[pre-commit.ci] auto fixes from pre-commit.com hooks

pre-commit-ci[bot] · OutisLi · commit b8fcbe624a49 · 2025-10-09T11:19:41.000+08:00
for more information, see https://pre-commit.ci
diff --git a/source/lib/src/gpu/tabulate.cu b/source/lib/src/gpu/tabulate.cu
@@ -654,16 +654,19 @@ __global__ void tabulate_fusion_se_t_tebd_fifth_order_polynomial(
       locate_xx_se_t(xx, table_idx, lower, upper, -max, max, stride0, stride1);
 
       FPTYPE var[6];
-      load_polynomial_params(var, table, table_idx, thread_idx, last_layer_size);
+      load_polynomial_params(var, table, table_idx, thread_idx,
+                             last_layer_size);
 
-      FPTYPE res = var[0] +
-                   (var[1] +
-                    (var[2] + (var[3] + (var[4] + var[5] * xx) * xx) * xx) * xx) * xx;
+      FPTYPE res =
+          var[0] +
+          (var[1] +
+           (var[2] + (var[3] + (var[4] + var[5] * xx) * xx) * xx) * xx) *
+              xx;
 
       // Store result preserving the nt_i x nt_j structure
       out[block_idx * nnei_i * nnei_j * last_layer_size +
-          ii * nnei_j * last_layer_size +
-          jj * last_layer_size + thread_idx] = res;
+          ii * nnei_j * last_layer_size + jj * last_layer_size + thread_idx] =
+          res;
     }
   }
 }
@@ -698,11 +701,12 @@ __global__ void tabulate_fusion_se_t_tebd_grad_fifth_order_polynomial(
         load_polynomial_params(var, table, table_idx, mm, last_layer_size);
 
         FPTYPE dres_dxx = var[1] + 2.0 * var[2] * xx + 3.0 * var[3] * xx * xx +
-                         4.0 * var[4] * xx * xx * xx + 5.0 * var[5] * xx * xx * xx * xx;
+                          4.0 * var[4] * xx * xx * xx +
+                          5.0 * var[5] * xx * xx * xx * xx;
 
-        FPTYPE dy_val = dy[block_idx * nnei_i * nnei_j * last_layer_size +
-                          ii * nnei_j * last_layer_size +
-                          jj * last_layer_size + mm];
+        FPTYPE dy_val =
+            dy[block_idx * nnei_i * nnei_j * last_layer_size +
+               ii * nnei_j * last_layer_size + jj * last_layer_size + mm];
         grad_sum += dy_val * dres_dxx;
       }
 
@@ -734,21 +738,24 @@ __global__ void tabulate_fusion_se_t_tebd_grad_grad_fifth_order_polynomial(
   for (int ii = 0; ii < nnei_i; ii++) {
     for (int jj = 0; jj < nnei_j; jj++) {
       FPTYPE xx = em_x[block_idx * nnei_i * nnei_j + ii * nnei_j + jj];
-      FPTYPE dz_dy_dem_x_val = dz_dy_dem_x[block_idx * nnei_i * nnei_j + ii * nnei_j + jj];
+      FPTYPE dz_dy_dem_x_val =
+          dz_dy_dem_x[block_idx * nnei_i * nnei_j + ii * nnei_j + jj];
 
       int table_idx = 0;
       locate_xx_se_t(xx, table_idx, lower, upper, -max, max, stride0, stride1);
 
       FPTYPE var[6];
-      load_polynomial_params(var, table, table_idx, thread_idx, last_layer_size);
+      load_polynomial_params(var, table, table_idx, thread_idx,
+                             last_layer_size);
 
       FPTYPE dres_dxx = var[1] + 2.0 * var[2] * xx + 3.0 * var[3] * xx * xx +
-                       4.0 * var[4] * xx * xx * xx + 5.0 * var[5] * xx * xx * xx * xx;
+                        4.0 * var[4] * xx * xx * xx +
+                        5.0 * var[5] * xx * xx * xx * xx;
 
       // Store result preserving the nt_i x nt_j structure
       dz_dy[block_idx * nnei_i * nnei_j * last_layer_size +
-            ii * nnei_j * last_layer_size +
-            jj * last_layer_size + thread_idx] = dz_dy_dem_x_val * dres_dxx;
+            ii * nnei_j * last_layer_size + jj * last_layer_size + thread_idx] =
+          dz_dy_dem_x_val * dres_dxx;
     }
   }
 }
@@ -1088,9 +1095,10 @@ void tabulate_fusion_se_t_tebd_grad_gpu(FPTYPE* dy_dem_x,
   DPErrcheck(gpuDeviceSynchronize());
   DPErrcheck(gpuMemset(dy_dem_x, 0, sizeof(FPTYPE) * nloc * nnei_i * nnei_j));
   tabulate_fusion_se_t_tebd_grad_fifth_order_polynomial<FPTYPE, MM, KK>
-      <<<nloc, KK * WARP_SIZE>>>(
-          dy_dem_x, table, em_x, em, dy, table_info[0], table_info[1],
-          table_info[2], table_info[3], table_info[4], nnei_i, nnei_j, last_layer_size);
+      <<<nloc, KK * WARP_SIZE>>>(dy_dem_x, table, em_x, em, dy, table_info[0],
+                                 table_info[1], table_info[2], table_info[3],
+                                 table_info[4], nnei_i, nnei_j,
+                                 last_layer_size);
   DPErrcheck(gpuGetLastError());
   DPErrcheck(gpuDeviceSynchronize());
 }
@@ -1111,13 +1119,14 @@ void tabulate_fusion_se_t_tebd_grad_grad_gpu(FPTYPE* dz_dy,
   }
   DPErrcheck(gpuGetLastError());
   DPErrcheck(gpuDeviceSynchronize());
-  DPErrcheck(gpuMemset(dz_dy, 0, sizeof(FPTYPE) * nloc * nnei_i * nnei_j * last_layer_size));
+  DPErrcheck(gpuMemset(
+      dz_dy, 0, sizeof(FPTYPE) * nloc * nnei_i * nnei_j * last_layer_size));
 
   tabulate_fusion_se_t_tebd_grad_grad_fifth_order_polynomial<FPTYPE, MM, KK>
-      <<<nloc, last_layer_size>>>(
-          dz_dy, table, em_x, em, dz_dy_dem_x,
-          table_info[0], table_info[1], table_info[2], table_info[3], table_info[4],
-          nnei_i, nnei_j, last_layer_size);
+      <<<nloc, last_layer_size>>>(dz_dy, table, em_x, em, dz_dy_dem_x,
+                                  table_info[0], table_info[1], table_info[2],
+                                  table_info[3], table_info[4], nnei_i, nnei_j,
+                                  last_layer_size);
   DPErrcheck(gpuGetLastError());
   DPErrcheck(gpuDeviceSynchronize());
 }
@@ -1381,27 +1390,25 @@ template void tabulate_fusion_se_r_grad_grad_gpu<double>(
     const int last_layer_size);
 
 // Template instantiations for SE_T_TEBD GPU functions
-template void tabulate_fusion_se_t_tebd_gpu<float>(
-    float* out,
-    const float* table,
-    const float* table_info,
-    const float* em_x,
-    const float* em,
-    const int nloc,
-    const int nnei_i,
-    const int nnei_j,
-    const int last_layer_size);
+template void tabulate_fusion_se_t_tebd_gpu<float>(float* out,
+                                                   const float* table,
+                                                   const float* table_info,
+                                                   const float* em_x,
+                                                   const float* em,
+                                                   const int nloc,
+                                                   const int nnei_i,
+                                                   const int nnei_j,
+                                                   const int last_layer_size);
 
-template void tabulate_fusion_se_t_tebd_gpu<double>(
-    double* out,
-    const double* table,
-    const double* table_info,
-    const double* em_x,
-    const double* em,
-    const int nloc,
-    const int nnei_i,
-    const int nnei_j,
-    const int last_layer_size);
+template void tabulate_fusion_se_t_tebd_gpu<double>(double* out,
+                                                    const double* table,
+                                                    const double* table_info,
+                                                    const double* em_x,
+                                                    const double* em,
+                                                    const int nloc,
+                                                    const int nnei_i,
+                                                    const int nnei_j,
+                                                    const int last_layer_size);
 
 template void tabulate_fusion_se_t_tebd_grad_gpu<float>(
     float* dy_dem_x,
diff --git a/source/lib/src/tabulate.cc b/source/lib/src/tabulate.cc
@@ -582,8 +582,7 @@ void deepmd::tabulate_fusion_se_t_tebd_cpu(FPTYPE* out,
 
           // Store result preserving the nt_i x nt_j structure
           out[ii * nnei_i * nnei_j * last_layer_size +
-              jj * nnei_j * last_layer_size +
-              kk * last_layer_size + mm] = res;
+              jj * nnei_j * last_layer_size + kk * last_layer_size + mm] = res;
         }
       }
     }
@@ -626,11 +625,12 @@ void deepmd::tabulate_fusion_se_t_tebd_grad_cpu(FPTYPE* dy_dem_x,
           FPTYPE a5 = table[table_idx * last_layer_size * 6 + 6 * mm + 5];
 
           FPTYPE dres_dxx = a1 + 2.0 * a2 * xx + 3.0 * a3 * xx * xx +
-                           4.0 * a4 * xx * xx * xx + 5.0 * a5 * xx * xx * xx * xx;
+                            4.0 * a4 * xx * xx * xx +
+                            5.0 * a5 * xx * xx * xx * xx;
 
-          FPTYPE dy_val = dy[ii * nnei_i * nnei_j * last_layer_size +
-                            jj * nnei_j * last_layer_size +
-                            kk * last_layer_size + mm];
+          FPTYPE dy_val =
+              dy[ii * nnei_i * nnei_j * last_layer_size +
+                 jj * nnei_j * last_layer_size + kk * last_layer_size + mm];
           grad_sum += dy_val * dres_dxx;
         }
 
@@ -641,16 +641,17 @@ void deepmd::tabulate_fusion_se_t_tebd_grad_cpu(FPTYPE* dy_dem_x,
 }
 
 template <typename FPTYPE>
-void deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(FPTYPE* dz_dy,
-                                                     const FPTYPE* table,
-                                                     const FPTYPE* table_info,
-                                                     const FPTYPE* em_x,
-                                                     const FPTYPE* em,
-                                                     const FPTYPE* dz_dy_dem_x,
-                                                     const int nloc,
-                                                     const int nnei_i,
-                                                     const int nnei_j,
-                                                     const int last_layer_size) {
+void deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(
+    FPTYPE* dz_dy,
+    const FPTYPE* table,
+    const FPTYPE* table_info,
+    const FPTYPE* em_x,
+    const FPTYPE* em,
+    const FPTYPE* dz_dy_dem_x,
+    const int nloc,
+    const int nnei_i,
+    const int nnei_j,
+    const int last_layer_size) {
   memset(dz_dy, 0, sizeof(FPTYPE) * nloc * nnei_i * nnei_j * last_layer_size);
   const FPTYPE lower = table_info[0];
   const FPTYPE upper = table_info[1];
@@ -667,7 +668,8 @@ void deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(FPTYPE* dz_dy,
         locate_xx_se_t(lower, upper, -_max, _max, stride0, stride1, xx,
                        table_idx);
 
-        FPTYPE dz_dy_dem_x_val = dz_dy_dem_x[ii * nnei_i * nnei_j + jj * nnei_j + kk];
+        FPTYPE dz_dy_dem_x_val =
+            dz_dy_dem_x[ii * nnei_i * nnei_j + jj * nnei_j + kk];
 
         for (int mm = 0; mm < last_layer_size; mm++) {
           FPTYPE a1 = table[table_idx * last_layer_size * 6 + 6 * mm + 1];
@@ -677,11 +679,12 @@ void deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(FPTYPE* dz_dy,
           FPTYPE a5 = table[table_idx * last_layer_size * 6 + 6 * mm + 5];
 
           FPTYPE dres_dxx = a1 + 2.0 * a2 * xx + 3.0 * a3 * xx * xx +
-                           4.0 * a4 * xx * xx * xx + 5.0 * a5 * xx * xx * xx * xx;
+                            4.0 * a4 * xx * xx * xx +
+                            5.0 * a5 * xx * xx * xx * xx;
 
           dz_dy[ii * nnei_i * nnei_j * last_layer_size +
-                jj * nnei_j * last_layer_size +
-                kk * last_layer_size + mm] = dz_dy_dem_x_val * dres_dxx;
+                jj * nnei_j * last_layer_size + kk * last_layer_size + mm] =
+              dz_dy_dem_x_val * dres_dxx;
         }
       }
     }
diff --git a/source/op/pt/tabulate_multi_device.cc b/source/op/pt/tabulate_multi_device.cc
@@ -369,16 +369,18 @@ void TabulateFusionSeTTebdForward(const torch::Tensor& table_tensor,
   // compute
   if (device == "GPU") {
 #if GOOGLE_CUDA || TENSORFLOW_USE_ROCM
-    deepmd::tabulate_fusion_se_t_tebd_gpu(descriptor, table, table_info, em_x, em,
-                                          nloc, nnei_i, nnei_j, last_layer_size);
+    deepmd::tabulate_fusion_se_t_tebd_gpu(descriptor, table, table_info, em_x,
+                                          em, nloc, nnei_i, nnei_j,
+                                          last_layer_size);
 #else
     throw std::runtime_error(
         "The input tensor is on the GPU, but the GPU support for the "
         "customized OP library is not enabled.");
 #endif  // GOOGLE_CUDA || TENSORFLOW_USE_ROCM
   } else if (device == "CPU") {
-    deepmd::tabulate_fusion_se_t_tebd_cpu(descriptor, table, table_info, em_x, em,
-                                          nloc, nnei_i, nnei_j, last_layer_size);
+    deepmd::tabulate_fusion_se_t_tebd_cpu(descriptor, table, table_info, em_x,
+                                          em, nloc, nnei_i, nnei_j,
+                                          last_layer_size);
   }
 }
 
@@ -414,28 +416,29 @@ void TabulateFusionSeTTebdGradForward(const torch::Tensor& table_tensor,
   if (device == "GPU") {
 #if GOOGLE_CUDA || TENSORFLOW_USE_ROCM
     deepmd::tabulate_fusion_se_t_tebd_grad_gpu(dy_dem_x, table, table_info,
-                                               em_x, em, dy, nloc, nnei_i, nnei_j,
-                                               last_layer_size);
+                                               em_x, em, dy, nloc, nnei_i,
+                                               nnei_j, last_layer_size);
 #else
     throw std::runtime_error(
         "The input tensor is on the GPU, but the GPU support for the "
         "customized OP library is not enabled.");
 #endif  // GOOGLE_CUDA || TENSORFLOW_USE_ROCM
   } else if (device == "CPU") {
     deepmd::tabulate_fusion_se_t_tebd_grad_cpu(dy_dem_x, table, table_info,
-                                               em_x, em, dy, nloc, nnei_i, nnei_j,
-                                               last_layer_size);
+                                               em_x, em, dy, nloc, nnei_i,
+                                               nnei_j, last_layer_size);
   }
 }
 
 template <typename FPTYPE>
-void TabulateFusionSeTTebdGradGradForward(const torch::Tensor& table_tensor,
-                                          const torch::Tensor& table_info_tensor,
-                                          const torch::Tensor& em_x_tensor,
-                                          const torch::Tensor& em_tensor,
-                                          const torch::Tensor& dz_dy_dem_x_tensor,
-                                          const torch::Tensor& descriptor_tensor,
-                                          torch::Tensor& dz_dy_tensor) {
+void TabulateFusionSeTTebdGradGradForward(
+    const torch::Tensor& table_tensor,
+    const torch::Tensor& table_info_tensor,
+    const torch::Tensor& em_x_tensor,
+    const torch::Tensor& em_tensor,
+    const torch::Tensor& dz_dy_dem_x_tensor,
+    const torch::Tensor& descriptor_tensor,
+    torch::Tensor& dz_dy_tensor) {
   // Check input shape
   if (dz_dy_dem_x_tensor.dim() != 3) {
     throw std::invalid_argument("Dim of dz_dy_dem_x should be 3");
@@ -458,9 +461,9 @@ void TabulateFusionSeTTebdGradGradForward(const torch::Tensor& table_tensor,
   // compute
   if (device == "GPU") {
 #if GOOGLE_CUDA || TENSORFLOW_USE_ROCM
-    deepmd::tabulate_fusion_se_t_tebd_grad_grad_gpu(dz_dy, table, table_info, em_x,
-                                                     em, dz_dy_dem_x, nloc,
-                                                     nnei_i, nnei_j, last_layer_size);
+    deepmd::tabulate_fusion_se_t_tebd_grad_grad_gpu(
+        dz_dy, table, table_info, em_x, em, dz_dy_dem_x, nloc, nnei_i, nnei_j,
+        last_layer_size);
 #else
     throw std::runtime_error(
         "The input tensor is on the GPU, but the GPU support for the "
@@ -470,9 +473,9 @@ void TabulateFusionSeTTebdGradGradForward(const torch::Tensor& table_tensor,
                 "In the process of model compression, the size of the "
                 "last layer of embedding net must be less than 1024!");
   } else if (device == "CPU") {
-    deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(dz_dy, table, table_info, em_x,
-                                                     em, dz_dy_dem_x, nloc,
-                                                     nnei_i, nnei_j, last_layer_size);
+    deepmd::tabulate_fusion_se_t_tebd_grad_grad_cpu(
+        dz_dy, table, table_info, em_x, em, dz_dy_dem_x, nloc, nnei_i, nnei_j,
+        last_layer_size);
   }
 }
 
@@ -1112,13 +1115,14 @@ class TabulateFusionSeTTebdOp
     auto options = torch::TensorOptions()
                        .dtype(table_tensor.dtype())
                        .device(table_tensor.device());
-    torch::Tensor descriptor_tensor = torch::empty(
-        {em_tensor.size(0), em_tensor.size(1), em_tensor.size(2), last_layer_size},
-        options);
+    torch::Tensor descriptor_tensor =
+        torch::empty({em_tensor.size(0), em_tensor.size(1), em_tensor.size(2),
+                      last_layer_size},
+                     options);
     // compute
     TabulateFusionSeTTebdForward<FPTYPE>(table_tensor, table_info_tensor,
-                                         em_x_tensor, em_tensor, last_layer_size,
-                                         descriptor_tensor);
+                                         em_x_tensor, em_tensor,
+                                         last_layer_size, descriptor_tensor);
     // save data
     ctx->save_for_backward({table_tensor, table_info_tensor, em_x_tensor,
                             em_tensor, descriptor_tensor});
@@ -1202,8 +1206,8 @@ std::vector<torch::Tensor> tabulate_fusion_se_t_tebd(
     const torch::Tensor& em_x_tensor,
     const torch::Tensor& em_tensor,
     int64_t last_layer_size) {
-  return TabulateFusionSeTTebdOp::apply(table_tensor, table_info_tensor,
-                                        em_x_tensor, em_tensor, last_layer_size);
+  return TabulateFusionSeTTebdOp::apply(
+      table_tensor, table_info_tensor, em_x_tensor, em_tensor, last_layer_size);
 }
 
 std::vector<torch::Tensor> tabulate_fusion_se_r(
diff --git a/source/tests/pt/test_tabulate_fusion_se_t_tebd.py b/source/tests/pt/test_tabulate_fusion_se_t_tebd.py
@@ -233,7 +233,9 @@ def setUp(self) -> None:
             dtype=dtype,
             device=env.DEVICE,
         ).reshape(4, 4)
-        self.em_tensor = self.em_x_tensor.reshape(4, 4, 1)  # SE_T_TEBD uses angular information, so 1D
+        self.em_tensor = self.em_x_tensor.reshape(
+            4, 4, 1
+        )  # SE_T_TEBD uses angular information, so 1D
         self.table_info_tensor.requires_grad = False
         self.table_tensor.requires_grad = False
         self.em_x_tensor.requires_grad = True