Add compiler.cc int64 int32 abs. int64 vs double abs.

YuhanXu · YuhanXu · commit cf7cdce844f8 · 2026-03-05T19:03:38.000+08:00
diff --git a/backends/metax_gpu/cinn/compiler/compiler.cc b/backends/metax_gpu/cinn/compiler/compiler.cc
@@ -213,6 +213,7 @@ __device__ inline int FN_INT32(mod)(int a, int b) {
 }
 __device__ inline int FN_INT32(max)(int a, int b) { return cinn_max(a, b); }
 __device__ inline int FN_INT32(min)(int a, int b) { return cinn_min(a, b); }
+__device__ inline int FN_INT32(abs)(int x) { return abs(x); }
 __device__ inline int FN_INT32(left_shift)(int a, int b) { return a << b; }
 __device__ inline int FN_INT32(right_shift)(int a, int b) { return a >> b; }
 __device__ inline int FN_INT32(bitwise_and)(int a, int b) { return a & b; }
@@ -239,6 +240,7 @@ __device__ inline int64_t FN_INT64(bitwise_xor)(int64_t a, int64_t b) { return a
 __device__ inline int64_t FN_INT64(bitwise_not)(int64_t a) { return ~a; }
 __device__ inline int64_t FN_INT64(clz)(int64_t a) { return __clzll(a); }
 __device__ inline int64_t FN_INT64(popc)(int64_t a) { return __popcll(a); }
+__device__ inline int64_t FN_INT64(abs)(int64_t x) { return llabs(x); }
 __device__ inline int64_t FN_INT64(logical_right_shift)(int64_t a, int64_t b) { return ((uint64_t)a >> b); }
 __device__ inline int64_t FN_INT64(trunc)(int64_t a) { return a; }
 __device__ inline int64_t FN_INT64(mod)(int64_t a, int64_t b) { int64_t res = a % b; if ((res != 0) && ((b ^ res) < 0)) res += b; return res; }
@@ -997,7 +999,28 @@ ARGIDX_STRUCT_MACRO(argidx_fp32_i32, float, int, 0)
 ARGIDX_STRUCT_MACRO(argidx_i32_i32, int, int, 0)
 
 // 手写 std::max 重载
-namespace std { 
+namespace std {
+  // --- 之前加的 long long / int64_t 补丁保持不变 ---
+  __device__ __forceinline__ int64_t max(long long a, int64_t b) { return a > b ? a : b; }
+  __device__ __forceinline__ int64_t max(int64_t a, long long b) { return a > b ? a : b; }
+  __device__ __forceinline__ int64_t min(long long a, int64_t b) { return a < b ? a : b; }
+  __device__ __forceinline__ int64_t min(int64_t a, long long b) { return a < b ? a : b; }
+
+  // ==============================================================
+  // 【新增防弹补丁】：解决 CINN 漏打 'f' 后缀导致的 float 和 double 混合报错
+  // ==============================================================
+__device__ __forceinline__ double max(float a, double b) { return a > b ? (double)a : b; }
+  __device__ __forceinline__ double max(double a, float b) { return a > b ? a : (double)b; }
+  __device__ __forceinline__ double min(float a, double b) { return a < b ? (double)a : b; }
+  __device__ __forceinline__ double min(double a, float b) { return a < b ? a : (double)b; }
+  
+  // 以防万一，解决 CINN 把 0 打印成 int 与 float 混合的报错 (如 std::max(val, 0))
+  __device__ __forceinline__ float max(float a, int b) { return a > b ? a : (float)b; }
+  __device__ __forceinline__ float max(int a, float b) { return a > b ? (float)a : b; }
+  __device__ __forceinline__ float min(float a, int b) { return a < b ? a : (float)b; }
+  __device__ __forceinline__ float min(int a, float b) { return a < b ? (float)a : b; }
+  // ==============================================================
+  
   // ArgMax 实现
   template <typename T> 
   __device__ __forceinline__ T max_argidx_impl(const T& a, const T& b) {