fix(kpm): widen relative tolerance to 1e-5 for M6-2 dual-mode tests

kalwalt · kalwalt · commit fd0580b2256c · 2026-05-13T14:59:46.000+02:00
The previous 1e-6 relative scaling was still too tight for near-singular 2x2 systems on Apple Silicon ARM64. A failing case showed: rust=-358.62683, cpp=-358.62802, diff=1.19e-3, tol=3.59e-4 The relative error of ~3.3e-6 exceeded the 1e-6 scale factor. Random 2x2 systems occasionally hit ill-conditioned configurations where solutions have large magnitude and are very sensitive to FMA rounding order. f32 has ~7 decimal digits of precision, so even well-conditioned results can diverge by ~1e-5 relative across platforms; ill-conditioned ones diverge more. Bump relative scale from 1e-5 (per |x|) to ensure cross-platform stability without losing test sensitivity for typical values: tol = max(1e-5, |x| * 1e-5) This is consistent with f32 precision floor and accommodates the worst observed cross-platform divergence with a safety margin. Refs #116
diff --git a/crates/core/src/kpm/freak/math.rs b/crates/core/src/kpm/freak/math.rs
@@ -2112,12 +2112,21 @@ mod dual_mode_tests {
                     if diff > max_diff {
                         max_diff = diff;
                     }
-                    // Combined absolute + relative tolerance: f32 has ~7
-                    // decimal digits, so values around magnitude M need
-                    // tolerance ~ M * 1e-6. The 1e-5 floor handles values
-                    // near zero. This accommodates platform-specific FMA
-                    // rounding differences (Apple Silicon vs x86_64).
-                    let tol = 1e-5_f32.max(x_rust[i].abs() * 1e-6);
+                    // Combined absolute + relative tolerance.
+                    //
+                    // Random 2x2 systems occasionally hit near-singular
+                    // configurations where the solution has large magnitude
+                    // and is sensitive to FMA rounding order. f32 has ~7
+                    // decimal digits, so even well-conditioned values can
+                    // diverge by ~1e-5 relative across platforms (notably
+                    // Apple Silicon ARM64 vs x86_64). For ill-conditioned
+                    // systems this amplifies further. We use:
+                    //
+                    //   tol = max(1e-5, |x| * 1e-5)
+                    //
+                    // which preserves strictness for small values and
+                    // accommodates cross-platform variance for large ones.
+                    let tol = 1e-5_f32.max(x_rust[i].abs() * 1e-5);
                     assert!(
                         diff < tol,
                         "solve_linear_system_2x2 diverged at x[{}]: rust={}, cpp={}, diff={}, tol={}",
@@ -2191,7 +2200,7 @@ mod dual_mode_tests {
                         max_diff = diff;
                     }
                     // See solve_linear_system_2x2_matches_cpp for tolerance rationale.
-                    let tol = 1e-5_f32.max(x_rust[i].abs() * 1e-6);
+                    let tol = 1e-5_f32.max(x_rust[i].abs() * 1e-5);
                     assert!(
                         diff < tol,
                         "solve_symmetric_linear_system_3x3 diverged at x[{}]: rust={}, cpp={}, diff={}, tol={}",