Improve error message in _real_quantize

danisereb · meenchen · commit 5d45ba1cf0f5 · 2026-01-28T08:50:22.000-08:00
Signed-off-by: Daniel Serebrenik &lt;daserebrenik@nvidia.com&gt;
diff --git a/modelopt/torch/quantization/nn/modules/tensor_quantizer.py b/modelopt/torch/quantization/nn/modules/tensor_quantizer.py
@@ -671,7 +671,8 @@ def _real_quantize(self, inputs):
                 buffer_to_register["_scale"] = scales
             else:
                 raise ValueError(
-                    f"Real quantization for MX {self._num_bits} format is not supported."
+                    f"Unsupported MX format: num_bits={self._num_bits}. "
+                    f"Expected (2, 1) for MXFP4 or (4, 3) for MXFP8."
                 )
         elif self._num_bits == (4, 3):
             # FP8 quantization (non-MX)