minor

kinjalpatel27 · kinjalpatel27 · commit 482f49215b8e · 2026-04-21T02:24:35.000Z
Signed-off-by: Kinjal Patel &lt;kinjalpravin@nvidia.com&gt;
diff --git a/modelopt/torch/quantization/plugins/vllm.py b/modelopt/torch/quantization/plugins/vllm.py
@@ -387,10 +387,7 @@ def _invoke_fused_moe_quantized_function(
             if self.w13_weight_quantizer.is_enabled:  # pragma: no cover
                 original_weight = self.w13_weight
                 B = self.w13_weight_quantizer(original_weight)  # noqa: N806
-                try:
-                    original_kernel(A, B, C, *args, **kwargs)
-                finally:
-                    self.w13_weight = original_weight
+                original_kernel(A, B, C, *args, **kwargs)
             else:
                 original_kernel(A, B, C, *args, **kwargs)
             if self.w13_output_quantizer.is_enabled:
@@ -400,10 +397,7 @@ def _invoke_fused_moe_quantized_function(
             if self.w2_weight_quantizer.is_enabled:  # pragma: no cover
                 original_weight = self.w2_weight
                 B = self.w2_weight_quantizer(original_weight)  # noqa: N806
-                try:
-                    original_kernel(A, B, C, *args, **kwargs)
-                finally:
-                    self.w2_weight = original_weight
+                original_kernel(A, B, C, *args, **kwargs)
             else:
                 original_kernel(A, B, C, *args, **kwargs)
             if self.w2_output_quantizer.is_enabled: