NVIDIA · yeyu-nvidia · Feb 24, 2026 · Feb 24, 2026 · coderabbitai · Feb 24, 2026
@@ -48,7 +48,7 @@
 )
 from transformers.trainer_pt_utils import LabelSmoother
 from transformers.utils import ModelOutput
-from transformers.utils.quantization_config import QuantizationMethod
+from transformers.utils.quantization_config import CompressedTensorsConfig
 
 from ..eagle.conversion import EagleDMRegistry
 from ..eagle.eagle_model import EagleModel
@@ -585,12 +585,9 @@ def modify(
             self.eagle_config._attn_implementation = "sdpa"
 
         # Patch for Kimi-K2-Thinking, avoid quantizing drafter
-        if (
-            hasattr(self.config, "quantization_config")
-            and self.config.quantization_config.quant_method
-            == QuantizationMethod.COMPRESSED_TENSORS
-        ):
-            self.config.quantization_config.quantization_config.ignore.append("re:.*eagle_module.*")
+        quant_config = getattr(self.config, "quantization_config", None)
+        if isinstance(quant_config, CompressedTensorsConfig):
+            quant_config.ignore.append("re:.*eagle_module.*")
-        quant_config = getattr(self.config, "quantization_config", None)
-        if isinstance(quant_config, CompressedTensorsConfig):
-            quant_config.ignore.append("re:.*eagle_module.*")
+        quant_config = getattr(self.config, "quantization_config", None)
+        if isinstance(quant_config, CompressedTensorsConfig):
+            if quant_config.ignore is None:
+                quant_config.ignore = []
+            pattern = "re:.*eagle_module.*"
+            if pattern not in quant_config.ignore:
+                quant_config.ignore.append(pattern)
-        quant_config = getattr(self.config, "quantization_config", None)
-        if isinstance(quant_config, CompressedTensorsConfig):
-            quant_config.ignore.append("re:.*eagle_module.*")
+        quant_config = getattr(self.config, "quantization_config", None)
+        if isinstance(quant_config, CompressedTensorsConfig):
+            if quant_config.ignore is None:
+                quant_config.ignore = []
+            pattern = "re:.*eagle_module.*"
+            if pattern not in quant_config.ignore:
+                quant_config.ignore.append(pattern)
 
         # Set default aux_hidden_state layers
         if (