fix MultiModalDataset padding

irisliu10 · irisliu10 · commit 86a2ba16bfb1 · 2026-02-02T14:04:12.000+08:00
diff --git a/angelslim/data/dataloader.py b/angelslim/data/dataloader.py
@@ -43,6 +43,7 @@ def create_data_loader(
         inference_settings: Dict = None,
         use_audio_in_video: bool = False,
         model_name: str = None,
+        quantization_config: str = None,
     ) -> DataLoader:
         """
         Create appropriate DataLoader based on data source
@@ -94,6 +95,7 @@ def create_data_loader(
                 data_source=data_source,
                 is_hf_dataset=not os.path.isfile(data_source),
                 model_name=model_name,
+                quantization_config=quantization_config,
             )
         elif data_type == "Text2ImageDataset":
             dataset = Text2ImageDataset(
diff --git a/angelslim/data/multimodal_dataset.py b/angelslim/data/multimodal_dataset.py
@@ -37,10 +37,12 @@ def __init__(
         data_source: Union[str, Dict] = None,
         is_hf_dataset: bool = False,
         model_name: str = None,
+        quantization_config: str = None,
     ):
         super().__init__(processor, device, max_length)
         self.is_hf_dataset = is_hf_dataset
         self.model_name = model_name
+        self.quant_algo = quantization_config.name if quantization_config else None
 
         if is_hf_dataset:
             self._load_hf_dataset(data_source, num_samples)
@@ -174,13 +176,21 @@ def _load_hf_dataset(self, dataset: str, num_samples: int):
 
     def _process_and_append(self, messages: List[Dict], tools=None):
         """Process messages and append to dataset"""
+
+        # max_length padding for gptq and awq
+        if "gptq" in self.quant_algo or "awq" in self.quant_algo:
+            padding = "max_length"
+        else:
+            padding = True
+
         if self.model_name in ["Qwen3VL", "Qwen3VLMoE"]:
             inputs = self.processor.apply_chat_template(
                 messages,
                 tools=tools,
                 tokenize=True,
                 add_generation_prompt=True,
                 return_dict=True,
+                padding=padding,
                 truncation=True,
                 return_tensors="pt",
                 max_length=self.max_length,
@@ -195,6 +205,7 @@ def _process_and_append(self, messages: List[Dict], tools=None):
             inputs = self.processor(
                 text=[text],
                 images=image_inputs,
+                padding=padding,
                 truncation=True,
                 return_tensors="pt",
                 max_length=self.max_length,
@@ -212,6 +223,7 @@ def _process_and_append(self, messages: List[Dict], tools=None):
                 text=[text],
                 images=image_inputs,
                 videos=video_inputs,
+                padding=padding,
                 truncation=True,
                 return_tensors="pt",
                 max_length=self.max_length,
diff --git a/angelslim/engine.py b/angelslim/engine.py
@@ -149,6 +149,7 @@ def prepare_data(
         inference_settings=None,
         use_audio_in_video=False,
         model_name=None,
+        quantization_config=None,
     ) -> Optional[Any]:
         """Prepare compression dataset"""
         if custom_dataloader is not None:
@@ -174,6 +175,7 @@ def prepare_data(
             inference_settings=inference_settings,
             use_audio_in_video=use_audio_in_video,
             model_name=model_name,
+            quantization_config=quantization_config,
         )
         self.max_seq_length = max_length
 
diff --git a/tools/run.py b/tools/run.py
@@ -169,6 +169,7 @@ def run(config):
             inference_settings=dataset_config.inference_settings,
             use_audio_in_video=model_config.use_audio_in_video,
             model_name=model_config.name,
+            quantization_config=compress_config.quantization,
         )
 
     # Step 5: Initialize compressor

Original file line number	Diff line number	Diff line change
`@@ -169,6 +169,7 @@ def run(config):`
`169`	`169`	`inference_settings=dataset_config.inference_settings,`
`170`	`170`	`use_audio_in_video=model_config.use_audio_in_video,`
`171`	`171`	`model_name=model_config.name,`
	`172`	`+ quantization_config=compress_config.quantization,`
`172`	`173`	`)`
`173`	`174`
`174`	`175`	`# Step 5: Initialize compressor`