open-compass · DeliWang · Mar 19, 2026
diff --git a/opencompass/datasets/ceval.py b/opencompass/datasets/ceval.py
@@ -20,7 +20,8 @@ def load(path: str, name: str, local_mode: bool = False):
         dataset = {}
         if environ.get('DATASET_SOURCE') == 'ModelScope':
             from modelscope import MsDataset
-            dataset = MsDataset.load(dataset_name=path, subset_name=name)
+            dataset = MsDataset.load(
+                dataset_name=path, subset_name=name, trust_remote_code=True)
         else:
             for split in ['dev', 'val', 'test']:
                 filename = osp.join(path, split, f'{name}_{split}.csv')
@@ -72,7 +73,8 @@ def load(path: str, name: str):
         dataset = {}
         if environ.get('DATASET_SOURCE') == 'ModelScope':
             from modelscope import MsDataset
-            dataset = MsDataset.load(dataset_name=path, subset_name=name)
+            dataset = MsDataset.load(
+                dataset_name=path, subset_name=name, trust_remote_code=True)
             # 向该数据添加 'is_clean' 字段
             annotations = CEvalDatasetClean.load_contamination_annotations(
                 path, 'val')

diff --git a/opencompass/models/huggingface_above_v4_33.py b/opencompass/models/huggingface_above_v4_33.py
@@ -478,6 +478,8 @@ def generate(self,
         self.logger.info(generation_kwargs)
 
         # step-2: conduct model forward to generate output
+        # LLaMA and some causal LMs do not accept token_type_ids in generate().
+        tokens.pop('token_type_ids', None)
         outputs = self.model.generate(**tokens, **generation_kwargs)
         outputs = outputs[:, tokens['input_ids'].shape[1]:]
 
@@ -580,6 +582,8 @@ def generate(self,
         generation_kwargs['pad_token_id'] = self.tokenizer.pad_token_id
 
         # step-2: conduct model forward to generate output
+        # LLaMA and some causal LMs do not accept token_type_ids in generate().
+        tokens.pop('token_type_ids', None)
         outputs = self.model.generate(**tokens, **generation_kwargs)
         outputs = outputs[:, tokens['input_ids'].shape[1]:]