add transformers generation as default

EYH0602 · EYH0602 · commit 5ef72f9da276 · 2025-09-30T13:17:16.000-07:00
diff --git a/src/tfbench/lm/_hf.py b/src/tfbench/lm/_hf.py
@@ -1,6 +1,6 @@
 from transformers import AutoModelForCausalLM, AutoTokenizer
 
-from ._types import LM, LMAnswer
+from ._types import LM, LMAnswer, NoneResponseError
 
 
 def extract_thinking_content(output: str) -> tuple[str, str | None]:
@@ -33,8 +33,8 @@ def __init__(self, model_name: str, pure: bool = False):
 
     def _gen(self, prompt: str) -> LMAnswer:
         messages = [
-            {"role": "system", "content": self.instruction},
             {"role": "user", "content": prompt},
+            {"role": "system", "content": self.instruction},
         ]
         text = self.tokenizer.apply_chat_template(
             messages,
@@ -49,5 +49,8 @@ def _gen(self, prompt: str) -> LMAnswer:
         output_ids = generated_ids[0][len(model_inputs.input_ids[0]) :].tolist()
         output = self.tokenizer.decode(output_ids, skip_special_tokens=True).strip("\n")
 
+        if output is None:
+            raise NoneResponseError(self.model_name)
+
         content, thinking_content = extract_thinking_content(output)
         return LMAnswer(answer=content, reasoning_steps=thinking_content)