fix: Use dict return value from forward() in training script

TimDettmers · claude · TimDettmers · commit 654c7db0c3fa · 2026-03-02T17:48:30.000-05:00
forward() returns {"loss": tensor} or {"logits": tensor}, not
a raw tensor.

Co-Authored-By: Claude Opus 4.6 &lt;noreply@anthropic.com&gt;
diff --git a/scripts/train_qwen3_30b.py b/scripts/train_qwen3_30b.py
@@ -87,7 +87,8 @@ def train_standard(model, input_ids_list, labels_list, n_steps=100, lr=1e-4):
         labels = labels_list[idx].unsqueeze(0).cuda()
 
         optimizer.zero_grad()
-        loss = model(input_ids, labels)
+        result = model(input_ids, labels)
+        loss = result["loss"]
         loss.backward()
         optimizer.step()
 
@@ -188,9 +189,12 @@ def main():
     input_ids = tokens["input_ids"].cuda()
 
     with torch.no_grad():
-        output = model_reload(input_ids, labels=None)
-        # Just verify it runs without error
-        print(f"  LoRA reload OK, output shape: {output.shape if hasattr(output, 'shape') else type(output)}")
+        result = model_reload(input_ids, labels=None)
+        logits = result["logits"]
+        # Generate a few tokens greedily
+        next_tokens = logits.argmax(dim=-1)
+        generated = tokenizer.decode(next_tokens[0], skip_special_tokens=True)
+        print(f"  LoRA reload OK, generated: {generated[:100]}")
 
     # Save results
     results = {