feat: add num_retries configuration to LLMClient and LLMConfig with validation

duartebarbosadev · duartebarbosadev · commit 3632a9333c9c · 2026-06-02T22:48:38.000+10:00
diff --git a/app/llm_provider.py b/app/llm_provider.py
@@ -18,6 +18,7 @@
 
 logger = logging.getLogger(__name__)
 DEFAULT_LLM_TIMEOUT_SECONDS = 60
+DEFAULT_LLM_RETRIES = 2
 
 # Suppress noisy logging from litellm/openai unless error/warning
 litellm.set_verbose = False
@@ -118,11 +119,14 @@ class LLMConfig:
     site_name: Optional[str] = None
     send_site_info: bool = True
     timeout_seconds: int = DEFAULT_LLM_TIMEOUT_SECONDS
+    num_retries: int = DEFAULT_LLM_RETRIES
 
     def __post_init__(self):
         """Validate configuration after initialization."""
         if not self.model:
             raise ValueError("Model name is required")
+        if self.num_retries < 0:
+            raise ValueError("Number of retries cannot be negative")
 
 
 class LLMClient:
@@ -204,6 +208,7 @@ def chat_completion(
             "temperature": temperature,
             "max_tokens": kwargs.pop("max_tokens", 4096),
             "timeout": kwargs.pop("timeout", self.config.timeout_seconds),
+            "num_retries": kwargs.pop("num_retries", self.config.num_retries),
             **kwargs,
         }
 
diff --git a/app/tests/test_translation.py b/app/tests/test_translation.py
@@ -656,6 +656,46 @@ def test_llm_client_accepts_fenced_raw_string_batch_json(self):
             [("hello", "Hola"), ("goodbye", "Adiós")],
         )
         self.assertEqual(mock_completion.call_args.kwargs["timeout"], 60)
+        self.assertEqual(mock_completion.call_args.kwargs["num_retries"], 2)
+
+    def test_llm_client_allows_retry_override(self):
+        """Callers can override the default LiteLLM retry count per request."""
+
+        response = SimpleNamespace(
+            choices=[
+                SimpleNamespace(
+                    message=SimpleNamespace(
+                        content='{"translations": [{"key": "hello", "translation": "Hola"}]}',
+                        reasoning_content=None,
+                    )
+                )
+            ]
+        )
+        llm_config = LLMConfig(
+            provider="openrouter", model="openrouter/owl-alpha", num_retries=4
+        )
+
+        with patch(
+            "llm_provider.litellm.completion", return_value=response
+        ) as mock_completion:
+            LLMClient(llm_config).chat_completion(
+                messages=[],
+                response_model=StringBatchTranslation,
+                temperature=0,
+                num_retries=1,
+            )
+
+        self.assertEqual(mock_completion.call_args.kwargs["num_retries"], 1)
+
+    def test_llm_config_rejects_negative_retries(self):
+        """Retry count must not disable validation by going negative."""
+
+        with self.assertRaisesRegex(ValueError, "Number of retries cannot be negative"):
+            LLMConfig(
+                provider="openrouter",
+                model="openrouter/owl-alpha",
+                num_retries=-1,
+            )
 
     def test_llm_client_accepts_dict_style_message(self):
         """LiteLLM responses can expose message data with dict-style access."""