Add base_url support for AI providers (#1) (#85)

Tari Putra · Codex · veo3sz01-bot · web-flow · commit ded291f2cb93 · 2026-04-26T15:46:19.000+05:30
* feat: add base url support for providers * Update packages/core/src/repowise/core/providers/llm/gemini.py * Document provider base_url env vars Agent-Logs-Url: https://github.com/veo3sz01-bot/repowise/sessions/19d8a471-8cf0-47ec-be83-37c705d7e832 * Remove server base_url config fallback Agent-Logs-Url: https://github.com/veo3sz01-bot/repowise/sessions/f1ae2603-6f6d-4530-b7e0-6d6cc811975c --------- Co-authored-by: Codex <242516109+Codex@users.noreply.github.com> Co-authored-by: veo3sz01-bot <271450703+veo3sz01-bot@users.noreply.github.com> Co-authored-by: Copilot <175728472+Copilot@users.noreply.github.com> Co-authored-by: copilot-swe-agent[bot] <198982749+Copilot@users.noreply.github.com> Co-authored-by: Raghav Chamadiya <65403859+RaghavChamadiya@users.noreply.github.com>
diff --git a/docs/USER_GUIDE.md b/docs/USER_GUIDE.md
@@ -903,8 +903,14 @@ repowise watch --workspace           # all workspace repos
 | Variable | Required | Description |
 |----------|----------|-------------|
 | `ANTHROPIC_API_KEY` | If using Anthropic | Anthropic API key |
+| `ANTHROPIC_BASE_URL` | No | Base URL override for Anthropic-compatible APIs |
 | `OPENAI_API_KEY` | If using OpenAI | OpenAI API key |
+| `OPENAI_BASE_URL` | No | Base URL override for OpenAI-compatible APIs |
 | `GEMINI_API_KEY` | If using Gemini | Google Gemini API key |
+| `GEMINI_BASE_URL` | No | Base URL override for Gemini-compatible APIs |
+| `OLLAMA_BASE_URL` | If using Ollama | Ollama server URL (default: `http://localhost:11434`) |
+| `LITELLM_BASE_URL` | No | Base URL override for LiteLLM proxy |
+| `LITELLM_API_BASE` | No | LiteLLM base URL alias (same as `LITELLM_BASE_URL`) |
 | `REPOWISE_DB_URL` | No | Database URL override (default: `.repowise/wiki.db`) |
 | `REPOWISE_EMBEDDER` | No | Embedder for semantic search: `gemini`, `openai`, `mock` |
 | `REPOWISE_API_URL` | Frontend only | Backend URL for the web UI (default: `http://localhost:7337`) |
diff --git a/packages/cli/src/repowise/cli/helpers.py b/packages/cli/src/repowise/cli/helpers.py
@@ -228,15 +228,37 @@ def resolve_provider(
     """
     from repowise.core.providers import get_provider
 
+    cfg: dict[str, Any] = {}
+    if repo_path is not None:
+        cfg = load_config(repo_path)
+
     if provider_name is None:
         provider_name = os.environ.get("REPOWISE_PROVIDER")
 
-    if provider_name is None and repo_path is not None:
-        cfg = load_config(repo_path)
-        if cfg.get("provider"):
-            provider_name = cfg["provider"]
-            if model is None and cfg.get("model"):
-                model = cfg["model"]
+    if provider_name is None and cfg.get("provider"):
+        provider_name = cfg["provider"]
+        if model is None and cfg.get("model"):
+            model = cfg["model"]
+
+    def _resolve_base_url(name: str) -> str | None:
+        """Return base_url from env or repo config for the provider."""
+        env_vars = {
+            "anthropic": ["ANTHROPIC_BASE_URL"],
+            "openai": ["OPENAI_BASE_URL"],
+            "gemini": ["GEMINI_BASE_URL"],
+            "ollama": ["OLLAMA_BASE_URL"],
+            "litellm": ["LITELLM_BASE_URL", "LITELLM_API_BASE"],
+        }
+        for var in env_vars.get(name, []):
+            val = os.environ.get(var)
+            if val:
+                return val
+        section = cfg.get(name)
+        if isinstance(section, dict):
+            base_url = section.get("base_url")
+            if base_url:
+                return base_url
+        return None
 
     if provider_name is not None:
         # Validate configuration before attempting to create provider
@@ -250,6 +272,9 @@ def resolve_provider(
         kwargs: dict[str, Any] = {}
         if model:
             kwargs["model"] = model
+        base_url = _resolve_base_url(provider_name)
+        if base_url:
+            kwargs["base_url"] = base_url
 
         # Pass API key from environment if available
         if provider_name == "anthropic" and os.environ.get("ANTHROPIC_API_KEY"):
@@ -274,13 +299,19 @@ def resolve_provider(
             if model
             else {"api_key": os.environ["ANTHROPIC_API_KEY"]}
         )
+        base_url = _resolve_base_url("anthropic")
+        if base_url:
+            kwargs["base_url"] = base_url
         return get_provider("anthropic", **kwargs)
     if os.environ.get("OPENAI_API_KEY") and os.environ["OPENAI_API_KEY"].strip():
         kwargs = (
             {"model": model, "api_key": os.environ["OPENAI_API_KEY"]}
             if model
             else {"api_key": os.environ["OPENAI_API_KEY"]}
         )
+        base_url = _resolve_base_url("openai")
+        if base_url:
+            kwargs["base_url"] = base_url
         return get_provider("openai", **kwargs)
     if os.environ.get("OPENROUTER_API_KEY") and os.environ["OPENROUTER_API_KEY"].strip():
         kwargs = (
@@ -301,6 +332,9 @@ def resolve_provider(
     ):
         api_key = os.environ.get("GEMINI_API_KEY") or os.environ.get("GOOGLE_API_KEY")
         kwargs = {"model": model, "api_key": api_key} if model else {"api_key": api_key}
+        base_url = _resolve_base_url("gemini")
+        if base_url:
+            kwargs["base_url"] = base_url
         return get_provider("gemini", **kwargs)
 
     raise click.ClickException(
diff --git a/packages/core/src/repowise/core/providers/embedding/openai.py b/packages/core/src/repowise/core/providers/embedding/openai.py
@@ -35,6 +35,7 @@ class OpenAIEmbedder:
     Args:
         api_key: OpenAI API key. Falls back to OPENAI_API_KEY env var.
         model:   Embedding model name. Default: "text-embedding-3-small".
+        base_url: Optional custom base URL for OpenAI-compatible endpoints.
     """
 
     _DIMS: dict[str, int] = {
@@ -51,12 +52,14 @@ def __init__(
         api_key: str | None = None,
         model: str = "text-embedding-3-small",
         timeout: float = _DEFAULT_TIMEOUT,
+        base_url: str | None = None,
     ) -> None:
         self._api_key = api_key or os.environ.get("OPENAI_API_KEY")
         if not self._api_key:
             raise ValueError(
                 "OpenAI API key required. Pass api_key= or set OPENAI_API_KEY env var."
             )
+        self._base_url = base_url or os.environ.get("OPENAI_BASE_URL")
         self._model = model
         self._timeout = timeout
         self._client: object | None = None  # cached; created once on first embed()
@@ -91,6 +94,7 @@ def _embed_sync() -> list[list[float]]:
                 self._client = openai.OpenAI(
                     api_key=self._api_key,
                     timeout=timeout,
+                    base_url=self._base_url,
                 )
             response = self._client.embeddings.create(model=model, input=texts)  # type: ignore[union-attr]
             raw_vectors = [list(item.embedding) for item in response.data]
diff --git a/packages/core/src/repowise/core/providers/llm/anthropic.py b/packages/core/src/repowise/core/providers/llm/anthropic.py
@@ -55,6 +55,7 @@ class AnthropicProvider(BaseProvider):
     Args:
         api_key:      Anthropic API key. Falls back to ANTHROPIC_API_KEY env var.
         model:        Model identifier. Defaults to claude-sonnet-4-6.
+        base_url:     Optional custom API base URL (for proxies/self-hosted endpoints).
         rate_limiter: Optional pre-configured RateLimiter. If None, no rate limiting
                       is applied (useful when the caller manages concurrency via semaphore).
     """
@@ -63,6 +64,7 @@ def __init__(
         self,
         api_key: str | None = None,
         model: str = "claude-sonnet-4-6",
+        base_url: str | None = None,
         rate_limiter: RateLimiter | None = None,
         cost_tracker: CostTracker | None = None,
     ) -> None:
@@ -72,7 +74,8 @@ def __init__(
                 "anthropic",
                 "No API key provided. Pass api_key= or set ANTHROPIC_API_KEY.",
             )
-        self._client = AsyncAnthropic(api_key=resolved_key)
+        resolved_base_url = base_url or os.environ.get("ANTHROPIC_BASE_URL")
+        self._client = AsyncAnthropic(api_key=resolved_key, base_url=resolved_base_url)
         self._model = model
         self._rate_limiter = rate_limiter
         self._cost_tracker = cost_tracker
diff --git a/packages/core/src/repowise/core/providers/llm/gemini.py b/packages/core/src/repowise/core/providers/llm/gemini.py
@@ -55,6 +55,7 @@ class GeminiProvider(BaseProvider):
     Args:
         model:        Gemini model name. Defaults to gemini-3.1-flash-lite-preview.
         api_key:      Google API key. Falls back to GEMINI_API_KEY or GOOGLE_API_KEY env var.
+        base_url:     Optional custom base URL (e.g., for proxy/self-hosted endpoints).
         rate_limiter: Optional RateLimiter instance.
         cost_tracker: Optional CostTracker for recording token usage and cost.
     """
@@ -63,6 +64,7 @@ def __init__(
         self,
         model: str = "gemini-3.1-flash-lite-preview",
         api_key: str | None = None,
+        base_url: str | None = None,
         rate_limiter: RateLimiter | None = None,
         cost_tracker: "CostTracker | None" = None,
     ) -> None:
@@ -77,6 +79,7 @@ def __init__(
                 "gemini",
                 "No API key found. Pass api_key= or set GEMINI_API_KEY / GOOGLE_API_KEY env var.",
             )
+        self._base_url = base_url or os.environ.get("GEMINI_BASE_URL")
         self._rate_limiter = rate_limiter
         self._cost_tracker = cost_tracker
         self._client: object | None = None  # cached; created once on first call
@@ -138,13 +141,36 @@ async def _generate_with_retry(
         # Capture self attrs for thread safety (avoids closing over self)
         model = self._model
         api_key = self._api_key
+        base_url = self._base_url
 
         def _call_sync() -> GeneratedResponse:
             from google import genai  # type: ignore[import-untyped]
             from google.genai import types as genai_types  # type: ignore[import-untyped]
 
             if self._client is None:
-                self._client = genai.Client(api_key=api_key)
+                client_kwargs: dict[str, Any] = {"api_key": api_key}
+                http_opts = None
+
+                if base_url:
+                    try:
+                        http_opts = genai_types.HttpOptions(base_url=base_url)
+                    except TypeError:
+                        log.warning(
+                            "gemini.http_options.base_url_unsupported",
+                            base_url=base_url,
+                        )
+
+                if http_opts is not None:
+                    try:
+                        self._client = genai.Client(**client_kwargs, http_options=http_opts)
+                    except TypeError:
+                        log.warning(
+                            "gemini.client.http_options_unsupported",
+                            base_url=base_url,
+                        )
+                        self._client = genai.Client(**client_kwargs)
+                else:
+                    self._client = genai.Client(**client_kwargs)
             client = self._client
             try:
                 response = client.models.generate_content(
@@ -235,13 +261,16 @@ async def stream_chat(
 
         model_name = self._model
         api_key = self._api_key
+        base_url = self._base_url
 
         def _call_sync(contents, config):
             """Single Gemini generate_content call in thread."""
             from google import genai  # type: ignore[import-untyped]
+            from google.genai import types as genai_types  # type: ignore[import-untyped]
 
             if self._client is None:
-                self._client = genai.Client(api_key=api_key)
+                http_opts = genai_types.HttpOptions(base_url=base_url) if base_url else None
+                self._client = genai.Client(api_key=api_key, http_options=http_opts)
             client = self._client
             try:
                 response = client.models.generate_content(
diff --git a/packages/core/src/repowise/core/providers/llm/litellm.py b/packages/core/src/repowise/core/providers/llm/litellm.py
@@ -19,6 +19,7 @@
 
 from __future__ import annotations
 
+import os
 import structlog
 from tenacity import (
     retry,
@@ -58,6 +59,7 @@ class LiteLLMProvider(BaseProvider):
         api_key:      API key for the target provider. Some providers read from
                       environment variables (e.g., GROQ_API_KEY, TOGETHER_API_KEY).
         api_base:     Optional custom API base URL (e.g., for self-hosted deployments).
+        base_url:     Alias for api_base for OpenAI-compatible proxies.
         rate_limiter: Optional RateLimiter instance.
     """
 
@@ -66,12 +68,18 @@ def __init__(
         model: str,
         api_key: str | None = None,
         api_base: str | None = None,
+        base_url: str | None = None,
         rate_limiter: RateLimiter | None = None,
         cost_tracker: "CostTracker | None" = None,
     ) -> None:
         self._model = model
         self._api_key = api_key
-        self._api_base = api_base
+        self._api_base = (
+            api_base
+            or base_url
+            or os.environ.get("LITELLM_API_BASE")
+            or os.environ.get("LITELLM_BASE_URL")
+        )
         self._rate_limiter = rate_limiter
         self._cost_tracker = cost_tracker
 
diff --git a/packages/core/src/repowise/core/providers/llm/ollama.py b/packages/core/src/repowise/core/providers/llm/ollama.py
@@ -20,6 +20,7 @@
 
 from __future__ import annotations
 
+import os
 import structlog
 from openai import AsyncOpenAI
 from openai import APIStatusError as _OpenAIAPIStatusError
@@ -76,10 +77,11 @@ class OllamaProvider(BaseProvider):
     def __init__(
         self,
         model: str = "llama3.2",
-        base_url: str = _DEFAULT_BASE_URL,
+        base_url: str | None = None,
         rate_limiter: RateLimiter | None = None,
     ) -> None:
-        self._client = AsyncOpenAI(api_key="ollama", base_url=_normalize_base_url(base_url))
+        resolved_base_url = base_url or os.environ.get("OLLAMA_BASE_URL") or _DEFAULT_BASE_URL
+        self._client = AsyncOpenAI(api_key="ollama", base_url=_normalize_base_url(resolved_base_url))
         self._model = model
         self._rate_limiter = rate_limiter
 
diff --git a/packages/core/src/repowise/core/providers/llm/openai.py b/packages/core/src/repowise/core/providers/llm/openai.py
@@ -72,7 +72,8 @@ def __init__(
                 "openai",
                 "No API key provided. Pass api_key= or set OPENAI_API_KEY.",
             )
-        self._client = AsyncOpenAI(api_key=resolved_key, base_url=base_url)
+        resolved_base_url = base_url or os.environ.get("OPENAI_BASE_URL")
+        self._client = AsyncOpenAI(api_key=resolved_key, base_url=resolved_base_url)
         self._model = model
         self._rate_limiter = rate_limiter
         self._cost_tracker = cost_tracker
diff --git a/packages/server/src/repowise/server/mcp_server/tool_answer.py b/packages/server/src/repowise/server/mcp_server/tool_answer.py
@@ -169,6 +169,20 @@ def _try(provider_name: str, **kwargs: Any):
             _log.debug("get_provider(%s) failed", provider_name, exc_info=True)
             return None
 
+    def _resolve_base_url(provider_name: str) -> str | None:
+        mapping = {
+            "openai": ["OPENAI_BASE_URL"],
+            "anthropic": ["ANTHROPIC_BASE_URL"],
+            "gemini": ["GEMINI_BASE_URL"],
+            "ollama": ["OLLAMA_BASE_URL"],
+            "litellm": ["LITELLM_BASE_URL", "LITELLM_API_BASE"],
+        }
+        for env_var in mapping.get(provider_name, []):
+            val = os.environ.get(env_var)
+            if val:
+                return val
+        return None
+
     # Explicit selection wins.
     if name:
         kw: dict[str, Any] = {}
@@ -184,20 +198,27 @@ def _try(provider_name: str, **kwargs: Any):
             kw["api_key"] = os.environ.get("GEMINI_API_KEY") or os.environ.get(
                 "GOOGLE_API_KEY"
             )
-        elif name == "ollama" and os.environ.get("OLLAMA_BASE_URL"):
-            kw["base_url"] = os.environ["OLLAMA_BASE_URL"]
+        base_url = _resolve_base_url(name)
+        if base_url:
+            kw["base_url"] = base_url
         return _try(name, **kw)
 
     # Auto-detect from API keys.
     if os.environ.get("ANTHROPIC_API_KEY"):
         kw = {"api_key": os.environ["ANTHROPIC_API_KEY"]}
         if model:
             kw["model"] = model
+        base_url = _resolve_base_url("anthropic")
+        if base_url:
+            kw["base_url"] = base_url
         return _try("anthropic", **kw)
     if os.environ.get("OPENAI_API_KEY"):
         kw = {"api_key": os.environ["OPENAI_API_KEY"]}
         if model:
             kw["model"] = model
+        base_url = _resolve_base_url("openai")
+        if base_url:
+            kw["base_url"] = base_url
         return _try("openai", **kw)
     if os.environ.get("GEMINI_API_KEY") or os.environ.get("GOOGLE_API_KEY"):
         kw = {
@@ -206,6 +227,9 @@ def _try(provider_name: str, **kwargs: Any):
         }
         if model:
             kw["model"] = model
+        base_url = _resolve_base_url("gemini")
+        if base_url:
+            kw["base_url"] = base_url
         return _try("gemini", **kw)
     if os.environ.get("OLLAMA_BASE_URL"):
         kw = {"base_url": os.environ["OLLAMA_BASE_URL"]}
diff --git a/packages/server/src/repowise/server/provider_config.py b/packages/server/src/repowise/server/provider_config.py
diff --git a/tests/unit/cli/test_helpers.py b/tests/unit/cli/test_helpers.py