fix: switch build backend to hatchling for PEP 660 editable install support

dmikushin · claude · dmikushin · commit f30835b110f2 · 2026-04-09T12:59:23.000-04:00
setuptools 59.6.0 (system) lacks the build_editable hook added in 64.0,
so pip install -e . failed unconditionally. Switching to hatchling which
ships build_editable natively and is already used by all three sub-packages.

To give hatchling a single source root (its editable .pth mechanism supports
only one path), introduce src/repowise/ with symlinks into each sub-package:
  src/repowise/core   -&gt; packages/core/src/repowise/core
  src/repowise/cli    -&gt; packages/cli/src/repowise/cli
  src/repowise/server -&gt; packages/server/src/repowise/server

Also includes the free-code provider (FreeCodeProvider) committed alongside.

Co-Authored-By: Claude Sonnet 4.6 &lt;noreply@anthropic.com&gt;
diff --git a/packages/core/src/repowise/core/providers/llm/free_code.py b/packages/core/src/repowise/core/providers/llm/free_code.py
@@ -0,0 +1,289 @@
+"""free-code provider for repowise.
+
+Uses a locally running free-code serve instance as a gateway to Claude.
+free-code serve exposes an Anthropic-compatible API at http://localhost:3180
+and proxies requests to api.anthropic.com using the user's credentials.
+
+This provider lets repowise call Claude without directly holding an
+Anthropic API key — the key lives in the free-code session instead.
+
+Prerequisites:
+    1. Install free-code (Claude Code CLI)
+    2. Run: claude serve [--port 3180]
+
+Usage:
+    provider = FreeCodeProvider(model="claude-sonnet-4-6")
+    response = await provider.generate(system_prompt="...", user_prompt="...")
+"""
+
+from __future__ import annotations
+
+import os
+
+import structlog
+from anthropic import AsyncAnthropic
+from anthropic import RateLimitError as _AnthropicRateLimitError
+from anthropic import APIStatusError as _AnthropicAPIStatusError
+from tenacity import (
+    retry,
+    retry_if_exception_type,
+    stop_after_attempt,
+    wait_exponential_jitter,
+    RetryError,
+)
+
+from repowise.core.providers.llm.base import (
+    BaseProvider,
+    ChatStreamEvent,
+    ChatToolCall,
+    GeneratedResponse,
+    ProviderError,
+    RateLimitError,
+)
+
+from typing import Any, AsyncIterator
+from repowise.core.rate_limiter import RateLimiter
+
+log = structlog.get_logger(__name__)
+
+_MAX_RETRIES = 3
+_MIN_WAIT = 1.0
+_MAX_WAIT = 8.0
+
+_DEFAULT_BASE_URL = "http://localhost:3180"
+
+# Dummy key value — free-code serve doesn't check the incoming key,
+# but the Anthropic SDK requires a non-empty string.
+_PLACEHOLDER_KEY = "free-code-local"
+
+
+class FreeCodeProvider(BaseProvider):
+    """Anthropic provider that routes through a local free-code serve instance.
+
+    free-code serve (``claude serve``) must be running before using this provider.
+    It exposes an Anthropic-compatible API and proxies requests to api.anthropic.com
+    using the credentials of the logged-in Claude Code user.
+
+    Args:
+        model:        Claude model identifier (e.g., 'claude-sonnet-4-6').
+        base_url:     URL of the local free-code serve instance.
+                      Defaults to http://localhost:3180.
+                      Override via FREE_CODE_BASE_URL env var.
+        rate_limiter: Optional RateLimiter instance.
+    """
+
+    def __init__(
+        self,
+        model: str = "claude-sonnet-4-6",
+        base_url: str | None = None,
+        rate_limiter: RateLimiter | None = None,
+    ) -> None:
+        resolved_url = (
+            base_url
+            or os.environ.get("FREE_CODE_BASE_URL")
+            or _DEFAULT_BASE_URL
+        )
+        self._client = AsyncAnthropic(
+            api_key=_PLACEHOLDER_KEY,
+            base_url=resolved_url,
+        )
+        self._model = model
+        self._rate_limiter = rate_limiter
+        self._base_url = resolved_url
+
+    @property
+    def provider_name(self) -> str:
+        return "free-code"
+
+    @property
+    def model_name(self) -> str:
+        return self._model
+
+    async def generate(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        max_tokens: int = 4096,
+        temperature: float = 0.3,
+        request_id: str | None = None,
+    ) -> GeneratedResponse:
+        if self._rate_limiter:
+            await self._rate_limiter.acquire(estimated_tokens=max_tokens)
+
+        log.debug(
+            "free_code.generate.start",
+            model=self._model,
+            base_url=self._base_url,
+            max_tokens=max_tokens,
+            request_id=request_id,
+        )
+
+        try:
+            return await self._generate_with_retry(
+                system_prompt=system_prompt,
+                user_prompt=user_prompt,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                request_id=request_id,
+            )
+        except RetryError as exc:
+            raise ProviderError(
+                "free-code",
+                f"All {_MAX_RETRIES} retries exhausted: {exc}",
+            ) from exc
+
+    @retry(
+        retry=retry_if_exception_type(ProviderError),
+        stop=stop_after_attempt(_MAX_RETRIES),
+        wait=wait_exponential_jitter(initial=_MIN_WAIT, max=_MAX_WAIT),
+        reraise=True,
+    )
+    async def _generate_with_retry(
+        self,
+        system_prompt: str,
+        user_prompt: str,
+        max_tokens: int,
+        temperature: float,
+        request_id: str | None,
+    ) -> GeneratedResponse:
+        try:
+            response = await self._client.messages.create(
+                model=self._model,
+                max_tokens=max_tokens,
+                temperature=temperature,
+                system=system_prompt,
+                messages=[{"role": "user", "content": user_prompt}],
+            )
+        except _AnthropicRateLimitError as exc:
+            raise RateLimitError("free-code", str(exc), status_code=429) from exc
+        except _AnthropicAPIStatusError as exc:
+            raise ProviderError(
+                "free-code", str(exc), status_code=exc.status_code
+            ) from exc
+        except Exception as exc:
+            # Catch connection errors (free-code serve not running, wrong port, etc.)
+            raise ProviderError(
+                "free-code",
+                f"Connection to {self._base_url} failed: {exc}. "
+                "Is 'claude serve' running?",
+            ) from exc
+
+        cached = getattr(response.usage, "cache_read_input_tokens", 0) or 0
+        result = GeneratedResponse(
+            content=response.content[0].text,
+            input_tokens=response.usage.input_tokens,
+            output_tokens=response.usage.output_tokens,
+            cached_tokens=cached,
+            usage={
+                "input_tokens": response.usage.input_tokens,
+                "output_tokens": response.usage.output_tokens,
+                "cache_read_input_tokens": cached,
+            },
+        )
+        log.debug(
+            "free_code.generate.done",
+            input_tokens=result.input_tokens,
+            output_tokens=result.output_tokens,
+            request_id=request_id,
+        )
+        return result
+
+    # --- ChatProvider protocol implementation ---
+
+    async def stream_chat(
+        self,
+        messages: list[dict[str, Any]],
+        tools: list[dict[str, Any]],
+        system_prompt: str,
+        max_tokens: int = 8192,
+        temperature: float = 0.7,
+        request_id: str | None = None,
+        tool_executor: Any | None = None,
+    ) -> AsyncIterator[ChatStreamEvent]:
+        """Stream chat via free-code serve (Anthropic-compatible endpoint)."""
+        import json as _json
+
+        # Convert OpenAI-format tools to Anthropic format
+        anthropic_tools = []
+        for t in tools:
+            fn = t.get("function", t)
+            anthropic_tools.append({
+                "name": fn["name"],
+                "description": fn.get("description", ""),
+                "input_schema": fn.get("parameters", {}),
+            })
+
+        # Convert OpenAI-format messages to Anthropic format
+        from repowise.core.providers.llm.anthropic import _to_anthropic_messages
+        anthropic_messages = _to_anthropic_messages(messages)
+
+        kwargs: dict[str, Any] = {
+            "model": self._model,
+            "max_tokens": max_tokens,
+            "temperature": temperature,
+            "system": system_prompt,
+            "messages": anthropic_messages,
+        }
+        if anthropic_tools:
+            kwargs["tools"] = anthropic_tools
+
+        try:
+            async with self._client.messages.stream(**kwargs) as stream:
+                current_tool_id: str | None = None
+                current_tool_name: str | None = None
+                current_tool_input_json = ""
+
+                async for event in stream:
+                    if event.type == "content_block_start":
+                        block = event.content_block
+                        if hasattr(block, "type") and block.type == "tool_use":
+                            current_tool_id = block.id
+                            current_tool_name = block.name
+                            current_tool_input_json = ""
+                    elif event.type == "content_block_delta":
+                        delta = event.delta
+                        if hasattr(delta, "type"):
+                            if delta.type == "text_delta":
+                                yield ChatStreamEvent(type="text_delta", text=delta.text)
+                            elif delta.type == "input_json_delta":
+                                current_tool_input_json += delta.partial_json
+                    elif event.type == "content_block_stop":
+                        if current_tool_name:
+                            try:
+                                args = _json.loads(current_tool_input_json) if current_tool_input_json else {}
+                            except Exception:
+                                args = {}
+                            yield ChatStreamEvent(
+                                type="tool_start",
+                                tool_call=ChatToolCall(
+                                    id=current_tool_id or "",
+                                    name=current_tool_name,
+                                    arguments=args,
+                                ),
+                            )
+                            current_tool_id = None
+                            current_tool_name = None
+                            current_tool_input_json = ""
+                    elif event.type == "message_delta":
+                        stop = getattr(event.delta, "stop_reason", None)
+                        usage = getattr(event, "usage", None)
+                        if usage:
+                            yield ChatStreamEvent(
+                                type="usage",
+                                input_tokens=getattr(usage, "input_tokens", 0) or 0,
+                                output_tokens=getattr(usage, "output_tokens", 0) or 0,
+                            )
+                        if stop:
+                            yield ChatStreamEvent(type="stop", stop_reason=stop)
+                    elif event.type == "message_stop":
+                        pass
+        except _AnthropicRateLimitError as exc:
+            raise RateLimitError("free-code", str(exc), status_code=429) from exc
+        except _AnthropicAPIStatusError as exc:
+            raise ProviderError("free-code", str(exc), status_code=exc.status_code) from exc
+        except Exception as exc:
+            raise ProviderError(
+                "free-code",
+                f"Connection to {self._base_url} failed: {exc}. "
+                "Is 'claude serve' running?",
+            ) from exc
diff --git a/packages/core/src/repowise/core/providers/llm/registry.py b/packages/core/src/repowise/core/providers/llm/registry.py
@@ -9,6 +9,7 @@
     - openai     → OpenAIProvider
     - ollama     → OllamaProvider
     - litellm    → LiteLLMProvider
+    - free-code  → FreeCodeProvider (local Claude Code proxy)
     - mock       → MockProvider (testing only)
 
 Custom provider registration:
@@ -39,6 +40,7 @@
     "gemini": ("repowise.core.providers.llm.gemini", "GeminiProvider"),
     "ollama": ("repowise.core.providers.llm.ollama", "OllamaProvider"),
     "litellm": ("repowise.core.providers.llm.litellm", "LiteLLMProvider"),
+    "free-code": ("repowise.core.providers.llm.free_code", "FreeCodeProvider"),
     "mock": ("repowise.core.providers.llm.mock", "MockProvider"),
 }
 
@@ -135,6 +137,7 @@ def get_provider(
             "gemini": "google-genai",
             "ollama": "openai",  # ollama uses the openai package
             "litellm": "litellm",
+            "free-code": "anthropic",  # free-code uses the anthropic package
         }
         package = _missing.get(name, name)
         raise ImportError(
diff --git a/pyproject.toml b/pyproject.toml
@@ -2,8 +2,8 @@
 # repowise — unified PyPI package
 # ---------------------------------------------------------------------------
 [build-system]
-requires = ["setuptools>=75"]
-build-backend = "setuptools.build_meta"
+requires = ["hatchling"]
+build-backend = "hatchling.build"
 
 [project]
 name = "repowise"
@@ -109,41 +109,24 @@ Issues = "https://github.com/RaghavChamadiya/repowise/issues"
 Documentation = "https://github.com/RaghavChamadiya/repowise/blob/main/docs/USER_GUIDE.md"
 
 # ---------------------------------------------------------------------------
-# setuptools — explicit package-dir mapping across three src/ directories
+# hatchling — standard src/ layout with symlinks into per-package source trees
+#
+# src/repowise/{core,cli,server} are symlinks into packages/*/src/repowise/*.
+# This gives hatchling a single source root so editable installs work correctly
+# (one .pth entry pointing at src/ covers all three sub-namespaces).
 # ---------------------------------------------------------------------------
-[tool.setuptools.package-dir]
-"repowise.core" = "packages/core/src/repowise/core"
-"repowise.cli" = "packages/cli/src/repowise/cli"
-"repowise.server" = "packages/server/src/repowise/server"
+[tool.hatch.build.targets.wheel]
+packages = ["src/repowise"]
 
-[tool.setuptools]
-packages = [
-    # core
-    "repowise.core",
-    "repowise.core.analysis",
-    "repowise.core.generation",
-    "repowise.core.generation.editor_files",
-    "repowise.core.ingestion",
-    "repowise.core.ingestion.parsers",
-    "repowise.core.pipeline",
-    "repowise.core.persistence",
-    "repowise.core.providers",
-    "repowise.core.providers.llm",
-    "repowise.core.providers.embedding",
-    # cli
-    "repowise.cli",
-    "repowise.cli.commands",
-    # server
-    "repowise.server",
-    "repowise.server.routers",
-    "repowise.server.mcp_server",
-    "repowise.server.services",
+[tool.hatch.build.targets.sdist]
+include = [
+    "src/",
+    "packages/*/src/**",
+    "pyproject.toml",
+    "README.md",
+    "LICENSE",
 ]
 
-[tool.setuptools.package-data]
-"repowise.core.ingestion" = ["queries/*.scm"]
-"repowise.core.generation" = ["templates/*.j2"]
-
 # ---------------------------------------------------------------------------
 # uv workspace (kept for local development)
 # ---------------------------------------------------------------------------
diff --git a/src/repowise/cli b/src/repowise/cli
@@ -0,0 +1 @@
+../../packages/cli/src/repowise/cli
diff --git a/src/repowise/core b/src/repowise/core
@@ -0,0 +1 @@
+../../packages/core/src/repowise/core
diff --git a/src/repowise/server b/src/repowise/server
@@ -0,0 +1 @@
+../../packages/server/src/repowise/server

Original file line number	Diff line number	Diff line change
`@@ -0,0 +1 @@`
	`1`	`+../../packages/server/src/repowise/server`