feat: multiple replicas for renderer and generator

kudroma404 · kudroma404 · commit 1a2ae77ae429 · 2026-02-05T18:19:30.000+03:00
diff --git a/commit.py b/commit.py
@@ -638,7 +638,39 @@ def _parse_commitments(commitments: dict, round_number: int, schedule: Schedule,
     help="HuggingFace token to pass as HF_TOKEN environment variable",
 )
 @click.option("--name", "container_name", default=None, help="Custom container name (default: generator)")
-def start_generator_cmd(image_url: str, targon_api_key: str, hf_token: str | None, container_name: str | None) -> None:
+@click.option(
+    "--container-concurrency",
+    "container_concurrency",
+    type=int,
+    default=1,
+    show_default=True,
+    help="Maximum concurrent requests per generator replica.",
+)
+@click.option(
+    "--min-replicas",
+    "min_replicas",
+    type=int,
+    default=1,
+    show_default=True,
+    help="Minimum number of generator replicas.",
+)
+@click.option(
+    "--max-replicas",
+    "max_replicas",
+    type=int,
+    default=2,
+    show_default=True,
+    help="Maximum number of generator replicas.",
+)
+def start_generator_cmd(
+    image_url: str,
+    targon_api_key: str,
+    hf_token: str | None,
+    container_name: str | None,
+    container_concurrency: int,
+    min_replicas: int,
+    max_replicas: int,
+) -> None:
     """Start the generator container."""
     click.echo(f"Starting generator: {image_url}", err=True)
 
@@ -663,6 +695,9 @@ def start_generator_cmd(image_url: str, targon_api_key: str, hf_token: str | Non
                 health_check_path=_GENERATOR_HEALTH_CHECK_PATH,
                 echo=lambda msg: click.echo(msg, err=True),
                 env=env,
+                container_concurrency=container_concurrency,
+                min_replicas=min_replicas,
+                max_replicas=max_replicas,
             )
         )
         click.echo(json.dumps({"success": True, "container_url": container_url}))
@@ -678,7 +713,36 @@ def start_generator_cmd(image_url: str, targon_api_key: str, hf_token: str | Non
 
 @cli.command("start-renderer")
 @click.option("--targon-api-key", required=True, help="Targon API key")
-def start_renderer_cmd(targon_api_key: str) -> None:
+@click.option(
+    "--container-concurrency",
+    "container_concurrency",
+    type=int,
+    default=1,
+    show_default=True,
+    help="Maximum concurrent requests per renderer replica.",
+)
+@click.option(
+    "--min-replicas",
+    "min_replicas",
+    type=int,
+    default=1,
+    show_default=True,
+    help="Minimum number of renderer replicas.",
+)
+@click.option(
+    "--max-replicas",
+    "max_replicas",
+    type=int,
+    default=2,
+    show_default=True,
+    help="Maximum number of renderer replicas.",
+)
+def start_renderer_cmd(
+    targon_api_key: str,
+    container_concurrency: int,
+    min_replicas: int,
+    max_replicas: int,
+) -> None:
     """Start the renderer container."""
     click.echo(f"Starting renderer: {_RENDER_IMAGE_URL}", err=True)
 
@@ -692,6 +756,9 @@ def start_renderer_cmd(targon_api_key: str) -> None:
                 port=_RENDER_PORT,
                 health_check_path=_RENDER_HEALTH_CHECK_PATH,
                 echo=lambda msg: click.echo(msg, err=True),
+                container_concurrency=container_concurrency,
+                min_replicas=min_replicas,
+                max_replicas=max_replicas,
             )
         )
         click.echo(json.dumps({"success": True, "container_url": container_url}))
@@ -709,14 +776,22 @@ def start_renderer_cmd(targon_api_key: str) -> None:
 @click.option("--data-dir", required=True, help="Path to the directory containing the .ply files to render")
 @click.option("--endpoint", required=True, help="Renderer endpoint URL.")
 @click.option("--output-dir", default="results", help="Path to the directory where the rendered images will be saved.")
-def render_cmd(data_dir: str, endpoint: str, output_dir: str) -> None:
+@click.option(
+    "--concurrency",
+    type=int,
+    default=1,
+    show_default=True,
+    help="Maximum number of files rendered concurrently.",
+)
+def render_cmd(data_dir: str, endpoint: str, output_dir: str, concurrency: int) -> None:
     """Render the .ply files using the renderer endpoint."""
     click.echo(f"Rendering {data_dir} with endpoint {endpoint}", err=True)
     try:
         renderer = Renderer(
             data_dir=data_dir,
             endpoint=endpoint,
             output_dir=output_dir,
+            concurrency=concurrency,
         )
         asyncio.run(renderer.render())
         click.echo(json.dumps({"success": True, "output_dir": output_dir}))
@@ -833,11 +908,19 @@ async def _stop() -> None:
 @click.option("--endpoint", required=True, help="Generator endpoint URL.")
 @click.option("--seed", required=True, help="Seed for generation.")
 @click.option("--output-folder", default="results", help="Folder path where generated .ply files will be saved.")
+@click.option(
+    "--concurrency",
+    type=int,
+    default=8,
+    show_default=True,
+    help="Maximum number of prompts / HTTP requests processed concurrently.",
+)
 def generate_cmd(
     prompts_file: str,
     endpoint: str,
     seed: str,
     output_folder: str,
+    concurrency: int,
 ) -> None:
     """Generate models using the generator endpoint."""
     # Read prompts from prompt file
@@ -864,6 +947,7 @@ def generate_cmd(
         seed=int(seed),
         output_folder=Path(output_folder),
         echo=lambda msg: click.echo(msg, err=True),
+        concurrency=concurrency,
     )
 
     try:
@@ -888,6 +972,9 @@ async def _create_container(
     echo: Callable[[str], None],
     args: list[str] | None = None,
     env: dict[str, str] | None = None,
+    container_concurrency: int = 1,
+    min_replicas: int = 1,
+    max_replicas: int = 2,
 ) -> str:
     """
     Create and deploy a container on Targon.
@@ -914,7 +1001,9 @@ async def _create_container(
                 image=image_url,
                 resource_name=resource_name,
                 port=port,
-                container_concurrency=1,
+                container_concurrency=container_concurrency,
+                min_replicas=min_replicas,
+                max_replicas=max_replicas,
                 args=args,
                 env=env,
             )
diff --git a/generator.py b/generator.py
@@ -14,6 +14,7 @@ def __init__(
         seed: int,
         output_folder: Path,
         echo: Callable[[str], None] | None = None,
+        concurrency: int = 8,
     ) -> None:
         """
         Initialize the Generator.
@@ -23,11 +24,13 @@ def __init__(
             seed: Seed value for generation (ensures reproducibility)
             output_folder: Path to folder where .ply files will be saved
             echo: Optional callback function for logging messages
+            concurrency: Max concurrent prompts / HTTP requests
         """
         self.endpoint = endpoint
         self.seed = seed
         self.output_folder = Path(output_folder)
         self.echo = echo or (lambda msg: None)
+        self.concurrency = concurrency
 
         # Create output folder if it doesn't exist
         self.output_folder.mkdir(parents=True, exist_ok=True)
@@ -46,8 +49,8 @@ async def generate_all(self, prompts: list[str]) -> None:
         tasks = []
         try:
             self.echo(f"Processing {len(prompts)} prompts...")
-            request_sem = asyncio.Semaphore(1)  # Using semaphores to limit request to one at a time.
-            process_sem = asyncio.Semaphore(8)  # Limiting request to control traffic
+            request_sem = asyncio.Semaphore(self.concurrency)
+            process_sem = asyncio.Semaphore(self.concurrency)
             tasks = [
                 asyncio.create_task(
                     self._process_prompt(
diff --git a/renderer.py b/renderer.py
@@ -8,18 +8,26 @@
 
 
 class Renderer:
-    def __init__(self, *, endpoint: str, data_dir: str, output_dir: str) -> None:
+    def __init__(
+        self,
+        *,
+        endpoint: str,
+        data_dir: str,
+        output_dir: str,
+        concurrency: int = 1,
+    ) -> None:
         self._endpoint = endpoint
         self._data_dir = Path(data_dir)
         self._output_dir = Path(output_dir)
         self._output_dir.mkdir(parents=True, exist_ok=True)
+        self._concurrency = concurrency
 
     async def render(self) -> None:
         """Render the .ply and .glb files using the renderer endpoint."""
         click.echo(f"Rendering {self._data_dir} with endpoint {self._endpoint}", err=True)
         tasks: list[asyncio.Task] = []
         try:
-            process_sem = asyncio.Semaphore(1)
+            process_sem = asyncio.Semaphore(self._concurrency)
             # Collect both .ply and .glb files
             ply_files = list(self._data_dir.glob("*.ply"))
             glb_files = list(self._data_dir.glob("*.glb"))
diff --git a/targon_client.py b/targon_client.py
@@ -24,6 +24,8 @@ class ContainerDeployConfig(BaseModel):
 
     image: str
     container_concurrency: int
+    min_replicas: int = 1
+    max_replicas: int = 2
     resource_name: str = "h200-small"
     port: int = 10006
     args: list[str] | None = None
@@ -96,8 +98,8 @@ async def deploy_container(self, name: str, config: ContainerDeployConfig) -> No
                 visibility="external",
             ),
             scaling=AutoScalingConfig(
-                min_replicas=1,
-                max_replicas=1,
+                min_replicas=config.min_replicas,
+                max_replicas=config.max_replicas,
                 container_concurrency=config.container_concurrency,
                 target_concurrency=config.container_concurrency,
             ),