feat(inference): add data-parallel-size config for vllm (#975)

csg-pr-bot · Dev Agent · web-flow · commit b26b54dde41c · 2026-04-09T17:47:47.000+08:00
Co-authored-by: Dev Agent &lt;dev-agent@example.com&gt;
diff --git a/configs/inference/vllm.json b/configs/inference/vllm.json
@@ -235,6 +235,11 @@
       "value": "0",
       "format": "--cpu-offload-gb %s"
     },
+    {
+      "name": "data-parallel-size",
+      "value": "1",
+      "format": "--data-parallel-size %s"
+    },
     {
       "name": "pipeline-parallel-size",
       "value": "1",
@@ -285,6 +290,11 @@
       "value": "disable",
       "format": "--enable-auto-tool-choice"
     },
+    {
+      "name": "enable-expert-parallel",
+      "value": "disable",
+      "format": "--enable-expert-parallel"
+    },
     {
       "name": "limit-mm-per-prompt",
       "value": "image=5,video=5",