refactor: also rename factory function rewrite_max_tokens in openai/openai-compatible

nic-6443 · nic-6443 · commit 45e5df4860af · 2026-04-20T15:31:52.000+08:00
diff --git a/apisix/plugins/ai-providers/aimlapi.lua b/apisix/plugins/ai-providers/aimlapi.lua
@@ -15,7 +15,7 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_tokens == nil then
             body.max_tokens = override.max_tokens
@@ -30,7 +30,7 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/chat/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/anthropic.lua b/apisix/plugins/ai-providers/anthropic.lua
@@ -15,7 +15,16 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
+    if override.max_tokens then
+        if force or body.max_tokens == nil then
+            body.max_tokens = override.max_tokens
+        end
+    end
+end
+
+
+local function rewrite_messages_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_tokens == nil then
             body.max_tokens = override.max_tokens
@@ -30,11 +39,11 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/v1/chat/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
             ["anthropic-messages"] = {
                 path = "/v1/messages",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_messages_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/azure-openai.lua b/apisix/plugins/ai-providers/azure-openai.lua
@@ -15,7 +15,7 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_tokens == nil then
             body.max_tokens = override.max_tokens
@@ -30,7 +30,7 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/deepseek.lua b/apisix/plugins/ai-providers/deepseek.lua
@@ -15,7 +15,7 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_tokens == nil then
             body.max_tokens = override.max_tokens
@@ -30,7 +30,7 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/chat/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/gemini.lua b/apisix/plugins/ai-providers/gemini.lua
@@ -15,7 +15,7 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_completion_tokens == nil then
             body.max_completion_tokens = override.max_tokens
@@ -30,7 +30,7 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/v1beta/openai/chat/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/openai-compatible.lua b/apisix/plugins/ai-providers/openai-compatible.lua
@@ -15,12 +15,19 @@
 -- limitations under the License.
 --
 
-local function rewrite_max_tokens(field_name)
-    return function(body, override, force)
-        if override.max_tokens then
-            if force or body[field_name] == nil then
-                body[field_name] = override.max_tokens
-            end
+local function rewrite_chat_request_body(body, override, force)
+    if override.max_tokens then
+        if force or body.max_tokens == nil then
+            body.max_tokens = override.max_tokens
+        end
+    end
+end
+
+
+local function rewrite_responses_request_body(body, override, force)
+    if override.max_tokens then
+        if force or body.max_output_tokens == nil then
+            body.max_output_tokens = override.max_tokens
         end
     end
 end
@@ -29,11 +36,11 @@ return require("apisix.plugins.ai-providers.base").new({
     capabilities = {
         ["openai-chat"]       = {
             path = "/v1/chat/completions",
-            rewrite_request_body = rewrite_max_tokens("max_tokens"),
+            rewrite_request_body = rewrite_chat_request_body,
         },
         ["openai-responses"]  = {
             path = "/v1/responses",
-            rewrite_request_body = rewrite_max_tokens("max_output_tokens"),
+            rewrite_request_body = rewrite_responses_request_body,
         },
         ["openai-embeddings"] = { path = "/v1/embeddings" },
     },
diff --git a/apisix/plugins/ai-providers/openai.lua b/apisix/plugins/ai-providers/openai.lua
@@ -15,12 +15,20 @@
 -- limitations under the License.
 --
 
-local function rewrite_max_tokens(field_name)
-    return function(body, override, force)
-        if override.max_tokens then
-            if force or body[field_name] == nil then
-                body[field_name] = override.max_tokens
-            end
+local function rewrite_chat_request_body(body, override, force)
+    if override.max_tokens then
+        if force or (body.max_completion_tokens == nil and body.max_tokens == nil) then
+            body.max_completion_tokens = override.max_tokens
+            body.max_tokens = nil
+        end
+    end
+end
+
+
+local function rewrite_responses_request_body(body, override, force)
+    if override.max_tokens then
+        if force or body.max_output_tokens == nil then
+            body.max_output_tokens = override.max_tokens
         end
     end
 end
@@ -32,11 +40,11 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"]       = {
                 path = "/v1/chat/completions",
-                rewrite_request_body = rewrite_max_tokens("max_completion_tokens"),
+                rewrite_request_body = rewrite_chat_request_body,
             },
             ["openai-responses"]  = {
                 path = "/v1/responses",
-                rewrite_request_body = rewrite_max_tokens("max_output_tokens"),
+                rewrite_request_body = rewrite_responses_request_body,
             },
             ["openai-embeddings"] = { path = "/v1/embeddings" },
         },
diff --git a/apisix/plugins/ai-providers/openrouter.lua b/apisix/plugins/ai-providers/openrouter.lua
@@ -15,7 +15,7 @@
 -- limitations under the License.
 --
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_tokens == nil then
             body.max_tokens = override.max_tokens
@@ -30,7 +30,7 @@ return require("apisix.plugins.ai-providers.base").new(
         capabilities = {
             ["openai-chat"] = {
                 path = "/api/v1/chat/completions",
-                rewrite_request_body = rewrite_request_body,
+                rewrite_request_body = rewrite_chat_request_body,
             },
         },
     }
diff --git a/apisix/plugins/ai-providers/vertex-ai.lua b/apisix/plugins/ai-providers/vertex-ai.lua
@@ -54,7 +54,7 @@ local function get_node(instance_conf)
 end
 
 
-local function rewrite_request_body(body, override, force)
+local function rewrite_chat_request_body(body, override, force)
     if override.max_tokens then
         if force or body.max_completion_tokens == nil then
             body.max_completion_tokens = override.max_tokens
@@ -74,7 +74,7 @@ return require("apisix.plugins.ai-providers.base").new({
                     return get_chat_completions_path(conf.project_id, conf.region)
                 end
             end,
-            rewrite_request_body = rewrite_request_body,
+            rewrite_request_body = rewrite_chat_request_body,
         },
         ["vertex-predict"] = {
             host = function(conf)
diff --git a/t/plugin/ai-proxy-request-body-override.t b/t/plugin/ai-proxy-request-body-override.t
@@ -496,3 +496,90 @@ max_tokens=555
     }
 --- response_body
 max_tokens=555
+
+
+
+=== TEST 10: openai chat - deprecated max_tokens in body is respected in default mode and cleared in force mode
+--- config
+    location /t {
+        content_by_lua_block {
+            local t = require("lib.test_admin").test
+
+            -- Route with default mode (no force)
+            local code = t('/apisix/admin/routes/1',
+                 ngx.HTTP_PUT,
+                 [[{
+                    "uri": "/chat",
+                    "plugins": {
+                        "ai-proxy": {
+                            "provider": "openai",
+                            "model": { "name": "gpt-4" },
+                            "auth": { "header": { "Authorization": "Bearer t" } },
+                            "override": {
+                                "endpoint": "http://localhost:6732",
+                                "request_body": {
+                                    "max_tokens": 999
+                                }
+                            },
+                            "ssl_verify": false
+                        }
+                    }
+                }]]
+            )
+            if code >= 300 then ngx.status = code; return end
+
+            local http = require("resty.http").new()
+            local cjson = require("cjson.safe")
+
+            -- Client sends deprecated max_tokens=200; default mode should NOT override
+            local res = assert(http:request_uri("http://127.0.0.1:" .. ngx.var.server_port .. "/chat", {
+                method = "POST",
+                body = '{"messages":[{"role":"user","content":"hi"}],"max_tokens":200}',
+                headers = { ["Content-Type"] = "application/json" },
+            }))
+            local body = cjson.decode(res.body)
+            local echoed = cjson.decode(body.choices[1].message.content)
+            ngx.say("default: max_tokens=", echoed.max_tokens,
+                    " max_completion_tokens=", echoed.max_completion_tokens)
+
+            -- Switch to force mode
+            code = t('/apisix/admin/routes/1',
+                 ngx.HTTP_PUT,
+                 [[{
+                    "uri": "/chat",
+                    "plugins": {
+                        "ai-proxy": {
+                            "provider": "openai",
+                            "model": { "name": "gpt-4" },
+                            "auth": { "header": { "Authorization": "Bearer t" } },
+                            "override": {
+                                "endpoint": "http://localhost:6732",
+                                "request_body": {
+                                    "max_tokens": 999
+                                },
+                                "request_body_force_override": true
+                            },
+                            "ssl_verify": false
+                        }
+                    }
+                }]]
+            )
+            if code >= 300 then ngx.status = code; return end
+
+            ngx.sleep(0.5)
+
+            -- Client sends deprecated max_tokens=200; force mode should clear it and set max_completion_tokens
+            res = assert(http:request_uri("http://127.0.0.1:" .. ngx.var.server_port .. "/chat", {
+                method = "POST",
+                body = '{"messages":[{"role":"user","content":"hi"}],"max_tokens":200}',
+                headers = { ["Content-Type"] = "application/json" },
+            }))
+            body = cjson.decode(res.body)
+            echoed = cjson.decode(body.choices[1].message.content)
+            ngx.say("force: max_tokens=", echoed.max_tokens,
+                    " max_completion_tokens=", echoed.max_completion_tokens)
+        }
+    }
+--- response_body
+default: max_tokens=200 max_completion_tokens=nil
+force: max_tokens=nil max_completion_tokens=999