feat(ai-proxy): validate model before starting server

bitsnaps · bitsnaps · commit 288024edadfa · 2026-02-06T12:15:52.000+01:00
diff --git a/src/commands/ai.js b/src/commands/ai.js
@@ -123,6 +123,21 @@ const buildModelListResponse = (models, fallbackModel) => {
   return { object: 'list', data };
 };
 
+const normalizeModelIds = (models) => {
+  if (!Array.isArray(models)) return [];
+  return models.map((model) => {
+    if (typeof model === 'string') return model;
+    if (model && model.id) return model.id;
+    return null;
+  }).filter(Boolean);
+};
+
+const resolveAvailableModelsRaw = async (puter) => {
+  if (!puter.ai || typeof puter.ai.listModels !== 'function') return [];
+  const models = await puter.ai.listModels();
+  return Array.isArray(models) ? models : [];
+};
+
 export const createAIProxyServer = (options = {}) => {
   const defaults = {
     host: options.host || '127.0.0.1',
@@ -132,11 +147,18 @@ export const createAIProxyServer = (options = {}) => {
     maxTokens: normalizeNumber(options.maxTokens, 1024),
     temperature: normalizeNumber(options.temperature, 1)
   };
+  const availableModelsRaw = options.availableModelsRaw;
+  const availableModelsNormalized = Array.isArray(availableModelsRaw)
+    ? normalizeModelIds(availableModelsRaw)
+    : null;
 
   const modelsHandler = async ({ res }) => {
     try {
+      if (Array.isArray(availableModelsRaw)) {
+        return sendJson(res, 200, buildModelListResponse(availableModelsRaw, defaults.model));
+      }
       const puter = getPuter();
-      const models = typeof puter.ai?.listModels === 'function' ? await puter.ai.listModels() : [];
+      const models = await resolveAvailableModelsRaw(puter);
       return sendJson(res, 200, buildModelListResponse(models, defaults.model));
     } catch (error) {
       return sendJson(res, 500, { error: { message: error.message || 'Failed to list models' } });
@@ -148,7 +170,7 @@ export const createAIProxyServer = (options = {}) => {
       method: 'GET',
       path: '/',
       handler: async ({ res }) => {
-        return sendJson(res, 200, { status: 'ok', message: 'Puter AI proxy running on /v1' });
+        return sendJson(res, 200, { status: 'ok', message: 'Puter AI running on /v1' });
       }
     },
     {
@@ -192,6 +214,17 @@ export const createAIProxyServer = (options = {}) => {
             return sendJson(res, 500, { error: { message: 'AI service not available', type: 'service_unavailable' } });
           }
 
+          if (availableModelsNormalized) {
+            if (availableModelsNormalized.length > 0 && !availableModelsNormalized.includes(model)) {
+              return sendJson(res, 400, { error: { message: `Unknown model: ${model}`, type: 'invalid_request_error' } });
+            }
+          } else if (typeof puter.ai.listModels === 'function') {
+            const availableModels = normalizeModelIds(await puter.ai.listModels());
+            if (availableModels.length > 0 && !availableModels.includes(model)) {
+              return sendJson(res, 400, { error: { message: `Unknown model: ${model}`, type: 'invalid_request_error' } });
+            }
+          }
+
           const result = await puter.ai.chat(prompt, {
             model,
             temperature,
@@ -224,15 +257,48 @@ export const createAIProxyServer = (options = {}) => {
 };
 
 export const startAIProxyServer = async (options = {}) => {
+  const requestedModel = typeof options.model === 'string'
+    ? options.model.trim()
+    : (options.model ? String(options.model).trim() : '');
   const defaults = {
     host: options.host || '127.0.0.1',
     port: normalizeNumber(options.port, 8080),
-    model: options.model || process.env.PUTER_AI_MODEL || 'gpt-5-nano',
+    model: requestedModel || process.env.PUTER_AI_MODEL || 'gpt-5-nano',
     system: options.system ?? process.env.PUTER_AI_SYSTEM ?? '',
     maxTokens: normalizeNumber(options.maxTokens, 1024),
     temperature: normalizeNumber(options.temperature, 1)
   };
-  const server = createAIProxyServer(defaults);
+  const profileModule = getProfileModule();
+  const authToken = profileModule.getAuthToken();
+  if (!authToken) {
+    throw new Error('Not authenticated. Run: puter login');
+  }
+
+  const puter = getPuter();
+  const availableModelsRaw = await resolveAvailableModelsRaw(puter);
+  const availableModels = normalizeModelIds(availableModelsRaw);
+  if (requestedModel && availableModels.length > 0 && !availableModels.includes(requestedModel)) {
+    console.error(chalk.red(`Unknown model: ${requestedModel}`));
+    const normalizedQuery = requestedModel.toLowerCase();
+    const tokens = normalizedQuery.split(/[-_/]/).filter(Boolean);
+    const primaryToken = tokens[0];
+    const prefix = normalizedQuery.slice(0, 3);
+    const suggestedModels = Array.from(new Set(availableModels.filter((model) => {
+      const lower = model.toLowerCase();
+      if (primaryToken && lower.includes(primaryToken)) return true;
+      if (!primaryToken && normalizedQuery.length > 3 && lower.includes(prefix)) return true;
+      return false;
+    })));
+    if (suggestedModels.length > 0) {
+      console.log(chalk.cyan('Try one of the following:'));
+      for (const suggestedModel of suggestedModels) {
+        console.log(chalk.dim(`  ${suggestedModel}`));
+      }
+    }
+    return null;
+  }
+
+  const server = createAIProxyServer({ ...defaults, availableModelsRaw });
   const { host, port } = await server.start();
   const trimmedSystem = String(defaults.system || '').trim();
   const systemPreview = trimmedSystem
diff --git a/tests/ai.test.js b/tests/ai.test.js
@@ -1,5 +1,5 @@
 import { describe, it, expect, vi, beforeEach, afterEach } from 'vitest';
-import { createAIProxyServer } from '../src/commands/ai.js';
+import { createAIProxyServer, startAIProxyServer } from '../src/commands/ai.js';
 import { getPuter } from '../src/modules/PuterModule.js';
 import { getProfileModule } from '../src/modules/ProfileModule.js';
 
@@ -65,7 +65,8 @@ describe('AI proxy server', () => {
   it('serves non-streaming chat completion', async () => {
     const puterMock = {
       ai: {
-        chat: vi.fn().mockResolvedValue('Hello there')
+        chat: vi.fn().mockResolvedValue('Hello there'),
+        listModels: vi.fn().mockResolvedValue(['gpt-5-nano'])
       }
     };
     const { port } = await startServer(puterMock);
@@ -86,7 +87,8 @@ describe('AI proxy server', () => {
   it('serves streaming chat completion', async () => {
     const puterMock = {
       ai: {
-        chat: vi.fn().mockResolvedValue('Hello world')
+        chat: vi.fn().mockResolvedValue('Hello world'),
+        listModels: vi.fn().mockResolvedValue(['gpt-5-nano'])
       }
     };
     const { port } = await startServer(puterMock);
@@ -104,4 +106,53 @@ describe('AI proxy server', () => {
     expect(text).toContain('data: ');
     expect(text).toContain('[DONE]');
   });
+
+  it('rejects unknown model', async () => {
+    const puterMock = {
+      ai: {
+        chat: vi.fn().mockResolvedValue('Hello world'),
+        listModels: vi.fn().mockResolvedValue(['gpt-5-nano'])
+      }
+    };
+    const { port } = await startServer(puterMock);
+    const response = await fetch(`http://127.0.0.1:${port}/v1/chat/completions`, {
+      method: 'POST',
+      headers: { 'content-type': 'application/json' },
+      body: JSON.stringify({
+        model: 'missing-model',
+        messages: [{ role: 'user', content: 'Hi' }]
+      })
+    });
+    const data = await response.json();
+    expect(response.status).toBe(400);
+    expect(data.error.message).toContain('Unknown model');
+  });
+
+  it('rejects unknown model before startup', async () => {
+    vi.mocked(getProfileModule).mockReturnValue({
+      getAuthToken: vi.fn(() => 'test-token')
+    });
+    const listModels = vi.fn().mockResolvedValue(['gpt-5-nano']);
+    vi.mocked(getPuter).mockReturnValue({
+      ai: {
+        listModels
+      }
+    });
+    const server = await startAIProxyServer({ model: 'missing-model', port: 0 });
+    expect(server).toBeNull();
+    expect(listModels).toHaveBeenCalled();
+  });
+
+  it('starts server when model exists', async () => {
+    vi.mocked(getProfileModule).mockReturnValue({
+      getAuthToken: vi.fn(() => 'test-token')
+    });
+    vi.mocked(getPuter).mockReturnValue({
+      ai: {
+        listModels: vi.fn().mockResolvedValue(['gpt-5-nano'])
+      }
+    });
+    const server = await startAIProxyServer({ model: 'gpt-5-nano', port: 0 });
+    await server.stop();
+  });
 });