fix: store ModelRequest in generate_sql messages list (#834)

MasterOdin · web-flow · commit 0dd09c029422 · 2025-06-20T20:24:52.000Z
diff --git a/projects/pgai/pgai/cli.py b/projects/pgai/pgai/cli.py
@@ -1347,7 +1347,10 @@ async def do() -> GenerateSQLResponse:
     console.print(Syntax(resp.sql_statement, "sql", word_wrap=True))
 
     if save_final_prompt:
-        save_final_prompt.expanduser().resolve().write_text(resp.final_prompt)
+        # The final prompt is the user prompt of the last message request we made.
+        save_final_prompt.expanduser().resolve().write_text(
+            str(resp.messages[-1][0].parts[-1].content)
+        )
 
 
 @semantic_catalog.command()
diff --git a/projects/pgai/pgai/semantic_catalog/gen_sql.py b/projects/pgai/pgai/semantic_catalog/gen_sql.py
@@ -358,17 +358,16 @@ class GenerateSQLResponse:
         context: The database context used to generate the SQL statement.
         command_type: The type of SQL statement generated (e.g. SELECT, INSERT, UPDATE)
         query_plan: The PostgreSQL query plan for the generated SQL statement.
-        final_prompt: The final prompt that was sent to the model.
-        messages: List of all messages exchanged during the generation process.
+        messages: List of all messages exchanged during the generation process, where the
+            ModelRequest has two parts: (SystemPromptPart, UserPromptPart).
         usage: Usage statistics for the AI model calls.
     """
 
     sql_statement: str
     context: DatabaseContext
     command_type: str
     query_plan: dict[str, Any]
-    final_prompt: str
-    messages: list[ModelRequest | ModelResponse]
+    messages: list[tuple[ModelRequest, ModelResponse]]
     usage: Usage
 
 
@@ -727,7 +726,7 @@ async def generate_sql(
     answer: str | None = None
     command_type: str | None = None
     pgversion: int | None = await _get_database_version(target_con)
-    messages: list[ModelRequest | ModelResponse] = []
+    messages: list[tuple[ModelRequest, ModelResponse]] = []
     user_prompt: str | None = None
     query_plan: dict[str, Any] | None = None
     error: str | None = None
@@ -755,16 +754,15 @@ async def generate_sql(
             error=error,
         )
 
+        request = ModelRequest(
+            parts=[
+                SystemPromptPart(content=system_prompt),
+                UserPromptPart(content=user_prompt),
+            ]
+        )
         model_response: ModelResponse = await model_request(
             model=model,
-            messages=[
-                ModelRequest(
-                    parts=[
-                        SystemPromptPart(content=system_prompt),
-                        UserPromptPart(content=user_prompt),
-                    ]
-                )
-            ],
+            messages=[request],
             model_request_parameters=ModelRequestParameters(
                 function_tools=[_search_tool_definition()]
                 if iteration < iteration_limit
@@ -775,7 +773,7 @@ async def generate_sql(
             model_settings=model_settings,
         )
 
-        messages.append(model_response)
+        messages.append((request, model_response))
         usage = usage + model_response.usage
 
         for part in model_response.parts:
@@ -882,7 +880,6 @@ async def generate_sql(
         context=ctx,
         command_type=command_type or "UNKNOWN",
         query_plan=query_plan or {},
-        final_prompt=user_prompt or "MISSING",
         messages=messages,
         usage=usage,
     )