�[38;5;8m 1�[0m �[37mfix: fall back to reasoning_content for reasoning models�[0m

2233admin · 2233admin · commit 8b02267d8a3d · 2026-03-26T05:27:20.000+08:00
�[38;5;8m   2�[0m
�[38;5;8m   3�[0m �[37mReasoning models (e.g. MiniMax-M2.7, DeepSeek-R1) return their output�[0m
�[38;5;8m   4�[0m �[37min `reasoning_content` instead of `content`. Previously all content�[0m
�[38;5;8m   5�[0m �[37mextraction sites assumed `content` was populated, returning an empty�[0m
�[38;5;8m   6�[0m �[37mstring for these models.�[0m
�[38;5;8m   7�[0m
�[38;5;8m   8�[0m �[37mAdd `_extract_content` / `_extract_content_from_dict` helpers that�[0m
�[38;5;8m   9�[0m �[37mcheck `reasoning_content` when `content` is empty/None. Applied to:�[0m
�[38;5;8m  10�[0m �[37m- openai_sdk.py: chat(), summarize(), vision()�[0m
�[38;5;8m  11�[0m �[37m- HTTP backends: openai, doubao, openrouter parse_summary_response()�[0m
�[38;5;8m  12�[0m
�[38;5;8m  13�[0m �[37mCo-Authored-By: Claude Opus 4.6 (1M context) &lt;noreply@anthropic.com&gt;�[0m
diff --git a/src/memu/llm/backends/base.py b/src/memu/llm/backends/base.py
@@ -3,6 +3,19 @@
 from typing import Any
 
 
+def _extract_content_from_dict(data: dict[str, Any]) -> str:
+    """Extract text content from a raw API response dict.
+
+    Falls back to ``reasoning_content`` for reasoning models (e.g. MiniMax-M2.7,
+    DeepSeek-R1) that put their output there instead of ``content``.
+    """
+    msg = data["choices"][0]["message"]
+    content = msg.get("content")
+    if not content:
+        content = msg.get("reasoning_content")
+    return content or ""
+
+
 class LLMBackend:
     """Defines how to talk to a specific HTTP LLM provider."""
 
diff --git a/src/memu/llm/backends/doubao.py b/src/memu/llm/backends/doubao.py
@@ -1,8 +1,8 @@
 from __future__ import annotations
 
-from typing import Any, cast
+from typing import Any
 
-from memu.llm.backends.base import LLMBackend
+from memu.llm.backends.base import LLMBackend, _extract_content_from_dict
 
 
 class DoubaoLLMBackend(LLMBackend):
@@ -29,7 +29,7 @@ def build_summary_payload(
         return payload
 
     def parse_summary_response(self, data: dict[str, Any]) -> str:
-        return cast(str, data["choices"][0]["message"]["content"])
+        return _extract_content_from_dict(data)
 
     def build_vision_payload(
         self,
diff --git a/src/memu/llm/backends/openai.py b/src/memu/llm/backends/openai.py
@@ -1,8 +1,8 @@
 from __future__ import annotations
 
-from typing import Any, cast
+from typing import Any
 
-from memu.llm.backends.base import LLMBackend
+from memu.llm.backends.base import LLMBackend, _extract_content_from_dict
 
 
 class OpenAILLMBackend(LLMBackend):
@@ -26,7 +26,7 @@ def build_summary_payload(
         }
 
     def parse_summary_response(self, data: dict[str, Any]) -> str:
-        return cast(str, data["choices"][0]["message"]["content"])
+        return _extract_content_from_dict(data)
 
     def build_vision_payload(
         self,
diff --git a/src/memu/llm/backends/openrouter.py b/src/memu/llm/backends/openrouter.py
@@ -1,8 +1,8 @@
 from __future__ import annotations
 
-from typing import Any, cast
+from typing import Any
 
-from memu.llm.backends.base import LLMBackend
+from memu.llm.backends.base import LLMBackend, _extract_content_from_dict
 
 
 class OpenRouterLLMBackend(LLMBackend):
@@ -30,7 +30,7 @@ def build_summary_payload(
 
     def parse_summary_response(self, data: dict[str, Any]) -> str:
         """Parse OpenRouter response (OpenAI-compatible format)."""
-        return cast(str, data["choices"][0]["message"]["content"])
+        return _extract_content_from_dict(data)
 
     def build_vision_payload(
         self,
diff --git a/src/memu/llm/openai_sdk.py b/src/memu/llm/openai_sdk.py
@@ -17,6 +17,19 @@
 logger = logging.getLogger(__name__)
 
 
+def _extract_content(response: ChatCompletion) -> str:
+    """Extract text content from a chat completion, with fallback for reasoning models.
+
+    Some reasoning models (e.g. MiniMax-M2.7, DeepSeek-R1) return their output in
+    ``reasoning_content`` instead of ``content``.  This helper checks both fields.
+    """
+    msg = response.choices[0].message
+    content = msg.content
+    if not content:
+        content = getattr(msg, "reasoning_content", None)
+    return content or ""
+
+
 class OpenAISDKClient:
     """OpenAI LLM client that relies on the official Python SDK."""
 
@@ -59,9 +72,9 @@ async def chat(
             temperature=temperature,
             max_tokens=max_tokens,
         )
-        content = response.choices[0].message.content
+        content = _extract_content(response)
         logger.debug("OpenAI chat response: %s", response)
-        return content or "", response
+        return content, response
 
     async def summarize(
         self,
@@ -82,9 +95,9 @@ async def summarize(
             temperature=1,
             max_tokens=max_tokens,
         )
-        content = response.choices[0].message.content
+        content = _extract_content(response)
         logger.debug("OpenAI summarize response: %s", response)
-        return content or "", response
+        return content, response
 
     async def vision(
         self,
@@ -148,9 +161,9 @@ async def vision(
             temperature=1,
             max_tokens=max_tokens,
         )
-        content = response.choices[0].message.content
+        content = _extract_content(response)
         logger.debug("OpenAI vision response: %s", response)
-        return content or "", response
+        return content, response
 
     async def embed(self, inputs: list[str]) -> tuple[list[list[float]], CreateEmbeddingResponse | None]:
         """Create text embeddings via the official SDK."""