fix: add asynchronous streaming support in base_chat_open_ai.py

liuruibin · liuruibin · commit ba24360b086b · 2026-05-21T16:31:42.000+08:00
diff --git a/apps/models_provider/impl/base_chat_open_ai.py b/apps/models_provider/impl/base_chat_open_ai.py
@@ -1,7 +1,7 @@
 # coding=utf-8
 import base64
 from concurrent.futures import ThreadPoolExecutor
-from typing import Dict, Optional, Any, Iterator, cast, Union, Sequence, Callable, Mapping
+from typing import Dict, Optional, Any, Iterator, cast, Union, Sequence, Callable, Mapping, AsyncIterator
 
 from langchain_core.language_models import LanguageModelInput
 from langchain_core.messages import BaseMessage, get_buffer_string, BaseMessageChunk, HumanMessageChunk, AIMessageChunk, \
@@ -102,7 +102,7 @@ def get_num_tokens_from_messages(
             with ThreadPoolExecutor(max_workers=1) as executor:
                 future = executor.submit(super().get_num_tokens_from_messages, messages, tools)
                 try:
-                    response = future.result()
+                    response = future.result(timeout=timeout)
                     maxkb_logger.info("请求成功（未超时）")
                     return response
                 except Exception as e:
@@ -131,6 +131,13 @@ def _stream(self, *args: Any, **kwargs: Any) -> Iterator[ChatGenerationChunk]:
                 self.usage_metadata = chunk.message.usage_metadata
             yield chunk
 
+    async def _astream(self, *args: Any, **kwargs: Any) -> AsyncIterator[ChatGenerationChunk]:
+        kwargs['stream_usage'] = True
+        async for chunk in super()._astream(*args, **kwargs):
+            if chunk.message.usage_metadata is not None:
+                self.usage_metadata = chunk.message.usage_metadata
+            yield chunk
+
     def _convert_chunk_to_generation_chunk(
             self,
             chunk: dict,