Skip to content

v1.2.0

Choose a tag to compare

@RMA-MUN RMA-MUN released this 30 Apr 11:57
· 118 commits to master since this release

LangChain-RAG-FastAPI-Service v1.2.0

✨ 新增特性

  • 支持基于SSE + yield生成器的流式对话输出
  • 新增LangSmith全链路监控与调用追踪能力
  • 扩展支持pdf、txt、markdown、ppt、docs多格式文档上传至向量数据库

⚡ 核心优化

  • 文档上传至向量数据库时,使用余弦相似度进行语义切割,避免检索时出现语义不完整的情况
  • RAG全链路升级:HYDE语义前置优化 + BM25+向量检索动态权重融合 + Cross Encoder重排序
  • 多文档批量处理 (多文档上传至向量数据库、多文档总结) 新增线程池并发支持,大幅降低任务耗时
  • 重排序模型禁用梯度运算,显著提升推理性能

🐛 问题修复

  • 修复asyncio is not defined运行时异常,提升服务稳定性

发布日期:2026-04-30 | 欢迎提交Issue & PR参与项目共建