v1.2.0
LangChain-RAG-FastAPI-Service v1.2.0
✨ 新增特性
- 支持基于SSE + yield生成器的流式对话输出
- 新增LangSmith全链路监控与调用追踪能力
- 扩展支持pdf、txt、markdown、ppt、docs多格式文档上传至向量数据库
⚡ 核心优化
- 文档上传至向量数据库时,使用余弦相似度进行语义切割,避免检索时出现语义不完整的情况
- RAG全链路升级:HYDE语义前置优化 + BM25+向量检索动态权重融合 + Cross Encoder重排序
- 多文档批量处理 (多文档上传至向量数据库、多文档总结) 新增线程池并发支持,大幅降低任务耗时
- 重排序模型禁用梯度运算,显著提升推理性能
🐛 问题修复
- 修复
asyncio is not defined运行时异常,提升服务稳定性
发布日期:2026-04-30 | 欢迎提交Issue & PR参与项目共建