v1.3.0
LangChain-RAG-FastAPI-Service v1.3.0
✨ 新增特性
- 精细化向量数据库数据管理,新增文档原始名称、切片数量、切片详情等字段存储,适配前端可视化展示需求
- 新增向量数据库完整CRUD接口,支持前端可视化直接修改向量库内容
- 多文档上传向量库对接 SSE 实现实时进度推送;针对 Chroma(SQLite) 不支持并发写入问题,采用「线程池并发切分文档 + 单线程串行入库」方案,最大化上传效率
- 新增「关于我们」页面,前端可一键跳转项目 GitHub,方便用户反馈问题、提交建议
- 支持 Ollama + 阿里云百炼 双平台 LLM / Embedding 模型,通过修改
.env配置文件即可快速切换模型
🏗️ 架构调整
- 拆分
vector_store模块:对外接口保持不变,底层逻辑拆分为独立类,解决原文件近900行过于臃肿、难以维护的问题 - 重构路由分层:将原RAG对话、向量库管理接口拆分,新增
knowledge_router与knowledge_service,分离路由与业务逻辑,优化项目结构
🐛 问题修复
- 修复
Unrecognized model, should have amodel_typekey in its config.json.报错
新增config.json自动查找函数,解决模型目录不匹配、自动下载后路径异常导致的模型识别失败问题
📦 新增依赖
- FastAPI 端新增
rank_bm25依赖,解决使用user_id隔离用户知识库时,BM25检索器底层依赖缺失问题
发布日期:2026-05-10 | 欢迎提交 Issue & PR 参与项目共建