88
99零注入 · 零登录 · 零配置
1010
11- [ ![ Version] ( https://img.shields.io/badge/version-2.1.5 -blue.svg )] ( https://github.com/LegnaOS/VSC-Augment-Proxy-Manager )
11+ [ ![ Version] ( https://img.shields.io/badge/version-3.0.1 -blue.svg )] ( https://github.com/LegnaOS/VSC-Augment-Proxy-Manager )
1212[ ![ Platform] ( https://img.shields.io/badge/platform-macOS%20%7C%20Windows%20%7C%20Linux-lightgrey.svg )] ( )
1313
1414</div >
1919
2020Augment Proxy Manager 运行一个本地 HTTP 代理服务器,拦截 Augment 扩展的 API 请求并转发到你选择的 AI 供应商。
2121
22- ** v1.9 引入零注入模式** — 无需修改代码、无需登录。代理利用 Augment 扩展内置的 API Token 模式,自动配置请求路由。
23-
2422```
2523Augment 扩展 → 本地代理 (:8765) → 你的 AI 供应商 API
26- ↑ 自动配置
24+ ↑ 自动配置 ↑ Viking 上下文增强
2725```
2826
2927启动代理时,自动设置 ` augment.advanced.completionURL ` 指向本地代理,` augment.advanced.apiToken ` 为占位 token。Augment 扩展检测到配置变更后,切换到 API Token 模式(绕过 OAuth),所有流量通过代理转发。停止代理时,自动清除配置,扩展恢复正常。
@@ -51,19 +49,52 @@ Augment 扩展 → 本地代理 (:8765) → 你的 AI 供应商 API
5149
5250## 功能特性
5351
52+ ### 🧠 v3.0 — 智能上下文引擎
53+
54+ - ** Viking 分层上下文** — 借鉴 [ OpenViking] ( https://github.com/volcengine/OpenViking ) 的文件系统范式,L0 摘要 / L1 结构 / L2 全文三级按需加载,精准控制注入 token 量
55+ - ** 目录聚合 + 递归下钻** — 向量初筛 → 目录级聚合 → Top 目录递归下钻,用结构化信号弥补向量精度不足
56+ - ** Session Memory** — 自动从对话中提取用户偏好(语言/框架/代码风格),LevelDB 持久化,跨会话长期记忆
57+ - ** 本地模型选择** — 侧边栏可视化选择 5 种本地 Embedding 模型(22MB ~ 118MB),支持运行时切换,下载进度实时显示
58+ - ** 远程 Embedding API** — 支持 GLM / OpenAI / 自定义远程 Embedding,远程失败自动回退本地
59+ - ** HuggingFace 镜像加速** — 内置 hf-mirror.com 国内镜像,模型下载速度大幅提升
60+ - ** 下载取消 + 缓存自动修复** — 支持取消正在进行的模型下载;检测到缓存损坏自动清理并重新下载
61+ - ** 智能缓存检测** — 已下载的模型直接从本地加载,不重复检查下载
62+ - ** OOM 崩溃防护** — 大模型加载导致 extension host 崩溃时,自动回退到默认小模型
63+
64+ ### 🔌 代理核心
65+
5466- ** 零注入绕过** — 自动配置 Augment 使用代理,无需修改任何代码
5567- ** 流式响应** — 聊天、补全、指令全程实时 SSE 流式传输
5668- ** 完整 Agent 模式** — 工具调用、文件编辑、代码库检索全部正常工作
57- - ** 本地代码索引** — 内置 RAG 语义搜索索引,无需云端同步
58- - ** OMC 编排增强** — 集成 [ oh-my-claudecode] ( https://github.com/Yeachan-Heo/oh-my-claudecode ) ,6 种编排模式 + 魔法关键词,可在侧边栏开关
59- - ** Embedding 配置** — 侧边栏可视化配置语义搜索的 Embedding 供应商 (GLM/OpenAI/自定义)
69+ - ** 配置热更新** — 切换供应商或模型无需重启代理,实时生效
70+
71+ ### 🔍 RAG 语义搜索
72+
73+ - ** 本地代码索引** — 内置 RAG 语义搜索,无需云端同步
74+ - ** 5 种 Embedding 模型** — MiniLM / BGE / E5 系列,含多语言模型,侧边栏一键下载切换
75+ - ** 模型专属缓存** — 不同模型独立缓存文件,切换模型不丢失历史缓存
76+
77+ ### ⚡ 增强功能
78+
79+ - ** OMC 编排增强** — 集成 [ oh-my-claudecode] ( https://github.com/Yeachan-Heo/oh-my-claudecode ) ,6 种编排模式 + 魔法关键词
6080- ** 思考模式** — 支持 DeepSeek、MiniMax、GLM 的扩展思考 (Thinking)
61- - ** JSON Mode** — 支持 Kimi API 的结构化 JSON 输出模式
62- - ** 联网搜索** — 支持 Kimi 内置的 ` $web_search ` 联网搜索功能
6381- ** Prompt 缓存** — 自动为支持的供应商注入 cache_control
6482- ** 上下文压缩** — 基于 token 使用率的智能对话历史压缩
65- - ** 配置热更新** — 切换供应商或模型无需重启代理,实时生效
66- - ** 侧边栏控制面板** — 可视化界面管理供应商、API Key 和运行状态
83+ - ** 侧边栏控制面板** — 可视化界面管理全部配置和运行状态
84+
85+ ## 本地 Embedding 模型
86+
87+ v3.0 支持在侧边栏选择并下载本地 Embedding 模型,无需配置远程 API 即可使用语义搜索:
88+
89+ | 模型 | 大小 | 维度 | 语言 | 说明 |
90+ | :-----| :-----| :-----| :-----| :-----|
91+ | MiniLM-L6 | 22MB | 384 | English | 最小最快,基础语义搜索 |
92+ | MiniLM-L12 | 33MB | 384 | English | 12 层,比 L6 更准 |
93+ | BGE-Small | 33MB | 384 | English | BAAI BGE 小模型,代码搜索效果好 |
94+ | ** BGE-Base** ⭐ | 109MB | 768 | English | 性价比最高,推荐 |
95+ | E5-Multi-Small | 118MB | 384 | 多语言 | 支持中/英/日/韩 |
96+
97+ 模型基于 [ Xenova/transformers.js] ( https://github.com/xenova/transformers.js ) ONNX 格式,首次使用自动下载到本地缓存。
6798
6899## 配置项
69100
@@ -76,17 +107,46 @@ Augment 扩展 → 本地代理 (:8765) → 你的 AI 供应商 API
76107| ` augmentProxy.{provider}.baseUrl ` | * 按供应商* | API 端点地址 |
77108| ` augmentProxy.{provider}.model ` | * 按供应商* | 模型名称 |
78109| ` augmentProxy.omc.enabled ` | ` false ` | 启用 OMC 编排增强 |
79- | ` augmentProxy.omc.mode ` | ` team ` | OMC 编排模式 (team/autopilot/ultrawork/ralph/ecomode/pipeline) |
80- | ` augmentProxy.embedding.enabled ` | ` false ` | 启用语义搜索 Embedding |
81- | ` augmentProxy.embedding.provider ` | ` glm ` | Embedding 供应商 (glm/openai/custom) |
110+ | ` augmentProxy.omc.mode ` | ` team ` | OMC 编排模式 |
111+ | ` augmentProxy.embedding.localModel ` | ` Xenova/all-MiniLM-L6-v2 ` | 本地 Embedding 模型 |
112+ | ` augmentProxy.embedding.enabled ` | ` false ` | 启用远程 Embedding API |
113+ | ` augmentProxy.embedding.provider ` | ` glm ` | 远程 Embedding 供应商 |
114+ | ` augmentProxy.embedding.mirror ` | ` "" ` | HuggingFace 下载镜像 (hf-mirror.com) |
82115
83116各供应商的专属选项(思考模式、缓存等)在设置中 ` augmentProxy.{provider}.* ` 下配置。
84117
85118API Key 安全存储在 VSCode 内置的 SecretStorage 中。
86119
87- ## 跨平台支持
120+ ## 架构
88121
89- 支持所有主流 VSCode 变体的路径检测:
122+ ```
123+ src/
124+ ├── extension.ts # 扩展入口
125+ ├── proxy.ts # HTTP 代理服务器 + 初始化
126+ ├── messages.ts # Augment 协议解析 + System Prompt 注入
127+ ├── sidebar.ts # 侧边栏 Webview UI
128+ ├── config.ts # 供应商配置
129+ ├── globals.ts # 全局状态 (Viking/SessionMemory/RAG/Embedding)
130+ ├── context-manager.ts # 上下文管理
131+ ├── context-compression.ts # 智能压缩
132+ ├── injection.ts # Augment 扩展自动配置
133+ ├── omc.ts # OMC 编排增强
134+ ├── tools.ts # 工具调用处理
135+ ├── providers/
136+ │ ├── anthropic.ts # Anthropic 流式转发
137+ │ ├── openai.ts # OpenAI 流式转发
138+ │ └── google.ts # Google Gemini 流式转发
139+ └── rag/
140+ ├── index.ts # RAG 索引 + Viking 增强搜索
141+ ├── embeddings.ts # Embedding 引擎 (本地 5 模型 + 远程 API)
142+ ├── viking-context.ts # Viking L0/L1/L2 分层上下文
143+ ├── session-memory.ts # Session Memory 长期记忆
144+ ├── code-parser.ts # 代码解析器
145+ ├── context-generator.ts # 上下文生成
146+ └── storage.ts # LevelDB 持久化存储
147+ ```
148+
149+ ## 跨平台支持
90150
91151| 编辑器 | macOS / Linux | Windows |
92152| :------| :-------------| :--------|
@@ -97,40 +157,72 @@ API Key 安全存储在 VSCode 内置的 SecretStorage 中。
97157
98158## 更新日志
99159
160+ ### v3.0.1 — 稳定性修复
161+
162+ ** 🛡️ 崩溃防护**
163+ - 修复 ` augmentConfig.update() ` 重复写入导致窗口无限重载的问题
164+ - 新增 OOM 崩溃检测:大模型加载导致 extension host 崩溃时,下次启动自动回退到默认小模型 (MiniLM-L6 22MB)
165+ - 模型初始化改为后台异步 (fire-and-forget),不再阻塞插件启动
166+ - ` deactivate() ` 在自动恢复场景下不再清除 Augment 配置
167+
168+ ** ⚡ 性能优化**
169+ - 智能缓存检测:已下载的模型直接从本地加载,跳过下载流程和进度回调
170+ - 移除两个过大的模型 (BGE-Large 335MB、E5-Base 278MB),避免 OOM 风险
171+
172+ ** 🔧 Bug 修复**
173+ - 修复下载进度条直接显示 100% 的问题 (transformers.js v3 状态名变更)
174+ - 修复 checkbox 设置 (OMC/远程 Embedding) 不持久化的问题
175+ - 修复 ` embedding.enabled ` 错误地阻止本地模型加载的问题 ("BM25 mode")
176+ - 新增 HuggingFace 镜像加速 (hf-mirror.com)
177+ - 新增下载取消功能
178+ - 新增缓存损坏自动检测清理并重新下载
179+
180+ ** 🎨 UI 改进**
181+ - 侧边栏重构:本地模型 (默认) 与远程 Embedding API (可选) 分区显示
182+ - 新增取消下载按钮
183+
184+ ### v3.0.0 — 智能上下文引擎
185+
186+ ** 🧠 Viking 分层上下文系统**
187+ - 借鉴 [ OpenViking] ( https://github.com/volcengine/OpenViking ) 上下文数据库理念
188+ - L0 摘要 (~ 100 tokens) / L1 结构化 (~ 2K tokens) / L2 全文,三级按需加载
189+ - 向量初筛 → 目录聚合 → Top 目录递归下钻 → 结果合并加权
190+ - 用结构化文件系统信号弥补向量精度不足,对弱模型提升尤为显著
191+
192+ ** 📦 本地模型选择**
193+ - 侧边栏可视化选择 5 种本地 Embedding 模型 (22MB ~ 118MB)
194+ - 支持运行时一键切换模型,自动重新初始化
195+ - 下载进度条显示文件名和百分比
196+ - 模型专属缓存文件,切换不丢失历史数据
197+ - HuggingFace 镜像加速 (hf-mirror.com),国内下载速度大幅提升
198+ - 支持取消下载;缓存损坏自动检测清理并重新下载
199+
200+ ** 🧬 Session Memory 长期记忆**
201+ - 自动从用户消息中提取偏好(编程语言、框架、代码风格)
202+ - 记录 Agent 经验和教训
203+ - LevelDB 持久化,跨会话保持记忆
204+ - 自动注入 System Prompt,AI 具备长期记忆能力
205+
206+ ** 🌐 远程 Embedding API**
207+ - 支持 GLM embedding-3 / OpenAI text-embedding-3-small / 自定义 API
208+ - 远程 API 失败自动回退本地模型
209+ - 远程/本地独立缓存,维度不冲突
210+
100211### v2.1.5
101- - 🚀 ** OMC 编排增强** — 集成 oh-my-claudecode,6 种编排模式 (Team/Autopilot/Ultrawork/Ralph/Ecomode/Pipeline)
102- - 🔮 ** 魔法关键词** — 消息中输入 ultrawork/search/analyze/ultrathink 自动增强提示
103- - 🧠 ** Embedding 配置 UI** — 侧边栏可视化配置语义搜索供应商、API Key、自定义端点
104- - 🔧 修复配置保存后状态丢失的 race condition (debounced sendFullStatus)
105- - 🧹 清理无用的 release notes 文件
212+ - 🚀 ** OMC 编排增强** — 集成 oh-my-claudecode,6 种编排模式
213+ - 🔮 ** 魔法关键词** — ultrawork/search/analyze/ultrathink 自动增强
214+ - 🧠 ** Embedding 配置 UI** — 侧边栏可视化配置
215+ - 🔧 修复配置保存 race condition
106216
107217### v2.1.4
108- - 🛠️ ** 完整支持 ` apply_patch ` 工具** — 支持 Augment 的两种 patch 格式(diff 格式和完整文件替换)
109- - 🤖 ** GLM-5 支持** — 更新智谱 AI 默认模型为 ` glm-5 `
110- - 🔧 修复 patch 解析器的 substring 逻辑,正确处理缩进
111- - 🔧 自动检测 patch 格式,智能选择 ` str-replace-editor ` 或 ` save-file `
112-
113- ### v2.1.3
114- - 🌙 ** Kimi Coding Plan 支持** — 支持月之暗面 Coding Plan API(需要特殊订阅)
115- - 🔧 修复 Kimi API 端点配置
116- - 🔧 完善 Anthropic 格式检测逻辑
218+ - 🛠️ 完整支持 ` apply_patch ` 工具
219+ - 🤖 GLM-5 支持
117220
118221### v2.1.0
119- - 🌙 ** Kimi (月之暗面) 支持** — 新增 Kimi 标准 API 支持
120- - 🔍 ** JSON Mode** — 支持 Kimi 的结构化 JSON 输出
121- - 🌐 ** 联网搜索** — 支持 Kimi 内置的 ` $web_search ` 功能
122-
123- ### v1.9.1
124- - 🐛 修复模型选择器后显示 "noCanvas" 的问题
125- - 🔄 切换供应商或模型后自动生效,无需重启代理
126- - 📊 上下文压缩配置从 Google 专属移至全局,适用于所有供应商
127- - 📊 上下文/Token 统计在侧边栏刷新后保持显示
222+ - 🌙 Kimi (月之暗面) 支持 + JSON Mode + 联网搜索
128223
129224### v1.9.0
130- - 🚀 零注入模式 — 自动配置 Augment 扩展
131- - 🤖 完整 Agent 模式支持
132- - 🔍 本地 RAG 语义搜索索引
133- - 💬 思考模式 / Prompt 缓存 / 上下文压缩
225+ - 🚀 零注入模式 + 完整 Agent 模式 + RAG 语义搜索 + 上下文压缩
134226
135227## 许可证
136228
0 commit comments