jqknono
diff --git a/‎CHANGELOG.md‎
Lines changed: 4 additions & 9 deletions b/‎CHANGELOG.md‎
Lines changed: 4 additions & 9 deletions
diff --git a/‎docs/copilot-chat-context-window.md‎
Lines changed: 62 additions & 127 deletions b/‎docs/copilot-chat-context-window.md‎
Lines changed: 62 additions & 127 deletions
diff --git a/‎package.json‎
Lines changed: 1 addition & 1 deletion b/‎package.json‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎src/contextUsageState.ts‎
Lines changed: 5 additions & 2 deletions b/‎src/contextUsageState.ts‎
Lines changed: 5 additions & 2 deletions
diff --git a/‎src/extension.ts‎
Lines changed: 2 additions & 9 deletions b/‎src/extension.ts‎
Lines changed: 2 additions & 9 deletions
@@ -2,6 +2,9 @@
 
 All notable changes to this project will be documented in this file.
 
+## [0.7.2] - 2026-04-16
+- feat(commitMessageGenerator): 增强风格参考约束与回退格式优先级
+
 ## [0.7.1] - 2026-04-16
 - chore: 升级版本至 0.7.1
 
@@ -44,12 +47,4 @@ All notable changes to this project will be documented in this file.
 
 ## [0.6.4] - 2026-03-22
 - fix(docs): 更新上下文窗口文档与状态栏显示逻辑
-- feat: 支持 contextSize 配置并优化上下文窗口处理
-
-## [0.6.2] - 2026-03-19
-- fix(provider-pricing): 更新供应商定价数据及资源链接
-- fix(#8): 更新 OpenRouter 指标采集流程
-- build(workflow): 更新 OpenRouter 指标与套餐抓取流程
-- feat(ci): 调整 OpenRouter 模型数据最大缓存天数
-- fix(provider-pricing): 更新模型定价数据和爬虫逻辑
-- fix(docs): 更新废弃字段 maxInputTokens 和 maxOutputTokens 的描述信息
+- feat: 支持 contextSize 配置并优化上下文窗口处理
@@ -1,159 +1,94 @@
-# VS Code Copilot Chat Context Window 使用说明
+# VS Code Chat Context Window 的值是怎么来的
 
-更新时间：2026-03-19
+更新时间：2026-04-22
 
 ## 一句话结论
 
-`Context Window` 不是一个让你手动编辑“当前上下文内容”的面板，而是一个“当前这轮对话已经塞进了多少上下文”的使用量指示器。真正决定上下文内容的入口，是聊天里的隐式上下文、`#` 引用、`@` 参与者、自定义指令、prompt files、图片、浏览器元素和对话历史。
+`Context Window X / Y tokens` 表示：
 
-## Context Window 里通常有什么
+| 部分 | 含义 | 来源 |
+| --- | --- | --- |
+| `Y` | 当前所选模型的总上下文窗口 | 由 VS Code 根据所选模型的上下文能力决定 |
+| `X` | 当前这轮对话已经占用的上下文 token | 由 VS Code / Copilot 在运行时把当前请求上下文拼装并计数后得到 |
 
-根据 VS Code 官方文档，Copilot Chat 会把下面几类信息拼进当前请求：
+这个控件本质上是“上下文占用统计”，不是“完整 prompt 明细列表”。
 
-- 隐式上下文：当前选中的代码、当前文件名；在部分模式下还会自动考虑活动文件。
-- 显式上下文：通过 `#` 主动附加的文件、文件夹、符号、`#codebase`、终端输出、网页内容等。
-- 参与者与工具：通过 `@` 选择的 chat participant，以及该参与者可用的工具定义。
-- 自定义指令：`.github/copilot-instructions.md`、`*.instructions.md`、`AGENTS.md`、用户级或组织级 instructions。
-- Prompt files：`*.prompt.md`，通常通过 `/你的命令名` 运行。
-- 多模态上下文：图片、浏览器元素、集成浏览器页面。
-- 会话历史：当前聊天的历史消息，以及历史过长后压缩出来的摘要。
-- 输出预留：为了避免本轮回答超限，系统会预留一部分 token 给模型输出。
+## `Y` 是怎么得到的
 
-你在悬浮 `Context Window X / Y tokens` 时看到的分类拆分，本质上就是这些来源的占用统计。
+官方文档只明确说明一件事：`Context Window` 的分母会随着你切换模型而变化，因为不同模型的 context window 不同。
 
-## 这东西应该怎么用
+对自定义模型提供方，VS Code 公开给扩展的模型容量元数据是：
 
-### 1. 把它当成“上下文预算表”，不是“内容编辑器”
+| API 字段 | 含义 |
+| --- | --- |
+| `maxInputTokens` | 模型最多可接受多少输入 token |
+| `maxOutputTokens` | 模型最多可生成多少输出 token |
 
-看见占用上涨，说明你当前这次对话携带的信息在变多。它适合回答两个问题：
+本仓库里，这两个值的来源链路是：
 
-- 现在这轮对话是否已经装了太多无关历史？
-- 我还要不要继续往里塞文件、图片、网页，还是应该先压缩/开新会话？
+| 步骤 | 本仓库实现 |
+| --- | --- |
+| 1. 读取模型配置 | `AIModelConfig.maxTokens` 表示模型总上下文窗口，`maxInputTokens` / `maxOutputTokens` 是拆分值，见 [src/providers/baseProvider.ts](../src/providers/baseProvider.ts) |
+| 2. 生成对外模型信息 | `toLanguageModelInfo(...)` 把 `model.maxInputTokens` 和 `model.maxOutputTokens` 暴露给 VS Code，见 [src/providers/lmChatProviderAdapter.ts](../src/providers/lmChatProviderAdapter.ts) |
+| 3. VS Code 显示分母 | VS Code 根据当前选中的模型信息显示 `Y` |
 
-不适合的用法是：盯着这个面板猜“为什么模型一定看到了某一段代码”。因为它显示的是预算和分类，不是完整逐项清单。
+所以，对这个仓库来说，`Y` 最终来自模型配置，再通过扩展注册的 `LanguageModelChatInformation` 传给 VS Code。
 
-### 2. 优先用 `#` 精确喂上下文
+## `X` 是怎么得到的
 
-如果问题和代码直接相关，优先用精确上下文，而不是一句笼统自然语言让 Agent 自己猜：
+官方文档说明，`X` 表示“当前已使用的上下文”，会随着对话推进不断增长；hover 时还能看到按类别拆分的占用。官方还能确认这些上下文来源会参与统计：
 
-- 单文件问题：直接选中代码，再补一个 `#对应文件`
-- 多文件链路问题：`#入口文件 #调用方文件 #相关配置文件`
-- 仓库级问题：明确写 `#codebase`
-- 终端报错：附加终端输出
-- 最新外部文档：直接贴 URL，或者加 `#fetch`
+| 来源 | 官方说明 |
+| --- | --- |
+| 系统与指令层 | system prompt、custom instructions 也属于 context window 的一部分 |
+| 隐式上下文 | 活动文件、当前选区、文件名会自动带入 |
+| 显式上下文 | `#file`、`#codebase`、`#terminalSelection`、`#fetch` 等 |
+| 工作区检索结果 | Copilot 会自动做 workspace indexing、search、read、usages 等检索，再把结果带入 |
+| 工具结果 | tool outputs、previous tool results 会进入上下文 |
+| 会话历史 | conversation history 会进入上下文 |
+| 多模态上下文 | 图片、浏览器元素、页面内容等 |
+| 历史压缩结果 | 上下文快满时，VS Code 会自动 compact 旧历史，摘要仍继续占用上下文 |
 
-官方文档还特别提到：附加文件时，能放下就传完整文件；放不下时会退化成文件大纲；大纲还放不下时，这个文件可能根本不会进 prompt。也就是说，“提到了文件名”不等于“完整源码一定进了上下文”。
+所以，`X` 不是“当前输入框文本长度”，而是“这次请求最终真正送进模型的上下文总量”。
 
-### 3. 用 `@` 决定“谁来回答”，不要把它和 `#` 混在一起理解
+## 这仓库能确认到哪一步
 
-- `#` 是给模型补材料
-- `@` 是指定由哪个 participant 处理问题
+这点最重要：
 
-例如：
+本仓库不会把“当前这轮响应结束后”拿到的真实 `usage` 实时精确写回 VS Code 原生 `Context Window`。
 
-- `@vscode 如何开启自动保存`
-- `@terminal 当前目录最大的 5 个文件是什么`
+并且按 2026-04-22 这次对当前 VS Code 源码链路与本扩展运行日志的核对结果，第三方 `LanguageModelChatProvider.provideTokenCount(...)` 也不会驱动原生 `Context Window` 弹层里的 `X`。
 
-如果你问的是仓库代码本身，重点还是先把代码上下文喂准，而不是只切 participant。
+能确认的实现如下：
 
-### 4. 稳定规则放 instructions，重复流程放 prompt files
+| 位置 | 结论 |
+| --- | --- |
+| [src/providers/lmChatProviderAdapter.ts](../src/providers/lmChatProviderAdapter.ts) | `provideTokenCount(...)` 不做本地 prompt token 估算；若存在“同模型最近一次已完成请求”的 usage 快照，则返回最近一次 occupied context，否则返回 `0` |
+| [src/providers/lmChatProviderAdapter.ts](../src/providers/lmChatProviderAdapter.ts) | `reportUsageToProgress(...)` 会读取响应里的 usage |
+| [src/providers/lmChatProviderAdapter.ts](../src/providers/lmChatProviderAdapter.ts) | `updateContextUsageState(...)` 会把 usage 缓存到本仓库自己的 `CodingPlans Context` 状态栏状态里 |
+| VS Code 源码 `src/vs/workbench/api/browser/mainThreadLanguageModels.ts` / `src/vs/workbench/api/common/extHostLanguageModels.ts` | `provideTokenCount(...)` 只被桥接到 `computeTokenLength(...)` / `countTokens(...)` 能力；本次未找到原生 `Context Window` UI 消费这条路径的源码 |
 
-如果某些约束每次都要生效，不要每轮聊天重复粘贴，应该落到文件：
+因此可以明确下结论：
 
-- 项目级统一规则：`.github/copilot-instructions.md`
-- 目录或语言特定规则：`*.instructions.md`
-- 多代理共享规则：`AGENTS.md`
-- 可复用工作流：`*.prompt.md`
+1. VS Code 原生 `Context Window` 的 `X`，不是本仓库把上游 `usage.totalTokens` 原样回填出来的值。
+2. 本仓库公开参与原生控件的能力，只有模型元数据和 `provideTokenCount()` 这个估算接口。
+3. 现在这里的 `provideTokenCount()` 虽然会优先返回“同模型最近一次已完成请求”的 occupied context，但按当前源码和运行结果，这不会驱动原生 `Context Window` 弹层里的 `X`。
+4. 因此，原生 `Context Window` 里的 `X` 目前仍应视为 VS Code / Copilot 自己的内部上下文拼装统计结果；对第三方 provider，这个值可能保持 `0`。
 
-官方建议也很明确：
+## 最终结论
 
-- 全项目共用规范，优先放 `.github/copilot-instructions.md`
-- 多代理场景，使用 `AGENTS.md`
-- 某类任务反复出现，做成 prompt file，用 `/命令名` 触发
+如果你只关心“vscode chat 的 context 窗口中的值是如何得到的”，可以直接记这一句：
 
-这几类文件会直接影响 Copilot Chat 的上下文组成，所以它们比“手动在聊天里反复解释一遍”更稳定。
+`Y` 来自当前模型的上下文能力；`X` 来自 VS Code / Copilot 把当前请求要发送的上下文拼起来后做的运行时统计。  
+在本仓库里，模型容量由扩展提供给 VS Code；但对第三方 provider，当前并不能依靠 `provideTokenCount()` 或上游 `usage` 去驱动原生 `Context Window` 的 `X`。
 
-### 5. UI / 页面问题，不要只发文字
+## 参考
 
-如果问题和前端界面有关，优先附加：
-
-- 截图
-- 浏览器元素
-- 集成浏览器页面
-
-官方文档支持把集成浏览器里的元素直接加进 Chat，上下文里可以包含 HTML、CSS，必要时还能带图片。对布局问题、样式问题、交互问题，这比“描述页面长什么样”有效得多。
-
-### 6. 当上下文快满时，主动压缩或开新会话
-
-官方文档说明，Context Window 快满时 VS Code 会自动做 compaction，也就是把更早的对话压缩成摘要。
-
-你的可操作手段有两个：
-
-- 输入 `/compact`，必要时补一句压缩重点，例如 `/compact focus on the provider config changes`
-- 直接开始新会话
-
-经验上：
-
-- 还在同一个问题链路里，但历史有噪音：用 `/compact`
-- 任务已经换题：直接开新会话
-
-## 结合本仓库应该怎么理解
-
-### 1. 本扩展复用的是 VS Code 内置 Context Window
-
-本仓库没有再维护一套独立的原生 Context Agent 展示。用户在聊天框里看到的 `Context Window`、hover 后的 token 拆分、compact 行为，都以 VS Code / Copilot Chat 当前内置实现为准。
-
-### 2. 分母大小依赖模型上下文配置
-
-在这个仓库里，模型上下文参数来自供应商/模型配置。代码里会把总上下文、最大输入、最大输出做归一化处理：
-
-- 当显式提供总上下文和输入/输出上限时，按显式值使用
-- 只提供部分字段时，会推导剩余部分
-- 没配时，会回退到默认值
-
-因此，如果供应商模型的 `contextSize`、`maxInputTokens`、`maxOutputTokens` 配置不准确，Copilot Chat 里看到的 `X / Y tokens` 也可能与真实模型能力不一致。本仓库当前推荐用 `contextSize` 作为描述模型上下文的主字段；`maxInputTokens` / `maxOutputTokens` 仅保留兼容旧配置。运行时会优先使用 `contextSize` 作为总上下文窗口；只有当 `maxInputTokens` 或 `maxOutputTokens` 超过它时，才会自动收敛到 `contextSize`。
-
-### 2.5 当前不再维护原生 Context Window 分子
-
-本仓库当前不再尝试把上游返回的 `usage` 回填到 VS Code 原生 `Context Window X / Y tokens` 的 `X`。
-
-原因不是上游没有 usage，而是当前公开的 VS Code Chat / Language Model 扩展 API 没有提供“把 prompt/completion/total/outputBuffer 这类 usage 明细写回原生 Context Window”的公开接口。公开接口要求扩展实现的只有：
-
-- 通过 `LanguageModelChatProvider.provideLanguageModelChatResponse(...)` 回传响应流
-- 通过 `LanguageModelChatProvider.provideTokenCount(...)` 返回一个 token 数
-
-而 `provideTokenCount(...)` 本质上是“对输入做 tokenizer 计数”的接口，不是“上报上一轮真实 usage”的接口。本仓库已经明确停止本地 prompt token 估算和本地 token 计数，因此这里直接返回 `0`，不再继续做上一轮 usage 回填这种妥协方案。
-
-如果上游接口返回了 usage，本仓库会把最近一次已完成请求的真实 usage 展示到状态栏 `CodingPlans Context`，用于查看实际占比和明细。后续若 VS Code 开放了原生 usage/context 写回 API，再恢复这一块，见 [todo/vscode-chat-api-follow-up.md](../todo/vscode-chat-api-follow-up.md)。
-
-### 3. 对这个项目最实用的上下文组织方式
-
-处理这个仓库的典型问题时，建议这样喂上下文：
-
-- 改 provider 行为：附加 `#src/providers/...` 和相关配置读取代码
-- 改设置项：附加 `#src/config/configStore.ts #package.json #README.md #DEV.md`
-- 改文档说明：附加 `#README.md #README_en.md #DEV.md`
-- 查某个模型上下文窗口为什么显示不对：附加模型配置 + `#src/providers/baseProvider.ts #src/config/configStore.ts`
-
-不要一上来就无差别 `#codebase`。只有在确实是跨模块机制问题时，才需要整仓上下文。
-
-## 排查建议
-
-如果你怀疑“为什么某条 instructions / prompt 没生效”，官方建议直接看 Chat 诊断信息：
-
-1. 在 Chat 视图里右键
-2. 选择 `Diagnostics`
-3. 检查已加载的 instruction files、prompt files 和错误信息
-
-这比只盯着 `Context Window` 数字更有效，因为后者只能告诉你“用了多少”，不能告诉你“具体哪份规则没被加载”。
-
-## 官方文档
-
-- VS Code: Manage context for AI
+- VS Code 官方：Manage context for AI  
   https://code.visualstudio.com/docs/copilot/chat/copilot-chat-context
-- VS Code: Chat overview
+- VS Code 官方：Chat overview  
   https://code.visualstudio.com/docs/copilot/chat/copilot-chat
-- VS Code: Use custom instructions in VS Code
-  https://code.visualstudio.com/docs/copilot/customization/custom-instructions
-- VS Code: Use prompt files in VS Code
-  https://code.visualstudio.com/docs/copilot/customization/prompt-files
+- VS Code 官方：How Copilot understands your workspace  
+  https://code.visualstudio.com/docs/copilot/reference/workspace-context
+- VS Code 官方：Language Model Chat Provider API  
+  https://code.visualstudio.com/api/extension-guides/ai/language-model-chat-provider
@@ -2,7 +2,7 @@
     "name": "coding-plans-for-copilot",
     "displayName": "%displayName%",
     "description": "%description%",
-    "version": "0.7.2",
+    "version": "0.7.9",
     "publisher": "techfetch-dev",
     "repository": {
         "type": "git",
 
@@ -10,6 +10,9 @@ export interface LastContextUsageSnapshot extends NormalizedTokenUsage {
   recordedAt: number;
 }
 
+const STATUS_BAR_NO_BREAK_SPACE = '\u00A0';
+const CONTEXT_STATUS_LABEL = `CodingPlans${STATUS_BAR_NO_BREAK_SPACE}Context`;
+
 export class ContextUsageState implements vscode.Disposable {
   private snapshot: LastContextUsageSnapshot | undefined;
   private readonly onDidChangeEmitter = new vscode.EventEmitter<LastContextUsageSnapshot | undefined>();
@@ -64,11 +67,11 @@ export class ContextStatusBarController implements vscode.Disposable {
 
 export function buildContextStatusText(snapshot: LastContextUsageSnapshot | undefined): string {
   if (!snapshot || snapshot.totalContextWindow <= 0) {
-    return 'CodingPlans Context --';
+    return `${CONTEXT_STATUS_LABEL}${STATUS_BAR_NO_BREAK_SPACE}--`;
   }
 
   const percentage = Math.min(100, Math.max(0, Math.round((readOccupiedContextTokens(snapshot) / snapshot.totalContextWindow) * 100)));
-  return `CodingPlans Context ${percentage}%`;
+  return `${CONTEXT_STATUS_LABEL}${STATUS_BAR_NO_BREAK_SPACE}${percentage}%`;
 }
 
 export function buildContextStatusTooltip(snapshot: LastContextUsageSnapshot | undefined): string {
 
@@ -3,7 +3,7 @@ import { ContextUsageState } from './contextUsageState';
 import { GenericAIProvider } from './providers/genericProvider';
 import { LMChatProviderAdapter } from './providers/lmChatProviderAdapter';
 import { ConfigStore } from './config/configStore';
-import { CodingPlanStatusBarController, PlanUsagePollingController, PlanUsageState, showCodingPlanDetails } from './planUsageStatus';
+import { CodingPlanStatusBarController, PlanUsagePollingController, PlanUsageState } from './planUsageStatus';
 import { initI18n, getMessage } from './i18n/i18n';
 import { getCompactErrorMessage } from './providers/baseProvider';
 import {
@@ -24,7 +24,6 @@ let providers: Map<string, GenericAIProvider> = new Map();
 let refreshModelsCommandInProgress = false;
 let languageModelProviderRegistration: vscode.Disposable | undefined;
 let reRegisterLanguageModelProviderInProgress = false;
-const SHOW_STATUS_DETAILS_COMMAND = 'coding-plans.showStatusDetails';
 
 function shouldShowGenerateCommitMessageCommand(): boolean {
   return vscode.workspace
@@ -205,15 +204,9 @@ export async function activate(context: vscode.ExtensionContext): Promise<void>
   context.subscriptions.push(contextUsageState);
   const planUsageState = new PlanUsageState();
   context.subscriptions.push(planUsageState);
-  context.subscriptions.push(
-    vscode.commands.registerCommand(SHOW_STATUS_DETAILS_COMMAND, () => {
-      showCodingPlanDetails(contextUsageState.getSnapshot(), planUsageState.getSnapshot());
-    })
-  );
   const codingPlanStatusBarController = new CodingPlanStatusBarController(
     contextUsageState,
-    planUsageState,
-    SHOW_STATUS_DETAILS_COMMAND
+    planUsageState
   );
   context.subscriptions.push(codingPlanStatusBarController);
   const planUsagePollingController = new PlanUsagePollingController(configStore, planUsageState, contextUsageState);
Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,9 @@ export interface LastContextUsageSnapshot extends NormalizedTokenUsage {`
`10`	`10`	`recordedAt: number;`
`11`	`11`	`}`
`12`	`12`
	`13`	`+const STATUS_BAR_NO_BREAK_SPACE = '\u00A0';`
	`14`	+const CONTEXT_STATUS_LABEL = `CodingPlans${STATUS_BAR_NO_BREAK_SPACE}Context`;
	`15`	`+`
`13`	`16`	`export class ContextUsageState implements vscode.Disposable {`
`14`	`17`	`private snapshot: LastContextUsageSnapshot \| undefined;`
`15`	`18`	`private readonly onDidChangeEmitter = new vscode.EventEmitter<LastContextUsageSnapshot \| undefined>();`
`@@ -64,11 +67,11 @@ export class ContextStatusBarController implements vscode.Disposable {`
`64`	`67`
`65`	`68`	`export function buildContextStatusText(snapshot: LastContextUsageSnapshot \| undefined): string {`
`66`	`69`	`if (!snapshot \|\| snapshot.totalContextWindow <= 0) {`
`67`		`- return 'CodingPlans Context --';`
	`70`	+ return `${CONTEXT_STATUS_LABEL}${STATUS_BAR_NO_BREAK_SPACE}--`;
`68`	`71`	`}`
`69`	`72`
`70`	`73`	`const percentage = Math.min(100, Math.max(0, Math.round((readOccupiedContextTokens(snapshot) / snapshot.totalContextWindow) * 100)));`
`71`		- return `CodingPlans Context ${percentage}%`;
	`74`	+ return `${CONTEXT_STATUS_LABEL}${STATUS_BAR_NO_BREAK_SPACE}${percentage}%`;
`72`	`75`	`}`
`73`	`76`
`74`	`77`	`export function buildContextStatusTooltip(snapshot: LastContextUsageSnapshot \| undefined): string {`