Skip to content

Commit b84047e

Browse files
author
XavierTrump
committed
merge: 同步 dev delicious233 到 dev trump
2 parents b5ebb27 + 01b521b commit b84047e

451 files changed

Lines changed: 16010 additions & 28884 deletions

File tree

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.

.agents/skills/dev-loop/SKILL.md

Lines changed: 21 additions & 18 deletions
Original file line numberDiff line numberDiff line change
@@ -10,18 +10,20 @@ description: "自主开发推进引擎——ROADMAP 驱动、模型分配、并
1010
1111
## 模型分配策略
1212

13-
> 最后更新:2026-05-24。与 AGENTS.md 保持同步。
13+
> 最后更新:2026-06-05。与 AGENTS.md 保持同步`opus` / `sonnet` / `haiku` 是 Claude CLI 路由别名;Codex 自带 agent 工具单独建模
1414
15-
| 别名 | 实际模型 | 上下文 | 角色 | 派发策略 |
16-
|---|---|---|---|---|
17-
| **opus** | DeepSeek-V4-Pro | 1M | 推理/架构/审查 | 主 Agent 决策、安全审查、DI 重构、复杂跨文件变更 |
18-
| **sonnet** | Kimi-K2.6 | 256k | 前端/多模态/快速并行 | Desktop UI、IM 界面、视觉审查、批量格式化/重命名 |
19-
| **haiku** | GLM-5.1 | 200k | 高智力编码/业务逻辑 | Go 后端编码、bug 修复、测试生成、算法实现。优先用,失败换 opus |
15+
| 入口 | 别名/模型 | 上下文 | 强项 | 派发策略 |
16+
|---|---|---:|---|---|
17+
| Codex 自带 agent 工具 | GPT-5.5 | 256k | 全方面强,代码、agentic 执行、审查都稳 | 中等上下文内的核心实现、跨前后端小集成、关键 review |
18+
| Claude CLI | **opus** = DeepSeek-V4-Pro | 1M | 长上下文推理、架构、竞品仓库研究、安全/方案审查 | 大范围阅读、路线图/架构判断、复杂设计评审 |
19+
| Claude CLI | **sonnet** = GLM-5.1 | 200k | 代码和 agentic 能力强,上下文短 | 窄范围代码实现、测试修复、Go/TS 小切片 |
20+
| Claude CLI | **haiku** = mimo-v2.5 | 适中 | 多模态、看图、视觉判断 | 竞品截图复核、Desktop 视觉 QA、UI 可读性/布局审查 |
2021

21-
- **主 Agent**:opus — 设计决策、审查输出、编辑核心文件(AGENTS.md/ROADMAP.md)
22-
- **前端 subagent**:sonnet — UI 组件、CSS、多模态视觉审查
23-
- **后端 subagent**:haiku — Go 编码 + 测试。实际失败才换 opus
24-
- **批量机械**:sonnet — 翻译、格式化、重命名、测试生成
22+
- **主 Agent**:设计决策、审查输出、编辑核心文件(AGENTS.md/STATE.md/ROADMAP.md)。
23+
- **Codex GPT-5.5 subagent**:工具可用时优先派给高价值代码实现和强 review;不要给超 256k 的大仓库研究。
24+
- **Claude opus**:长上下文推理、竞品研究、安全/架构审查。
25+
- **Claude sonnet**:明确路径内的实现和 focused tests;prompt 精简,只传必要文件。
26+
- **Claude haiku**:截图/多模态/UI 视觉审查,不作为代码主力。
2527

2628
## CC 原生工具配合
2729

@@ -44,7 +46,7 @@ dev-loop 配合两个 CC 内置命令使用效果最好:
4446
## 标准工作循环
4547

4648
### 1. 理解
47-
-`AGENTS.md` / `docs/handoff/STATE.md` / `docs/roadmap.md`
49+
-`AGENTS.md` / `docs/handoffs/STATE.md` / `docs/roadmap.md`
4850
- 理解现有架构、约定、当前进度
4951
- STATE.md 是跨 session 状态文件,每次接手先读
5052

@@ -56,21 +58,22 @@ dev-loop 配合两个 CC 内置命令使用效果最好:
5658
- 不确定的设计先做轻量探索(只读 agent)
5759

5860
### 3. 执行
59-
- **自己(opus 主 session)**:设计决策、审查输出、编辑核心文件(AGENTS.md/STATE.md/ROADMAP.md)
60-
- **派 opus subagent**:复杂功能、架构重构、安全审查、多维度审计
61-
- **派 sonnet subagent**:批量机械工作(翻译、格式化、测试生成、重命名)
62-
- **派 haiku subagent**:编码实现、bug 修复、算法。优先用 haiku,实际失败才换 opus
61+
- **自己(主 session)**:设计决策、审查输出、编辑核心文件(AGENTS.md/STATE.md/ROADMAP.md)
62+
- **派 Codex GPT-5.5 subagent**:中等上下文内的核心实现、跨模块小集成、关键代码 review
63+
- **派 Claude opus**:复杂架构推理、长上下文研究、安全审查、多维度审计
64+
- **派 Claude sonnet**:窄范围编码实现、bug 修复、focused tests
65+
- **派 Claude haiku**:截图/多模态视觉 QA、UI 对比和可读性审查
6366
- 每次 subagent 完成后审查其输出
6467

6568
### 4. 审查
66-
- 完成一批变更后启动交叉审查:4-5 个 opus agent 并行
67-
- 维度:结构、文档、安全、架构、易用性
69+
- 完成一批变更后启动交叉审查:按维度混用 Codex GPT-5.5、Claude opus、Claude sonnet、Claude haiku
70+
- 维度:结构、文档、安全、架构、易用性、视觉 QA
6871
- 让其他 agent 提问题:"审查这个变更,列出你担心的问题"
6972
- 修复高优先级项
7073

7174
### 5. 同步
7275
- AGENTS.md / CLAUDE.md(规则变更)
73-
- `docs/handoff/STATE.md`(事实变更:进度/阻塞/部署状态)
76+
- `docs/handoffs/STATE.md`(事实变更:进度/阻塞/部署状态)
7477
- ROADMAP.md(标记完成、记录阻塞、写下一步)
7578
- 运行 `neat-freak` 清理过时文档
7679
- 运行 `memory-management` 同步 memory(如有跨系统需求)
Lines changed: 43 additions & 57 deletions
Original file line numberDiff line numberDiff line change
@@ -1,73 +1,59 @@
11
# 模型选择决策树
22

3-
最后更新:2026-05-23
3+
最后更新:2026-06-05
44

5-
## 可用模型
5+
## 可用 subagent 入口
66

7-
| 别名 | 实际后端 | 上下文 | 优势 | 限制 |
8-
|---|---|---|---|---|
9-
| **opus** | deepseek-v4-pro | 1M | 深度推理、架构设计、安全审查、复杂重构 | 慢、贵 |
10-
| **sonnet** | deepseek-v4-flash | 1M | 快速并行执行、批量操作、格式统一 | 编码能力不如 haiku |
11-
| **haiku** | glm-5.1 | **200k** | 简短复杂逻辑、业务编码、算法 | **上下文小**、不稳定 |
7+
| 入口 | 别名/模型 | 上下文 | 优势 | 限制 |
8+
|---|---|---:|---|---|
9+
| Codex 自带 agent 工具 | GPT-5.5 | 256k | 全方面强,代码、agentic 执行、审查都稳 | 上下文不如 Claude opus,不能吃超大仓库研究 |
10+
| Claude CLI | **opus** = DeepSeek-V4-Pro | 1M | 长上下文推理、架构设计、安全审查、竞品仓库研究 | 代码实现不作为首选 |
11+
| Claude CLI | **sonnet** = GLM-5.1 | 200k | 代码和 agentic 能力强,适合聚焦实现 | 上下文短,不能给大批量阅读 |
12+
| Claude CLI | **haiku** = mimo-v2.5 | 适中 | 多模态、看图、视觉判断、UI 对比 | 不作为代码主力 |
1213

13-
## Haiku 定位
14+
## 选择原则
1415

15-
haiku 专精于**短上下文内的复杂逻辑**——单个函数的精巧算法、棘手的业务规则、深度 bug 分析。不适合大批量文件操作或需要加载大量参考文档的任务。
16-
17-
**能用 haiku 的:**
18-
- 单个函数/模块的复杂算法实现
19-
- 聚焦的 bug 修复(错误 + 相关代码 < 200k)
20-
- 业务逻辑审查(单个文件或小范围)
21-
- 代码片段优化
22-
23-
**不能用 haiku 的:**
24-
- 跨文件重构(上下文不够)
25-
- 批量文件操作(3+ 文件可能溢出)
26-
- 需要加载多个参考文档的任务
27-
- 翻译超过 5 个文件的批次
28-
29-
**原则:haiku = 小而精。短上下文、高复杂度、单点突破。大任务→sonnet/opus。**
30-
31-
## Haiku Fallback
32-
33-
haiku 编码强但不稳定。首次编码用 haiku(前提:不超 200k)。返回乱码/截断→不重试,直接换 opus。批量大上下文→用 sonnet。
16+
- **先看入口**:Codex 自带 agent 工具和 Claude CLI 是两套执行面,不能把别名混用。
17+
- **先限上下文**:超过 256k 的研究、竞品仓库阅读、跨大量文件审查优先 Claude opus;不超过 256k 的核心代码实现优先 Codex GPT-5.5。
18+
- **先限写入范围**:任何编码 subagent 都必须有允许路径、禁止范围、验收命令和证据输出。
19+
- **多模态单独派发**:截图、竞品图、视觉 QA 优先 Claude haiku,不让代码 agent 猜图。
3420

3521
## 决策流程
3622

3723
```
3824
任务类型?
39-
├── 设计/架构/审查类
40-
│ └── → opus(主 session 或 opus subagent)
41-
├── 批量机械操作(翻译、格式化、重命名)
42-
│ ├── 5 个文件以内 → sonnet subagent
43-
│ └── 多文件大规模 → 拆批,每批 sonnet subagent
44-
├── 编码实现/功能开发
45-
│ ├── 单文件复杂逻辑 → haiku subagent(优先)
46-
│ ├── 小范围业务编码(1-2 文件)→ haiku subagent
47-
│ ├── 多文件重构 → opus subagent(haiku 上下文不够)
48-
│ └── haiku 不稳定 → 换 opus
49-
├── 交叉审查
50-
│ ├── 安全/架构/业务逻辑 → opus(需深度推理)
51-
│ └── 结构/文档/易用性 → sonnet(机械检查)
52-
├── 探索/搜索
53-
│ ├── 单个目标明确 → 自己做(Grep/Glob)
54-
│ ├── 多维度搜索 → 2-3 sonnet 并行 Explore agent
55-
│ └── 深度代码理解 → 1 opus Explore agent
56-
└── 安全审查
57-
└── → opus subagent(必须,不能跳过)
25+
├── 核心实现 / 跨前后端小集成
26+
│ ├── 上下文 <= 256k → Codex GPT-5.5 subagent
27+
│ └── 上下文 > 256k → 拆小;设计交给 Claude opus,代码交给 GPT-5.5/sonnet
28+
├── 窄范围代码修复(明确 1-3 个文件)
29+
│ ├── Go/TS/测试小切片 → Claude sonnet(GLM-5.1)
30+
│ └── 高风险实现 review → Codex GPT-5.5 或 Claude opus 复核
31+
├── 长上下文推理 / 架构 / 安全 / 竞品仓库研究
32+
│ └── Claude opus(DeepSeek-V4-Pro, 1M)
33+
├── 截图 / 竞品图 / 视觉 QA / UI 可读性
34+
│ └── Claude haiku(mimo-v2.5,多模态)
35+
├── 机械批量文档或格式统一
36+
│ ├── 中等上下文 → Codex GPT-5.5
37+
│ └── 超大上下文或需要归纳 → Claude opus 先规划,再分片执行
38+
└── 交叉审查
39+
├── 安全/架构/长期方向 → Claude opus
40+
├── 代码正确性/集成风险 → Codex GPT-5.5
41+
├── 小范围实现细节 → Claude sonnet
42+
└── UI 截图/视觉/布局 → Claude haiku
5843
```
5944

60-
## 并行度
45+
## 上下文管理
6146

62-
- 独立任务:最大并行数 = 任务数
63-
- 审查任务:4-5 维度同时跑,opus 管安全/架构,sonnet 管结构/文档/易用性
64-
- 翻译任务:按文件数分片,~20-40 文件/sonnet subagent
65-
- haiku 子任务:每次只给 1-2 个文件,prompt 精简
47+
| Agent | 上限 | 策略 |
48+
|---|---:|---|
49+
| Codex GPT-5.5 | 256k | 给完整任务卡 + 必要文件;适合强实现和强 review |
50+
| Claude opus | 1M | 可给大仓库、大量文档、竞品源码;产出方案/审查,不直接机械改大批文件 |
51+
| Claude sonnet | 200k | prompt 精简,只传相关文件;适合窄范围代码和测试 |
52+
| Claude haiku | 适中 | 输入截图或少量 UI 代码;输出视觉问题和修改建议 |
6653

67-
## 上下文管理
54+
## 并行度
6855

69-
| 模型 | 上限 | 策略 |
70-
|---|---|---|
71-
| haiku | 200k | 精简 prompt,只传必要文件,不传大型参考文档 |
72-
| sonnet | 1M | 可传大量文件,适合批量操作 |
73-
| opus | 1M | 适合深度分析大型代码库 |
56+
- 写入范围互不重叠时才能并行。
57+
- R2/R4/R5/R3/R6A 这类 Desktop 队列按依赖顺序合并;只读 review 可并行。
58+
- 视觉 QA 可以和代码 review 并行,但修复必须由主 Agent 统一分派。
59+
- subagent 完成后,主 Agent 必须复核 diff、运行 targeted checks,再更新 roadmap 或合并。

.agents/skills/dev-team/SKILL.md

Lines changed: 20 additions & 13 deletions
Original file line numberDiff line numberDiff line change
@@ -11,18 +11,25 @@ description: 多 Team 并行开发引擎 — 大规模 Issue 修复、跨模块
1111

1212
```
1313
你(主 Agent)
14-
├── Team Leader 1 (Opus) → Worktree A
15-
│ ├── Worker 1 → 修 2-3 issues
16-
│ ├── Worker 2 → 修 2-3 issues
17-
│ ├── Worker 3 → 修 2-3 issues
18-
│ └── Worker 4 → 测试 + 审查
19-
├── Team Leader 2 (Opus) → Worktree B
14+
├── Team Leader 1 (Codex GPT-5.5 或 Claude opus) → Worktree A
15+
│ ├── Worker 1 (GPT-5.5 / Claude sonnet) → 修 1-3 issues
16+
│ ├── Worker 2 (GPT-5.5 / Claude sonnet) → 修 1-3 issues
17+
│ ├── Worker 3 (Claude haiku) → 截图 / 视觉 QA(如需要)
18+
│ └── Worker 4 (GPT-5.5 / opus) → 测试 + 审查
19+
├── Team Leader 2 (Codex GPT-5.5 或 Claude opus) → Worktree B
2020
│ └── ... (同上)
2121
└── ... (最多 5 个 Team 并行)
2222
```
2323

2424
每个 Team 在自己的 worktree 中独立开发,文件范围完全不重叠。
2525

26+
| Agent | 上下文 | 定位 |
27+
|---|---:|---|
28+
| Codex GPT-5.5 subagent | 256k | 全方面强,适合核心实现、跨模块小集成、强代码 review |
29+
| Claude opus = DeepSeek-V4-Pro | 1M | 长上下文推理、架构、安全、竞品仓库研究 |
30+
| Claude sonnet = GLM-5.1 | 200k | 代码和 agentic 能力强,适合明确文件范围内的实现和测试 |
31+
| Claude haiku = mimo-v2.5 | 适中 | 多模态,看图、视觉 QA、UI 对比 |
32+
2633
## 何时使用
2734

2835
- 10+ Issue 需要按模块分组修复
@@ -83,11 +90,11 @@ You are Team Leader for {team_name}. Fix {N} issues ({batch_name}).
8390
8491
1. Create worktree: git worktree add .worktrees/{worktree_name} -b feat/{branch_name}
8592
2. Read key source files: {file_list}
86-
3. Spawn 4 Opus workers (Agent tool, mode="bypassPermissions", run_in_background=true)
87-
- Worker 1: {issue_list_1}
88-
- Worker 2: {issue_list_2}
89-
- Worker 3: {issue_list_3}
90-
- Worker 4: {issue_list_4}
93+
3. Spawn workers by task type:
94+
- Codex GPT-5.5: core implementation / integration review (<=256k context)
95+
- Claude sonnet: narrow code fixes with explicit file whitelist
96+
- Claude haiku: screenshot or visual QA
97+
- Claude opus: long-context architecture/security review
9198
4. Each worker: read → write failing test → implement fix → go test passes
9299
5. Review all work, resolve conflicts, go test -race, commit
93100
6. Push branch
@@ -145,8 +152,8 @@ git branch -d feat/team-*
145152
```
146153
输入:129 个 Issue,按 label 分组为 5 个批次
147154
Team 数:5
148-
每个 Team:1 Leader + 4 Workers = 5 Opus agents
149-
总 agent 数:25
155+
每个 Team:1 Leader + 3-4 Workers,按任务类型混用 GPT-5.5 / opus / sonnet / haiku
156+
总 agent 数:约 20-25
150157
Worktree 数:5
151158
152159
文件隔离验证(零重叠):

.agents/skills/ui-screenshot/scripts/capture.ts

Lines changed: 7 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -66,6 +66,7 @@ async function main() {
6666
const [vw, vh] = (viewport as string).split(',').map(Number);
6767
const waitMs = Number(wait);
6868
const useMock = mock !== 'false';
69+
const captureTheme = theme === 'light' ? 'light' : 'dark';
6970

7071
const timestamp = new Date().toISOString().replace(/[:T]/g, '-').slice(0, 19);
7172
const outputPath = resolve(out ?? `screenshots/capture-${timestamp}.png`);
@@ -78,12 +79,17 @@ async function main() {
7879

7980
const context = await browser.newContext({
8081
viewport: { width: vw, height: vh },
81-
colorScheme: theme as 'dark' | 'light',
82+
colorScheme: captureTheme,
8283
deviceScaleFactor: 1,
8384
});
8485

8586
const page = await context.newPage();
8687

88+
await page.addInitScript((selectedTheme) => {
89+
window.localStorage.setItem('agenthub-theme', selectedTheme);
90+
document.documentElement.setAttribute('data-theme', selectedTheme);
91+
}, captureTheme);
92+
8793
// Inject mock data before navigation
8894
if (useMock) {
8995
await page.addInitScript((payload) => {

.env.example

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -16,6 +16,7 @@ AGENTHUB_DB_PORT=5432
1616
AGENTHUB_DB_USER=agenthub
1717
AGENTHUB_DB_PASSWORD=dev_password
1818
AGENTHUB_DB_NAME=agenthub
19+
# AGENTHUB_DB_SSLMODE=disable # disable | require | verify-ca | verify-full
1920

2021
# ── Redis 7 ─────────────────────────────────
2122
AGENTHUB_REDIS_HOST=localhost

.github/workflows/checks.yml

Lines changed: 2 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -42,7 +42,7 @@ jobs:
4242
- name: Test (unit only, skip integration)
4343
run: go test ./... -count=1 -short -coverprofile=coverage.out -covermode=atomic
4444

45-
- name: Coverage check (overall >= 70%)
45+
- name: Coverage check (overall >= 75%)
4646
run: |
4747
COVERAGE=$(go tool cover -func=coverage.out | grep total | awk '{print $3}' | sed 's/%//')
4848
THRESHOLD=75
@@ -193,14 +193,11 @@ jobs:
193193
docker:
194194
name: Docker build (Hub Server)
195195
runs-on: ubuntu-latest
196-
defaults:
197-
run:
198-
working-directory: hub-server
199196
steps:
200197
- uses: actions/checkout@v4
201198

202199
- name: Build Docker image
203-
run: docker build -t agenthub-hub-server -f deployments/Dockerfile .
200+
run: docker build -t agenthub-hub-server -f hub-server/deployments/Dockerfile .
204201

205202
- name: Verify image
206203
run: docker images agenthub-hub-server

0 commit comments

Comments
 (0)