這份路徑以本 repo 既有筆記為起點,規劃一條從「讀懂概念 → 動手實作 → 深入原理 → 跨生態比較 → 產出分享」的五階段學習路線。
目標讀者:想成為 AI 工程師 / AI 產品經理、以 Claude Code / Codex / Antigravity 為主力工具的開發者。
Stage 0 ─ 全景定位 ← 已有:compare-coding-agents.md
│
Stage 1 ─ 觀念地圖 ← 已有:anthropic-blog-teaching-notes.md
│
Stage 2 ─ 動手實作(缺) ── 寫第一個 Agent / 用 Claude Code 完成任務
│
Stage 3 ─ 底層原理(缺) ── Transformer、RLHF、Tool Use、MCP 內部機制
│
Stage 4 ─ 跨生態比較(缺) ── OpenAI / Google / Open-source 觀念體系
│
Stage 5 ─ 輸出與分享(缺) ── 部落格、開源 Skill、PR review
每個 Stage 結束都應該有可驗收的產出(筆記、demo 或 commit),而不是只是「讀完了」。
目的:知道市場上有哪些 Coding Agent、各自的形態與目標客群。
驗收:能用一句話講出 Codex / Antigravity / Claude Code 的核心差異,並說出自己「為什麼選 Claude Code(或別的)」的三個理由。
回頭補強:每季更新一次(模型版本、價格、SWE-bench 分數變化很快)。
現有筆記:anthropic-blog-teaching-notes.md
目的:建立 Anthropic 生態系的概念骨架——Agent 設計哲學、Context Engineering、Tool Design、Multi-Agent、Safety。
驗收:
- 能不看筆記畫出「Workflow vs Agent」的決策樹。
- 能解釋為什麼多代理人 token 用量是 chat 的 15×。
- 能列出 Claude Code 三件套(CLAUDE.md / slash commands / git worktree)。
回頭補強:每次 Anthropic 出新 engineering 文章時補進去。
這是目前 repo 最缺的一塊——光讀沒寫,觀念會留不住。
- 目標:在自己一個專案裡,只用 Claude Code 完成一個 PR(feature 或 bug fix)。
- 要做:
- 為該 repo 寫第一版
CLAUDE.md。 - 寫 1–2 個
.claude/commands/*.md自訂指令。 - 用 git worktree 開兩個 Claude 平行做不同子任務。
- 為該 repo 寫第一版
- 輸出筆記:
practice-01-claude-code-real-task.md,記錄:CLAUDE.md的演進(v1 → v2 改了什麼)。- 哪些 prompt 有效、哪些沒用。
- 踩到的坑(context 爆掉、tool 卡住、權限被擋)。
- 目標:用 Python / TypeScript SDK 做一個 < 200 行的 Agent。
- 建議題目(挑一個):
- 「讀我的 GitHub 通知 → 摘要今天該回覆的 issue/PR」。
- 「掃描某個 repo → 自動產生 release notes 草稿」。
- 「監控某網站 RSS → 用 Claude 篩選並寄信」。
- 輸出筆記:
practice-02-first-agent.md,重點寫:- 你定義了哪些 tool?工具描述如何寫?
- context 怎麼管理(每輪丟什麼進去)?
- 失敗模式(hallucinate、無限 loop、token 爆量)。
- 目標:把 2.1 或 2.2 累積的知識封裝成一個
SKILL.md包。 - 驗收:把這個 Skill 同時在 Claude Code 與 API 端跑起來。
- 輸出筆記:
practice-03-portable-skill.md。
- 至少 3 個 commit 在外部 repo(不是本 repo)展示用 Agent 完成的任務。
- 本 repo 多 3 份
practice-*.md。
不需要重訓模型,但要知道模型為什麼這樣行為,才有辦法 debug。
- 讀 Jay Alammar《The Illustrated Transformer》。
- 輸出筆記:
theory-01-transformer-essentials.md,重點:- QKV、Attention、Position Encoding 一頁圖。
- Decoder-only vs Encoder-Decoder。
- 讀 Anthropic「Constitutional AI」原始論文。
- 讀「Natural Emergent Misalignment from Reward Hacking」。
- 輸出筆記:
theory-02-rlhf-and-alignment.md,重點:- SFT → RLHF → CAI 的差異。
- 為什麼模型會 reward hack、會 alignment fake。
- 讀 Anthropic 的
tool_useAPI 文件 + 一篇 MCP spec。 - 動手:手刻一個極簡 tool-loop(不靠 SDK)。
- 輸出筆記:
theory-03-tool-use-internals.md,重點:- Tool schema → 模型怎麼選工具?
- parallel tool calls 是怎麼運作的?
- MCP 與普通 function calling 差在哪?
- 讀 Anthropic Prompt Caching 文件。
- 動手:對一個長 prompt 加 cache、量化命中率與成本下降。
- 輸出筆記:
theory-04-context-and-caching.md。
- 能向同事白板講解「為什麼工具描述會影響選工具的準確度」。
- 能解釋 prompt caching 在哪些場景省最多錢。
Stage 1 只覆蓋 Anthropic,要避免生態系視野盲區,得補上另外兩個。
- 讀 OpenAI 的「Practical Guide to Building Agents」、Responses API、Computer Use、Codex 文件。
- 輸出筆記:
ecosystem-01-openai-agents.md,對照 Anthropic 寫差異:- Agent 抽象(OpenAI 的 Assistants / Responses vs Anthropic 的 Messages + tool_use)。
- Memory / 持久狀態的處理。
- Tool / Function calling schema 差異。
- 讀 Gemini API 文件、Antigravity 設計理念、Google 的 Agent Development Kit。
- 輸出筆記:
ecosystem-02-google-gemini.md,重點:- Three-surface architecture(editor + terminal + browser)的設計動機。
- Artifact 機制是什麼、能用在哪。
- 挑一個讀 source code 半天。
- 輸出筆記:
ecosystem-03-open-source-agents.md,重點:- 它們如何模擬閉源 SDK 的 agent loop?
- 跟 Claude Agent SDK 的設計差異?
- 收到「該選哪家 API」的問題時,能 5 分鐘畫出決策樹回答。
真正鞏固學習的方式是輸出——寫得出來才代表懂了。
- 把 Stage 2–4 的 practice / theory / ecosystem 筆記挑 3 篇改寫成部落格文章。
- 中英雙語版本(中文留 repo、英文發 dev.to / Medium)。
- 把 Stage 2.3 的 Skill 上 GitHub,附中英文 README。
- 接受 issue / PR,從別人提問裡學新東西。
- 在 GitHub 上找 3 個用 Claude Code / Codex 寫的開源 PR,留高品質 review。
- 輸出筆記:
reflection-01-pr-review-learnings.md,記錄看到的 anti-pattern。
- 訂閱:Anthropic News、Alignment Science Blog、OpenAI Blog、Simon Willison's Weblog。
- 每月一篇
monthly-digest-YYYY-MM.md:本月最值得讀的 5 篇文章 + 為什麼。
| Stage | 預估時間 | 主要產出數 |
|---|---|---|
| 0 + 1 | 已完成 | 2 |
| 2 動手實作 | 3–4 週 | 3 篇 practice + 外部 commits |
| 3 底層原理 | 2 週 | 4 篇 theory |
| 4 跨生態比較 | 2–3 週 | 3 篇 ecosystem |
| 5 輸出分享 | 持續 | 月更 + 開源專案 |
完成 Stage 0–4 大約2 個月。Stage 5 是長期習慣。
維持一目了然的前綴:
compare-*.md ← 橫向比較(產品 / 模型 / 框架)
anthropic-*.md, openai-*.md, google-*.md ← 單一生態系筆記
practice-NN-*.md ← 動手練習紀錄
theory-NN-*.md ← 原理性筆記
ecosystem-NN-*.md ← 跨生態系觀察
reflection-*.md ← 心得與 review
monthly-digest-YYYY-MM.md ← 每月精選
learning-roadmap.md ← 本檔(路徑索引)
如果想立刻開始:
- 本週:開一個小 side project,套用 Stage 2.1(先寫
CLAUDE.md,跑一週看效果)。 - 下週:寫第一篇
practice-01-claude-code-real-task.md。 - 月底:開始 Stage 3.1(Transformer 觀念補完)。
不要等讀完所有資料才開始動手——邊做邊讀效率高十倍。