Упражнения сгруппированы по уровням: 🟢 новичок / 🟡 средний / 🔴 продвинутый. Каждое имеет:
- Цель — что должно стать понятно.
- Шаги — что делать.
- Подсказка — где смотреть.
- Критерий — как понять, что сделано.
Большинство упражнений read-only: открываете файлы, отвечаете на вопросы. Несколько требуют запуска cd evals && npm test.
Цель: ориентироваться в структуре.
Шаги:
- Откройте корень репо.
- Выпишите все агентские файлы (паттерн
*.agent.md). - Откройте
governance/— выпишите 7 файлов. - Откройте
schemas/— посчитайте JSON-файлы.
Подсказка: Глава 02, Глава 03.
Критерий: 13 агентов, 7 governance, 20 схем.
Цель: убедиться, что P.A.R.T. — обязательный порядок.
Шаги:
- Откройте
Researcher-subagent.agent.md. - Найдите 4 заголовка: Prompt → Archive → Resources → Tools.
- Проверьте порядок.
Подсказка: Глава 04.
Критерий: Порядок строго P → A → R → T.
Цель: убедиться, что харнесс работает.
Шаги:
cd evals.npm install(один раз).npm test.- Прочитать сводку.
Подсказка: Глава 14.
Критерий: Все тесты passed. Знаете время прогона.
Цель: понять, что в нём.
Шаги:
- Откройте
NOTES.md. - Найдите active objective и current phase.
- Сравните с реальным состоянием репо.
Подсказка: Глава 12.
Критерий: Можете сказать, что сейчас «активная цель» проекта.
Цель: понять mapping тира на ревьюеров.
Шаги:
- Откройте
governance/runtime-policy.json. - Найдите
review_pipeline_by_tier. - Заполните таблицу:
| Tier | Активные ревьюеры | Max iterations |
|---|---|---|
| TRIVIAL | ? | ? |
| SMALL | ? | ? |
| MEDIUM | ? | ? |
| LARGE | ? | ? |
Подсказка: Глава 07, Глава 10.
Критерий: Таблица сходится с governance.
Цель: определить классификацию.
Шаги: для каждой ситуации выберите класс (transient / fixable / needs_replan / escalate):
| # | Ситуация | Класс |
|---|---|---|
| 1 | Тест упал по network timeout | ? |
| 2 | Build fails: typo в имени переменной | ? |
| 3 | Endpoint требует middleware, которого нет | ? |
| 4 | Найдена SQL injection | ? |
| 5 | HTTP 429 от тулзы | ? |
| 6 | Архитектурная зависимость оказалась циклической | ? |
| 7 | Бюджет токенов исчерпан | ? |
Подсказка: Глава 13.
Критерий: transient / fixable / needs_replan / escalate / transient / needs_replan / escalate.
Цель: прочитать ключевую схему.
Шаги:
- Откройте
schemas/planner.plan.schema.json. - Найдите все required-поля верхнего уровня.
- Найдите enum для
complexity_tier. - Найдите enum для
executor_agentв phases.
Подсказка: Глава 09.
Критерий: Можете перечислить required-поля и оба enum-а.
Цель: научиться выбирать skill-references.
Шаги: для каждой задачи выберите 1–3 skills из skills/index.md:
| # | Задача | Skills |
|---|---|---|
| 1 | Добавить пагинацию в /v1/orders (CoreImplementer) | ? |
| 2 | Сделать форму регистрации accessible (UIImplementer) | ? |
| 3 | Развернуть pgvector через Helm (PlatformEngineer) | ? |
| 4 | Написать FAQ-секцию документации (TechnicalWriter) | ? |
| 5 | Спланировать API-рефакторинг (Planner) | ? |
Подсказка: Глава 11, Domain Mapping в skills/index.md.
Критерий: Каждый выбор аргументируется доменом.
Цель: определить слой памяти.
Шаги: куда писать каждый факт?
| # | Факт | Слой |
|---|---|---|
| 1 | «Сейчас работаем над фазой 4 plan X» | ? |
| 2 | «Verdict PA для итерации 1: APPROVED» | ? |
| 3 | «Гипотеза: возможно, использовать SSE вместо WebSocket» | ? |
| 4 | «Каноническая верификация — cd evals && npm test» |
? |
| 5 | «P.A.R.T. order is mandatory and enforced» | ? |
Подсказка: Глава 12.
Критерий: NOTES.md / task-episodic / session / repo-persistent / repo-persistent.
Цель: end-to-end дизайн.
Шаги:
- Задача: «Добавить экспорт /v1/orders в CSV».
- Опишите шаги от первого ввода пользователя до commit:
- Кто отвечает на input? (Planner или Orchestrator)
- Какой
complexity_tier? Почему? - Какие триггеры PLAN_REVIEW? Какой pipeline?
- Какие фазы (≥3, ≤10)?
- Какие executor_agent для каждой?
- Какие skill_references?
- Какие quality_gates?
Подсказка: Главы 05–08.
Критерий: Согласованный план; sanity-проверка через схему planner.plan.schema.json.
Цель: мыслить как PlanAuditor.
Шаги:
- Откройте любой план в
plans/(например,subagent-routing-guardrails-plan.md). - Применить 4-perspective check (Architecture / Security / Risk / Completeness).
- Найти ≥1 потенциальную проблему в каждой перспективе.
Подсказка: Глава 07, PlanAuditor-subagent.agent.md.
Критерий: ≥4 содержательных findings.
Цель: мыслить как AssumptionVerifier.
Шаги:
- Возьмите тот же план.
- Найти ≥3 «assumption-fact confusion» (предположения, выданные за факты без evidence).
- Для каждого: указать местоположение и предложить evidence для resolution.
Подсказка: AssumptionVerifier-subagent.agent.md, 17 mirage patterns.
Критерий: ≥3 mirage с evidence.
Цель: мыслить как ExecutabilityVerifier.
Шаги:
- Возьмите 3 первые задачи из первой фазы того же плана.
- Для каждой проверьте:
- Есть ли ссылки на файлы?
- Есть ли точные команды (exact strings)?
- Все ли термины определены?
- Нет ли implicit assumptions о состоянии?
- Заполните: PASS / WARN / FAIL для каждой.
Подсказка: Глава 07, ExecutabilityVerifier-subagent.agent.md.
Критерий: 3 task verdicts с обоснованием.
Цель: обнаружить scope drift.
Шаги:
- Возьмите завершённый plan (любой в
plans/archive/). - Симулируйте changed_files как union всех файлов из всех фаз + 1 «лишний».
- Постройте
plan_phases_snapshot[]. - Найдите scope drift.
- Определите fix executor по правилу «highest phase_id with файл в
files[]».
Подсказка: Глава 08, code-reviewer.verdict.schema.json.
Критерий: Корректный fix routing.
Цель: добавить skill корректно.
Шаги:
- Идея: «sql-injection-prevention.md» pattern.
- Создать pattern-файл (3–5 sections, инструктивный стиль).
- Зарегистрировать в
skills/index.mdDomain Mapping. - Обновить применимых агентов (CoreImplementer, CodeReviewer, PlanAuditor).
- Запустить
cd evals && npm test.
Подсказка: Глава 11, skills/README.md.
Критерий: Eval проходит. Skill читается естественно.
Цель: понять observability.
Шаги:
- Прочитать docs/agent-engineering/OBSERVABILITY.md.
- Сделать диаграмму: какие поля переходят между gate-event и delegation-protocol для корреляции?
- Описать, как восстановить полный flow из NDJSON-лога.
Критерий: Диаграмма содержит trace_id и iteration_index с источниками/потребителями.
Цель: governance change по правилам.
Шаги:
- Гипотеза: «MEDIUM тоже должен запускать ExecutabilityVerifier».
- Какие файлы поменять?
- Какие тесты могут упасть?
- Что обновить в Orchestrator-промпте, если что?
Подсказка: Глава 10, governance/runtime-policy.json.
Критерий: Список изменений согласован с правилом «governance побеждает промпт».
Цель: проверить, готовы ли отвечать другим людям.
Вопросы:
- «Зачем нужен AssumptionVerifier, если есть PlanAuditor?» — обоснуйте через разные перспективы.
- «Когда использовать ABSTAIN, а когда REPLAN_REQUIRED?» — объясните разницу.
- «Почему Planner не вызывает ревьюеров сам?» — объясните разделение ответственности.
- «Почему PLAN_REVIEW нет в
workflow_stateenum?» — объясните различие промпт-стадий и schema-states. - «Чем
failure_classificationотличается отclarification_request?» — объясните разные routing paths.
Подсказка: все главы пособия.
Критерий: На каждый вопрос — связный ответ ≥3 предложения с цитатами/файлами.
Для самопроверки овладения. Выберите 3:
A. Объясните P.A.R.T. человеку, который никогда не работал с агентами. B. Объясните разницу между skill и documentation. C. Объясните, почему eval-харнесс не вызывает реальные LLM. D. Объясните, как Orchestrator выбирает executor для фазы. E. Объясните, что такое «backbone pattern» (см. MIGRATION-CORE-FIRST.md).