Гайд по шаблонам

Эти шаблоны готовы к копированию в ваш проект. Каждый из них служит конкретной цели в воркфлоу агента. Редактируйте содержимое, чтобы оно соответствовало командам, путям, именам фич и шагам верификации вашего проекта.

Как начать

Сначала скопируйте эти четыре файла в корень вашего проекта:

AGENTS.md или CLAUDE.md
init.sh
claude-progress.md
feature_list.json

Добавляйте остальные файлы по мере роста проекта.

AGENTS.md

Корневой файл инструкций. Это первое, что читает агент в начале сессии. Он задаёт операционные правила: что делать перед написанием кода, как работать и как заканчивать.

Как использовать:

Скопируйте в корневую директорию проекта
Замените шаги стартового воркфлоу на реальные пути и команды вашего проекта
Настройте рабочие правила под конвенции вашей команды
Сохраните секцию definition of done — это самая важная часть

Что он делает для агента:

Заставляет читать прогресс и состояние фич перед началом работы
Требует работать над одной фичей за раз
Требует доказательства, прежде чем что-либо помечать как done
Определяет, как выглядит чистое окончание сессии

Используйте AGENTS.md для Codex или других агентов. Используйте CLAUDE.md, если работаете с Claude Code — структура та же, просто отформатировано под стиль инструкций Claude.

init.sh

Скрипт старта. Запускает установку зависимостей, верификацию и печатает команду запуска — всё за один проход.

Как использовать:

Скопируйте в корень проекта
Отредактируйте эти три переменные сверху:
- INSTALL_CMD — ваша команда установки зависимостей (например, npm install, pip install -r requirements.txt)
- VERIFY_CMD — базовая команда верификации (например, npm test, pytest)
- START_CMD — команда запуска dev-сервера (например, npm run dev)
Сделайте его исполняемым: chmod +x init.sh

Что он делает:

Печатает текущую директорию (чтобы можно было убедиться, что он запускается в правильном месте)
Устанавливает зависимости
Выполняет команду верификации
Печатает команду запуска (или выполняет её, если установлен RUN_START_COMMAND=1)

Если верификация падает, агент должен остановиться и починить базу, прежде чем делать что-либо ещё.

claude-progress.md

Лог прогресса. Каждая сессия пишет в этот файл, и каждая новая сессия читает его первым делом.

Как использовать:

Скопируйте в корень проекта
Заполните секцию «Current Verified State» информацией о вашем проекте
После каждой сессии обновляйте запись о сессии

Что значит каждое поле:

Current Verified State — единственный источник истины о том, в каком состоянии проект
- Repository root directory — где живёт проект
- Standard startup path — команда для запуска проекта
- Standard verification path — команда для запуска тестов
- Highest priority unfinished feature — над чем должна работать следующая сессия
- Current blocker — всё, что застопорилось
Session Record — одна запись на сессию
- Goal — что вы планировали сделать
- Completed — что реально было сделано
- Verification run — какие тесты были запущены
- Evidence recorded — какие доказательства были зафиксированы
- Commits — что было закоммичено
- Known risks — что может быть сломано
- Next best action — с чего должна начать следующая сессия

feature_list.json

Трекер фич. Машиночитаемый список всех фич, которые агенту нужно реализовать, вместе со статусом, шагами верификации и доказательствами.

Как использовать:

Скопируйте в корень проекта
Замените примеры фич на свои
Каждой фиче нужно:
- id — короткий уникальный идентификатор
- priority — целое число, меньше = выше приоритет
- area — какая часть приложения (например, "chat", "import", "search")
- title — короткое описание
- user_visible_behavior — что пользователь должен увидеть, когда оно работает
- status — одно из not_started, in_progress, blocked, passing
- verification — пошаговые инструкции для подтверждения, что оно работает
- evidence — зафиксированное доказательство того, что верификация прошла (заполняется агентом)
- notes — любой дополнительный контекст

Правила статусов:

not_started — не трогали
in_progress — единственная фича, над которой сейчас идёт работа (только одна за раз)
blocked — не может продолжаться из-за задокументированной проблемы
passing — верификация прошла, и доказательство зафиксировано

У агента в любой момент должна быть только одна фича в in_progress.

session-handoff.md

Компактная заметка-передача между сессиями. Используйте её, когда сессия заканчивается, и вы хотите, чтобы следующая быстро подхватила работу.

Как использовать:

Скопируйте в корень проекта
Заполняйте в конце каждой сессии (или попросите агента заполнить)

Что покрывает каждая секция:

Currently verified — что подтверждённо работает и какая верификация была запущена
Changes this session — что изменилось в коде или инфраструктуре
Still broken or unverified — известные проблемы и рискованные участки
Next best action — что должна сделать следующая сессия и чего не трогать
Commands — команды старта, верификации и отладки для быстрого доступа

Этот файл опционален для коротких сессий. Он становится важным, когда сессии длинные или когда у проекта несколько активных областей.

clean-state-checklist.md

Чек-лист, который нужно пройти перед окончанием каждой сессии. Гарантирует, что репозиторий в хорошем состоянии для чистого старта следующей сессии.

Как использовать:

Скопируйте в корень проекта
Пройдитесь по нему перед тем, как закрыть сессию
Агент тоже должен проверять эти пункты как часть своей end-of-session рутины

Что он проверяет:

Стандартный старт всё ещё работает
Стандартная верификация всё ещё запускается
Лог прогресса обновлён
Список фич отражает реальное состояние (нет ложных записей passing)
Никаких незаписанных недоделанных шагов
Следующая сессия может продолжить без ручного ремонта

evaluator-rubric.md

Оценочный лист для ревью качества вывода агента. Используйте после сессии или на майлстоунах проекта, чтобы оценить, дотягивает ли работа до планки.

Как использовать:

Скопируйте в корень проекта
После сессии (или набора сессий) оценивайте работу агента по шести измерениям
Каждое измерение оценивается 0–2

Шесть измерений:

Correctness — соответствует ли реализация целевому поведению?
Verification — реально ли были запущены требуемые проверки, с доказательствами?
Scope discipline — оставался ли агент в рамках выбранной фичи?
Reliability — переживает ли результат перезапуск или повторный прогон?
Maintainability — достаточно ли понятны код и документация для следующей сессии?
Handoff readiness — может ли новая сессия продолжить, опираясь только на артефакты репозитория?

Варианты заключения:

Accept — соответствует планке
Revise — нужны фиксы перед принятием
Block — фундаментальные проблемы, которые надо решать в первую очередь

Важно: evaluator нужно калибровать. «Из коробки» агенты — плохие судьи самих себя: они выявляют проблемы, а потом уговаривают себя одобрить. Вам придётся итерировать:

Запустите evaluator на завершённом спринте.
Сравните его оценки с собственным человеческим суждением.
Где они расходятся — сделайте рубрику конкретнее по критериям pass/fail.
Перезапустите и проверьте сходимость.
Повторяйте, пока evaluator не начнёт стабильно совпадать с человеческим ревью.

Закладывайте 3–5 раундов калибровки. Записывайте каждое изменение, чтобы отслеживать, что улучшило сходимость.

quality-document.md

Снимок качества, оценивающий каждый продуктовый домен и архитектурный слой вашего проекта. Отслеживает здоровье кодовой базы во времени, а не только вывод отдельной сессии.

Как использовать:

Скопируйте в корень проекта
Перед началом сессии: прочитайте, чтобы понять, где кодовая база слабее всего
После сессии: обновите оценки на основе того, что изменилось
Со временем: сравнивайте снимки, чтобы увидеть, какие изменения harness реально улучшили здоровье кодовой базы

Что он оценивает:

Продуктовые домены (например, импорт документов, Q&A-флоу, индексация): каждому домену ставится оценка (A–D) по статусу верификации, читаемости для агента, стабильности тестов и ключевым пробелам
Архитектурные слои (например, main process, preload, renderer, services): каждому слою ставится оценка за соблюдение границ и читаемость для агента

Почему это важно:

Рубрика evaluator оценивает отдельные выводы агента. Quality-документ оценивает саму кодовую базу. Они отвечают на разные вопросы:

Рубрика evaluator: «Хорошо ли агент сработал в этой сессии?»
Quality-документ: «Проект становится сильнее или слабее со временем?»

Когда обновлять:

После каждой значимой сессии
Перед сравнениями бенчмарков
После проходов по уборке или упрощению
При онбординге нового агента или модели в проект

Связь с упрощением harness:

Quality-документ также поддерживает упрощение harness. Каждый компонент harness кодирует предположение о том, чего модель не умеет. По мере улучшения моделей эти предположения устаревают. Чтобы проверить, нужен ли компонент:

Сделайте снимок quality-документа.
Удалите один компонент harness.
Прогоните набор бенчмарк-задач.
Сделайте ещё один снимок.
Сравните — если оценки не упали, компонент был излишним. Если упали — верните его обратно.

Гайд по шаблонам ​

Как начать ​

AGENTS.md ​

init.sh ​

claude-progress.md ​

feature_list.json ​

session-handoff.md ​

clean-state-checklist.md ​

evaluator-rubric.md ​

quality-document.md ​

Гайд по шаблонам

Как начать

AGENTS.md

init.sh

claude-progress.md

feature_list.json

session-handoff.md

clean-state-checklist.md

evaluator-rubric.md

quality-document.md