Связанные лекции: Лекция 09. Не давайте агентам объявлять победу слишком рано · Лекция 10. Только полный прогон пайплайна считается настоящей верификацией Файлы шаблонов: templates/
Проект 05. Заставьте агента самостоятельно проверять свою работу
Что вы делаете
Реализуйте разделение ролей — генератор, который пишет код, evaluator, который ревьюит, и опционально планировщик. Запустите трижды, чтобы измерить эффект каждой добавленной роли.
Выберите содержательную фичу-апгрейд (многоходовой диалог, редизайн панели цитирования или фильтрация документов) и удерживайте её одинаковой во всех запусках.
Инструменты
- Claude Code или Codex
- Git
- Node.js + Electron
Механизм harness
Самопроверка + Q&A с обоснованием + завершение по доказательствам