Skip to content

中文版本 →

Связанные лекции: Лекция 09. Не давайте агентам объявлять победу слишком рано · Лекция 10. Только полный прогон пайплайна считается настоящей верификацией Файлы шаблонов: templates/

Проект 05. Заставьте агента самостоятельно проверять свою работу

Что вы делаете

Реализуйте разделение ролей — генератор, который пишет код, evaluator, который ревьюит, и опционально планировщик. Запустите трижды, чтобы измерить эффект каждой добавленной роли.

Выберите содержательную фичу-апгрейд (многоходовой диалог, редизайн панели цитирования или фильтрация документов) и удерживайте её одинаковой во всех запусках.

Инструменты

  • Claude Code или Codex
  • Git
  • Node.js + Electron

Механизм harness

Самопроверка + Q&A с обоснованием + завершение по доказательствам