Пов'язані лекції: Лекція 11. Зробіть runtime агента спостережуваним · Лекція 12. Чистий перехід наприкінці кожної сесії Файли шаблонів: templates/
Проєкт 06. Побудуйте повний harness агента (підсумковий проєкт)
Що ви робите
Це підсумковий проєкт. Зберіть усе, чого ви навчилися в перших п'яти проєктах, запустіть повний бенчмарк, а потім виконайте прохід очищення, щоб переконатися, що якість підтримувана.
Використовуйте фіксований набір багатофункціональних завдань, що охоплює повний продуктовий зріз: імпорт документів, індексування, Q&A на основі цитат, спостережуваність у runtime та зрозумілий перезапускуваний стан репозиторію. Спочатку запустіть зі слабким базовим harness, потім із вашим найсильнішим harness, далі — очищення та повторний запуск. Нарешті, проведіть абляційний експеримент harness — видаляйте по одному компоненту і спостерігайте, які з них насправді мають значення.
Інструменти
- Claude Code або Codex
- Git
- Node.js + Electron
- Шаблон якісного документа
- Рубрика оцінювача
- Усі компоненти harness, накопичені з перших п'яти проєктів
Механізм harness
Повний harness: усі механізми + спостережуваність + абляційне дослідження
Використовуйте зафіксований у репозиторії проєкт
Шлях у репозиторії: projects/project-06/
| Директорія | Що містить | Що порівнювати |
|---|---|---|
starter/ | Здебільшого завершений продуктовий код із навмисно слабкою поверхнею harness: базовий AGENTS.md, без feature_list.json, без session-handoff.md, без чеклисту чистого стану. | Ручні спостереження базового рівня зі слабким harness. Стартова версія навмисно не містить скриптів бенчмарку. |
solution/ | Повна поверхня harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, документи якості/оцінювача, скрипти бенчмарку та очищення. | Запустіть projects/project-06/solution/scripts/benchmark.sh та projects/project-06/solution/scripts/cleanup-scanner.sh, потім порівняйте докази з якісних документів. |
На відміну від попередніх проєктів, стартова версія підсумкового проєкту не є здебільшого неповною з точки зору продуктових функцій. Основний пробіл — у робочому harness навколо застосунку.