Aulas relacionadas: Aula 11. Tornar o tempo de execução do agente observável. · Aula 12. Transição de informações clara e objetiva ao final de cada sessão. Arquivos de template: templates/
Projeto 06. Construa um Harness Completo para Agentes (Capstone)
O Que Você Vai Fazer
Este é o projeto final (capstone). Reúna tudo o que foi aprendido nos cinco primeiros projetos, execute um benchmark completo e depois faça uma etapa de limpeza para verificar se a qualidade é sustentável ao longo do tempo.
Utilize um conjunto fixo de tarefas com múltiplas funcionalidades cobrindo todo o recorte do produto: importação de documentos, indexação, perguntas e respostas baseadas em citações, observabilidade em runtime e um estado de repositório legível e reinicializável. Primeiro execute com um harness fraco como baseline, depois com seu harness mais robusto e, por fim, faça uma limpeza e uma nova execução. Depois disso, realize um experimento de ablação do harness — remova um componente por vez para descobrir quais realmente fazem diferença.
Ferramentas
- Claude Code ou Codex
- Git
- Node.js + Electron
- Template de documento de qualidade
- Rubrica de avaliação
- Todos os componentes de harness acumulados nos cinco primeiros projetos
Mecanismo do Harness
Harness completo: todos os mecanismos + observabilidade + estudo de ablação
Utilize o Projeto Versionado
Caminho do repositório: projects/project-06/
| Diretório | O que contém | O que comparar |
|---|---|---|
starter/ | Código do produto praticamente completo, mas com uma superfície de harness intencionalmente fraca: AGENTS.md básico, sem feature_list.json, sem session-handoff.md e sem checklist de estado limpo. | Observações manuais da baseline com harness fraco. O starter intencionalmente não inclui scripts de benchmark. |
solution/ | Superfície completa de harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, documentos de qualidade/avaliação, além de scripts de benchmark e limpeza. | Execute projects/project-06/solution/scripts/benchmark.sh e projects/project-06/solution/scripts/cleanup-scanner.sh, depois compare as evidências documentadas de qualidade. |
Diferente dos projetos anteriores, o starter do capstone não possui principalmente funcionalidades do produto faltando. A principal lacuna está no harness operacional ao redor da aplicação.