Skip to content

中文版本 →

Aulas relacionadas: Aula 11. Tornar o tempo de execução do agente observável. · Aula 12. Transição de informações clara e objetiva ao final de cada sessão. Arquivos de template: templates/

Projeto 06. Construa um Harness Completo para Agentes (Capstone)

O Que Você Vai Fazer

Este é o projeto final (capstone). Reúna tudo o que foi aprendido nos cinco primeiros projetos, execute um benchmark completo e depois faça uma etapa de limpeza para verificar se a qualidade é sustentável ao longo do tempo.

Utilize um conjunto fixo de tarefas com múltiplas funcionalidades cobrindo todo o recorte do produto: importação de documentos, indexação, perguntas e respostas baseadas em citações, observabilidade em runtime e um estado de repositório legível e reinicializável. Primeiro execute com um harness fraco como baseline, depois com seu harness mais robusto e, por fim, faça uma limpeza e uma nova execução. Depois disso, realize um experimento de ablação do harness — remova um componente por vez para descobrir quais realmente fazem diferença.

Ferramentas

  • Claude Code ou Codex
  • Git
  • Node.js + Electron
  • Template de documento de qualidade
  • Rubrica de avaliação
  • Todos os componentes de harness acumulados nos cinco primeiros projetos

Mecanismo do Harness

Harness completo: todos os mecanismos + observabilidade + estudo de ablação

Utilize o Projeto Versionado

Caminho do repositório: projects/project-06/

DiretórioO que contémO que comparar
starter/Código do produto praticamente completo, mas com uma superfície de harness intencionalmente fraca: AGENTS.md básico, sem feature_list.json, sem session-handoff.md e sem checklist de estado limpo.Observações manuais da baseline com harness fraco. O starter intencionalmente não inclui scripts de benchmark.
solution/Superfície completa de harness: AGENTS.md, CLAUDE.md, feature_list.json, init.sh, session-handoff.md, clean-state-checklist.md, documentos de qualidade/avaliação, além de scripts de benchmark e limpeza.Execute projects/project-06/solution/scripts/benchmark.sh e projects/project-06/solution/scripts/cleanup-scanner.sh, depois compare as evidências documentadas de qualidade.

Diferente dos projetos anteriores, o starter do capstone não possui principalmente funcionalidades do produto faltando. A principal lacuna está no harness operacional ao redor da aplicação.