Skip to content

中文版本 →

Aulas relacionadas: Aula 09. Impedir que os agentes declarem vitória prematuramente. · Aula 10. Somente uma execução completa do pipeline conta como verificação real. Arquivos de template: templates/

Projeto 05. Faça o Agente Verificar o Próprio Trabalho

O Que Você Vai Fazer

Implemente separação de papéis — um gerador que implementa, um avaliador que revisa e, opcionalmente, um planejador. Execute o processo três vezes para medir o efeito de cada papel adicional.

Escolha uma melhoria significativa de funcionalidade (conversa multi-turno, redesign do painel de citações ou filtragem de documentos) e mantenha-a consistente em todas as execuções.

Ferramentas

  • Claude Code ou Codex
  • Git
  • Node.js + Electron

Mecanismo do Harness

Autoverificação + grounded Q&A + conclusão baseada em evidências

Utilize o Projeto Versionado

Caminho do repositório: projects/project-05/

DiretórioO que contémO que comparar
starter/Aplicação baseada no Projeto 04 antes da melhoria de histórico de conversas.Ponto de partida caso você queira executar novamente as três variantes por conta própria.
solution/single-role/Um único agente planeja, implementa e faz a própria revisão.evaluator-rubric.md com nota 1.6/5 e defeitos listados.
solution/gen-eval/Gerador mais avaliador com evidências de revisão.evaluator-rubric.md com nota 3.3/5 e observações de revisão.
solution/plan-gen-eval/Planejador mais gerador mais avaliador.sprint-contract.md e evaluator-rubric.md com nota 4.9/5.

A funcionalidade versionada é o histórico de conversas de perguntas e respostas multi-turno. Mantenha essa funcionalidade constante em todas as três variantes para que a única variável seja a separação de papéis.