Guia de Modelos (Templates)
Estes modelos estão prontos para serem copiados para o seu próprio projeto. Cada um serve a um propósito específico no fluxo de trabalho do agente. Edite o conteúdo para corresponder aos comandos, caminhos, nomes de recursos e etapas de verificação do seu projeto.
Como Começar
Copie estes quatro arquivos para a raiz do seu projeto primeiro:
AGENTS.mdouCLAUDE.mdinit.shclaude-progress.mdfeature_list.json
Adicione os arquivos restantes conforme seu projeto cresce.
AGENTS.md
O arquivo de instruções de raiz. Esta é a primeira coisa que o agente lê ao iniciar uma sessão. Ele define as regras de operação: o que fazer antes de escrever o código, como trabalhar e como finalizar.
Como usar:
- Copie para o diretório raiz do seu projeto
- Substitua as etapas do fluxo de trabalho de inicialização pelos caminhos e comandos reais do seu projeto
- Ajuste as regras de trabalho para corresponder às convenções da sua equipe
- Mantenha a seção de definição de concluído (definition of done) — é a parte mais importante
O que ele faz pelo agente:
- Diz para ler o progresso e o estado do recurso antes de começar o trabalho
- Força o trabalho em um recurso de cada vez
- Exige evidências antes de marcar qualquer coisa como concluída
- Define como deve ser um encerramento de sessão limpo
Use AGENTS.md para Codex ou outros agentes. Use CLAUDE.md se estiver trabalhando com o Claude Code — a estrutura é a mesma, apenas formatada para o estilo de instrução do Claude.
init.sh
O script de inicialização. Executa a instalação de dependências, a verificação e imprime o comando de início — tudo de uma vez só.
Como usar:
- Copie para a raiz do seu projeto
- Edite estas três variáveis no topo:
INSTALL_CMD— seu comando de instalação de dependências (ex:npm install,pip install -r requirements.txt)VERIFY_CMD— seu comando de verificação básica (ex:npm test,pytest)START_CMD— seu comando de início do servidor de desenvolvimento (ex:npm run dev)
- Torne-o executável:
chmod +x init.sh
O que ele faz:
- Imprime o diretório atual (para que você possa confirmar que está rodando no lugar certo)
- Instala as dependências
- Executa o comando de verificação
- Imprime o comando de início (ou o executa se
RUN_START_COMMAND=1estiver definido)
Se a verificação falhar, o agente deve parar e corrigir a base antes de fazer qualquer outra coisa.
claude-progress.md
O log de progresso. Cada sessão escreve neste arquivo, e cada nova sessão o lê primeiro.
Como usar:
- Copie para a raiz do seu projeto
- Preencha a seção "Estado Verificado Atual" com as informações do seu projeto
- Após cada sessão, atualize o registro da sessão
O que cada campo significa:
- Estado Verificado Atual — a única fonte da verdade para a situação atual do projeto
Diretório raiz do repositório— onde o projeto resideCaminho de inicialização padrão— o comando para colocar o projeto em execuçãoCaminho de verificação padrão— o comando para executar os testesRecurso inacabado de maior prioridade— o que a próxima sessão deve trabalharBloqueio atual— qualquer coisa que esteja travada
- Registro da Sessão — uma entrada por sessão
Objetivo— o que você planejou fazerConcluído— o que realmente foi feitoExecução de verificação— quais testes foram executadosEvidência registrada— qual prova foi capturadaCommits— o que foi commitadoRiscos conhecidos— o que pode estar quebradoPróxima melhor ação— onde a próxima sessão deve começar
feature_list.json
O rastreador de recursos. Uma lista legível por máquina de cada recurso que o agente precisa implementar, junto com seu status, etapas de verificação e evidências.
Como usar:
- Copie para a raiz do seu projeto
- Substitua os recursos de exemplo pelos seus próprios
- Cada recurso precisa de:
id— um identificador único curtoprioridade— número inteiro, menor = maior prioridadeárea— qual parte do app (ex: "chat", "importação", "busca")título— descrição curtacomportamento_visível_ao_usuário— o que o usuário deve ver quando funcionarstatus— um denot_started,in_progress,blocked,passingverificação— instruções passo a passo para confirmar que funcionaevidência— prova registrada de que a verificação passou (preenchida pelo agente)notas— qualquer contexto extra
Regras de status:
not_started— não foi tocadoin_progress— o único recurso em que se está trabalhando no momento (apenas um por vez)blocked— não pode prosseguir devido a um problema documentadopassing— a verificação passou e a evidência está registrada
O agente deve ter apenas um recurso em in_progress a qualquer momento.
session-handoff.md
Uma nota de entrega compacta entre sessões. Use isso quando uma sessão terminar e você quiser que a próxima continue rapidamente.
Como usar:
- Copie para a raiz do seu projeto
- Preencha ao final de cada sessão (ou peça para o agente preencher)
O que cada seção cobre:
- Verificado atualmente — o que está confirmado como funcionando e qual verificação foi executada
- Alterações nesta sessão — qual código ou infraestrutura mudou
- Ainda quebrado ou não verificado — problemas conhecidos e áreas de risco
- Próxima melhor ação — o que a próxima sessão deve fazer e o que não tocar
- Comandos — comandos de inicialização, verificação e depuração para referência rápida
Este arquivo é opcional para sessões pequenas. Ele se torna importante quando as sessões são longas ou quando o projeto tem várias áreas ativas.
clean-state-checklist.md
Um checklist para percorrer antes de encerrar cada sessão. Garante que o repositório esteja em um bom estado para a próxima sessão começar de forma limpa.
Como usar:
- Copie para a raiz do seu projeto
- Percorra-o antes de fechar uma sessão
- O agente também deve verificar esses itens como parte de sua rotina de fim de sessão
O que ele verifica:
- A inicialização padrão ainda funciona
- A verificação padrão ainda roda
- O log de progresso está atualizado
- A lista de recursos reflete o estado real (sem entradas
passingfalsas) - Nenhum trabalho inacabado foi deixado sem registro
- A próxima sessão pode continuar sem correções manuais
evaluator-rubric.md
Um cartão de pontuação para revisar a qualidade da entrega do agente. Use isso após uma sessão ou em marcos do projeto para avaliar se o trabalho atende aos critérios.
Como usar:
- Copie para a raiz do seu projeto
- Após uma sessão (ou um conjunto de sessões), pontue o trabalho do agente em seis dimensões
- Cada dimensão é pontuada de 0 a 2
As seis dimensões:
- Correção — a implementação corresponde ao comportamento pretendido?
- Verificação — as verificações exigidas foram realmente executadas, com evidências?
- Disciplina de escopo — o agente permaneceu dentro do recurso selecionado?
- Confiabilidade — o resultado sobrevive a uma reinicialização ou re-execução?
- Manutenibilidade — o código e a documentação estão claros o suficiente para a próxima sessão?
- Prontidão para entrega — uma nova sessão pode continuar usando apenas os artefatos do repositório?
Opções de conclusão:
- Aceitar — atende aos critérios
- Revisar — precisa de correções antes de aceitar
- Bloquear — problemas fundamentais que precisam ser resolvidos primeiro
Importante: o avaliador precisa de ajuste. Por padrão, os agentes são maus juízes de si mesmos — eles identificam problemas e depois se convencem a aprovar. Você precisará iterar:
- Execute o avaliador em um sprint concluído.
- Compare suas pontuações com seu próprio julgamento humano.
- Onde elas divergirem, torne a rúbrica mais específica sobre os critérios de aprovação/reprovação.
- Execute novamente e verifique o alinhamento.
- Repita até que o avaliador corresponda consistentemente à revisão humana.
Planeje de 3 a 5 rodadas de ajuste. Registre cada mudança para que você possa rastrear o que melhorou o alinhamento.
quality-document.md
Um instantâneo de qualidade que avalia cada domínio de produto e camada arquitetônica em seu projeto. Acompanha a saúde da base de código ao longo do tempo, não apenas a entrega de uma sessão individual.
Como usar:
- Copie para a raiz do seu projeto
- Antes de iniciar uma sessão: leia para entender onde a base de código está mais fraca
- Após uma sessão: atualize as notas com base no que mudou
- Ao longo do tempo: compare os instantâneos para ver quais mudanças no harness realmente melhoraram a saúde da base de código
O que ele avalia:
- Domínios de produto (ex: importação de documentos, fluxo de Q&A, indexação): cada domínio recebe uma nota (A-D) em status de verificação, legibilidade para o agente, estabilidade de teste e lacunas principais
- Camadas arquitetônicas (ex: processo principal, preload, renderizador, serviços): cada camada recebe uma nota para aplicação de limites e legibilidade para o agente
Por que isso importa:
A rúbrica do avaliador pontua entregas individuais de agentes. O documento de qualidade pontua a própria base de código. Eles respondem a perguntas diferentes:
- Rúbrica do avaliador: "O agente fez um bom trabalho nesta sessão?"
- Documento de qualidade: "O projeto está ficando mais forte ou mais fraco ao longo do tempo?"
Quando atualizar:
- Após cada sessão significativa
- Antes de comparações de benchmark
- Após passagens de limpeza ou simplificação
- Ao integrar um novo agente ou modelo ao projeto
Ligação com a simplificação do harness:
O documento de qualidade também apoia a simplificação do harness. Cada componente do harness codifica uma suposição sobre o que o modelo não pode fazer. À medida que os modelos melhoram, essas suposições tornam-se obsoletas. Para verificar se um componente ainda é necessário:
- Tire um instantâneo do documento de qualidade.
- Remova um componente do harness.
- Execute a suíte de tarefas de benchmark.
- Tire outro instantâneo.
- Compare — se as notas não caíram, o componente era excesso. Se caíram, restaure-o.