Guía de Plantillas
Estas plantillas están listas para copiar en tu propio proyecto. Cada una cumple un propósito específico en el flujo de trabajo del agente. Edita el contenido para que coincida con los comandos, rutas, nombres de características y pasos de verificación de tu proyecto.
Cómo Comenzar
Copia estos cuatro archivos en la raíz de tu proyecto primero:
AGENTS.mdoCLAUDE.mdinit.shclaude-progress.mdfeature_list.json
Añade los archivos restantes a medida que tu proyecto crece.
AGENTS.md
El archivo de instrucciones raíz. Esta es la primera cosa que el agente lee cuando inicia una sesión. Define las reglas operacionales: qué hacer antes de escribir código, cómo trabajar y cómo cerrar.
Cómo usarlo:
- Copia al directorio raíz de tu proyecto
- Reemplaza los pasos del flujo de inicio con las rutas y comandos reales de tu proyecto
- Ajusta las reglas de trabajo para que coincidan con las convenciones de tu equipo
- Mantén la sección de definición de completado — es la parte más importante
Qué hace por el agente:
- Le indica que lea el progreso y el estado de las características antes de comenzar a trabajar
- Lo obliga a trabajar en una característica a la vez
- Requiere evidencia antes de marcar algo como completado
- Define cómo se ve un fin de sesión limpio
Usa AGENTS.md para Codex u otros agentes. Usa CLAUDE.md si estás trabajando con Claude Code — la estructura es la misma, solo formateada para el estilo de instrucciones de Claude.
init.sh
El script de inicio. Ejecuta la instalación de dependencias, verificación e imprime el comando de inicio — todo en un solo paso.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Edita estas tres variables en la parte superior:
INSTALL_CMD— tu comando de instalación de dependencias (ej.npm install,pip install -r requirements.txt)VERIFY_CMD— tu comando de verificación básica (ej.npm test,pytest)START_CMD— tu comando de inicio del servidor de desarrollo (ej.npm run dev)
- Hazlo ejecutable:
chmod +x init.sh
Qué hace:
- Imprime el directorio actual (para que puedas confirmar que se está ejecutando en el lugar correcto)
- Instala dependencias
- Ejecuta el comando de verificación
- Imprime el comando de inicio (o lo ejecuta si
RUN_START_COMMAND=1está configurado)
Si la verificación falla, el agente debe detenerse y corregir la línea base antes de hacer cualquier otra cosa.
claude-progress.md
El registro de progreso. Cada sesión escribe en este archivo, y cada sesión nueva lo lee primero.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Rellena la sección "Estado Verificado Actual" con la información de tu proyecto
- Después de cada sesión, actualiza el registro de sesión
Qué significa cada campo:
- Estado Verificado Actual — la única fuente de verdad sobre dónde está el proyecto
Repository root directory— dónde vive el proyectoStandard startup path— el comando para poner en marcha el proyectoStandard verification path— el comando para ejecutar los testsHighest priority unfinished feature— en qué debería trabajar la próxima sesiónCurrent blocker— cualquier cosa que esté atascada
- Registro de Sesión — una entrada por sesión
Goal— lo que planeabas hacerCompleted— lo que realmente se hizoVerification run— qué tests se ejecutaronEvidence recorded— qué prueba se capturóCommits— qué se commiteóKnown risks— qué podría estar rotoNext best action— dónde debería empezar la próxima sesión
feature_list.json
El rastreador de características. Una lista legible por máquina de cada característica que el agente necesita implementar, junto con su estado, pasos de verificación y evidencia.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Reemplaza las características de ejemplo con las tuyas
- Cada característica necesita:
id— un identificador único cortopriority— entero, menor = mayor prioridadarea— qué parte de la aplicación (ej. "chat", "import", "search")title— descripción cortauser_visible_behavior— lo que el usuario debería ver cuando funcionastatus— uno denot_started,in_progress,blocked,passingverification— instrucciones paso a paso para confirmar que funcionaevidence— prueba registrada de que la verificación pasó (rellenada por el agente)notes— cualquier contexto adicional
Reglas de estado:
not_started— no ha sido tocadain_progress— la única característica en la que se está trabajando actualmente (solo una a la vez)blocked— no se puede proceder debido a un problema documentadopassing— la verificación pasó y la evidencia está registrada
El agente solo debe tener una característica en in_progress en cualquier momento.
session-handoff.md
Una nota de entrega compacta entre sesiones. Usa esto cuando una sesión termina y quieres que la próxima la retome rápidamente.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Rellénalo al final de cada sesión (o haz que el agente lo rellene)
Qué cubre cada sección:
- Actualmente verificado — qué está confirmado como funcionando y qué verificación se ejecutó
- Cambios esta sesión — qué código o infraestructura cambió
- Aún roto o sin verificar — problemas conocidos y áreas de riesgo
- Mejor próxima acción — qué debería hacer la próxima sesión, y qué no tocar
- Comandos — comandos de inicio, verificación y depuración para referencia rápida
Este archivo es opcional para sesiones pequeñas. Se vuelve importante cuando las sesiones son largas o cuando el proyecto tiene múltiples áreas activas.
clean-state-checklist.md
Una lista de verificación para revisar antes de terminar cada sesión. Asegura que el repositorio esté en un buen estado para que la próxima sesión comience limpiamente.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Revísala antes de cerrar una sesión
- El agente también debería verificar estos elementos como parte de su rutina de fin de sesión
Qué verifica:
- El inicio estándar sigue funcionando
- La verificación estándar sigue ejecutándose
- El registro de progreso está actualizado
- La lista de características refleja el estado real (no hay entradas
passingfalsas) - No hay trabajo a medio terminar sin registrar
- La próxima sesión puede continuar sin correcciones manuales
evaluator-rubric.md
Una tarjeta de puntuación para revisar la calidad de salida del agente. Usa esto después de una sesión o en hitos del proyecto para evaluar si el trabajo cumple con el estándar.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Después de una sesión (o un conjunto de sesiones), puntúa el trabajo del agente en seis dimensiones
- Cada dimensión se puntúa de 0 a 2
Las seis dimensiones:
- Corrección — ¿la implementación coincide con el comportamiento objetivo?
- Verificación — ¿las verificaciones requeridas se ejecutaron realmente, con evidencia?
- Disciplina de alcance — ¿el agente se mantuvo dentro de la característica seleccionada?
- Fiabilidad — ¿el resultado sobrevive un reinicio o reejecución?
- Mantenibilidad — ¿el código y la documentación son lo suficientemente claros para la próxima sesión?
- Preparación de entrega — ¿puede una sesión nueva continuar usando solo artefactos del repositorio?
Opciones de conclusión:
- Aceptar — cumple con el estándar
- Revisar — necesita correcciones antes de aceptar
- Bloquear — problemas fundamentales que necesitan resolverse primero
Importante: el evaluador necesita ajuste. De fábrica, los agentes son malos autojueces — identifican problemas y luego se convencen a sí mismos de aprobar. Necesitarás iterar:
- Ejecuta el evaluador en un sprint completado.
- Compara sus puntuaciones con tu propio juicio humano.
- Donde diverjan, haz la rúbrica más específica sobre los criterios de aprobación/fallo.
- Vuelve a ejecutar y verifica la alineación.
- Repite hasta que el evaluador coincida consistentemente con la revisión humana.
Planifica 3-5 rondas de ajuste. Registra cada cambio para que puedas rastrear qué mejoró la alineación.
quality-document.md
Una instantánea de calidad que califica cada dominio de producto y capa arquitectónica en tu proyecto. Rastrea la salud del código base a lo largo del tiempo, no solo la salida de sesiones individuales.
Cómo usarlo:
- Copia a la raíz de tu proyecto
- Antes de comenzar una sesión: léelo para entender dónde el código base es más débil
- Después de una sesión: actualiza las calificaciones basándote en qué cambió
- Con el tiempo: compara instantáneas para ver qué cambios del harness realmente mejoraron la salud del código base
Qué califica:
- Dominios de producto (ej., importación de documentos, flujo de P&R, indexación): cada dominio recibe una calificación (A-D) en estado de verificación, legibilidad del agente, estabilidad de tests y brechas clave
- Capas arquitectónicas (ej., proceso principal, preload, renderer, servicios): cada capa recibe una calificación para enforcement de límites y legibilidad del agente
Por qué importa:
La rúbrica del evaluador puntúa las salidas individuales del agente. El documento de calidad puntúa el código base en sí. Responden a preguntas diferentes:
- Rúbrica del evaluador: "¿Hizo buen trabajo el agente en esta sesión?"
- Documento de calidad: "¿El proyecto se está fortaleciendo o debilitando con el tiempo?"
Cuándo actualizar:
- Después de cada sesión significativa
- Antes de comparaciones de benchmark
- Después de pases de limpieza o simplificación
- Al incorporar un nuevo agente o modelo al proyecto
Conexión con la simplificación del harness:
El documento de calidad también soporta la simplificación del harness. Cada componente del harness codifica un supuesto sobre lo que el modelo no puede hacer. A medida que los modelos mejoran, estos supuestos se vuelven obsoletos. Para verificar si un componente sigue siendo necesario:
- Toma una instantánea del documento de calidad.
- Elimina un componente del harness.
- Ejecuta el conjunto de tareas de benchmark.
- Toma otra instantánea.
- Compara — si las calificaciones no bajaron, el componente era sobrecarga. Si bajaron, restáuralo.