Guía de Plantillas

Estas plantillas están listas para copiar en tu propio proyecto. Cada una cumple un propósito específico en el flujo de trabajo del agente. Edita el contenido para que coincida con los comandos, rutas, nombres de características y pasos de verificación de tu proyecto.

Cómo Comenzar

Copia estos cuatro archivos en la raíz de tu proyecto primero:

AGENTS.md o CLAUDE.md
init.sh
claude-progress.md
feature_list.json

Añade los archivos restantes a medida que tu proyecto crece.

AGENTS.md

El archivo de instrucciones raíz. Esta es la primera cosa que el agente lee cuando inicia una sesión. Define las reglas operacionales: qué hacer antes de escribir código, cómo trabajar y cómo cerrar.

Cómo usarlo:

Copia al directorio raíz de tu proyecto
Reemplaza los pasos del flujo de inicio con las rutas y comandos reales de tu proyecto
Ajusta las reglas de trabajo para que coincidan con las convenciones de tu equipo
Mantén la sección de definición de completado — es la parte más importante

Qué hace por el agente:

Le indica que lea el progreso y el estado de las características antes de comenzar a trabajar
Lo obliga a trabajar en una característica a la vez
Requiere evidencia antes de marcar algo como completado
Define cómo se ve un fin de sesión limpio

Usa AGENTS.md para Codex u otros agentes. Usa CLAUDE.md si estás trabajando con Claude Code — la estructura es la misma, solo formateada para el estilo de instrucciones de Claude.

init.sh

El script de inicio. Ejecuta la instalación de dependencias, verificación e imprime el comando de inicio — todo en un solo paso.

Cómo usarlo:

Copia a la raíz de tu proyecto
Edita estas tres variables en la parte superior:
- INSTALL_CMD — tu comando de instalación de dependencias (ej. npm install, pip install -r requirements.txt)
- VERIFY_CMD — tu comando de verificación básica (ej. npm test, pytest)
- START_CMD — tu comando de inicio del servidor de desarrollo (ej. npm run dev)
Hazlo ejecutable: chmod +x init.sh

Qué hace:

Imprime el directorio actual (para que puedas confirmar que se está ejecutando en el lugar correcto)
Instala dependencias
Ejecuta el comando de verificación
Imprime el comando de inicio (o lo ejecuta si RUN_START_COMMAND=1 está configurado)

Si la verificación falla, el agente debe detenerse y corregir la línea base antes de hacer cualquier otra cosa.

claude-progress.md

El registro de progreso. Cada sesión escribe en este archivo, y cada sesión nueva lo lee primero.

Cómo usarlo:

Copia a la raíz de tu proyecto
Rellena la sección "Estado Verificado Actual" con la información de tu proyecto
Después de cada sesión, actualiza el registro de sesión

Qué significa cada campo:

Estado Verificado Actual — la única fuente de verdad sobre dónde está el proyecto
- Repository root directory — dónde vive el proyecto
- Standard startup path — el comando para poner en marcha el proyecto
- Standard verification path — el comando para ejecutar los tests
- Highest priority unfinished feature — en qué debería trabajar la próxima sesión
- Current blocker — cualquier cosa que esté atascada
Registro de Sesión — una entrada por sesión
- Goal — lo que planeabas hacer
- Completed — lo que realmente se hizo
- Verification run — qué tests se ejecutaron
- Evidence recorded — qué prueba se capturó
- Commits — qué se commiteó
- Known risks — qué podría estar roto
- Next best action — dónde debería empezar la próxima sesión

feature_list.json

El rastreador de características. Una lista legible por máquina de cada característica que el agente necesita implementar, junto con su estado, pasos de verificación y evidencia.

Cómo usarlo:

Copia a la raíz de tu proyecto
Reemplaza las características de ejemplo con las tuyas
Cada característica necesita:
- id — un identificador único corto
- priority — entero, menor = mayor prioridad
- area — qué parte de la aplicación (ej. "chat", "import", "search")
- title — descripción corta
- user_visible_behavior — lo que el usuario debería ver cuando funciona
- status — uno de not_started, in_progress, blocked, passing
- verification — instrucciones paso a paso para confirmar que funciona
- evidence — prueba registrada de que la verificación pasó (rellenada por el agente)
- notes — cualquier contexto adicional

Reglas de estado:

not_started — no ha sido tocada
in_progress — la única característica en la que se está trabajando actualmente (solo una a la vez)
blocked — no se puede proceder debido a un problema documentado
passing — la verificación pasó y la evidencia está registrada

El agente solo debe tener una característica en in_progress en cualquier momento.

session-handoff.md

Una nota de entrega compacta entre sesiones. Usa esto cuando una sesión termina y quieres que la próxima la retome rápidamente.

Cómo usarlo:

Copia a la raíz de tu proyecto
Rellénalo al final de cada sesión (o haz que el agente lo rellene)

Qué cubre cada sección:

Actualmente verificado — qué está confirmado como funcionando y qué verificación se ejecutó
Cambios esta sesión — qué código o infraestructura cambió
Aún roto o sin verificar — problemas conocidos y áreas de riesgo
Mejor próxima acción — qué debería hacer la próxima sesión, y qué no tocar
Comandos — comandos de inicio, verificación y depuración para referencia rápida

Este archivo es opcional para sesiones pequeñas. Se vuelve importante cuando las sesiones son largas o cuando el proyecto tiene múltiples áreas activas.

clean-state-checklist.md

Una lista de verificación para revisar antes de terminar cada sesión. Asegura que el repositorio esté en un buen estado para que la próxima sesión comience limpiamente.

Cómo usarlo:

Copia a la raíz de tu proyecto
Revísala antes de cerrar una sesión
El agente también debería verificar estos elementos como parte de su rutina de fin de sesión

Qué verifica:

El inicio estándar sigue funcionando
La verificación estándar sigue ejecutándose
El registro de progreso está actualizado
La lista de características refleja el estado real (no hay entradas passing falsas)
No hay trabajo a medio terminar sin registrar
La próxima sesión puede continuar sin correcciones manuales

evaluator-rubric.md

Una tarjeta de puntuación para revisar la calidad de salida del agente. Usa esto después de una sesión o en hitos del proyecto para evaluar si el trabajo cumple con el estándar.

Cómo usarlo:

Copia a la raíz de tu proyecto
Después de una sesión (o un conjunto de sesiones), puntúa el trabajo del agente en seis dimensiones
Cada dimensión se puntúa de 0 a 2

Las seis dimensiones:

Corrección — ¿la implementación coincide con el comportamiento objetivo?
Verificación — ¿las verificaciones requeridas se ejecutaron realmente, con evidencia?
Disciplina de alcance — ¿el agente se mantuvo dentro de la característica seleccionada?
Fiabilidad — ¿el resultado sobrevive un reinicio o reejecución?
Mantenibilidad — ¿el código y la documentación son lo suficientemente claros para la próxima sesión?
Preparación de entrega — ¿puede una sesión nueva continuar usando solo artefactos del repositorio?

Opciones de conclusión:

Aceptar — cumple con el estándar
Revisar — necesita correcciones antes de aceptar
Bloquear — problemas fundamentales que necesitan resolverse primero

Importante: el evaluador necesita ajuste. De fábrica, los agentes son malos autojueces — identifican problemas y luego se convencen a sí mismos de aprobar. Necesitarás iterar:

Ejecuta el evaluador en un sprint completado.
Compara sus puntuaciones con tu propio juicio humano.
Donde diverjan, haz la rúbrica más específica sobre los criterios de aprobación/fallo.
Vuelve a ejecutar y verifica la alineación.
Repite hasta que el evaluador coincida consistentemente con la revisión humana.

Planifica 3-5 rondas de ajuste. Registra cada cambio para que puedas rastrear qué mejoró la alineación.

quality-document.md

Una instantánea de calidad que califica cada dominio de producto y capa arquitectónica en tu proyecto. Rastrea la salud del código base a lo largo del tiempo, no solo la salida de sesiones individuales.

Cómo usarlo:

Copia a la raíz de tu proyecto
Antes de comenzar una sesión: léelo para entender dónde el código base es más débil
Después de una sesión: actualiza las calificaciones basándote en qué cambió
Con el tiempo: compara instantáneas para ver qué cambios del harness realmente mejoraron la salud del código base

Qué califica:

Dominios de producto (ej., importación de documentos, flujo de P&R, indexación): cada dominio recibe una calificación (A-D) en estado de verificación, legibilidad del agente, estabilidad de tests y brechas clave
Capas arquitectónicas (ej., proceso principal, preload, renderer, servicios): cada capa recibe una calificación para enforcement de límites y legibilidad del agente

Por qué importa:

La rúbrica del evaluador puntúa las salidas individuales del agente. El documento de calidad puntúa el código base en sí. Responden a preguntas diferentes:

Rúbrica del evaluador: "¿Hizo buen trabajo el agente en esta sesión?"
Documento de calidad: "¿El proyecto se está fortaleciendo o debilitando con el tiempo?"

Cuándo actualizar:

Después de cada sesión significativa
Antes de comparaciones de benchmark
Después de pases de limpieza o simplificación
Al incorporar un nuevo agente o modelo al proyecto

Conexión con la simplificación del harness:

El documento de calidad también soporta la simplificación del harness. Cada componente del harness codifica un supuesto sobre lo que el modelo no puede hacer. A medida que los modelos mejoran, estos supuestos se vuelven obsoletos. Para verificar si un componente sigue siendo necesario:

Toma una instantánea del documento de calidad.
Elimina un componente del harness.
Ejecuta el conjunto de tareas de benchmark.
Toma otra instantánea.
Compara — si las calificaciones no bajaron, el componente era sobrecarga. Si bajaron, restáuralo.

Guía de Plantillas ​

Cómo Comenzar ​

AGENTS.md ​

init.sh ​

claude-progress.md ​

feature_list.json ​

session-handoff.md ​

clean-state-checklist.md ​

evaluator-rubric.md ​

quality-document.md ​

Guía de Plantillas

Cómo Comenzar

AGENTS.md

init.sh

claude-progress.md

feature_list.json

session-handoff.md

clean-state-checklist.md

evaluator-rubric.md

quality-document.md