Lista de Verificación de Señales de Fallo
Usa esta lista al revisar una ejecución de harness débil.
- ¿El agente preguntó o infirió incorrectamente cómo iniciar la app?
- ¿Creó directorios o abstracciones que no coinciden con el producto previsto?
- ¿Se detuvo tras construir una shell de UI visible sin un flujo completo?
- ¿Dejó notas o artefactos que ayuden a una ejecución futura a continuar?
- ¿Podría una sesión nueva entender qué ocurrió en menos de cinco minutos?