Zugehörige Lektionen: Lektion 09. Agenten daran hindern, zu früh Erfolg zu melden · Lektion 10. Nur ein vollständiger Pipeline-Lauf zählt als echte Verifikation Vorlagendateien: templates/
Projekt 05. Den Agenten seine eigene Arbeit verifizieren lassen
Was du tust
Implementiere Rollentrennung: einen generator für die Umsetzung, einen evaluator für die Prüfung und optional einen planner. Führe drei Läufe durch, um den Effekt jeder zusätzlichen Rolle zu messen.
Wähle eine substanzielle Feature-Erweiterung, etwa Multi-Turn-Konversation, Neugestaltung des Zitat-Panels oder Dokumentfilterung, und halte sie über alle Läufe hinweg konstant.
Werkzeuge
- Claude Code oder Codex
- Git
- Node.js + Electron
Harness-Mechanismus
Selbstverifikation + begründete Q&A + evidenzbasierter Abschluss