Skip to content

中文版本 →

Leçons liées : Leçon 09. Empêcher les agents de déclarer la victoire trop tôt · Leçon 10. Seule une exécution de pipeline complet compte comme vraie vérification Fichiers modèles : templates/

Projet 05. Faire vérifier son propre travail par l'agent

Ce que vous faites

Implémentez la séparation des rôles : un generator qui implémente, un evaluator qui relit, et éventuellement un planner. Exécutez trois fois pour mesurer l'effet de chaque rôle ajouté.

Choisissez une amélioration substantielle de fonctionnalité, comme une conversation multi-tour, une refonte du panneau de citations ou un filtrage de documents, et gardez-la identique dans toutes les exécutions.

Outils

  • Claude Code ou Codex
  • Git
  • Node.js + Electron

Mécanisme de harness

Auto-vérification + Q&A fondé sur des sources + finalisation basée sur des preuves