Skip to content

中文版本 →

関連講義: 講義 09. エージェントの早すぎる完了宣言を止める · 講義 10. フルパイプライン実行だけが本当の検証である テンプレートファイル: templates/

プロジェクト 05. エージェントに自分の作業を検証させる

やること

役割分離を実装します。実装する generator、レビューする evaluator、必要に応じて planner を用意します。役割を追加するたびに効果を測るため、3 回実行します。

複数ターン会話、引用パネルの再設計、ドキュメントフィルタリングなど、実質的な機能改善を 1 つ選び、すべての実行で同じ対象を使います。

ツール

  • Claude Code または Codex
  • Git
  • Node.js + Electron

Harness メカニズム

自己検証 + 根拠付き Q&A + 証拠に基づく完了判定