Skip to content

English version →

Tegishli maʼruzalar: 11-maʼruza. Agent ishining runtimeʼda kuzatilishini taʼminlang · 12-maʼruza. Har bir sessiya yakunida toza holat qoldiring Andoza fayllari: templates/

Loyiha 06. Toʻliq agent harnessʼini quring (Capstone)

Nima qilasiz

Bu capstone (yakunlovchi) loyihadir. Dastlabki beshta loyihada oʻrganilgan barcha narsalarni bir joyga toʻplang, toʻliq benchmark ishlating, soʻngra sifatni barqaror ushlab turish mumkinligini isbotlash uchun tozalash (cleanup) bosqichini amalga oshiring.

Toʻliq mahsulot boʻlagini (product slice) qamrab oladigan qatʼiy koʻp funksiyali (multi-feature) vazifalar toʻplamidan foydalaning: hujjatni import qilish, indekslash, iqtiboslarga asoslangan Q&A, runtime kuzatuvchanligi va oʻqish mumkin boʻlgan qayta ishga tushiriladigan (restartable) repo holati. Avval kuchsiz asosiy (baseline) harness bilan ishga tushiring, soʻngra oʻzingizning eng kuchli harnessʼingiz bilan, oxirida esa tozalash qilib, qayta ishlating. Va nihoyat, harnessʼda ablasyon (ablation) tajribasini oʻtkazing — har bir komponentni bittadan olib tashlang va haqiqatda qaysi biri muhim ekanligini aniqlang.

Vositalar

  • Claude Code yoki Codex
  • Git
  • Node.js + Electron
  • Sifat hujjati andozasi (Quality document template)
  • Baholovchi rubrikasi (Evaluator rubric)
  • Dastlabki beshta loyihada toʻplangan barcha harness komponentlari

Harness mexanizmi

Toʻliq harness: barcha mexanizmlar + kuzatuvchanlik (observability) + ablasyon oʻrganish (ablation study)