Inglizcha maʼlumotnomalar (English Reference)
Ushbu qaydlar andozalardan shunchaki tarqoq fayllar toʻplami emas, balki toʻliq ishlaydigan harness sifatida qanday foydalanish kerakligini tushuntiradi.
Ichki maʼlumotnoma qaydlari (Internal Reference Notes)
method-map.md: koʻp uchraydigan uzoq davom etadigan muvaffaqiyatsizlik rejimlari (failure modes) ni birinchi boʻlib hal qiladigan artefakt yoki siyosat bilan bogʻlaydi.initializer-agent-playbook.md: inisializatsiya agenti funksiya (feature) ishini boshlashdan oldin nimalarni yozib qoldirishi kerak.coding-agent-startup-flow.md: kod yozuvchi (coding) agentlarning keyingi ishga tushishlari uchun belgilangan (fixed) sessiya boshlash oqimi.prompt-calibration.md: asosiy (root) yoʻriqnomalarni ularni ortiqcha shishib yoki moʻrt boʻlib ketishiga yoʻl qoʻymasdan qanday qilib aniq va foydali saqlash usullari.
Asosiy maqolalar
Bu roʻyxat ataylab qisqa tutilgan. Harness bu model atrofidagi ishlash tizimi (execution system) degani: agent sikli (loop), vositalarni ishlatish (tool execution), izolyatsiya (sandboxing), holat (state), kontekst, tekshiruv (verification), yakunlash (termination), orkestratsiya va kuzatuvchanlik (observability). Umumiy prompt muhandisligi yoki keng agent-freymvork maqolalari asosiy roʻyxatga kirmaydi.
Dastlabki uchta maqola kursning tayanchi boʻlib qoladi:
- OpenAI: Harness engineering: leveraging Codex in an agent-first world (2026-02-11): agent-first repozitoriylar, repo-lokal kontekst, maxsus linting va strukturaviy himoya toʻsiqlari (guardrails).
- Anthropic: Effective harnesses for long-running agents (2025-11-26): inisializatsiya agenti, kod yozuvchi agent, funksiyalar roʻyxati (feature list), jarayon jurnali (progress log) va kontekst oynalari oʻrtasida ishlarni topshirish (handoff).
- Anthropic: Harness design for long-running application development (2026-03-24): rejalashtiruvchi (planner) / yaratuvchi (generator) / baholovchi (evaluator) rollari, kontekstni qayta ishga tushirish (resets), harnessʼni soddalashtirish va eskirgan taxminlar.
Faqatgina juda aloqador boʻlgan bir nechta 2026-yilgi maqolalar qoʻshilgan:
- OpenAI: Unrolling the Codex agent loop (2026-01-23): Codex runtime harness, vosita (tool) chaqiruvlari, kontekstning oʻsishi va siklning yakunlanishi (loop termination).
- Anthropic: Demystifying evals for AI agents (2026-01-09): modelni va harnessʼni birgalikda baholash (evaluating), hamda evaluation harnessʼlarni agent harnessʼlaridan farqlash.
- LangChain: Improving Deep Agents with harness engineering (2026-02-17): kod yozuvchi agentni Terminal Bench 2.0 da Top 30 dan Top 5 ga koʻtarish uchun modelni oʻzgartirmasdan, tizim promptlari, vositalar, middleware, treysing va oʻz-oʻzini tekshirishni (self-verification) yaxshilash.
- Thoughtworks / Martin Fowler: Harness engineering for coding agent users (2026-04-02): kod yozuvchi agent foydalanuvchilarining harnessʼlari feedforward yoʻriqnomalar va feedback datchiklari sifatida (deterministik va inferensial nazoratlar bilan).
- Cursor: Continually improving our agent harness (2026-04-30): harnessʼga offline evals, onlayn metrikalar, tool-error taksonomiyasi, modelga xos sozlashlar (tuning) va suhbat oʻrtasida modelni almashtirish (mid-chat switching) orqali doimiy takomillashib boruvchi mahsulot tizimi sifatida qarash.
2026-yildagi Qoʻshimcha Manbalar (Extended References)
Bular kursning asosiy manbalari emas, biroq maxsus harness modullarini loyihalashda juda foydali boʻlishi mumkin. Ushbu boʻlimda faqat asosiy matni bevosita agent sikli, vosita ishlatish, kontekstni boshqarish, tekshiruv, izolyatsiya, boshqaruv qatlamlari yoki regressiyani boshqarish (regression governance) ni qamrab olgan manbalargina saqlangan. Sof agent mahsulotlari, platforma eʼlonlari, jamoaviy case studyʼlar va benchmarklar kiritilmagan.
- OpenAI: Unlocking the Codex harness: how we built the App Server (2026-02-04): harness qayta foydalanish mumkin boʻlgan App Server protokoli sifatida (tred yashash davri, resume, fork, diffs va mijoz integratsiyalari bilan).
- OpenAI Developers: Run long horizon tasks with Codex (2026-02-23): uzoq davom etadigan vazifalar uchun doimiy (durable) loyiha xotirasi, bosqichlarni (milestone) validatsiya qilish va “done-when” misollari.
- OpenAI: The next evolution of the Agents SDK (2026-04-15): modelga xos boʻlgan (model-native) harnessʼlar, sandboxʼda ishga tushirish (sandbox execution) hamda fayl/buyruq ishlashi.
- OpenAI: An open-source spec for Codex orchestration: Symphony (2026-04-27): muammolar treykerini (issue tracker) yoki Linear doskasini koʻp agentli boshqaruv paneliga (control plane) aylantirish.
- Anthropic: Building a C compiler with a team of parallel Claudes (2026-02-05): parallel agentlar jamoalari, vazifa qulflari (task locks), git sinxronizatsiyasi, konteyner izolyatsiyasi va avtonom sikllar.
- Anthropic: Scaling Managed Agents: Decoupling the brain from the hands (2026-04-08): sessiya, harness va sandboxʼni almashtirsa boʻladigan (swappable) interfeyslar sifatida ajratuvchi meta-harness qarashi.
- Anthropic: An update on recent Claude Code quality reports (2026-04-23): mantiqiy fikrlash kuchi, kontekstni tozalash (pruning) va tizim promptlari, regressiyani nazorat qilishni talab qiluvchi harness oʻzgarishlari sifatida.
- LangChain: Context Management for Deep Agents (2026-01-28): kontekstni fayl tizimiga oʻtkazish (offloading), tool-call qisqartirish, xulosalash (summarization) va kontekstni boshqarish harnessʼlari uchun maqsadli evalʼlar.
- LangChain: Tuning Deep Agents to Work Well with Different Models (2026-04-29): promptlar, vosita nomlari, middleware va sub-agent konfiguratsiyasi uchun modelga xos harness profillari.
- LangChain: Continual learning for AI agents (2026-04-05): agentni takomillashtirishni model, harness va kontekst qatlamlariga boʻlish (treyslar orqali quvvatlanadi).
- Microsoft: Agent Harness in Agent Framework (2026-03-12): shell/filesystem harnessʼlari, tasdiqlash oqimi (approval flow), boshqariluvchi shell ijrosi va kontekst zichlash (compaction).
- Google: Announcing ADK for Java 1.0.0 (2026-03-30): qayta ishlatiladigan harness primitivlari sifatida plaginlar, hodisa zichlash (event compaction), HITL, sessiya/xotira xizmatlari va A2A.
- GitHub: Automate repository tasks with GitHub Agentic Workflows (2026-02-13): GitHub Actions xavfsiz chiqishlar (outputs), izolyatsiya (sandboxing), ruxsatlar (permissions) va tekshirishlar (review) ga ega agentik jarayon (workflow) ishlatuvchisi sifatida.
- AWS: AI agents in enterprises: Best practices with Amazon Bedrock AgentCore (2026-02-03): Runtime, Xotira, Gateway, Identifikatsiya/Siyosat, Kuzatuvchanlik va Baholash (Evaluations) boʻyicha korporativ harness qatlamlari.
- Stripe: Minions: Stripeʼs one-shot, end-to-end coding agents (2026-02-09) va Part 2 (2026-02-19): devbox izolyatsiyasi, maxsus agent harnessʼlari, blueprint holat mashinalari, qoidalar fayllari, MCP vositalari nazorati, xavfsizlik tekshiruvlari va pre-push/CI qayta aloqa sikllari.
- Cognition: What We Learned Building Cloud Agents (2026-04-23): VM izolyatsiyasi, sessiya snapshot/resume, orkestratsiya, boshqaruv (governance), audit loglari va cloud-agent runtimeʼlari uchun integratsiyalar.
- Cognition: Multi-Agents: Whatʼs Actually Working (2026-04-22): generator-verifier sikllari, toza-kontekst (clean-context) tekshiruvchilari, aqlli-doʻst (smart-friend) yoʻnaltiruvchilari, menejer-xodim muvofiqlashtirishi va agentlararo aloqa chegaralari.
- Replit: Decision-Time Guidance: Keeping Replit Agent Reliable (2026-01-20, yangilangan 2026-01-23): barcha qoidalarni tizim promptiga tiqish oʻrniga, yengil klassifikator qaror qabul qilish nuqtasida qisqa vaziyatga qarab (situational) yoʻriqnoma kiritadi.
- Vercel: How we made v0 an effective coding agent (2026-01-07): dinamik tizim promptlari, streaming rewrite qatlami hamda deterministik/model asosidagi avto-toʻgʻrilagichlar (autofixers).
- Vercel: Introducing deepsec (2026-05-04): skanerlash, tekshirish (investigate), qayta validatsiya (revalidate), boyitish (enrich), eksport, plagin va rad etishni tekshirish (refusal-checker) qadamlari bilan xavfsizlikka qaratilgan kod yozuvchi agent harnessʼi.
- Sourcegraph: CodeScaleBench (2026-03-03): MCP vositalarini oʻzlashtirish, tool-use transkriptlari, benchmark QA, tekshiruvchi (verifier)/qayta ishlab chiqaruvchanlik eshiklari va prompt/muqaddima iteratsiyalarini qamrab oluvchi eval/vosita harnessʼi boʻyicha maʼlumotnoma.
Faqatgina 2025-yilga oid umumiy manbalar asosiy roʻyxatdan chiqarildi. Dastlabki 2025 Anthropic harness maqolasi kursning asosiy manbasi boʻlgani uchungina qoldirildi.
Oʻqish boʻyicha tavsiya etilgan ketma-ketlik
method-map.mdinitializer-agent-playbook.mdcoding-agent-startup-flow.mdprompt-calibration.md- OpenAI Harness engineering
- Anthropic Effective harnesses
- Anthropic Harness design for long-running application development
- OpenAI Codex agent loop
- Anthropic agent evals
- LangChain Improving Deep Agents
- Thoughtworks / Martin Fowler Harness engineering for coding agent users
- Cursor Continually improving our agent harness