Довідник
Ці нотатки пояснюють, як використовувати шаблони як повноцінний harness, а не просто набір розрізнених файлів.
Внутрішні довідкові нотатки
method-map.md: відображення поширених режимів збою при тривалій роботі на артефакт або політику, що усуває їх у першу чергуinitializer-agent-playbook.md: що ініціалізатор повинен залишити після себе до початку роботи над функціямиcoding-agent-startup-flow.md: фіксований процес запуску сесії для подальших сесій кодуванняprompt-calibration.md: як підтримувати кореневі інструкції чіткими без перевантаження та крихкості
Основні статті
Цей список навмисно вузький. Harness означає систему виконання навколо моделі: цикл агента, виконання інструментів, ізоляцію, стан, контекст, верифікацію, завершення, оркестрацію та спостережуваність. Загальні статті про prompt-інженерію або широкі фреймворки агентів до основного списку не включаються.
Три оригінальні статті залишаються основою курсу:
- OpenAI: Harness engineering: leveraging Codex in an agent-first world (2026-02-11): репозиторії з пріоритетом агентів, локальний контекст репозиторію, власний лінтинг та структурні запобіжники.
- Anthropic: Effective harnesses for long-running agents (2025-11-26): агент-ініціалізатор, агент кодування, список функцій, журнал прогресу та передача між контекстними вікнами.
- Anthropic: Harness design for long-running application development (2026-03-24): ролі планувальника / генератора / оцінювача, скидання контексту, спрощення harness та застарілі припущення.
Додано лише кілька вкрай актуальних статей 2026 року:
- OpenAI: Unrolling the Codex agent loop (2026-01-23): harness runtime Codex, виклики інструментів, зростання контексту та завершення циклу.
- Anthropic: Demystifying evals for AI agents (2026-01-09): спільна оцінка моделі та harness, розмежування harness оцінювання та harness агента.
- LangChain: Improving Deep Agents with harness engineering (2026-02-17): фіксація моделі при покращенні системних підказок, інструментів, middleware, трасування та самоверифікації для переміщення агента кодування з Топ-30 у Топ-5 на Terminal Bench 2.0.
- Thoughtworks / Martin Fowler: Harness engineering for coding agent users (2026-04-02): harness для користувачів агентів кодування як випереджувальні напрямники та зворотні датчики, з детермінованими та інференційними засобами управління.
- Cursor: Continually improving our agent harness (2026-04-30): harness як безперервно вдосконалюваний продукт з офлайн-оцінками, онлайн-метриками, таксономією помилок інструментів, налаштуванням під конкретні моделі та перемиканням моделей під час чату.
Розширені посилання 2026 року
Це не основні джерела курсу, але вони корисні при проектуванні конкретних модулів harness. Цей розділ містить лише джерела, тіло яких безпосередньо охоплює цикл агента, виконання інструментів, управління контекстом, верифікацію, ізоляцію, рівні управління або регресійне управління. Суто агентні продукти, оголошення платформ, кейси команд та тести продуктивності виключаються.
- OpenAI: Unlocking the Codex harness: how we built the App Server (2026-02-04): harness як протокол App Server для повторного використання з lifecycle потоку, відновленням, форком, дифами та клієнтськими інтеграціями.
- OpenAI Developers: Run long horizon tasks with Codex (2026-02-23): довгострокова пам'ять проекту, валідація проміжних результатів та приклади умов завершення для тривалих задач.
- OpenAI: The next evolution of the Agents SDK (2026-04-15): нативні для моделі harness, виконання в пісочниці та виконання файлів/команд.
- OpenAI: An open-source spec for Codex orchestration: Symphony (2026-04-27): перетворення трекера задач або дошки Linear на площину управління мультиагентами.
- Anthropic: Building a C compiler with a team of parallel Claudes (2026-02-05): паралельні команди агентів, блокування задач, синхронізація git, ізоляція контейнерів та автономні цикли.
- Anthropic: Scaling Managed Agents: Decoupling the brain from the hands (2026-04-08): погляд на мета-harness, що розділяє сесію, harness та пісочницю як замінні інтерфейси.
- Anthropic: An update on recent Claude Code quality reports (2026-04-23): зусилля на міркування, скорочення контексту та системні підказки як зміни harness, що потребують регресійного управління.
- LangChain: Context Management for Deep Agents (2026-01-28): вивантаження у файлову систему, скорочення викликів інструментів, резюмування та цільові оцінки для harness управління контекстом.
- LangChain: Tuning Deep Agents to Work Well with Different Models (2026-04-29): профілі harness для конкретних моделей щодо підказок, назв інструментів, middleware та конфігурації підагентів.
- LangChain: Continual learning for AI agents (2026-04-05): розподіл вдосконалення агента на рівні моделі, harness та контексту на основі трасувань.
- Microsoft: Agent Harness in Agent Framework (2026-03-12): harness оболонки/файлової системи, процес затвердження, виконання оболонки на хості та ущільнення контексту.
- Google: Announcing ADK for Java 1.0.0 (2026-03-30): плагіни, ущільнення подій, HITL, сервіси сесій/пам'яті та A2A як примітиви harness для повторного використання.
- GitHub: Automate repository tasks with GitHub Agentic Workflows (2026-02-13): GitHub Actions як виконавець агентних робочих процесів із захищеними виводами, ізоляцією, дозволами та перевіркою.
- AWS: AI agents in enterprises: Best practices with Amazon Bedrock AgentCore (2026-02-03): enterprise-рівні harness для Runtime, Memory, Gateway, Identity/Policy, Observability та Evaluations.
- Stripe: Minions: Stripe's one-shot, end-to-end coding agents (2026-02-09) та Частина 2 (2026-02-19): ізоляція devbox, власні harness агентів, машини станів blueprint, файли правил, підбір інструментів MCP, засоби безпеки та цикли зворотного зв'язку pre-push/CI.
- Cognition: What We Learned Building Cloud Agents (2026-04-23): ізоляція ВМ, знімок/відновлення сесії, оркестрація, управління, журналювання аудиту та інтеграції для runtime хмарних агентів.
- Cognition: Multi-Agents: What's Actually Working (2026-04-22): цикли генератор-верифікатор, рецензенти з чистим контекстом, маршрутизація розумного помічника, координація менеджер-дочірній агент та межі міжагентної комунікації.
- Replit: Decision-Time Guidance: Keeping Replit Agent Reliable (2026-01-20, оновлено 2026-01-23): легкий класифікатор вставляє коротку ситуативну настанову в момент прийняття рішення замість завантаження всіх правил у системну підказку.
- Vercel: How we made v0 an effective coding agent (2026-01-07): динамічні системні підказки, шар потокового переписування та детерміновані/керовані моделлю автовиправники.
- Vercel: Introducing deepsec (2026-05-04): harness агента кодування з акцентом на безпеці зі кроками сканування, дослідження, повторної валідації, збагачення, експорту, плагінів та перевірки відмов.
- Sourcegraph: CodeScaleBench (2026-03-03): довідник harness оцінювання/інструментарію, що охоплює прийняття інструментів MCP, транскрипти використання інструментів, контроль якості тестів, верифікаційні/відтворювані шлюзи та ітерації підказок/преамбул.
Суто загальні посилання лише 2025 року виключені з основного списку. Оригінальна стаття Anthropic про harness 2025 року залишається, оскільки є базовим джерелом курсу.
Рекомендований порядок читання
method-map.mdinitializer-agent-playbook.mdcoding-agent-startup-flow.mdprompt-calibration.md- OpenAI Harness engineering
- Anthropic Effective harnesses
- Anthropic Harness design for long-running application development
- OpenAI Codex agent loop
- Anthropic agent evals
- LangChain Improving Deep Agents
- Thoughtworks / Martin Fowler Harness engineering for coding agent users
- Cursor Continually improving our agent harness