Türkçe Referans
Bu notlar, şablonları gevşek bir dosya yığını olarak değil, çalışan bir harness olarak nasıl kullanacağınızı açıklar.
İç Referans Notları
method-map.md: yaygın uzun süreli hata modlarını önce hangi dosyanın veya politikanın çözdüğüne haritalayıninitializer-agent-playbook.md: başlatıcı ajanın özellik işine başlamadan önce geride bırakması gerekenlercoding-agent-startup-flow.md: daha sonraki kod yazma turları için sabit oturum başlatma akışıprompt-calibration.md: kök talimatları, şişkin ve kırılgan hale getirmeden nasıl keskin tutacağınız
Birincil Makaleler
Bu liste bilinçli olarak dardır. Harness, modelin etrafındaki yürütme sistemi anlamına gelir: ajan döngüsü, araç yürütme, sandbox, durum, bağlam, doğrulama, sonlandırma, orkestrasyon ve gözlemlenebilirlik. Genel prompt mühendisliği veya geniş ajan çerçevesi makaleleri birincil listeye ait değildir.
Orijinal üç makale kursun belkemiği olmaya devam etmektedir:
- OpenAI: Harness engineering: leveraging Codex in an agent-first world (2026-02-11): ajan öncelikli depolar, depo yerel bağlam, özel linting ve yapısal korkuluklar.
- Anthropic: Effective harnesses for long-running agents (2025-11-26): başlatıcı ajan, kod yazma ajanı, özellik listesi, ilerleme günlüğü ve bağlam pencereleri arasında devir.
- Anthropic: Harness design for long-running application development (2026-03-24): planlayıcı / üretici / değerlendirici rolleri, bağlam sıfırlamaları, harness sadeleştirme ve eskimiş varsayımlar.
Yalnızca birkaç son derece alakalı 2026 makalesi eklenmiştir:
- OpenAI: Unrolling the Codex agent loop (2026-01-23): Codex runtime harness'ı, araç çağrıları, bağlam büyümesi ve döngü sonlandırma.
- Anthropic: Demystifying evals for AI agents (2026-01-09): modeli ve harness'ı birlikte değerlendirmek ve değerlendirme harness'larını ajan harness'larından ayırmak.
- LangChain: Improving Deep Agents with harness engineering (2026-02-17): modeli sabit tutarken bir kod yazma ajanını Terminal Bench 2.0'da İlk 30'dan İlk 5'e taşımak için sistem promptlarını, araçları, ara katmanları, izlemeyi ve öz-doğrulamayı iyileştirme.
- Thoughtworks / Martin Fowler: Harness engineering for coding agent users (2026-04-02): deterministik ve çıkarımsal kontrollerle ileri besleme kılavuzları ve geri bildirim sensörleri olarak kod yazma ajanı kullanıcı harness'ları.
- Cursor: Continually improving our agent harness (2026-04-30): harness'ı çevrimdışı değerlendirmeler, çevrimiçi metrikler, araç hatası taksonomisi, modele özgü ayarlama ve sohbet ortası model değişimi ile sürekli iyileştirilen bir ürün sistemi olarak ele almak.
2026 Genişletilmiş Referanslar
Bunlar temel kurs kaynakları değildir, ancak belirli harness modüllerini tasarlarken faydalıdır. Bu bölüm yalnızca, içeriği doğrudan ajan döngüsü, araç yürütme, bağlam yönetimi, doğrulama, sandbox, kontrol katmanları veya regresyon yönetişimini kapsayan kaynakları tutar. Saf ajan ürünleri, platform duyuruları, ekip vaka çalışmaları ve karşılaştırma testleri hariçtir.
- OpenAI: Unlocking the Codex harness: how we built the App Server (2026-02-04): iş parçacığı yaşam döngüsü, devam, çatallama, diff'ler ve istemci entegrasyonları içeren yeniden kullanılabilir bir App Server protokolü olarak harness.
- OpenAI Developers: Run long horizon tasks with Codex (2026-02-23): uzun süreli görevler için kalıcı proje hafızası, kilometre taşı doğrulaması ve "ne zaman bitti" örnekleri.
- OpenAI: The next evolution of the Agents SDK (2026-04-15): model-yerel harness'lar, sandbox yürütme ve dosya/komut yürütme.
- OpenAI: An open-source spec for Codex orchestration: Symphony (2026-04-27): bir konu takipçisini veya Linear panosunu çok ajanlı bir kontrol düzlemine dönüştürmek.
- Anthropic: Building a C compiler with a team of parallel Claudes (2026-02-05): paralel ajan ekipleri, görev kilitleri, git senkronizasyonu, konteyner yalıtımı ve otonom döngüler.
- Anthropic: Scaling Managed Agents: Decoupling the brain from the hands (2026-04-08): oturum, harness ve sandbox'ı değiştirilebilir arayüzler olarak ayıran meta-harness görünümü.
- Anthropic: An update on recent Claude Code quality reports (2026-04-23): regresyon yönetişimi gerektiren harness değişiklikleri olarak akıl yürütme çabası, bağlam budama ve sistem promptları.
- LangChain: Context Management for Deep Agents (2026-01-28): bağlam yönetimi harness'ları için dosya sistemi aktarımı, araç çağrısı kısaltma, özetleme ve hedefli değerlendirmeler.
- LangChain: Tuning Deep Agents to Work Well with Different Models (2026-04-29): promptlar, araç adları, ara katmanlar ve alt-ajan yapılandırması için modele özgü harness profilleri.
- LangChain: Continual learning for AI agents (2026-04-05): izlemelerle beslenen ajan iyileştirmesini model, harness ve bağlam katmanlarına ayırmak.
- Microsoft: Agent Harness in Agent Framework (2026-03-12): shell/dosya sistemi harness'ları, onay akışı, barındırılan shell yürütme ve bağlam yoğunlaştırma.
- Google: Announcing ADK for Java 1.0.0 (2026-03-30): yeniden kullanılabilir harness ilkelleri olarak eklentiler, olay yoğunlaştırma, HITL, oturum/hafıza hizmetleri ve A2A.
- GitHub: Automate repository tasks with GitHub Agentic Workflows (2026-02-13): güvenli çıktılar, sandbox, izinler ve inceleme ile ajan iş akışı çalıştırıcısı olarak GitHub Actions.
- AWS: AI agents in enterprises: Best practices with Amazon Bedrock AgentCore (2026-02-03): Runtime, Memory, Gateway, Identity/Policy, Observability ve Evaluations boyunca kurumsal harness katmanları.
- Stripe: Minions: Stripe's one-shot, end-to-end coding agents (2026-02-09) ve Part 2 (2026-02-19): devbox yalıtımı, özel ajan harness'ları, blueprint durum makineleri, kural dosyaları, MCP araç küratörlüğü, güvenlik kontrolleri ve pre-push/CI geri bildirim döngüleri.
- Cognition: What We Learned Building Cloud Agents (2026-04-23): bulut-ajan runtime'ları için VM yalıtımı, oturum anlık görüntüsü/devam, orkestrasyon, yönetişim, denetim günlüğü ve entegrasyonlar.
- Cognition: Multi-Agents: What's Actually Working (2026-04-22): üretici-doğrulayıcı döngüleri, temiz bağlamlı inceleyiciler, akıllı arkadaş yönlendirmesi, yönetici-alt koordinasyonu ve ajanlar arası iletişim sınırları.
- Replit: Decision-Time Guidance: Keeping Replit Agent Reliable (2026-01-20, güncelleme 2026-01-23): tüm kuralları sistem promptuna doldurmak yerine, karar noktasında kısa durumsal rehberlik enjekte eden hafif bir sınıflandırıcı.
- Vercel: How we made v0 an effective coding agent (2026-01-07): dinamik sistem promptları, akıcı bir yeniden yazma katmanı ve deterministik/model güdümlü otomatik düzelticiler.
- Vercel: Introducing deepsec (2026-05-04): tarama, soruşturma, yeniden doğrulama, zenginleştirme, dışa aktarma, eklenti ve reddetme denetleyici adımları içeren güvenlik odaklı bir kod yazma ajanı harness'ı.
- Sourcegraph: CodeScaleBench (2026-03-03): MCP araç benimsemesi, araç kullanım transkriptleri, kıyaslama QA, doğrulayıcı/yeniden üretilebilirlik kapıları ve prompt/önsöz yinelemesi içeren bir değerlendirme/araçlar harness referansı.
Yalnızca 2025'e ait genel referanslar birincil listeden çıkarılmıştır. Orijinal 2025 Anthropic harness makalesi, kursun temel kaynağı olduğu için kalmıştır.
Önerilen Okuma Sırası
method-map.mdinitializer-agent-playbook.mdcoding-agent-startup-flow.mdprompt-calibration.md- OpenAI Harness engineering
- Anthropic Effective harnesses
- Anthropic Harness design for long-running application development
- OpenAI Codex agent loop
- Anthropic agent evals
- LangChain Improving Deep Agents
- Thoughtworks / Martin Fowler Harness engineering for coding agent users
- Cursor Continually improving our agent harness