Skip to content

中文参考

这一部分解释这些模板该怎么配合使用,而不是把它们当成一堆孤立文件。

内部参考材料

重点参考文章

这里的筛选标准很窄:只保留能直接解释 harness 机制的文章。Harness 在这里指模型外部的运行系统,包括 agent loop、工具执行、沙箱、状态、上下文、验证、终止条件、控制平面和观测反馈;不是泛泛的 prompt engineering 或 agent 框架介绍。

保留原始三篇作为课程主轴:

额外只加入几篇高相关、高含金量的 2026 文章:

2026 扩展参考

这些文章不作为课程主轴,但在设计特定 harness 模块时很有借鉴价值。只保留文章正文直接涉及 agent loop、工具执行、上下文管理、验证、沙箱、控制层、回归治理等机制的材料;纯 agent 产品、平台发布、团队实践或 benchmark 不放进这里。

严格按时间筛选时,2025-only 的泛参考不进入主列表。原始三篇中的 Anthropic 2025 文章保留,是因为它是本课程方法的基础来源。

推荐阅读顺序

  1. method-map.md
  2. initializer-agent-playbook.md
  3. coding-agent-startup-flow.md
  4. prompt-calibration.md
  5. OpenAI Harness engineering
  6. Anthropic Effective harnesses
  7. Anthropic Harness design for long-running application development
  8. OpenAI Codex agent loop
  9. Anthropic agent evals
  10. LangChain Improving Deep Agents
  11. Thoughtworks / Martin Fowler Harness engineering for coding agent users
  12. Cursor Continually improving our agent harness