本篇代碼示例：code/ 實戰練習：Project 03. 讓 agent 關掉再打開還能接著幹

第六講. 讓 agent 每次工作前先初始化

你開了一個新的 agent 會話，讓它"幫我加個搜索功能"。它上來就開始改代碼——精神可嘉。改了 20 分鐘發現測試框架沒配好，又花 10 分鐘搞測試框架，然後發現數據庫遷移腳本格式不對，又折騰了一會兒。最後搜索功能倒是加了，但整個會話的效率很低——大部分時間花在了"搞清楚這個項目怎麼運作"上，而不是寫搜索功能。

更好的做法是：在讓 agent 開始幹活之前，先用一個獨立的階段把基礎環境搭好、驗證命令跑通、項目結構搞清楚。就像蓋房子——你不能邊打地基邊砌牆，不然牆砌到一半地基還沒幹，整棟樓都得推倒重來。先打地基，地基幹了，再砌牆，一氣呵成。

這節課講的就是為什麼初始化必須是獨立的階段，不能跟實現混在一起。

地基和牆：兩種完全不同的工作

初始化和實現的優化目標完全不同。實現階段的目標是：最大化已驗證功能的數量和質量。初始化階段的目標是：最大化後續所有實現的可靠性和效率。

當你把初始化和實現混在一起的時候，agent 面臨一個多目標優化問題——它要同時搭基礎設施和寫功能代碼。在沒有顯式優先級設定的情況下，agent 自然傾向於寫代碼（因為那是直接可見的產出），而犧牲基礎設施（因為它的價值只能在後續會話中體現）。這就像讓施工隊同時打地基和砌牆——他們大概率會急著砌牆，因為牆看得見、能交差。但地基沒打好的房子，後面出的問題是系統性的。

初始化生命週期

混在一起做會怎樣

最直接的問題：地基打不牢。Agent 花了 80% 的精力寫功能代碼，剩下 20% 隨便搭了點基礎設施。測試框架配了但沒驗證過，lint 規則設了但太寬鬆，進度檔案沒創建。這些缺陷在第一個會話裡不明顯（因為 agent 還記得它做了什麼），但到第二個會話就暴露了——新 agent 不知道項目怎麼跑、怎麼測、做到哪了。地基不牢，地動山搖。

更隱蔽的代價是"未驗證的累積"——在測試框架配好之前寫的功能代碼，等回頭補測試的時候可能發現設計上就有問題，早知道的話應該用不同的方式實現。就像在地基沒幹的時候就開始貼瓷磚，等發現地面不平時，瓷磚全得撬掉重來。

上下文預算也在被浪費。初始化工作（配環境、配測試、理解項目結構）消耗了大量預算，留給實際功能實現的反而不夠了。結果第一個會話只完成了一半的功能，第二個會話還得從頭理解項目。預算花在了打地基上，但地基也沒打好——兩頭都沒佔著。

最容易被忽略的是隱式假設埋下的雷。Agent 在初始化過程中做的決策（用什麼測試框架、目錄怎麼組織、依賴怎麼管理）如果不顯式記錄下來，後續會話就可能做出矛盾的選擇。第一個施工隊用的是水泥地基，第二個施工隊不知道，往上面打了木樁——地基直接裂了。

Anthropic 在他們的長運行應用開發研究中明確建議把初始化和實現分離。他們的實驗數據：使用獨立初始化階段的項目，多會話場景中的功能完成率比混合方式高 31%。關鍵是——初始化階段投入的時間在後續 3-4 個會話中就能完全收回。地基打得越紮實，上面的樓蓋得越快。

OpenAI 的 Codex harness engineering 指南也強調"倉庫作為操作記錄"的原則——第一次運行就要建立清晰的操作結構，否則每次新會話都得重新推斷項目約定。

核心概念

初始化階段：agent 生命週期中的第一個階段，不做功能實現，只建立後續所有實現階段的執行前提。輸出不是代碼，而是基礎設施。
自舉契約：一個項目能被全新 agent 會話無歧義操作的條件——能啟動、能測試、能看進度、能接手下一步。四個條件缺一不可。
冷啟動 vs 熱啟動：冷啟動是從空目錄開始，agent 要猜項目結構；熱啟動是從範本或已有項目開始，基礎設施已經就位。熱啟動的效果遠好於冷啟動——就像在有水電的工地上開工，比在荒郊野嶺從頭搞起快得多。
交接就緒性：項目在任何時刻都處於"可以被全新 agent 接手"的狀態。不需要口頭解釋，只看倉庫內容就能接著幹。
首次驗證時間：從項目開始到第一個功能點通過驗證的時間。這是衡量初始化效率的核心指標。
下游可用性：初始化質量的最佳衡量標準——後續會話不需要依賴隱式知識就能成功執行任務的比例。

怎麼做好初始化

把初始化當作一個獨立的階段來執行。 第一個會話只做初始化，不寫任何業務功能代碼。初始化的產出是：

1. 可運行的環境。 項目能啟動、依賴都裝好、沒有環境問題。地基澆好了，沒裂縫。

2. 可驗證的測試框架。 至少有一個示例測試能通過。這證明測試框架本身是配對的——就像地基上立了一根柱子，證明地基能承重。

3. 自舉契約文檔。 一個明確的文檔告訴後續會話：

markdown

# 初始化契约

## 啟動命令
- 安装依赖：`make setup`
- 啟動開發服務器：`make dev`
- 執行測試：`make test`
- 完整驗證：`make check`

## 当前狀態
- 所有依赖已安装並锁定
- 測試框架已配置（Vitest + React Testing Library）
- 示例測試通過（1/1）
- Lint 规则已配置（ESLint + Prettier）

## 專案結構
- src/ — 源程式碼
- src/components/ — React 组件
- src/api/ — API 客户端
- tests/ — 測試檔案

4. 任務分解。 把整個項目拆成有序的任務列表，每個任務有明確的驗收標準：

markdown

# 任務分解

## Task 1: 使用者認證基础
- 實作 JWT 認證中间件
- 添加登录/注册端点
- 验收標準：pytest tests/test_auth.py 全部通過

## Task 2: 使用者資料页面
- 實作使用者資料 CRUD
- 添加資料编辑表單
- 验收標準：pytest tests/test_profile.py 全部通過

## Task 3: 搜索功能
- ...

5. Git 提交作為檢查點。 初始化完成後提交一個乾淨的 checkpoint。後續所有工作都從這個 checkpoint 開始。

熱啟動策略：不要從空目錄開始。用一個項目範本（create-react-app、fastapi-template 等）預置好標準的目錄結構、依賴配置和測試框架。把通用的初始化步驟預置到範本裡，只留下項目特有的初始化工作。就像在有通水通電的工地上開工，比從荒郊野嶺開始強一萬倍。

初始化的完成條件：不是"寫了多少代碼"，而是自舉契約的四個條件都滿足了——能啟動、能測試、能看進度、能接手下一步。用這個檢查清單驗收初始化：

markdown

## 初始化验收清單
- [ ] `make setup` 從零開始能成功
- [ ] `make test` 至少有一個測試通過
- [ ] 新的 agent 會話能只看倉庫回答"怎么跑"和"怎么測"
- [ ] 任務分解檔案存在且有至少 3 個任務
- [ ] 所有内容已提交到 git

實際案例

一個 React 前端項目的兩種初始化方式對比：

混合方式（邊打地基邊砌牆）：agent 在第一個會話中同時做了項目腳手架創建和首個功能實現。會話結束時，倉庫有可運行的代碼，但：沒有顯式的啟動/測試命令文檔、沒有進度跟蹤檔案、沒有任務分解。第二個會話花了約 20 分鐘推斷項目結構、測試框架和構建流程——就像新來的施工隊看著一片工地，不知道地基打到什麼程度、水電管道走到哪了，只能一個個挖開來看。

獨立初始化（先打地基）：第一個會話只做初始化——用項目範本創建目錄結構、配置測試框架（Vitest + React Testing Library）、寫一個示例測試並驗證通過、創建自舉契約文檔和任務分解檔案、提交初始檢查點。第二個會話的重建時間不到 3 分鐘，直接從任務列表開始工作——施工隊來了，看了一眼施工圖就知道從哪裡接著幹。

整個項目週期對比：混合方式的總重建時間（跨所有會話）比獨立初始化多約 60%。獨立初始化多花的那 20 分鐘在後續會話中被成倍收回。就像地基打得紮實，上面蓋樓的效率反而更高——慢即是快。

關鍵要點

初始化和實現的優化目標不同，混在一起只會互相拖後腿。先打地基，再砌牆。
初始化的產出不是代碼，是基礎設施：可運行的環境、可驗證的測試、自舉契約、任務分解。
用"自舉契約"的四個條件驗收初始化：能啟動、能測試、能看進度、能接手下一步。
熱啟動優於冷啟動。用項目範本預置標準化的基礎設施。
初始化投入的時間會在後續 3-4 個會話中完全收回。這不是額外的成本，是前期投資——地基打得越紮實，樓蓋得越快。

練習

自舉契約設計：為一個你正在開發的項目寫一個完整的自舉契約。然後開一個全新的 agent 會話，只給它看倉庫內容（不給任何口頭上下文），讓它嘗試啟動項目、跑測試、瞭解當前進度。記錄它遇到的問題——每個問題都對應自舉契約中缺失的一個條款。
對比實驗：選一箇中等複雜度的新項目。方式 A：讓 agent 初始化和首次實現同時做。方式 B：先花一個會話做獨立初始化，第二個會話開始實現。在 4 個會話後對比：首次驗證時間、重建成本、功能完成率。
初始化驗收清單：為你的項目設計一個初始化驗收清單。讓一個全新的 agent 會話執行清單上的每一項，記錄哪些項通過了、哪些沒通過。沒通過的項就是你的 harness 需要補強的地方。

第六講. 讓 agent 每次工作前先初始化 ​

地基和牆：兩種完全不同的工作 ​

初始化生命週期 ​

混在一起做會怎樣 ​

核心概念 ​

怎麼做好初始化 ​

實際案例 ​

關鍵要點 ​

延伸閱讀 ​

練習 ​

第六講. 讓 agent 每次工作前先初始化

地基和牆：兩種完全不同的工作

初始化生命週期

混在一起做會怎樣

核心概念

怎麼做好初始化

實際案例

關鍵要點

延伸閱讀

練習