跳到主要內容
Lab Grimoire
TW EN
請喝咖啡
CLAUDE.md 寫好這 12 條,AI 出錯率砍掉 7 成
回到文章總覽
by CY

CLAUDE.md 寫好這 12 條,AI 出錯率砍掉 7 成


CLAUDE.md 寫好這 12 條,AI 出錯率砍掉 7 成

TL;DR

AI 助手老是搞錯你的意思?問題可能不在 AI,而在你沒給它一份好的「行為守則」。Karpathy 在 30 個程式庫實測 6 週,證明只要在 CLAUDE.md 寫對 12 條規則,錯誤率能從 41% 壓到 3%。本文帶你拆解這套方法,不會寫程式也能學會。


你的 AI 不是笨,是沒憲法

很多人第一次用 AI 編程助手的體驗都差不多:請它改一行程式碼,結果它把整個檔案重寫;請它修一個小問題,它順手「幫你」改了十幾個不相干的地方。你氣得在對話框裡打出一堆大寫字母,但下次它照樣犯。

問題出在哪?想像一下,你新請了一位實習生。你沒告訴他公司的 coding style、專案慣例、哪些檔案絕對不能碰。他不是不認真,而是根本不知道規矩。CLAUDE.md 就是你寫給 AI 助手的那份「公司守則」,更精確地說,它是 AI 行為的憲法。

Karpathy(前 Tesla AI 總監)最早提出了 4 條基本規則,光是這樣就把錯誤率從 41% 砍到 11%。後來有開發者在 30 個不同的 codebase 上花了 6 週反覆驗證,再追加 8 條規則,錯誤率進一步壓到 3%。從快一半出錯,到幾乎零失誤,差別就在那份 CLAUDE.md。

Error rate reduction: 41% to 11% to 3%


12 條規則拆解:從「態度」到「機制」

前 4 條是 Karpathy 的原始配方,定義 AI 的工作態度:

  1. 思考先行:動手之前先分析問題,不要急著吐程式碼。
  2. 簡潔優先:能改一行就不要改十行。
  3. 外科手術式修改:只碰該碰的地方,其餘一律不動。
  4. 目標驅動:每次修改都要對應一個明確的目的,不做「順便改一下」的事。

這 4 條聽起來像常識,但 AI 的預設行為恰好相反。它被訓練成「盡可能多做事來展現能力」,所以你必須明確告訴它:少即是多。

後 8 條是實戰中長出來的機制設計,解決更深層的問題:

  1. 模型只做判斷,不做確定性邏輯:數學計算、精確比對這類工作,交給程式碼處理,別讓 AI 用「猜」的。
  2. Token 預算硬上限:限制 AI 單次回應的長度,避免它自嗨寫出一篇論文。
  3. 衝突不取平均:當兩條規則打架時,選一邊站,不要和稀泥。
  4. 寫前先讀:修改任何檔案之前,必須先讀完現有內容。
  5. 測試驗證意圖:改完之後跑測試,確認結果符合原本的設計目的。
  6. 多步驟需檢查點:複雜任務拆成小段,每段做完都要回報。
  7. 遵循既有慣例:專案裡已經有的風格和模式,照著走就對了。
  8. 失敗要大聲:遇到做不到的事,立刻說出來,不要默默瞎猜。

12 Rules Framework: Attitude Layer vs Mechanism Layer


少即是多:200 行懸崖

這套方法有個致命的陷阱。許多人嚐到甜頭後,開始瘋狂往 CLAUDE.md 裡堆規則,結果適得其反。

實測資料顯示,當 CLAUDE.md 超過 200 行,AI 的合規率會急劇下降。原因很直覺:塞太多指令,AI 的注意力被稀釋,反而記不住哪些才是真正重要的。

The 200-Line Cliff: AI compliance drops sharply after 200 lines

另一個常見錯誤是放太多「範例」。範例比規則佔用更多 token,而且容易讓 AI 過度擬合特定情境,碰到新狀況反而不知變通。

另一個被忽略的真相:告訴 AI「你是一位資深工程師」完全沒用。角色扮演不會改變模型的行為模式,真正有效的是具體的行為指令。

學術研究者其實特別適合這套思維。有人提出用「巢狀 CLAUDE.md」的概念來管理長期研究專案:最頂層的 CLAUDE.md 像憲法,定義跨專案通用的規矩;每個子資料夾裡的 CLAUDE.md 則像地方法規,處理特定任務的細節。這樣既維持整體一致性,又不會讓單一檔案膨脹到失控。


不寫程式的你,也能帶走的 3 件事

就算你從來沒用過 Claude Code,這 12 條規則背後的思維框架,對任何需要「指揮 AI 做事」的人都有價值:

  1. 寫「守則」而非「許願」:把你的需求寫成明確的行為規範,而不是模糊的期望。「幫我寫一篇好文章」遠不如「用台灣繁體中文、800 字以內、每段開頭要有小標題」。

  2. 少量精準勝過大量模糊:與其列 30 條注意事項,不如挑出最重要的 5 條,並標明優先順序。AI 和人一樣,指令太多就會選擇性遺忘。

  3. 要求 AI 主動回報失敗:在你的提示裡加上「如果有任何不確定的地方,請直接告訴我,不要猜測」。這一條就能擋掉大量無聲的錯誤。

AI 不是讀心術士,它是一個需要明確規則的協作者。你給它的守則越精準,它回報你的成果就越可靠。


本文整理自 Karpathy 原始規則及社群 30 個 codebase 的 6 週實測資料。

常見問題

CLAUDE.md 是什麼?不會寫程式也能用嗎?

CLAUDE.md 是一份純文字檔案,放在專案的根目錄下,用來告訴 AI 助手「你在這個專案裡該怎麼做事」。它不是程式碼,不需要任何語法知識,本質上就是一份行為守則清單。 你可以把它想成公司新人訓練手冊:裡面寫的是「修改檔案前先讀完原始內容」「遇到不確定的地方要主動回報」這類自然語言的規矩。任何人只要會打字、會條列清單,就能寫出有效的 CLAUDE.md。 對於非工程背景的學術研究者,已有社群文章(Claude Code 102 for Academic Researchers)示範如何用 CLAUDE.md 管理論文寫作、資料分析等工作流程,門檻相當低。 ---

規則寫越多,AI 就越聽話嗎?

恰好相反。實測資料明確顯示,CLAUDE.md 超過 200 行之後,AI 的合規率會急劇下降。 原因在於 AI 模型的注意力機制有其極限。當指令量超過一定門檻,模型無法同時追蹤所有規則,開始選擇性忽略。就像你給員工一份 50 頁的 SOP,他大概只會記得前三頁和最後一頁。 更隱蔽的陷阱是「範例過多」。很多人喜歡在 CLAUDE.md 裡附上大量範例來解釋規則,但範例比規則佔用更多 token(AI 的注意力資源),而且會導致過度擬合:AI 完美複製你的範例情境,但碰到稍有不同的新狀況就不知變通。 最佳實踐是: - 核心規則控制在 12-15 條以內 - 每條規則用一句話說清楚 - 範例只在極度必要時附上,且每條規則最多一個 - 如果專案龐大,使用巢狀 CLAUDE.md(頂層憲法 + 子資料夾區域法規) ---

這 12 條規則只適用於 Claude 嗎?

規則的具體語法(放在 CLAUDE.md 檔案裡)確實是 Claude Code 的機制。但這 12 條規則背後的思維框架,適用於所有 AI 助手。 核心邏輯是:AI 的預設行為傾向「多做」而非「精準做」,因此你需要用明確的行為指令來約束它。這個原則不因模型品牌而改變。 舉例來說: - **「先讀再寫」**(Rule 8):在 ChatGPT 裡,你可以要求「在修改之前,請先完整引用你要修改的段落,確認你理解了原文」。 - **「失敗要大聲」**(Rule 12):在任何 AI 對話中加上「如果有任何不確定的地方,請直接告訴我,不要猜測」,都能顯著減少無聲錯誤。 - **「衝突不取平均」**(Rule 7):當你給 AI 多重指令且彼此矛盾時,明確告訴它「當兩條規則衝突,以第一條為準」。 無論你用的是 ChatGPT、GitHub Copilot、Gemini 還是其他工具,這套「寫守則而非許願」的思維都能提升你與 AI 協作的品質。差別只在於每個工具載入規則的方式不同(有的用 system prompt、有的用設定檔、有的用專案文件)。

覺得這篇有幫助?

追蹤以收到新的 AI × 生醫研究筆記:

或請我喝杯咖啡,讓新內容持續產出。

☕ 請我喝杯咖啡