CLAUDE.md 寫好這 12 條，AI 出錯率砍掉 7 成

Q: 規則寫越多，AI 就越聽話嗎？

恰好相反。實測資料明確顯示，CLAUDE.md 超過 200 行之後，AI 的合規率會急劇下降。 原因在於 AI 模型的注意力機制有其極限。當指令量超過一定門檻，模型無法同時追蹤所有規則，開始選擇性忽略。就像你給員工一份 50 頁的 SOP，他大概只會記得前三頁和最後一頁。 更隱蔽的陷阱是「範例過多」。很多人喜歡在 CLAUDE.md 裡附上大量範例來解釋規則，但範例比規則佔用更多 token（AI 的注意力資源），而且會導致過度擬合：AI 完美複製你的範例情境，但碰到稍有不同的新狀況就不知變通。 最佳實踐是： - 核心規則控制在 12-15 條以內 - 每條規則用一句話說清楚 - 範例只在極度必要時附上，且每條規則最多一個 - 如果專案龐大，使用巢狀 CLAUDE.md（頂層憲法 + 子資料夾區域法規） ---

TL;DR

AI 助手老是搞錯你的意思？問題可能不在 AI，而在你沒給它一份好的「行為守則」。Karpathy 在 30 個程式庫實測 6 週，證明只要在 CLAUDE.md 寫對 12 條規則，錯誤率能從 41% 壓到 3%。本文帶你拆解這套方法，不會寫程式也能學會。

你的 AI 不是笨，是沒憲法

很多人第一次用 AI 編程助手的體驗都差不多：請它改一行程式碼，結果它把整個檔案重寫；請它修一個小問題，它順手「幫你」改了十幾個不相干的地方。你氣得在對話框裡打出一堆大寫字母，但下次它照樣犯。

問題出在哪？想像一下，你新請了一位實習生。你沒告訴他公司的 coding style、專案慣例、哪些檔案絕對不能碰。他不是不認真，而是根本不知道規矩。CLAUDE.md 就是你寫給 AI 助手的那份「公司守則」，更精確地說，它是 AI 行為的憲法。

Karpathy（前 Tesla AI 總監）最早提出了 4 條基本規則，光是這樣就把錯誤率從 41% 砍到 11%。後來有開發者在 30 個不同的 codebase 上花了 6 週反覆驗證，再追加 8 條規則，錯誤率進一步壓到 3%。從快一半出錯，到幾乎零失誤，差別就在那份 CLAUDE.md。

Error rate reduction: 41% to 11% to 3%

12 條規則拆解：從「態度」到「機制」

前 4 條是 Karpathy 的原始配方，定義 AI 的工作態度：

思考先行：動手之前先分析問題，不要急著吐程式碼。
簡潔優先：能改一行就不要改十行。
外科手術式修改：只碰該碰的地方，其餘一律不動。
目標驅動：每次修改都要對應一個明確的目的，不做「順便改一下」的事。

這 4 條聽起來像常識，但 AI 的預設行為恰好相反。它被訓練成「盡可能多做事來展現能力」，所以你必須明確告訴它：少即是多。

後 8 條是實戰中長出來的機制設計，解決更深層的問題：

模型只做判斷，不做確定性邏輯：數學計算、精確比對這類工作，交給程式碼處理，別讓 AI 用「猜」的。
Token 預算硬上限：限制 AI 單次回應的長度，避免它自嗨寫出一篇論文。
衝突不取平均：當兩條規則打架時，選一邊站，不要和稀泥。
寫前先讀：修改任何檔案之前，必須先讀完現有內容。
測試驗證意圖：改完之後跑測試，確認結果符合原本的設計目的。
多步驟需檢查點：複雜任務拆成小段，每段做完都要回報。
遵循既有慣例：專案裡已經有的風格和模式，照著走就對了。
失敗要大聲：遇到做不到的事，立刻說出來，不要默默瞎猜。

12 Rules Framework: Attitude Layer vs Mechanism Layer

少即是多：200 行懸崖

這套方法有個致命的陷阱。許多人嚐到甜頭後，開始瘋狂往 CLAUDE.md 裡堆規則，結果適得其反。

實測資料顯示，當 CLAUDE.md 超過 200 行，AI 的合規率會急劇下降。原因很直覺：塞太多指令，AI 的注意力被稀釋，反而記不住哪些才是真正重要的。

The 200-Line Cliff: AI compliance drops sharply after 200 lines

另一個常見錯誤是放太多「範例」。範例比規則佔用更多 token，而且容易讓 AI 過度擬合特定情境，碰到新狀況反而不知變通。

另一個被忽略的真相：告訴 AI「你是一位資深工程師」完全沒用。角色扮演不會改變模型的行為模式，真正有效的是具體的行為指令。

學術研究者其實特別適合這套思維。有人提出用「巢狀 CLAUDE.md」的概念來管理長期研究專案：最頂層的 CLAUDE.md 像憲法，定義跨專案通用的規矩；每個子資料夾裡的 CLAUDE.md 則像地方法規，處理特定任務的細節。這樣既維持整體一致性，又不會讓單一檔案膨脹到失控。

不寫程式的你，也能帶走的 3 件事

就算你從來沒用過 Claude Code，這 12 條規則背後的思維框架，對任何需要「指揮 AI 做事」的人都有價值：

寫「守則」而非「許願」：把你的需求寫成明確的行為規範，而不是模糊的期望。「幫我寫一篇好文章」遠不如「用台灣繁體中文、800 字以內、每段開頭要有小標題」。
少量精準勝過大量模糊：與其列 30 條注意事項，不如挑出最重要的 5 條，並標明優先順序。AI 和人一樣，指令太多就會選擇性遺忘。
要求 AI 主動回報失敗：在你的提示裡加上「如果有任何不確定的地方，請直接告訴我，不要猜測」。這一條就能擋掉大量無聲的錯誤。

AI 不是讀心術士，它是一個需要明確規則的協作者。你給它的守則越精準，它回報你的成果就越可靠。

本文整理自 Karpathy 原始規則及社群 30 個 codebase 的 6 週實測資料。

常見問題

CLAUDE.md 是什麼？不會寫程式也能用嗎？

CLAUDE.md 是一份純文字檔案，放在專案的根目錄下，用來告訴 AI 助手「你在這個專案裡該怎麼做事」。它不是程式碼，不需要任何語法知識，本質上就是一份行為守則清單。你可以把它想成公司新人訓練手冊：裡面寫的是「修改檔案前先讀完原始內容」「遇到不確定的地方要主動回報」這類自然語言的規矩。任何人只要會打字、會條列清單，就能寫出有效的 CLAUDE.md。對於非工程背景的學術研究者，已有社群文章（Claude Code 102 for Academic Researchers）示範如何用 CLAUDE.md 管理論文寫作、資料分析等工作流程，門檻相當低。 ---

規則寫越多，AI 就越聽話嗎？

恰好相反。實測資料明確顯示，CLAUDE.md 超過 200 行之後，AI 的合規率會急劇下降。原因在於 AI 模型的注意力機制有其極限。當指令量超過一定門檻，模型無法同時追蹤所有規則，開始選擇性忽略。就像你給員工一份 50 頁的 SOP，他大概只會記得前三頁和最後一頁。更隱蔽的陷阱是「範例過多」。很多人喜歡在 CLAUDE.md 裡附上大量範例來解釋規則，但範例比規則佔用更多 token（AI 的注意力資源），而且會導致過度擬合：AI 完美複製你的範例情境，但碰到稍有不同的新狀況就不知變通。最佳實踐是： - 核心規則控制在 12-15 條以內 - 每條規則用一句話說清楚 - 範例只在極度必要時附上，且每條規則最多一個 - 如果專案龐大，使用巢狀 CLAUDE.md（頂層憲法 + 子資料夾區域法規） ---

這 12 條規則只適用於 Claude 嗎？

規則的具體語法（放在 CLAUDE.md 檔案裡）確實是 Claude Code 的機制。但這 12 條規則背後的思維框架，適用於所有 AI 助手。核心邏輯是：AI 的預設行為傾向「多做」而非「精準做」，因此你需要用明確的行為指令來約束它。這個原則不因模型品牌而改變。舉例來說： - **「先讀再寫」**（Rule 8）：在 ChatGPT 裡，你可以要求「在修改之前，請先完整引用你要修改的段落，確認你理解了原文」。 - **「失敗要大聲」**（Rule 12）：在任何 AI 對話中加上「如果有任何不確定的地方，請直接告訴我，不要猜測」，都能顯著減少無聲錯誤。 - **「衝突不取平均」**（Rule 7）：當你給 AI 多重指令且彼此矛盾時，明確告訴它「當兩條規則衝突，以第一條為準」。無論你用的是 ChatGPT、GitHub Copilot、Gemini 還是其他工具，這套「寫守則而非許願」的思維都能提升你與 AI 協作的品質。差別只在於每個工具載入規則的方式不同（有的用 system prompt、有的用設定檔、有的用專案文件）。

覺得這篇有幫助？

追蹤以收到新的 AI × 生醫研究筆記：

RSS X / Twitter

或請我喝杯咖啡，讓新內容持續產出。

☕ 請我喝杯咖啡