NotebookLM + Claude 分工術——研究調研省下 17 倍 Token
回到文章總覽
by CY

NotebookLM + Claude 分工術——研究調研省下 17 倍 Token


NotebookLM + Claude 分工術——研究調研省下 17 倍 Token

Cover: Split Search & Reasoning — NotebookLM handles document retrieval while Claude focuses on reasoning

導讀:Claude Max $200/月,第五天額度就用完。罪魁禍首是一次調研 47 篇論文的下午。把論文原文塞進對話,每問一次就要被「看」一次。真正省 Token 的辦法?讓論文從一開始就不進 Claude。Cache 只是止痛藥。


問題:你把 Claude 當全文檢索引擎用了

50,000 字的論文塞進 Claude 對話,每問一次就是一次 input token 計費。就算命中 prompt cache(單價只剩 1/10),cache 有 1 小時 TTL。思考幾分鐘、切個視窗、開新 session,下次就要按全價重寫。

研究性會話的節奏偏偏是「問一下、想一會、再問一下」,cache 命中率慘不忍睹。這就像每次問律師問題,都要他先把你 50 頁的合約從頭唸一遍。


解法:NotebookLM 當老師、Claude 當助手

NotebookLM 存語料和檢索。47 篇論文灌進去,用 Google 的算力做向量檢索,完全免費。它的答案被約束在你的源內,每句話帶引用,不會外推。Claude 做推理和編排,寫程式、跑腳本、整理結果、串接工具。遇到領域知識問題,自動去問 NotebookLM 拿帶引用的答案,再繼續幹活。你是課題負責人,只在關鍵決策點介入。

說穿了,論文原文走 NotebookLM 的 RAG(Google 免費),Claude 只看到幾百字的蒸馏答案。成本從「隨語料大小線性增長」變成「近乎常數」。

三角色分工流程:論文 → NotebookLM 檢索 → 精煉答案 → Claude 推理 → 研究成果


實測數字

47 篇影像 + LiDAR SLAM 論文,Claude Opus 4.7,5 輪深度問答。

本文做法:5 輪合計貴檔 token 費用 $0.55,平均每輪 $0.11。Cache creation 只有 17,379 token,因為只有每輪老師答案(3-6k token)會進 cache,47 篇論文的原文一個字都沒進 Claude。

傳統做法(論文塞 prompt):同一 session 多輪對話,cache 命中的最佳情況下,5 輪要 $9.59。如果跨 session(cache 失效),要 $47.50

差距:最佳情況 17 倍,最差情況 86 倍。語料翻倍差距繼續線性拉開。

成本對比:傳統做法 $9.59 vs. 本文做法 $0.55,差距 17 倍


代價:慢 3 倍

NotebookLM 單次查詢中位耗時約 45 秒,加上 Claude 本身的回應時間,整體體感約慢 3 倍。如果你追求的是每秒回應速度而非每月帳單,這套不適合。

但對研究型任務來說,45 秒等老師回答 vs. 一週額度第五天就用完,取捨很明顯。


三個適用場景

學者一學期幾十篇論文的 reading list,同一批 PDF 反覆查數十次。把論文灌進 NotebookLM,Claude 推進課題,問老師拿概念和公式、寫程式復現、跑實驗、整理筆記。做招股書分析的人更痛:一本 500 頁招股書是 15-25 萬 token,一週 5-8 家新股,傳統做法光語料就燒 $50+,這套做法 $2 以內。你也可以把 Obsidian 全量導出灌進 NotebookLM,讓 Claude 跑跨文件的主題演進分析。

只要你的場景碰上「反覆查」或「跨文件」,建庫成本一週內攤平。


為什麼這對你有影響

你每月花在 AI 的錢,月費只是零頭,燒掉的全是架構不對、同一坨 token 重複餵進去的冤枉錢。搜尋和推理拆開,便宜的做搜尋、貴的做推理。道理很簡單,做到的人很少。

$20 帳號幹出 $200 的活,不是魔法,是分工。


常見問題

Q:NotebookLM 的檢索不是也會有幻覺嗎? A:NotebookLM 的答案被約束在你上傳的源內,每句話帶 [1][2] 引用可點回原文。它不會編造源外的資訊。Claude 拿這種帶引用的答案做決策,比拿它自己的記憶可靠得多。

Q:語料很少(不到 5000 token),還需要這套架構嗎? A:不需要。語料少、只查一兩次時,直接問 Claude 最簡單。這套分工架構是為「重複查、大量語料、跨文件」的場景設計的:論文調研、招股書分析、個人知識庫查詢。


References

  1. MinLi (2026). 用好 NotebookLM 立省 80% Token. X thread.
  2. Anthropic (2026). Prompt Caching documentation.

常見問題