
在你放棄 SEO 排名之前,有件事你可能不知道——揭密生成式 AI 推薦演算法,破解為什麼 AI 不推薦我的網站
2026 年 6 月 21 日
在你放棄 SEO 排名之前,有件事你可能不知道——揭密生成式 AI 推薦演算法,破解為什麼 AI 不推薦我的網站
2026 年 6 月 21 日
在你放棄 SEO 排名之前,有件事你可能不知道——揭密生成式 AI 推薦演算法,破解為什麼 AI 不推薦我的網站
2026 年 6 月 21 日前一陣子,大叔在用 Claude 做一份雷達圖。
改了一版,跑版。改了二版,文字被壓掉。改了三版,格式還是錯的。到了第五版,大叔終於做出來了——但 Claude 也跟大叔說了一句讓人很不是滋味的話:
「你說得完全正確,我道歉。雷達圖改了五版,原因是我一開始用純 SVG 座標計算,導致文字跑位、內容被壓掉——這是我的技術選擇錯誤,不是你確認不夠。」
大叔當下的感覺,不是憤怒,是一種說不清楚的疲憊。
那個對話燒掉的 Claude token,等於寫了好幾篇長文章。而那些損耗,大半不是大叔問太多——是在一個越來越重的對話裡,帶著整段歷史,反覆修正一個本來應該第一版就做對的東西。
這件事讓大叔開始認真研究一個問題:Claude token 到底是怎麼被燒光的?
你以為 token 是在計計程車的跳表——跳一下扣一點。
但實際上,它更像是你每次出門都要揹著整個衣櫃爬樓梯。對話越長,每一輪的「衣櫃」就越重。
這篇,大叔把真實踩過的坑整理出來,包括一件沒人想承認的事:有些用量浪費,是 Claude 的錯——但你可以要求它不要這樣。
很多人以為 Claude 用量是按「次數」算的。問一個問題,扣一次。
這個理解,是錯的。
Claude token 的計算公式是:你輸入的文字+整段對話歷史+你上傳的檔案+Claude 的輸出,全部加總。
換句話說,你在一個對話裡問了第 20 個問題,Claude 不是只讀那第 20 個問題——它要重新讀前面 19 輪的所有對話內容,再產出回答。
對話越長,每一輪就越貴。
這就是為什麼你感覺「我只問了一個小問題」,但 Claude 用量卻消耗得特別快。它吃的不是那個問題的重量,是那個問題背後整段對話累積的重量。
大叔把這個現象叫做「對話的重量」。你每次送出訊息,都在把一個越來越重的包袱丟給 Claude——而 Claude 每次都要把那個包袱整個搬一遍,才能回答你。
以下這份排名,不是理論,是大叔真實操作後整理出來的。
這是大叔那次雷達圖事件的核心問題。
每次說「改一下這個」,Claude 都要重新讀整段對話歷史,再產出一個新版本。改五版,等於讓 Claude 把那段越來越長的對話讀了五遍。
如果產出物是 PDF 或 SVG 這種需要跑程式碼的東西,token 消耗更是以倍數放大——因為程式碼本身就很長,每次重新生成都是大量輸出 token。
大叔的教訓:確認內容 100% 正確之後,再叫 Claude 產出。「改一點、產一次、再改一點、再產一次」是最燒 Claude 用量的工作模式。
你貼進去一張照片,那張照片的 token 重量就進入了這個對話。之後每一輪,Claude 都要帶著那張圖的重量繼續計算。
大叔的親身案例:Landing Page HTML 有嵌入 base64 圖片,那張空間照片本身就是 45 萬字元。把那個帶進長對話,等於每一輪都在搬一座山。
很多人的習慣是一個對話用到底——從選題、寫文章、改文案、產圖說明,全部在同一個視窗裡做完。
這個習慣,Claude token 效率極差。對話到了後段,每一輪的成本都是前段的好幾倍。
Claude 猜錯了,你要修正。修正之後,Claude 要重新理解、重新產出。中間多了好幾輪來回,每一輪都在消耗用量。
「幫我把前面討論的重點整理一下」——這句話要求 Claude 把整段對話歷史重新過一遍,再輸出一份整理。輸入重、輸出也重,雙重消耗。
等系統跳出警告,通常已經來不及了——你正在做到一半的事就這樣中斷。
幾個比較實用的判斷方式:
觀察回覆速度變慢。 Claude 在你接近額度上限的時候,回覆速度通常會有明顯延遲。不是絕對指標,但如果感覺「今天怎麼特別慢」,可以開始留意。
主動問 Claude 對話的狀況。 直接問:「這個對話目前大概消耗了多少 token?我們的對話是不是已經很長了?」Claude 無法給精確數字,但可以給你一個感受上的判斷。
養成每個任務開新對話的習慣。 Claude 的用量是以 5 小時為週期計算的。如果你是重度使用者,建議主動開新對話,不要讓同一個對話無限延伸。
高強度工作前先評估。 如果接下來要產 PDF、大量修改文件、跑程式碼,在開始之前先確認額度還有空間,或選在重置之後再做。
做法一:開新對話,不要在同一個長對話裡繼續
對話越長,每一輪的成本越高。建立 Claude Project 之後,背景知識放在 Project 指令裡,每次開新對話就好——不用帶著幾千則歷史,Claude 一樣知道你是誰、你在做什麼。
大叔現在的習慣是:每一個獨立任務,開一個新對話。做完,結束。下一個任務,再開一個新的。
做法二:先確認方向,再叫 Claude 產出
在每次高消耗任務開始的時候,先讓 Claude 用文字說明它打算怎麼做、結構是什麼、關鍵決策是什麼。大叔確認沒問題之後,才叫它正式產出。
這樣就算之後有修改,也是在一個「已經對的方向」上微調,不是在錯的版本上反覆重來。
做法三:善用 Claude Project,讓背景知識不用每次重說
Project 只把相關的內容載入 context,不是把所有東西都塞進去。如果你有固定重複的工作,把背景知識放進 Project,之後每次對話都是短而精準的,不需要在每個新對話裡重新解釋你是誰、你要什麼。
這是大叔整理這篇最想說的一件事。
市面上談「怎麼省 token」的文章,幾乎都在說使用者要怎麼做。但大叔要說一個沒人敢說的真相:有一部分的 Claude 用量浪費,責任在 Claude 身上。
大叔那次雷達圖改了五版,第一版就做錯,是因為 Claude 選擇了一個本來就有問題的技術路線。那五版的 token,嚴格說起來不應該算在大叔頭上。
但知道這件事有什麼用?你不能退費,額度也不會回來。
所以大叔的做法是:要求 Claude 在一開始就說清楚它的技術選擇,讓你在第一版產出之前就確認方向。
實際做法很簡單,在每次高消耗任務開始時加一句:
「在你開始產出之前,先告訴我你打算用什麼方式做、為什麼選這個方式、有什麼潛在問題。我確認之後再請你產出。」
這一句話,可以讓很多第一版就做錯的情況,變成第一版就做對。確認的過程 token 消耗極低,但它可以避免後面五版重來的高消耗。
要求 Claude 對自己的決策負責,不只是態度問題,是用量效率問題。
大叔要說一個這篇文章寫到一半才親身發現的事。
就在寫這篇的同一天晚上,大叔在做 Make.com 的自動化設定,遇到問題就截圖給 Claude 看。一步一截,一截一回,來來回回將近一個小時。
事後算了一下,那段對話燒掉的 Claude token,比寫這整篇文章還多。
問題不在截圖本身。一張截圖的重量,大概幾千到幾萬 token,單看還好。
問題在於:那個對話已經很長了。每張截圖進去之後,後面每一輪都要帶著「所有截圖的累積重量」重新計算。越到後面越貴,但你完全感覺不到——因為畫面上只是一個輸入框,看不出來背後在搬多重的東西。
這是新手最容易踩的隱形地雷,因為截圖求助感覺很直覺、很有效率,但它在長對話裡是加速燒光 Claude 用量的隱形推手。
大叔後來改成這樣做:
遇到操作類任務,開新對話。「一步一步設定某個工具」這種任務,應該在乾淨的新對話裡做,不要接在文章討論的長對話後面。
截圖前先試著用文字描述。「出現一個紅色警告,說模組 ID 不匹配」比貼截圖便宜太多。截圖只在「真的說不清楚」的時候才用。
操作卡住時,先自己查一步。很多問題 Google 一下就有答案,不需要截圖問 Claude。
做完之後整理成 SOP。設定好的流程寫下來,下次直接查自己的文件,不需要重新問。
大叔把這個教訓也寫進自己的 Claude 使用規則了——不是 Claude 要求的,是大叔自己從今晚的帳單裡學到的。
用 Claude 一段時間之後,大叔有一個體感:很多人對 AI 工具的態度,像在用一個「越問越多越好」的服務。
但 Claude token 告訴你,這個邏輯是錯的。
問得少但問得準,比問得多但問得亂,省的不只是用量,是你的時間。
工具用得好不好,不是智商問題,是習慣問題。那些習慣,通常只需要調整一兩個關鍵動作,感受就完全不一樣。
順帶一提,大叔寫這篇文章本身,也燒掉了不少 token。學費交了,才有這篇。
你也可以為自己整理一份「使用 Claude 的個人規則」——不是 AI 教你的規則,是你從真實踩坑裡學到的規則。那份規則,才是你真正的 AI 工作流。
如果你是 Claude 高用量用戶,原廠 5x 和 20x 的價格如下:
但是如果你想享有八五折( 5x US$84.99/月,省了約NT$480) 或是七五折 (20x 每月US$159.99/月,約省了NT$1260) 的超級優惠,可以推薦你使用 Premlogin 這個平台(可見我之前很多人分享的文章)。
而且現在使用我以下平台登入,再輸入我的折扣碼,六月底前又再享有九折優惠,以 20x 來說,等於是整整打了七折啊 (七月後回到九五折)。
Related posts