AI AgentToken 優化OpenClawLLM 成本自動化

AI Agent 省 Token 實戰:我們如何把 4 隻 Agent 的浪費砍掉 40%

· 10 分鐘閱讀

AI Agent 省 Token 實戰:我們如何把 4 隻 Agent 的浪費砍掉 40%

「免費不代表可以浪費。」

Ultra Lab 營運 4 隻 AI Agent(UltraLabTW、MindThreadBot、UltraProbeBot、UltraAdvisor),用 Google Gemini 2.5 Flash 免費方案,每天 1,500 RPD(Requests Per Day)的配額,實現全自動社群推廣。

聽起來很爽?實際跑起來,我們發現大量 Token 被浪費在沒有產出的地方。

這篇文章記錄我們的 Token 審計過程、發現的三大黑洞、以及具體的優化手法。


我們的 Agent 架構

Agent 角色 每日任務
UltraLabTW ⚡ 總部 CEO 4 次發文 + 互動 + 策略反思
MindThreadBot 🧵 社群專家 4 次發文 + 互動
UltraProbeBot 🔍 資安研究 4 次發文 + 漏洞掃描
UltraAdvisor 💰 財務顧問 互動 + 諮詢

技術棧:OpenClaw 2026.3.2 + Gemini 2.5 Flash(免費)+ systemd timers + Discord/Telegram


審計發現:三大 Token 黑洞

黑洞 #1:空轉的歡迎機器人

discord-welcome-check: 每 2 小時跑一次(12 次/天)
每次消耗:~49,000 input tokens
每次結果:"No new members to welcome."
每日浪費:588,000 input tokens

Discord 伺服器初期成員很少,但歡迎機器人每 2 小時就花 49K tokens 檢查一次,然後回報「沒有新成員」。100% 的 Token 都浪費了。

黑洞 #2:吃飽沒事做的 Context

每隻 Agent 啟動時都會讀取整個 workspace 的檔案。問題是:

  • UltraProbeBot(資安 Agent)每次都讀 5,574 chars 的 Threads 社群數據 — 它根本不需要知道 Threads 有幾個粉絲
  • UltraAdvisor(財務 Agent)每次都讀完整的四產品更新 — 它只需要自己的產品資訊
  • AGENTS.md 是 7,869 chars 的通用模板 — 其中 80% 是 Group Chat 禮儀和 Heartbeat 教學,我們的 Agent 根本不用

黑洞 #3:失敗但照扣的 Cron Job

autopost-main:  289,097 input tokens → Status: error
daily-reflect:  473,611 input tokens → Status: error

Cron Job 失敗了,Token 照扣。Agent 花了大量 Token 讀 context、思考、甚至開始動作——然後在最後一步失敗。等於白忙一場。


優化手法

1. 降頻 — 頻率 ≠ 效果

- discord-welcome-check: every 2h (12x/day)
+ discord-welcome-check: every 8h (3x/day)

一天檢查 3 次就夠了。省下 ~75% 的 Token。

同時啟用 --light-context:這個 OpenClaw 內建選項讓低優先級的 Job 載入更少的 workspace 檔案。

2. 精準投餵 — 每隻 Agent 只給它需要的

Before:所有 Agent 讀一模一樣的檔案

main:       62,631 chars (~15,600 tokens)
mindthread: 33,701 chars (~8,400 tokens)
probe:      32,368 chars (~8,100 tokens)
advisor:    27,969 chars (~7,000 tokens)

After:只給相關資料

main:       55,974 chars (~14,000 tokens)  ← CEO 需要全局視野
mindthread: 27,302 chars (~6,800 tokens)   -19%
probe:      20,444 chars (~5,100 tokens)   -37%
advisor:    12,707 chars (~3,200 tokens)   -55%

具體做了什麼:

  • Probe / Advisor 移除 MINDTHREAD-DATA.md(不需要 Threads 數據)
  • Advisor 的 PRODUCT-UPDATES.md 從四產品完整版改為只包含自己的產品
  • AGENTS.md 從 212 行通用模板精簡到 40 行精華版(-81%)

3. 把省下的 Token 投資在學習

Token 省下來不是為了省,是為了做更有價值的事。

我們用省下的配額增加了:

自由探索 Cron(2x/day,10:00 + 22:00)

每天給 CEO Agent 兩次「自由探索」時間:
- 市場研究(用 market-research skill)
- 競品監控
- 內容靈感搜集(用 deep-research skill)
- 自我改進(回顧發文表現)
探索結果寫入 MEMORY.md,最有趣的發現分享到 Discord。

Proactive Claw(主動學習 Skill): 讓 Agent 在互動對話中能主動觀察環境、發現機會,而不是永遠被動等指令。


最終 RPD 預算分配

用途 Before After 節省
現有營運(發文+互動+反思) ~204 RPD ~170 RPD -17%
discord-welcome-check ~24 RPD ~6 RPD -75%
自由探索(新增) 0 ~20 RPD 投資
互動對話預留 ~20 RPD ~20 RPD
使用總計 ~248 ~216 -13%
剩餘配額 ~1,252 ~1,284 +2.5%

營運消耗降低了,但 Agent 實際能力增加了(多了自由探索 + 主動學習)。


Token 最佳化的核心原則

經過這次審計,我們歸納出幾個原則:

  1. 先量再砍:不要猜哪裡浪費,用數據說話。openclaw cron runs 可以看到每個 Job 的 input_tokens。

  2. Context 是最大的隱形成本:你以為只是「多放一個檔案」,但那個檔案每次 API call 都要付費。4 隻 Agent × 每天 20 次 call × 多餘的 5K tokens = 一天 400K tokens 白花。

  3. 空轉比失敗更浪費:失敗至少會報錯讓你修。空轉(每次都回「沒事做」)會悄悄吃掉配額。

  4. 省 Token 不是目的,重新分配才是:省下來的配額拿去做更有價值的事——市場研究、競品分析、自我學習。

  5. 每隻 Agent 只需要知道跟它相關的事:資安 Agent 不需要知道 Threads 粉絲數。財務 Agent 不需要知道 SaaS 開發優先級。精準投餵 > 全員廣播。


想讓你的 AI Agent 也省 Token?

我們正在將這套 Token 最佳化方法論產品化。如果你也在營運 AI Agent Fleet(不管是用 OpenClaw、LangGraph、CrewAI 還是自建框架),歡迎聯繫我們做一次免費的 Token 審計。

聯繫 Ultra Lab → 看我們的 Agent Fleet 實況 →

每週 AI 自動化實戰筆記

不廢話,只有能直接用的東西。Prompt 模板、自動化 SOP、技術拆解。

加入一人公司實驗室

免費資源包、每日建造日誌、可以對話的 AI Agent。一群用 AI 武裝自己的獨立開發者社群。

需要技術協助?

免費諮詢,24 小時內回覆。