成本與用量
AI 不像傳統 SaaS 按座位計費。每一次對話都在消耗 Token,每一個 Token 都有成本。 這個分類讓你搞清楚錢流向哪、怎麼省。
你需要知道的三件事
1. realvco 訂閱費 ≠ AI 使用費
- realvco 月費:付給 realvco 的主機與維運費用
- AI 使用費:付給 OpenAI / Anthropic / Google 等 API 供應商
兩筆費用分開計算。訂閱 realvco 你拿到一台主機 + 三個夥伴框架,AI 模型 API Key 是你自己的(或 realvco 代購方案)。
2. Token 是計價單位,不是訊息數
- 1 個中文字 ≈ 1.5-2 Tokens
- 1 個英文單字 ≈ 1.3 Tokens
- AI 的回應也算 Tokens(通常 output 比 input 貴 3-5 倍)
- 長對話會累積,因為每次請求都帶整段歷史
一段日常對話(你問 100 字、AI 答 300 字)大約 1,000 Tokens。
3. 模型差距很大
同樣處理一段內容:
| 模型 | 輸入 / 百萬 Tokens | 輸出 / 百萬 Tokens | 適合 |
|---|---|---|---|
| GPT-4o-mini | $0.15 | $0.60 | 日常對話、客服 |
| GPT-4o | $2.50 | $10.00 | 複雜推理、創作 |
| Claude 3.5 Sonnet | $3.00 | $15.00 | 程式碼、長文理解 |
| Claude 3.5 Haiku | $0.80 | $4.00 | 快速回應 |
| Gemini 1.5 Flash | $0.075 | $0.30 | 大容量、便宜 |
GPT-4o 是 GPT-4o-mini 的 17 倍貴。 日常對話用 mini 就夠,不用預設最貴。
深入主題
Usage Dashboard 解讀
管理儀表板(Admin Panel) 的 用量分頁 每個數字代表什麼
Token 計價原理
為什麼 1,000 字的對話可能花到 5 美分
預算警示
設定月預算上限、每日告警、超額關閉
成本優化
換模型、壓縮 context、快取、限流
快速省錢 TOP 5
如果你現在覺得花太多,優先做這五件事:
- 切換日常對話到便宜模型 — 把 Ada 的主模型從 GPT-4o 改成 GPT-4o-mini,成本降 80%
- 開啟 Context 壓縮 — 長對話自動摘要舊訊息,少帶歷史省錢
- 限制單次回應長度 — 設定
maxTokens,避免 AI 寫出一整本小說 - 設月預算上限 — 超過就停,避免失控
- 用 Gemini Flash 跑大量任務 — Google 的 Flash 模型便宜到幾乎免費
每項都在成本優化有詳細步驟。