realvco Docs

成本與用量

AI 不像傳統 SaaS 按座位計費。每一次對話都在消耗 Token,每一個 Token 都有成本。 這個分類讓你搞清楚錢流向哪、怎麼省。


你需要知道的三件事

1. realvco 訂閱費 ≠ AI 使用費

  • realvco 月費:付給 realvco 的主機與維運費用
  • AI 使用費:付給 OpenAI / Anthropic / Google 等 API 供應商

兩筆費用分開計算。訂閱 realvco 你拿到一台主機 + 三個夥伴框架,AI 模型 API Key 是你自己的(或 realvco 代購方案)。

2. Token 是計價單位,不是訊息數

  • 1 個中文字 ≈ 1.5-2 Tokens
  • 1 個英文單字 ≈ 1.3 Tokens
  • AI 的回應也算 Tokens(通常 output 比 input 貴 3-5 倍)
  • 長對話會累積,因為每次請求都帶整段歷史

一段日常對話(你問 100 字、AI 答 300 字)大約 1,000 Tokens。

3. 模型差距很大

同樣處理一段內容:

模型輸入 / 百萬 Tokens輸出 / 百萬 Tokens適合
GPT-4o-mini$0.15$0.60日常對話、客服
GPT-4o$2.50$10.00複雜推理、創作
Claude 3.5 Sonnet$3.00$15.00程式碼、長文理解
Claude 3.5 Haiku$0.80$4.00快速回應
Gemini 1.5 Flash$0.075$0.30大容量、便宜

GPT-4o 是 GPT-4o-mini 的 17 倍貴。 日常對話用 mini 就夠,不用預設最貴。


深入主題


快速省錢 TOP 5

如果你現在覺得花太多,優先做這五件事:

  1. 切換日常對話到便宜模型 — 把 Ada 的主模型從 GPT-4o 改成 GPT-4o-mini,成本降 80%
  2. 開啟 Context 壓縮 — 長對話自動摘要舊訊息,少帶歷史省錢
  3. 限制單次回應長度 — 設定 maxTokens,避免 AI 寫出一整本小說
  4. 設月預算上限 — 超過就停,避免失控
  5. 用 Gemini Flash 跑大量任務 — Google 的 Flash 模型便宜到幾乎免費

每項都在成本優化有詳細步驟。


相關文件