2025 年 7 月 28 日 OpenRouter 最受歡迎 AI API 排行榜與深度洞察

,

2025 年 7 月 28 日 OpenRouter 最受歡迎 AI API 排行榜與深度洞察

截至 2025 年 7 月 28 日,OpenRouter 公布的最新使用數據顯示,整體市場已由「唯性能論」轉向「性價比至上」的新賽道。Google 以 43.2 % 的 Token 份額穩居龍頭,DeepSeek 異軍突起拿下 19.4 %,而昔日霸主 OpenAI 僅剩 5.9 %。以下榜單依實際調用量排序,並輔以價格、延遲與應用場景三大維度,協助開發者快速掌握市場脈動。

排名 模型名稱 所屬機構 Token 份額 每百萬輸出 Token 價格 (USD) 典型延遲 (ms) 強項場景
1 Gemini 2.0 Flash Google 28.7 % 0.40 120 即時翻譯、客服對話
2 Claude Sonnet 4 Anthropic 18.5 % 2.00 280 程式碼生成、技術問答
3 Gemini 2.5 Flash Preview Google 11.3 % 0.65 150 長文本摘要、資料萃取
4 DeepSeek V3 Free DeepSeek 10.1 % 0.00 350 開源實驗、教育用途
5 DeepSeek V3 Paid DeepSeek 9.3 % 0.20 320 邏輯推理、數學計算
6 Gemini 2.5 Pro Google 3.2 % 3.00 200 高階分析、研究報告
7 Claude 3.7 Sonnet Anthropic 2.8 % 2.40 300 法律文件、合規審查
8 GPT-4o-mini OpenAI 2.1 % 0.60 180 行銷文案、社群貼文
9 Llama 3.1 70B Meta 1.9 % 0.35 400 本地部署、隱私應用
10 Mistral Large 2 Mistral 1.4 % 1.20 250 歐洲語系、多語客服

市場洞察:從「跑分競賽」到「代幣經濟學」

Google 的雙箭頭策略:Flash 搶市占、Pro 顧利潤

Google 能在半年內將市占率從 25 % 推升至 43 %,關鍵在於「雙 Flash」的精準定位。Gemini 2.0 Flash 以每百萬 Token 0.4 美元的破盤價,成功取代過去 GPT-3.5 Turbo 的生態位,成為新創公司與消費級應用的首選;而 Gemini 2.5 Flash Preview 則以略高的 0.65 美元,提供接近 Pro 等級的推理深度,提前鎖定未來升級需求。兩者相加,便囊括了整體市場四成以上的調用量。

值得注意的是,高單價的 Gemini 2.5 Pro 雖僅占 3.2 %,卻貢獻了 Google 在 OpenRouter 平台上約 18 % 的營收,顯示「平價衝量、高價保利」的組合拳已奏效。

DeepSeek 的「免費增值」悖論:流量暴漲卻難留客

DeepSeek V3 同時以 Free 與 Paid 版本攻榜,合計 19.4 % 的份額已超越 Anthropic,成為最大黑馬。然而,根據《SemiAnalysis》追蹤,DeepSeek 自有平台的月活躍用戶在短短四個月內流失近三成,主因在於官方為節省算力,刻意壓低上下文長度至 64 K 並拉高首 Token 延遲至 25 秒以上。這使得大量開發者轉向 OpenRouter 等第三方平台取用 DeepSeek 模型,以獲得更佳的 QoS(服務品質)。換言之,DeepSeek 成功打響品牌,卻將營收機會拱手讓給了中間商。

Anthropic 的「專家定位」:守住程式碼灘頭堡

Claude Sonnet 4 在「程式設計」細分場景的市占率高達 44.5 %,遠超其他競品。Anthropic 透過持續優化程式碼訓練資料與長上下文理解,成功在開發者社群建立「寫 Code 找 Claude」的心智。雖然總體份額被 Google 與 DeepSeek 擠壓,但高黏著度的專業用戶確保了穩定現金流,也為未來推出更高階的 Claude Opus 5 奠定基礎。

OpenAI 的斷崖危機:品牌光環不再保證轉換

GPT-4o-mini 在 5 月曾靠行銷操作短暫衝上第二名,但熱度退燒後迅速滑落至第八。核心問題在於價格帶尷尬:0.6 美元比 Gemini Flash 貴 50 %,性能卻未明顯勝出;相較自家 GPT-4o 又缺乏多模態優勢。OpenAI 若無法在下半年推出更具性價比的迭代,API 市占恐將進一步被邊緣化。


開發者行動指南:如何選型與避坑

  1. 預算敏感型專案:直接鎖定 Gemini 2.0 Flash,0.4 美元即可獲得 120 ms 的超低延遲,適合客服、翻譯等即時場景。
  2. 程式碼與技術問答:優先採用 Claude Sonnet 4,雖然單價較高,但 44.5 % 的市占率代表生態系完整,除錯資源豐富。
  3. 教育與原型驗證:DeepSeek V3 Free 提供零成本入場券,惟需注意官方高延遲問題,建議透過 OpenRouter 調用以獲得較佳體驗。
  4. 長文本分析:Gemini 2.5 Flash Preview 在 0.65 美元的價位帶提供 1 M Token 上下文,性價比遠超 GPT-4o。
  5. 高階研究:若預算充足且需要極致推理品質,Gemini 2.5 Pro 的 3 美元定價仍低於 Claude Opus 4,可作為替代方案。

結論:「代幣經濟學」時代的三大啟示

  1. 價格戰已結束:開發者不再只看「$/Mtok」,而是綜合評估延遲、上下文與穩定性,形成新的「代幣經濟學」指標。
  2. 中間商紅利持續:DeepSeek 的案例證明,即使模型廠商擁有技術優勢,若缺乏足夠算力與全球節點,仍難逃被平台分食的命運。
  3. 場景細分不可逆:未來半年,我們將看到更多針對「法律、醫療、金融」等垂直場景的微調模型,以高附加價值對抗價格競爭。

對開發者而言,緊盯 OpenRouter 每月公布的調用數據,將成為選型與議價的關鍵依據;對模型供應商而言,如何在性能、價格與服務品質之間取得平衡,將決定能否在這場馬拉松中存活。