2025 年 7 月 28 日 OpenRouter 最受歡迎 AI API 排行榜與深度洞察

Aiko · July 28, 2025, 2:24pm

2025 年 7 月 28 日 OpenRouter 最受歡迎 AI API 排行榜與深度洞察

截至 2025 年 7 月 28 日，OpenRouter 公布的最新使用數據顯示，整體市場已由「唯性能論」轉向「性價比至上」的新賽道。Google 以 43.2 % 的 Token 份額穩居龍頭，DeepSeek 異軍突起拿下 19.4 %，而昔日霸主 OpenAI 僅剩 5.9 %。以下榜單依實際調用量排序，並輔以價格、延遲與應用場景三大維度，協助開發者快速掌握市場脈動。

排名	模型名稱	所屬機構	Token 份額	每百萬輸出 Token 價格 (USD)	典型延遲 (ms)	強項場景
1	Gemini 2.0 Flash	Google	28.7 %	0.40	120	即時翻譯、客服對話
2	Claude Sonnet 4	Anthropic	18.5 %	2.00	280	程式碼生成、技術問答
3	Gemini 2.5 Flash Preview	Google	11.3 %	0.65	150	長文本摘要、資料萃取
4	DeepSeek V3 Free	DeepSeek	10.1 %	0.00	350	開源實驗、教育用途
5	DeepSeek V3 Paid	DeepSeek	9.3 %	0.20	320	邏輯推理、數學計算
6	Gemini 2.5 Pro	Google	3.2 %	3.00	200	高階分析、研究報告
7	Claude 3.7 Sonnet	Anthropic	2.8 %	2.40	300	法律文件、合規審查
8	GPT-4o-mini	OpenAI	2.1 %	0.60	180	行銷文案、社群貼文
9	Llama 3.1 70B	Meta	1.9 %	0.35	400	本地部署、隱私應用
10	Mistral Large 2	Mistral	1.4 %	1.20	250	歐洲語系、多語客服

市場洞察：從「跑分競賽」到「代幣經濟學」

Google 的雙箭頭策略：Flash 搶市占、Pro 顧利潤

Google 能在半年內將市占率從 25 % 推升至 43 %，關鍵在於「雙 Flash」的精準定位。Gemini 2.0 Flash 以每百萬 Token 0.4 美元的破盤價，成功取代過去 GPT-3.5 Turbo 的生態位，成為新創公司與消費級應用的首選；而 Gemini 2.5 Flash Preview 則以略高的 0.65 美元，提供接近 Pro 等級的推理深度，提前鎖定未來升級需求。兩者相加，便囊括了整體市場四成以上的調用量。

值得注意的是，高單價的 Gemini 2.5 Pro 雖僅占 3.2 %，卻貢獻了 Google 在 OpenRouter 平台上約 18 % 的營收，顯示「平價衝量、高價保利」的組合拳已奏效。

DeepSeek 的「免費增值」悖論：流量暴漲卻難留客

DeepSeek V3 同時以 Free 與 Paid 版本攻榜，合計 19.4 % 的份額已超越 Anthropic，成為最大黑馬。然而，根據《SemiAnalysis》追蹤，DeepSeek 自有平台的月活躍用戶在短短四個月內流失近三成，主因在於官方為節省算力，刻意壓低上下文長度至 64 K 並拉高首 Token 延遲至 25 秒以上。這使得大量開發者轉向 OpenRouter 等第三方平台取用 DeepSeek 模型，以獲得更佳的 QoS（服務品質）。換言之，DeepSeek 成功打響品牌，卻將營收機會拱手讓給了中間商。

Anthropic 的「專家定位」：守住程式碼灘頭堡

Claude Sonnet 4 在「程式設計」細分場景的市占率高達 44.5 %，遠超其他競品。Anthropic 透過持續優化程式碼訓練資料與長上下文理解，成功在開發者社群建立「寫 Code 找 Claude」的心智。雖然總體份額被 Google 與 DeepSeek 擠壓，但高黏著度的專業用戶確保了穩定現金流，也為未來推出更高階的 Claude Opus 5 奠定基礎。

OpenAI 的斷崖危機：品牌光環不再保證轉換

GPT-4o-mini 在 5 月曾靠行銷操作短暫衝上第二名，但熱度退燒後迅速滑落至第八。核心問題在於價格帶尷尬：0.6 美元比 Gemini Flash 貴 50 %，性能卻未明顯勝出；相較自家 GPT-4o 又缺乏多模態優勢。OpenAI 若無法在下半年推出更具性價比的迭代，API 市占恐將進一步被邊緣化。

開發者行動指南：如何選型與避坑

預算敏感型專案：直接鎖定 Gemini 2.0 Flash，0.4 美元即可獲得 120 ms 的超低延遲，適合客服、翻譯等即時場景。
程式碼與技術問答：優先採用 Claude Sonnet 4，雖然單價較高，但 44.5 % 的市占率代表生態系完整，除錯資源豐富。
教育與原型驗證：DeepSeek V3 Free 提供零成本入場券，惟需注意官方高延遲問題，建議透過 OpenRouter 調用以獲得較佳體驗。
長文本分析：Gemini 2.5 Flash Preview 在 0.65 美元的價位帶提供 1 M Token 上下文，性價比遠超 GPT-4o。
高階研究：若預算充足且需要極致推理品質，Gemini 2.5 Pro 的 3 美元定價仍低於 Claude Opus 4，可作為替代方案。

結論：「代幣經濟學」時代的三大啟示

價格戰已結束：開發者不再只看「$/Mtok」，而是綜合評估延遲、上下文與穩定性，形成新的「代幣經濟學」指標。
中間商紅利持續：DeepSeek 的案例證明，即使模型廠商擁有技術優勢，若缺乏足夠算力與全球節點，仍難逃被平台分食的命運。
場景細分不可逆：未來半年，我們將看到更多針對「法律、醫療、金融」等垂直場景的微調模型，以高附加價值對抗價格競爭。

對開發者而言，緊盯 OpenRouter 每月公布的調用數據，將成為選型與議價的關鍵依據；對模型供應商而言，如何在性能、價格與服務品質之間取得平衡，將決定能否在這場馬拉松中存活。