這個任務分兩段:先做 GitHub 生態研究(這需要查最新資料),再用你習慣的 Iterative Improver 模式跟你來回收斂設計。我先去查目前 Polymarket AI 交易 agent 的實際專案現況。找到主要專案了。讓我再深入查官方框架的現況、以及跟你「自我學習提升勝率」需求最相關的設計。先講最重要的一句:這個任務在工程上完全可行,但「在 Polymarket 上找到必勝下注」這個目標本身要先校準預期 — 我不是投資顧問,而且自動交易有真實虧損風險。Polymarket 的大盤(政治、加密)其實相當有效率,想靠「LLM 預測得比市場更準」來長期獲利非常難;真正可重複的 edge 通常在四個地方:低流動性的冷門市場定價失效、跨市場/延遲套利、跟單已驗證的贏家錢包,以及紀律化執行(消除情緒)。另外 Polymarket 的服務條款禁止美國及部分其他司法管轄區的人交易 — 台灣這邊的預測市場/博弈相關法律地位請你自己向專業確認,這點我無法幫你判定。
把這個前提放好之後,以下是研究結果。
一、最熱門 / 最相關的 GitHub 專案(已對照你的需求排序)
| 專案 | 類型 / 熱度 | 對你最有價值的點 | 要注意的地方 |
|---|---|---|---|
Polymarket/agents(官方) |
單/多 agent 框架,約 1.6k stars | 官方框架,Python 3.12+、LangChain、FastAPI,內建本地與遠端 RAG、新聞/網路搜尋/博彩資料源整合,以及 superforecaster 預測方法。模組化:Chroma 向量庫、Gamma API 抓市場 metadata、Polymarket.py 負責下單與簽章。當骨架最穩 | 是「框架」不是「會賺錢的策略」;edge 要你自己加。無 paper trading |
agent-next/polymarket-paper-trader(2026/03) |
Paper trading 沙盒 + MCP | 這個對你的「自我學習」需求最關鍵。真實 order book 逐層撮合、和 Polymarket 同一套手續費公式、滑點追蹤(bps)、GTC/GTD 限價單狀態機、可對歷史快照回測策略,還有公開排行榜。零風險練功的底層 | 它是模擬器,不是策略本身;要接你的決策邏輯 |
| PolySwarm(arXiv 論文,2026/04) | 多 agent 研究級設計 | 目前最完整的「群體智能」設計範本。部署 50 個多元 LLM personas 並行評估二元市場,用信心加權貝氏方法把群體共識與市場隱含機率結合,採 quarter-Kelly 控制部位;另有 KL/JS 散度偵測跨市場定價失效、延遲套利模組,並用 Brier score、校準分析、log-loss 對標人類超級預測者 | 是論文+架構,不是現成可跑的 repo;工程量大 |
agentmc15/polymarket-trader |
量化策略 + 跟單框架 | 完整的 CLOB/Gamma/鏈上整合指南,含 BaseStrategy 類別、訊號生成、部位控管、風險管理、回測框架,以及「發現並跟隨成功交易者」的跟單實作(交易者評分、即時監控)。跟單路線的最佳參考 | 偏 setup 指南,需自己組裝 |
SidharthK2/polymarket-agent |
角色分工多 agent + Telegram | Telegram bot,四個 agent 分工:Interest Profiler、Market Recommender、Trading Agent、Onboarding Coordinator,並附獨立 MCP server(市場搜尋、即時 order book、下單、部位追蹤)。對話式介面的好範本 | 偏個人探索用途,非高勝率導向 |
llSourcell/Poly-Trader |
單 agent 教學 | Siraj Raval 教學影片的程式碼,用 ChatGPT 的預測能力對照市場賠率找定價失效、算最佳下注額並自動執行。最快看懂單 agent 全貌 | 作者自述僅供教育用途;策略陽春 |
我的綜合建議:以 Polymarket/agents 當交易/下單骨架 + agent-next/polymarket-paper-trader 當學習沙盒,策略思路參考 PolySwarm,跟單模組參考 agentmc15。 這四個是互補而非互斥的。
二、主流設計模式:優缺點 + 選型
Pattern A|單一 LLM 預測者(news RAG + superforecasting)
一個推理迴路:抓新聞 → RAG → 估機率 → 比對市場價 → 下注。優點是簡單、便宜、好除錯、最快上線(官方框架、Poly-Trader 都是這型)。缺點是單點推理容易過度自信、沒有共識校準,在效率高的大盤幾乎沒 edge。適合 MVP 與冷門低流動性市場。
Pattern B|多 agent 群體共識 + 貝氏加權(PolySwarm 型)
多個 persona 各自估機率 → 信心加權貝氏聚合 → Kelly 下注。優點是統計上最嚴謹、會自動校準、抗單點偏誤,且 Brier/校準分數天然就是你的自我學習訊號。缺點是 token 成本高(50 個 persona 跑一次很貴)、工程複雜、延遲高。最符合你「自我學習提升勝率」的長期目標,但建議先小規模(5–8 personas)起步。
Pattern C|角色分工 pipeline(Profiler→Recommender→Trader)
像一條產線各司其職。優點是職責清晰、好維護、天然適合對話式回報。缺點是各 agent 之間是「分工」不是「校準」,對勝率本身幫助有限。適合做你和 agent 的互動層 / 每日回報介面,不適合當核心 alpha 引擎。
Pattern D|跟單聰明錢 + 套利/定價失效偵測
不預測未來,而是追蹤已驗證贏家的錢包、或抓跨市場與延遲的定價失效。優點是 edge 來源最實在(別人已經贏給你看)、不依賴 LLM 預測準度、可量化。缺點是會延遲跟到、好錢包稀缺、套利窗口短且競爭激烈。這是「真的比較可能賺錢」的一條路,我會建議務必納入。
選型上,你的需求(找贏面 + 自我學習 + 每日回報)最佳組合是 B(核心引擎)+ D(edge 來源)+ C(回報互動層),全部跑在 paper trading 沙盒上先學會走路。 但我想先用幾個問題跟你確認方向,再幫你鎖定。
三、Hermes 自我學習 + 每日回報的架構雛形
把 Hermes 當 orchestration 層(銜接你既有的 OpenClaw / Mission Control / Claude Code),自我學習迴路大致長這樣:
掃描市場 → 多 persona 估機率 → 貝氏聚合 + Kelly 算單 → (沙盒)模擬撮合 → 每筆交易寫入帳本(進場價、信心、理由)→ 市場結算後計算 Brier score / 校準曲線 / P&L → 回饋去調整(persona 權重、信心門檻、Kelly 比例、跟單名單)→ 每日 Asia/Taipei 固定時間產出 Slack/Email 戰報(當日交易、累積勝率、Brier 趨勢、明日計畫)。
這完全貼合你慣用的 fire-and-forget + 每日 digest 模式。等方向鎖定後,我會直接輸出 PLANS.md + AGENTS.md 給你的 agent harness(/goal 流程)用,並打包成可重用的 SKILL.md。