多個 AI 模型協同工作、對外只呈現一個 API,Sakana AI 於 2026 年 6 月 22 日正式發布 Sakana Fugu,一套以強化學習訓練的協調模型自動分配任務給多個專業 Agent 的系統。
(前情提要:Anthropic 遭美國政府「封殺」撤下 Fable 模型,外媒指三大隱憂:恐助攻中國開源 AI)
(背景補充:馬斯克變身算力軍火商!SpaceX 簽下 Reflection 63 億美元大單,出租 Nvidia GB300 助攻開源 AI)
本文目錄
- 指揮官模型的工作原理
- 比肩受限的頂級模型
- 定價結構與市場限制
多個頂尖 AI 模型同時上場,不過只需要呼叫一個 API,這是 Sakana AI 在 Fugu 上的核心賭注。本週一(22 日),日本 AI 研究室 Sakana AI 正式發布 Sakana Fugu。
定位為「以系統取代單一模型」:一套自動指揮多個專業 Agent 協同工作的框架,對外只暴露一個 OpenAI 相容的標準 API 介面。用戶不需要知道後臺有幾個模型在跑、也不需要手動設計協作流程,一切由 Fugu 內部的指揮機制負責分派。
指揮官模型的工作原理
Fugu 的底層架構有兩個創新:TRINITY 和 Conductor。
TRINITY 設計了三角分工架構:任務被拆給三種角色,「思考者(Thinker)」負責規劃方案,「執行者(Worker)」負責實作,「驗證者(Verifier)」負責找漏洞。
三個角色由不同的 LLM 分別擔任,形成相互制衡的工作組。簡單來說就是:不讓同一個模型既想方案又批改答案。
Conductor 則是整個系統的核心,一個以強化學習訓練的 7B 引數協調模型,負責決定每次任務要呼叫哪些 Agent、如何讓它們溝通,以及如何整合最終輸出。這個模型不依賴預先設計的工作流程,而是透過訓練自己摸索出最有效的協作路徑,Sakana 稱之為「非直觀但高效的協作模式」。
Agent 池的組成可以彈性調整。Standard 層級允許企業用戶排除特定供應商或模型,以符合資料隱私或合規要求,對不允許資料出境的機構而言,這是一個關鍵的差異化設計。
比肩受限的頂級模型
Sakana 用四個基準測試對比 Fugu 與前沿模型的表現。
- SWE Bench Pro(軟體工程程式碼修復能力):Fugu 59.0 分、Fugu Ultra 73.7 分
- LiveCodeBench(即時程式競賽):Fugu 92.9、Fugu Ultra 93.2
- GPQA Diamond(研究生等級跨學科問答,難度接近博士資格考):Fugu 與 Fugu Ultra 同為 95.5
- Humanity’s Last Exam(由全球頂尖學者設計的極難題庫):Fugu 47.2、Fugu Ultra 50.0。
Sakana 宣稱這些數字「在嚴格基準測試上比肩 Mythos Preview 和 Fable 5」,但目前還有待第三方機構驗證。
定價結構與市場限制
Fugu 分三個訂閱層級:Standard 每月 20 美元、Pro 每月 100 美元(10 倍用量)、Max 每月 200 美元(20 倍用量),三個層級均包含 Fugu 與 Fugu Ultra 的使用權限。
另外提供企業 Token 計費方案,Fugu Ultra 費率為每百萬輸入 Token 5 美元、每百萬輸出 Token 30 美元;超過 272,000 Token 的長上下文場景,費率調整為 10 美元輸入、45 美元輸出。
一個值得關注的計費邏輯:Sakana 強調,在任務中協同呼叫更多 Agent 並不意味著費用等比增加。定價機制依據活躍 Agent 池中層級最高的模型採單一混合費率計算,換句話說,加入第二個或第三個 Agent 不會翻倍帳單,這與自行串接多家 API 相比,在複雜任務上有明顯的成本優勢。
目前最明確的限制是地理範圍:Fugu 不向歐盟與歐洲經濟區(EEA)的用戶開放,官方理由是正在推進 GDPR 合規認證,時程未定。2026 年 7 月前完成訂閱的早期用戶可獲得第二個月免費。
多個模型協同跑贏單一模型,這不是 Sakana 提出的新命題。他們真正在主張的是:指揮官架構裡的每一個 Agent 都可以替換,系統的天花板因此不被任何一個供應商鎖定。
📍相關報導📍
AI 算力吃電怪獸!雪佛龍拿下微軟 20 年協議建專屬天然氣電廠,首批電力 2028 年上線
美光戰略投資 Anthropic H 輪融資!雙方簽署 HBM 長期供應協議,$MU 股價狂飆破 1200 鎂創歷史新高
美國宣布解除「伊朗石油制裁」60 天,荷姆茲海峽危機緩解、全球通膨降溫有望
資安專家:與 Claude Mythos 同樣危險的 AI 模型根本擋不住,24 個月內將遍地都是
Claude Fable 自我改進系統實戰:迴圈、動態工作流與 Routines 完整指南








