企業 AI 公司 Cohere 宣布推出 Command A+,這是一款開源混合專家語言模型,專為企業級智能代理任務設計,且對算力需求相對較低。
該公司表示,此模型建立在 North(Cohere 用於開發和部署智能代理 AI 系統的企業工作空間)一年的工作成果之上,將 Command 系列的各項能力整合至單一模型,旨在支援實驗、部署和生產環境中的可擴展應用。
Command A+ 現已在 Apache 2.0 授權條款下提供,讓開發者可廣泛存取這款模型。Cohere 表示,此模型旨在支援主權 AI 部署,包括組織希望直接掌控基礎設施與模型行為的環境。此次發布包含可在 Hugging Face 上下載的模型權重,以及透過 Cohere 的 Model Vault 提供的實施指引和部署選項。
根據該公司公布的規格,此模型採用稀疏 MoE 架構,總參數量為 2,180 億,活躍參數量為 250 億,支援 128,000 個 Token 的輸入上下文,並可生成最多 64,000 個 Token。它專為文字、圖像和工具呼叫輸入而設計,並可在 48 種語言中產生文字、推理及工具呼叫輸出。
Cohere 表示,Command A+ 針對推理、檢索增強生成、多語言任務、多模態文件處理及智能代理工作流程進行了優化。該公司亦強調其硬體效率,指出此模型提供多種量化格式,包括 BF16、FP8 和 W4A4,並可在少量高端 GPU 上運行。此模型也被定位為 Cohere 迄今速度最快的發布版本,該公司指出,與先前的 Command 模型相比,其輸出速度有所提升、延遲降低了,並且 Token 效率更佳。Cohere 表示,推測解碼已針對模型架構進行調整,以在不影響輸出品質的前提下進一步提升推理速度。
該公司將 Command A+ 描述為早期 Command A 版本的整合繼任者,表示它在長上下文推理、多模態理解、檢索和程式碼生成等以企業為中心的任務上,超越了前幾代模型。Cohere 亦強調相較於 Command A Reasoning 的基準測試進步,包括在電信相關智能代理評估、基於終端機的程式編碼任務,以及 North 內部使用的評測指標上取得了更佳成績。此模型據稱也提升了試算表分析、智能代理問答及基於記憶的工作流程的表現。
多語言能力是此次發布的另一核心部分。Cohere 表示,Command A+ 將語言支援從 23 種擴展到了 48 種,同時提升了翻譯和多語言推理性能。該公司亦報告在非歐洲語言方面取得進展,包括阿拉伯語、韓語和日語的分詞效率有所改善。在多模態基準測試中,該模型據稱在文件和圖像推理任務上表現更強,包括 MathVista、MMMU 和 CharXiv 相關評估。
富士通對此次發布表達了業界關注,表示該模型的架構與智能代理性能與其自身的主權 AI 策略相符。Cohere 將此次發布定位為同時應對企業 AI 三大優先事項的更廣泛努力的一部分:能力、安全性與成本。該公司表示,未來的開發將持續聚焦於推理、多模態性能和程式編碼,同時確保模型適合在客戶掌控的環境中部署。
Command A+ 可透過 Hugging Face、Model Vault、Cohere 的 API 以及免費線上示範空間取得。Cohere 表示,相關文件和部署資料亦已提供給希望測試或將模型整合至企業工作流程的組織。
The Post Cohere Unveils Command A+, Advancing Sovereign And Efficient Enterprise AI Deployment 最先出現在 Metaverse Post。


