挑戰輝達統治力:Cohere發佈開源輕量化語音模型Transcribe

在企業級AI市場動作頻頻的Cohere公司,於2026年3月26日正式推出了名為Cohere Transcribe的開源語音識別模型。這款模型擁有20億參數,專為邊緣裝置設計,旨在打破以往語音模型因體積過大而導致的延遲瓶頸。通過採用Apache 2.0協議開源,Cohere試圖效仿Meta的路徑,利用開發者社區的力量快速完善生態,並最終實現商業化反哺。

邊緣側的性能怪獸:支援14種語言且超越主流對手。Cohere Transcribe在訓練中涵蓋了包括中文、日語、法語和希伯來語在內的14種語言。根據Hugging Face開放ASR排行榜的最新資料,該模型在性能指標上已經超越了ElevenLabs Scrie和阿里旗下的Qwen3等同類競品。

得益於精簡的參數量,它能直接部署在手機、PC或工業閘道器等終端裝置上,無需頻繁呼叫雲端算力,這不僅極大地降低了資料傳輸延遲,也為銀行、銷售和醫療等對隱私高度敏感的行業提供了更安全的解決方案。

從文字到語音的戰略擴張:重塑智能體互動基石。雖然Cohere過去一直深耕文字生成領域,但此次跨界語音識別被視為其建構全能AI智能體(Agent)的關鍵一步。公司宣佈,Cohere Transcribe即將整合進其AI智能體編排平台North中。

分析人士指出,隨著Siri式的語音互動成為AI浪潮的起點,語音能力已成為智能體感知世界的必備“耳朵”。Cohere正通過這種“小而強”的開源策略,在邊緣計算和即時語音翻譯市場與IBM、阿里巴以巴及推出AI Companion 3.0的Zoom展開正面交鋒。 (AI的記錄日常)