挑戰輝達統治力：Cohere發佈開源輕量化語音模型Transcribe

2026/03/29

•

在企業級AI市場動作頻頻的Cohere公司，於2026年3月26日正式推出了名為Cohere Transcribe的開源語音識別模型。這款模型擁有20億參數，專為邊緣裝置設計，旨在打破以往語音模型因體積過大而導致的延遲瓶頸。通過採用Apache 2.0協議開源，Cohere試圖效仿Meta的路徑，利用開發者社區的力量快速完善生態，並最終實現商業化反哺。

邊緣側的性能怪獸：支援14種語言且超越主流對手。Cohere Transcribe在訓練中涵蓋了包括中文、日語、法語和希伯來語在內的14種語言。根據Hugging Face開放ASR排行榜的最新資料，該模型在性能指標上已經超越了ElevenLabs Scrie和阿里旗下的Qwen3等同類競品。

得益於精簡的參數量，它能直接部署在手機、PC或工業閘道器等終端裝置上，無需頻繁呼叫雲端算力，這不僅極大地降低了資料傳輸延遲，也為銀行、銷售和醫療等對隱私高度敏感的行業提供了更安全的解決方案。

從文字到語音的戰略擴張：重塑智能體互動基石。雖然Cohere過去一直深耕文字生成領域，但此次跨界語音識別被視為其建構全能AI智能體（Agent）的關鍵一步。公司宣佈，Cohere Transcribe即將整合進其AI智能體編排平台North中。

分析人士指出，隨著Siri式的語音互動成為AI浪潮的起點，語音能力已成為智能體感知世界的必備“耳朵”。Cohere正通過這種“小而強”的開源策略，在邊緣計算和即時語音翻譯市場與IBM、阿里巴以巴及推出AI Companion 3.0的Zoom展開正面交鋒。 (AI的記錄日常)

科技