ElevenLabs不只是一家做音訊模型的公司。
AI音訊賽道,衝出一家百億美元獨角獸!
智東西2月5日報導,昨天,英國AI音訊獨角獸ElevenLabs宣佈完成5億美元的D輪融資,估值達110億美元。其估值較去年年初的33億美元,實現了超230%的飛速增長。ElevenLabs聯合創始人兼CEO Mati Staniszewski還透露,該公司已在考慮IPO事宜。
本輪融資由紅杉資本領投。已參與ElevenLabs多輪融資的a16z追加4倍投資,ICONIQ追加3倍投資,這意味這兩家投資機構增大了在ElevenLabs的持股比例。
ElevenLabs於2022年成立於英國倫敦,最初主要從事文字轉語音模型的開發,後來也陸續打造了語音轉文字模型、AI音效模型、AI配音模型、AI音樂模型等領域。
該公司既向企業提供語音API服務,也為創作者和品牌提供音訊生成平台ElevenCreative,還通過ElevenAgents平台向企業提供AI語音客服服務。你甚至能在知名遊戲《堡壘之夜》裡找到由ElevenLabs生成的音訊。2025年底,ElevenLabs的ARR(年度經常性收入)已經超過3.3億美元。
自成立以來,ElevenLabs已完成五輪融資,累計融資總額達到7.81億美元。輝達此前曾參與ElevenLabs的C輪融資。輝達創始人兼CEO黃仁勳稱,ElevenLabs打造了世界上最好的語音AI產品,他主動向輝達團隊推薦了ElevenLabs。如今,黃仁勳在各類大會上以虛擬卡通形象出現時,就會用ElevenLabs的工具來復刻自己的聲音。
從融資規模、收入增長到資本陣容,ElevenLabs已經穩穩位居全球AI音訊賽道的第一梯隊。這樣一家成立不到4年、卻能在競爭激烈的語音AI領域中快速拉開身位的公司,顯然不只是踩中了風口那麼簡單。它背後的創業起點、關鍵選擇,以及對產品與市場的理解,值得深度拆解。
ElevenLabs的兩位聯合創始人Mati Staniszewski和Piotr Dabkowski都來自波蘭。受到童年時觀看的那些配音糟糕的美國電影的啟發,他們決定打造一款AI工具,來解決這一問題。
在創業之前,Mati Staniszewski曾在瀏覽器公司Opera、投資與技術供應商貝萊德以及資料智能上市公司Palantir任職。而Piotr Dabkowski自畢業後,就一直在Google擔任軟體工程師,直至2022年與Mati Staniszewski一同創業。
初出茅廬的ElevenLabs究竟能給這個行業帶來什麼變化?在2023年投資ElevenLabs之際,a16z的投資人Bryan Kim闡述了他對ElevenLabs潛力的理解。
Bryan Kim認為,儘管語音轉文字技術已經存在了數十年,但它未能發揮全部潛力。大多數合成語音缺乏吸引人的語調和發音,缺乏個性感,而高端的人工錄製語音服務雖然存在,但冗長的製作流程和高昂的成本使得這項技術在大多數即時和互動場景中難以實現。
ElevenLabs的出現,就是要滿足這些場景對高品質語音的需求。
2023年1月,ElevenLabs首次推出了語音設計和克隆產品,並對現有的文字轉語音模型進行了顯著改進。之後還陸續推出多款文字轉語音模型,擴展多語言支援,甚至拿下了一些已故知名演員的聲音版權,進行克隆並對外提供商業化服務。
上線6個月後,ElevenLabs已積累超過100萬註冊使用者,創作了總計時長超過10年的音訊內容。2024年11月時,其使用者數量已經超過3300萬。2025年,其ARR邁過了1億美元大關。
在2025年6月的一場採訪中,ElevenLabs的增長負責人Luke Harries透露,該公司能實現如此快速的增長,背後主要有兩大驅動力。
一方面,ElevenLabs的基礎模型能力不斷迭代,在表現力、真實感上不斷提升。ElevenLabs認為,語音模型與其他AI模型不同,規模和資料量不是最重要的決定因素,反而是模型架構發揮著重要作用。
領導ElevenLabs研究工作的聯合創始人Piotr Dabkowski憑藉自己的影響力,招募到了多位世界頂尖的語音AI研究員,該公司已在模型架構上取得一些突破。不過由於他們打造的是閉源模型,外界無從知曉這些改進究竟在那些方面。
另一方面,ElevenLabs還很擅長市場行銷工作。該公司懂得如何利用社交媒體的力量,還通過舉辦駭客松比賽、製作另類Demo等方式破圈,實現爆發式增長。
而在企業客戶方面,ElevenLabs認為在企業級市場應該採用自下而上的打法,也就是先從消費級和開發者切入,在建立名聲和信任後,大型客戶自然會來。
不過,ElevenLabs並不想把自己限定在音訊模型這一狹窄的賽道,該公司瞄準的是更大的市場。
在一場與TechCrunch錄製的播客中,Mati Staniszewski稱,ElevenLabs想解決的根本問題,是人類與科技產品如何互動的問題,這是他們一直以來開發產品的主線。
最初,ElevenLabs打造了文字轉語音模型,讓科技產品中的語音聽起來更像人。但要打造真正優秀的體驗,光有逼真的人聲是不夠的,AI還需要能夠生成聲音、音樂,並具備對語音的理解力。Mati Staniszewski認為這是該公司從成立以來到2025年上半年的最大重心。
但事實上,Mati Staniszewski認為音訊模型這條賽道本身並沒有什麼前景:“這一賽道或許在未來1-2年內仍是成立的,但再過幾年,這項技術就會完全商品化(Commoditized)”。
如今,ElevenLabs還在造模型的原因是,短期內它還是提升AI音訊產品質量的最好方式。但隨著這項技術日趨成熟、易於獲取,成為可大量採購的“標準件”,音訊模型或許會成為廣泛的底層基礎能力,而非核心競爭優勢。
於是,在2025年下半年,Mati Staniszewski帶領ElevenLabs進行了一項重要的戰略調整,如今,ElevenLabs的首要任務是幫助企業部署對話智能體,並能以新的方式與使用者、客戶互動。
Mati Staniszewski判斷,隨著智能體、對話智能體和語音智能體的興起,使用者可以與裝置交談了,但要讓這些智能體真正產生價值,就需要將大量資訊和知識庫帶入智能體內部,使其能夠與現有系統整合。
整合後,這些產品還需要具備可測試、可評估、可監控的特點,這樣才能獲取企業級客戶的信任。
這些智能體的主要應用場景,其實就是AI語音客服。ElevenLabs的智能體是多模態的,可以理解口頭或書面輸入,像人類一樣傾聽、閱讀並與客戶互動。企業還可對這些智能體進行定製化,在ElevenLabs提供的可視化工具中打造出對話流,精確定義這些智能體該如何與客戶互動。
這一戰略決策,讓ElevenLabs得以在企業級市場進一步攻城略地。如今,在語音智能體賽道,他們的一些大客戶包括Cisco(思科)、Meta、Salesforce等等,而在音訊創作領域,迪士尼、Epic等影視與遊戲製作公司都在使用其產品。
反映到ARR上,ElevenLabs在做出這一戰略轉向後,ARR增速明顯加快。2025年初,ElevenLabs達到1億美元ARR時,用時為20個月,而緊接著跨越2億美元ARR大關僅用時10個月。
2026年初,當ElevenLabs宣佈實現3.3億美元ARR時,距離他們達成2億美元ARR的時間僅為5個月。
語音AI賽道,並不缺乏優秀的模型。中國的MiniMax、阿里、海外的Google、OpenAI等公司都曾打造優秀的語音產品,那麼,ElevenLabs的差異化優勢在那兒?
就像軟體和硬體的結合才是蘋果公司的魔力一樣,Mati Staniszewski認為,AI模型與產品的結合才能發揮最大價值。
ElevenLabs雖然也會研究一些前沿方向,比如開源視訊模型與語音模型的結合,但他們更重視的始終是打造更好的產品,不會像競爭對手那樣訓練一些計算密集或資料密集的模型。
同時,Mati Staniszewski還認為ElevenLabs具備更高的專注度,他們直接專注於解決人類與電腦進行語音互動的問題,該公司的願景是獨立於競爭對手們所做的事情之外的。
拿到新融資後,ElevenLabs的首要目標是推動其智能體產品的發展。未來幾天,他們很快會推出適用於智能體平台的全新對話模型,能更快、更準確地理解和表達感情。
如今,ElevenLabs已經是一家擁有400名員工的公司了,與其他估值相近的AI創企相比,這已經幾乎可以算是大公司了。
ElevenLabs正在倫敦、紐約、舊金山、華沙、都柏林、東京、首爾、新加坡、班加羅爾、雪梨、聖保羅、柏林、巴黎和墨西哥城等地開展國際擴展,並配備本地化的市場推廣團隊,這對該公司旗下的語音AI業務而言,尤其重要。
回頭看ElevenLabs的成長路徑,它並沒有走一條堆參數、拼算力的傳統模型公司路線,而是始終圍繞一個更底層的問題推進:語音和音訊,究竟在真實世界裡如何被使用。而在戰略層面,他們又足夠清醒地判斷出“音訊模型終將商品化”,果斷將重心轉向對話智能體與企業場景。
這是一種“產品先行、模型服務於產品”的打法,讓ElevenLabs在語音AI這個擁擠的賽道中擁有了差異化的特點。而這或許也是頭部企業和頂級風投,願意重金押注ElevenLabs的關鍵。 (智東西)