七種宿命下的大模型創業
中國大模型還在如火如荼,但國外的一些生成式AI先鋒們,正在上演一場生死出逃大戲。
3月下旬,美國生成式AI 明星公司Stability AI突然宣佈公司CEO莫斯塔克(Emad Mostaque)辭職。莫斯塔克也在社媒平台推特(X)上表示,離職後將致力於去中心化AI。至於什麼是去中心化AI,生產式AI怎麼就過時了,就語焉不詳了。
這當然都是藉口。最大的原因,就是Stability AI沒錢了。
根據《富比士》報道,Stability曾經是人工智慧最熱門的新創公司之一,但幾個月來,它的資金已經耗盡,莫斯塔克也無法獲得足夠的額外資金。它拖欠了亞馬遜的付款,亞馬遜AWS曾一度威脅要撤銷對未付帳單的存取權。此外,還拖欠了Google和CoreWeave的雲端服務費用。
根據《富比士》引用的Stability內部財務報告,Stability AI 2023年總預計成本為1.53億美元,但預計收入僅1,100萬美元。
入不敷出,自然要垮,不稀罕。
但稀罕的是,按照Stability AI的表現,如果是在中國,在這個大模型投資火熱還沒有退去的時候,一億多美元的前期虧損,不管是前期投資方還是尋找後續輪次融資,幾家投資機構合作的話也不是負擔不起,只要公司能證明自己未來的潛力。例如中國就有不少大模型企業獲得數億美元以上等級的投資,且獲得投資時並未獲利。
至少在中國,一些大模型獨角獸企業由於正處於創業初期,儘管已經收穫訂單,但走向盈利依然需要時日。前期一、兩年虧損,本來就是大模型產業的常態。所以,光是虧了一年就要崩,未必是Stability AI不行的真正原因。
那麼,為什麼在美國通貨膨脹、資本不缺美元的當下,Stability AI要不行了呢?沒錢付費雲端服務了,投資人不投了,創辦人內訌了,客戶不買了,被巨頭取代了,晶片斷供了……大模型企業,真的是慘到有那麼多種死法在等著。
那麼,梳理中外各類大模型企業,大模型企業,到底需要面對多少種「坑」?到底是什麼樣的大模型才能捲出來?大模型跑出來,要面對哪些兩難、必經宿命?
Stability AI的技術真的不行嗎?要知道,其文生圖大模型產品Stable Diffusion,與OpenAI的DALL-E以及Midjourney,被業界公認為文生圖領域的三巨頭。 Stable Diffusion 在2022 年8 月推出,以開源底層程式碼的形式在HuggingFace/Github 公開發布,因此也為最多人使用。
根據Everypixel統計,從1826 年第一張照片拍攝到1975 年,底片相機花了近150 年才拍攝約150 億張照片。而從2022年2月到2023年8月,僅用一年半時間,使用文生圖演算法就已經產生了超過150 億張圖片,其中大約80%的圖像(即125.9 億張)是用Stable Diffusion創建的。
而且,因為Stable Diffusion是開源模型,使用該模型產生的圖片不限於Stability AI 官方平台,所以官方平台之外產生的圖片量可能還會更多。由此也可見Stable Diffusion在業界的地位。
但即使如此,技術行,市場不行,投資人也不會認可。
2023年才賺了1,100萬美元,而OpenAI卻賺得盆滿缽滿(當然算力支出也與日俱增)。
根據英國金融時報引述知情人士透露,OpenAI的2023年營收可能已經達到20億美元(月收入乘以12的衡量標準)。知情人士補充稱,越來越多企業客戶採用生成式AI工具來提高工作效率,到2025年這一數字有望翻倍。
不過,這就夠了嗎?
並不是沒有人懷疑。
紅杉資本在近期舉行的AI Ascent 2024上就表示,2023年,各家AI公司在輝達GPU上已經大手大腳花去500億美元,但由此產生的收入才有30億美元。
如果拋開OpenAI的20億美元年收入,那以紅杉資本的30億美元估計,其他數百上千家大小大模型企業的總營收只有10億美元,明顯規模還不夠大。
另根據分析公司Similarweb的數據,自2023年4月開始, ChatGPT平台訪問量就出現下滑,2023年年8月訪問量比5月下降21%。美國AI 分析師Alberto Romero也認為,AI 平台訪問量停滯不前,許多大模型企業成長、營收和利潤率都不盡如人意,AI 新創公司的估值過高了。
沒有市場空有技術的企業,要危險了,因為投資人的錢是有限的,大家都會不約而同投給更有市場潛力的大模型企業,比如智譜AI、百川智能等企業就拿到了好幾家互有競爭關係巨頭的投資;投資人不再像以往網路創業高潮時,互相投幾個競品,大家互相燒錢,競爭到最後哪怕贏家也是慘勝。
事實上,2023年除了少數幾家大模型創業企業拿到大筆融資,大部分創業企業並沒有獲得大筆融資,反而在內卷的賽道中被大家拿放大鏡去尋找差錯。
就算是拿到大額融資的獨角獸,也有一些我們並沒有看到太多動作,比如MiniMax的產品就比較“藏在深閨”,儘管和金山辦公、掌閱、騰訊等企業也已經有合作落地案例,但相比其他幾家獨角獸,在曝光量上似乎沒有那麼多。是夠自信所以低調,還是避免被更多人拿放大鏡去看?
有些企業的低調,是因為PPT好做而產品難做,技術不好做但市場更難做。但沒有足夠的聲量去助威市場的開拓,光是技術有優勢未必不怕「巷子深」。
主打開來源的Stability AI,到底是怎麼賺錢的,市場在哪裡?開源等於免費嗎?其產品Stable Diffusion既然採用免費開源模式,又如何能夠獲利?
當然不是。
開源也可以賺錢。例如智譜AI就開源了ChatGLM-6B、GLM-130B等。當然,也不能說智譜是開源公司,智譜的選擇是開源先行,開源與閉源同時存在。開源是為了培育生態,佔領更多用戶。
使用者用習慣了,再開始賺錢:一是依照客戶需求,提供大模型客製化開發服務,雲端私有化本地私有化最高價格分別為120萬元/年和3,690萬元/年;二是標準版大模型,提供API存取方式,依Tokens使用收費,ChatGLM-Turbo、CharacterGLM、Text-Embedding收費標準分別為0.005元/千Tokens、0.015元/千Tokens、0.005元/千Tokens。據了解,目前,智譜AI的商業化主要針對企業和機構的B端用戶。
智譜CEO張鵬就曾指出,開源的好處是開發者可以低成本、快速地切入使用上大模型,但開源大模型在安全性、穩定性等方面很難得到保障,而商業版本可以提供更多的服務,更多的保障以及更多後續的服務。
此外,國外不少新創大模型企業也都用開源來開局,如Hugging Face推出的HuggingChat,例如美國晶片製造公司Cerebras(開源Cerebras-GPT)、Databricks(開源Dolly)等。
開源其實只是大模型企業用來敲開客戶大門的一塊敲門磚,客戶可以使用開源大模型訓練一定參數的、在企業內部部署的大模型,只要客戶用習慣自己的開源模型,就可以轉為付費用戶,購買調試更加完美的閉源大模型,從而享受更全面的大模型服務。
而Meta的Llama 2在2023年7月宣布開源,並且可直接商用。巨頭的開源就不同於創業的開源,不僅是為了當敲門磚,而是仿照安卓開源的思路,在落後於OpenAI之後,試圖用免費開源吸引更多開發者從而構建出強大完整的生態,日後再透過生態獲利。
所以,拆解Stability AI的問題,沒有市場的關鍵,就在於沒有走通從開源邁向閉源的商業一步,開源是為了能夠引導向可商業化的閉源,不能為了開源而開源。而OpenAI這類閉源大語言模型,B端會向接入其端口的APP應用收取費用,C端像用戶收取使用費用,走通了商業化之路,才能去暢談未來。
死了的或是投資人失去信心的大模型企業,基本上都是找錯了場景。
文生圖場景,能夠活下來幾家?
至少Stability AI沒有跑通,Midjourney等巨頭又基本壟斷了主要市場,創業者可以基於開源模型做開發還可以走,一些藝術家也在AI文生圖領域做輕創業。但想做一個類似Midjourney這樣的文生圖大模型,靠C端付費獲利,就基本上被堵死了這條路。
谷歌的文生圖大模型Imagen 2有多少人用?當然,中國還是有大廠在做,如文心一格大模型,美圖的文生圖模型等。
但美圖主要還是用大模型技術,實現AI繪畫、AI擴圖、AI頭像、牙齒矯正、AI去皺紋等功能,本質上是對以往美顏功能的再強化。
不過,美圖並不避諱俗氣的美顏。美圖CEO吳欣鴻曾在財報電話會裡指出:「我們不能無邊無際去做一個大而全,什麼能力都有,但不知道要給誰用的模型。美圖一開始就是有明確的需求和場景來反推模型的研發。”
所以美圖不做高大上的、Midjourney一樣的文生圖,而是根據固定指令去做輕量化但很實用的“文生圖”,進一步優化用戶的美顏需求。
程式碼生成,也是大模型企業最想落地商業化的場景。
智譜AI CEO張鵬曾表示,國外真正的AI落地過程當中最明確的一個需求、一個場景就是代碼輔助,大概佔整個付費意願裡面50%以上的場景,智譜也在中國做類似的落地。
商湯也在今年推出「小浣熊」2.0版本,包含辦公室輔助、程式碼輔助等功能。小浣熊基於日日新SensNova大模型,在程式碼輔助上,評測指出可以幫助開發者提升程式效率超50%。
此外,AI Agent也被許多大模型企業視為變現的重要道路。什麼是AI Agent?其實就是不必人類一步一步下指令,可以自主感知、規劃決策、執行複雜任務,這就需要在大模型基礎上,增加規劃(Planning)、記憶(Memory)、工具(Tools)等組件。要不然每個任務還需要一個單獨的指令下達人員,對企業來說也就不能節省成本。
找對場景,可以獲得營收。找錯了場景,燒完錢可能就會面臨經營難以維繫的窘境。
不過,中國的大模型企業,除了少數新創企業,大部分背後還有一個可以輸血的母公司。賠多了不敢說,但一兩億美元的前期投資,一般還是能夠支持,找錯場景趕緊切換,還能有一些容錯的時間。
至少在去年,業界多將大模型的落地市場,分為通用大模型和垂直大模型兩大類。
通用大模型,一般參數千億以上聚焦基礎層,百度文心一言,阿里通義千問、科大訊飛星火大模型等。
垂直大模型,一般參數在十億、百億級別,聚焦解決垂直領域問題,一般在通用大模型基礎上訓練行業專用模型,應用到各類垂直行業。
一般而言,通用大模型做C端,或賦能垂直大模型;垂直大模型則主做B端。但這個分類,真的能夠囊括這麼多類型的大模型創業嗎?
誰更賺錢?
垂直未必不賺錢。前幾天據報道,就有一家企業中標了千萬級的湘鋼人工智慧鋼鐵大模型建設專案(硬體部分)。
通用也未必不賺錢。據百度在剛結束的GENERATE 生態大會上透露,截至2024年3月底,百度智能雲的千帆大模型平台已經為8.5萬家企業提供服務,幫助他們精調了1.4萬個大模型,並開發出超過19萬個大模型應用。顯然,這些服務不會都是免費的。
不過,大家依然打的難捨難分。
你百度賦能產業,我阿里、位元組同樣能做到。
2023雲棲大會上,阿里巴巴集團主席蔡崇信透露,目前全國80%的科技企業和超過一半的AI大模型公司跑在阿里雲上。阿里雲同樣在賦能千行百業。
火山引擎在2023年一場會議上也透露,火山引擎的大模型雲平台獲得智譜AI、崑崙萬維等眾多企業的良好回饋;中國大模型領域,七成以上已是火山引擎客戶。
做通用的巨頭,真的就能三分天下或是五分大模型天下?巨頭既做賦能自己也下場做大模型,如何和生態夥伴相處?
這些問題不解決,通用大模型也未必能一直穩坐釣魚台。
通用和專業大模型,其實還可以轉換成另一個問題,做C端還是B端?通用大模型兩者皆可,而垂直大模型基本上都是做B端。
相較於對C端客戶收費,一個月幾十塊一年幾百塊,10萬級的付費用戶數才能做出數千萬的營收。而且,中國用戶很難習慣對軟體付費,畢竟摸不著。就算中國率先對C端收費的通用大模型,也沒有公佈相關的營收。
做B端,拿到幾個專案就能做到幾千萬營收。而且,雖然AI時代不同於網路時代,但網友們依然習慣免費精神,能夠持續付費的就只有B端了。
那麼,B端就比C端更容易跑通商業化之路嗎?
在金融、工業、協同辦公等領域,幫助企業私有化部署大模型,看起來是個好生意。但同樣更多B端場景,客戶連資訊化、數位化都還沒有完全適應,更不要說再加個大模型。
而且,做B端就要深入嵌入企業業務流程,看起來拿下了客戶關鍵業務入口,但客戶對大模型的確定性要求也更高了。來個幻覺問題,怎麼辦?那就需要更多的人機協同,客戶發現投入越來越重,也會有所顧慮。
B端不好做,C端又不好付費,大模型創業,也更容易死亡在這種夾縫之中。
投資人朱嘯虎前段時間還在接受騰訊新聞《潛望》欄目專訪時給中國大模型產業潑了冷水,表示不看好中國大模型創業,認為大模型最終還是大廠的機會,和看好大模型創業的傅盛也在朋友圈觀點激辯。
爭辯未必分對錯,都是為了流量。不過,當很多人覺得缺卡會影響中國大模型創業時,其實,缺卡的大模型創業企業,未必就活得不好。反倒是一些不缺卡的大模型企業,其體驗未必能贏得顯示卡沒有那麼寬裕的創業企業。
關鍵是不能缺錢。
不缺錢的大模型新創企業,目前至少都活得風生水起。例如阿里投資的月之暗面、MiniMax、智譜AI、百川智能和零一萬物五家大模型獨角獸企業,當然,阿里、騰訊、字節等巨頭在五家獨角獸的投資上也都有所爭奪取捨。其中月之暗面、智譜AI和百川智能都非常活躍,月之暗面作為創業企業,也憑藉超長文本能力在業界掀起了一場長文本軍備競賽。
使用體驗上,根據一些同事分享,智譜AI等創業企業的大模型,使用體驗並不輸給一些巨頭旗下的大模型。
而筆者個人在測試月之暗面Kimi時,如果對話視窗輸入過多文字,整個瀏覽器(Chrome)崩潰的機率就會提高很多倍,筆記本風扇也因此「嗚嗚」轉起來。超長文本如果容易導致網頁崩潰,那產品依然還需要優化。在網頁介面上,月之暗面kimi似乎不夠精緻,跳動的對話機器人頭像也過於卡通(當然,美感偏好僅限於個人體驗)。
如果超長文本帶來的熱度不能讓團隊更進一步去優化迭代,那企業很可能又要陷入某一種大模型創業的艱難宿命中。
長期10年後會怎樣,誰也無法預測。但只要不缺錢,短期三、兩年內,這五家估值均超過10億美元的獨角獸必然有能夠跑出來的。而這幾家獨角獸,也不以顯示卡多為核心競爭力。
所以,缺卡不可怕。買不到最先進的輝達,中國也不是不能買替代卡或租用算力,只不過或許沒那麼順手而已。
缺卡,被業界渲染得過分可怕了。
當然,所有原因,歸根到底都是缺錢。不過,相較於缺卡、缺錢,未來大模型產業發展要面臨的更大問題,是缺電。
根據史丹佛人工智慧研究所(HAI)《2023年人工智慧指數報告》數據,OpenAI的GPT-3單次訓練耗電量高達1287兆瓦時(1兆瓦時=1000度)。如果跑費一輛特斯拉需要100萬公里,那麼單次訓練的耗電量能跑廢約1000輛特斯拉電動車。隨著模型參數越來越大,大模型企業訓練、推理需求進一步上升,耗電量也將幾何級上升。未來,或許還會有大模型企業,會不得不為電費折腰。
由英特爾牽頭髮起、面向商用領域的AI PC硬體產品與商業應用已經於3月正式發布,當然,除了英特爾之外,AMD、蘋果同樣重視個人電腦的AI化,都在探索CPU+GPU+NPU的多硬體加速器架構。酷睿Ultra、銳龍8040、蘋果M3等系列處理器皆對AI有特異化設計。
AI PC會影響大模型創業家嗎?畢竟消費者自己有了適合的端側的本地算力,可以運行十億、甚至百億級參數的大模型,還需要使用付費的雲端大模型嗎?
或許這一點不用擔心。以手機的端側大模型為例,目前vivo、OPPO、小米等最新的旗艦手機都搭載了端側大模型,使用手機算力進行推理。但受限於算力有限,目前效果,和發佈時的“賣家秀”相比就是“買家秀”,原來沒有那麼驚艷。
反倒是基於雲端算力的一些大模型APP、官網,在手機、電腦上的表現會更好。
據了解,由於合規問題,蘋果手機的AI功能不能使用谷歌的Gemini,而蘋果自研AI由於造車的耽擱,目前落後於對手,至少目前蘋果要想推出有競爭力的AI功能,只能與中國企業合作。有爆料指出,蘋果先前曾三家公司洽談合作AI 大模型,其分別有百度的文心一言、阿里的通義千問、月之暗面的Kimi,但分析稱目前機率最大的還是百度。
不過,端側的一大優勢,就是最接近使用者,一旦端側大模型進一步優化,或者類似蘋果尋找百度合作推出手機端側大模型,在效果可與雲端算力比拼的時候,非巨頭的大模型創業家又該如何因應?
畢竟,端側大模型使用本地算力,長期也不會收費。而現在免費使用的許多大模型,在C端終將有一天要走向收費,或者免費模式僅可使用表現一般的模型版本。
大模型創業家如何比拼才能避免死亡?
我們沒有答案。但大多時候,大模型產業整體都是缺錢的,都是刺刀見紅的,算力都是緊張的,C端都是一將功成萬骨枯的,B端都是難以憋出大招瞬間制勝的,通用大模型都是投入巨大的,專業大模型都是缺乏貫通行業的優質數據的,場景和市場都是千變萬化的……死因何止七種?
千難萬難,只有在有限的資源內做出更極致的產品,才能在未來的激烈競爭中佔有一席之地。(億歐觀點)
參考資料:Kenrick Cai and Iain Martin:Unpaid bills, bungled contracts and a disastrous meeting with Nvidia's kingmaker CEO. Inside the stunning downfall of Emad Mostaque.