七種宿命下的大模型創業

2024/04/11

•

中國大模型還在如火如荼，但國外的一些生成式AI先鋒們，正在上演一場生死出逃大戲。

3月下旬，美國生成式AI 明星公司Stability AI突然宣佈公司CEO莫斯塔克（Emad Mostaque）辭職。莫斯塔克也在社媒平台推特（X）上表示，離職後將致力於去中心化AI。至於什麼是去中心化AI，生產式AI怎麼就過時了，就語焉不詳了。

這當然都是藉口。最大的原因，就是Stability AI沒錢了。

根據《富比士》報道，Stability曾經是人工智慧最熱門的新創公司之一，但幾個月來，它的資金已經耗盡，莫斯塔克也無法獲得足夠的額外資金。它拖欠了亞馬遜的付款，亞馬遜AWS曾一度威脅要撤銷對未付帳單的存取權。此外，還拖欠了Google和CoreWeave的雲端服務費用。

根據《富比士》引用的Stability內部財務報告，Stability AI 2023年總預計成本為1.53億美元，但預計收入僅1,100萬美元。

入不敷出，自然要垮，不稀罕。

但稀罕的是，按照Stability AI的表現，如果是在中國，在這個大模型投資火熱還沒有退去的時候，一億多美元的前期虧損，不管是前期投資方還是尋找後續輪次融資，幾家投資機構合作的話也不是負擔不起，只要公司能證明自己未來的潛力。例如中國就有不少大模型企業獲得數億美元以上等級的投資，且獲得投資時並未獲利。

至少在中國，一些大模型獨角獸企業由於正處於創業初期，儘管已經收穫訂單，但走向盈利依然需要時日。前期一、兩年虧損，本來就是大模型產業的常態。所以，光是虧了一年就要崩，未必是Stability AI不行的真正原因。

那麼，為什麼在美國通貨膨脹、資本不缺美元的當下，Stability AI要不行了呢？沒錢付費雲端服務了，投資人不投了，創辦人內訌了，客戶不買了，被巨頭取代了，晶片斷供了……大模型企業，真的是慘到有那麼多種死法在等著。

那麼，梳理中外各類大模型企業，大模型企業，到底需要面對多少種「坑」？到底是什麼樣的大模型才能捲出來？大模型跑出來，要面對哪些兩難、必經宿命？

Stability AI的技術真的不行嗎？要知道，其文生圖大模型產品Stable Diffusion，與OpenAI的DALL-E以及Midjourney，被業界公認為文生圖領域的三巨頭。 Stable Diffusion 在2022 年8 月推出，以開源底層程式碼的形式在HuggingFace/Github 公開發布，因此也為最多人使用。

根據Everypixel統計，從1826 年第一張照片拍攝到1975 年，底片相機花了近150 年才拍攝約150 億張照片。而從2022年2月到2023年8月，僅用一年半時間，使用文生圖演算法就已經產生了超過150 億張圖片，其中大約80%的圖像（即125.9 億張）是用Stable Diffusion創建的。

而且，因為Stable Diffusion是開源模型，使用該模型產生的圖片不限於Stability AI 官方平台，所以官方平台之外產生的圖片量可能還會更多。由此也可見Stable Diffusion在業界的地位。

但即使如此，技術行，市場不行，投資人也不會認可。

2023年才賺了1,100萬美元，而OpenAI卻賺得盆滿缽滿（當然算力支出也與日俱增）。

根據英國金融時報引述知情人士透露，OpenAI的2023年營收可能已經達到20億美元（月收入乘以12的衡量標準）。知情人士補充稱，越來越多企業客戶採用生成式AI工具來提高工作效率，到2025年這一數字有望翻倍。

不過，這就夠了嗎？

並不是沒有人懷疑。

紅杉資本在近期舉行的AI Ascent 2024上就表示，2023年，各家AI公司在輝達GPU上已經大手大腳花去500億美元，但由此產生的收入才有30億美元。

如果拋開OpenAI的20億美元年收入，那以紅杉資本的30億美元估計，其他數百上千家大小大模型企業的總營收只有10億美元，明顯規模還不夠大。

另根據分析公司Similarweb的數據，自2023年4月開始， ChatGPT平台訪問量就出現下滑，2023年年8月訪問量比5月下降21%。美國AI 分析師Alberto Romero也認為，AI 平台訪問量停滯不前，許多大模型企業成長、營收和利潤率都不盡如人意，AI 新創公司的估值過高了。

沒有市場空有技術的企業，要危險了，因為投資人的錢是有限的，大家都會不約而同投給更有市場潛力的大模型企業，比如智譜AI、百川智能等企業就拿到了好幾家互有競爭關係巨頭的投資；投資人不再像以往網路創業高潮時，互相投幾個競品，大家互相燒錢，競爭到最後哪怕贏家也是慘勝。

事實上，2023年除了少數幾家大模型創業企業拿到大筆融資，大部分創業企業並沒有獲得大筆融資，反而在內卷的賽道中被大家拿放大鏡去尋找差錯。

就算是拿到大額融資的獨角獸，也有一些我們並沒有看到太多動作，比如MiniMax的產品就比較“藏在深閨”，儘管和金山辦公、掌閱、騰訊等企業也已經有合作落地案例，但相比其他幾家獨角獸，在曝光量上似乎沒有那麼多。是夠自信所以低調，還是避免被更多人拿放大鏡去看？

有些企業的低調，是因為PPT好做而產品難做，技術不好做但市場更難做。但沒有足夠的聲量去助威市場的開拓，光是技術有優勢未必不怕「巷子深」。

主打開來源的Stability AI，到底是怎麼賺錢的，市場在哪裡？開源等於免費嗎？其產品Stable Diffusion既然採用免費開源模式，又如何能夠獲利？

當然不是。

開源也可以賺錢。例如智譜AI就開源了ChatGLM-6B、GLM-130B等。當然，也不能說智譜是開源公司，智譜的選擇是開源先行，開源與閉源同時存在。開源是為了培育生態，佔領更多用戶。

使用者用習慣了，再開始賺錢：一是依照客戶需求，提供大模型客製化開發服務，雲端私有化本地私有化最高價格分別為120萬元/年和3,690萬元/年；二是標準版大模型，提供API存取方式，依Tokens使用收費，ChatGLM-Turbo、CharacterGLM、Text-Embedding收費標準分別為0.005元/千Tokens、0.015元/千Tokens、0.005元/千Tokens。據了解，目前，智譜AI的商業化主要針對企業和機構的B端用戶。

智譜CEO張鵬就曾指出，開源的好處是開發者可以低成本、快速地切入使用上大模型，但開源大模型在安全性、穩定性等方面很難得到保障，而商業版本可以提供更多的服務，更多的保障以及更多後續的服務。

此外，國外不少新創大模型企業也都用開源來開局，如Hugging Face推出的HuggingChat，例如美國晶片製造公司Cerebras（開源Cerebras-GPT）、Databricks（開源Dolly）等。

開源其實只是大模型企業用來敲開客戶大門的一塊敲門磚，客戶可以使用開源大模型訓練一定參數的、在企業內部部署的大模型，只要客戶用習慣自己的開源模型，就可以轉為付費用戶，購買調試更加完美的閉源大模型，從而享受更全面的大模型服務。

而Meta的Llama 2在2023年7月宣布開源，並且可直接商用。巨頭的開源就不同於創業的開源，不僅是為了當敲門磚，而是仿照安卓開源的思路，在落後於OpenAI之後，試圖用免費開源吸引更多開發者從而構建出強大完整的生態，日後再透過生態獲利。

所以，拆解Stability AI的問題，沒有市場的關鍵，就在於沒有走通從開源邁向閉源的商業一步，開源是為了能夠引導向可商業化的閉源，不能為了開源而開源。而OpenAI這類閉源大語言模型，B端會向接入其端口的APP應用收取費用，C端像用戶收取使用費用，走通了商業化之路，才能去暢談未來。

死了的或是投資人失去信心的大模型企業，基本上都是找錯了場景。

文生圖場景，能夠活下來幾家？

至少Stability AI沒有跑通，Midjourney等巨頭又基本壟斷了主要市場，創業者可以基於開源模型做開發還可以走，一些藝術家也在AI文生圖領域做輕創業。但想做一個類似Midjourney這樣的文生圖大模型，靠C端付費獲利，就基本上被堵死了這條路。

谷歌的文生圖大模型Imagen 2有多少人用？當然，中國還是有大廠在做，如文心一格大模型，美圖的文生圖模型等。

但美圖主要還是用大模型技術，實現AI繪畫、AI擴圖、AI頭像、牙齒矯正、AI去皺紋等功能，本質上是對以往美顏功能的再強化。

不過，美圖並不避諱俗氣的美顏。美圖CEO吳欣鴻曾在財報電話會裡指出：「我們不能無邊無際去做一個大而全，什麼能力都有，但不知道要給誰用的模型。美圖一開始就是有明確的需求和場景來反推模型的研發。”

所以美圖不做高大上的、Midjourney一樣的文生圖，而是根據固定指令去做輕量化但很實用的“文生圖”，進一步優化用戶的美顏需求。

程式碼生成，也是大模型企業最想落地商業化的場景。

智譜AI CEO張鵬曾表示，國外真正的AI落地過程當中最明確的一個需求、一個場景就是代碼輔助，大概佔整個付費意願裡面50%以上的場景，智譜也在中國做類似的落地。

商湯也在今年推出「小浣熊」2.0版本，包含辦公室輔助、程式碼輔助等功能。小浣熊基於日日新SensNova大模型，在程式碼輔助上，評測指出可以幫助開發者提升程式效率超50%。

此外，AI Agent也被許多大模型企業視為變現的重要道路。什麼是AI Agent？其實就是不必人類一步一步下指令，可以自主感知、規劃決策、執行複雜任務，這就需要在大模型基礎上，增加規劃（Planning）、記憶（Memory）、工具（Tools）等組件。要不然每個任務還需要一個單獨的指令下達人員，對企業來說也就不能節省成本。

找對場景，可以獲得營收。找錯了場景，燒完錢可能就會面臨經營難以維繫的窘境。

不過，中國的大模型企業，除了少數新創企業，大部分背後還有一個可以輸血的母公司。賠多了不敢說，但一兩億美元的前期投資，一般還是能夠支持，找錯場景趕緊切換，還能有一些容錯的時間。

至少在去年，業界多將大模型的落地市場，分為通用大模型和垂直大模型兩大類。

通用大模型，一般參數千億以上聚焦基礎層，百度文心一言，阿里通義千問、科大訊飛星火大模型等。

垂直大模型，一般參數在十億、百億級別，聚焦解決垂直領域問題，一般在通用大模型基礎上訓練行業專用模型，應用到各類垂直行業。

一般而言，通用大模型做C端，或賦能垂直大模型；垂直大模型則主做B端。但這個分類，真的能夠囊括這麼多類型的大模型創業嗎？

誰更賺錢？

垂直未必不賺錢。前幾天據報道，就有一家企業中標了千萬級的湘鋼人工智慧鋼鐵大模型建設專案（硬體部分）。

通用也未必不賺錢。據百度在剛結束的GENERATE 生態大會上透露，截至2024年3月底，百度智能雲的千帆大模型平台已經為8.5萬家企業提供服務，幫助他們精調了1.4萬個大模型，並開發出超過19萬個大模型應用。顯然，這些服務不會都是免費的。

不過，大家依然打的難捨難分。

你百度賦能產業，我阿里、位元組同樣能做到。

2023雲棲大會上，阿里巴巴集團主席蔡崇信透露，目前全國80%的科技企業和超過一半的AI大模型公司跑在阿里雲上。阿里雲同樣在賦能千行百業。

火山引擎在2023年一場會議上也透露，火山引擎的大模型雲平台獲得智譜AI、崑崙萬維等眾多企業的良好回饋；中國大模型領域，七成以上已是火山引擎客戶。

做通用的巨頭，真的就能三分天下或是五分大模型天下？巨頭既做賦能自己也下場做大模型，如何和生態夥伴相處？

這些問題不解決，通用大模型也未必能一直穩坐釣魚台。

通用和專業大模型，其實還可以轉換成另一個問題，做C端還是B端？通用大模型兩者皆可，而垂直大模型基本上都是做B端。

相較於對C端客戶收費，一個月幾十塊一年幾百塊，10萬級的付費用戶數才能做出數千萬的營收。而且，中國用戶很難習慣對軟體付費，畢竟摸不著。就算中國率先對C端收費的通用大模型，也沒有公佈相關的營收。

做B端，拿到幾個專案就能做到幾千萬營收。而且，雖然AI時代不同於網路時代，但網友們依然習慣免費精神，能夠持續付費的就只有B端了。

那麼，B端就比C端更容易跑通商業化之路嗎？

在金融、工業、協同辦公等領域，幫助企業私有化部署大模型，看起來是個好生意。但同樣更多B端場景，客戶連資訊化、數位化都還沒有完全適應，更不要說再加個大模型。

而且，做B端就要深入嵌入企業業務流程，看起來拿下了客戶關鍵業務入口，但客戶對大模型的確定性要求也更高了。來個幻覺問題，怎麼辦？那就需要更多的人機協同，客戶發現投入越來越重，也會有所顧慮。

B端不好做，C端又不好付費，大模型創業，也更容易死亡在這種夾縫之中。

投資人朱嘯虎前段時間還在接受騰訊新聞《潛望》欄目專訪時給中國大模型產業潑了冷水，表示不看好中國大模型創業，認為大模型最終還是大廠的機會，和看好大模型創業的傅盛也在朋友圈觀點激辯。

爭辯未必分對錯，都是為了流量。不過，當很多人覺得缺卡會影響中國大模型創業時，其實，缺卡的大模型創業企業，未必就活得不好。反倒是一些不缺卡的大模型企業，其體驗未必能贏得顯示卡沒有那麼寬裕的創業企業。

關鍵是不能缺錢。

不缺錢的大模型新創企業，目前至少都活得風生水起。例如阿里投資的月之暗面、MiniMax、智譜AI、百川智能和零一萬物五家大模型獨角獸企業，當然，阿里、騰訊、字節等巨頭在五家獨角獸的投資上也都有所爭奪取捨。其中月之暗面、智譜AI和百川智能都非常活躍，月之暗面作為創業企業，也憑藉超長文本能力在業界掀起了一場長文本軍備競賽。

使用體驗上，根據一些同事分享，智譜AI等創業企業的大模型，使用體驗並不輸給一些巨頭旗下的大模型。

而筆者個人在測試月之暗面Kimi時，如果對話視窗輸入過多文字，整個瀏覽器（Chrome）崩潰的機率就會提高很多倍，筆記本風扇也因此「嗚嗚」轉起來。超長文本如果容易導致網頁崩潰，那產品依然還需要優化。在網頁介面上，月之暗面kimi似乎不夠精緻，跳動的對話機器人頭像也過於卡通（當然，美感偏好僅限於個人體驗）。

如果超長文本帶來的熱度不能讓團隊更進一步去優化迭代，那企業很可能又要陷入某一種大模型創業的艱難宿命中。

長期10年後會怎樣，誰也無法預測。但只要不缺錢，短期三、兩年內，這五家估值均超過10億美元的獨角獸必然有能夠跑出來的。而這幾家獨角獸，也不以顯示卡多為核心競爭力。

所以，缺卡不可怕。買不到最先進的輝達，中國也不是不能買替代卡或租用算力，只不過或許沒那麼順手而已。

缺卡，被業界渲染得過分可怕了。

當然，所有原因，歸根到底都是缺錢。不過，相較於缺卡、缺錢，未來大模型產業發展要面臨的更大問題，是缺電。

根據史丹佛人工智慧研究所（HAI）《2023年人工智慧指數報告》數據，OpenAI的GPT-3單次訓練耗電量高達1287兆瓦時（1兆瓦時=1000度）。如果跑費一輛特斯拉需要100萬公里，那麼單次訓練的耗電量能跑廢約1000輛特斯拉電動車。隨著模型參數越來越大，大模型企業訓練、推理需求進一步上升，耗電量也將幾何級上升。未來，或許還會有大模型企業，會不得不為電費折腰。

由英特爾牽頭髮起、面向商用領域的AI PC硬體產品與商業應用已經於3月正式發布，當然，除了英特爾之外，AMD、蘋果同樣重視個人電腦的AI化，都在探索CPU+GPU+NPU的多硬體加速器架構。酷睿Ultra、銳龍8040、蘋果M3等系列處理器皆對AI有特異化設計。

AI PC會影響大模型創業家嗎？畢竟消費者自己有了適合的端側的本地算力，可以運行十億、甚至百億級參數的大模型，還需要使用付費的雲端大模型嗎？

或許這一點不用擔心。以手機的端側大模型為例，目前vivo、OPPO、小米等最新的旗艦手機都搭載了端側大模型，使用手機算力進行推理。但受限於算力有限，目前效果，和發佈時的“賣家秀”相比就是“買家秀”，原來沒有那麼驚艷。

反倒是基於雲端算力的一些大模型APP、官網，在手機、電腦上的表現會更好。

據了解，由於合規問題，蘋果手機的AI功能不能使用谷歌的Gemini，而蘋果自研AI由於造車的耽擱，目前落後於對手，至少目前蘋果要想推出有競爭力的AI功能，只能與中國企業合作。有爆料指出，蘋果先前曾三家公司洽談合作AI 大模型，其分別有百度的文心一言、阿里的通義千問、月之暗面的Kimi，但分析稱目前機率最大的還是百度。

不過，端側的一大優勢，就是最接近使用者，一旦端側大模型進一步優化，或者類似蘋果尋找百度合作推出手機端側大模型，在效果可與雲端算力比拼的時候，非巨頭的大模型創業家又該如何因應？

畢竟，端側大模型使用本地算力，長期也不會收費。而現在免費使用的許多大模型，在C端終將有一天要走向收費，或者免費模式僅可使用表現一般的模型版本。

大模型創業家如何比拼才能避免死亡？

我們沒有答案。但大多時候，大模型產業整體都是缺錢的，都是刺刀見紅的，算力都是緊張的，C端都是一將功成萬骨枯的，B端都是難以憋出大招瞬間制勝的，通用大模型都是投入巨大的，專業大模型都是缺乏貫通行業的優質數據的，場景和市場都是千變萬化的……死因何止七種？

千難萬難，只有在有限的資源內做出更極致的產品，才能在未來的激烈競爭中佔有一席之地。(億歐觀點)

參考資料：Kenrick Cai and Iain Martin：Unpaid bills, bungled contracts and a disastrous meeting with Nvidia's kingmaker CEO. Inside the stunning downfall of Emad Mostaque.