第四範式戴文淵：深耕產業大模型十年，這是中國AI市場的風口

2024/04/25

•

湧現（Emergence），是生成式AI浪潮的關鍵現象：當模型規模擴大至臨界點，AI會展現出人類一般的智慧，能理解、學習甚至創造。

「湧現」也發生在現實世界——矽基文明一觸即發，AI領域的創業者、創造者，正在用他們的智慧與頭腦，點亮實現AGI的漫漫征途。

在新舊生產力交替之際，《智能湧現》推出新欄位“湧現36人”，我們將透過與業界關鍵人物的對話，記錄這一階段的新思考。

一整年來，「第四範式」創辦人兼CEO戴文淵朝客戶潑了不少冷水。

“你先忘記AI，忘記大模型，先想清楚你要的是什麼。”

這些「靈魂拷問」的背後，是戴文淵身為人工智慧產業老兵，對「科技跟風熱」的本能思考與反問。

在投身AI創業前，戴文淵曾就職於華為諾亞方舟實驗室，也負責過「百度鳳巢」（百度的搜尋行銷系統）的研發。他覺得技術需要服務解決核心問題，「不是因為有了機器學習的技術，你才硬套上技術去解決公司的問題」。

但技術浪潮的起落，就如亂花迷人眼。 2014年，第四範式成立。至今十年來，戴文淵經歷了大數據、CV（電腦視覺）等風口。當進度條拉到大語言模型石破天驚的2023年，他發現同樣的問題在風口中重複上演：從業者只想追逐科技熱潮，卻忘了業務核心問題。

ChatGPT的智慧湧現，讓全產業為之沸騰。但在戴文淵看來，ChatGPT帶來的大語言模型浪潮，對不少行業而言是個美麗的泡沫，「大語言模型解決的是說話問題，但大部分行業的核心問題，都不是說話」。

他為36氪舉了不少例子：零售業核心問題是如何做好供應鏈，醫療行業核心問題是怎麼診斷和預防，金融業的核心問題是如何風控——這些核心問題對應的數據模態，分別是監測數據、體檢報告、詐欺數據，都不是語言。

「在一個大語言模型基座上嫁接其他模態的數據，是非常困難的。」戴文淵直言，「現在市場上99%的行業大模型，其實都是行業大語言模型，沒法解決核心問題。」

真正的產業大模型到底是什麼？

基於不同模態的場景數據，訓練出的「場景大模型」 ——這是戴文淵給的答案。

GPT本質上是讓AI能夠預測下一個token。戴文淵覺得，大語言模型的出現，限制了大家對Transformer的想像——既然大模型能預測下一個文本，為何不能預測模態各異的「X」？

若將「Predict the next X」的思想，運用到解決產業問題，「X」就代表了不同模態的產業核心數據。 3月29日，第四範式發布了產業大模型平台「先知AIOS 5.0」。產業客戶只要在平台上傳不同模態的核心數據，就可以低門檻訓練出解決核心問題的場景大模型。 10年來，這是第四範式先知AI平台的第五次迭代，而這部分業務，在第四範式的營收佔比中，已接近60%。

只是在市場信仰派和技術信仰派爭論不休的當下，產業大模型的故事看起來不夠性感。在市場信仰派眼中，產業大模型總有一天會被足夠強大的通用大模型顛覆，不是長遠生意；在技術信仰派眼中，產業大模型解決的是單點問題，與AGI的信念相去甚遠。

戴文淵卻認為，產業大模型，就是一條基於自身優勢、通往AGI的「縱向道路」。行業多、數據多，是中國大模型產業的優勢。在戴文淵看來，理論上將成千上萬個場景大模型相融合，每一個Vertical（垂直領域）都做到極致，覆蓋面越來越廣，沒覆蓋的地方越來越少，「你感知不到我還有不知道的地方，就能無限逼近AGI。

通往AGI的路線需要因地制宜，在戴文淵看來，大模型的商業模式也不能照搬OpenAI。他告訴36氪，OpenAI是一個大模型公司，商業模式借鏡的是Adobe等工具型企業，放置中國，是個很小的市場。相對地，第四範式是個產業大模型平台，商業形態借鏡了Salesforce或Palantir，「對應的是To B科技市場，市場規模會大很多」。

不過，AGI的話題終歸遙遠，戴文淵眼中的頭頂大事，是用行業大模型為客戶提效。

「其實我覺得各行各業需求，並不複雜。我們要解決的，是從客戶利益出發，與客戶一起清醒判斷清楚自己要什麼，再回過頭去琢磨技術。」他總結。

以下為智能湧現與戴文淵的對話，經整理編輯：

真正的產業大模型，叫做場景大模型

智能湧現：多年以前我們和第四範式接觸的時候，你就提到「AI Everywhere」的概念。這兩年隨著AI技術的演進，你覺得現在第四範式做的大模型和更早時候有什麼不同？

戴文淵：我們並不是從今天才開始做產業大模型，其實從十年前創業第一天開始做的就是產業大模型。在「先知1.0」（第四範式在2014年12月發布的AI平台）推出的時候，做的是高維度即時自學習，本質上就是行業大模型，「高維」就意味著參數要大。

只不過那個年代，在維度還不夠高的情況下，產業模型的生成能力有所不足。我們只能在獲利能力特別好的場景上把規模做大。如果獲利能力不是那麼好的場景，用現在參數規模的模型去解決問題，最後經濟帳算不回來。

現在隨著算力和分散式模型訓練演算法的成熟，做十億以上維度的大模型的門檻或成本，逐漸降低到了業界能接受的程度。因此我們現在的產業模型，已經到了可以用生成式AI去解決產業問題的階段。

智慧湧現：「先知AIOS 5.0」平台定位是怎麼樣的？

戴文淵：「先知」的定位就是產業大模型。我們對產業大模型的認知，可能和現在市面上所謂的「產業大模型」不一樣。

現在我們看到的市面上99%的“行業大模型”，在我看來不是真正的行業大模型，而是叫行業大語言模型。比方說金融機構的金融術語大模型，它可能比普通的大模型更能聽懂金融機構業務人員說的話。

智能湧現：為什麼產業語言大模型不是真正的產業大模型？

戴文淵：我們發現絕大多數的行業，語言模型並沒有在解決核心問題。不能說行業語言模型完全沒用，但比如說金融業的核心問題是控制風險，而不是和客戶聊天。再例如零售業的核心是要做好供應鏈和銷售，醫療行業的核心是去診斷，給出治療方案，都不是和客戶聊天。

智慧湧現：不少友商是根據幾個主流產業，例如醫療、金融、製造業等等，來推出產業大模型。你怎麼看待這樣的劃分方式？

戴文淵：如果這個分割方式是工業一個大模型，金融一個大模型，在我看來太粗了。這樣劃分一定不可能做出一個真正解決業務核心問題的大模型，即使是金融業，銀行、保險、證券都是不一樣的。

那為什麼現在會有金融大模型？實際上它不是金融大模型，只是嫁接過一些金融術語的大語言模型。假設你丟一個交易，問這個模型是不是詐欺交易，或是問大模型能不能貸款，得到的答案基本上都是胡扯的。

這就是為什麼我覺得這些產業大模型沒有解決核心問題的原因，因為每個產業的核心業務，絕大多數都不是在說話。

智能湧現：那應該怎麼劃分產業模型？

戴文淵：在我看來，所謂的產業大模型不是一個產業一個模型，而是一個場景一個模型。所謂的產業大模型下面會分成許多不同的場景，或者可以說產業大模型是場景模型的一個集合。例如體檢報告預測不代表醫療，而是代表醫療的一個場景，或者說是慢病管理的場景。

這些場景也可能是特殊的模態，比方說醫療場景可能是體檢報告，金融可能是信用報告。基於這些特殊的模態，我們要去建構生成式AI模型。

智慧湧現：你提到語言模型的技術架構是預測下一個字符，產業模型則是預測下一個“X”，這個“X”指的就是不同場景的模態嗎？

戴文淵：是的。我們解決一個問題，它有確定的模態，有一批數據，之後就是去訓練一個基座。產業大模型要解決產業問題，同樣也要訓練產業基座大模型，只不過模態不是語言。就像預測下一個體檢報告，數據的模態是體檢報告。至於上面需不需要嫁接其他模態數據另說，解決問題首先是需要一個產業基座大模型。

智慧湧現：第四範式和下游企業的開發者在AIOS 5.0上分別承擔怎樣的角色？

戴文淵：第四範式承擔的主要是平台的發展。或者咱們說個最極端的例子，假設OpenAI能夠把它所有的語料傳到AIOS 5.0，第四範式平台下面也有足夠多的GPU，我們的平台就能開發出一個GPT。

要培養會訓練產業大模型的AI

智慧湧現：產業的場景有成千上萬個，每個場景一個基座模型，第四範式做的過來嗎？

戴文淵：各行各業的產業大模型都不可能由第四範式一家來解決。我們不是選擇發布幾千、數萬個模型，而是發布一個產業大模型的開發與管理平台，這也是先知AIOS 5.0的核心價值。

當企業需要發展一個產業大模型的時候，可以把特定模態的資料上傳到上面，低門檻發展出一個產業大模型。我們去解決各行各業場景的問題，其實是要把模型開發的門檻降低。

我相信未來第四範式發展出來的模型只是裡面的千分之一、萬分之一，甚至更少。絕大多數的模型，由業界人員開發出來。

智能湧現：相較於大語言模型，訓練不同模態的產業大模型會有哪些困難？

戴文淵：最難的反而不是技術。產業大模型的訓練也主要基於Transformer架構。 Transformer的出現讓生成式AI建構的成本降低了，也就是預測下一個字或其他模態的「X」的成本降低了。我們現在能用過去同樣的成本，做出更大的模型。

產業大模型建構的困難在於，當場景越來越多，你就無法在每個場景都用最優秀的科學家去做。這一行科學家人數太少。

智能湧現：這是不是也牽扯到AI公司如今的人才密度問題？

戴文淵：我覺得這不是人才密度的問題。如果你面對的不是做一個模型，而是做一百萬個、一千萬個模型，沒有一家AI公司能有那麼多人才，地球上都沒有那麼多的人才。

智能湧現：那第四範式的解法是什麼？這個算是做產業大模型的護城河麼？

戴文淵：要實現這條路徑，有一個必備的技術叫做AutoML－自動機器學習。能夠用不是那麼頂尖的科學家，甚至非科學家的工程師、資料分析師，去把這麼大體量的模型訓練出來。 AutoML不說每個模型都能做到世界上最頂尖的水平，但普遍可以做到排名Top 5%的水平。

為什麼我們在AutoML上會有優勢？是因為我們做過的場景太多了。 AutoML是一個失敗的藝術，不是成功的藝術，並不是說我有一個別人都不知道的靈丹妙藥或演算法。

每天我們都有幾百上千個場景在訓練，不僅訓練成功了很多大模型，也訓練失敗了很多大模型。這些失敗都是AutoML調整、優化的寶貴財富。日積月累，累積了將近十年，這是我們最不可被超越的。

智能湧現：先發優勢和累積還是很重要。

戴文淵：對。比如說Google的搜尋引擎，早期可能是演算法，後來大家就是用谷歌用很多，它出來的結果哪裡不好它自己知道，知道以後自己修改。你不怎麼用別人的搜尋引擎，別人就很難去超越Google。

落地的第一關，是幫客戶想清楚自己想要什麼

智慧湧現：在場景模型的落地過程中，您覺得困境是什麼？

戴文淵：在我看來，最大的困境是認知的問題。其實絕大多數的行業都知道自己的核心問題是什麼，但是當一個新的技術出現的時候，他們往往在討論新的技術的時候，就忘記了行業的核心問題是什麼了。

比如說零售業要解決供應鏈問題，但當大數據出現後，他們就變成蒐集數據了，忘了自己其實要解決供應鏈問題。同樣，當CV（計算視覺技術）出現後，他們就變成我要研究人工智慧、研究人臉辨識問題；當大語言模型出現後，又開始研究怎麼說話。

排第二的問題其實叫做彌合兩邊差距。企業也知道自己要解決什麼問題，但科技的語言和業務的語言之間是有差距的，彌補這個差距也要花不少時間。

智能湧現：這些困境現在仍然存在嗎？

戴文淵：這兩個問題，我覺得過去一年基本上解決了。你看去年這個時候，各行各業都在上線大語言模型。這麼做了半年以後，很多客戶突然發現我不是說話的，是賣東西的、批貸款的、做設備管理的。現在基本上大家的認知已經過來了，後面緊接著就是紮實地把這個問題解決了。

剛才講到的數據、算力、成本方面的問題，是實實在落地時要解決的問題，我覺得不算什麼大問題。包括數據，過去如果你整理得不好，那今天開始就把數據規範好，很快可能就有數據了。咱們也不是說明天就一定要把所有的產業大模型都做出來。

算力的成本，各方面我們都要做判斷，如果場景模型創造的價值夠大，是天量的價值我們可能搞到千億參數，海量的價值可能搞到百億參數，中等規模的搞十億參數，總是能找到一個適合你的規模和成本。

智慧湧現：企業想要在AIOS 5.0上產生一個場景大模型，需要多少資料？

戴文淵：我只能說訓練數據和參數量是成比例的增加，你需要一個量級的參數，不一定需要同一個量級的訓練數據，如果參數量只有1K，訓練數據少一個數量級也可以。

智能湧現：場景問題必須用大模型來解決嗎？

戴文淵：其實並不是說所有的事一定是必須。如果你能接受它沒那麼好，參數量也可以比較不那麼大。

但如果說在產業裡面，咱們就是要追求極致的業務效果，參數量就應該變大。對於行銷場景，當參數量變大了，它行銷得能夠更精準，在能更精準地知道你明天要買什麼樣的東西的情況下，我的收益就很大了。為了這個我就應該把大模型做大。

智慧湧現：下游企業用得起場景大模型嗎？

戴文淵：這取決於要把參數量做到多大。現在訓練到百億以上參數的成本還是吃不消的，如果是十億級參數，對絕大多數我們所看到的客戶而言，還是一個可以接受的範圍。

智能湧現：成本主要來自算力？

戴文淵：是。當參數量增加一個數量級，其實成本增加的比一個數量級更多。對於普通的場景，十億參數規模還是在可以接受的範圍。

智能湧現：今年場景大模型會為第四範式帶來比較好的商業回報嗎？

戴文淵：我覺得今年大家會思考一些更腳踏實地的問題。整個市場營收的成長，今年肯定會看到。

通往AGI，我們也有縱向優勢

智能湧現：從旁觀者的角度來看，做小場景的模型往往是市場導向的。你有通往AGI的理想嗎？

戴文淵：我覺得AGI就是無窮大，做AI的人可能永遠都到不了，但你要永遠逼近它。從科學的角度，我認為我永遠到不了AGI，但對於個體感知而言，只要AI的能力能涵蓋你所能問出的所有問題，在你的視角裡就是AGI，這可能不需要多久。

智能湧現：怎麼逼近AGI？

戴文淵：實話說我們很久裡思考過通往AGI的兩條路。

我們國內有大量場景和數據優勢，從一兩個，到一萬個、十萬個、百萬個，當我們覆蓋場景足夠多，把這些模型拼起來，最後你可能也實現了AGI。這是縱向的路線，也是我們會在對應領域，比OpenAI更有優勢的地方。

另外一條是橫向的路，用OpenAI的方式去打敗OpenAI，對於絕大多數公司，至少此時此刻機會不是很大。因為他有你一個數量級以上的資源，如果你走它的路，打敗它是不切實際的。

縱向方式是每個Vertical（垂直領域）都做到極致，覆蓋範圍越來越廣，沒覆蓋的地方越來越少，你感知不到我還有不知道的地方。橫向路線就是我的能力越來越強，高於絕大多數人的能力。兩邊都在無限逼近AGI。

智能湧現：現在能證明縱向的路可以走通嗎？

戴文淵：我認為縱向這條路一定是能走通的。就好比我們發布的幾個場景，我們一個個的Vertical做得能比OpenAI更好，後面要努力的方向就是讓我們的覆蓋面越來越廣。

但透過橫向的方式做到這幾個能力，所需的資源可能是大量的。

智能湧現：橫向縱向，哪條路更難走？

戴文淵：大家難的地方不完全一樣。橫向的往上再堆，其實是資源的指數增加。我們要解決的其實是有效資料量指數級成長時，算力和資料取得的成本怎麼可能不指數級成長。

縱向對應的是我們需要去一個個突破場景，可能每個場景不一定要做到萬億參數，絕大多數場景在十億、百億參數量，少部分在千億這個量級。將來隨著算力成本的降低，可能絕大多數場景都能做到千億參數。我們需要突破的是場景之間的壁壘，最後把這些場景結合在一起。

國內大模型，商業模式無法完全複製OpenAI

智慧湧現：目前產業大模型，或更準確地說是場景大模型，到了為模型廠商帶來大規模營收，甚至獲利的時間點嗎？

戴文淵：如果你這個模型沒有創造什麼核心價值，即使現在獲利了，也不是持久的。

所以，產業大模型需要越來越多地切入到產業的核心問題。只有你創造的是核心價值，產業才會願意為這個模型去付費更多，你才能帶來更多的收入和利潤。這是其一。

其二，從商業模式角度來說，不同市場特徵的商業模式還不太一樣，所以，在中國市場找到更適合的商業模式，是大模型公司在下一個階段需要重點考慮的問題。

智慧湧現：怎樣的商業模式比較適合當下的中國市場？

戴文淵：我們的商業模式其實是To B類的科技商業模式，用產業大模型平台，服務千行百業。

這是個巨大市場。其實國內頭部的產業整體科技預算，都是在千億（元）規模，像是金融、能源、醫療等。

我剛才想表達的是中國最後的大模型形態，有可能跟海外不太一樣。因為我們有自己的市場特性。

例如OpenAI對應的是工具類市場，工具類市場對應的是Photoshop這類市場，是結合當地的市場特性。所以我覺得中國的大模型公司，未來商業形態也要結合本土的市場優勢和市場成長容量。

智慧湧現：所以其實是落地場景的商業模式為大模型企業提供了商業機會。

戴文淵：落地到怎樣的場景就是我們思考的問題。我們可能提供大模型技術，但最後的商業形態借鏡的是Salesforce，或是Palantir。 OpenAI是一個大模型公司，商業模式借鏡的是Adobe，這是有差別的。 (36氪)