2024WAIC閉幕,我們整理了場內場外的AI辯論“修羅場”

1 大模型——開源智商稅VS閉源終被追上

你是開源派還是閉源派?

開源派代表馬斯克認為,AI大模型共享程式碼是一切的前提,不但可以促進技術的發展和透明度,還防止AI被少部分人群壟斷;閉源派代表Sam Altman主打,堅持閉源,延遲開源,追求商業利益最大化。

具體而言,在創新速度、專業性上,開源優於閉源;在性能突破,資料的多維度,以及通用性上,閉源優於開源。即,開放原始碼的最大優勢是技術共享、推動創新;閉源的最大優勢是商業化,集中人才、資本力量,只為提高性能。

如果按照“打蛇打七吋”的思路,想證明開源“不可行”只要證明“開源其實不open”;想證明閉源“不可行”只要證明“閉源其實不會永遠領先”。

有趣的是,正反兩方均提出了對應觀點。

在2024WAIC上,李彥宏斷定:模型開源和程式碼開源是兩個概念,模型開源只能拿到一堆參數,做不到真正的共享;

在此前採訪中,朱嘯虎表示:開源模型最終會趕上閉源模型,因為開源有更廣泛的貢獻者和驗證。周鴻禕也站開源:如果企業能夠專注於特定領域,並利用其獨有的資料資源進行深入的專業訓練,那麼這些模型完全有可能在特定領域的能力上超越GPT-4。

具體來看,雙方有哪些激烈碰撞?

閉源派:百度CEO李彥宏

觀點:開源其實是一種智商稅。

原因一:開源能力不夠。開源模型在參數規模相同的情況下,能力通常不如閉源模型,如果開源模型想要在能力上追平閉源模型,就需要更大的參數規模,這將導致更高的推理成本和更慢的反應速度。

“我覺得,開源其實是一種智商稅。當你理性地去想,大模型能夠帶來什麼價值,以什麼樣的成本帶來價值的時候,就會發現,你永遠應該選擇閉源模型。今天無論是ChatGPT、還是文心一言等閉源模型,一定比開源模型更強大,推理成本更低。”

原因二:開源不是真開源。使用開源模型進行個性化改款,可能會創造出孤本模型,這些模型既無法從基礎模型的持續升級中獲益,也無法共享算力。

“很多人混淆了模型開源和程式碼開放原始碼的概念,模型開源只能拿到一堆參數,還要再做SFT、安全對齊,即使是拿到對應原始碼,也不知道是用了多少比例、什麼比例的資料去訓練這些參數,無法做到眾人拾柴火焰高,拿到這些東西,並不能讓你站在巨人的肩膀上迭代開發”。

捍衛者1:月之暗面創始人楊植麟

觀點:開源模型不會縮小與閉源模型的差距,閉源模型會持續領先。

“AI和其它領域不同,開源沒有算力驗證,沒有人力和資本聚集,開源追不上閉源”

“像OpenAI一樣的閉源是通往Super App的唯一通路,而開源只是 ToB 的獲客手段。”

捍衛者2:前OpenAI首席科學家Ilya Sutskever

觀點:幾年後,每個人都會清楚,開源是不明智的。

“短期內,開放原始碼的價值在於幫助公司生產有用的產品,允許使用者成為他們希望使用模型的最終決策者,決定如何使用模型以及支援哪種用例。但在某個時候,人工智慧(AGI)會非常強大,令人難以置信,那麼開源是沒有意義的。”

開源派:阿里雲CTO周靖人

觀點:通義千問拉平了開源、閉源模型之間的差距。

“兩年前,我們在世界人工智慧大會上發佈通義大模型系列,當時我們公佈,通義核心模型將開源開放。到今天,通義千問已經實現真正意義上的全尺寸、全模態開源,拉平了開源、閉源模型之間的差距。”

捍衛者1:360創始人周鴻禕

觀點:如果企業能夠專注於特定領域,並利用其獨有的資料資源進行深入的專業訓練,那麼這些模型完全有可能在特定領域的能力上超越GPT-4。開源社區擁有的工程師和科學家的規模遠遠超過閉源機構,數量級達到數百倍。儘管開源大模型僅發展了一年,但其能力已超越了GPT-3.5。

“我是一直相信開放原始碼的力量,至於說網上有些名人胡說八道,你們別被忽悠了。他說開源不如閉源好?連說這話的公司自己都是借助了開放原始碼的力量才成長到今天。”

捍衛者2: 金沙江創投主管合夥人朱嘯虎

觀點:開源模型最終會趕上閉源模型,因為開源有更廣泛的貢獻者和驗證。

“在美國,閉源模型和開源模型的差別可能沒有那麼大,當然還是大廠的閉源模型比較領先,所以他們的目標也比較遠大。很多美國大企業現在採用的方案也是在私有雲上部署,用開源模型部署企業的大模型,然後用自己的資料進行垂直最佳化,這樣能保證自己資料的隱私。

國內也是一樣的,很多大企業尤其是一些央企,私有化部署不是在私有雲上,而是徹底的私有化部署,然後同樣用開源模型,用自己的資料進行調整。用開源模型最主要的好處能保護自己的資料。中國創業企業最好也是拿開源模型來訓練,可以保護自己在垂直場景的資料。”

中間派:百川智能 CEO 王小川

觀點:關於開閉源之爭,核心是要看誰在開源。從To B角度,開源閉源其實都需要。二者不是競爭關係,而是在不同產品中互補的關係。

未來80%的企業會用到開放原始碼的大模型,因為閉源沒有辦法對產品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務。兩者不是競爭關係,而是在不同產品中互補的關係。

總結:對於大模型開發者而言,開源是遠期理想,閉源是短期現實。全球科技“投資之王”Vinod Khosla表達過對開放原始碼的擔憂:“訓練成本確實高了一個數量級,這正是我認為開源不可行的原因。”

根據斯坦福 HAI 研究所最新發佈的AI Index報告。

第一,在所有選定的基準上,目前閉源模型的表現均優於開源模型。

第二,隨著時間的推移,模型訓練成本急劇增加;對計算訓練需求更大的模型需要的訓練成本只會更多。

這些對於開源大模型廠商不是一個好消息:方向或許是正確的,未來或許是光明的,但道路一定是曲折的。

如何安全地快進到技術迭代曲線不再陡峭的那天,是開源派需要共同克服的難題。

話說回來,先拋開模型能力,從產品體驗上來看,閉源大模型還沒有一騎絕塵的優勢。

「Al數智源」根據Similarweb資料統計出,無論是6月第四周訪問量,還是近28天訪問量,天工AI搜尋 (崑崙萬維 開源)> Kimi (月之暗面 閉源)> 文心一言 (百度 閉源)。

2 應用——衡量“超級”不看DAU

首先,大佬們的共識是,注意力要放在應用層。

李彥宏迸發了金句“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。”他呼籲,業界應將關注點從模型本身轉移到應用上,關注如何通過大模型開發出滿足市場需求的AI應用。

商湯科技董事長兼CEO徐立:應用是決定人工智慧超級時刻的一個關鍵。

“我的中學的退休的老師不停地在群裡問我,怎麼用人工智慧去寫文案、生成祝福的圖片,發到他的退休群裡等等。我突然想到,其實超級時刻和應用是互相成就的。只有超級時刻帶來的認知變化,最後才能推動應用。倒推回來,如果我們有應用作支撐,那麼我們現在這個時刻就是「超級時刻」。所以,應用是「超級時刻」的關鍵。”

華為常務董事、華為雲CEO張平安:要敢於開放行業場景,讓人工智慧在行業應用上領先。

“我們不能把AI基礎設施依賴於是不是有最先進支撐的AI晶片,如果沒有,我們就沒辦法在AI上領先,這個觀點必須要摒棄掉。”

其次,超級應用長什麼樣?大佬們的共識:至少不長ChatBot樣。

李彥宏稱,要避免掉入“超級應用陷阱”。

即,移動時代的邏輯是一個DAU 10億的APP叫成功;但在AI 時代,“超級能幹”的應用比只看DAU的“超級應用”更重要。只要對產業、對應用場景能產生大的增益,整體的價值就比移動網際網路要大的多。

該說法也有道理。比如,在一眾ChatBot應用中,似乎只跑出了ChatGPT,其成功是基於領先的GPT系列大模型。其他資料非常美好的Pi和Character AI,一個已經被微軟生吞活剝,另一個被爆資金斷裂,計畫賣身Google和 Meta。顯然,實現商業化是成為“超級應用”前必須解決的問題。

在BI近期採訪中,Foundation Capital的Moore表示,不是每個產品都需要ChatBot,自己早已疲於應付拿著通用用例找投資的創企。創始人要先關注能解決的問題,然後再選擇相應的技術。

那麼,超級應用的輪廓該如何勾勒?

李彥宏非常看好智能體(AI Agent)。“在大模型的加持下,只要用人話把工作流說清楚,再配以專有知識庫,即可做出一個很有價值的智能體,比網際網路時代製作一個網頁還簡單。”——醫療、教育、金融、製造、交通、農業等各行業領域,未來都會依據自己的場景和特有經驗、規則、資料等,做出各種智能體,將會出現數百萬量級的智能體,形成龐大生態。

商湯科技董事長兼CEO徐立:像 GPT 帶來的聊天式的應用,Sora 帶來的視訊應用,但它還沒有到「超級時刻」,是因為沒有真正走進到一個行業垂直應用當中、引起廣泛的變化。他補充道,超級時刻和應用是互相成就的,只有超級時刻帶來認知的變化,最後才能推動超級應用。

MiniMax 創始人兼CEO 閆俊傑的觀點是:殺手應用至少要在三年之後。

“在 AI時代最大的應用,我覺得還是挺有機會的,但是(當前) APP 肯定還沒那麼大。我覺得可能要3年後(可能)才會有大眾化的東西,但沒關係,當你能做到第一個,然後你的能力變強、資源變多、技術能力變好,有可能大概就可以做。同時,這個東西就一步步來,然後我認為(Killer App)至少三年之後。”

智譜 AI CEO 張鵬對“三年期限”有不同的看法。

“也許明天就有,這個事情需要綜合考量不同因素,一個是技術本身的成熟度,第二個是市場和使用者本身是否準備好。第三個是需求的發掘,然後甚至還加上有一點點運氣,變數太多,很難用我的大腦這麼簡單的一個神經網路去預測這種事情。”

他認為:Google從成為世界第一的搜尋引擎,到探索出成功的商業落地的路徑,花了6 年。Meta,原來的 Facebook,同樣也花了6年。這件事就像我們小時候玩打磚塊的遊戲,你想要瞄準縫隙,很精準地打到一個縫隙裡。這件事情首先得找到縫隙在哪兒?路徑在哪兒?很多事情要前赴後繼地去探索,這個過程就很重要,不要只看到最終的結果,更重要的是我們採取行動,這才是目前大家更應該關注的事情。

不過,張鵬也給出了自己對“縫隙”的認知:一個很重要的點是去突破大模型的多模態。

“為什麼要多模態?是因為真正的人在現實世界中解決問題的時候,他需要的、輸入的資訊本身就是多模態的。比如說我們希望它幫助我們去掃地、做飯、洗衣服。其實這些任務,你不要小看這些任務,它所需要輸入的資訊是非常多模態的,所以這些方面能力的突破會帶來 AI 的普惠,AI 更大的這種可能性。”

第三,機會在大廠,還是在於創業者?

大廠派:中國工程院院士、阿里雲創始人王堅

觀點:人工智慧對大公司更友好,草根創業變得很難。

王堅認為,網際網路具有草根性、對資源的依賴少,但是人工智慧對資源具有很強的依賴性——大量的資料、計算能力和專業知識,這些往往需要昂貴的投入和長期的積累。這種資源密集型的特點使得AI對大公司更為友好,而草根創業者則面臨更大的困難。面對AI,小企業跟大企業的差別是,大企業一定會覺得AI是工具的革命,小企業一定會覺得這是革命的工具。而如果大公司也有“革命的工具”意識,那麼劃時代的影響就來了。

“以蘋果公司舉例,蘋果是拿AI去服務C端的客戶,在我看來事實上是人工智慧技術重新重構了蘋果這家公司。只要是一個新的技術,一定會有新的大公司出現,沒有新的大公司出現,它是不是一個顛覆性的技術要打一個問號的,這是第一個邏輯,同時也一定會有大公司是烈火重生的。”

“不好說”派:著名風投NFX

觀點:誰的贏面更大取決於定位哪些市場&採用何種策略。

大廠優勢——資金、人才,可以複製創企產品,利用現有分銷網路推廣產品;

大廠劣勢——大企業病,牴觸變革,龜速創新。

創企優勢——速度,但幾乎只有速度,幾個創始人組成一個小團隊,迅速決策並推出產品;

創企劣勢——缺錢,一般也沒有穩定的客戶群體。

NFX提出了AI同時具備“顛覆性創新”和“持續性創新”的特點,實際上分別對應王堅所說的“革命的工具”和“工具的革命”。

“顛覆性創新”有利於初創企業,靈活且願意承擔風險,能夠創造出全新的市場和服務,例如Uber顛覆了原有的計程車企業;ChatGPT可能顛覆搜尋市場;

“持續性創新”,有利於現有企業,更容易鎖定市場,聚焦於改進、加速或完善已有的市場和服務,例如Facebook用AI廣告定位,Google用AI最佳化搜尋引擎等等。

對於創業者而言,需要思考在自己所瞄準的行業中,AI帶來的主要影響是顛覆性or持續性?以及,你的產品和市場更適合顛覆性創新,還是持續性創新?

如果是前者,你就必須提供真正,具有顛覆性的價值主張,開闢新的市場,破壞現有的商業模式,或創造全新的、難以想像的體驗,就像 Uber和Lyft。

需要做到:1、在“龜速”行業中開展業務,不要選“行銷”這類易攻難守的;2、比舊方案好100倍;3、發揮速度優勢,在率先獲得重要專有資料的市場開展業務,包括尋找非結構化資料的脈絡;4、用AI創造全新使用者體驗,不要讓使用者體驗“味如嚼蠟”。

如果是後者,在有限的條件下,創企必須調整你的產品、資訊和商業模式,與現有巨頭並駕齊驅。例如,一些行業在引入AI後,規模也會無限擴大,催生出一些利基市場。而這些利基市場要麼是現有企業無法提供的,要麼是現有企業沒意識到的。預測AI催生的利基市場並利用,就是初創企業的制勝之地。關鍵在於,認清自己所處的行業是否將經歷變革,對變革內容有清晰認知。這些行業通常會圍繞流程而建,核心產出保持不變,但流程可以有無限變種(從而為你開闢新的利基市場)。

對於國內AI創業者而言,磕應用幾乎是唯一選項。所以,比起聽一耳朵“唱衰論”,不如想想如何在通用大模型的底座之上,利用自身行業資源,找場景,親民。可以預見,在眾多細分賽道上,或許不是大廠和創企競爭,而是創企之間百舸爭流,而這勢必又會拉起爭分奪秒的比賽。 (騰訊科技)