26 年前,微軟中國研究院成立(即微軟亞洲研究院的前身),作為創辦者和首任院長,李開復帶領微軟亞洲研究院從零開始發展,並建立起了一套完善的「大牛+小牛+學生」人才培養機制和創新文化,在全球產生了重大影響。
在後來的人工智慧浪潮中,微軟亞洲研究院更是成為了中國網際網路以及 AI 領域的黃埔軍校,向業界輸送了大批技術中堅力量,據極客公園此前不完全統計,有超過 15 位「院友」在阿里、百度、小米等網際網路巨頭擔任總裁或 CTO;更多人投身創業大潮,成為商湯、曠視、依圖等獨角獸公司的創始人或技術領導人。
商湯、曠視、依圖還有雲從科技,以電腦視覺為核心,是上一波的 AI 創業浪潮中的中國「AI 四小龍」,曾經歷輝煌,但普遍遭遇商業化困境,這一波大模型 AI 創業浪潮,會怎樣走出一條不同的路徑?
1 年前,零一萬物成立。去年 11 月,零一萬物開源發佈首款預訓練大模型 Yi-34B,半年後,零一萬物又發佈了千億參數規模的 Yi-Large。這一年來,零一萬物迅猛發展,無論是海外的產品還是自家的模型,在各種國際權威評測中都展現出了令人印象深刻的成績。
26 年前,李開復就引領了一代人的 AI 之路,如今又親自投身到了這場新的浪潮之中。儘管已經 62 歲,但李開復並不是一個只在後台掌控的領導者,他仍然是團隊中的核心人物,那麼,為何他要如此熱情地投身到這場浪潮中?
5 月 30 日,極客公園創始人&總裁張鵬和零一萬物 CEO、創新工場董事長李開復博士一起探討了大模型、他的創業經歷,以及未來通用人工智慧可能為商業和科技領域帶來的影響。
在直播中,李開復輸出了一些精彩觀點:
極客公園對此次直播進行了整理,分享如下。
張鵬:在零一萬物最新版的模型裡面,有什麼令你很興奮的進展?包括外界的反饋,該怎麼理解?
李開復:大模型不像晶片那麼容易評估,算一算速度就可以了,大模型要使用才知道誰好。而且使用的評估每個人意見不一樣,所以就會發生這樣的現象,每當一家中國,美國的大模型出來之後,看起來它都是世界第一,那使用者或者開發者到底該用哪個模型?到底該用哪個 API?真的是很頭疼的事情。
我最近的領悟是,模型要想選優、排序、打擂台的話,有三個要點:
零一萬物成立之初就明確了公司的全球市場定位。零一萬物立志成為一家國際第一梯隊的大模型公司,服務全球使用者,同時將中國市場視為最重要的市場。
基於這一戰略,零一萬物選擇了兩個國際權威評測平台——斯坦福大學的英語排行 AlpacaEval 2.0 和開放研究組織 LMSYS 競技場——來展示零一萬物的實力,並與全球的大模型競爭。
在 LMSYS 公開盲測綜合排名中,零一萬物僅次於 OpenAI、Google、Anthropic 三家矽谷巨頭,是全球第一梯隊裡唯一一家中國公司;在斯坦福的 AlpacaEval 2.0 評測中,零一萬物模型甚至超過了 Google Gemini 1.5,標誌著零一萬物在一個公正的、全球的擂台上進入了世界第一梯隊,這是我們非常自豪的事情。
張鵬:Yi-Large 模型什麼時候支援定義 system character(系統特性)?還有 function call(函數呼叫)?
李開復: system prompt(系統提示)已經能夠達到比較好的效果,零一萬物將持續對其進行強化,函數呼叫還需要一兩個月。零一萬物每一兩周都會更新 API,並升級 API 背後的模型。
張鵬:今年的零一萬物戰略主營業務會放在哪裡?是模型還是應用,還是在佈局其他?作為創始人& CEO 怎麼定義今年的目標?
李開復:目前,零一萬物不參與模型價格戰,也不打算參與任何基於項目的需求定製開發,也就是不會去競標做某個大但是需求不通用的項目,然後在其中「賠本賺吆喝」來撬動下一輪融資。這種做法在 AI 1.0 時代已經嘗試過,但最終發現這種做一單賠一單的方式是行不通的,所以零一萬物絕對不會採用這種方法。
除此之外,零一萬物對其他方向都持開放態度。無論是國內還是國外,To C 的 App 或者 To B 的模型、API 等都可以涉足,但會聚焦於最有增長潛力的領域。
最有可能成功的方向是深度定製大模型。零一萬物將專注於那些真正理解大模型的客戶,願意為了實現偉大目標付出高額費用的客戶。因為這些客戶能夠看到大模型對他們公司的巨大影響,雖然他們在市場上並不容易找到,但他們是零一萬物希望吸引的目標客戶。
張鵬:深度定製是指幫他們做微調嗎?
李開復: 不是微調,是要教他們怎麼做訓練。要把一個模型做好,需要先做好一個基礎的模型,讓它適合去做持續訓練。初始資料可能是一些行業資料,得把這些行業資料整合到到模型中,然後在此基礎上進行微調。當前有足夠好的底座,又願意去投入資金獲得軟體訓練許可的公司很少。原因在於這樣做成本投入非常高。但是懂得用的公司是願意付這個錢的。這種公司全世界可能也就幾十家,而且大部分這種客戶可能在國外,所以這是一個差異化的方向。
另一種等待爆款的方法是開發 Consumer App(面向消費者的應用)。零一萬物會逐個開發一些應用程式,希望能出爆款,即使不是爆款也能盈利,並且能健康成長。如果其中一個應用成為超級爆款,就能帶動整個公司的發展,因為它可能成為未來的抖音、小紅書等。所以,零一萬物會繼續開發 Consumer App,這也是我們的重要發展方向。
API 業務我們持理性樂觀。因為目前國內市場才剛剛起步,大家的業務規模都還不大。API 業務是零一萬物目前剛起步的業務之一,但如果我們能保持性價比優勢,未來可能成為最大的業務之一。模型則屬於幕後英雄。這三種業務都依賴於模型,但並不是直接出售模型,而是通過不同的方式產生收入。有些業務收入確定性高,但增長率低;有些業務收入確定性低,風險也較低,但有爆發的可能性;還有些業務可能會帶來巨大的利潤,但如果做得不好,效果可能一般。
這三種業務模式疊加在一起,我認為可以創造出收入較多、增長率較高且收入質量較高的公司。零一萬物堅決不走過去 AI 1.0 時代證明走不通的路,這就是我們的整體特色。
張鵬:這樣做其實就是在打一些真正有價值的工,客戶使用了我們的服務,我們真正為他們創造了價值,而他們也有能力付費。
李開復: 補充一點,這不是基於項目的工作,也不是簡單的打工。將模型部署到客戶企業後,會給他們帶來巨大的價值,不僅節省成本還能創造收益。
由於客戶不願意資料外洩,他們有可能不願意使用 API。所以零一萬物會根據需求把模型部署到客戶的內部,這需要高度的彼此信任,收費方式也是按年收費,可能更接近於 SAP 或微軟 SQL 資料庫的年度許可費用。這也是為什麼在國內可能會比較困難,因為沒有太多公司願意支付這類費用。
張鵬:在大模型時代,創業是否應該選擇低成本模型來吸引使用者增長,或者採用高成本模型來打造高價值產品?產品經理或者創業者是否應該避免中間地帶,而是專注於兩端策略?
李開復:一年前大模型存在非常多的缺陷,比如說幻覺問題。有幻覺的話,很多應用是做不好的。最近隨著技術如 RAG(檢索增強生成)等的進步,大部分的這些問題已得到解決,所以幻覺的解決會是一個重要的里程碑,這個事情正處於處理程序之中。同時,模型能力跟使用者留存是有絕對關係的。零一萬物自己探索了四個產品,其中基座 Yi 模型從 Yi-34B 換到了 Yi-Large 的 132B,使用者留存可以增加 30%。
如果用一年前的舊模型,比如說 GPT-3.5,雖然今年成本已經降低,但是不太容易能找到 TC-PMF (Product-Market-Technology-Cost Fit,技術成本 X 產品市場契合度) 的,因為它畢竟是第一代產品,可能無法解決大部分使用者想要解決的問題,不太好收費。
當然在某些特定領域,例如客服領域,使用成本較低的模型來尋找 TC-PMF 是有可能的,但這樣的機會並不多。
另一個選擇是一開始就收費、就用最好的模型。在海外市場,我們的一款個人 AI 生產力產品就採取了 freemium 模式(基礎服務免費提供,而高級服務則需要付費)。雖然免費部分可能比較有限,但這是為了鼓勵使用者盡快升級到付費的高級服務。這種模式已經幫助零一萬物在海外獲得了數百萬使用者,並且使用者已經形成了良好的付費習慣。
但採取收費模式也就意味著限制了使用者量和應用的發展空間,這種模式可能很難做出一個 Super App。一旦選擇了收費模式,雖然理論上可以進行調整,但實際上可能會陷入一個以盈利為主要目的的營運模式中。
我最期待的是,有一天,Super App 所需的技術會變得既強大又便宜。剛剛舉了一個最極端的例子,假設我們要做一個公司來顛覆抖音,可能會考慮採用全 AI 的模式,由 AI 為每個使用者定製內容,會更有針對性、更逼真、更有趣等等。
理論上很好,但是今天要做成這個絕對不可能,Super App 需要夠便宜的 Sora 加 GPT-5,這個產品才能做出來。 GPT-4o 是無法滿足這一需求的,且推理成本過高。
Sora 跟 GPT-5 才剛出來,成本還降不下來,而這個應用又是一個要累積很多使用者量才能開始收費的應用,所以要實現顛覆性應用可能還需要四五年時間,除非有哪家公司能夠很快發明更便宜的技術。所以抖音肯定是在這個方向最安全的公司。
顛覆其他平台也是一樣的,都需要大量的資源和投入。Super App 通常提供免費服務,然後通過其他方式盈利,假設一個 App 的DAU是 5, 000 萬,每天這 5, 000 萬個使用者需要做 100 個 API call,那每一個 API call 又是多少錢?算下來可能幾周就破產了。就算用 Yi-Large,也是 100 萬個 token 20 塊錢(0.02 元 / 千 tokens),明年這個價格可能是兩塊錢,後年就可能是兩毛錢了。所以就要在正確的時候啟動正確的應用,當然,跑馬圈地還是需要的,只是要先把 TC-PMF 算好。
而且跑馬圈地比以前更重要了,因為大家都虎視眈眈地想要去顛覆微博,要顛覆小紅書,每一個巨頭都有創業者在盯著想要顛覆。
張鵬:巨頭其實也在盯著每一個創業者。
李開復: 對,但是有一個很大的問題,就是創新者的窘境。哪怕微軟這麼強大的公司,投了 OpenAI,然後做了 Microsoft Copilot 非常好的產品,但是他還是沒有做採取 AI first 的策略,而是在現有產品上新增 AI 功能。
一開始微軟也是一個創新者,但當它佔有了市場,成為壟斷者,它也會捨不得自己顛覆自己的市場,這為創業者提供了機會。
當然一旦有一個公司做了一個 AI-First Office 以後,那微軟就會醒過來,但那時候還是否來得及,就取決於很多因素了。
所以窗口期很重要。創業者要在巨頭還活在創新者的窘境的時候,把 TC-PMF 想清楚,悄悄地推出產品,然後等到巨頭覺醒過來,創業者的產品已經做好了,已經有自己的「護城河」了。
無論多麼熱愛 AI,都必須認識到一件事,沒有公司可以僅靠技術優勢永遠勝出。所以創業者需要創造非技術的競爭壁壘,比如品牌忠誠度,最好是像果粉對蘋果的那種忠誠。
做了 TC-PMF 以後,創業者可能擁有 6-12 個月的時間窗口來建立非技術的競爭壁壘。如果成功建立了,巨頭可能就會後悔莫及,別的競爭對手可能也打不過;如果沒有成功,那這次創業可能就不會有好的結果了。
張鵬:國內下一個爆款 AI 2.0 應用最可能是在哪個領域裡誕生?
李開復: 其實每個時代都差不多。在每個新的技術時代初期,使用者需求有著相似的模式。
在移動網際網路時代,大家問我這個問題,我的回答是工具型。在 PC 時代,第一批應用是像 Word 這樣的辦公軟體。同樣,在移動網際網路時代,工具型應用成了先鋒,比如創新工場投資的豌豆莢和很多類似的工具,它們滿足了第一批使用者,通常也是技術型使用者的需求。
AI 2.0 技術的應用也正在改變工具型產品的定義。零一萬物做的萬知和友商做的類似產品能夠閱讀文件、提供結論、撰寫文件、作文、PPT、流程圖等,這些其實就是 AI-first 理念下簡單版的 Microsoft Office。
這些工具型產品能幫助白領更高效地完成工作,一方面,因為產出的作品通常需要署名,這些工作者有動力去修正 AI 產生的幻覺或錯誤,另一方面這些產品能幫白領提高效率,他們願意付費。
當然也有很多其他機會。PC 跟移動網際網路時代,工具之後,內容消費成為了下一個增長點,接著遊戲娛樂、社交、支付和電商、本地生活相繼迎來機遇。
可能下一個爆款 AI 2.0 應用大概會按照這個速度,一環扣一環地出現。
張鵬:所以 AI 時代也會像移動網際網路時代的節奏逐層蔓延,很難跳步嗎?
李開復: 這裡講得很泛,如果要真的細去說這個 App 行不行,還要考慮的一件事就是 TC-PMF。
比如一個社交應用可能今年就能實現 TC-PMF,那就可以立即開始開發,但另一個應用實現不了,就得等兩年。
創業者要考慮的是做的這個應用,除了要考慮周期,還要更細緻地去理解想做的應用,它需要的技術什麼時候可以落地?它的成本是否可以承受,然後需要付出多少成本?是用免費的模式還是收費的模式?這些都要想清楚。
張鵬:智能硬體結合大模型在 C 端近期有出現一些新的機會嗎?
李開復:我中長期特別看好這個領域,但是它的風險比做大模型還大。
為什麼這麼說?想像什麼是 AI-Native 應用,首先,AI-Native 應用表示它一定是基於大模型;其次,它應該是基於人類語言來做互動,而今天的語音識別,無論是用 OpenAI 的 GPT-4o 還是傳統的先識別文字再去執行任務的做法,它必然是語音驅動的。
那麼未來的發展趨勢是從問答式互動轉向代理式互動(agent),即 AI 不僅能回答問題,還能執行任務。
基於這些條件,我們可以預見到未來需要一個萬能的智能助手,它能夠隨時召喚、隨時響應,並且始終在傾聽。比如我在工作的時候突然想到太太的生日快到了要幫她訂個蛋糕,我可以跟 AI 助手說一聲,那等下它就幫我買好了。
但手機做不到這樣。需要解鎖手機、打開應用、輸入指令,然後等待結果。這整個過程存在延遲,與直接說話完成任務相比,效率低得多,可能 2 秒鐘的時間我就把任務講完了,但是打開手機等 30 秒鐘才能執行這兩秒鐘任務,這就很不合理。
所以,理想的裝置應該具備三個功能:隨身攜帶、隨時召喚、始終在聽。
它的呈現形式可能是耳機、眼鏡、項鏈、手環、戒指還有手錶,需要很多軟體、硬體的修改,讓它能一直在聽,但是又不會需要很多電量,因為它們的體積很小,無法容納大電池。
要實現這樣的裝置,面臨許多巨大的技術挑戰。語音模型需要足夠精準(看起來 GPT-4o 已經很接近了),然後需要開發可靠的代理技術,並建立聲音識別系統,並且裝置要做得夠小、夠快、夠精確,還要有強大的計算量,當然你可以靠旁邊的手機來做計算,但是這些都是很麻煩的事情,還有它的電池能做到多小?它能持續用多久?它的價格會是什麼價位?
Humane 做了一個 AI Pin,很驚豔,但 699 美元的價格對於消費者來說可能過於昂貴,而且它不夠完美,第一批這種做 always on、 always listening 的隨身穿戴的 AI 大模型、 AI native 裝置,可能會因為剛才的原因死在沙灘上,所以一定要慎重。
而且這種裝置要執行任務的話,還需要與淘寶、美團等平台合作,但這可能會遇到品牌和使用者資料方面的阻力。這當中有很多需要磨合的地方,滾動雪球需要很長的時間。
但是它最後一定會起來的,這個事情也有它的 TC-PMF,那就要大家自己去找,但是 TC-PMF 肯定不會今年出來,今年會死掉一批,它們死掉我們就一個個研究怎麼去避免他們的這些問題,然後總有一天能有好的產品出來。
張鵬:前段時間,就短短的幾個小時之內,各家大模型降價,大模型 API 呼叫商業模式忽然就無限接近不要錢了。當然後來我們又看到了一些資訊,說不是完全免費的,但在那一瞬間給人的心理衝擊也是很強的。
在你看來,第一,為什麼會有這樣的事?第二,這件事會帶來什麼樣的影響?第三就是到底現在做一個好的大模型的 API 還有沒有價值?
李開復:首先推理成本下降是理所當然的,它是大模型向前發展的最大動力。它要比摩爾定律下降得快很多,過去一年 GPT 和同類模型就降價了 10 倍左右。
所以以後每年降 10 倍,它必然會推動 AI-first 的應用革命,因為今天不是應用做不出來,只是好的模型太貴,便宜的模型不夠好。因此 API 的價格下降是必然的,大家都應該樂見於此的。這是第一點,這個在美國、中國都是一樣的。
然後,降價是理所當然的,是一定應該發生的。但是為什麼降價?可能有幾個不同的理由。第一種是推理成本真的下降了,那就要把便宜的模型去讓更多的使用者應用,這樣才能找到 TC-PMF,才能讓偉大的 AI-first App 跑出來。
第二種是用過去燒錢的心態去打價格戰。不少大模型公司認為自己能夠融到更多的資金,或者作為大公司,能夠承受更大的虧損,因此會持續降低價格,直到競爭對手無法繼續承受。這種降價策略並沒有真正幫助市場或使用者,只是一種短期內搶佔市場份額的手段。
第三種降價是將那些性能不佳或者實際上沒有太大用途的模型價格降到極低,甚至免費,而對於真正有價值的模型,降價幅度並不大。這種做法有點類似於玩弄標題,吸引使用者的注意力,但實際上並沒有提供具有競爭力的高品質產品。
我也講一下零一萬物的措施,因為是 newcomer,所以對零一萬物來說沒有什麼降了價就會賠多少錢的問題,現在 API 業務還在發力階段。
現在模型的能力在不斷增強,定價應該定在不要賠錢的價位,同時要能夠促進模型的廣泛應用,兩者的平衡要自己來定。
頂尖的模型應有高的價錢,但是高到合理就好;一般的模型,不賠錢就好。大概應該是這個原則。用 GPT-4 Turbo、 GPT-3.5 Turbo 來舉例,兩個產品同時推出,而他們的價錢差了 20 倍,所以很明顯,不是所有的模型都是一樣的。所有用 GPT-4 Turbo 的人都是傻子嗎?不是,是因為 GPT-3.5 Turbo 不滿足他的需求。所以上次我在宣佈 Yi-Large 模型的時候說過,現在追求一個好的應用已經不只是找到 PMF 就可以了。PMF 適合移動網際網路時代,跟技術的發展無關,跟成本也基本無關,它假設的技術能力是基本靜態的,然後假設的成本也是基本靜態或者緩慢下降的。
今天技術的進步速度非常快,每年模型的性能可以提升相當於 100 分的 IQ(智商)。今年的技術水平完全沒法跟明年比,明年跟後年又是不可相比的。所以在做產品的時候,要考慮到技術的發展軌跡,考慮推理成本每年可能降低 10 倍的情況。
大模型時代,做產品面臨的挑戰最大,因為同時需要瞭解市場、產品、使用者,以及技術的進展。要想 6 個月以後有什麼今年沒有的;或者今年已經出現,6 個月以後會變得厲害多少?哪一家會最厲害?
然後在還沒有做 App 的時候就要預測,假設做 App 要 6 個月,那麼就要預測 6 個月以後技術到什麼階段,然後根據技術到時的水平和價格去做應用。
這個就是 TC-PMF,就是 technology costs、 product market fit 四件事情要同時來考量。
回到價格戰的問題,為什麼今天沒有特別多特別偉大的應用?除了 ChatGPT 帶來了一個世界級革命之外,怎麼出現沒有二三十個甚至三五個特別強的 App?就是因為 ChatGPT 用了全世界最強的模型,才達到這樣的顛覆水平,兩個月就有 1 億使用者。
別的 App 公司還沒有這麼強的模型,或者他想用 GPT-4o,也可以做,但是 GPT-4o 自己內部使用和作為開發者去付費完全兩回事,開發者是算不過這筆賬的。
偉大的應用肯定會出來。但是他們有一批需要 GPT-4 等級的能力,然後未來還會有一批需要 GPT-5 等級的,未來還有一批會需要 GPT-6 等級的,這些應用它每個都會有一個收費能力的問題,收費能力強的可以早點用,收費能力差的就比較麻煩了。
最後說回價格戰,零一萬物是不參加價格戰的。零一萬物定價的時候就已經考慮到這些因素。Yi-Large 是國際權威的 LMSYS 盲測評比中國排名第一的大模型,但收費是其他所有進入這個榜單的前 20 名的模型裡面最低的,零一萬物比另外兩家進入榜單的模型都低,比一家低兩倍,比另外一家低 5 倍,而且在榜單裡零一萬物在國產模型中居第一。
張鵬:所謂的統一多模態這一波進步,它到底意味著什麼,可能解鎖一些什麼樣新的內容?為什麼國內大模型公司都要往這走?
李開復:這是正確的技術路線,也會是一個必答題。
零一萬物從去年開始著手統一多模態模型的設計和小規模訓練,目前正逐步擴大規模,並對未來的進展持樂觀態度。
如果語言是人類知識的濃縮和核心,多模態就是一種感知,包括大家看到的、聽到的。人類智慧是語言、知識和感知三者結合的產物,AI 的發展同樣需要這三者的融合。
而且我們也應該相信,如果一個有視力的人跟一個沒有視力的人,他們哪怕都讀了同樣的內容、同樣的速度、同樣的頁面,能看的可能會學得更多、更快,因為他們會參考各種看到的東西,把視覺的也結合進去,所以 unified training(統一訓練)完全符合人類對一切知識獲取的過程。
一個 Unified Model(全模態模型)最基本的應該是,當各個模態被整合在一起時,每一個模態都能夠比未統一的情況下表現得更好。
我同意 GPT-4o 是一個驚豔的演示,但在其背後仍存在兩個問題。
首先它應該不是一個終極模型。對於 OpenAI 來說,GPT-4o 只是一個小的發佈,真正的大招可能要等到 GPT-5 出來;其次,儘管觀看那幾個人的聊天演示時,他們都聊得很自然,但仔細深入瞭解後會發現仍存在一些問題:演示者的表現非常謹慎,每個人都清楚自己要講的內容。GPT-4o 的魯棒性(模型在面對各種異常情況或不完美的輸入時,仍能保持穩定和可靠的性能)以及技術投入實際應用的時候,是否仍有展示版如此完美還有待商榷。
第二個問題是,儘管 NLP(自然語言處理)的研究已有數十年歷史,但直到類似 ChatGPT 這樣的產品出現,才真正實現了突破。
多模態的 Killer App 還沒有出現,因為做科研的人可能不是最有想像力的,做的研究領域相對固定,基本就在語音識別、人臉識別、搜尋引擎這些領域,不過這也很正常,因為做科研的人本來就不是 PM(產品經理)。但是在今天沒有模型+ PM 的存在,哪怕是 GPT-4o 這樣的多模態產品在實際應用中也可能顯得比較牽強。
我認為 OpenAI 的 GPT-4o 在多模態領域已經展現出業界領先的產品管理(PM)能力,但我並不認為它已經實現了完整的 TC-PMF,可能還需要再推進一段時間看看。
我這裡要鼓勵做多模態的科研人員,多跟 PM 在一起聊一聊,看能碰撞出什麼樣的火花。要不然的話 GPT-4o 這麼好的產品它最後不見得會達到跟 ChatGPT 初次面世時給世界一樣的震撼。
張鵬:它是 product demo fit(產品演示與目標使用者需求或市場定位之間的匹配),Demo 展示得非常好。
李開復:也可能我低估了它。1993 年,我在蘋果公司工作時,曾在美國電視節目《Good Morning America 上演示 Mac 電腦的功能。演示時,Mac 上面的一個 demo 看起來非常智能,能夠安排會議、程式設計 DCR,甚至還可以幫我填寫支票。但是之後 demo 做成產品又花了很多時間,然後也並沒有達到 PMF。
OpenAI 的 GPT-4o 肯定比當年 Mac 上面的 demo 要好很多,但是也未必真找到了 PMF。但是這就需要大家多努力,產品經理需要告訴多模態研究團隊什麼是產品市場匹配,使用者需要什麼,以及怎麼最佳化產品才能滿足這些需求,這兩類團隊要互相協作。
也有一種可能,PMF 有時可能是被偶然找到的。ChatGPT 可能就是這樣,它開放了 API 讓大家試用,這樣可能會導致一些試錯,也是可貴的探索。
張鵬:直播間有使用者提問說現在 AI 產品的獲客成本遠高於 AI 推理成本,關於這一點怎麼看?這是不是也是屬於 PMF 沒做到的一種體現,所以獲客成本這麼高?還是說流量都在巨頭手裡,沒辦法?
李開復: 推理成本低,會不會是用的模型不夠好?好的模型是挺貴的。
張鵬:應用是收費的還是不收費的好?
李開復: 對於免費產品或者需要先獲取使用者才能收費的產品而言,面臨的挑戰更大。一般來說,這種免費產品所需的技術和成本都非常高。如果獲客成本還高於推理成本,那麼肯定會陷入困境,無法持續發展。
張鵬:再問問技術的問題,跑分是不是可以定向最佳化的?這種定向最佳化對於模型未來在廣泛運用的過程中,是不是有最大的幫助?今天的模型跑分,到底該怎麼理解?什麼時候可能跑分就不重要了,什麼時候依舊是重要的,能不能幫我們定義一下?
李開復: 跑分就像考試分數,它能夠衡量個人在一些客觀指標上的能力,但是大家都知道有些人光看背書就能拿到高分。
一個模型如果不報任何的分數,大家會有點懷疑,但如果報了分數以後,當訓練在不斷增加更多的資料,然後不斷去調整,再去跑分,有時候會發現模型不進步,但這種情況是模型真的不進步了,還是衡量標準落後了,不好說。
比如說最常用的 MMLU 權威評測集(用於衡量多工語言理解能力),基本就是考一大堆問題,類似考 GRE,那它是不是真的有足夠多的衡量模型的細節,有待商榷。
所以分還是會繼續跑,但是明顯它的重要性會下降。現在這個階段,一個第三方的、足夠多的真人來根據自身體感盲測,機器來打分的擂台應該成為最重要的擂台。但今天沒有足夠多的應用,所以大家需要用這種客觀的、MMLU 的模式來跑分。
下一個階段,就是產品足夠普及了,靠使用者靠使用投票,大家就不會在意太多細節了。
張鵬:跑分這個階段還是很需要,但我們知道它最終是要落到產品裡和應用上的。
李開復: 不要忘了中間的擂台階段其實也是很重要的,要不然一個大公司,一個開發者怎麼選擇 API?
現在國內可能還不一樣,在美國的話不跑個分,根本無法入門。跑了分以後,大家才會判斷值不值得關注,那是另外一回事,但是跑分是一個門票,沒有的話就不要進來,但是有的話也未必人家會完全信,因為自己的資料,自己的評分可能會有自吹自擂的成分。
比如一個開發者、創業者和大公司要選擇用哪個模型做底座,或者用哪家的 API 來做應用的底座,當第一次做這個選擇的時候,基本就要比兩件事,一個就是誰在擂台上表現最好,或者挑幾家最好的,然後自己再做內測,然後做 AB test,這是一個標準做法。
慢慢大家都會搞清楚,誰家是最好的開源,最好的閉源,最好的 To B,最好的 To C,最好的英文、最好的中文…… 大家搞清楚了以後,擂台賽就會結束。
現在還在一個這個混戰階段,所以大家必須靠擂台,要不然的話世界上的模型太多了。以後整個全世界 100 家大模型公司,可能只剩幾家。
張鵬:這種純混戰,循環打擂到逐漸收斂到可能剩下一些屈指可數的公司,這個處理程序可能需要多長時間?
李開復:一年之內就會淘汰掉一半。
淘汰不代表他們會關門,淘汰表示他們可能會說放棄一些業務,比如說以後就專注行業模型了,或者是專注於其他。但最後,頂級的可能真的就只會剩下 10 家以下了。
張鵬:未來一年可能會看到有一半公司會放棄。
李開復: 對,有些創業公司就融不到錢了,如果你是個創業公司,就剩比如說 1 億美金了,然後一個月要燒 2000 萬美金,是五個月把它燒完賭一賭,最後燒一個模型打敗 Google,還是用三年拿這 1 億美金打造一個 App?這個不用我多說了。
張鵬:大家還記著你作為創業導師幫了很多當年的年輕人,現在人們又來求助了,這個時代怎麼辦?大家想創業但融資又這麼困難,怎麼辦?
李開復: 假設要做 AI 領域的話,你要相信技術每一年會增加 100 個 IQ points,每一年成本會降低 10 倍,那麼你只要去仔細的鑽研這個領域,我相信你會找到一個足夠好的應用。而且創業不一定要把目標定成「我也要做一個字節跳動」,當然每個人都想做個字節跳動,我也想做,但很難。可能需要超級強的能力,加上一定的運氣。
張鵬:張一鳴做字節跳動的時候也沒想過能做成今天的字節跳動。
李開復: 對。其實 AI 2.0 時代的來臨,會有很多賺錢但不上市的公司出現。比如說你如果想創業,熱愛大模型,並想用大模型和技術去幫一些公司解決問題,就可以把已有的大模型應用於幫公司解決問題上。因為 AI 絕對可以解決很多問題,一定可以收費,可能前三個月就能實現盈利了。
雖然這種模式可能不具備可擴展性,不足以發展成為上市公司,但它仍然是一種有效的創業方式。一些創業公司起初可以通過提供服務收費,然後逐步演變為擁有自己產品的公司。
現在融資是難,但創業仍有多種可能。不是每次創業都能做一家偉大的公司,或者都需要做一個上市的公司。去做一個服務型的公司,做一個提供解決方案的公司,做一個系統整合的公司,也都有價值。
而且你一旦開始入局了,等以後環境好了,都還有機會再去做各種轉型,發掘出第二、第三條增長曲線。
最後一個建議,無論是尋求融資還是自行創業,其實面臨的最大的靈魂拷問就是現金流。無論如何,都必須確保現金流能夠維持公司營運,直至實現盈利或者獲得融資,或者找到下一個成長點,這一點至關重要。
張鵬:這次作為一個創業者,一年多以來的創業歷程是什麼樣的?有哪些你印象比較深刻的,或者你認為可以稱之為里程碑的這樣的節點?
李開復: 這次創業是 all in 全身投入。我這次創業的優勢是在人脈方面。我召集了很多舊部或者投資過的公司特別牛的人,每個很牛的公司、很牛的部門、很牛的人來一個,他們各自又會帶人脈過來,是一個超級快速的積累過程。讓我振奮的地方是「best of the best」。做搜尋的來自搜尋公司,做模型的來自模型公司,做 infrastructure(基礎設施)來自 infrastructure 公司,做應用的來自應用公司。
這些人湊在一起每天都充滿激情,非常振奮,當然這四撥人各自的文化背景、管理方式等等都不一樣,所以能把他們融合在一起,然後能夠在出問題的時候預測、判斷、修復,然後他們都願意基本接受我的領導,這是讓我最自豪的。
還有一點很特殊,就是我剛創立這個公司的時候就知道時間窗口非常短,零一萬物又是最晚做的一家大模型公司。所以要能夠追上這個時間,零一萬物需要搜尋、模型、infrastructure 以及應用四個路徑同時做。
可能有人會質疑,沒有模型,怎麼做應用?沒有基礎設施,怎麼做模型?我認為四個方向需要同時進行,然後再將它們整合起來。因此,沒有基礎設施,我們就先使用開放原始碼的解決方案,沒有模型,我們就先使用 GPT,然後等到有了更好的解決方案再將其替換過來。
所以零一萬物從 0 到 1 的過程可能是少見的一邊飛飛機,一邊在換零件的過程。儘管過程中也有不少擔憂,但走得還是蠻順利。現在,零一萬物的基礎設施成本比其他公司便宜了 2 到 3 倍,模型現在達到了世界第一梯隊水平,而且應用今年也有望獲得超過上億元的收入。
張鵬:在大模型時代要做一個 AI-native 的公司,本身對人、對組織內部的管理也會帶來很多變化,你過往投過那麼多創業者,也在微軟這樣龐大的公司裡待過,今天又要做一個創業公司,進入到 AI-native 的創業,應該有很多感受可以分享?
李開復:零一萬物超越了很多傳統 VC 的投資原則,如果 30 年前的我拿著這個創業計畫在一年前來敲門,很可能會被拒之門外。
因為傳統的創業理念強調專注,要先驗證一個想法,然後不斷迭代。但是這次零一萬物不得不打破這種傳統方式。
為什麼?首先,這個領域的發展速度太快了。過去一年新技術迭代速度超越人想像,模型進步了多少,成本下降了多少。這已經不是移動網際網路時代的速度了,不快就沒有希望。
第二,與其說它是一個 AGI play(當然它也是),但它更是一個 Ecosystem play。今天零一萬物想做的不是一個大模型公司,而是要做新一代的生態系統裡面的系統型的、完整的、五臟俱全的公司。
最接近我的想法的可能是 PC 時代的微軟。當時,微軟做 Windows kernel,相當於今天的大模型;做 Windows,相當於今天的 API 和平台;做 Office,相當於今天的應用;然後做基礎設施,相當於今天的 Azure Cloud。
這 4 件事情都為什麼都要做?因為它們彼此是超級互補的。基礎設施和模型必須一起做,才能用最少的成本訓練出模型,才能有推理成本最低的模型。模型和應用也必須一起做,因為它們實際上是一體的。而且,當你用自己的應用調優了模型之後,這麼好的模型自己一家用太可惜了,也得給別人用。從商業的角度來說,每個都是有掙錢的機會的。基礎設施幫零一萬物節省了很多成本,而其他三個都有潛在的超級高收入的機會。
沒有理由該賺的錢不去賺。就像微軟當時賺了 Windows 錢還想賺 office,賺了 office 錢之後還想再做 MSN、再做 Xbox,再做 Azure,所以這是一個系統性的擴張,有那麼多商機,少拿一個就虧了,然後就是這每一個的技術都是互補的,你 1 + 1 + 1 + 1 遠遠大於 4,可能等於 10。這麼做當然是超級難的,一個創業公司就上這麼高的複雜度。但是零一萬物要做一個偉大的事情,就像要登陸月球不是因為它簡單,是因為它難。我們要挑戰 AGI 不是因為它簡單,是因為它難。那四個部門的組織架構難嗎?其實是很難的。像雅虎這樣的公司,它的內容和技術部門就一直不能和平共處,但是微軟就可以,微軟大概有可能十種不同的部門,他們都能夠和諧共處,彼此互補。
感謝我今天四位下屬的信任,即便他們四個人,每個人都可以出去融 5, 000 萬美金,但是他們選擇跟著我一起做的更偉大的事情,有這樣一個應該是人類有史以來最好的創業機會,我怎麼可能放棄?
張鵬:你能招來的都是像你說的可以獨當一面的成為優秀創業者的人,你們合在一起,那這個目標怎麼設定?大家會有個藍圖嗎?或者說他們所做的事情最終要怎麼聚在一起?都說這一代的 AI 公司組織架構一定會調整,但是調整完了怎麼能夠 work 起來?
李開復: 零一萬物在發展過程中確實遇到了一些挑戰。純粹依靠 OKR 和 KPI 來管理會出現一些問題。比如只是告訴產品團隊今年要實現 1.5 億的收入,然後告訴模型團隊要打入世界第一梯隊,然後就讓他們一起工作,這樣是行不通的。
那應該怎麼做?做應用的人應該要朝著使用者、收入做;做模型要朝著打榜,朝著模型的表現做。
但後來我們發現,雖然兩個團隊各自都達到了 OKR,但是公司的總目標——打造一個偉大的產品並帶動最強的模型——並沒有實現。我們發現,雖然模型很強,應用也不錯,但是兩者結合在一起並沒有實現 1+1=3 的效果。
這個時候零一萬物就採取了一個很多公司都採取過的機制,內部稱之為 war room(作戰室)。零一萬物明確了接下來的一個目標,並確定了一個假想敵,我們一定要超越他,打敗他,然後倒推兩個團隊應該做什麼。第一次 war room 成功之後,之後馬上再開第二次 war room,這個階段會面臨一些其他的目標,比如說模型跟推理怎麼結合?以及如何降低推理成本而不降低模型的能力。這是兩個團隊需要共同努力解決的問題。
這兩次 war room 之後我認識到幾點,首先,這幾個團隊按照傳統的組織架構,基本就很多人彼此都不認識,但其實是應該在一起工作的;其次,過去的 OKR、KPI 等方法論其實存在問題,這時候我們就開始考慮怎麼樣去最佳化組織架構,怎麼樣去最佳化對齊模式……
這些事情推進下來,基本上團隊裡的人都互相認識了,OKR 也得到了合適地對齊,組織架構也做了一些調整。接下來的合作,我就比較放心了。
張鵬:都說 new blood(新人)他們其實是在現在這個 AI 時代裡更有優勢的,那開復老師你也是從之前的 AI 時代過來的,你還要作為公司的創始人,你怎麼找自己在公司裡的位置呢?
李開復: 我這幾年真的跌破眼鏡,對 AI 會有這樣的發展感到不可思議,當時學的所有的實際知識放到當下已經不太匹配,所以我及時清零過往陳舊的知識體系,但保留了資料和演算法為王的做法。
我也看到新的大模型的威力,它不但推動創業,它也讓我發現自己過去是多麼的無知,所以要擁抱新技術,要相信年輕人。
補充一點,還有一種特別稀缺的人才,就是懂模型的 PM。PM 如果不懂模型,各種方法論基本就沒有用武之力。
張鵬:62 歲創業,憑啥讓大家能有信心,這個事能做成?
李開復: 我決定創業做零一萬物有兩個主要原因。第一個是純粹技術的理想主義,第二個是做一個偉大的企業。
我之前申請卡內基梅隆大學博士時,在申請信的最後一段寫道:「AI 是對人類學習歷程的闡釋,對人類思維過程的量化,對人類行為的澄清,以及對人類智能的理解……AI 是人類認識並理解自己的最後一里路,我希望加入到這個全新綻放、充滿前景的未來科學領域。」
在過去的 40 多年裡,我見證了人工智慧領域的跌宕起伏,但始終沒有看到 AGI 夢想接近實現。然而,當我看到 ChatGPT 時,我意識到它的出現比我預期的要快。我意識到,我不能錯過這個機會,我必須參與其中。
參與的方式可以是投資,可以是自己做,那就到了第二個問題,為什麼要自己做?因為我想要建立一個偉大的企業。我曾經在微軟工作,深知微軟之所以偉大的原因。微軟具有出色的戰略思維和能力,能夠容納不同的文化和管理方式,使公司整體能力超過單個部分的總和。
微軟之所以強大,主要在於其戰略思維的卓越和對不同文化與管理方式的包容。這使得公司能夠將各個部門協同合作,實現 1 + 1 + 1 + 1 = 10 的效果。
此外,微軟擅長在新技術興起時建構生態系統,從底層技術到平台層、API 層再到應用層,每個環節都能創造成功的產品。它能夠將這些產品轉化為像自來水一樣的基礎設施,為使用者提供服務。
我清楚地看到微軟是如何將多個產品整合成 Office 套件,以及如何將 Office 中的技術應用到 Windows 平台上,從而增強了其競爭力。
當然,微軟之所以能成為伺服器領域的巨頭,是因為它在雲端運算興起之前已經站穩了腳跟。它的每一步都有著清晰的方法論,而我也對此瞭如指掌。
但我曾認為自己無法創造出如此偉大的公司,畢竟即使是像Google這樣的公司也無法與微軟相提並論。Google在搜尋和Android方面做得很好,但在開發者生態方面卻相對一般。儘管它的應用數量很多,但沒有像 TikTok、微信、Instagram 或 Uber 這樣具有全球影響力的應用。我認為Google缺乏承載多種文化的基因和跨領域思維。
如今情況變了。長話短說,我相信我在微軟時期所學到的一切是打造下一個潛在萬億美元市值的公司所需的能力。儘管我年紀有點大,也許也不是最適合的產品經理,但我可以利用我學到的方法論和人脈,快速組建一個 200 多人的團隊,創造奇蹟。
今天,零一萬物已經邁出了第一步。
張鵬:其實大家也知道開復老師經歷過重病的考驗,那現在創業,家人和朋友有沒有勸阻過你?
李開復:工作時間確實很長,但這並不是我一生中最瘋狂的時期。壓力可能是相當大的,但我一直以來都有很強的抗壓能力。我還是會堅持每天保持 6 個半到 7 個小時的睡眠,儘量保持健康的飲食,並進行一些適量的運動,家人也是一定要陪的。
在這個前提下,每周投入七八十個小時專注於工作,家人能夠理解,他們可能也知道拿我沒辦法,因為這是我的夢想。
我不僅熱愛這份工作,也喜歡與人交流的機會,讓更多人瞭解 AI 2.0 價值。即使我見了 100 個投資人,最終只有 5 家願意投資零一萬物,但另外 95 家,我希望至少能讓他們意識到 AI 2.0 的偉大。也許我去向 100 家企業推銷零一萬物產品,最終只有兩家願意購買,但我希望那剩下的 98 家有一天也能儘早使用人工智慧。
這些時間都不是徒勞無功的,而是都在創造價值。有些時間為我和公司創造了價值,大部分時間又為整個生態系統創造了價值。
張鵬:這一年是不是很快樂?
李開復: 對。我實際上是公司最大的融資者、銷售和獵頭,同時還需要打造公司的文化和方向,以及制定戰略。
過去的一年裡,我瞭解到年輕創業者有他們的優勢,他們可能更加與時俱進,懂得產品和技術。但我認為每個人都有自己的優勢。如果你見過我團隊中的任何人,或者認識我、知道我投資我的人,你就會知道我的精力不輸給任何年輕人,我的熱情和投入甚至可能會超過他們,而且零一萬物每個人都有各自的長處,以後會看到我們的成果的。
張鵬:所以你不認為年齡是問題,你也不認為自己有什麼劣勢。
李開復:很多人是幻想,如果我給一個 62 歲的人工作,他還管技術,我會有多痛苦或者多失敗?但如果你認識我公司的人就會知道,零一萬物幾乎每兩周就有一次全員大會,在全員大會上,我會分享所有的進展,坦率地溝通零一萬物各個方面的情況,包括產品、技術和融資的情況,無論是好是壞。我用的是一種非常透明、年輕化的管理風格。
很多比我年輕得多的創業者可能更像老闆,而我可能是最不像老闆的老闆。例如,我剛才提到零一萬物團隊有一個 war room,每天 1 點 war room 開會,我也會去,我會為大家買最酷的飲料和點心。
但我不會站在那裡為大家加油,或者發表演講,我只是專心地傾聽,然後詢問問題,這樣我就可以理解公司發生的一切。所以也許有些人想像我會因為年資很深而固守成規,但實際上不是這樣的。
張鵬:最終就是優秀的產品會證明一切,對吧?
李開復:沒錯,最關鍵的是能不能做出好的產品和模型。優秀的產品它會證明一切。
不管我是不是一個年輕的創業者,如果公司有各種缺陷,如管理不善、招聘錯誤、技術方向錯誤等等,那就無法成功。
但事實上,零一萬物已經做出了中國最優秀的模型,有上億收入的 consumer APP,明年零一萬物會有一份更好的成績單。 (極客公園)