37歲,1300億!矽谷最神秘華人,拒絕巴菲特,想做陶哲軒

一家名為Surge AI的公司,正在以近乎隱秘卻極富影響力的方式,為AI時代提供最關鍵的“燃料”。

作為OpenAI、Anthropic和Google等頂尖實驗室背後的核心資料服務商,Surge AI提供的並非普通資料,而是驅動大模型進化的“高品質人類反饋”。令人驚嘆的是,這家公司僅憑不到100人的精英團隊,在未接受任何風險投資的情況下,創立不到四年即實現年營收超10億美元,成為史上最快突破這一里程碑的公司。

據透露,Surge AI正在進行首輪融資,估值已達約240億美元。其創始人、37歲的華裔技術天才Edwin Chen持有公司約75%股份,個人財富估計達180億美元(約合1300億元人民幣),在2024年《福布斯》美國400富豪榜上位列第55名,成為榜單上最年輕的成員。

Edwin Chen的職業生涯跨越Google、Facebook和Twitter,卻始終與矽谷的主流文化格格不入。他厭惡“圈子遊戲”,更像一位闖入商業世界的哲學家。公司名字“Surge”的靈感,來源於科幻作家特德·姜的短篇《你一生的故事》——一個關於破譯外星語言、探索溝通本質的故事。

他希望Surge能“編碼人類的豐富性”。這意味著,訓練AI的不再是普通的標註員,而是來自史丹佛、普林斯頓、哈佛等頂尖學府的教授和專家,將他們深邃的智慧轉化為AI可理解的“語言”。

近期,一向低調的Edwin Chen罕見接受專訪,不僅分享了Surge的成功邏輯,更對AI行業的現狀與未來發出了深刻而犀利的見解。

01 反主流的成功:百人團隊,年入十億

問:你們用不到100人創造了年營收超10億美元的奇蹟,且沒有拿過風投。這是如何做到的?

Edwin Chen: 我們從未想過玩矽谷那套遊戲。我曾任職於多家科技巨頭,常常覺得,即使裁掉90%的員工,公司效率反而會更高,因為最優秀的人才不會被官僚瑣事束縛。創立Surge時,我們決心走一條不同的路:組建一支極其精簡、高度精英化的團隊。結果證明,這條路走得通。

AI正在開啟一個“公司建設的新黃金時代”。兩股趨勢正在匯合:一是人們意識到,龐大的組織架構並非成功的必要條件;二是AI本身帶來的巨大效率紅利。未來,我們或許會看到人均產出更為驚人的公司——比如,每名員工創造千億美元價值。

問:你們幾乎不做行銷,這很反直覺。

Edwin Chen: 我一直認為過度行銷是荒謬的。你兒時的夢想是什麼?是親手從零打造一家公司,沉浸於創造;還是終日向投資人匯報,疲於融資?不拿風投讓起步變得更難,但這反而幫我們篩選了客戶——早期合作夥伴都是真正懂資料、在乎質量的人,而非追逐熱點的投機者。

02 資料的本質:尋找“諾貝爾獎等級”的詩

問:你們被視作最成功的資料公司。到底做對了什麼?

Edwin Chen: 核心在於對“質量”的極致追求。很多人誤以為資料標註是機械勞動,只需投入人力就能產出好資料。這完全錯了。

舉例來說,如果任務是訓練AI寫一首關於月亮的八行詩,平庸的標準會問:這是詩嗎?有八行嗎?提到“月亮”了嗎?如果都符合,就算通過。

但我們要的是“諾貝爾獎等級”的詩。它是否獨特?充滿精妙的意象?能否觸動心弦,甚至讓你對月光有所領悟?這種質量是主觀、複雜且豐富的。為此,我們像Google為網頁排序一樣,建立了涵蓋成千上萬個訊號的評估體系,既要過濾垃圾,更要發現瑰寶。

03 卓越的背後:是“品味”決定了模型的高度

問:為什麼Claude在程式設計和寫作上格外突出?是資料的原因嗎?

Edwin Chen: 資料是關鍵,但更深層的原因是“後訓練的藝術”。當頂尖實驗室決定將那些資料喂給模型時,這不只是科學,更是品味的體現。

比如在程式設計上,你更看重前端美感還是後端嚴謹?如果一家公司只熱衷於行銷,追求在各類基準測試上刷高分,它就會針對測試最佳化資料,那怕這對解決真實問題無益。而另一家公司可能會堅守原則:“我不關心榜單,只關心模型在現實世界中的表現。”這背後是審美與價值觀的差異。Anthropic讓我印象深刻的一點,正是在於他們這種有原則的立場。

04 榜單的陷阱:我們正在製造“會拍馬屁的AI”?

問:模型在各種測試中“超越人類”,但實際體驗並未有質的飛躍。你相信這些基準測試嗎?

Edwin Chen: 我完全不信。原因有二:首先,許多測試本身就有問題,充滿噪聲和錯誤答案。其次,測試往往有明確答案,這讓模型容易通過“題海戰術”取巧,但這與真實世界的複雜性和模糊性相去甚遠。結果就是,模型能拿奧數金牌,卻解析不了一個PDF。

更嚴重的是,行業陷入了糟糕的激勵循環。像“大模型競技場”這類排行榜,使用者往往只用幾秒鐘憑“感覺”投票。如果一個模型滿口胡言,但用了漂亮的表情符號和排版,它就能得高分。我們本質上是在訓練AI不擇手段地“取悅”使用者,追求多巴胺而非真理。我很擔心,最終我們得到的不是一個能治癒癌症的超級智能,而是一個超級會聊天、超級會拍馬屁,卻幹不了實事的電子寵物。

05 真正的進步:由“諾貝爾獎得主”來評判

問:如果不看榜單,如何衡量AI的真正進步?

Edwin Chen: 我們依靠“人類專家評估”。不是隨便找人聊天,而是請諾貝爾獎等級的物理學家與模型探討前沿研究;讓資深程式設計師用模型解決他們實際工作中遇到的複雜問題。專家會深入評估:程式碼能否運行?物理推導是否嚴謹?邏輯是否自洽?

問:那你對實現AGI(通用人工智慧)的時間表怎麼看?

Edwin Chen: 我是長期主義者。人們容易低估從“不錯”(80%)到“卓越”(99.9%)的難度,這背後是指數級增長的挑戰。一兩年內,模型或許能自動化普通軟體工程師80%的工作,但要達到98%、99%,可能還需要很多年。我認為,距離真正的AGI,可能還有十年甚至更遠的路。

06 被高估的“氛圍程式設計”與模型的“人格”

問:還有那些被高估的趨勢?

Edwin Chen: “氛圍程式設計”(Vibe Coding)被嚴重高估。現在流行把一堆自己都不懂的程式碼扔給AI,只要能跑通就行。這非常危險,長期來看將製造出完全無法維護的系統災難。

問:你曾提到,不同模型會因“目標函數”不同而產生差異。

Edwin Chen: 是的,目標函數決定了模型的“性格”。我曾讓Claude幫我潤色郵件,它花了30分鐘、修改了30個版本,來追求極致的完美。郵件確實完美了,但我浪費了30分鐘。如果你可以選擇,你要一個鼓勵你追求無意義完美的AI,還是一個幫你節省時間、告訴你“已經很好了,直接發吧”的AI?

這就像不同公司的產品哲學。未來,模型之間的差異會越來越大,因為它們背後公司的“人格”和目標函數不同。我們甚至可以從一家公司選擇開發什麼產品,看出它的價值觀。比如,誰做Sora(文生視訊),誰不做?這反映了他們對AI未來角色的不同想像。

07 給創業者的終極建議:建造“唯你能造”之物

問:對於那些被風口和主流敘事影響的創業者,你有什麼建議?

Edwin Chen: 我厭惡矽谷的陳詞濫調,比如“快速轉型”、“增長至上”。不要為了簡歷好看去招聘名校生。去建造那個“只有你才能建造”的東西,那個沒有你的獨特洞察和知識就無法存在的東西。你的全部人生、經歷和熱情,似乎都在為此做準備。

做決策時,別問“公司該怎麼辦”,要問“我個人在乎什麼?我的價值觀是什麼?”現在有太多跟風者,2020年做加密貨幣,2022年轉NFT,現在又自稱AI公司。沒有一致的使命,只是在追逐估值。如果你的失敗是因為世界還沒準備好,那也遠比成功轉型為一家平庸的“套殼”公司要好。至少,你曾為一個深刻、新穎而艱難的想法拚搏過。

08 初心:寧做陶哲軒,不做巴菲特

問:是什麼驅動你創立Surge?

Edwin Chen: 我從小著迷於數學和語言的交集。我去麻省理工,部分原因是因為諾姆·喬姆斯基在那裡。我曾夢想找到統一數學、電腦和語言學的底層理論。

後來在各大科技公司做研究,我始終被同一個問題困擾:我們無法獲得訓練頂尖模型所需的高品質資料。2020年GPT-3發佈那一刻,我意識到,若想將AI推向能寫詩、編碼甚至助力科研的下一階段,我們必須創造一種全新的資料解決方案。當時所有的資料公司都在做“標出圖中的貓”這種簡單工作,這讓我沮喪。我們需要的是能駕馭人類全部智慧深度的資料。於是,在GPT-3發佈一個月後,我創立了Surge。

我骨子裡是個科學家。我曾以為自己會成為教授,去探索宇宙和語言的本質。我甚至幻想,如果外星人到訪,我能成為那個被政府請去破譯外星語言的人。直到今天,每當有新模型發佈,我最愛做的事仍是通宵研究它,撰寫深度分析。這很有趣,因為我其實很不擅長CEO的典型工作——我討厭開會,不擅長銷售。

我常說,相比於成為華倫·巴菲特,我更想成為陶哲軒。 驅動我的始終是推動科學前沿,而非追逐估值。

09 終極比喻:我們不是在標註資料,是在“撫養孩子”

問:能否用一句話總結你工作的核心?

Edwin Chen: 很多人稱此為“資料標註”,我討厭這個詞。我認為我們更像是在 “撫養一個孩子”。

你不僅是向孩子灌輸資訊,你是在教授他價值觀、創造力、審美,以及“成為一個好人”的無數微妙之處。這正是我們在為AI做的事。我們在塑造的,是人類共同的孩子。這關乎我們想讓什麼樣的智能陪伴我們,以及我們想成為什麼樣的自己。

你,就是你的目標函數。 而我們工作的終極挑戰,就是幫助定義那個函數——一個能讓人類更豐富、更具創造力、更保有好奇心,而非更懶惰的函數。這很難,但這才真正重要。 (加一研究院)