一個從Google「打工人」走出的數學怪才,靠著自掏腰包創業,五年把公司做到營收超12億美元,估值300億美金。他討厭矽谷的浮誇,卻意外登上《福布斯400》富豪榜,成為最年輕的成員。
紐約,第九大道上奢華的三層星巴克臻選烘焙工坊。
Edwin Chen點了一杯綠茶,因為他覺得在這裡點咖啡太浪費時間。
37歲的他,剛剛成了美國《福布斯400》榜單裡最年輕的億萬富翁,身價高達180億美元!
但Edwin Chen是個怪人——
這是一個用自己方式改寫AI產業規則的人。
Forbes 400(福布斯美國400富豪榜)是美國福布斯雜誌(Forbes)每年發佈的榜單。
專門列出美國境內最富有的400位個人,按其淨資產(net worth)從高到低排名。
如果按照年齡排序,37歲的Edwin Chen是新晉的最年輕億萬富翁。
有意思的是,緊隨Edwin Chen之後的Lukas Walton是沃爾瑪創始人山姆·沃爾頓的孫子,2005年其父約翰·沃爾頓因飛機失事去世後,他繼承了大筆遺產,在福布斯400榜單上,他的淨資產為398億美元。
而如果按照淨資產的排序,排名前15的最年輕富豪是Google的兩位創始人,拉里·佩奇和謝爾蓋·布林(52歲),以及馬斯克(54歲),但沒有一個人是40歲以下,年齡最大是巴菲特(95歲)。
福布斯自己都認為,美國最富有的人群也往往是年紀最大的。
過去25年間,福布斯400富豪榜成員的平均年齡從61歲攀升至70歲,比39歲的美國人平均年齡整整大了三十歲。
在福布斯400最新的榜單中,Edwin Chen甚至還沒有頭像(目前)。
Edwin Chen此前如此低調,以至於即使Scale AI的Alexander Wang被Meta重金收購時,他的名字也沒有「浮現」在媒體中。
但隨著Scale AI引發的對資料標註的關注度,Edwin Chen如今這位福布斯400富豪榜最年輕的成員,正準備走出幕後發出自己的聲音。
福布斯的記者Phoebe Liu對Edwin Chen進行了一次專訪,揭開了這家另類資料標註公司Surge背後的故事。
Edwin Chen曾在Google、臉書和推特(現在的X)任職,在AI革命的浪潮中悄然創立了資料標註公司Surge。
Phoebe Liu在紐約的星巴克對Edwin Chen進行了兩個多小時的專訪,以下是訪談全文,略作刪改。
在曼哈頓公寓裡用整個上午審閱資料集、研讀論文並偵錯尖端AI模型後,Edwin Chen信步走向第九大道上的星巴克臻選烘焙工坊。
身著Vuori藏青色T恤,肩挎虎紋帆布托特包,Edwin Chen走下樓梯坐在暗角卡座。
這位資料標註與AI訓練公司Surge AI的創始人兼CEO啜飲著小杯綠茶。
Edwin Chen聊天時連珠妙語:
從矽谷文化(他深惡痛絕)到競爭對手(全是人力外包作坊);再到若外星人造訪地球時的人類互動方式,「他們不說英語,該如何溝通?如何破譯其語言?或許能通過某種數學方式實現。」
這一困境也在他最喜歡的短篇小說——科幻作家特德·姜1998年的作品《你一生的故事》中有所探討。
該小說後來成為電影《降臨》的藍本,講述了一位語言學家通過識別外星人語言和文字中的模式與之交流的故事。
Edwin Chen表示,這也是他在2020年創立Surge的部分靈感來源,他希望自己的資料標註公司能夠編碼「人性的豐富性」。
對他而言,這意味著讓最聰明的人類(包括史丹佛、普林斯頓和哈佛的教授)來訓練AI,將他們的專業知識轉化為支撐大語言模型的0和1程式碼。
除了這些常春藤聯盟的精英,Edwin Chen還僱傭了來自全球50多個國家的超過百萬名零工工作者,他們負責提出可能難倒AI的問題,評估模型的回答,並編寫幫助AI生成完美回覆的標準。
Edwin Chen說,「我真心認為我們所做的工作對所有AI模型都至關重要,沒有我們,通用AI(AGI)就不可能實現」。
Edwin Chen,一位言辭冗長、才華橫溢且性格古怪的人物,或許是你從未聽說過的最成功的科技企業家。
這主要是因為他一直刻意保持低調。
即使是Surge AI的官網也是同樣的低調,低調到首頁只有一堆文字,沒有酷炫的UI和精緻的互動效果。
這位曾在推特、Google和臉書任職的資料科學家避開了傳統的風險投資,七年前離開了矽谷這個「魚缸」,選擇用自己在大科技公司十年積累的「幾百萬」存款來資助Surge公司。
「我們自籌資金的原因之一是我一直討厭矽谷的地位遊戲,」Edwin Chen說道,他將典型的由風投支援的矽谷初創公司描述為「快速致富的計畫」。
他也討厭籌集大量資金然後不得不花掉的想法。
在他看來,這會導致大規模的超額招聘。
Surge僅有250名員工,包括全職、兼職和顧問。相比之下,其競爭對手Scale AI的員工數量是Surge的四倍,但收入卻更少。
Surge自成立不到五年間,2024年營收已達12億美元,客戶涵蓋Google、Meta、微軟以及AI實驗室Anthropic和Mistral。
Edwin Chen透露,公司幾乎從創立首日就實現盈利!
基於當前業績,其估值約達240億美元。
Surge正以300億美元估值進行10億美元融資談判,目前該輪融資尚未最終落定。
Edwin Chen決定使用「自有資金」支援Surge的決策獲得了豐厚回報:他持有的約75%股份估值約180億美元,這足以使他成為今年福布斯美國400富豪榜上最富有的新晉成員。
年僅37歲的他,也是該榜單上最年輕的成員。
Surge聲稱其方法不同於舊式的資料標註模式——後者往往僱傭全球欠發達國家的人員,以每小時幾美分的報酬讓他們坐在電腦前區分貓和狗。
相反,Edwin Chen的資料標註員(包括專業人士和教授)會遵循一套指令與線上聊天機器人互動。
他們可能被要求嘗試誘導聊天機器人輸出錯誤或有毒回覆,然後撰寫更好的回應;或者被要求比較不同AI對同一問題的回覆,並解釋為何某一回覆更優。
按收入計算,Surge目前是該行業最大的企業!
但包括Scale AI(Meta於6月以140億美元收購其49%股份)、Turing、Mercor和Invisible AI在內的競爭對手正在迅速崛起。
一直以來,Edwin Chen都在幕後默默建設他的公司並積累聲譽。
一位現任Meta研究員表示,Surge只是不願透露他們的任何工作細節。
但隨著行業的發展,Edwin Chen不再滿足於置身幕後。
他深切擔憂當今的AI模型被錯誤的目標所最佳化,將使用者引入幻覺兔子洞——這正如他曾在YouTube和Twitter工作時,那些平台的演算法主要被最佳化來追求點選率。
他希望Surge能幫助引領AI行業的發展,這意味著他要將自己定位為更具影響力的思想領袖。
Edwin Chen在佛羅里達州的水晶河(人口3400人)長大,這座墨西哥灣沿岸城市以海牛和退休人士而非科技億萬富翁聞名。
他的父母從台灣移民到美國,經營著一家中泰美式餐廳,Edwin Chen少年時期曾在那裡工作。
他真正的興趣在於語言與數學之間的關聯。
用他自己的話說:我一直對語言的數學基礎很著迷。
小時候,他想學習大約20種語言,並且熱愛拼字比賽。
數學對他來說很容易,但直到他開始注意到數字中獨特的模式,數學才真正抓住他的想像力。
Edwin Chen在八年級就學習了微積分,他表示自己獲得了精英寄宿學校喬特中學(位於康涅狄格州)最後兩年全額獎學金,該校校友包括約翰·甘迺迪和伊萬卡·川普。
在修完喬特所有數學課程後,他高三大部分時間都在耶魯大學教授指導下研究任何自己感興趣的課題。
隨後他進入麻省理工學院,主修數學,共同創立了語言學社團,並實行多相睡眠計畫——即將睡眠分割成多次短時休息,比如每六小時小睡30分鐘,而非連續八小時的長眠。
在麻省理工學院就讀三年後,Edwin Chen在彼得·蒂爾位於舊金山的避險基金實習,並對此非常喜歡,以至於再也沒有返校。
完成必修課程後,他申請了學位並於兩年後獲得。
隨後,他先後在推特、Google和臉書工作,擔任過涉及內容稽核和推薦演算法的多個職位。
在每一個職位上,Edwin Chen都遇到了同樣的問題:難以大規模獲取高品質的人工標註資料。
2020年,他離開推特,並於同年創立了Surge。
Edwin Chen是一名素食主義者,他每天步行兩萬步,並稱在紐約街頭漫步時能迸發出最佳思考。
每周一兩次,他會午夜漫步至時代廣場。
「我熱愛看到這濃縮的人間百態——百老匯演員、來自世界各地的遊客、夜班工人、藝術家——被燈光、科技與基礎設施環繞。」
「為什麼有人會想上市呢?上市公司的一大問題在於它們總是不得不為短期利益而擔憂。」
Edwin Chen厭倦了那些「完全是垃圾」的資料標註,這些標註要麼來自報酬過低而不在乎的人,要麼來自缺乏必要文化或政治知識以做出明智判斷的人。
Surge希望僱傭那些理解語境並對語言有深刻理解的人。
他在業務的其他方面也採取了獨特策略。
放棄傳統的銷售與行銷手段,他最初通過自己廣受歡迎的資料科學部落格進行溝通——這個部落格是他在十多年前業餘時間建立的。
他表示,Surge的首批客戶正是通過該部落格獲得,但拒絕透露具體名單。
已知早期客戶包括愛彼迎、Twitch及其前僱主推特公司。
他嘗試直接向科技公司的資料科學家進行推廣,認為這些人能識別Surge資料質量並更願意付費(據兩名研究人員透露,Surge的收費比競爭對手高出50%至十倍)。
2023年5月的一個周六夜晚,一位Google研究員經同事推薦致電Edwin Chen。
當時Google的Gemini系列AI模形狀況相當糟糕。
這通電話持續了兩個多小時。
不久後,Google與Surge簽訂了年額超1億美元的合同。
AI初創公司往往守口如瓶,但即便在同業中,Surge仍顯得格外神秘。
其最大客戶也不完全清楚其資料優勢所在。
反過來,Surge及其競爭對手也難以追蹤那些資料最終用於訓練Gemini、Claude或OpenAI的GPT模型。
Surge拒絕透露其項目人員匹配機制、資料收集方式及標註流程。
客戶支付數百萬美元後,獲得的僅是一個資料集連結。
這使得Surge能夠通過隱藏測試、由評分更高的標註員進行人工稽核,以及最佳化表現且可能相當對抗性的機器學習演算法,更密切地監控標註員的表現。
Edwin Chen堅持認為,Surge的質量控制和深厚的技術專長是其秘密武器。
對於Surge這類企業而言,存在一個根本性問題:隨著AI技術的進步,是否會有一天不再需要人類進行資料標註?
據Meta研究人員透露,今年四月發佈的Llama4等模型已大量依賴AI自主生成和標註資料——即所謂的合成資料。
Surge採用了一種人機協同的變通方案:由AI生成資料並自行標註,但由人類評估其表現。
Edwin Chen堅信人類不可或缺。
他指出當人類與AI協同工作時,所能達到的成就遠超任何單方的獨立成果。
但即便人類保持參與,若行業更注重機器自我訓練,仍將影響其盈利空間——因為訓練成本將大幅降低。 (新智元)