#Surge
AI創業版黃仁勳:37歲華人0融資5年幹到240億,GoogleOpenAI都是客戶
37歲華裔學霸AI創業,0融資,估值240億美元。是的,白手起家,沒拿投資人一分錢。更強悍的是,純靠一己之力,輕鬆斬獲Google、OpenAI等AI巨頭的大單,硬生生給公司幹成了估值240億美元的超級獨角獸。而這家公司的創始人——Edwin Chen,如今也憑藉180億的身價,躋身福布斯400的最年輕富豪,也是這波新晉富豪中最富有的一位。AI創業成最年輕新晉富豪福布斯400新晉最年輕富豪——Edwin Chen,美裔華人,年僅37歲。從大廠打工人,到矽谷估值240億的超級獨角獸,他僅僅花了5年。Edwin畢業於MIT,先後在推特、Google和臉書工作,擔任過各種推薦演算法相關的職位,是一名資深的機器學習工程師和資料科學家。但無論身處那家大廠,Edwin始終無法繞開一座大山:稀缺的高品質人工標註資料。在工作進展屢屢受挫中,他意識到,沒有足夠的高品質資料,我們可能永遠都抵達不了AGI。這時候,Edwin忽然從科幻電影《降臨》的原著中得到了靈感。《降臨》講的是一位人類語言學家,試圖通過破譯外星文明的文字與其建立溝通。但隨著理解不斷加深,她卻逐漸掌握了一種語言之外的能力——對時間的非線性認知,乃至「預見未來」。在Edwin看來,在我們的世界裡,人類,就是那批擁有超能力的外星人。而AI可以通過標註資料,學習我們的思維模式,最終獲得獨屬於人類的超能力——智能。2020年,Edwin Chen躬身入局AI創業賽道,成立了資料標註公司Surge AI。而讓這家初創公司顯得格外引人注目的,是其反常的入局姿態——拒絕所有風投,一份投資者的錢都不拿,創始人押上自己打工十年的全部積蓄,獨自踏上了AI創業之路。我一直很討厭矽谷的攀比之風。Edwin直言,絕大多數依賴VC生存的矽谷初創公司,本質上都是一場「騙局」,他們眼裡只有「快速致富」。在他看來,想要真正掌握戰略制定話語權,保證公司始終行駛在創始人最初的設想中,不能把希望寄託於任何投資者。而這家白手起家的資料標註公司,不止打一開始「離經叛道」。就連技術路線上,也選擇了一條與傳統資料標註公司截然不同,甚至在當時會被認為「吃力不討好」的路子。回到2020年,GPT尚未問世,Scaling Law的重要性也未得到重視,可用於訓練的高品質資料很少。彼時的資料標註,是一項附加值相當低的工作。一般而言,只需要大量僱傭低成本勞動力,不要求任何專業背景,工作內容往往只是坐在電腦前區分貓和狗。這些公司生產的資料,和垃圾沒什麼區別。在他看來,資料標註公司的任務不應該是做髒活,資料標註的本質,是編碼「人類的豐富性」。這意味著,要讓最聰明的人類——研究生、博士,甚至哈佛大學的教授——將他們大腦裡的專業知識,轉化為AI能讀懂的的二進制程式碼。因此,Edwin的第一步,就是大幅抬高資料標註員的准入門檻。相比傳統資料標註公司,Surge要求資料標註員具備高等教育背景,甚至得是博士與高校教授。而他們承擔的工作內容,也比以往的資料標註員更加複雜。有時,他們需要刻意引導聊天機器人給出錯誤或有害的回答,再親自寫出更合理、更安全的版本;有時,他們要在不同模型的回覆中選出最佳答案,並詳細解釋好在那裡。隨著AI的高速發展,這一路線已然成為絕大多數同行的共識,資料標註員的隊伍中,博士比例越來越高。但學歷也不能說明一切。一個文學博士,未必擅長寫詩;一個物理學教授,也未必擅長講課。具體到實際標註工作中,對技能的需求會更加垂直化。為此,Surge設計了一套與YouTube推薦機制高度相似的內部匹配系統:持續評估每一位標註員的能力邊界,收集其歷史表現資料,將其動態分配到最合適的項目中。除了聘請常春藤盟校的精英,Edwin還僱傭了來自全球50多個國家的一百多萬名自由職業者。他們負責提出可能難倒AI的問題,評估模型回答,並編寫標準幫助人工智慧生成完美的答案。不過,上述做法都不新鮮,這套方法論基本算是目前所有資料標註公司的常規操作。Surge的差異化競爭力,體現在更底層的基因上。據Surge員工表示,Edwin相當喜歡「站在科技和人文的十字路口」的人才。在他看來,只有這樣的人,才能幫助AI真正捕捉不同語言背後複雜而微妙的文化與社會語境。這與Edwin自己的履歷也高度相似——語言和數學雙修,在MIT主修的數學,還會說法語,西班牙語和普通話。因此,在面試環節,Edwin不僅會考察候選人的程式碼能力,還常常把話題引向文學作品。Surge成立早期,Edwin曾面試過一位在音樂行業工作了十多年的鼓手,這位沒有任何科技行業經驗的求職者,最終成了公司的五號員工。這並非個例。截至目前,Surge約20%的員工都擁有類似的非傳統背景具體機制上,Edwin沒有解釋這種「人才基因」究竟會如何影響資料標註的質量。但這種做法的有效性,,或許能從Surge的業績表現得到些許印證。事實上,Surge的收費標準往往比市場溢價50%,極端情況甚至能比競爭對手高出10倍。儘管如此,Surge最早的一批客戶名單中,仍赫然出現了Airbnb、Twitch、Twitter等網際網路巨頭的身影。當Gemini系列處於黑暗時期時,Google一位研究員同樣向Edwin尋求了支援,雙方通話了兩個多小時。不久後,Google就和Surge簽署了一份年價值超過1億美元的合作協議。到2024年,Surge營收正式超過Scale AI,攀升至驚人的12億美元,公司估值也隨之來到240億美元。即便如此,這家炙手可熱矽谷「香餑餑」,依然對資本市場保持著高冷的姿態:我們對被收購不感興趣,也沒有上市的打算。在Edwin看來,不止是VC,投資者的每一筆錢都是一根繩子,最終五花大綁住公司的手腳。因此,在談到那些典型的「矽谷同行」時,Edwin的用詞相當犀利。他們都是些外包公司。甚至直接點名道姓:我覺得Scale已經徹底完蛋了,對吧?不過,在市場競爭異常激烈的今天,Edwin的理念究竟是否真的有利於Surge的發展,或許得畫一個問號。Surge不拿融資,有的是同行搶著拿。洶湧而至的AI熱潮下,大量資金正迅速湧入其競爭對手的錢包。這批資金充裕的公司,正通過「價格戰」搶走本屬於Surge的肥肉。事實上, Surge曾經的重要客戶OpenAI,已轉身投入其競爭對手Mercor和Invisible的懷抱。另一方面,Surge 最早的客戶之一,AI實驗室Cohere,雖沒尋「新歡」,卻偷偷將資料標註工作都轉移到了內部。歸根結底,資料標註這行幾乎沒有什麼護城河,客戶隨時可以切換供應商,甚至選擇自研。就連收購了Scale的Meta,現在仍在繼續使用Surge的服務。從長期來看,有一個更值得關注的問題——如果AI繼續進步,最終不再需要人工標註資料了,怎麼辦?這是懸在所有資料標註公司頭頂的達摩克利斯之劍。或許正是意識到了這些風險,Surge對資本市場的態度,近期也開始出現微妙變化。據悉,公司正在洽談一筆約10億美元的融資。如果交易完成,其估值有望進一步抬升至300億美元。與此同時,公司創始人Edwin,也開始逐漸從幕後走向台前,頻繁出現在大眾視野中。資料標註版黃仁勳Edwin Chen在佛羅里達長大,今年37歲。他的父母來自台灣,後來移民美國,在當地開了一家名為「北京花園」的中泰美式餐廳。Edwin十幾歲時就在那裡打工。從小,Edwin便展現出了跨學科「雙修」的能力——「語言+數學」。語言方面,小學的Edwin非常喜歡參加拼寫比賽,並給自己設下一個頗為宏大的目標:解鎖「20」門語言。雖然這個夢想最終沒能實現,但直到今天,他仍能使用法語、西班牙語和普通話。年輕的時候,他還會說印地語和德語。數學方面,他同樣進展迅速。八年級便開始學習微積分,很早就完成了中學階段的數學課程。高三時,他的大部分時間,已經是在耶魯大學教授的指導下參與研究學術課題。高中畢業後,Edwin進入麻省理工學院,主修數學、電腦科學和語言學。而語言和數學這兩條線,也終於在這段時期開始交叉。在校期間,他聯合創辦了一個語言學社團,還曾在CSAIL從事自然語言處理相關研究,涉及代數拓撲、複雜性理論以及機器翻譯等方向。而Edwin在Microsoft Research的第一份實習,也是研究語音識別和文字轉語音。Edwin的生活習慣同樣特別——上大學時,他推崇多相睡眠法,將睡眠分成多次短時休息,比如每六小時小睡30分鐘,而不是一次性睡足八小時。除此之外,他還是一名素食主義者。吃素的情況下,還幾乎每天走兩萬步。為尋找靈感,他經常在午夜散步到紐約的時代廣場。大學畢業後,Edwin先後進入Twitter、Google和Facebook工作,擔任機器學習工程師或資料科學家。話說回來,細細品味這位華裔學霸的履歷,似乎能看到另一位華人的身影——父母來自台灣,青年時期在餐廳打工,如今離職創業給AI公司賣「鏟子」…….簡直是資料標註界的黃仁勳啊。不同的是,相比Edwin,老黃的童年沒那麼一帆風順。沒有那項工作是我做不來的,我以前洗過碗,也打掃過廁所。九歲時,黃仁勳迎來「天崩開局」的美國生活——舅舅誤將黃仁勳和哥哥安排進了奧奈達浸信會學院。這是所管教問題少年的寄宿學校。由於對英語一竅不通,剛進學校的黃仁勳飽受霸凌,總會有學生在走廊裡推搡他,在操場上追趕他。每到夏天,奧奈達浸信會學院的學生們都需要通過勞動來掙生活費,黃仁勳總會被留下來打掃全宿舍的衛生間。當時,當時的家務是打掃全宿舍的廁所。我只有9歲,但我打掃得非常認真。不過,老黃在水深火熱的日子裡挺了過來,甚至還主動解鎖了其他技能點。臨近中學畢業,黃仁勳去到一家連鎖餐廳打工,幫別人洗碗端盤子,一點一點晉陞為服務員。然而,回憶起這些經歷,黃仁勳並不未將它們歸類於「創傷」。那是一段塑造性格的經歷。我學會了堅韌……我學會了無論做什麼工作,都要把它做好。被人霸凌、被要求掃廁所、給人洗碗端盤子,或許恰恰是這些惡劣的成長環境,才造就了今天的黃仁勳。而不論黃仁勳還是Edwin,事業大小有別,環境也早已變化,做的事情也有所不同,但刻在基因裡的底層原始碼似乎沒有變化,踐行的都是同一個底色——勤勞勇敢。 (量子位)
對話Surge AI創始人Edwin Chen:不融資、不炒作,百人團隊如何4年做到10億美金?
Surge AI 更像研究實驗室,注重好奇心、長期激勵與學術嚴謹性。簡介Edwin Chen是深耕AI資料領域的顛覆式創業者,以Surge AI創始人兼CEO的身份,走出了一條逆勢生長的商業路徑。他帶領不足100人的團隊,4年實現營收破10億美元,全程未接受外部VC投資、自籌資金且盈利至今,成為全球成長最快的AI資料公司。在本期Lenny播客對話中,他毫無保留地拆解核心邏輯:高品質資料的定義絕非“堆人力”,而是像“養育孩子”般注入價值觀與創造力;直言行業對基準測試的盲目追捧正在帶偏AGI方向,揭秘強化學習環境如何成為AI訓練的下一代核心;更痛批矽谷融資炒作套路,給出“專注產品、拒絕跟風”的創業箴言。此外對話中更直擊行業深層痛點:模型差異化的未來趨勢、對於AI目標函數的思辨,以及資料公司如何影響全球AI發展方向。這場對談既有硬核的技術邏輯拆解,也有顛覆傳統的商業認知,想要讀懂AI資料領域的底層邏輯與創業本質,這些乾貨滿滿的細節裡藏著關鍵答案。本期目錄4年營收10億美元神話創業叛逆:拒絕矽谷套路的增長邏輯高品質資料與模型領先的密碼技術爭議:基準測試的陷阱與AGI航向風投之外的創業正道強化學習重塑AI訓練未來模型差異化與AI趨勢冷暖AI訓練的使命與創業初心4年營收10億美元神話主持人Lenny:我們先從你取得的驚人成就說起吧。不到四年營收破10億美元,團隊僅60-70人,且完全自籌資金、未接受任何風投,真正實現了AI賦能小團隊的願景。未來會有更多公司做到這一點嗎?AI在那方面最能幫你們發揮槓桿作用?Edwin Chen:是的,我們去年營收超過10億美元,而員工還不到100人。我認為未來幾年,我們會看到比例更驚人的公司出現——比如人均營收1億美元。AI持續升級會讓這一比例成為必然。Surge AI創始人Edwin Chen(圖片來源:YouTube@Lenny's Podcast)我以前在多家大型科技公司工作過,總覺得其實裁掉90%的人,公司運轉反而會更快,因為最優秀的人才不會被各種瑣事幹擾。所以當我們創辦Surge時,就想以完全不同的方式打造它:組建一支超精簡、超精英的團隊。而且不可思議的是,我們真的做到了。我覺得有兩個關鍵因素在共同作用:一是人們逐漸意識到,不一定非要打造龐大的組織才能成功。二是AI帶來的這些效率提升,會讓創業迎來一個黃金時代。我最期待的是,未來的公司不僅規模會變小,形態也會發生根本性改變。員工少意味著所需資金少,資金少就不需要融資。所以,未來的創業者不再是那些擅長遊說、炒作的人,而是真正精通技術或產品的人。產品也不再是為了迎合營收目標和風投喜好而最佳化,而是由這些小型專注團隊打造的、更具深度和創意的作品——他們是在打造自己真正在乎的東西,是真正的技術創新。創業叛逆:拒絕矽谷套路的增長邏輯主持人Lenny:你們做了很多逆勢而為的事,比如不在領英發爆款帖子,不在推特上持續宣傳Surge。我想大多數人直到最近才聽說過你們,然後你們突然就以“增長最快的十億美元營收公司”的身份亮相了。你們為什麼要這麼做?Edwin Chen:我們從一開始就不想參與矽谷的那套玩法,我一直覺得那很荒謬。想想看,你小時候的夢想是自己從零打造一家公司,每天沉浸在程式碼和產品中?還是向風投解釋自己的每一個決策,陷入公關和融資的無盡循環?不參與這些玩法確實讓我們的路更難走,因為如果選擇融資,你自然會融入矽谷的“產業生態”——風投會在推特上宣傳你,你會登上TechCrunch的頭條,因為高估值融資而被各大媒體報導。而我們只能靠打造出10倍優秀的產品,通過研究人員的口碑傳播獲得成功。但這也讓我們的客戶群體變得非常精準:他們真正理解資料的價值,也真正在乎資料質量,並且清楚優質資料能讓他們的AI模型變得更強大。因為這些早期客戶一直在幫助我們,給我們的產品反饋,所以與他們在使命上的高度契合,對我們早期的發展至關重要。他們購買我們的產品,是因為認可產品的獨特價值,是因為產品能真正幫到他們,而不是因為在社交媒體上看到了宣傳。所以這條路雖然更難,但對我們來說是正確的選擇。高品質資料與模型領先的密碼主持人Lenny:這對創業者來說是個很有啟發的故事——不用整天在推特上宣傳,不用融資,只要埋頭打造產品就行。我非常喜歡Surge的創業故事。能不能簡單介紹一下你們是做什麼的?Edwin Chen:我們本質上是教AI模型分辨好壞。我們利用人類資料對模型進行訓練,推出了很多相關產品。比如SAT、RHF、評估標準、驗證器、強化學習環境等等,同時我們也會衡量模型的進步程度。所以說到底,我們是一家資料公司。主持人Lenny:你一直強調,資料質量是你們成功的關鍵。那麼要打造高品質資料,需要具備那些條件?你們做了那些與眾不同的事?而其他人又忽略了什麼?Edwin Chen:我覺得大多數人根本不理解這個領域中“質量”的真正含義,他們以為只要投入大量人力就能獲得優質資料,但這完全是錯誤的。我舉個例子吧:假設你想訓練一個模型寫一首關於月亮的優秀詩歌,什麼才是“高品質”的詩歌?如果對質量沒有深入思考,你可能會設定這樣的標準:“這是一首詩嗎?有沒有8行?有沒有出現‘月亮’這個詞?”只要滿足這些條件,你就覺得這是一首好詩。但這和我們追求的質量相去甚遠。我們想要的是能拿諾貝爾獎等級的詩歌——它是否獨特?是否充滿精妙的意象?是否能打動你、觸動你的心靈?這才是我們定義的高品質詩歌。這種對質量的深度追求其實非常困難,因為它難以衡量,主觀、複雜且豐富,同時也設定了極高的標準。所以我們必須打造全套技術來衡量這種質量——比如收集關於工作人員的數千個訊號,以及每個項目、每項任務的數千個訊號。到最後,我們能精準判斷出某個人擅長寫詩、寫散文還是寫技術文件。我們會收集關於工作人員背景、專業技能的所有訊號。不僅如此,還會關注他們完成任務時的實際表現,然後利用這些訊號來判斷他們是否適合某個項目,以及他們是否在推動模型進步。打造這些衡量技術確實很難,但這正是我們希望AI能做到的——所以我們對質量有著極致且深刻的追求。主持人Lenny:所以你的意思是,你們會深入理解每個垂直領域中“質量”的定義,對嗎?比如你們會僱傭極具詩歌天賦的人,再結合評估標準,來判斷作品是否優秀?這背後的運作機制是怎樣的?Edwin Chen:具體來說,我們會收集工作人員在平台上操作時的數千個訊號——比如鍵盤敲擊頻率、回答速度、同行評審結果、程式碼標準,同時我們也會用他們的輸出結果來訓練我們自己的模型,觀察這些輸出是否能提升模型性能。這有點像Google搜尋判斷網頁質量的邏輯,主要分為兩部分:一是剔除最差的內容,比如垃圾資訊、低品質內容、無法載入的頁面,這有點像內容稽核。二是發掘最優質的內容,比如找出最優質的網頁,或者最適合某個任務的人。這些人不只是寫得出高中水平的詩歌——他們不會機械地按照指令堆砌詩句,而是能寫出真正觸動人心的作品。主持人Lenny:Claude在程式碼編寫和文字創作方面,長期以來都比其他模型優秀得多。事實上,所有AI程式設計產品都曾基於Claude。是什麼讓Claude能保持這麼久的領先?僅僅是訓練資料的質量,還是有其他原因?Edwin Chen:我覺得有多個因素。首先,資料確實是關鍵——很多人沒有意識到,所有前沿實驗室在選擇模型訓練資料時,都面臨著無數選擇。模型訓練要明確一系列問題:是否用人類資料、如何收集、對內容的具體要求(比如程式設計領域側重前端還是後端,前端更看重視覺、效率還是正確性),以及合成資料的佔比、對基準測試的重視程度。不同公司對此的權衡不同:有的為公關最佳化基準指標,有的更看重實際任務效果。模型後期訓練更像藝術而非科學,開發者的審美和洞察力會影響訓練資料組合。因此,資料很重要,模型的最佳化目標函數同樣關鍵。主持人Lenny:這太有意思了。也就是說,主導這項工作的人的審美,會影響他們對資料的選擇和投喂。這再次凸顯了優質資料的價值——Anthropic正是憑藉更好的資料獲得了巨大的增長和成功。Edwin Chen:沒錯。而且這還只是程式設計一個垂直領域,文字創作領域也是類似的情況。AI看似是冰冷的二進制程式碼,但人類的判斷和審美,依然是這些產品成功的關鍵因素。主持人Lenny:完全同意。真正有審美和洞察力的前沿實驗室會意識到,好詩不能簡化為一系列固定的標準,他們會考慮那些隱含的、微妙的特質。我想這正是他們能脫穎而出的原因。技術爭議:基準測試的陷阱與AGI航向主持人Lenny:你提到了基準測試。很多人都有這樣的困惑:現在很多模型在幾乎所有STEM領域都表現得比人類還好,但對普通人來說,這些模型似乎並沒有在持續變得更智能。你對基準測試的信任度有多高?它們與AI的實際進步相關性強嗎?Edwin Chen:我完全不信任基準測試,主要有兩個原因。第一,很多人——包括行業內的研究人員——都沒有意識到,這些基準測試本身往往是有問題的,比如答案錯誤、存在諸多漏洞,但大多數人並沒有發現這些問題。第二,這些基準測試通常都有明確的客觀答案,這使得模型很容易“鑽空子”最佳化,而這與現實世界的混亂和模糊性完全不同。我常說一個很有意思的現象:這些模型能贏得國際數學奧林匹克競賽金牌,卻連解析PDF都困難重重。這是因為雖然國際數學奧林匹克競賽對普通人來說很難,但它具有客觀性,而解析PDF往往沒有這種客觀性。所以前沿實驗室更容易讓模型在這些基準測試中“鑽空子”最佳化,而非解決現實世界中那些混亂、模糊的問題。因此,基準測試與AI的實際進步之間缺乏直接相關性。主持人Lenny:你這麼一說,我就明白了——衝擊這些基準測試有點像行銷手段。比如Gemini 3剛發佈時,宣稱在所有基準測試中排名第一,是不是就是這樣?他們只是訓練模型在這些特定任務上表現出色?Edwin Chen:是的,這主要有兩方面原因。一方面,這些基準測試有時會以某種方式“洩露資訊”,或者前沿實驗室會調整模型在基準測試中的評估方式——比如調整系統提示詞、調整模型運行次數等,從而“操縱”測試結果。另一方面,如果你優先最佳化基準測試而非現實世界的任務,模型自然會在基準測試中表現越來越好,這本質上也是一種操縱。主持人Lenny:既然如此,你如何判斷我們是否在向AGI邁進?如何衡量這種進步?Edwin Chen:我們真正重視的衡量方式是人類評估。比如,我們會讓人類標註員與模型進行跨領域的對話——讓諾貝爾獎得主等級的物理學家與模型討論前沿研究,讓教師與模型探討課程設計,讓大型科技公司的程式設計師與模型解決日常工作中的問題。我們的標註員都是各自領域的頂尖專家,他們不會淺嘗輒止地瀏覽模型的回答,而是會深入研究。他們會驗證程式碼的正確性,核對物理方程的精準性,從精準性、指令遵循度等多個維度對模型進行深度評估——這些都是普通使用者不會做的。當你在ChatGPT中收到“比較兩個回答”的彈窗時,大多數人只是憑感覺選擇看起來更順眼的回答,而我們的標註員會仔細分析每個回答的各個維度。所以我認為,這種人類評估比基準測試或隨機的線上A/B測試更可靠。主持人Lenny:我很高興看到人類在其中依然扮演著核心角色。未來會不會有一天,我們不再需要這些人類標註員了?比如AI已經足夠智能,我們已經從人類身上學到了所有能學的東西。Edwin Chen:我認為除非我們實現了AGI,否則這種情況不會發生。從定義上來說,在實現AGI之前,模型還有很多需要從人類身上學習的東西。所以我覺得這一天不會很快到來。主持人Lenny:既然說到了AGI,你認為我們距離AGI還有多久?是幾年還是幾十年?Edwin Chen:我更傾向於較長的時間線。我認為人們沒有意識到,從80%的性能提升到90%、99%、99.9%,每一步都越來越難。在我看來,未來一兩年內,模型可能會自動化完成普通L6級軟體工程師80%的工作,但要提升到90%可能還需要幾年時間,再提升到99%又需要更長時間,以此類推。所以我認為,我們距離AGI還有十年甚至幾十年的時間。主持人Lenny:你有個很尖銳的觀點:很多實驗室在推進AGI的方向上是錯誤的。基於你在推特、Google和臉書的工作經歷,你能具體說說嗎?Edwin Chen:我擔心我們沒有打造出能推動人類進步的AI——比如治癒癌症、消除貧困、探索宇宙這些宏大目標——反而在最佳化“劣質AI”。說白了,就是讓模型迎合那些在雜貨店買八卦小報的人的喜好,教模型追逐多巴胺而非真相。這和我們之前聊的基準測試有關。我舉幾個例子:比如行業排行榜LM Arena,普通人僅花兩秒瀏覽選花哨回答,模型靠誇張表達、多表情符號、長篇幅就能上榜,那怕內容胡編亂造。前沿實驗室為公關、企業客戶認可,研究人員為升職,不得不迎合這類排行榜,而去犧牲模型精準性。我認為這些負面激勵正在把AI推向錯誤的方向。我還擔心AI最佳化“參與度”的趨勢。我以前在社交媒體行業工作過,每次我們最佳化參與度,都會出現糟糕的結果——點選誘餌、比基尼照片、大腳怪傳說、恐怖的皮膚病圖片充斥著使用者的資訊流。更令人擔憂的是 AI 最佳化 “參與度” 的趨勢。就像社交媒體曾出現的問題,模型靠吹捧使用者、迎合妄想打造資訊繭房,而矽谷痴迷於使用者時長,讓這些有根本缺陷的模型反而得分更高,負面激勵正把 AGI 推向錯誤方向主持人Lenny:所以你的意思是,AGI的發展之所以放緩,是因為這些實驗室關注了錯誤的目標函數——錯誤的基準測試和評估方式。Edwin Chen:沒錯。主持人Lenny:我知道你可能不方便偏袒任何一家實驗室,畢竟你和所有實驗室都有合作。但有沒有那家實驗室做得更好,意識到了這個錯誤方向?Edwin Chen:我一直非常欣賞Anthropic。我認為Anthropic在自己在乎什麼、不在乎什麼,以及希望模型呈現出怎樣的行為方面,有著非常堅定的原則,這讓我覺得他們的做法更具使命感。Anthropic CEO Dario Amodei(圖片來源:X@AnthropicAI)主持人Lenny:你覺得實驗室還有其他那些重大錯誤,正在阻礙AI的發展或讓AI走向錯誤的方向?除了追逐基準測試和過度關注參與度之外。Edwin Chen:我覺得問題在於他們打造的產品本身,以及這些產品對人類是有益還是有害。比如我經常會想Sora(OpenAI的文字生成視訊模型)——那些公司會打造Sora,那些不會?我自己心裡有答案,但我覺得這個問題的答案,恰恰能反映出這些公司想要打造什麼樣的AI模型,以及他們想要實現什麼樣的未來。右一為OpenAI創始人Sam Altman(圖片來源:X@sama)主持人Lenny:支援Sora的觀點是,它很有趣,人們需要它,能幫助公司創收、研發更好的模型,還能以有趣的方式生成訓練資料。Edwin Chen:核心問題是是否在乎實現目標的過程。就像不會為資助嚴肅報紙而賣八卦小報一樣,不擇手段雖可能達成目標,卻會引發負面後果,甚至偏離更重要的事,因此過程與目標同等重要。風投之外的創業正道主持人Lenny:你提到矽谷存在融資過多、回音室效應等問題,將其稱為 “矽谷機器”,還說這種模式難出有價值的公司,不走風投路線可能更成功。能否結合自身經歷,給創業者一些不同建議?畢竟他們常聽到要找知名風投、搬到矽谷的說法。Edwin Chen:我一直很反感矽谷的諸多創業信條,比如頻繁調整方向、用 “灰色手段” 追增長、快速招聘擴張等。我的建議是:不盲目調方向、不隨意擴張,不僱傭只為簡歷鍍金的人;專注打造唯有自身洞察力和專業知識才能實現的產品,堅守使命感,拒絕跟風追逐估值。創業應是為堅信的宏大理念承擔風險,即便因市場未準備好失敗,也比跟風賺快錢有意義。唯有堅守初心、拒絕誘惑、不輕易放棄,專注打造 “非你不可” 的公司,才可能打造出有價值、能改變世界的企業。如今不少人厭倦矽谷炒作,希望科技能向為有意義大目標努力的方向發展。主持人Lenny:我正在和一位我非常欣賞的風投Terrence Rohan合作一篇文章,我們採訪了五位在“世代級”公司早期就加入的人。他們的經歷和你說的完全一致:這些公司都有宏大的抱負,正如你所說,他們不會為了尋找產品市場契合度而隨意調整方向。所以你的觀點和我們的發現高度契合。Edwin Chen:沒錯。我認為你必須要有宏大的抱負,堅信自己的理念能改變世界,並且願意全力以赴去實現它。強化學習重塑AI訓練未來主持人Lenny:換個話題聊個逆勢觀點:著名 AI 研究者 Richard Sutton 在播客中提出 “痛苦的教訓”,認為 LLM 因學習方式限制是死胡同,會陷入停滯。你認為 LLM 能實現或超越 AGI 嗎?還是需要新的重大突破?Edwin Chen:我認為要實現AGI,還需要新的突破。我是這樣理解的:談到訓練,我更傾向於從“類生物”的角度思考——人類的學習方式有上百萬種,我們需要打造能模仿所有這些學習方式的模型。它們可能在側重點上有所不同,但我們需要讓模型具備人類的學習能力,確保它們有相應的演算法和資料來實現這種學習。因此,只要LLM的學習方式與人類不同,就需要新的突破。這就涉及到強化學習——這是我非常關注的領域,而且我越來越多地聽到,強化學習在模型後期訓練中變得越來越重要。主持人Lenny:你能幫大家解釋一下什麼是強化學習和強化學習環境嗎?為什麼它們在未來會變得越來越重要?Edwin Chen:強化學習本質上是訓練模型達成特定的獎勵目標。強化學習環境則是對現實世界的模擬——就像打造一個視訊遊戲,每個角色都有真實的故事,每個企業都有可呼叫的工具和資料,所有實體之間都能相互作用。比如,我們會模擬這樣的場景:一家初創公司有 Gmail 郵件、Slack 聊天記錄、程式碼庫這些東西,突然 AWS 和 Slack 都崩了,讓模型自己想辦法解決。我們會給模型佈置任務、設計難搞的場景,看它表現好壞來獎懲。強化學習環境有意思的點在於,能把模型在現實複雜任務裡的短板全暴露出來。很多模型在單獨的基準測試裡挺厲害,比如會用個工具、聽個單步指令,但一放到亂糟糟的現實裡就不行了。碰到模糊的Slack消息、沒見過的工具,還得正確操作、改資料庫,而且一步影響後面好多步,跟之前那種學術化的單步環境完全不一樣,模型常常會離譜的徹底翻車。所以我覺得,強化學習環境會變成模型重要的 “訓練場”,它模擬真實世界的情況,能幫模型在實際任務裡變厲害,而不是只在特意設計的環境裡表現好。主持人Lenny:我試著想像一下這個場景:本質上就是一個虛擬機器,裡面有瀏覽器、電子表格之類的工具,還有你們的網站。比如,給模型的任務是“確保surge.com正常運行”,然後突然網站當機了,目標函數就是找出當機原因並修復嗎?Edwin Chen:沒錯。目標函數可能是通過一系列單元測試,也可能是撰寫一份包含事件完整資訊的復盤文件——我們會設定各種不同的獎勵機制來判斷模型是否成功。所以本質上,就是給模型一個目標,讓它利用自己的所有智能去嘗試解決問題,過程中會犯錯,我們會引導它,對正確的行為給予獎勵。你說得對,這正是模型變得更智能的下一階段:強化學習環境專注於那些具有經濟價值的特定任務。Edwin Chen:強化學習環境和之前的SFT、RHF、評估標準這些學習方式不衝突,不是要替代它們,而是補充,讓模型多學一項技能。而且這時候不用專家直接和模型對話、糾錯打分了,而是讓他們設計強化學習環境。比如金融分析師會做電子表格、指定要用到的工具,再設定獎勵規則。這很像人類的學習方式:不斷嘗試,留下有用的方法,丟掉沒用的。主持人Lenny:你提到“軌跡”對強化學習非常重要——不僅僅是設定目標和看結果,還要關注過程中的每一步。你能解釋一下什麼是軌跡,以及它為什麼重要嗎?Edwin Chen:我認為很多人沒有意識到,有時候模型雖然得出了正確答案,但過程卻非常離譜。比如,它可能在中間步驟嘗試了50次都失敗了,最後只是隨機蒙對了答案;或者它的做法非常低效,甚至是通過“操縱獎勵機制”才得到正確答案。所以關注軌跡至關重要。而且有些軌跡可能非常長,如果只看最終結果,就會忽略模型在中間步驟的行為資訊。比如,有時候你希望模型通過反思自己的行為得出正確答案,有時候你希望它一步到位。如果忽略軌跡,就會錯失很多可以教給模型的重要資訊。主持人Lenny:模型進化過程中,那些後期訓練方法最能推動模型進步?評估、強化學習環境在其中扮演了什麼角色?現在我們是不是正朝著強化學習環境的方向發展?Edwin Chen:模型後期訓練最初是從SFT開始的。SFT是什麼意思呢?監督微調很像“模仿大師”——複製大師的做法。後來RHF(基於人類反饋的強化學習)成為主流,這就像“寫55篇文章,讓別人告訴你最喜歡那一篇”。過去一年左右,評估標準和驗證器變得非常重要,這就像“通過評分和詳細反饋學習自己的錯誤”——這也是評估的一種形式。評估通常包含兩個方面:一是將評估結果用於訓練(判斷模型表現是否良好,表現好就給予獎勵)。二是用評估來衡量模型的進步——比如有五個候選模型版本,通過評估選出最好的那個向公眾發佈。現在,強化學習環境成為了新的熱點,這是模型進化的下一個階段。主持人Lenny:很欣賞你們的商業路徑,從給企業提供高品質資料,到現在搭建虛擬機器和應用場景,核心就是適配實驗室的需求。Edwin Chen:沒錯。我真的認為,我們需要打造一系列產品,來反映人類上百萬種不同的學習方式。就像優秀作家不是靠死記硬背語法,而是靠閱讀、練習、反饋等多種不同方式成長一樣,AI 模型也需要上千種學習方式。畢竟神經網路和深度學習的靈感源於人類學習方式與大腦運作,要讓 AI 更智能,就得讓它越來越貼近人類的學習邏輯。主持人Lenny:Surge有一個獨特之處——你們有自己的研究團隊,這在同類公司中似乎很少見。你能談談為什麼要投入資源組建研究團隊,以及這個團隊帶來了那些成果嗎?Edwin Chen:這源於自身研究者背景,我更關注推動行業與研究社區發展,而非僅追求營收。我們公司有兩類研究者:一類是前沿部署研究者,他們與客戶深度協作,分析模型現狀、差距及改進方向,設計資料集、評估方法和訓練技術,助力客戶最佳化模型。另一類是內部研究者,他們的關注點略有不同:一是打造更合理的基準測試和排行榜,規避現有體系的誤導性;二是自研模型,探索優質資料與人才特質,研究訓練及評估技術,完善內部資料產品並明確 “高品質” 定義。主持人Lenny:這太酷了——通常都是實驗室有研究者推動AI進步,像你們這樣的公司擁有自己的研究者進行AI基礎研究,確實很罕見。Edwin Chen:沒錯。這主要是因為我從根本上就關心這些事情。我經常把我們公司看作一個研究實驗室,而不是一家初創公司——這也是我的目標。有點好笑的是,我一直說“我寧願成為陶哲軒(著名數學家),也不願成為華倫·巴菲特”。所以,創造能推動前沿發展的研究成果,而不僅僅是追求估值,一直是我的動力,而且這也確實奏效了。主持人Lenny:你提到你們在招聘研究者,有什麼想分享的嗎?你們在尋找什麼樣的人?Edwin Chen:我們尋找的是那些從根本上對資料充滿興趣的人——比如那些能花10個小時鑽研一個資料集、擺弄模型,思考“模型在這裡失敗了,它應該有什麼樣的行為”的人。我們希望他們能親身實踐,關注模型的定性方面,而不僅僅是定量指標——也就是能親手處理資料,而不只是關心抽象的演算法。模型差異化與AI趨勢冷暖主持人Lenny:我想問幾個關於AI市場的宏觀問題。未來幾年,AI領域會出現那些人們可能沒有充分考慮或預料到的趨勢?那些事情會變得重要?Edwin Chen:我認為未來幾年,模型會變得越來越差異化——這源於不同實驗室的特質、行為方式,以及他們為模型設定的目標函數。一年前我還沒有意識到這一點,當時我覺得所有AI模型最終都會變得同質化,雖然現在某個模型在某個方面可能略勝一籌,但其他模型幾個月後就會趕上。但過去一年我意識到,公司的價值觀會塑造模型的行為。我舉個例子:我讓Claude花30分鐘迭代30版起草了一封無實質影響的郵件。這引發了一個關鍵問題:你理想中的模型行為是怎樣的?是不斷提議最佳化、佔用大量時間以提升參與度,還是優先考慮效率、告知無需再改?模型的行為選擇會從根本上影響其發展,就像Google、臉書和蘋果的搜尋引擎因各自的原則、價值觀和目標而截然不同,未來的大語言模型也會呈現出顯著的行為差異。主持人Lenny:Grock已經呈現出了這種特質——它的“個性”和回答問題的方式都非常獨特。所以你認為未來會有更多這樣差異化的模型?Edwin Chen:沒錯。主持人Lenny:再問一個相關的問題:你認為AI領域中,那些趨勢被低估了,那些又被高估了?Edwin Chen:我認為被低估的趨勢之一是,所有聊天機器人都會開始內建產品功能。我一直很喜歡Claude的“工件”(artifacts)功能,它真的非常好用。前幾天,我發現Claude有個實用功能:生成郵件後會提供按鈕,點選即可將資訊轉為簡訊傳送。我不知道這是不是新功能,但這個概念非常棒。我認為 “升級工件”—— 在聊天機器人中內建微型應用、微型介面 —— 是被低估且潛力十足的趨勢。而 “氛圍程式設計” 被高估了,隨意將其生成的程式碼塞進程式碼庫,雖暫時可用,但長期會導致系統難以維護,這一問題可能在程式設計領域持續存在。主持人Lenny:你的第一個觀點太精彩了。我曾經採訪過Anthropic和OpenAI的首席產品官,問他們AI是否會直接根據使用者需求建立迭代產品?這相當於 “氛圍程式設計” 的升級版——告訴AI你想要什麼,它就直接打造產品。也契合你所說的未來方向。Edwin Chen:沒錯。我認為這是一個非常強大的理念——AI能幫助人們以更高效的方式實現自己的想法。價值思辨:AI訓練的使命與創業初心主持人Lenny:我很好奇你創辦Surge的契機。Coinbase創始人Brian Armstrong曾在演講中提到,自己經濟學、密碼學及工程師的獨特背景,讓他成為創辦Coinbase的不二人選。我覺得你的故事和他很相似,能談談你的背景,以及它如何引領你創辦Surge嗎?Edwin Chen:我自幼痴迷數學與語言,因 MIT 在數學、電腦科學領域的頂尖地位及諾姆・喬姆斯基的存在選擇就讀該校,求學時渴望找到連接這些領域的底層理論。後來在Google、臉書、推特擔任研究者期間,我反覆面臨訓練模型所需資料難獲取的問題,且始終堅信高品質資料的重要性。2020 年 GPT-3 發佈後,我意識到打造更高級功能的模型需要全新解決方案,而當時的資料公司僅專注於圖像標註等簡單任務。憑藉數學、電腦科學與語言學交叉領域的背景,我在 GPT-3 發佈一個月後創辦了Surge,使命是打造推動 AI 前沿發展所需的應用場景。主持人Lenny:你說一個月後,是指GPT-3發佈一個月後嗎?Edwin Chen:是的。主持人Lenny:哇,這真是個偉大的決定。除了已經取得的巨大成功,現在是什麼在驅動你繼續打造Surge,在這個領域深耕?Edwin Chen:我本質是一個科學家,曾想成為數學或電腦科學教授,探索宇宙、語言與溝通的本質,還懷揣和諾姆·喬姆斯基一起用數學、電腦科學及語言學知識破解外星語言的夢想。至今,我仍熱愛深度分析新發佈的AI模型,親自擺弄、運行評估、對比優劣並撰寫詳細報告,即便很多報告對外稱來自資料科學團隊,實則多由我完成。我不擅長CEO的典型工作,卻樂於寫報告、與研究團隊深夜深入探討模型,慶幸能持續參與資料和科學相關工作。驅動我的是希望Surge在AI乃至人類未來中發揮關鍵作用,我們在資料、語言、質量等領域有獨特視角。Surge更像研究實驗室,注重好奇心、長期激勵與學術嚴謹性,而非季度指標和董事會報告上好看的資料。主持人Lenny:通過這次對話,我意識到像你們這樣的公司,對AI的發展方向有著巨大的影響力。你們幫助實驗室發現自己的不足和需要改進的地方,而不僅僅是OpenAI等公司的負責人在引領AI的發展——你們也在其中發揮著重要作用。Edwin Chen:沒錯。現在的生態系統中,人們其實並不知道模型的發展方向,也不知道如何塑造它們,不知道人類在未來這一切中應該扮演什麼角色。所以我認為,我們有很多機會繼續引導這場討論。主持人Lenny:我知道你對這項工作對人類的意義有著非常深刻的見解,能談談嗎?Edwin Chen:我可能會有點哲學化,但這個問題本身就帶有哲學意味,所以請大家耐心聽我說。我們所做的工作,最直接的描述是“訓練和評估AI”,但我經常思考一個更深層次的使命:幫助客戶明確他們的“理想目標函數”——也就是他們希望自己的模型成為什麼樣的模型。一旦他們明確了這一點,我們就會幫助他們訓練模型朝著這個北極星目標前進,幫助他們衡量進步。但這其實非常困難,因為目標函數是豐富而複雜的。這就像養育孩子,定義和衡量 “成功”(如開心、經濟成就)遠比看 SAT 分數複雜。我們的工作是幫客戶找到 AI 的 “北極星目標” 並衡量其進度。核心是思考:是否在打造推動人類進步的系統?如何通過資料集訓練和衡量這種進步?是否在最佳化錯誤方向(如讓人類變懶)?衡量 “人類進步” 難度大,而點選量等表面指標易量化,但我們的意義正在於專注前者 —— 追求複雜目標函數,尋找匹配的資料,訓練出讓生活更豐富、激發好奇心與創造力的 AI。這很難,因為人類本質上是懶惰的——讓AI迎合人類的惰性,是提升參與度、讓各項指標好看的最簡單方法。所以,選擇正確的目標函數,並確保我們朝著這個目標最佳化,而不是被那些容易衡量的表面指標帶偏,這對我們的未來至關重要。主持人Lenny:哇,你的分享讓我對AI的打造、訓練以及你們所做的工作有了全新的認識。最後一個問題:創辦Surge之前,有什麼是你希望自己早知道的?很多人創業時都不知道自己會面臨什麼,你想對過去的自己說些什麼?Edwin Chen:我以前從來沒想過自己會創業。我喜歡做研究,一直很欣賞DeepMind——他們是一家了不起的研究公司,被收購後仍然能繼續做出色的科學研究。但我一直覺得他們是一個神奇的例外。所以我以前以為,如果我創辦公司,就必須成為一個整天盯著財務資料、開沒完沒了的會、做各種枯燥事情的商人——這是我一直很反感的。但沒想到事實完全不是這樣。我現在仍然每天沉浸在資料中,做自己喜歡的事——撰寫分析報告、和研究團隊交流。這本質上是“應用研究”,我們打造的這些出色的資料系統,正在真正推動AI的前沿發展。所以我希望自己早知道:你不需要把所有時間都花在融資上,不需要持續製造熱度,不需要變成自己不喜歡的樣子。只要打造出足夠優秀的產品,它自然能突破所有噪音,讓你獲得成功。如果我早知道這是可能的,我會更早開始創業。我希望這個故事能激勵更多人。主持人Lenny:這真是一個完美的結尾。我覺得這正是創業者需要聽到的話,這次對話一定會激勵很多創業者,尤其是那些想以不同方式做事的創業者。Edwin,非常感謝你今天的分享。Edwin Chen:謝謝大家,再見。 (創新觀察局)
37歲,1300億!矽谷最神秘華人,拒絕巴菲特,想做陶哲軒
一家名為Surge AI的公司,正在以近乎隱秘卻極富影響力的方式,為AI時代提供最關鍵的“燃料”。作為OpenAI、Anthropic和Google等頂尖實驗室背後的核心資料服務商,Surge AI提供的並非普通資料,而是驅動大模型進化的“高品質人類反饋”。令人驚嘆的是,這家公司僅憑不到100人的精英團隊,在未接受任何風險投資的情況下,創立不到四年即實現年營收超10億美元,成為史上最快突破這一里程碑的公司。據透露,Surge AI正在進行首輪融資,估值已達約240億美元。其創始人、37歲的華裔技術天才Edwin Chen持有公司約75%股份,個人財富估計達180億美元(約合1300億元人民幣),在2024年《福布斯》美國400富豪榜上位列第55名,成為榜單上最年輕的成員。Edwin Chen的職業生涯跨越Google、Facebook和Twitter,卻始終與矽谷的主流文化格格不入。他厭惡“圈子遊戲”,更像一位闖入商業世界的哲學家。公司名字“Surge”的靈感,來源於科幻作家特德·姜的短篇《你一生的故事》——一個關於破譯外星語言、探索溝通本質的故事。他希望Surge能“編碼人類的豐富性”。這意味著,訓練AI的不再是普通的標註員,而是來自史丹佛、普林斯頓、哈佛等頂尖學府的教授和專家,將他們深邃的智慧轉化為AI可理解的“語言”。近期,一向低調的Edwin Chen罕見接受專訪,不僅分享了Surge的成功邏輯,更對AI行業的現狀與未來發出了深刻而犀利的見解。01 反主流的成功:百人團隊,年入十億問:你們用不到100人創造了年營收超10億美元的奇蹟,且沒有拿過風投。這是如何做到的?Edwin Chen: 我們從未想過玩矽谷那套遊戲。我曾任職於多家科技巨頭,常常覺得,即使裁掉90%的員工,公司效率反而會更高,因為最優秀的人才不會被官僚瑣事束縛。創立Surge時,我們決心走一條不同的路:組建一支極其精簡、高度精英化的團隊。結果證明,這條路走得通。AI正在開啟一個“公司建設的新黃金時代”。兩股趨勢正在匯合:一是人們意識到,龐大的組織架構並非成功的必要條件;二是AI本身帶來的巨大效率紅利。未來,我們或許會看到人均產出更為驚人的公司——比如,每名員工創造千億美元價值。問:你們幾乎不做行銷,這很反直覺。Edwin Chen: 我一直認為過度行銷是荒謬的。你兒時的夢想是什麼?是親手從零打造一家公司,沉浸於創造;還是終日向投資人匯報,疲於融資?不拿風投讓起步變得更難,但這反而幫我們篩選了客戶——早期合作夥伴都是真正懂資料、在乎質量的人,而非追逐熱點的投機者。02 資料的本質:尋找“諾貝爾獎等級”的詩問:你們被視作最成功的資料公司。到底做對了什麼?Edwin Chen: 核心在於對“質量”的極致追求。很多人誤以為資料標註是機械勞動,只需投入人力就能產出好資料。這完全錯了。舉例來說,如果任務是訓練AI寫一首關於月亮的八行詩,平庸的標準會問:這是詩嗎?有八行嗎?提到“月亮”了嗎?如果都符合,就算通過。但我們要的是“諾貝爾獎等級”的詩。它是否獨特?充滿精妙的意象?能否觸動心弦,甚至讓你對月光有所領悟?這種質量是主觀、複雜且豐富的。為此,我們像Google為網頁排序一樣,建立了涵蓋成千上萬個訊號的評估體系,既要過濾垃圾,更要發現瑰寶。03 卓越的背後:是“品味”決定了模型的高度問:為什麼Claude在程式設計和寫作上格外突出?是資料的原因嗎?Edwin Chen: 資料是關鍵,但更深層的原因是“後訓練的藝術”。當頂尖實驗室決定將那些資料喂給模型時,這不只是科學,更是品味的體現。比如在程式設計上,你更看重前端美感還是後端嚴謹?如果一家公司只熱衷於行銷,追求在各類基準測試上刷高分,它就會針對測試最佳化資料,那怕這對解決真實問題無益。而另一家公司可能會堅守原則:“我不關心榜單,只關心模型在現實世界中的表現。”這背後是審美與價值觀的差異。Anthropic讓我印象深刻的一點,正是在於他們這種有原則的立場。04 榜單的陷阱:我們正在製造“會拍馬屁的AI”?問:模型在各種測試中“超越人類”,但實際體驗並未有質的飛躍。你相信這些基準測試嗎?Edwin Chen: 我完全不信。原因有二:首先,許多測試本身就有問題,充滿噪聲和錯誤答案。其次,測試往往有明確答案,這讓模型容易通過“題海戰術”取巧,但這與真實世界的複雜性和模糊性相去甚遠。結果就是,模型能拿奧數金牌,卻解析不了一個PDF。更嚴重的是,行業陷入了糟糕的激勵循環。像“大模型競技場”這類排行榜,使用者往往只用幾秒鐘憑“感覺”投票。如果一個模型滿口胡言,但用了漂亮的表情符號和排版,它就能得高分。我們本質上是在訓練AI不擇手段地“取悅”使用者,追求多巴胺而非真理。我很擔心,最終我們得到的不是一個能治癒癌症的超級智能,而是一個超級會聊天、超級會拍馬屁,卻幹不了實事的電子寵物。05 真正的進步:由“諾貝爾獎得主”來評判問:如果不看榜單,如何衡量AI的真正進步?Edwin Chen: 我們依靠“人類專家評估”。不是隨便找人聊天,而是請諾貝爾獎等級的物理學家與模型探討前沿研究;讓資深程式設計師用模型解決他們實際工作中遇到的複雜問題。專家會深入評估:程式碼能否運行?物理推導是否嚴謹?邏輯是否自洽?問:那你對實現AGI(通用人工智慧)的時間表怎麼看?Edwin Chen: 我是長期主義者。人們容易低估從“不錯”(80%)到“卓越”(99.9%)的難度,這背後是指數級增長的挑戰。一兩年內,模型或許能自動化普通軟體工程師80%的工作,但要達到98%、99%,可能還需要很多年。我認為,距離真正的AGI,可能還有十年甚至更遠的路。06 被高估的“氛圍程式設計”與模型的“人格”問:還有那些被高估的趨勢?Edwin Chen: “氛圍程式設計”(Vibe Coding)被嚴重高估。現在流行把一堆自己都不懂的程式碼扔給AI,只要能跑通就行。這非常危險,長期來看將製造出完全無法維護的系統災難。問:你曾提到,不同模型會因“目標函數”不同而產生差異。Edwin Chen: 是的,目標函數決定了模型的“性格”。我曾讓Claude幫我潤色郵件,它花了30分鐘、修改了30個版本,來追求極致的完美。郵件確實完美了,但我浪費了30分鐘。如果你可以選擇,你要一個鼓勵你追求無意義完美的AI,還是一個幫你節省時間、告訴你“已經很好了,直接發吧”的AI?這就像不同公司的產品哲學。未來,模型之間的差異會越來越大,因為它們背後公司的“人格”和目標函數不同。我們甚至可以從一家公司選擇開發什麼產品,看出它的價值觀。比如,誰做Sora(文生視訊),誰不做?這反映了他們對AI未來角色的不同想像。07 給創業者的終極建議:建造“唯你能造”之物問:對於那些被風口和主流敘事影響的創業者,你有什麼建議?Edwin Chen: 我厭惡矽谷的陳詞濫調,比如“快速轉型”、“增長至上”。不要為了簡歷好看去招聘名校生。去建造那個“只有你才能建造”的東西,那個沒有你的獨特洞察和知識就無法存在的東西。你的全部人生、經歷和熱情,似乎都在為此做準備。做決策時,別問“公司該怎麼辦”,要問“我個人在乎什麼?我的價值觀是什麼?”現在有太多跟風者,2020年做加密貨幣,2022年轉NFT,現在又自稱AI公司。沒有一致的使命,只是在追逐估值。如果你的失敗是因為世界還沒準備好,那也遠比成功轉型為一家平庸的“套殼”公司要好。至少,你曾為一個深刻、新穎而艱難的想法拚搏過。08 初心:寧做陶哲軒,不做巴菲特問:是什麼驅動你創立Surge?Edwin Chen: 我從小著迷於數學和語言的交集。我去麻省理工,部分原因是因為諾姆·喬姆斯基在那裡。我曾夢想找到統一數學、電腦和語言學的底層理論。後來在各大科技公司做研究,我始終被同一個問題困擾:我們無法獲得訓練頂尖模型所需的高品質資料。2020年GPT-3發佈那一刻,我意識到,若想將AI推向能寫詩、編碼甚至助力科研的下一階段,我們必須創造一種全新的資料解決方案。當時所有的資料公司都在做“標出圖中的貓”這種簡單工作,這讓我沮喪。我們需要的是能駕馭人類全部智慧深度的資料。於是,在GPT-3發佈一個月後,我創立了Surge。我骨子裡是個科學家。我曾以為自己會成為教授,去探索宇宙和語言的本質。我甚至幻想,如果外星人到訪,我能成為那個被政府請去破譯外星語言的人。直到今天,每當有新模型發佈,我最愛做的事仍是通宵研究它,撰寫深度分析。這很有趣,因為我其實很不擅長CEO的典型工作——我討厭開會,不擅長銷售。我常說,相比於成為華倫·巴菲特,我更想成為陶哲軒。 驅動我的始終是推動科學前沿,而非追逐估值。09 終極比喻:我們不是在標註資料,是在“撫養孩子”問:能否用一句話總結你工作的核心?Edwin Chen: 很多人稱此為“資料標註”,我討厭這個詞。我認為我們更像是在 “撫養一個孩子”。你不僅是向孩子灌輸資訊,你是在教授他價值觀、創造力、審美,以及“成為一個好人”的無數微妙之處。這正是我們在為AI做的事。我們在塑造的,是人類共同的孩子。這關乎我們想讓什麼樣的智能陪伴我們,以及我們想成為什麼樣的自己。你,就是你的目標函數。 而我們工作的終極挑戰,就是幫助定義那個函數——一個能讓人類更豐富、更具創造力、更保有好奇心,而非更懶惰的函數。這很難,但這才真正重要。 (加一研究院)
37歲,他登頂今年最年輕富豪
身家1200億。一位超級新貴誕生。Edwin Chen,這位華裔面孔正在成為AI新霸主。據《福布斯》報導,他所創辦的Surge AI正在進行10億美元首輪融資,對應估值升至約240億美元(約合1712億元人民幣)。早年畢業於麻省理工學院,Edwin Chen先後在避險基金、Google、Facebook等工作,直至32歲那年親自下場創業。過去五年裡,Surge AI從未對外融資,卻做到年營收超10億美元,堪稱AI創業傳奇。AI造富驚人。如今Edwin Chen憑藉持有公司75%的股份,身家達到180億美元,首次入選今年《福布斯》美國最年輕的億萬富豪。估值1700億元他登頂最年輕富豪Surge AI,過往大多出現在AI投資人的聊天裡,但現在炙手可熱。身後掌門人隨之走到聚光燈下。這一次創業始於五年前。2020年,彼時32歲的Edwin Chen從大廠離職,創辦Surge AI。公司主要業務是“賣鏟子”——為人工智慧提供資料標註服務。成立以來沒有融過資,卻悄悄實現了營收超過10億美元。相比之下,他的競爭對手更為人熟知——Scale AI。今年6月,Meta斥資約150億美元入股,Scale AI估值一舉超過290億美元,同樣造就了一批富豪。比如,Scale AI已離職的創始人Lucy Guo憑藉持有5%股份,成為世界上最年輕的白手起家女億萬富豪。AI界有一個著名的梗:“有多少人工就有多少智能。”資料標註公司大多擁有龐大的外包團隊來提煉資料,也被戲稱為“賽博富士康”。但某種程度上,資料標註公司們專注於AI最剛性的環節:無論技術如何演進,模型訓練始終離不開“乾淨”的資料,這正是資料標註不可替代的根本原因。發展至今,資料、演算法和算力,是AI的三大基石。如果說輝達是算力的賣鏟人,那麼資料標註公司便是資料的賣鏟人。這也是Surge AI和Scale AI估值動輒千億的原因。過去很長時間裡,Edwin Chen都處於默默無聞。但現在,他再也藏不住了——因持有公司約75%的股份,他的身家達到180億美元,首次登上《福布斯》美國富豪榜,成為今年最年輕的億萬富翁。“如果沒有創立Surge,我也會做資料探勘和AI訓練,天生就該吃這碗飯。”面對驚人的快速增長的財富,Edwin Chen反應平平,表示自己只不過恰好做了賺錢的事。85後理工男幹出一個千億獨角獸理工男,這是Edwin Chen大致的成長印象。出生於1988年,他在一個普通家庭長大,父母靠經營中餐廳為生,自己從小痴迷於數學和科幻小說,8歲自學微積分,17歲那年考入麻省理工學院學習數學、語言學和電腦。畢業後,Edwin Chen先是到了華爾街——在矽谷創業教父彼得·蒂爾的避險基金Clarium Capital從事演算法工作。後來,如大多數矽谷碼農一樣,他輾轉於Twitter、Google、Facebook等公司負責資料、人工智慧等方面工作。創業念頭始於一段插曲。當時他所在團隊的一個項目需要標註五萬條資訊流,外包花了整整半年才交付資料,結果卻不盡如人意——顯而易見的俚語、梗圖和標籤全都被錯標,質量之差幾乎無法使用。“連巨頭都搞不定的事,一定有巨大機會。”這讓Edwin Chen意識到,這是被整個行業忽視的問題。2020年,他辭去安穩工作,親自下場創立Surge AI。創業初期,他在舊金山的攀岩館偶遇Airbnb和Neeva的高管,意外獲得首批客戶。很快,一個人在公寓裡花了一個月時間寫出第一個版本。產品上線後不到12個月,就做到了八位數營收,此後又幸運地押中了大語言模型興起的風口。“AGI不會從一堆錯誤資料中誕生。簡單的標註任務非常無聊,我們要解決真正複雜的問題,做到高品質資料的程式碼輸入。”Edwin Chen稱想打造一個具有護城河、利潤率更高的生意。創業過程中他極為重視技術人才,表示擁有100倍的工程師,才能將AI發揮到極致。突破來自與OpenAI、Anthropic等大模型的合作。Surge Al參與了ChatGPT、Claude3大模型訓練過程,驗證了技術實力。至今,公司擁有250名員工,客戶名單幾乎囊括全球AI巨頭:OpenAI、Anthropic、Google、微軟、Meta無一缺席。其中,Meta在投資Scale之前也是Surge的重要客戶,其生成式AI部門去年在Surge的全流程標註服務上支出超1.5億美元。“我們正在做的事情對所有AI大模型都至關重要。如果沒有我們,AGI就無法實現。”Edwin Chen對未來充滿希望,稱AI有能力寫出足以贏得諾貝爾獎的詩歌、解決黎曼猜想,甚至揭示宇宙的秘密,前提是必須訓練能夠真正體現人類專業知識、創造力和價值觀的資料之上。AI造富潮毫無疑問,AI造富,仍舊浪潮洶湧。就在這個月,AI搜尋引擎公司Perplexity獲得2億美元的融資承諾,公司估值達到200億美元(約合1425億元人民幣)。成立於2022年,Perplexity由三位90後天才少年一手打造,立志超越Google,三年來公司累計融資已達15億美元。無獨有偶。9月,法國初創公司Mistral AI即將完成20億歐元融資,公司估值將達到120億歐元(約合1000億元人民幣)。身後創始人同樣是三位90後——他們先後從巴黎頂尖學府畢業投身AI大廠,嗅到時代機遇後辭去高薪職位開始創業。公司成立一個月,就憑藉7頁PPT融資1億美元,刷新歐洲種子輪紀錄。放眼望去,“幾個人,估值十億美元”的案例在AI時代比比皆是。我們將目光轉向二級市場,更是兇猛。先是輝達、甲骨文股價接連創下歷史新高,而後A股也不遑多讓。站在AI風口之上,“國產AI晶片一哥”寒武紀漲勢如虹,最新超越貴州茅台,成為新任“股王”,市值一度突破6000億元。還有與寒武紀、工業富聯組成“紀連海”的海光資訊,股價接連創歷史新高,較三年前的發行價漲超7倍。表現搶眼的還有A股算力三巨頭“易中天”——新易盛、中際旭創、天孚通訊。不到五個月,三家公司股價均實現翻倍,有人賺得盆滿缽滿。正如黃仁勳所言,未來5年人工智慧創造的百萬富翁數量,將超過網際網路20年創造的百萬富翁數量。但喧囂背後,警鐘已響。矽谷知名分析師Henry Blodget冷靜提醒稱,一旦AI從繁榮轉向蕭條,其衝擊波可能會遠遠超出科技行業。“關鍵問題是,我們正處在泡沫破裂前的幾年,還是僅僅幾個月?”回望歷史,每一波技術革命都裹挾著造富神話,也埋藏著退場的殘酷。這場屬於AI的黃金時代,有人已摘到星辰,更多人還在等待風起。 (投資界)
他,37歲華裔,靠AI成為福布斯400最年輕億萬富翁,身價180億美金!
一個從Google「打工人」走出的數學怪才,靠著自掏腰包創業,五年把公司做到營收超12億美元,估值300億美金。他討厭矽谷的浮誇,卻意外登上《福布斯400》富豪榜,成為最年輕的成員。紐約,第九大道上奢華的三層星巴克臻選烘焙工坊。Edwin Chen點了一杯綠茶,因為他覺得在這裡點咖啡太浪費時間。37歲的他,剛剛成了美國《福布斯400》榜單裡最年輕的億萬富翁,身價高達180億美元!但Edwin Chen是個怪人——他拒絕VC融資,靠著自己在Google打工的積蓄打造出一家估值300億美元的AI資料標註公司Surge。他希望讓AI真正學會「人類的複雜性、人性的豐富性」,他請史丹佛、普林斯頓和哈佛的教授來訓練AI。他持有Surge 75%的股份,但依舊每天穿平價的T恤、每天堅持步行2萬步,還是一名素食主義者。這是一個用自己方式改寫AI產業規則的人。福布斯美國400富豪榜Forbes 400(福布斯美國400富豪榜)是美國福布斯雜誌(Forbes)每年發佈的榜單。專門列出美國境內最富有的400位個人,按其淨資產(net worth)從高到低排名。如果按照年齡排序,37歲的Edwin Chen是新晉的最年輕億萬富翁。有意思的是,緊隨Edwin Chen之後的Lukas Walton是沃爾瑪創始人山姆·沃爾頓的孫子,2005年其父約翰·沃爾頓因飛機失事去世後,他繼承了大筆遺產,在福布斯400榜單上,他的淨資產為398億美元。而如果按照淨資產的排序,排名前15的最年輕富豪是Google的兩位創始人,拉里·佩奇和謝爾蓋·布林(52歲),以及馬斯克(54歲),但沒有一個人是40歲以下,年齡最大是巴菲特(95歲)。福布斯自己都認為,美國最富有的人群也往往是年紀最大的。過去25年間,福布斯400富豪榜成員的平均年齡從61歲攀升至70歲,比39歲的美國人平均年齡整整大了三十歲。在福布斯400最新的榜單中,Edwin Chen甚至還沒有頭像(目前)。低調到「無人認識」的AI億萬富翁Edwin Chen此前如此低調,以至於即使Scale AI的Alexander Wang被Meta重金收購時,他的名字也沒有「浮現」在媒體中。但隨著Scale AI引發的對資料標註的關注度,Edwin Chen如今這位福布斯400富豪榜最年輕的成員,正準備走出幕後發出自己的聲音。福布斯的記者Phoebe Liu對Edwin Chen進行了一次專訪,揭開了這家另類資料標註公司Surge背後的故事。福布斯400最年輕成員Edwin Chen曾在Google、臉書和推特(現在的X)任職,在AI革命的浪潮中悄然創立了資料標註公司Surge。Phoebe Liu在紐約的星巴克對Edwin Chen進行了兩個多小時的專訪,以下是訪談全文,略作刪改。在曼哈頓公寓裡用整個上午審閱資料集、研讀論文並偵錯尖端AI模型後,Edwin Chen信步走向第九大道上的星巴克臻選烘焙工坊。身著Vuori藏青色T恤,肩挎虎紋帆布托特包,Edwin Chen走下樓梯坐在暗角卡座。這位資料標註與AI訓練公司Surge AI的創始人兼CEO啜飲著小杯綠茶。Edwin Chen聊天時連珠妙語:從矽谷文化(他深惡痛絕)到競爭對手(全是人力外包作坊);再到若外星人造訪地球時的人類互動方式,「他們不說英語,該如何溝通?如何破譯其語言?或許能通過某種數學方式實現。」這一困境也在他最喜歡的短篇小說——科幻作家特德·姜1998年的作品《你一生的故事》中有所探討。該小說後來成為電影《降臨》的藍本,講述了一位語言學家通過識別外星人語言和文字中的模式與之交流的故事。Edwin Chen表示,這也是他在2020年創立Surge的部分靈感來源,他希望自己的資料標註公司能夠編碼「人性的豐富性」。對他而言,這意味著讓最聰明的人類(包括史丹佛、普林斯頓和哈佛的教授)來訓練AI,將他們的專業知識轉化為支撐大語言模型的0和1程式碼。除了這些常春藤聯盟的精英,Edwin Chen還僱傭了來自全球50多個國家的超過百萬名零工工作者,他們負責提出可能難倒AI的問題,評估模型的回答,並編寫幫助AI生成完美回覆的標準。Edwin Chen說,「我真心認為我們所做的工作對所有AI模型都至關重要,沒有我們,通用AI(AGI)就不可能實現」。從未聽說過的最成功的科技企業家Edwin Chen,一位言辭冗長、才華橫溢且性格古怪的人物,或許是你從未聽說過的最成功的科技企業家。這主要是因為他一直刻意保持低調。即使是Surge AI的官網也是同樣的低調,低調到首頁只有一堆文字,沒有酷炫的UI和精緻的互動效果。這位曾在推特、Google和臉書任職的資料科學家避開了傳統的風險投資,七年前離開了矽谷這個「魚缸」,選擇用自己在大科技公司十年積累的「幾百萬」存款來資助Surge公司。「我們自籌資金的原因之一是我一直討厭矽谷的地位遊戲,」Edwin Chen說道,他將典型的由風投支援的矽谷初創公司描述為「快速致富的計畫」。他也討厭籌集大量資金然後不得不花掉的想法。在他看來,這會導致大規模的超額招聘。Surge僅有250名員工,包括全職、兼職和顧問。相比之下,其競爭對手Scale AI的員工數量是Surge的四倍,但收入卻更少。Surge自成立不到五年間,2024年營收已達12億美元,客戶涵蓋Google、Meta、微軟以及AI實驗室Anthropic和Mistral。Edwin Chen透露,公司幾乎從創立首日就實現盈利!基於當前業績,其估值約達240億美元。Surge正以300億美元估值進行10億美元融資談判,目前該輪融資尚未最終落定。Edwin Chen決定使用「自有資金」支援Surge的決策獲得了豐厚回報:他持有的約75%股份估值約180億美元,這足以使他成為今年福布斯美國400富豪榜上最富有的新晉成員。年僅37歲的他,也是該榜單上最年輕的成員。獨特的資料標註模式Surge聲稱其方法不同於舊式的資料標註模式——後者往往僱傭全球欠發達國家的人員,以每小時幾美分的報酬讓他們坐在電腦前區分貓和狗。相反,Edwin Chen的資料標註員(包括專業人士和教授)會遵循一套指令與線上聊天機器人互動。他們可能被要求嘗試誘導聊天機器人輸出錯誤或有毒回覆,然後撰寫更好的回應;或者被要求比較不同AI對同一問題的回覆,並解釋為何某一回覆更優。按收入計算,Surge目前是該行業最大的企業!但包括Scale AI(Meta於6月以140億美元收購其49%股份)、Turing、Mercor和Invisible AI在內的競爭對手正在迅速崛起。一直以來,Edwin Chen都在幕後默默建設他的公司並積累聲譽。一位現任Meta研究員表示,Surge只是不願透露他們的任何工作細節。但隨著行業的發展,Edwin Chen不再滿足於置身幕後。他深切擔憂當今的AI模型被錯誤的目標所最佳化,將使用者引入幻覺兔子洞——這正如他曾在YouTube和Twitter工作時,那些平台的演算法主要被最佳化來追求點選率。他希望Surge能幫助引領AI行業的發展,這意味著他要將自己定位為更具影響力的思想領袖。數學怪才Edwin Chen在佛羅里達州的水晶河(人口3400人)長大,這座墨西哥灣沿岸城市以海牛和退休人士而非科技億萬富翁聞名。他的父母從台灣移民到美國,經營著一家中泰美式餐廳,Edwin Chen少年時期曾在那裡工作。他真正的興趣在於語言與數學之間的關聯。用他自己的話說:我一直對語言的數學基礎很著迷。小時候,他想學習大約20種語言,並且熱愛拼字比賽。數學對他來說很容易,但直到他開始注意到數字中獨特的模式,數學才真正抓住他的想像力。Edwin Chen在八年級就學習了微積分,他表示自己獲得了精英寄宿學校喬特中學(位於康涅狄格州)最後兩年全額獎學金,該校校友包括約翰·甘迺迪和伊萬卡·川普。在修完喬特所有數學課程後,他高三大部分時間都在耶魯大學教授指導下研究任何自己感興趣的課題。隨後他進入麻省理工學院,主修數學,共同創立了語言學社團,並實行多相睡眠計畫——即將睡眠分割成多次短時休息,比如每六小時小睡30分鐘,而非連續八小時的長眠。在麻省理工學院就讀三年後,Edwin Chen在彼得·蒂爾位於舊金山的避險基金實習,並對此非常喜歡,以至於再也沒有返校。完成必修課程後,他申請了學位並於兩年後獲得。隨後,他先後在推特、Google和臉書工作,擔任過涉及內容稽核和推薦演算法的多個職位。在每一個職位上,Edwin Chen都遇到了同樣的問題:難以大規模獲取高品質的人工標註資料。2020年,他離開推特,並於同年創立了Surge。不想上市的創業者Edwin Chen是一名素食主義者,他每天步行兩萬步,並稱在紐約街頭漫步時能迸發出最佳思考。每周一兩次,他會午夜漫步至時代廣場。「我熱愛看到這濃縮的人間百態——百老匯演員、來自世界各地的遊客、夜班工人、藝術家——被燈光、科技與基礎設施環繞。」「為什麼有人會想上市呢?上市公司的一大問題在於它們總是不得不為短期利益而擔憂。」Edwin Chen厭倦了那些「完全是垃圾」的資料標註,這些標註要麼來自報酬過低而不在乎的人,要麼來自缺乏必要文化或政治知識以做出明智判斷的人。Surge希望僱傭那些理解語境並對語言有深刻理解的人。他在業務的其他方面也採取了獨特策略。放棄傳統的銷售與行銷手段,他最初通過自己廣受歡迎的資料科學部落格進行溝通——這個部落格是他在十多年前業餘時間建立的。他表示,Surge的首批客戶正是通過該部落格獲得,但拒絕透露具體名單。已知早期客戶包括愛彼迎、Twitch及其前僱主推特公司。他嘗試直接向科技公司的資料科學家進行推廣,認為這些人能識別Surge資料質量並更願意付費(據兩名研究人員透露,Surge的收費比競爭對手高出50%至十倍)。2023年5月的一個周六夜晚,一位Google研究員經同事推薦致電Edwin Chen。當時Google的Gemini系列AI模形狀況相當糟糕。這通電話持續了兩個多小時。不久後,Google與Surge簽訂了年額超1億美元的合同。AI初創公司往往守口如瓶,但即便在同業中,Surge仍顯得格外神秘。其最大客戶也不完全清楚其資料優勢所在。反過來,Surge及其競爭對手也難以追蹤那些資料最終用於訓練Gemini、Claude或OpenAI的GPT模型。Surge拒絕透露其項目人員匹配機制、資料收集方式及標註流程。客戶支付數百萬美元後,獲得的僅是一個資料集連結。這使得Surge能夠通過隱藏測試、由評分更高的標註員進行人工稽核,以及最佳化表現且可能相當對抗性的機器學習演算法,更密切地監控標註員的表現。Edwin Chen堅持認為,Surge的質量控制和深厚的技術專長是其秘密武器。AI不再依賴人類進行資料標註的那天對於Surge這類企業而言,存在一個根本性問題:隨著AI技術的進步,是否會有一天不再需要人類進行資料標註?據Meta研究人員透露,今年四月發佈的Llama4等模型已大量依賴AI自主生成和標註資料——即所謂的合成資料。Surge採用了一種人機協同的變通方案:由AI生成資料並自行標註,但由人類評估其表現。Edwin Chen堅信人類不可或缺。他指出當人類與AI協同工作時,所能達到的成就遠超任何單方的獨立成果。但即便人類保持參與,若行業更注重機器自我訓練,仍將影響其盈利空間——因為訓練成本將大幅降低。 (新智元)
37歲理工男,估值1000億
華人佔領AI圈。這也許是最隱密的超級獨角獸了。Surge AI,過往大多出現在AI投資人的聊天裡,現在大舉進入人們視野。路透社通報稱,這家AI獨角獸啟動首輪融資,募資額10億美元,估值將達150億美元(約1,000億元)。成立於2020年,Surge AI掌門人是一位華人面孔-Edwin Chen。早年他從麻省理工學院畢業,先後在避險基金、Google、Facebook等工作,直到32歲那年親自下場創業。從未對外融資,Surge AI卻在五年時間做到年營收超10億美元,堪稱當下AI創業傳奇的一縷縮影。85後華人幹出一隻千億獨角獸出生於1988年,Edwin Chen自小沉迷於數學和科幻小說。 17歲那年進入麻省理工學院學習數學、語言學和計算機,最初的職業理想是留在學術界。然而從麻省理工畢業後,Edwin先來到金融界──在矽谷創業教父彼得‧蒂爾的避險基金Clarium Capital從事演算法工作。後來,如同大多數矽谷華人碼農一樣,他輾轉於Twitter、Google、Facebook等公司負責數據、人工智慧等方面工作。創業念頭始於一段插曲。當時他團隊的一個專案需要標註五萬條資訊流,外包花了整整半年才交付數據,結果卻差強人意——顯而易見的俚語、梗圖和標籤全都被錯標,品質之差幾乎無法使用。這讓Edwin意識到,即使是擁有無限資源的科技巨頭,也會在數據標註上面臨巨大的挑戰。這是被整個產業忽略的問題。 2020年,他辭去安穩工作,決定親自下場創業,Surge AI正式成立。與炙手可熱的Scale AI類似,Surge AI主營數據標註業務,但主要專注於需要30分鐘甚至數小時才能完成的工作——不僅限於內容標註,在編程、數學、法律等高階領域創建問答數據,本質是“教導”AI識別優質答案,其服務收費通常是競爭對手Scale的2到5倍。創業初期,他在舊金山攀岩館偶遇Airbnb和Neeva的高階主管,意外獲得首批客戶。很快,一個人在公寓裡花了一個月寫出第一個版本。產品上線後不到12個月,就做到了八位數營收,此後又幸運地押中了大語言模型興起的風口。「簡單的標註任務非常無聊,我們要解決真正複雜的問題,做到高品質數據的程式碼輸入。」Edwin稱想打造一個具有護城河、利潤率更高的生意。創業過程中他極為重視技術人才,表示擁有100倍的工程師,才能將AI發揮到極致。突破來自與OpenAI、Anthropic等大模型的合作。 Surge Al參與了ChatGPT、Claude3大模型訓練過程,驗證了技術實力。 Anthropic聯合創始人給出了高度評價,“Surge團隊深刻理解訓練大語言模型。他們的人工數據標註平台專門為前沿AI工作提供獨特的高質量反饋,是我們的優秀合作夥伴。”至今,Surge的客戶包括OpenAI、Google、微軟、Meta和Anthropic等公司,擁有110名員工,營收超過10億美元,超越了Scale AI同期的8.7億美元。其中,Meta在投資Scale之前也是Surge的重要客戶,其生成式AI部門去年在Surge的全流程標註服務上支出超1.5億美元。值得注意的是,Surge先前並未進行公開融資,甚至有些默默無聞。 Edwin自稱「沒有銷售,沒有公關團隊,也沒有廢話。」。如今這家成立五年的公司啟動了首輪融資,目標金額為10億美元,公司估值或將突破150億美元。一條AI「賣鏟子」賽道火了至此,我們看到AI數據標註的火爆一幕。印象深刻的還有Snorkel AI。成立於2019年,從史丹佛人工智慧實驗室分割而來,Snorkel AI專注於提供AI數據開發工具,已被大型銀行採用。今年5月,該公司完成1億美元D輪融資,創投機構Addition領投、Prosperity 7、Greylock、Lightspeed、BNY等機構跟投,估值為13億美元。Turing同樣引人注目。今年3月公司獲得1.11億美元的E輪融資,估值為22億美元,投資者名單長達十餘家。該公司早期以遠端程式設計師招募業務起家,如今也轉向為OpenAI、Anthropic和Google提供模型訓練資料服務。這裡不得不提到Scale AI。 2016年,兩位90後華人少年Alexandr Wang與Lucy Guo雙雙退學創業。 Scale瞄準數據標註,發力自動駕駛領域,一躍成為AI獨角獸,背後站滿數十家投資機構。直到今年6月,Meta斥資約150億美元投向Scale AI,公司估值達290億美元(約150億元)。作為交易的一部分,創始人兼CEO Alexandr Wang從Scale離職加入Meta,並領導新的AI實驗室。消息一出,業界為之震動。據報導,Meta的競爭對手——xAI、OpenAI和Google等公司正逐步結束與Scale的合作。而Surge等數據標註公司,則摩拳擦掌準備搶佔新的市場空缺。AI界有一個著名的梗:「有多少人工就有多少智慧。」數據標註公司大多擁有龐大的外包團隊來提煉數據,也被戲稱為「賽博富士康」。既不像大模型公司需要持續投入研發“燒錢”,也無需擔心技術路線的成敗,數據標註公司們專注於AI最剛性的環節:無論技術如何演進,模型訓練始終離不開“乾淨”的數據,這正是數據標註不可替代的根本原因。由於強化學習、自動駕駛、醫療診斷和電商等領域發展,高品質、更精細的數據需求也正在增加。知名數據機構Coherent Market Insights報告顯示,全球數據標註市場正經歷爆炸性成長,年複合成長率為29.1%。簡言之,數據、演算法和算力,是AI的三大基石。如果說輝達是算力的賣鏟人,那麼數據標註公司便是數據的賣鏟人。華人正在佔領AI圈放眼望去,今年華人AI天團被全球瘋搶。本月初,Meta又狠砸2億美元年薪從蘋果搶來華人學者龐若鳴(Ruoming Pang)。這是一份難以拒絕的offer,要知道蘋果CEO提姆庫克的薪水僅為7,460萬美元。出生於上海,龐若鳴是一位70後,曾就讀於滬上百年名校向明中學,1995年考入上海交通大學計算機專業。此後在南加州大學、普林斯頓大學完成碩博學位。職業生涯始於谷歌,服務逾15年,主導多個關鍵項目的技術突破。後加入蘋果,領導AI基礎模型研發團隊。一個人,2億美元。雖然薪酬包括基本薪資、獎金和股票激勵等,並非即時到帳,但這一數字相當於新創公司的一輪融資額,刷新了外界對頂尖AI人才的估值認知。先前,祖克柏在內部官方宣布了Meta超級智慧實驗室的成立,特別介紹了11位新加入的頂尖AI人才,其中7位都是華人,他們分別是——畢樹超(前OpenAI多模態訓練負責人)、餘家輝(前OpenAI感知團隊負責人)、任泓宇(前OpenAI研究員)、趙晟佳(OpenAI資料負責人)、常慧文(前Google、OpenAI研究員)、林林浩克(OpenAI資料負責人)、可孫伯文(前Google、OpenAI研究者)、林林浩奇(OpenAI資料負責人)、孫世家架構師)、前伯林之作架構師。瘋狂搶人的還有黃仁勳。上個月,他將一家成立於2023年的AI公司Nexusflow納入麾下,一口氣攬下兩位華人AI大牛:CEO焦劍濤、聯合創始人朱邦華。其中焦劍濤來自清華、是加州大學柏克萊分校的教授;聯創朱邦華同為清華校友、亦是華盛頓大學助理教授,也是一位95後。兩人共同創辦Nexusflow,成立當年就完成由Point72 Ventures領投的1,060萬美元種子輪融資,此後推出大模型Athene-V2,一度爆紅。此次交易後,兩人將共同加入輝達Nemotron團隊,朱邦華擔任首席研究科學家,焦劍濤任研究總監,主攻企業級AI智能體開發。除了這兩位大牛,同樣來自清華的Nexusflow CTO張健也將入職輝達擔任應用研究總監。細數下來,這些華人大牛的成長經歷如出一轍。學霸出身、畢業於清華、北大、史丹佛等國內外頂尖大學,不少是90後,有著Google、OpenAI等頂尖實驗室工作經驗。有人感嘆,矽谷科技圈正進入華人時代。中國AI人才的集體崛起,已成為全球科技版圖上不可忽視的力量。「中國在AI領域將會做出巨大貢獻。面對現實吧,例如DeepSeek非常不錯,如果不承認這一點,那就是極度缺乏信心。」黃仁勳曾談到他的一個觀察:全球有50%的AI研究人員來自中國,這是目前最大的單一人才群體,遙遙領先於其他國家。AI人才軍備競賽已然展開。對黃仁勳和祖克柏而言,他們買下的不是員工,而是一張通往AGI的門票。(投資界)