#中國工程師
黃仁勳回應一切:中國工程師天生熱愛開源、希望死在工作崗位、AGI 已到來
如果要找一個人來解釋這場 AI 大爆發究竟是怎麼發生的,黃仁勳無疑是最合適的人選。三十年前創立輝達、押注圖形處理器,把 CUDA 強行裝進遊戲顯示卡,市值從 80 億跌至 15 億,然後用十年爬回來。在所有人還在爭論推理晶片會不會只是低端市場時,他已經在為智能體時代設計機架架構。這種提前預判,顯然不只是靠運氣,更離不開他幾十年如一日做的一件事:在所有人相信之前,先把那個未來講給所有人聽。今天,知名播客主持人 Lex Fridman 公開了他與黃仁勳長達兩小時的深度專訪。對話涵蓋 CUDA 護城河、中國科技生態、程式設計的未來,DLSS5、乃至意識與死亡。這是黃仁勳近期最完整的一次公開表達,也是迄今為止最接近他思維方式的一次真實記錄。附上黃仁勳採訪文字版實錄 🔗:https://lexfridman.com/jensen-huang-transcript一個問題,60 個專家同時在場,這就是輝達開會的方式採訪開篇,Fridman 指出輝達已將設計重心從單晶片擴展至機架等級,涵蓋 GPU、CPU、記憶體、網路、NVLink、光纖與銅纜互聯、供電、冷卻、軟體以及機架本身。他問黃仁勳:在如此多變數的協同設計中,最難的部分是什麼?黃仁勳首先解釋了極致協同設計為何從工程邏輯上不可迴避。他說,問題的根源在於規模:當你把一個任務分佈到一萬台電腦上,你期望的結果是獲得遠超線性疊加的加速效果,比如一百萬倍的提升,而單純增加電腦數量只能帶來線性收益。阿姆達爾定律(Amdahl's Law)由電腦科學家 Gene Amdahl 於 1967 年提出,指的是「短板效應」在平行計算中同樣存在——系統的整體性能提升受限於無法平行的那部分程式碼。這就是阿姆達爾定律的約束,也就是說,如果計算只佔總工作量的 50%,即便把計算速度提升到無限快,整體也只能加速兩倍。「一旦你把問題分佈出去,所有東西都會成為瓶頸。CPU 是問題,GPU 是問題,網路是問題,交換機是問題。分散式運算在我們這個規模下,每一個環節都必須同時攻克。」在組織層面,黃仁勳透露自己的直接匯報超過 60 人,幾乎涵蓋所有技術學科的頂尖專家:記憶體、CPU、光學、GPU 架構、演算法、設計,無一缺席。他刻意放棄一對一匯報制度,改為讓所有人同時在場討論任何一個具體問題。「因為我們在做極致協同設計,所以任何一次討論都不可能只有一個人在場。我們呈現一個問題,所有人一起攻。當我們討論冷卻,網路專家在聽;當我們討論供電,記憶體專家在聽。誰要是對本該關注的事情沒有關注,我會直接點名。」他將公司架構比作作業系統,認為公司的組織結構應當直接反映它所處的環境和它要生產的產品,而非套用統一的「漢堡式」或「軟性」組織圖或者「汽車公司」組織圖。把 CUDA 塞進遊戲顯示卡,是最痛苦也是最關鍵的決定在講述輝達的戰略演進時,黃仁勳也詳細梳理了從圖形加速器到計算平台的轉型路徑。他說,輝達最初是一家加速器公司,專注於圖形處理。專業化的好處是極致最佳化,問題在於市場邊界天然受限,而市場規模直接決定研發投入能力,研發能力又決定了一家公司在計算領域能發揮多大的影響力。於是輝達必須拓寬邊界,向通用計算邁進,但通用性和專業性之間往往存在天然的矛盾:越向通用計算靠攏,專業加速能力就越被稀釋。「我把這兩個本質上矛盾的詞硬連在一起,公司必須一步一步走那條極其狹窄的路,在擴展計算邊界的同時,守住最重要的專業化能力。」第一步是可程式設計像素著色器,第一次向可程式設計性邁進。第二步是在著色器中加入 IEEE 標準相容的 FP32 浮點運算,這一步吸引了那些此前在 CPU 上做流處理和資料流計算的研究者。他們發現,GPU 的計算密度極高,又能相容他們原有的軟體邏輯。這直接促成了 Cg 語言(為 GPU 程式設計設計的高級著色器語言),再到 CUDA。將 CUDA 搭載到 GeForce 消費級顯示卡是整個歷史中最關鍵也最痛苦的決策。黃仁勳說,計算平台的價值完全取決於裝機量,而不是架構的優雅程度。他舉 x86 為例:這是歷史上被批評最多的架構,遠沒有同期那些被頂尖電腦科學家精心設計的 RISC 架構優雅,但 x86 活下來了,RISC 大多失敗了。原因只有一個:裝機量。「當時 GeForce 每年出貨數百萬塊顯示卡。我們說,不管使用者用不用 CUDA,都把它裝進每一台 PC 裡,用這個作為培育裝機基數的起點。同時我們去大學裡寫教材、開課程、到處推廣 CUDA。在那個年代,PC 是主要的計算載體,沒有雲,我們等於把超算塞進了每一個在校學生和研究人員的手裡,總有一天會有驚喜發生。」代價是慘烈的。CUDA 讓 GeForce 的成本大幅上升,將輝達的毛利率徹底壓垮,公司毛利率本已只有 35%,成本增加 50% 之後,全部利潤蒸發。市值從約 80 億美元一路跌至 15 億美元,在底部徘徊了相當長的時間。「但我們一直扛著 CUDA,一直搭載在 GeForce 上。輝達是 GeForce 建起來的家,是 GeForce 把 CUDA 送到了所有人手裡。研究人員和科學家在大學裡發現了 CUDA,因為他們本來就是遊戲玩家,他們自己攢電腦,他們拿 PC 元件搭叢集。」後來,這成為深度學習革命的基礎設施。對於如何作出這類賭注式決策,黃仁勳說,他的決策過程始於好奇心,然後是推理。當推理系統在內心足夠清晰地呈現出「這件事一定會發生」時,他便開始相信它,而一旦相信,就會去實現。但更重要的是他管理集體信念的方式:他從不等到決策那一天才宣佈,而是通過每一次外部資訊、工程里程碑、行業新發現,持續向董事會、管理團隊、員工、合作夥伴一點一點地鋪設認知基礎。「到了宣佈的那一天,我希望所有人的反應是:『Jensen,你怎麼現在才說?』收購 Mellanox 是這樣,全力押注深度學習是這樣,現在 Groq 也是這樣,我已經鋪墊了兩年半。」他把 GTC 大會描述為向全行業塑造未來認知的工具,不只面向員工,也面向合作夥伴和整個生態。「我們不生產電腦,也不搭建雲。我們是計算平台公司,任何人都無法直接購買我們的產品,但我們向所有層級開放平台。在我的產品準備好之前,必須先讓所有人相信它將要到來。」Ilya 說資料耗盡了,黃仁勳說他搞錯方向了對於 Scaling Laws(縮放定律/擴展定律),黃仁勳提出了一個系統性框架,包含四個相互咬合的層次。第一條是預訓練擴展定律。模型越大,訓練資料越多,AI 越聰明。當 Ilya Sutskever 表示「預訓練資料耗盡」時,業界一度恐慌,認為 AI 到了天花板。黃仁勳認為這個擔憂搞混了方向:人類生產的資料確實有限,但合成資料的比重會越來越高,而且這並不奇怪,人類知識本來就是「合成」的,知識在人與人之間流轉、被重新詮釋、再創作、再消費。AI 現在已經能夠以真實資料為基礎大量生成合成訓練資料,預訓練的瓶頸從資料量轉移到了算力。第二條是後訓練擴展定律。通過指令微調、強化學習等方式持續精煉模型能力,這個空間仍然廣闊。第三條是測試時擴展定律(test-time compute),也就是推理階段的計算投入。黃仁勳說,當初很多人預判推理是「簡單的」,認為推理晶片只需要小而廉價,完全不需要輝達那樣昂貴複雜的產品,將來推理市場會是一個被商品化的低端市場。「這在邏輯上就說不通。預訓練是記憶和歸納,是閱讀;推理是思考、推理、規劃、搜尋、嘗試、分解陌生問題。思考怎麼可能是計算輕量級的?」事實證明他是對的,測試時擴展的計算消耗遠超市場預期。第四條是智能體擴展定律。一個大語言模型變成一個智能體,在測試時去查資料庫、使用工具、分配子任務,同時派生出大量子智能體。「擴充輝達規模最簡單的方法是多僱員工,而智能體的分裂速度比僱人快多了。」這些智能體在運行過程中積累大量有價值的經驗和資料,其中的精華會反哺預訓練,再經後訓練精煉,再經測試時增強,形成完整的閉環飛輪。「歸根結底,智能的擴展取決於一件事:算力。」對於如何在硬體設計層面預判 AI 模型的走向,黃仁勳坦言這是最難的部分之一,因為 AI 模型架構每六個月就會迭代一次,而系統和硬體架構的迭代周期是三年。輝達的應對策略包括三條:內部做基礎研究和應用研究,自己訓練模型,獲得一手體感;作為全球唯一與所有 AI 公司同時合作的平台公司,廣泛傾聽行業前沿的挑戰;以及保持架構的靈活性,讓 CUDA 能隨演算法演進而演進。他舉了混合專家模型(MoE)的例子:正是預判到 MoE 的崛起,輝達才將 NVLink 從 8 路擴展到 72 路,使一個完整的 4 兆乃至 10 兆參數模型能夠在單一計算域內運行,行為上如同一塊巨大的 GPU。而 Vera Rubin 一代機架相較於 Grace Blackwell 機架,最顯著的變化在於增加了儲存加速器,引入了全新的 Vera CPU,還有專為智能體任務設計的 Rock 機架,因為智能體工作時需要頻繁訪問檔案系統、呼叫工具、執行程式碼,這與單純運行 LLM 推理是完全不同的工作負載。為什麼在 Claude Code、Codex、OpenClaw 出現之前,我們就設計好了這一代架構?因為推理根本不需要等到具體產品出現,你只需要坐下來認真思考:一個大語言模型要成為真正的數字工人,它必須做什麼?它必須訪問檔案系統獲取真實資料,必須能上網查資料,必須會用工具,必須能派生子任務。這些都不是玄學,就是基本邏輯。他還用了一個生動的思想實驗:想像十年後最強的 AI 智能體是一個人形機器人,進入你家幹活,更可能的情形是它使用你家裡現有的工具,比如微波爐,還是它的手指會隨時變成錘子、手術刀或者微波發生器?答案顯然是前者。「我描述的,其實就是 OpenClaw 幾乎所有的核心特性。」黃仁勳眼中的馬斯克:一個把自己變成所有人最高優先順序的人Fridman 提到黃仁勳曾高度稱讚馬斯克以四個月時間建成 Colossus 超算,目前已達 20 萬塊 GPU 的規模。黃仁勳闡述了他從中看到的工程與管理哲學。他說,馬斯克是一個能在多個高深領域同時保持深度的人,同時又是出色的系統思考者。他習慣性地對每一件事追問三個問題:這是必要的嗎?必須這樣做嗎?必須花這麼長時間嗎?層層追問之後,系統會被剝離到最小必要形態,但能力卻完整保留。「他也會親自出現在問題發生的現場。有問題,他就去現場,『把問題給我看』。這種做法能打破大量『這就是我們一貫的做法』的慣性。每個供應商都有很多客戶和項目,他的做法是讓自己成為所有人項目裡的最優先順序,而且他是靠親身示範做到的,不是靠嘴說。」他描述了 Fridman 也同樣經歷過的一個細節:馬斯克曾蹲在機架旁邊和工程師一起研究如何插拔線纜,目的是減少出錯機率。「從每一個細節積累起來的直覺,讓你能同時看清微觀的低效和宏觀的系統性問題,然後你才有資格說『讓我們換一種完全不同的方式來做這件事』。」為什麼中國科技圈天然傾向於開源談及最近訪問中國之行,黃仁勳表示,全球約 50% 的 AI 研究人員是中國人,其中大多數仍在中國國內工作。中國科技行業崛起的時間節點,恰好與移動網際網路時代高度重合,使他們能夠以軟體為突破口進入全球競爭。他認為,中國科技生態之所以能持續輸出大量頂尖公司,有幾個結構性原因。第一是競爭烈度。中國並非一個統一的大市場,而是由無數個省和城市組成的競爭體系,這導致每個垂直領域都出現了數量驚人的競爭者,電動車如此,AI 公司亦然,最終在激烈競爭中存活下來的必然是極其優秀的企業。第二是開放共享的文化。中國工程師圈子高度依賴於學校、公司之間的人際網路,同學就是終身兄弟,朋友就是同行。黃仁勳說,中國工程師的優先順序排序是:家人第一,朋友第二,公司第三。這個排序直接決定了他們對待知識的態度。他們的工程師,兄弟在那家公司,朋友在那家公司,大家都是同學。同學這個概念,在中國意味著一輩子的兄弟。所以他們分享知識的速度極快,根本沒有理由把技術藏著掖著,放到開源上就好了。正因如此,中國科技公司對開放原始碼的貢獻力度遠超外界預期,而開源社區反過來進一步放大、加速了整體創新節奏。第三是崇尚工程的社會文化。這是一個崇尚建造的國家。他也由此延伸到輝達的開源戰略,特別提到 Nemotron 3,這是一個 1200 億參數的開放權重混合專家模型,架構上融合了 Transformer 與狀態空間模型(SSM)。輝達推進開源有三重動機:其一,自己訓練模型是極致協同設計的一部分,能讓硬體團隊直接感知模型架構的走向;其二,專有模型和開源模型各有必要,開源是讓 AI 真正擴散到每個行業、每個國家、每個研究者和學生手中的必要條件;其三,AI 遠不只是語言,生物學、物理、氣象、流體等領域都需要專門訓練的模型,每個行業都能獲得世界級的 AI 基礎模型。43000 個人和數百萬開發者,共同撐起輝達護城河被問及輝達最重要的競爭護城河,黃仁勳給出了一個清晰的排序。第一是 CUDA 的安裝基數。他說,即便二十年前有人做出了一個技術上更出色的替代架構,比如 GUDA 或 TUDA,也很可能失敗。因為決定架構成敗的從來不只是技術,而是有多少開發者將自己的軟體建立在這個平台上。CUDA 今天的地位,來自 43000 名輝達員工數十年的持續投入,也來自數百萬開發者將他們的軟體棧壓注在這個平台上的信任。他還強調了輝達執行速度的重要性:任何一個開發者只要選擇了 CUDA,幾乎可以確定六個月後它會變得更好十倍;他開發的軟體能觸達幾億台裝置、覆蓋所有主要雲服務商、所有主要行業、所有主要國家;而且他能確信輝達會在可預見的未來持續維護和改進 CUDA。「把這幾點加在一起,如果我是一個開發者,我會首先選 CUDA,並且把最多的資源投入到 CUDA 上。」第二護城河是生態系統的橫向覆蓋。輝達將極其複雜的系統縱向整合,但同時向每一家公司的計算平台橫向開放接入,從Google雲、亞馬遜 AWS、微軟 Azure,到 CoreWeave、Nscale 這樣的新興算力公司,到製藥企業的超算,再到電信基站邊緣裝置、汽車、機器人、衛星。一個架構覆蓋了全球幾乎所有行業。對於輝達未來能否達到 10 兆美元市值,黃仁勳的推演從兩個根本性變化出發:計算從檢索式轉向生成式,意味著算力需求量級躍升;電腦從倉儲單元轉變為生產工廠,意味著它從成本中心變成了直接與企業營收掛鉤的利潤中心。他預計世界 GDP 增速將會加快,而計算佔 GDP 的比例將達到過去的 100 倍以上。他提到輝達的 3 兆美元收入路徑在他看來是「當然可能」的,並沒有任何物理定律約束這一數字的實現,更重要的是,輝達的增長不依賴於從現有競爭對手手中奪取份額,而是依賴於一個幾乎從零開始生長出來的全新市場。「當輝達是 100 億美元的公司時,你沒法說『如果他們從誰那裡拿到 10% 份額就能增長多少』。他們的想像力需要從零建構。但我有的是時間,每一次 GTC 都會讓這件事變得更加真實。」談及智能體時,他將 OpenClaw 比作「Token 的 iPhone」:「消費者直接能用到了。iPhone 等級的產品到了,它是有史以來增長最快的應用,一飛衝天,就這樣。」玩家對 AI 糊感的憤怒,其實是一面鏡子黃仁勳說,GeForce 至今仍是輝達最重要的品牌行銷策略:人們十幾歲時因為遊戲認識輝達,進入大學和職業生涯後自然轉向 CUDA 和專業工具。被問及史上最重要的遊戲,他給出兩個答案:從文化與行業影響力看是 Doom,它把 PC 從辦公工具變成了家庭娛樂裝置;從遊戲技術看是 Virtua Fighter。近年的代表作則是完整實現光線追蹤渲染的《賽博朋克 2077》。談及 DLSS 5 引發的玩家爭議,他理解那種對「AI 糊感」的反感,承認這是真實存在的審美問題。但他解釋,DLSS 5 的工作前提是三維幾何資料的嚴格約束,每一幀都完全忠實於藝術家定義的空間結構和紋理風格,做的是增強而非覆蓋。「玩家以為 DLSS 會在成品遊戲上做後處理,這個理解是錯的。它嵌入在創作流程裡,藝術家決定用還是不用。」系統也完全開放,工作室可以自行訓練模型、指定卡通或水彩等任意風格。他隨後作出一個更宏觀的觀察:玩家對 AI 糊感的敏感,恰恰說明人類真正在乎的是創作者留下的那些不完美的印記。「只要 AI 是輔助藝術家的工具,它就是好的。」此外他還提到輝達為遊戲開發者提供的次表面散射皮膚著色器,這項技術模擬光線穿透皮膚淺層後散射的物理現象,讓遊戲人物皮膚呈現出更接近真實的半透明質感。「這些都是工具,由藝術家決定怎麼用。我們只是提供工具箱。」AGI、程式設計的未來與人類的位置在 AGI 定義問題上,Fridman 以「能夠從零創立並營運一家市值超十億美元的科技公司」作為測試標準,黃仁勳的回答是:這個門檻,我認為 AI 現在已經達到了。他設想一個 AI 建立了某款應用,短時間內吸引數十億使用者,完成商業化後退出,這和網際網路時代那些曇花一現的爆款網站並無本質差異,而那些網站的技術複雜度遠低於 OpenClaw 今天能生成的東西。「我不知道具體會是什麼,但我在網際網路時代也沒有預測到任何那些公司。」他同時強調,100000 個智能體建立一個持續營運的輝達的機率是零,但建立一個短暫的爆款應用並從中獲利,完全可能已經在發生了。關於程式設計的未來,黃仁勳認為程式設計的定義本身需要改寫。程式設計的本質是規格說明,即告訴電腦要建構什麼。在這個定義下,能做到這件事的人數量將從 3000 萬擴展到 10 億。每一個木匠、水管工、會計師都將成為自己行業裡的創新者,因為 AI 讓他們能夠以自然語言表達意圖,並將其轉化為實際產品。「如果我是一個木匠,我看到 AI,我會非常興奮。如果我是一個水管工,我會完全瘋狂。」他用輻射科醫生的案例回應了「AI 會消滅職業」的擔憂:電腦視覺在 2019 年前後達到超人水平,曾被普遍預測輻射科醫生將消亡。結果是所有輻射科平台都整合了 AI、輻射科醫生數量不降反升,現在全球還出現了輻射科醫生短缺。原因很簡單:能更快讀片,就能讀更多片,就能服務更多病人,醫院營收增加,需要更多輻射科醫生。「那個預警走得太遠,嚇跑了很多本該進入這個行業的人,這是真實的傷害。輝達的軟體工程師數量只會增加,不會減少。他們的職業目的是解決問題,而解決問題這件事的每一個組成部分,評估結果、團隊協作、診斷問題、創新、連接不同領域,這些都不會消失。」在工作中倒下,是最好的結局被問及是否思考自己的死亡,黃仁勳的回答十分誠實。「我真的不想死。我有很好的家庭,有非常重要的工作。這不是『一生難得一次的體驗』,而是整個人類文明難得一次的體驗,我正在其中。輝達是歷史上最重要的科技公司之一,這件事我非常認真。」對於繼承人規劃,他的回應讓人出乎意料:他說他「不相信繼任規劃」,但原因恰恰是認真思考了這個問題。如果你真的關心自己離開後公司的命運,那麼你今天應該做的,是把你所學、你所理解、你所積累的全部知識、洞察和判斷,以最高頻率傳遞給周圍所有人。「每一次會議都是推理會議。我學到的任何東西,沒有在我桌上停留超過一秒鐘的,立刻就指向某個人:去研究這個,這個東西很了不起,你會想瞭解它的。我在持續地賦能周圍所有人,讓他們的能力不斷提升。」他說自己希望的結局是在工作中倒下,而且是瞬間的,沒有漫長的痛苦過程。對於人類未來 100 年的希望,他說他一生都對人性的善意保有高度信心,儘管偶爾會被辜負,但結果一次又一次證明他是對的,而且往往超出預期。 (APPSO)
ChatGPT背後的中國工程師曝光!不是清華姚班的...
在華人如雲的OpenAI,不少人或許聽過清華姚班大神陳立傑或姚順雨的名號,但鮮少有人知曉翁家翌的名字。他不是競賽金牌得主,也不是清華姚班神話,在博士遍地的AI圈裡,他是極少數碩士生。近日,他在一個播客採訪中首次講述求學經歷和在OpenAI工作細節,外界才知道到,如此低調的他,竟是OpenAI各大核心模型的幕後推手。翁家翌拒絕DeepSeek,在2022年加入OpenAI,全程深度參與了ChatGPT系列幾乎所有關鍵大模型的強化學習、後訓練和基礎設施搭建。從我們熟知的爆款ChatGPT初始版本上線(基於GPT-3.5),到GPT-4、GPT-4V、GPT-4o,再到GPT-5等,都有這位中國工程師的貢獻。(圖源|翁家翌個人網站)在成為OpenAI研發工程師之前,他就潛水在各大技術論壇,用開源資料和自研工具默默影響過無數人。疫情期間刷屏網路的美簽網站tuixue,正是出自他之手。兩個多小時的播客聽下來,許多人被他思考的深度、表達的克制和謙虛的態度圈粉,更重要的是,翁家翌的成長之路,也給無數中產家庭的孩子點亮了燈。在AI圈天才少年的光環下,求學期間的翁家翌顯得格外慢熱。回想小時候,翁家翌說:“我學新東西,經常要花別人兩三倍的時間。”這個福建95後,小時候被爸媽拉去聽了某進修校的奧數課和語文課,此後一發不可收愛上奧數,從小學一年級到中學從未停止過。小翁家翌是數學口算小神童,同齡人剛做到一半,他不過腦就能得到正確答案。但他又是個龜速學習者,遇到新概念,需花大量時間和精力建構知識樹,徹底理解過後才能上手實踐。小學語文背誦,別人早背熟了,他還在琢磨記憶法,磕磕巴巴。但一旦掌握了,一覺睡醒也能倒背如流。“因為慢,我練習跆拳道時,一到上場實戰就被別人揍。”他笑著回憶。圖源unsplash正所謂笨鳥先飛,提前學成了翁家翌生存策略。他初中時自學高中數學,遇到難題追著老師問,初二把高中數學啃完,初三又開始攻微積分。“數學給了我巨大成就感和正反饋...提前學就是在投資未來,與其刷題,不如學更多對未來有用的東西,收益會更高。”初中在福建私立校就讀,因為學校有程式設計興趣班,加上父母支援,他便抱著玩的態度學了程式設計。沒專業程式設計裝置,他就用普通iPad敲程式碼,活脫脫一個程式設計苦行僧。(圖源|YouTube)高中因升學壓力,他正式進入競賽體系。起初,他同時沖數學和資訊學競賽,高一數學競賽小有成績。但再往上衝,資源和天賦門檻越來越高,學起來相當困難的他果斷放棄,轉攻資訊學競賽。但資訊學競賽這段經歷也一波三折。高一參加省選時,翁家翌幾乎不會做題。但高二,他就靠摸索出來的解法拿到全場最高分,進了省隊。後來在清華夏令營表現出色,翁家翌拿到高考加60分及有條件一本線錄取資格。但真正全國賽時,他嚴重失利,僅摘得福建省銅牌,省內排倒數第一。競賽失利對他心態影響很大,因為高二沒系統學文化課,他擔心高考沒把握,反覆權衡之後,他選了風險更高的路。2016年按清華降60分的協議,翁家翌進了自動化系。入讀後因自動化高年級課程不符合他的預期,2017年他轉到了電腦系。(圖源|知乎@Trinkle)本科一開始,翁家翌就按照電腦博士申請來規劃未來。大一找圖形學老師,但讀論文時發現水平不夠,外加對方向不感興趣,就不了了之了。大二報名學術新星計畫,加入清華朱軍教授的TSAIL實驗室,起初他什麼都不懂,誤打誤撞選了喜歡的強化學習領域,惡補知識後,在程式設計和AI方面才有了質的飛躍。實驗室期間,他參與了AI競賽ViZDoom項目,憑藉紮實工程和演算法能力,他所在團隊獲得多個獎項,也是賽事歷史上首個中國區冠軍。2020年疫情隔離在家的翁家翌自己重新寫了一套強化學習訓練流程,Tianshou(天授)框架誕生,開源之後迅速出圈,在GitHub上獲得幾千星標。後來,他成功加入圖靈獎得主Yoshua Bengio的實驗室,深入研究強化學習和自然語言處理,接觸到了全球頂級學術資源。申請碩博申請時,因競爭激烈,外加外語分數不高,翁家翌只拿到了美國卡耐基梅隆大學碩士Offer。他也是後來極少數以碩士應屆生直接進入OpenAI核心團隊的人。(圖源|翁家翌個人網站)播客採訪中,翁家翌多次提到,追求影響力是自己初心和動力。他喜歡且想做賣鏟子的人,創造價值,幫助他人,實現自我。這一想法是高三突然從他腦海裡蹦噠出來的:“如果人生是一場遊戲,遊戲的結算分數就是有多少人記得你的名字。”得益於人生遊戲結算的靈感,之後,他的每一步都在踐行自己的價值追求。剛進清華時翁家翌就做起了「慈善」。他把收集到的所有無版權課程作業、項目程式碼、實驗材料和筆記等全部放到了GitHub上,公開分享給了全世界,讓所有人站在同一起跑線。“我想打破資訊差,不想讓後人重蹈覆轍,不想讓大家花十幾二十小時鑽牛角尖。很多人能力強,只是不擅長收集資訊。如果我能做到資訊平權,學弟學妹們可能會在清華活得更好。”圖源unsplashOpenAI現在員工數千人,但它依然保持著小團隊的人才密度,擁有硬核的創新。翁家翌認為這背後因為資訊平權,它讓每個人都能發揮出最大潛力,而不是自掃門前雪。但他也因曾經的開放原始碼專案而遭到想要盈利者的蛋糕。有人認為他破壞了傳統規則,遭到不少網路惡評。但無數同學靠它完成了任務,節省了大量時間,對他而言這就是最好的回報。“去清華隨便抓個電腦系的學生問,你認識捐樓的人嗎?他們大機率不認識。但你問認識翁家翌嗎?他應該認識。因為大家都看過我的作業。”這是翁家翌在播客中的原話。圖源unsplash2019年2月,大三的翁家翌還心血來潮買了阿里雲伺服器,註冊了tuixue.com的域名。命運的齒輪就在那一刻慢慢啟動了。他起初只是做一些愚人節惡作劇、放課程答案、資料庫作業、演算法模擬器等網頁。誰知道2020年三月,因為疫情美國突然傳出暫停簽證的消息,全球留學生一片恐慌。當時翁家翌在網上刷到某中介整理的5個城市未來三天美簽預約情況,他覺得這個資訊很實用,等待簽證的留學生肯定迫切需要。於是他利用自己的爬蟲技術,做了個即時監控美簽預約名額的網站,高峰期時該網站每日訪問量破百萬,服務了數千萬人,成了留學生的救命稻草。圖源unsplash業餘時間他還搞過許多網路安全的東西,甚至修了不少校園網的漏洞。強化學習框架開源Tianshou(天授)也是放大他影響力的典型案例,這個由他主導的項目,降低了強化學習研究的門檻,讓新人快速上手實驗。再到如今OpenAI貢獻列表裡,翁家翌的名字頻繁出現,比如ChatGPT原始團隊第六作者、GPT-4o的RLInfra主要作者等。這意味著大家都在用他底層架構的鏟子,這遠比單一的演算法研究起到的作用更明顯。所有技術發展到終局都將是普及,翁家翌認為:“做技術是為了讓自己能影響到更多的人,做更有意義的事情,技術只是手段,不是目的。”(圖|翁家翌簡歷部分)從國內頂級學府到海外頂級大廠,往往是天才敘事的經典範本。但最為可貴的是,在翁家翌的自我描述裡,這一切靠的不是天賦。他認為,除了找到了喜歡且擅長做的領域,最重要的是清楚自己的目標,並建立了一套獨屬於自己的評價體系。翁家翌有著超乎同齡人的哲學深度,他說:“人生可算作是種體驗,既然你已經來到這個世界上了,那就不要浪費這段旅程。如果你不喜歡被外部評價推著走,那就建立自己的標準。”圖源unsplash在全省狀元聚集的清華,周圍人幾乎都在為GPA、競賽、科研、論文拚搏。「博士強過碩士、學歷越高越好」的固有認知也在校園蔓延開來,無數人為直博耗盡心血。初置身其中,翁家翌不可避免承受了巨大壓力,他坦言花了好長時間才從這個框架裡跳出來。方法簡單卻殘酷,那就是先把該做的事用最低限度的時間達到標準,而後把全部注意力投入到自己長期想做、真正重要的方向。受導師影響,本科期間他把電腦系的成功指標總結為,論文+比賽+GitHub三位數以上的Star,後來又進一步演化為做對現實世界人有沒有幫助、有沒有作用的東西。這套自己的評價體系後來也得到了OpenAI聯合創始人John Schulman的讚許,在面試時特意提到他的GitHub很乾淨、工程質量很好。(圖源|知乎)讀研期間,他敏銳捕捉到AI行業的風向,相比學術能力,工程的價值越來越大,於是便把自己的重點放在了工程能力的培養上,為進入工業界打好基礎。他在播客中尖銳地指出,如果想進工業界,讀博就是浪費生命,因為工業界看重的是你能否規模化,解決現實複雜問題,而非發論文。“教一個研究員(researcher)如何做好工程(engineering),遠比教一個工程師如何做好研究要難。”在他看來,現在這個時代不缺創新和好的想法,真正稀缺的是能在單位時間內驗證更多正確有效的想法,成功率和迭代次數成正比。圖源unsplashCMU碩士畢業後,他海投18家公司,順利拿到了Google、OctoML、幻方浩方(後來的DeepSeek)、OpenAI、輝達等Offer。因為對頂級研究方法的追求以及想在成熟工業級研究體系中訓練,他選了OpenAI,放棄了DeepSeek。(圖源|Github)去年科技領域的諮詢顧問Ram Srinivasan判斷稱,AI軍備競賽的人才之爭已進入2.0階段。1.0階段是圍繞那一小撮最聰明的人的戰爭,企業靠天價薪酬招收高度學術化的頂級研究者。而2.0超越了單純燒錢留人的階段,高薪只是入門票。真正拉開差距的是基礎設施、機會和願景。從這個角度看,翁家翌的選擇恰好踩中了這場轉變的節點,堅守初心,利用模型和工程工具快速迭代落地,將技術的價值帶入千萬家。(圖源|Ram Srinivasan)不管是翁家翌走過的路,還是人才之爭進入2.0階段的判斷,這都預示著傳統精英教育的劇本正在一步步失效。卷名校學歷、刷高GPA、競賽和論文等也很重要,但絕大多數人捲到極致也到不了頂端,只落得個分母的下場,跟他人之間沒有差異。在這樣的大背景下,未來的教育最重要的或許是,鼓勵孩子去定義自己的成功,不能被別人家孩子牽著走。這是一個個性越發凸顯的時代,成功樣本也會層出不窮,每個孩子都有機會去找到的閃光點。也正是如此,不能因害怕孩子失敗或是偏離主流賽道,亦或者走得太慢、走了彎路而放棄追求自己的路。圖源unsplash那又該如何找到孩子的成功之路呢?答案往往藏在那些日常生活中。比如孩子對那門學科感興趣、平時喜歡談論什麼話題、每天會把時間花在那裡...這些長期穩定的關注點都是打開成功的一把鑰匙。但這一切都有個更為根本的大前提,那就是讓孩子找到「為什麼要做這件事」的內驅力。今天的孩子常被形容為空心一代,究其根本是他們太早為分數、排名和名校奔命,從未真正有時間思考自己為什麼出發?一旦這個外在的評價標準消失了,他們的內心就會迅速坍塌。當孩子知道自己在為何而努力,即便沒有掌聲和鮮花,即便身邊牛人一堆,Ta依然不受干擾,能保持自我,持續向前。 (INSIGHT視界)
Manus 向上,智譜向右:中國工程師紅利,只有出海才能兌現價值?
兩條路徑,一種宿命清晨的科技圈被一條消息刷屏了:成立不久的 AI Agent 創業公司 Manus 被 Meta 以 20 億美金的價格收入囊中。創始人肖弘更直接獲封 Meta 副總裁。就在 Manus 在新加坡慶祝“技術套現”的同時,國內大模型領頭羊智譜清言也在同一時間啟動了香港上市的招股。招股書顯示,智譜預計市值超 511 億港元,但繁華背後卻是沉重的財務壓力——2025 年上半年虧損 17.5 億元,平均每月“燒掉”近 3 億。按此速度,帳上現金僅夠維持 9 個月。同樣是頂尖的華人技術團隊,一個在 Meta 的生態裡輕裝上陣,一個在資本市場的博弈中求生。這種巨大的體感差異,真的只是因為“出海”與否嗎?估值博弈:被“土壤”攤薄的價值我們將坐標拉長到全球視野。智譜即便頂著“中國 OpenAI”的光環,其市銷率(P/S)在 64 倍至 78 倍之間,相較於國內 AI 應用公司已是巔峰,但對比美國同行卻略顯落寞。大洋彼岸做企業服務的 Anthropic,2025 年營收預計超過 50 億美金,二級市場隱含估值高達 3500 億美金,更不用上篇文章提到的Palantir,市值已經突破4500億美金。就算有美股的泡沫和對AI價值的高估,可那又怎麼樣呢?泡沫的繁榮也是繁榮,總比理性的貧瘠強,普通人創業,首先要獲得市場和資本的認可,讓創始人和投資人先賺到錢。可為什麼智譜既有 Anthropic 的訂閱邏輯,又有 Palantir 的服務屬性,市值卻難以跨越數量級的鴻溝?答案不在技術指標,而在於中國企業級市場的“三大泥潭”:私有化部署、定製化開發、資料治理。這並非新鮮事,但為何難以破解?我曾經以為這不過就是中國企業現階段的無奈之舉,直到我無意中翻開一百多年前傳教士明恩溥的那本《中國人的性格》,才發現如今中國企服市場的每一個痛點,都能在百年前的社會心理中找到底層編碼。社會心理一:互相猜疑這種心理在企服市場中的體現就是猜疑的高牆與私有化的執念。明恩溥觀察到,中國民居最顯著的特點就是環城、環村、環房而建的高牆。這種防禦不是針對外敵,而是針對彼此。“據說,人與人之間之所以相互不信任,原因有兩個:一是不瞭解對方;二是太瞭解對方。”書中舉例:一個婦女聽到院內喧嘩便勃然大怒,認定人們在議論她;一個僕人被辭退,會固執地猜疑所有人都在背後中傷;中國人分錢時,大家很難相信既定方案,總覺得錢被別人剋扣了。這種深植骨髓的“不安全感”,完美對應在當下的數位化決策中。許多大中型企業不惜支付數倍溢價,也要搞私有化部署,理由如出一轍:“資料交給別人,我不放心。” 甚至有企業寧可雇上千人團隊從頭研發商業成熟產品,美其名曰“自主可控”,實則是擔心資料被外人窺視。在這些決策者心中,私有化部署等於絕對安全。這正如明恩溥描述的“高牆心理”——寧可把現金埋在自家的床底,也不願存入銀行。他們寧願相信月薪八千、三本畢業的自家維運,也不信大廠投入幾十上百億研發的技術能力和安全機制。這種心理帶來的效率損耗,正是中國企業軟體難以規模化增長的第一個病灶。社會心理二:“順而不從”與定製化黑洞為什麼中國企業的個性化需求如此之多?是因為業務真的特殊嗎?未必。更多時候,是為了遷就不合理的舊流程和人的操作習慣。明恩溥將其總結為“順而不從”。書中寫道:給苦力一把快鐮刀,他笑著接過,轉身卻繼續用那把鈍滯的舊刀,理由是“舊的更好用”;給洗衣工脫水機,他棄之不用,寧可手搓得破爛不堪;園丁不按吩咐修牆,反而插滿樹枝,被質問時還能講出一堆優越性。有位地方官命僕人去遠方取水,僕人卻私自到近處取甜水,只要結果滿意,官員便不追究其抗命這種“會捉老鼠就是好貓”的實用主義,在企業數位化中演變為對標準化軟體的天然抵制。管理層呼籲標準化,下級表面尊重,實際操作中卻繞過規則。如果上級持續施壓,壓力便逐級下移,直至消解,一切恢復如初。這種博弈導致廠商不得不針對每個企業、甚至每個部門開發特定的補丁。定製化開發不是在適配業務,而是在適配那些不願改變的“舊習慣”。社會心理三:漠視精確帶來的“資料負債”“大數對得上就行”,是中國企業資料治理的隱秘真相。明恩溥提到,中國人對數字的敏銳度往往讓位於“模糊的體面”。AI的底層邏輯是資料,而資料要求的是絕對的精確。但我們的傳統心理中,似乎自帶一層“模糊濾鏡”。明恩溥發現:說老人七八十歲,可能才滿七十;去看戲花了173弔錢,口述時一定是“兩百吊”,因為“沒區別”。這種對數字的無所謂,直接導致了企業內部的資料斷層。當年我代表就職的企業與合作方簽署了一個970萬的軟體合同,於是對方在簽約喜報中就體現了合作金額“千萬大單”,反正看起來接近1000萬就行,實際上還差了整整30萬。我服務過一家年營收數百億的集團,不管是集體總部還是眾多二級單位之間,的資料幾乎沒有一個能完全對上。真正用的好就一個財務系統,做核算出報表,你搞你的我搞我的,對不上就對不上,以財務資料為準。這種對精確性的漠視,導致了國內企業普遍面臨極高的“資料債務”。當 AI 進入這些企業時,面對的是一堆邏輯混亂、口徑不一的髒資料。為了讓 AI 說句“人話”,廠商不得不投入大量精力在底層治理上,這種苦活累活,讓任何業務都變得沉重且低效。結語:在鹽鹼地外尋找“增長範式”鹽鹼地裡固然能種出莊稼,但需要極高的改良成本。Manus的成功,本質上是利用了中國的工程師紅利,但在產品設計之初就對準了規則明確、生態成熟的海外市場。這為新一代軟體創業團隊提供了一個極其清晰的生存指南:跑出原型,然後快速融入國際化生態。而對於像智譜這樣根植本土的先行者,真正要獲得商業上的成功,還需要極大的戰略定力和資本支撐。未來相當長一段時間內,國內市場或許會繼續維持這種“高投入、慢回報”的常態,這是由社會心理和商業環境共同決定的。而那些希望快速兌現技術價值的團隊,出海不再是選項,而是必然。無論如何,還是要祝福Manus,他們證明了本土教育背景的技術團隊一樣能做出世界頂尖的產品,同時還能賺到錢;同時也要致敬智譜,走入資本市場,迎接更大的挑戰。 (岩聊數位化)
富士康,突發!
富士康又傳來大消息!據彭博援引知情人士報導,富士康科技集團(Foxconn Technology Group)要求數百名中國工程師和技術人員離開其在印度的iPhone工廠,這給蘋果(Apple)公司在印度擴大生產的努力造成了打擊。彭博稱,目前尚不清楚富士康讓這些員工回國的原因。知名電子行業分析師郭明錤表示,中國大陸員工回國這件事的影響幾乎可忽略。首先,富士康在印度iPhone工廠的中國大陸員工本來就很少;其次,富士康在印度iPhone工廠的產能是由台灣地區員工建立的,而不是大陸員工;在印度iPhone工廠的中國大陸員工陸續回國是早已規劃的,蘋果也完全知情。今天,富士康旗下A股——工業富聯股價大漲超8%。富士康的大消息彭博社報導稱,富士康要求數百名中國工程師和技術人員離開其在印度的iPhone工廠,這給蘋果公司在這個南亞國家擴大生產的努力造成了打擊。據彭博報導,從兩個月前開始,富士康的許多中國員工被告知要飛回國。目前尚不清楚富士康讓這些員工回國的原因。富士康是蘋果公司最大的iPhone組裝商。一位蘋果公司的代表不予置評。富士康亦未回應彭博的電郵置評請求。彭博社報導稱,這一變動對蘋果而言來的不是時候。因為這家公司正準備與印度製造夥伴聯手擴大新款iPhone 17的產能,而富士康也正在印度南部新建一座iPhone工廠。蘋果計畫到2026年底在印度生產面向美國市場的大部分iPhone,但此舉遭到美國總統川普的多次批評。5月,川普再次發出威脅,要求該公司在美國境內製造iPhone,否則須繳納至少25%的關稅。影響多大?蘋果執行長庫克曾讚許中國大陸組裝勞工技術和專業知識,強調這是蘋果生產線大多設在中國大陸的一大原因。不過,也有知情人士指出,中國大陸人力撤出印度不會衝擊生產質量,但可能影響組裝線效率。《紐約時報》早前曾報導稱,蘋果公司雖已加速在印度生產iPhone,但仍在中國組裝iPhone中大部分的複雜元件,包括螢幕和面容識別技術模組。這些元件經過一個被稱為“預裝配”的過程後再運往印度,最終在那裡組裝成一部iPhone。因此,最終產品可以聲稱是在印度組裝的,但其實大部分工作是在中國完成的。郭明錤發文稱,這件事的影響幾乎可忽略,因為富士康印度iPhone工廠的中國大陸員工回國早就規劃好了,蘋果也完全知情。郭明錤分析,原因有三點:第一,富士康在印度iPhone工廠的中國大陸員工本來就很少;第二,富士康在印度iPhone工廠的產能是由台灣地區員工建立的,而不是大陸員工。第三,在印度iPhone工廠的中國大陸員工陸續回國是早已規劃的,蘋果也完全知情。近年,富士康已在印度逐步建立了相當規模的組裝業務。該公司還曾派遣大量經驗豐富的中國工程師前往印度,以加速其業務擴張。據悉,中國管理人員在培訓富士康印度員工方面發揮了關鍵作用。印度僅在四年前才開始大規模組裝 iPhone,如今已佔全球產量的五分之一。值得一提的是,今天工業富聯A股表現非常出色。截至午間收盤,股價漲幅超過8%。據中郵證券研報,資料流量的增長使得交換器市場從100G/200G過渡到400G/800G的產品,並將逐步邁向1.6T。根據Dell'OroGroup預測,2025年800G交換機連接埠將有望超越400G成為主流配置。公司憑藉在智能製造、響應速度等方面的優勢,市場份額不斷提升。目前公司高速交換機產品組合涵蓋Ethernet、Infiniband和NVLinkSwitch的多元部署,產品結構逐步向高階邁進,800G交換機陸續出貨,高階產品佔比持續提升。 (券商中國)