#華人
華人與印度裔系列4:印度人能當好CEO,卻很難出黃仁勳,那我們為何還要學習印度裔?
前三篇我們聊了職場政治和表達,後台有讀者留言:“看得憋屈,難道華人的宿命就是給印度高管打工?”今天我們把視角拉高一個維度。不再看“誰在管人”,而是看“誰在創造”。矽谷風投教父保羅·格雷厄姆(Paul Graham)最近提出了一個震動科技圈的概念:“創始人模式”(Founder Mode)與“經理人模式”(Manager Mode)。這個理論提供了一個絕佳的手術刀,能精準剖開“印度裔CEO”與“華裔創始人”之間的本質分野。如果說印度裔高管是“經理人模式”的巔峰產物(完美的管家);那黃仁勳、袁征、張一鳴,則是“創始人模式”的極致代表(瘋狂的暴君)。這不只是職位的區別,這是兩種完全互斥的底層作業系統。01經理人模式:金融工程與熵增的對抗為什麼華爾街偏愛薩提亞·納德拉(微軟)和桑達爾·皮查伊(Google)?因為他們是完美的“代理人”。在“經理人模式”下,公司的首要目標不是“做出驚豔的產品”,而是“可預測的增長”。看看皮查伊治下的Google,過去幾年最大的創新是什麼?是DeepMind嗎?不,那是買來的。是Transformer架構嗎?那是科學家搞出來的,然後被OpenAI拿去發揚光大了。皮查伊做到了什麼?他通過精密的“金融工程”——股票回購、成本控制、裁員、最大化廣告變現——讓Google的財報無懈可擊。印度裔精英的各種特質,完美適配這套系統:極度的高容錯性(High Tolerance for Ambiguity): 面對大公司內部複雜的流程、扯皮、模糊的權責,他們不僅不焦慮,反而能如魚得水地進行資源置換。共識驅動(Consensus Driven): 他們擅長在做決定前拉通所有部門,不僅分攤了風險,還讓每個人都覺得被尊重。PPT治國: 這不是貶義。在數萬人的組織裡,能夠將複雜的戰略通過精美的敘事(Narrative)傳遞下去,本身就是最高級的管理能力。結論一:印度裔CEO的勝利,是“存量管理學”的勝利。他們是給這艘巨大的、必然走向混亂(熵增)的巨輪,續命的修補匠。02創始人模式:反共識的獨裁與穿透但黃仁勳是另一個物種。輝達的組織架構圖如果畫出來,會讓所有MBA教授心梗:扁平得像一張煎餅。黃仁勳直接管理著60名高管(通常CEO的直屬下級不超過10人)。他不分層級,經常越過VP直接抓基層工程師問細節。這就是保羅·格雷厄姆所說的“創始人模式”的核心特徵:“穿透性管理”(Skip-level Management)。為什麼很難出“印度版黃仁勳”?因為這種模式需要一種極度反人性的特質:對“共識”的蔑視,和對“具體”的病態執著。工程納粹(Engineering Narcissism): 華人創始人往往是技術原教旨主義者。袁征(Zoom)早期因為受不了WebEx的程式碼臃腫才出來單干;黃仁勳為了CUDA生態死磕了十幾年,當時華爾街都覺得他瘋了。反人情世故: 在“創始人模式”裡,沒有“給面子”這回事。你的程式碼跑不通就是垃圾,不管你是VP還是實習生。這種“對事不對人”的極致,在講究人情和階層的印度文化裡很難生存。甚至擁抱痛苦: 黃仁勳有句名言:“希望你們經歷痛苦。” 印度高管擅長讓員工“舒服”(從而獲得支援率),華裔創始人擅長讓員工“痛苦”(從而逼出極限)。結論二:華裔創始人的勝利,是“增量工程學”的勝利。他們不是來分配蛋糕的,他們是帶著火藥和鏟子來炸開新礦脈的。03教育程式碼的差異:MBA vs PhD這種分化,在教育階段就已經註定。看一份有趣的資料:美國標普500企業的CEO中,印度裔大多持有MBA學位(管理碩士);而華裔高管/創始人,絕大多數持有技術PhD學位(博士)。MBA教育的核心是“最佳化”:在給定約束條件下,尋求局部最優解(Local Maxima)。這訓練出的是交易員思維——低買高賣,整合資源。PhD教育的核心是“突破”:在未知領域裡,尋找那個唯一的真理(Global Maxima)。這訓練出的是求道者思維——那怕把牆撞破,也要找到那個公式。印度家庭教育孩子:要能說會道(Debate),要成為領導者(Leader),要融入社區。華人家挺教育孩子:要學好數理化,要技多不壓身,要掌握核心科技。前者生產了全球最好的“連接器”(CEO/高管);後者生產了全球最硬的“發動機”(創始人/技術大牛)。04給我們的啟示:你是要做API,還是做核心?分析到這裡,答案不再是簡單的“誰輸誰贏”,而是“生態位”的選擇。文章開頭提到的憋屈感,其實源於一種“錯位競爭”:大多數華人拿著“做核心(Kernel)”的技能包,卻試圖去搶“做介面(API)”的飯碗。在現代商業大廈裡:CEO/高管是API:他們負責連接外部投資者、內部員工、媒體和公眾。他們需要標準、圓滑、通用、低摩擦。創始人/技術骨幹是Kernel:他們負責運算、邏輯、核心功能。他們需要硬核、穩定、甚至可以晦澀難懂。如果你想在這個時代破局,有兩條路:路子A(適合大多數人):給你的“中國芯”套一個“印度殼”。不要放棄你的技術核心(那是你的護城河),但必須在這之上封裝一層“API”。學會用MBA的語言講技術故事;學會把“我做了什麼”轉化為“給公司賺了什麼”;學會像印度同事那樣,把60分的成果包裝出90分的期待值。這叫“帶介面的硬核”。路子B(適合極少數人):徹底的創始人模式。如果你無法忍受包裝和妥協,那就去尋找或者創造一個“由於技術極度稀缺,導致必須容忍你脾氣”的環境。就像早期的OpenAI,或者現在的輝達。在那裡,Truth is the only currency(真理是唯一的貨幣)。 (裴裴談)
90後華人科學家:超一億美金年薪背後的權力遊戲
一紙離職信,震動矽谷AI版圖。2025年11月20日,圖靈獎得主、被譽為「AI教父」之一的楊立昆(Yann LeCun)在領英上發表告別辭,宣佈將於年底離開效力12年的Meta。這位曾一手締造FAIR(基礎人工智慧研究實驗室)輝煌的宗師級人物,在65歲之際選擇重新出發,追尋關於「世界模型」的未竟理想。楊立昆的離去,標誌著Meta AI戰略路線徹底轉向:從FAIR所代表的學院派長期理想主義,全面倒向以產品化與商業落地為導向的實用主義。這一歷史性轉身的背後,是Meta內部早已展開的權力重組。就在數月前,年僅30出頭的華人科學家趙晟佳(Shengjia Zhao)——前OpenAI核心開發者——空降Meta,引發組織震動。趙晟佳的加盟充滿戲劇性:入職不到30天便萌生去意,祖克柏親自以「首席科學家」頭銜與天價薪資極力挽留。他的“上位史”,成為矽谷AI人才爭奪白熱化的真實縮影。當圖靈獎得主楊立昆選擇離開堅守12年的Meta,當30歲的趙晟佳以超一億美金年薪空降矽谷,這場看似簡單的新老交替背後,是一場關乎AI技術路線、企業戰略與文化認同的深層博弈。從OpenAI到Meta,從清華園到矽谷,這位年輕科學家的選擇不僅改變著個人命運,更在重塑科技巨頭間的權力天秤。圖源:Shengjia Zhao 的 X清華少年到史丹佛博士的進階翻開趙晟佳的履歷,一條近乎完美的頂尖學者成長路徑徐徐展開。2012年,他考入清華大學機械工程系,後因對電腦的濃厚興趣轉至電腦系,於2016年取得學士學位。在清華的四年裡,他的視野遠遠不限於課堂。2014年,趙晟佳赴美國萊斯大學交換學習,這段經歷徹底開啟了他的學術視野:課堂講座常延續至深夜討論,各類想法在交流中不斷被檢驗、挑戰與完善。更重要的是,他在跨文化、跨學科的協作中,學會了以多元視角理解和推進科學研究。本科畢業後,他將目光投向了矽谷。2016年,趙晟佳進入史丹佛大學攻讀電腦科學博士,師從Stefano Ermon教授。在六年的博士生涯中,他全心投入深度生成模型、變分推斷等前沿方向。其代表作《InfoVAE: Balancing Learning and Inference in Variational Autoencoders》於2019年發表在AAAI,至今引用量已超23000次,成為該領域的里程碑論文。博士期間,他幾乎囊括了各類頂尖獎項:ICLR 2022傑出論文獎、Google卓越獎學金、高通創新獎(QinF)、摩根大通博士獎學金等。趙晟佳的教育經歷然而,真正讓他在全球AI領域聲名鵲起的,是在OpenAI的三年。2022年6月博士畢業後,趙晟佳加入OpenAI為技術團隊成員。當時ChatGPT尚未問世。他不僅是ChatGPT、GPT-4、GPT-4.1的早期核心開發者,也是OpenAI推理模型體系的關鍵奠基者——主導了「o1」與後續「o3」系列的研究。「o1」在AI業界的影響堪稱技術核爆。它將思維鏈從理論概念轉化為可規模化部署的產品,使AI從機率性的語言續寫工具,躍升為具備類人邏輯推理能力的系統。這項突破迅速引發Google、DeepSeek、xAI等全球頂尖實驗室的跟進。與此同時,他也領導OpenAI的合成資料團隊,在業界深陷高品質資料匱乏的困境中,建構了一套可複製、可擴展的資料生成範式。可以說,在Meta向他伸出橄欖枝之前,趙晟佳已是當代生成式AI技術範式的重要建構者之一。他掌握了業內競相追逐的「新型擴展範式」——對於急於在AGI賽道實現反超的祖克柏而言,他無疑是必須爭取的關鍵人才。三十天離職危機今年夏天,Meta陷入了前所未有的焦慮與混亂。公司寄予厚望的Llama 4模型發佈後表現平平,更因"性能評測造假"爭議而聲譽受損。面對OpenAI和Google的持續領跑,以及中國AI實驗室在開源領域的快速追趕​​,祖克柏決定放手一搏。他斥資143億美元收購資料標註巨頭Scale AI,並任命其28歲的創始人Alexandr Wang為Meta首席人工智慧長。隨後,旨在整合公司所有AI資源的"Meta超級智慧實驗室"(MSL)正式成立,標誌著Meta向AGI發起了全面衝刺。為了讓MSL配備頂尖人才,Meta開啟了一場瘋狂的挖角行動。祖克柏不僅親自向目標研究人員傳送邀請郵件,還安排他們在其太浩湖莊園進行面談。Meta開出了高達九位美元的薪酬方案,其中部分offer的有效期僅有幾天。正是在這樣的背景下,趙晟佳被Meta成功從OpenAI挖來。更引人注目的是,圍繞著他迅速集結了一支實力雄厚的華人科學家團隊:團隊成員包括前OpenAI多模態後訓練研究負責人畢樹超、前OpenAI感知技術研究負責人及Gemini多模態後訓練研究負責人畢樹超、前OpenAI感知技術研究負責人及Gemini多模態部門聯合創始人餘家輝、OpenAI o3-mini和o1-mini的核心開發者任泓宇、前OpenAI電腦視覺專家常慧雯,以及前Google DeepMind高級研究科學家任涇宇、前OpenAI電腦視覺專家常慧雯,以及前Google DeepMind高級研究科學家。祖克柏為這支夢之隊承諾了頂級資源支援。據悉,趙晟佳和MSL團隊將能夠使用計劃於2026年建成的"普羅米修斯"計算叢集,該叢集擁有高達1000兆瓦的電力供應,足以支撐前所未有的超大規模AI訓練。然而,這段"聯姻"在開始後不久就面臨危機。據多家媒體報導,趙晟佳加入Meta僅數日,就遭遇了嚴重的管理混亂和文化衝突。MSL內部資源分配不公、官僚作風盛行,承諾的算力資源遲遲未能兌現,這讓習慣OpenAI高效科研環境的趙晟佳深感不適。知情人士透露,趙晟佳當時已決定離開,甚至與老東家OpenAI達成了回歸協議,並簽署了入職檔案。這消息對祖克柏而言無異於當頭一棒。若這位重金聘請的頂尖人才在入職不到一個月就重返競爭對手,不僅將使Meta顏面盡失,更將對其重振AI雄心的計劃造成致命打擊。為留住趙晟佳,祖克柏展現了驚人的決斷力。他直接介入,打破常規,授予趙晟佳"Meta超級智慧實驗室首席科學家"頭銜,並正式確立其領導地位,要求其直接向自己和Alexandr Wang匯報。祖克柏更在Threads上高調宣佈這項任命,特別強調趙晟佳是實驗室的聯合創始人,"從第一天起就是我們的首席科學家"。這不僅是一次薪酬留人,更是一次地位與權力的鄭重承諾。最終,趙晟佳選擇留下,成為Meta AI版圖中僅次於祖克柏與Alexandr Wang的第三號關鍵人物。權力更迭暗戰趙晟佳最終選擇留下,但Meta的內部動盪遠未平息。事實上,MSL的成立與趙晟佳的快速上位,恰恰催化了Meta新舊勢力更替下的深層矛盾。儘管趙晟佳被成功挽留,同期加入的其他頂尖人才卻未能適應。據外媒報導,與趙晟佳同期加盟的兩位前OpenAI研究員——Ethan Knight與Avi Verma,在入職不到一個月內相繼離職,重返OpenAI。來自GoogleDeepMind的研究科學家Rishabh Agarwal也在短短數月後選擇離開。對這些頂尖研究者而言,Meta雖能提供豐厚的薪酬,卻難以復現他們理想的科學研究環境。一位離職員工坦言:“人才終將流向能產生共鳴的地方。缺乏內在凝聚力的體系,終會從內部瓦解。”與此同時,管理階層的「低齡化」與信任危機逐漸浮現。統管Meta AI全域的Alexandr Wang年僅28歲,先前並無人工智慧領域的研究經驗,其背景主要來自營運資料標註公司Scale AI。這種「平信徒領導內行人」的局面,在內部引發了諸多資深科學家的困惑與不滿。有內部人士透露,Alexandr Wang所帶來的Scale AI高階主管團隊與Meta原有體系格格不入,管理方式簡單直接,甚至導致Meta與Scale AI在資料合作層面出現裂痕。更深遠的影響體現在FAIR實驗室的邊緣化。在MSL成立前,由楊立昆一手打造的FAIR實驗室一直是Meta AI的金字招牌。然而在新架構下,FAIR被整體併入MSL體系。儘管楊立昆名義上仍保留FAIR首席科學家頭銜,但在匯報關係上,這點陣圖靈獎得主需要向28歲的Alexandr Wang匯報。儘管祖克柏與楊立昆本人均公開否認角色變化,但在外界看來,隨著公司資源全面向以產品化為導向的MSL傾斜,堅持「世界模型」長線研究的FAIR團隊,實際上已失去對Meta核心AI戰略的主導權。Llama 4的失利成為壓垮駱駝的最後一根稻草,也成為楊立昆選擇體面離開的導火線。儘管雙方在分手聲明中保持了極大的克制,甚至達成了投資合作的“第三條道路”,但楊立昆的離去,無疑標誌著Meta AI那個充滿理想主義的學術時代正式落幕。面對重重挑戰,Meta正嘗試踩下剎車。據《金融時報》獲得的內部備忘錄顯示,Meta已暫停MSL除關鍵崗位外的所有招聘,以期在製訂新戰略的同時更審慎地規劃未來。而這一切的挑戰,恰恰發生在個人能力與時代機遇碰撞的關鍵節點。對趙晟佳而言,出任首席科學家只是開始。他不僅需要帶領團隊在技術上追趕GPT-4、打造更強大的Llama 5,更要在Meta複雜的官僚體係與文化衝突的夾縫中,為祖克柏找到通往AGI的可行路徑。而這場權力更迭的意義,早已超越了趙晟佳個體生涯的起落。它對應出整個AI產業在理想與現實間的艱難平衡,也預示著科技巨頭在AGI旅程上更為激進的投資邏輯。這位90後華人科學家必須證明:超一億美金的薪酬背後,是與之匹配的遠見與實力。在趙晟佳按下"普羅米修斯"叢集啟動鍵的那一刻,一場新的AI競賽已經悄悄開始。 (創業邦)
富裕華人新動向:告別新加坡,擁抱中東
近年來,越來越多富裕的華人開始將目光從新加坡轉向杜拜及阿布達比,試圖在海灣地區設立家族辦公室並獲得居留權。這一趨勢反映了他們對新加坡日益嚴格的移民政策感到沮喪,同時也凸顯了海灣地區在吸引全球財富方面的競爭力。海灣地區的吸引力根據私人銀行家和超高淨值顧問的說法,過去一年中,許多華裔富人對遷往杜拜和阿布達比表現出了濃厚興趣。設立家族辦公室不僅可以簡化獲得公民身份或居留權的流程,還能享受稅收優惠和生活穩定性。標準渣打銀行新加坡財富規劃與家族諮詢全球主管 Mike Tan表示,東亞客戶對杜拜的諮詢數量在過去一年激增。雖然銀行未提供具體資料,但譚指出,阿聯的黃金簽證政策極具吸引力。這種簽證為投資者、部分家庭成員以及高技能工作者提供長達十年的居留權,稅收政策穩定寬鬆。 2022年,阿聯頒發了近8萬張黃金簽證,比前一年的4.7萬張增長顯著。此外,杜拜離岸金融中心的家族相關機構數量也在快速成長。截至今年上半年,這一數字已達到1,000家,而2023年底僅為600家。儘管官方資料未揭露這些機構的來源地,但顧問表示,許多新增機構是由中國富人設立的。新加坡的限制與挑戰相較之下,新加坡近年來對移民政策進行了嚴格把控。儘管設立家族辦公室並獲得就業通行證相對容易,但獲得永久居留權和公民身份的難度卻大大增加。根據新加坡移民與關卡局的資料,過去五年,新加坡每年平均發放3.3萬個永久居留權和2.13萬個公民身份,但移民顧問表示,審批通過率可能低至8.25%。此外,新加坡近期爆發的一起涉及中國福建幫派的重大洗錢案件,也促使當地政府對個人資金流動進行更嚴格的審查。這種審查力度的增加進一步降低了富裕華人在新加坡定居的吸引力。中東的財富新機遇在中東,尤其是杜拜,富裕的華裔客戶發現了更多的機會。燈塔坎頓(Lighthouse Canton)財富管理公司阿聯業務董事總經理普拉尚特·坦登(Prashant Tandon)指出,資產規模在5,000萬至2億美元之間的中段高淨值人士對阿聯的興趣最大。這些人通常具有更強的創業精神,同時可能面臨中國大陸或香港的商業壓力。「許多家庭已經出售了新加坡的房地產,並將資金重新投資到阿聯,」M/HQ管理合夥人揚·姆拉澤克(Yann Mrazek)表示。他補充道,中國和新加坡的嚴格疫情封鎖政策首次激發了富人對海灣地區的興趣。此外,隨著加密貨幣產業的興起,越來越多的華裔加密貨幣企業家也開始在中東設立業務。杜拜的虛擬資產監管局(VARA)已向39家加密貨幣公司頒發了完整牌照,而新加坡則在今年夏天開始對無牌加密交易所進行嚴格打擊。新加坡和杜拜在吸引全球富人方面各有優勢,但隨著政策的變化,杜拜正逐漸成為華裔富人的新寵。正如一位財富管理顧問所說:“不同司法管轄區的風險偏好差異很大,而新加坡顯然比迪拜更加保守。”在全球財富流動日益加速的今天,選擇一個適合的落腳點不僅關乎財富保值,更似乎是對未來生活的一種規劃。或許正如一句古話所說:“風物長宜放眼量”,面對變化的全球格局,富裕階層的選擇也在揭示這個世界的一些本質。 (蹺步書)
大批美國華人媽媽,正在送ABC娃回國讀985......
這幾年赴美留學的熱潮有所降溫,但出國讀書依然是不少家庭的選擇。只是,現在開始出現一種新的趨勢:一些華人家長選擇讓在美國長大的孩子回中國讀本科。最近,我在華人論壇上看到這樣一則帖子:一位華人家長,把自己的ABC娃送回國內大學讀本科了。為什麼要回國讀?這位家長說,他們所在學區不錯,但孩子成績中等、活動經歷不多,不是典型的華裔資優生。如果按常規申請,她家娃大概能進UC Riverside。這所大學其實已經很不錯了,排名在全美第75位,本州學費約1.5萬美元一年,算上住宿和生活費用,每年要花2.5–3萬美元。可在名校情結嚴重的華人家長眼中,這筆投入與學校排名並不成正比。更何況,過去幾年裡,“美國本科教育正在走下坡路”的聲音也越來越多。相比之下,中國不少名校教學紮實、學習氛圍濃、競爭激烈。於是,他們決定:不如趁孩子還年輕,回國闖一闖。事實證明,這個選擇相當不錯。孩子現在就讀於北京一所知名大學(雖非清北,但實力很強),校園環境和學習氛圍都讓家長非常滿意。宿舍有獨立衛浴、空調和 WiFi,生活便利;課程方面,除了高數稍難,其他科目孩子都能適應,為了跟上高數,他們還請了985同齡生給孩子做私教輔導。更令人驚喜的是,孩子整個人明顯變了:變得主動、自律,也更有目標感。現在他加入了學生會、參加多個社團,還在配音比賽中闖入決賽。忙碌、充實,也終於展現出屬於自己的潛力。而從經濟角度看,這筆帳也很划算。在北京這樣一所好大學,一年學費加住宿費才2.5萬人民幣,比在美國讀本州公立大學要省下至少七倍的開支。華人孩子開始放棄UC系或美國中等公立大學,轉而選擇回國讀書這條路究竟能否走得通?它是華人家庭在教育賽道上的新方向,還是一場充滿未知的“逆向冒險”?涉及到孩子的教育,華人家長向來認真、謹慎、甚至挑剔。但這個家長的舉動從性價比到人生體驗,都博得了不少人的好評和稱讚。也有很多家長認為這條路為孩子的教育提供了一個新思路,追問各種細節。仔細分析這位家長決定讓孩子回國讀本科的原因,背後有著深思熟慮的考量:首先,這個家庭整體對教育的態度相對佛系(不過顯然還是在乎的,否則孩子的中文水平也不會那麼好)。但相比那些從小就為孩子規劃名校路線的家庭,他們更早意識到孩子的學業潛力和性格特點,所以不上頭推娃、也不執著於精英大學。在擇校上保持了更開放的心態,從而在擇校上多了很多性價比高的選擇。其次,從費用角度看,這波操作性價比實在太高。她家娃在國內讀本科,每年學費加住宿費大約2.5萬元人民幣,留學生甚至還有機會申請獎學金。四年下來,最大的開銷恐怕就是中美往返的機票。即便算上機票,整體費用也遠低於在美國讀大學的動輒幾十萬美元的花費。而且,如果孩子畢業後想回美國發展,還可以申請帶獎學金的研究生項目,回美國讀個名校碩士鍍金。即便沒有獎學金,一兩年的碩士費用也比四年本科划算得多。更重要的是,這種逆向留學的教育背景反而成了亮點,許多美國大學對有跨文化學習經歷的申請者格外青睞。只要成績不錯,申請名校的機會反而更高。可以說,這是一種繞開美國高昂本科學費的聰明路徑。最後,從人生格局來看,與其把孩子一直“困”在加州念讀一個排名靠後的UC系大學,不如去中國的重點大學開闊視野,重塑圈層。再說,孩子有美國國籍,容錯率其實很高。正如這位家長自己所說:“人生總有退路。我也想過他可能會跟不上國內的教學節奏,但真不行就退學回美國讀個社區大學、再慢慢找方向也沒關係。青春就該試試看,花一兩年探索自己,也挺值得的。”當然,也有人質疑這位家長的做法:認為選擇這條路除了家長省錢外,對孩子未來的競爭力沒有什麼好處。將來孩子畢業,留在中國卷不過本地娃;回美國找工作,從知識儲備到人脈搭建都“斷層”四年,在就業市場缺乏競爭力。“國內人都想盡辦法送孩子來美國讀書,你怎麼還送回去?”家長的回覆我認為對華人家長頗有參考性:自己二十年前留學、打拚出頭,那時候的確是因為“美國更好”;可二十年過去,世界早就不一樣了。如今全家都真心覺得,美國未必再是最佳選擇,尤其對已經拿到美國國籍的孩子來說,回中國讀大學,反而可能是最優解。從投入產出比來看,這個決定也極其務實。省下的美國四年大學學費,加上一點額外積蓄,他們在另一個州以孩子名義買了一套房,能自住、也能出租,長期也許還能升值。何樂而不為呢?教育並不是唯一的“刀刃”,讓孩子早一點擁有資產、理解財富,也是一種成長、內心也更踏實。至於未來發展,孩子的選擇其實更加廣闊:中英文流利讓他在中國以外的亞洲大城市也有優勢。如果畢業後想留在東亞,這段跨國學習與生活經歷本身就是加分項,可去香港、新加坡等地發展,不必侷限於北上廣。若想回美國工作,不去矽谷或華爾街,做普通工作也未必完全依賴人脈;就算需要,孩子繼續在美國讀研,建立人脈和拓展機會仍有充足時間。可以說,這位家長從教育、經濟、語言能力到人生閱歷,一整套規劃幾乎都經過深思熟慮。一輪操作下來,不僅成本更低,孩子的選擇反而更多,理性又划算!像這位家長一樣送娃逆向留學,並非個例。也並非華人家長的“專屬”操作。越南裔、菲律賓裔、印裔、巴基斯坦裔的家長都有過類似操作,送自己在美國長大的娃回國去本國名校接受本科教育,學醫、牙醫、電腦專業的都有。越來越多在美國的家長開始重新審視讓孩子在美國上大學這件事,其中重要的原因是美國高等教育的性價比的確越來越低。先看最現實的部分:學費和生活成本的飆升。過去十年,無論公立還是私立四年制大學,學費都在不斷上漲。如今,一個在美國上大學的孩子,每年平均開銷(學費、住宿、餐飲、保險等)往往高達5萬到8萬美元。很多家庭為了供孩子讀大學,不得不動用儲蓄、推遲退休,甚至背上貸款。根據2025年的一項家長調查,超過六成美國家長表示,他們會為了支付孩子的大學學費而推遲退休或做出其他經濟犧牲。孩子上大學已經成了不少家庭的沉重經濟項目。AI生成可問題是花了這麼多錢,真的值得嗎?雖然布魯金斯學會等機構的研究指出:大學教育總體能提高一生收入水平,但大學的回報率差距極大。頂尖學校、熱門專業的畢業生確實容易拿到高薪,但普通大學、冷門專業甚至部分文科專業的回報率很有限,有些畢業生花了幾十萬美元拿到的文憑,進入職場後收入卻不如學徒制或職業培訓出身的人。而這兩年就業市場的低迷,更讓家長們在孩子高等教育方面的投資雪上加霜。根據美國勞工部與紐約聯儲的最新資料:2025年年輕大學畢業生(23-27歲)失業率已達5.3%,高於疫情前水平;約 41%的畢業生處於“未充分就業”狀態,即他們雖然有工作,但往往與所學專業無關,薪資偏低、職業發展受限。很多學生花了四年甚至更多時間和金錢,卻沒能真正靠學歷改變命運、看到一個更好的未來。相較於上述缺陷,對華人家長來說,讓孩子回中國接受高等教育,教育密度高、花費低、競爭力強,還能培養語言和文化優勢,堪稱性價比之王。就拿華人家長都愛讓孩子申請的醫學院來說,國內不少頂尖醫學院開設了全英文臨床醫學班,課程設定針對美國醫師考試(USMLE)體系,教授授課也多用英文,有些甚至是外籍醫生親自帶教。在本科階段,還可以選擇醫學英語或相關專業,為將來申請美國醫學院或從事醫學相關工作打下基礎。對於ABC學生來說,不存在語言或身份問題,而國際生學費相比美國本土醫學院也要低得多,完全不必為費用焦慮。圖源unsplash全英文臨床醫學課程通常為六年制,畢業後學歷可通過美國ECFMG認證,相當於美國MD。近年來,美國部分州對有經驗的外國醫師放寬了住院醫師培訓要求,有的州甚至可以減少住院時間即可執業;而且國內醫學院的臨床實習機會豐富,學生更容易接觸大量病例、積累實戰經驗。再從學費來看,在保守估算下,中國6年制全英文臨床醫學的學制內直接成本(學費+生活費)平均30萬人民幣左右,而美國醫學院4年單獨階段的直接成本要200-250萬元人民幣;即使加上回美考試費、認證與申請成本,中國讀醫科的路徑在經濟方面仍然具有顯著優勢。畢業時ABC英文流利、身份清晰,回到美國就業同樣具有競爭力。綜合學費、學制長度、臨床經驗和未來發展機會來看,中國頂尖醫學院無疑在性價比上勝過美國本土醫學院。就算不讀醫學或者電腦、人工智慧這些熱門學科,ABC回中國讀本科其他專業,在性價比上也非常划算。過去十幾年,國內頂尖大學的發展令人驚豔,無論是教學水平、科研實力,還是硬體設施,都有了質的飛躍。在社交平台上,有位ABC孩子Eve的經歷很有代表性。她在美國德州出生和成長,18歲前一直接受公立學校教育,從未離開過美國,卻成功申請到北大元培學院就讀。在北大讀完一年後,她分享了自己最震撼的幾件事:食堂的優質餐飲、多元化的同學群體、校園內便捷的交通,以及靈活自由的選課系統。對於一個在美國郊區長大的孩子來說,Eve坦言自己從小在學校吃的食堂既差又貴,來到北大後,她被七八個食堂的飯菜美味又實惠震驚了。校園裡到處都是可掃碼使用的共享單車,出行非常方便。她原以為大學裡幾乎全是中國學生,卻驚喜地發現身邊有來自巴西、匈牙利、馬來西亞、新加坡等多個國家的外國學生,而且中文都非常流利。最讓她喜歡的,是元培學院靈活的選課制度。作為大一新生,她對未來方向毫無頭緒,但在元培,她可以先不定專業,通過選修不同課程探索興趣、調整方向,最終找到自己的目標。她認為,這種充分的探索管道非常適合大學生。在北大讀了一年後,Eve收穫了中文水平明顯提升、對中國文化傳統的理解更深入、同時也激發了自己更強的學習動力和努力意願。就在中國讀名校這件事來說,ABC從操作上來說也的確更容易一些。以申請國內最頂尖的學府清北來說,海外華裔孩子可以避開國內萬馬千軍過獨木橋的高考,在高中成績、漢語考試成績、SAT成績達標的情況下就有很大機率被錄取。HSK五級是什麼水平?能掌握2500個中文單詞,五級考試真題如下:有聽力、閱讀和寫作三部分,共110分鐘,這位送孩子去北京讀書的華人家長就說,自家娃中文其實並不好,寫短文會有很多錯別字、也會用拼英代替,但居然也有漢語六級水平了。相較於中國留學生考的托福、GRE難度係數不是一個量級。綜合來看,這波逆向留學操作對於一些ABC來說確實是不錯的選擇。但想要回國讀好大學,華人家庭和孩子還是有一些坎兒要過:中文水平。能聽懂中文、流利說中文的ABC已是少數群體了,還能讀會寫的孩子更是鳳毛麟角。這背後需要父母的督促和孩子的努力。Eve說,她們家在家裡和父母、長輩一直用中文溝通外;除此之外,她從幼兒園到五年級期間,每天學一小時的中文,五年級之後,就一直堅持自學中文。正是這種長期的付出,才能讓她有機會就讀北大。課程。想要進中國top級的大學讀本科,你在美國的高中成績肯定也要拿得出手(大多數A、少量B、不能低於B)才行。除此之外,進入大學後高數和理工類課程是否跟得上也是不少ABC的難題。像華人論壇上的那個孩子和Eve,在美國就讀的都是好學區的公立高中,自己本身又在數學“尖子班”,饒是如此,在大學的高數課還是他們不小的挑戰。最後,身份認同問題。他們既非完全本地學生,又不同於典型國際生,在校園生活中可能感到“介於兩者之間”,在社交、文化習慣、審美、價值觀認同上會遇到摩擦,需要時間和心理調整去找到自己的定位和平衡感。這需要孩子本身具有堅毅的性格和強大的內心。當然,送孩子逆向留學,最關鍵的是孩子自己要感興趣、願意嘗試。父母的角色只能是提供建議和參考,最終的決定權應該交給已經成年的孩子,讓他們為自己的未來負責。 (INSIGHT視界)
Meta白人員工破大防:華人工程師扎堆,“說中文”成原罪?
在北美矽谷大廠裡用中文聊天到底算不算一種“文化冒犯”?部分白人員工:不懂普通話的我像身處地獄華人員工be like:1. Meta上熱搜,因為中國人太多?最近,Meta 的華人員工又一次被推到了風口浪尖。cr. Blind大概意思是,有個哥們在Blind發帖稱Meta華人太多,結果底下有個回覆就開始控訴華人四宗罪:1、中國人在正式會議中說英文,但一結束就用中文交流;2、中國人會排斥非中國人,比如午餐絕不會邀請非中國人加入;3、他們當中很多人英語水平很差,以至於很難理解他們所說的內容;4、他們當中有些人沒有邊界感。這位樓主表示,Meta廣告部門尤其是在門洛帕克總部,他所在的團隊中國人佔比80%。這對於完全不懂普通話的他來說簡直是噩夢。有多少朋友看完第一反應be like:以下是辯方有理有據的發言“英語母語者終於體會到了非英語者在英語世界裡的邊緣處境,我願稱之為當白人成為minority之後的破防”:“吃飯不帶非華人,有沒有可能是白人飯太難吃”以及“合理懷疑是三哥在挑撥離間”:總結一下大家的最終論點:以上截圖源自xiaohongshustatista曾在2022年統計過Meta技術部門和非技術部門中各大族裔的佔比,技術部門中亞裔佔比最高,達到了55.8%:cr. statista2. Meta不是個例,華人改變科技格局其實這已經不是Meta第一次因為華人太多而被控訴,一年前也有類似的吐槽帖出現在Reddit:評論區的資料其實比樓主的吐槽更精彩。“在矽谷隨便挑一家公司,你就會發現工程部門大多是中國人和印度人,不僅僅是在Meta”“大型科技公司60%是印度人,30%是中國人,初創公司仍有70%是白人的原因大機率是不提供sponsor…”以上截圖源自Reddit矽谷正走向“華人時代”最好的例子,就是2023年馬斯克創辦的xAI,創始團隊的12人中,有5位是華人科學家:吳宇懷:xAI核心科學家之一,出生在浙江,2021年獲多倫多大學機器學習博士學位,師從諾貝爾獎得主、深度學習之父Geoffrey Hinton;張國棟:本科畢業於浙大,後於多倫多大學獲得博士學位,同樣師從Geoffrey Hinton,加入xAI前,其職業經歷覆蓋微軟亞洲研究院、Google大腦、DeepMind等頂尖機構;此外,還有本碩就讀於哈佛大學數學系的楊格,本科畢業於清華大學,碩博畢業於卡內基梅隆大學的戴子航,以及吳宇懷的導師、同樣畢業於多倫多大學的Jimmy Ba。cr. 網路,左起分別為馬斯克、吳宇懷、Jimmy Ba今年科技AI圈反反覆覆的搶人大戰,更是證實了華人科學家正成為頂尖科技公司的核心力量。今年6月Meta成立了“超級智能實驗室”,整個團隊44個核心成員中,有超過一半是華人,小扎更是不惜重金招兵買馬,組建的“AI夢之隊”中,華人學者依舊超半數:7月,Meta又從Apple挖走了華裔基礎模型負責人龐若鳴(Ruoming Pang),年薪高達2億美元。Nvidia老總黃仁勳,6月直聘了量化華人、清華校友朱邦華和焦劍濤:黃仁勳與95後清華校友朱邦華根據MacroPolo資料,2019年美國頂級AI研究機構中,擁有本科中國國籍背景的研究人員佔比為29%,僅僅三年後的2022年,這個數字飆升至47%,而美國本土只有18%。毫無疑問的是,2025年隨著AI競爭的加劇,華人科學家的價值將進一步凸顯。為什麼華人工程師在矽谷如此受歡迎?簡單來說是因為他們在AI時代格外具有“最稀缺的高價值資源”。2025年第66屆國際數學奧林匹克競賽(IMO)共產生了72塊金牌,其中中國6名隊員全員奪金,滿分的5位金牌選手中,有2名是中國學生。中國教育體系從小就關注孩子的數學、物理等基礎學科訓練,華人工程師從小接受高強度數理教育,具備深厚的數學功底,如線性代數、機率論等。從晶片到模型,從硬體驅動到演算法驅動,AI競爭的核心已轉向演算法設計、架構創新與資料理解,而這些,恰恰是華人工程師與生俱來的強項。“華人科學家正在接管矽谷”正在成為事實。7月,黃仁勳在北京脫下標誌性皮衣,身著唐裝,用中文演講的行為似乎也在回應這一趨勢。黃仁勳 NVIDIA“中國做得太棒了!全球50%的AI研究人員是中國人,你無法阻止他們推進AI發展。”3. 華人站在矽谷中央,留學生如何入局?前兩年我們看科技圈,總是從layoffs.fyi的裁員資料上感到焦慮。但2025年,裁員大幅減少的同時,AI發展對華人的歡迎也給了所有向往矽谷的新人一顆定心丸。cr. layoffs.fyi如果想在未來的灣區擁有一席之地,有那些熱門的崗位值得留學生沖?1)演算法工程師Algorithm Engineer人工智慧領域的核心人才,主要負責研究、開發和最佳化各種人工智慧演算法。需要深入理解機器學習、深度學習等演算法原理,針對不同的業務場景設計和實現合適的演算法模型。要求從業者具備紮實的數學基礎(線性代數、機率統計)和機器學習理論,精通Python等程式語言,熟悉TensorFlow、PyTorch等深度學習框架,並且能夠從海量資料中挖掘有價值的資訊來最佳化演算法。學歷上本科是門檻,頭部企業更傾向碩士/博士。2)機器學習工程師Machine Learning Engineer機器學習工程師是專注於將機器學習模型落地應用的技術專家,主要負責模型訓練、最佳化和部署。他們需要紮實的Python/Java程式設計能力,精通TensorFlow/PyTorch框架,熟悉資料預處理、特徵工程和模型調優。與演算法工程師相比更側重工程實現,與資料科學家相比更專注技術落地。核心技能包括分散式運算、模型壓縮和雲端部署,需掌握Docker/Kubernetes等工具。企業招聘時看重工程能力和項目經驗,薪資範圍20-60萬,自動駕駛、推薦系統等領域需求旺盛,需具備將演算法轉化為實際產品的能力。3)提示詞工程師Prompt Engineer提示詞工程師(Prompt Engineer)是AI時代的新興職業,負責設計、最佳化和調整與大模型(如GPT、Claude等)互動的提示詞(Prompt),以提升AI輸出的精準度和實用性。企業招聘時通常要求本科及以上學歷(電腦、AI、語言學相關專業優先),熟悉Python程式設計及主流大模型(如LLaMA、DeepSeek)的調優方法,掌握思維鏈引導、角色扮演等Prompt Engineering技巧。還有更多AI時代熱門的崗位以及工作內容和招聘要求,WST為大家整理了一份檔案,需要的同學可以加入小助理獲取。過去幾年,就算你不是尖子生,但只要你畢業於名校,依舊可以收到多個工作類型、地點、薪水和僱主都很有吸引力的工作邀請。但現在的情況是,很多GPA高達4.0的優秀畢業生,連一個Offer也拿不到。時間線為王,低年級是超車的好機會對於想要留美上岸科技大廠的留學生們來說,2025年的機會是比2024年多,但相比繁盛時期依舊更少,但門檻卻因為AI的強勢加入而水漲船高,想要絲滑上岸也需要經歷一番苦戰。簡言之,大一大二打基礎階段則要付出更多的努力。這裡就不得不提許多海外頂級公司都會開放針對低年級學生的早期項目,既能快速瞭解行業狀況,感受企業氛圍,又可以瞭解公司內部的招聘流程,進而加速求職過程。別以為低年級項目只是諮詢/金融行業的專屬,基本上我們熟悉的幾個科技大廠都會開放低年級項目申請。有的是針對大一大二學生,而有的項目已經將年齡捲到了高中畢業生。Nvidia Ignite ProgramDuolingo Thrive ProgramMicrosoft Explore ProgramUber STAR項目Lyft Early Talent ProgramGoogle STEP項目(大一、大二學生可申請);Summer of Code(面向高中畢業生的實習)Palantir Sophomore internship;Meritocracy Fellowship(面向高中畢業生的實習)Meta University項目Amazon Propel ProgramSalesforce、LinkedIn、Amex、Micron、Dropbox 、Capital One等公司也有相關低年級項目申請。 (WallStreetTequila)
剛剛,Meta風雨飄搖中發了篇重量級論文,作者幾乎全是華人
【新智元導讀】風雨飄搖中的Meta,於昨天發佈了一篇重量級論文,提出了一種被稱作「早期經驗」(Early Experience)的全新範式,讓AI智能體「無師自通」,為突破強化學習瓶頸提供了一種新思路。Meta自從Alexandr Wang加入後混亂不堪,人心惶惶,Yann LeCun也公開表達出走意願。但就在昨天,他們發了一篇大論文《Agent Learning via Early Experience》,提出了一種被稱作「早期經驗」(Early Experience)的全新範式,讓AI智能體「無師自通」,為突破強化學習瓶頸提供了一種新思路。https://arxiv.org/abs/2510.08558論文作者絕大多數都是華人。默默做事的,永遠是華人。研究背景與問題在現實場景中訓練語言智能體常常面臨一個兩難困境:強化學習需要明確的環境獎勵訊號,但許多真實環境缺乏可驗證的獎勵反饋,或者任務跨度很長導致信用分配(credit assignment)困難;而模仿學習(通常採取監督微調)則依賴昂貴且有限的專家演示資料,模型在訓練中無法與環境互動,因而難以從失敗中學習,遇到新情況時泛化能力差。要麼沒有獎勵訊號指導學習,要麼只有少量人類示範可供模仿,智能體的自主成長因此受限。目前大多數語言智能體採取監督微調的範式:在靜態的專家軌跡資料上訓練策略,將環境狀態對應到人類給定的動作序列。這種方法雖然訓練方便,卻存在明顯侷限:智能體訓練時不與環境互動,看不到自己動作導致的結果,無法「知錯就改」,也很難推廣到訓練資料覆蓋不到的新情境。此外,高品質專家示範資料獲取成本高昂,難以大規模擴充。另一方面,理想情況下我們希望讓智能體像人一樣通過自身經驗不斷成長,但是傳統強化學習在缺少獎勵的環境中難以奏效。面對缺乏獎勵訊號且示範資料有限的困境,我們亟需新的訓練範式來讓智能體完成自主學習。方法框架:「早期經驗範式」針對上述難題,該論文提出了一種折中的新範式,稱為「早期經驗」(Early Experience)。這一範式定位於模仿學習和強化學習之間的中間地帶:智能體在訓練過程中不再僅依賴人類示範資料,還引入自身動作所產生的後續狀態作為訓練訊號。該範式是讓智能體在沒有外部獎勵的情況下,通過嘗試動作->觀察結果->將結果轉化為監督,來直接從自己行為的後果中獲取經驗教訓。這一過程無需環境提供獎勵,利用的完全是智能體探索所產生的資料,可視作在人工演示(無獎勵但資料有限)和強化學習(有獎勵但探索困難)之間架起的一座橋樑。論文具體探討了在「早期經驗」範式下的兩種核心訓練策略:隱式世界建模(Implicit World Modeling, IWM):該策略讓智能體利用收集到的環境狀態序列來建立內部的環境動態模型。做法是讓智能體在一些決策點嘗試由其策略自主提出的替代動作,然後記錄執行這些動作後環境的狀態變化,將這些「未來狀態」作為額外訓練訊號。通過學習預測動作將帶來怎樣的狀態轉變,智能體逐漸內化環境的因果規律,提升對環境動態的理解和決策的穩健性。這種隱式建模有點類似於人類在腦海中模擬「如果我這麼做,會發生什麼」,從而讓策略對行動後果有所預見。自我反思(Self-Reflection, SR):該策略旨在讓智能體從自身不理想的決策中總結經驗教訓。智能體會將自己的動作與專家示範進行對比,識別那些決策是次優的或錯誤的,並為此生成一段反思性的思維鏈說明,即一個自我分析的內在獨白。這些由智能體生成的反思性解釋將作為訓練資料的一部分,指導模型在相似情境下做出更優選擇。例如,在購物網站任務中,如果智能體原本選擇了一個超出預算的商品,一個可能的自我反思是:「這個紅色襯衫雖然符合顏色偏好,但價格超出預算,上述選擇不合理,應該考慮價格更低的藍襯衫。」這樣,智能體通過反思約束條件,理解了自己決策的不足。在訓練中,研究者將這些反思解說與正確動作一起加入訓練,使模型學會根據上下文進行推理並修正決策。自我反思策略相當於給予智能體一個自我導師:讓它自己說明那裡做錯了,以及正確的思路是什麼,從而內化細粒度的經驗教訓。這兩種策略都遵循同一原則:即使沒有外部獎勵,智能體「自我探索」所產生的動作-結果資料本身就能提供高品質的監督訊號。通過將自身行為引起的未來狀態轉換成學習訊號,語言智能體無需額外的人類獎勵標註也可以不斷改進。早期經驗範式可以無縫整合到現有訓練流程中:先用少量專家資料進行基本模仿學習初始化策略,然後讓智能體展開受控的探索(產生「早期經驗」資料),再用上述隱式世界建模和自我反思策略提取的監督訊號對策略進行強化訓練。這一過程實現了從「人教模型」向「模型自學」的轉變。實驗驗證:八大環境的評估表現作者在八個多樣化環境中對早期經驗範式進行了全面評估,涵蓋實體導航、網頁瀏覽、多輪工具使用、長序列規劃以及多領域API呼叫等任務類型。這些環境包括例如:文字版的室內導航和操作(如ALFWorld)、線上購物網頁(WebShop)、科學實驗模擬環境(ScienceWorld)、旅行規劃對話任務(TravelPlanner)等等,既有需要在虛擬空間中行動的執行型任務,也有需要多步推理規劃的認知型任務。同時,模型基座涵蓋了不同規模和架構的大語言模型(如不同參數規模的Llama系模型等),以測試方法對模型尺寸的適應性。實驗結果顯示,引入「早期經驗」後的智能體表現顯著優於純模仿學習基線。在所有測試環境中,無論採用隱式世界建模還是自我反思,兩種方法都取得了一致的提升:任務成功率平均提升了約9.6個百分點,遷移到域外新情境的泛化成功率提升約9.4個百分點。這表明早期經驗範式不僅提高了智能體在已知任務上的效率,還大幅增強了其應對未知場景的泛化能力。例如,在要求滿足多重約束的長鏈推理任務中(如旅行規劃需要兼顧時間與預算),自我反思策略帶來了超過10個百分點的成功率躍升,體現出對複雜推理任務的特別優勢。而在需要與環境反覆互動嘗試的任務中(如網頁購物需要點選不同頁面),隱式世界建模有效讓智能體掌握了環境狀態轉移規律,也取得了兩位數的成功率提升。此外,作者還考察了該範式的資料效率和模型可擴展性:令人驚喜的是,即使將專家演示資料量減少一半,引入早期經驗訓練後模型仍能達到甚至超過使用全部專家資料時的性能。這說明早期經驗提供了額外且多樣的訓練訊號,可以在一定程度上替代昂貴的人工示範資料,提高資料利用效率。同時,將這一方法應用到更大規模的模型上,同樣取得了穩定增益——早期經驗範式在不同模型大小上效果保持一致,不存在隨模型變大而效果遞減的問題。這表明該方法具有良好的橫向與縱向可擴展性:既能拓展到更廣的任務領域,又能適用於更強大的模型。另一個關鍵實驗是驗證早期經驗作為強化學習的預熱(warm-start)是否能夠進一步提升最終表現。作者在其中3個具有明確獎勵的環境中先用模仿學習、隱式世界建模、自我反思分別訓練初始策略,然後再在相同條件下繼續進行強化學習微調。結果發現:以早期經驗(隱式世界建模或自我反思)初始化的策略經過強化學習最佳化後達到了最高的最終成功率,相比直接用模仿學習初始化的策略最終成功率最高提升了約6.4個百分點。這說明,早期經驗階段帶來的性能增益可以持續到最終的強化學習訓練成果中。一些環境中,早期經驗組與普通組的差距在強化學習過程中甚至進一步拉大(例如ALFWorld環境),證明早期經驗為後續強化學習提供了更高的上限起點。在有獎勵和無獎勵場景下,早期經驗訓練都展示出優異表現,架起了一座從模仿學習通向完全自主強化學習的實踐之橋。分析與亮點通讀論文後,我們認為該論文有一些顯著的亮點。無獎勵下的高品質監督訊號早期經驗範式的最大亮點在於即便沒有環境獎勵,也能為智能體提供有效的學習訊號。傳統強化學習需要獎勵來評價行為好壞,而早期經驗通過「自身行為的後果」來指導策略改進。智能體探索產生的未來狀態本身就是監督——成功也好,失誤也罷,這些經驗片段都成為訓練素材。例如,隱式世界建模讓模型直接預測環境響應,自我反思讓模型檢討錯誤決策的原因,兩者都為智能體提供了稠密而豐富的反饋(那怕這種反饋不以數值獎勵呈現)。實驗已經證明,這種沒有顯式獎勵的監督訊號依然可以將模型性能推向新的高度。相比之下,單純依賴專家示範的監督訊號是靜態且狹窄的,而早期經驗訊號來自智能體主動探索,覆蓋了更廣的狀態-動作空間,這正是其泛化能力大幅提升的原因之一。泛化能力與可擴展性由於引入了智能體自己探索得到的大量多樣化軌跡,模型不再侷限於人類示範所涵蓋的有限情景,從而在未知環境下表現更穩健。作者的域外測試顯示,早期經驗訓練的智能體在任務變種或新場景中的成功率遠超僅有模仿學習的基線,證明了其跨域遷移能力。此外,從可擴展性看,早期經驗範式具有良好的資料與模型擴展效果:它可以利用相同環境,讓智能體反覆生成海量的訓練資料(因為不需要人工標註獎勵),大幅降低了對人工資料的依賴;同時無論模型參數規模增加還是減小,方法的收益都基本保持,展示出跨模型規模的一致性。這一點非常關鍵,因為很多方法在小模型上有效但擴展到大模型時效果不明顯,而早期經驗方法在不同規模的模型上都取得了顯著而穩定的提升。早期經驗不僅拓寬了智能體「見過」的世界,也為大模型時代的持續改進提供了一種資料可伸縮的方案。對比其他方法(STaR、長鏈推理等)早期經驗範式與現有一些讓模型自我提升的思路有所不同,提供了更具「現實檢驗」的學習訊號。例如,Zelikman等人提出的STaR(Self-Taught Reasoner,自學推理器)方法讓模型為已有示範生成推理過程並自我過濾。但這種方法面對複雜環境時遇到兩個問題:模型產生的解說未經過環境驗證,可能並不正確;為保證動作正確性常需要丟棄大量不匹配專家的解說資料,導致可用訓練樣本很少。作者在文中復現了STaR風格的資料生成,發現模型為專家動作生成的推理鏈中,只有極少比例能匹配專家決策,篩選後幾乎沒剩下多少有用資料,而且這些推理因為從未真正與環境互動,往往是假想的、不可靠的。相比之下,早期經驗方法中智能體每一次生成的動作和反思都直接基於實際環境反饋:不論是隱式建模獲取的狀態轉移,還是自我反思產生的教訓,都源自真實行動的結果,因而資訊含量更高、指導性更強。針對需要長鏈推理的任務,簡單地讓模型生成更長的思考鏈(例如調優提示詞或控制思考步數)只能帶來有限的改善,而早期經驗中的自我反思相當於讓模型親身實踐再反思,其對於複雜推理任務的提升要顯著得多。在作者的實驗中,自我反思策略在需要多步規劃和約束滿足的任務上取得了最大的增益(如旅行規劃任務成功率提高十多個百分點),這也從側面證明了相比靜態的CoT方法,讓模型「做過再想」效果更加突出。方法適用範圍早期經驗範式的一大優點在於其通用性。論文結果表明,無論是具身環境(如機器人操作)還是數字環境(如網頁、API互動),無論任務需要感知行動還是邏輯推理,該方法都能帶來一致收益。這說明將「自己探索」融入訓練的思路具有很強的普適性,不侷限於某一類任務。同時,隱式世界建模和自我反思兩種策略各有側重又能相輔相成:隱式世界建模更側重環境動力學,適用於需要試錯探索的場景;自我反思側重策略最佳化和約束滿足,對多步驟推理任務幫助更大。兩者共享早期經驗的框架,可以根據任務特點選擇使用,從而靈活地提高智能體性能。總結《Agent Learning via Early Experience》提出了一種創新的語言智能體訓練範式,成功彌合了模仿學習和強化學習之間的鴻溝。主要貢獻早期經驗範式的提出:正式提出並定義了「早期經驗」這一訓練新範式,為在無外部獎勵訊號的條件下讓智能體從自身經驗中學習提供了可行方案。這一範式可被視為從依賴人類資料的模仿學習邁向完全自主強化學習的實用且可擴展的橋樑。兩大訓練策略(隱式世界建模和自我反思):設計並系統研究了在早期經驗範式下的兩種具體策略:一是通過隱式世界建模讓智能體學會預測環境變化,從而增強決策的環境紮根性;二是通過自我反思促使智能體從自身行動中提煉細粒度教訓,提升推理和決策能力。這兩種策略證明了即使沒有獎勵,智能體也能將「探索-反饋」循環轉化為有效學習訊號。實驗與效果:在八個多樣環境和多種模型架構上進行了綜合評測,結果顯示早期經驗方法在任務成功率、跨域泛化以及後續強化學習表現等方面均有顯著提升。在若干基準上,該方法取得了SOTA,並通過消融和分析實驗提供了有益的洞察。例如,早期經驗模型以更少的資料達到甚至超過基線效果,且能提升最終的強化學習訓練上限。當前方法的侷限與未來方向目前的隱式建模和自我反思主要著眼於短跨度的經驗片段,對於那些超長序列規劃任務中的信用分配問題,如果沒有顯式獎勵仍然是一個挑戰。未來的研究可以探索如何讓早期經驗範式也能處理更長鏈條的決策最佳化。結合自監督目標是一個有前景的方向——可以考慮引入豐富的自監督學習訊號(如預測下一個子目標等),進一步提升無獎勵環境下的訓練效果。將早期經驗與強化學習在持續學習框架下結合,也是作者設想的方向之一。例如,在有了環境獎勵後,讓模型接著用RL微調,或在訓練過程中逐步引入獎勵訊號,檢驗兩者的協同作用。還可以探索更多形式的早期經驗(不限於論文提出的兩種),比如不同的自我監督策略,乃至讓智能體自己生成新的訓練目標等。作者也提到希望將該範式拓展到更大規模的真實應用中,在真實線上環境中持續收集智能體的互動資料,進行有機的持續最佳化。這將是真正邁向「經驗時代」的一步——讓智能體在真實世界中邊運行邊成長。Early Experience為訓練更自主、更智能的語言代理打開了一扇新的大門。在獎勵稀缺甚至缺失的廣闊應用場景下,它提供了一種高效利用自身經驗的學習機制。隨著這一範式與強化學習、自監督等方法的融合,以及在長期規劃任務上的突破,我們有理由期待下一代智能體將能夠更充分地自我進化,朝著真正的通用智能體邁進。顯然,屬於AI智能體的「早期經驗」時代或許才剛剛開始。目前的這些成果可能是幾個月甚至更久之前就在進行的,而Meta的新時代能否保持住這種學術產出質量,仍有待觀察。 (新智元)
狂開100槍!當街無差別掃射!澳洲華人區附近發生大規模槍擊
昨天晚上7點45分左右,雪梨Croydon Park發生槍擊事件,1男子手持大口徑步槍“向人群無差別掃射開火”,開了多達100槍。警方趕抵現場後,將周邊區域全部封鎖,並要求居民待在家中。不少在雪梨Croydon Park的華人都收到了警察的簡訊,簡訊中提醒公眾在原地躲避。槍擊事件發生近2個小時後,警方突襲了一幢建築並將槍手逮捕。新州警方表示,槍擊事件發生在Georges River Rd與Brighton Ave交界處附近。讓人擔憂的是,槍手的射擊目標似乎十分隨意,不僅造成至少16人受傷,還導致多輛汽車(包括一輛警車)被子彈擊中,現場一片混亂。1名50多歲男子因頸部和胸部中槍,被緊急送往Canterbury Hospital接受治療。(圖片來源:澳洲九號台新聞)此外,還有3人前往Campsie警局求助,包括一名30多歲的男子、一名30多歲的女子及一名50多歲的女子,這3人傷勢較輕。而在案發現場,急救人員為16名輕傷者進行了治療,其中有2名男子隨後被送往Royal Prince Alfred Hospital。目前暫無警員的傷亡報告。(圖片來源:《雪梨晨鋒報》)周日晚9點30分左右,警方對Georges River Rd的一幢建築展開突襲行動,並逮捕了這名60歲的槍手。警方表示,該男子在抓捕行動中受傷,目前在警方的看守下,在醫院內接受治療。(圖片來源:《雪梨晨鋒報》)警方還在案發現場繳獲了多支槍械。助理警司Trent King表示:“我們將會調查該男子是如何獲得彈藥以及槍械的。他所使用的是一支大口徑的步槍。”King表示,尚不清楚該男子的作案動機,警方將對該男子進行審問。(圖片來源:《雪梨晨鋒報》)警司Stephen Parry表示,當警員趕到現場時,也遭到槍手的攻擊。警方初步估計,槍手開了“50到100槍”。由於子彈擊中了玻璃,所以不少傷者都是被飛濺的玻璃渣劃傷的。(圖片來源:《雪梨晨鋒報》)一名計程車司機案發時正好開車經過此處,突然聽到“砰、砰、砰”的響聲。“我接著就發現車窗上出現了幾個洞,好在槍手並沒有擊中我,真的很震驚。”“這就和電影裡演的一樣,你懂我意思麼?”(圖片來源:《雪梨晨鋒報》)目擊者Joe Azar表示,自己就在案發地對面的一家公司上班,起初還以為有人在放煙花。“隨後我們就發現,有車輛的擋風玻璃裂開了,公車站台的玻璃也碎了。那時我們才意識到,有人在開槍。”Azar表示,他們原本試圖逃離大樓,但後來又折返回來並趴在地板上報警。“整個過程非常慌亂,完全來不及反應。大約1個小時後,警方確認安全了才讓我們離開。”當地居民表示,槍響後共有30多輛警車趕到現場。最後,全副武裝的戰術行動小組衝進樓內抓人。(圖片來源:《雪梨晨鋒報》)當地居民Matt Iocco接受《雪梨晨鋒報》採訪時表示,案發時他聽到Georges River Rd傳來巨大的爆炸聲。“大家都躲到車後面,一開始不停地有槍聲傳來,後來槍聲就變得斷斷續續。”而在警方逮捕槍手前,一直有警用直升機在案發現場上空盤旋,告誡民眾待在家中避險。新州警方經過初步調查後宣佈,本次槍擊事件與KB主義或幫派組織無關。調查顯示,槍手是站在屋頂朝著人群開火的。(圖片來源:澳洲九號台新聞)《雪梨晨鋒報》報導稱,60歲的槍手被逮捕時面部受傷,隨後被送往醫院。他已於今晨出院,目前處於被關押狀態。警方表示,該男子獨自居住在Croydon Park的一間公寓內,是新州交通局(Transport NSW)的僱員,他的兩個孩子均已成年。(圖片來源:《雪梨晨鋒報》)警方在現場繳獲了一把.30口徑步槍,目前尚不清楚該男子是如何獲得槍械和彈藥,以及他的作案動機是什麼。初步調查顯示,該男子的攻擊並非針對警員。此外,警方沒能發現任何表明其動機的檔案,他也沒有精神問題。 (圖片來源:澳洲九號台新聞)《雪梨晨鋒報》報導稱,新州州長Chris Minns曾於周日晚間到訪Burwood警局,慰問參與此次行動的警員。Minns讚揚了警方保護社區的表現,同時表示“這類暴力行為在新州沒有容身之所”。 (今日昆士蘭)
華人富豪留5億遺產 ,家屬或分文不得!暗藏恐怖條款!
已故科技企業家謝家華(Tony Hsieh,音譯)的5億美元遺產本來已經夠複雜了,現在,一份神秘遺囑的突然出現,讓整個案件變得更加離奇。這位曾讓線上鞋業零售商Zappos起死回生的傳奇人物,2020年因房屋火災去世,當時大家都以為他沒留下遺囑。沒想到今年,一份日期寫著2015年3月的遺囑突然寄到了拉斯維加斯法院,把所有人都搞懵了。謝家華在矽谷可是響噹噹的人物。他把Zappos做成了行業巨頭,2009年以12億美元賣給亞馬遜。但生命最後一年,他深受心理健康問題困擾,還染上了毒品和酒精。他在猶他州帕克城的豪宅牆上貼滿了數千張便利貼,上面寫滿了各種投資承諾,動輒幾百萬美元。謝家華去世後,他父親理查德·謝(Richard Hsieh,音譯)一直在管理遺產。這幾年,不斷有前朋友和同事冒出來說謝家華欠他們錢,理查德·謝忙得不可開交。然而,這份最新神秘遺囑的來歷實在太可疑了。寄件人自稱叫卡什夫·辛格(Kashif Singh,音譯),說是在已故祖父皮爾·穆罕默德(Pir Muhammad,音譯)的遺物裡發現的,他祖父去世前還患有痴呆症。問題是,理查德·謝的律師們壓根找不到這個辛格在那兒。更離譜的是,遺囑裡指定的兩名執行人——羅伯特·阿姆斯特朗(Robert Armstrong,音譯)和馬克·費拉里奧(Mark Ferrario,音譯),這倆內華達州律師以前從沒見過謝家華,連認識都不認識。阿姆斯特朗知道自己被列為執行人時,整個人都驚呆了。理查德·謝的律師團隊開始大規模調查。翻日程表、查商業記錄、看遺產規劃檔案,還聯絡了謝家華生前合作過的七位律師。結果呢?幾乎什麼都沒查到。律師們上周在法庭檔案裡詳細說明了情況:遺囑上籤字的證人查不到,檔案裡提到的其他人找不著,連那兩個信託基金都沒有任何記錄。謝家華身邊的人都說從沒聽過穆罕默德這個名字,也沒證據顯示他跟拉斯維加斯或謝家華的圈子有半點關係。唯一有點用的線索就是郵戳。律師們發現,跟遺囑有關的兩個信封是從不同地方寄出的。一個從康涅狄格州格林威治寄出,回信地址卻寫的是拉斯維加斯。另一個從賓夕法尼亞州Fairless Hills寄出,回信地址又變成了懷俄明州夏延。這到底是怎麼回事?阿姆斯特朗說,他接到過一個自稱辛格的人打來的電話。沒多久,6月份的時候,有人給了他一份穆罕默德的死亡證明。這份證明好像是從巴基斯坦俾路支省來的,上面寫著穆罕默德2022年10月去世。但問題是,這份證明被大量塗黑,律師們說“根本沒法驗證是真是假”。遺囑的內容更讓人心驚。裡面有個條款特別狠:如果謝家華的四位在世家人中有任何一個敢反對遺囑,那所有人都拿不到一分錢。遺囑把超過5000萬美元和好幾處拉斯維加斯的房產都轉到了幾個信託基金裡,但受益人是誰?到現在還是個謎。法律專家看了這份遺囑後直搖頭,說措辭“笨拙”,很多地方都不像正常的遺囑。比如它居然授權穆罕默德“獨家持有”原件,理由是防止被銷毀,這種寫法很少見。周二,拉斯維加斯法官格洛麗亞·斯特曼(Gloria Sturman,音譯)任命阿姆斯特朗和費拉里奧為遺產特別管理人,這意味著這倆人現在可以為這份遺囑說話了。不過法官在聽證會上也沒掩飾自己的疑慮。“這很奇怪,”她直接說,“但這不代表遺囑就是假的,就是很奇怪而已。”斯特曼表示,考慮到案件這麼不尋常,她暫時不會撤掉理查德·謝的遺產管理人職位。想要對遺囑提出異議的人,從法官書面命令發出後有三個月時間站出來。圍繞這5億美元遺產的法律戰已經打了四年多了,現在又冒出這份神秘遺囑,事情變得更加撲朔迷離。 (知事堂)