#AI人才
小扎親自煲湯!矽谷挖人手段又升級了
OpenAI首席研究官Mark Chen爆料,矽谷AI人才爭奪激烈,Meta首席執行長祖克柏甚至親自烹飪送湯招攬人才。人工智慧企業間的商戰某種程度上並不高科技,甚至可能只關乎於一碗湯。OpenAI首席研究官Mark Chen在一檔播客節目中激情爆料,稱矽谷現在的AI人才爭奪格局已經發生了變化,Meta首席執行長祖克柏甚至自己烹飪並親自送湯來招攬他想從OpenAI挖走的科研人員。Chen透露自己當時非常震驚,但隨後“從善如流”。現在他也會給自己的新員工送湯,並希望從Meta挖走人才。不過,他不會自己烹飪,而是讓矽谷裡的一家高檔韓國餐廳負責製作。他甚至開玩笑稱計畫在OpenAI公司外開設烹飪課,以凸顯出目前矽谷人才競爭中的荒謬感。但不可否認的是,矽谷對於AI頂尖研究人才的爭奪已經進入了一個全新階段。利誘不如走心?Chen表示,Meta對他手下一半的直接下屬都拋過橄欖枝,並為挖角行動投入了100億美元。但他強調,Meta很多次挖角都以失敗告終,因為研究人員相信OpenAI的發展方向,且認為它才會是率先研究出通用人工智慧的公司。儘管如此,今年還是有很多頂尖人才選擇換個東家,且競爭也不僅只在於OpenAI與Meta之間,馬斯克的xAI、微軟、Anthropic,甚至國內大廠騰訊、字節跳動及阿里巴巴也都全情參與人才之戰。這也反映出該行業內關鍵的供需矛盾。業內共識,目前能夠設計和訓練尖端大型語言模型的人才庫極其稀少,全球具備獨立推進這項技術所需專業知識的研究人員可能不足1000人。而由於人工智慧行業允許研究人員提前兌現股權,提供特殊的計算資源獲取管道,並許諾員工在人工智慧系統建構方式中的強大影響力,企業很難用當年網際網路時期的健身房、免費咖啡等福利吸引人才,因此,更多的企業家不得不開始提供一些“情緒價值”。祖克柏的湯就是一個典型案例。企業高管通過建構親密方式來招攬員工,以在薪酬和資源上再次加碼,比如送湯的背後意味十分簡潔明了:你是重要人才,所以值得我花時間來討好。 (科創日報)
美國AI泡沫破裂?比網際網路泡沫慘慘17倍!AI裁員潮背後的隱憂
近日,《Nature》一篇文章討論了這樣一個問題:若AI泡沫破裂,OpenAI、Google等AI公司的科學家將流向那裡?該文章認為他們或將重回學術界,或將創辦AI科技公司,過程中雖然伴隨著裁員與震盪,但從長期看可能促成AI人才與技術溢出到其它領域。資料顯示,2025年前十個月,美國裁員總數已經超過110萬人,科技行業成為重災區。亞馬遜在財報亮眼的同時裁掉了1.4萬名員工,微軟也裁員超過1.5萬人。官方解釋都是圍繞AI展開:為了讓企業更靈活、更高效,必須“精簡組織結構”。然而,真正的原因更深層:巨額的AI投資壓力。微軟、亞馬遜、Google、Meta、甲骨文等科技巨頭在AI算力、晶片、資料中心等方面的資本支出已達到歷史新高。僅微軟今年資本支出就超過600億美元,預計明年接近千億美元。對於任何企業來說,這都是巨額負擔。裁員,成為了最直接的成本控制手段。如果未來幾年AI技術無法兌現盈利預期,整個行業可能面臨泡沫破裂的風險。AI泡沫破裂可能引發一系列連鎖效應:1.股市暴跌AI相關股票佔標普500市值比例接近三分之一,股價下跌可能導致富裕階層資產縮水,消費能力下降。2.企業現金流緊張高債務企業可能面臨流動性危機,被迫裁員或縮減投資,甚至出現破產風險。3.就業市場衝擊初級白領崗位首當其衝,尤其是科技、資料處理、初級程式設計師崗位。AI相關崗位需求可能下降,部分新興產業擴張受阻。藍領崗位暫時安全,但如果經濟衰退波及整體消費,物流、零售等行業也可能連鎖裁員。4.宏觀經濟影響消費下降 → GDP增速放緩。投資收縮 → 科技、建築、核能等相關行業受影響。可能導致美國經濟進入短暫衰退期,經濟增長動力大幅下降。5.金融市場連鎖反應銀行與投資機構可能面臨壞帳風險,高槓桿科技公司觸發市場恐慌,整體投資者信心下降。不過,AI投資也催生了新的就業機會:資料中心建設、核電產業以及新興AI公司,都創造了大量崗位。這說明,AI並非單純的“失業機器”,而是一場產業結構重塑。對比2000年前的那場網際網路技術泡沫,從經濟規模來看,AI泡沫可能會比網際網路泡沫慘烈 17 倍!如果AI泡沫真的來臨,那些OpenAI和Google的頂級大腦會流向那裡?馬里蘭大學學院公園分校(University of Maryland in College Park)的經濟學家Brent Goldfarb表示,如果AI泡沫破裂,AI研究人員和開發者也會面臨類似的裁員。他認為受影響最大的是一大批一窩蜂湧上AI熱潮的初創公司,比如跟風推出會議記錄、「AI科學家」等AI應用的公司。而OpenAI、Google、輝達以及其他主要AI公司「很可能會活下來」。這些公司最不可能做的事情就是砍掉自己的科學核心,因為這才是通往未來的路徑。目前,在AI領域,無論投資規模還是論文發表量,科技行業都遠遠超過學術界。研究者提出一個現象:「AI人才外流(AI brain drain)」——美國科技行業僱傭了幾乎70%的人工智慧相關領域博士畢業生數量,遠遠超過學術界。這導致了在各類基準測試榜單上名列前茅的最大AI模型中,有90%都是由產業界開發的。2025年的美國裁員潮,讓人們對AI既充滿期待,也感到不安。它帶來了經濟增長的引擎,但也潛藏著泡沫破裂的危機。 (HsuDan)
失衡的烏托邦:Meta的開源AI路線是如何遭遇滑鐵盧的
2025年10月底,Meta AI部門宣佈裁員600個職位,甚至核心部門的研究總監,同時掌管AI業務的高管紛紛離職、被邊緣化,就連圖靈獎得主Yann LeCun也被認為自身難保。一方面祖克柏在用上億美元的年薪挖AI人才,但同時又如此決絕的裁員,這樣割裂的行為背後是因為什麼?於是我們採訪了Meta的前FAIR研究總監AI科學家田淵棟、參與了Llama 3後訓練的前Meta員工Gavin Wang、矽谷資深HR專家以及一些匿名人士,試圖還原一下Meta的Llama開源路線到底發生了什麼:為什麼Llama 3還讓眾人驚豔,而僅一年之後的Llama 4就如此拉胯?中間發生了什麼?Meta的開源路線從一開始就註定是個錯誤嗎?AI大模型激烈對戰的當下,一個烏托邦式的AI研究實驗室還能夠存在嗎?01 FAIR與GenAI的誕生 Meta的AI十年佈局與架構搭建首先來看看Meta對AI佈局的整個公司架構。2013年年底,祖克柏開始搭建Meta的AI團隊。當時,Google收購了Geoffrey Hinton的DNN團隊,將Hinton招入麾下,同一時間,Meta將Yann Lecun請來坐鎮AI的發展。至此,圖靈獎三巨頭的兩位開始步入商業科技來主導AI研發。在祖克柏邀請Yann LeCun加入Meta的時候,後者提過三個條件:1.不從紐約搬走;2.不會辭去在紐約大學的工作;3.必須開展開放的研究,公開發佈所做的所有工作,並將程式碼開源。所以,一開始Meta的路線就是開放原始碼的。Yann LeCun進入Meta之後,開始著手前沿的AI研發,組建了Fundamental AI Research實驗室,也就是大名鼎鼎的FAIR實驗室,主導人工智慧的前沿研究。田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:FAIR是負責前沿研究的,就是做一些現在目前看起來沒有特別大的應用,但是新的想法、新的思路、新的演算法、新的框架、新的模型架構。這樣的探索之後可能會有一些大的突破,大概是這樣的一個邏輯。但是對於Meta來說,最終還是要看到AI在自身產品上的進展。於是和FAIR組平行設定了一個組叫“Generative AI”,簡稱“GenAI”組。這個組裡面分別有不同的功能團隊,包括了Llama開源模型的研發,將AI能力運用到產品上的Meta AI團隊,還有AI算力基建的資料中心團隊,其它的還有一些小部門,比如說Search(搜尋),Enterprise(企業服務),Video-gen(文生視訊)模型等等。GenAI和FAIR是平行關係,這像是一個天平,一邊是前沿科研,一邊是產品化。理想情況下,前沿研究能帶來更好的產品力,而產品賺錢了能讓管理層有更大的動力撥款給FAIR去做研發。田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:比如FAIR會提供一些很好的想法和工作給GenAI去用,讓GenAI把這些想法和工作放進生產,然後在下一代模型中使用出來。很多人的初心就是說想做一些不一樣的東西,或者是與眾不同的方向、工作。能不能真正地實現AGI(通用人工智慧)?這其實是個比較大的問題。陳茜矽谷101聯合創始人:所以FAIR的目的是AGI,但是GenAI它的目的是怎麼把AI放在Meta現有的產品中,讓AI發生效應。田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:對,應該說主要一方面是Llama,Llama是一個很大的模型。還有就是怎麼樣把AI比較好地用在一些具體的應用上。但是,讓這樣的天平始終保持平衡,是一個很理想化的烏托邦狀態。而這個烏托邦狀態的前提是,Meta的AI模型水平一直是要保持最領先的,或者說,至少是在開源賽道最領先,且不落後閉源模型太多的。圖片來源:Meta AI陳茜矽谷101聯合創始人:你覺得在FAIR最快樂的一段時光是什麼時候?田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:我覺得從我入職FAIR之後一直到2022年,這段時間是很開心的。因為大語言模型來了之後,整個生態或者說研究者之間的關係發生了一些變化。因為大語言模型來了之後,算力成了很重要的一個因素。因為算力是有限的,所以就會產生各種問題、各種矛盾。大家都要訓練一個很大的模型,如果是這樣的話,相互之間就開始有一些問題,比如說如果我卡多了,你卡就少了。因為卡不多就沒辦法訓練出很好的模型,所以在2023年之後這段時間之內,狀態肯定不會像以前那麼好。而Meta的AI天平是如何失衡的呢?我們可以從Llama的四代發佈中,看到一些端倪和痕跡。02 “開源之光” Llama的昔日驕傲與滑鐵盧?之所以Meta給自家大語言模型取名“Llama”,據說是因為考慮到Large Language Model的縮寫“LLM”不太好發音,所以就補上了元音字母。“Llama”朗朗上口也便於記憶傳播。也正是這樣,大語言模型命名自此才和“羊駝”扯上了關係。Chapter 2.1 Llama 1:開放原始碼的“種子”我們先來看看Llama 1,這也為Meta的大模型“開源”路線奠定了基礎。2023年2月24日,Meta發佈Llama模型,主打“更小參數更好效果”(多規模:7B/13B/33B/65B),強調當時的13B模型可以在多項基準上超過175B參數的GPT-3。而Llama在官宣之後的一周,權重在4chan上以種子形式被“洩露”,引發了AI社區對開源模型的廣泛討論,甚至還引發國會參議員致信質詢Meta。雖然有不少質疑的聲音,但業界對Llama的“意外洩露”出人意料的支援,而這也被視為“大模型開源”的格局重塑,並且很快催生出了諸多的民間微調項目。我們在這裡稍微解釋一下大模型的“開源”定義。其實Meta也不是完全的開源。Meta稱之為“開放權重”(Open weights)。在機器學習中,有三個部分:結構(architecture),權重(weights)和程式碼(code)。所謂“權重”,就是模型學習到的所有參數數值。模型訓練完成後,所有參數會存成幾個巨大的二進制檔案。每個檔案裡保存著每一層神經網路的矩陣數值。而在推理時,模型程式碼會載入這些權重檔案,用GPU進行矩陣運算生成文字。所以“開放權重”就意味著向公眾提供訓練好的參數檔案,外界可以本地載入、部署和微調,但還不是完全的“開源”,因為真正的開源意味著公開訓練資料、程式碼和許可等等。但Meta並沒有公開這些資訊,甚至之後的Llama2、3、4代都僅僅是開放權重,只是在許可證的政策上有些鬆動。雖然Llama屬於“半開源”,但比起OpenAI,Anthropic和Google完全閉源、只通過API介面來提供模型能力服務的公司來說,已經算給開源社區帶來非常旺盛的生命力了。Chapter 2.2 Llama 2: 開放“可商用”2023年7月28日,Meta聯合微軟發布了大模型Llama 2,包含7B、13B和70B參數的三種參數變體。新一代模型的“開源”雖然也是“開放權重”,但對比Llama 1的不可商用、只能申請研究用途而言,Llama 2是一個免費可商用的版本,更放寬了許可證的權限,而Wired等雜誌更是指出,Llama 2 讓“開放路線”對抗封閉模型巨頭成為現實。而我們看到,Llama 2很快在開發者社區風靡起來,它的可得性顯著放大了生態和AI開發。之後,就到了2024年的Llama 3,這也是Llama系列最為輝煌的時刻。Chapter 2.3 Llama 3系列: 逼近閉源陣營步入Llama3的時代,Meta已經成為AI開源社區的頂流存在。2024年的4月到9月,Meta連發三個版本的模型迭代。2024年4月18日,Meta發佈8B、70B兩個規格的Llama 3版本,稱同等規模“顯著超越Llama 2”,並將其作為Meta AI助手的底座之一。之後的7月23日,Meta推出405B、70B、8B三檔Llama 3.1模型,並宣稱405B是“全球最強的開放可得基礎模型”之一;同時登陸AWS Bedrock、IBM watsonx等平台。僅兩個月之後的2024年9月25日,Meta推出Llama 3.2,主打小而全的多模態,新增1B與3B輕量文字模型與1B與90B的視覺多模態模型,面向終端/邊緣場景;AWS等平台同步接入,開源框架平台OLlama亦可本地運行。我們採訪到了Llama 3團隊的Gavin Wang,他負責Llama 3的後訓練工作,對我們表示當時整個Meta,GenAI團隊是在以“光速”前進,真的有種“AI一天,人間一年”的感覺。Gavin Wang前Meta AI工程師,從事Llama 3後訓練:當時Llama3.1/3.2確實是有很多很好的進展,比如多模態是在這個階段裡面發佈的,包括後面他們做Lightweight model(輕量化模型)1B/3B的。我覺得這時候產品化生態取得了很大進展,很多的社群都有支援,包括我有朋友在Llama Stack團隊,他們就是專門支援整個Llama的生態在企業級或者說小企業級的落地。Llama 3的強勢出擊,特別是450B版本被認為是在模型能力上對閉源陣營的逼近,也被認為將快速推動AI應用的落地。而對於Meta內部員工來說,特別是在Llama組的AI工程師們,這是一件非常讓他們值得驕傲的項目。Gavin Wang前Meta AI工程師,從事Llama 3後訓練:當時的敘事是說,Meta是大廠裡面唯一一個剩下開放原始碼的模型,而且還對整個開源生態很有貢獻。當時我覺得很多人都會覺得,這不僅僅是在做一份工作,而是我們真的就是在支援整個AI的前沿的發展,你做的每一件事情都感覺非常有意義,我當時是非常自豪的感覺。我出去跟別人說,我是在做Llama 3的團隊,一些創業公司的創始人他們都會說:非常感謝你的努力。感覺整個技術圈,尤其是AI創業圈,都在指望Llama。Meta乘著東風,期望Llama 4的發佈,能進一步的擴大自身在AI開發社區的影響力,保持“頂尖大模型中的唯一開源存在”。祖克柏在2025年1月底財報會議後發帖說,“我們對Llama 3的目標是使開源與封閉模型具有競爭力,而我們對Llama 4的目標是領先。”然而,三個月之後的Llama 4發佈,卻是一場徹底的災難和滑鐵盧。Chapter 2.4 Llama 4: 滑鐵盧2025年4月5日,Meta推出Llama 4的兩個版本(Scout與Maverick),宣稱多模態與長上下文能力大幅躍進,並在宣傳中高調引用LMArena排行榜上的領先成績:Maverick版本僅次於Gemini 2.5 Pro,與ChatGPT 4o和Grok 3 Pro並列第二。然而很快,開發者社區的反饋並不正面,認為Llama 4的效果不及預期。市面上開始有流言質疑Meta在LMArena上衝到第二名的版本有作弊嫌疑,懷疑Llama 4給LMArena排名的是經過了最佳化的變體,而這個變體經過了對話強化的訓練,存在誤導LMArena、導致過擬合的現象。雖然Meta高層迅速否認了作弊,但影響迅速發酵,一方面,媒體紛紛將此視為“用特調版本刷榜”的“誘餌換包”(bait-and-switch),行業對基準公信力與可復現性的討論升溫;另一方面,Meta更高端的Behemoth版本推遲發佈,公關與節奏嚴重受挫。截至目前,Behemoth還沒有發佈,Meta應該是放棄了。接下來就是大家所知道的,祖克柏開始孤注一擲的大手筆收購Scale AI,把Alexander Wang挖過來領導新的AI架構,之後用上億美元的支票開始挖人,瘋狂攪局矽谷AI人才市場。再之後就是最近的新聞,Alex開始重組整個Meta的AI架構,裁掉600人。但大家看看這個時間線,是不是還是覺得很割裂,在Llama 3和Llama 4的這一年中,發生了什麼?怎麼Llama 4一下子就不行了?這是不是也太快了。我們通過復盤,也許找到了一些答案。還記得我們在前文提到,Meta內部的AI架構是一架天平嗎?Llama 4失敗的原因就是:這架天平失衡了。03 失衡天平 前沿研究與商業化的路線之爭在Meta的AI架構中,FAIR和GenAI是平行的兩個組,Yann Lecun管FAIR,但Yann LeCun很多時候沉浸在自己的研發中,有時候還在網上跟人,比如說馬斯克對戰,還經常說不看好LLM路線,讓Meta很頭疼。於是,2023年2月,Meta高層把Meta AI的研究負責人Joelle Pineau調到FAIR,擔任FAIR的全球負責人,與Yann LeCun兩人一起領導FAIR。圖片來源:Bussiness Insider而GenAI的負責人是Ahmad Al-Dahle,這個哥們兒之前在蘋果工作了快17年,而祖克柏把他挖過來的原因,就是想把AI和Meta的各種產品結合起來,包括元宇宙,智能眼鏡的AI整合,以及聊天工具meta.ai等等。而就在經歷了Llama 2的成功,公司開始研發Llama 3的過程中,Meta高層越來越強調“要將AI用於自家產品”的屬性。於是我們看到,2024年1月,Meta的AI團隊進行了一次重組,FAIR的兩名負責人開始直接匯報給Meta的CPO(首席產品官)Chris Cox。Gavin Wang前Meta AI工程師,從事Llama 3後訓練:整個Llama 1 ~ 3算是一個時代,大家很瘋狂地在卷scaling law(縮放法則),當時整個行業裡都在追隨基礎模型的能力的提升。大家在探索基礎模型、大語言模型本身的能力的邊界。但是Meta的領導層, 像祖克柏和CPO Chris Cox,他們其實很早就意識到大語言模型的能力能夠落地,能真正為社會產生價值,他們肯定是從產品力上去出發的。所以說當時Llama 2和Llama 3的階段,整個GenAI的核心目標是讓研究成果真正產品化、工程化。也因此就是在最高管理層層面,包括副總裁、高級總監的高層,是由一些之前更多的是產品背景和工程背景的人來領導的。在Llama 3成功推出,Meta高層開始制定Llama 4的路線之際,所有的注意力都放在了與產品結合上,也就是多模態能力,因此忽視了對模型推理能力上的重視。而就在Llama 3到Llama 4的這一年研發過程中,2024年9月12日,OpenAI推出了基於思維鏈的o1系列模型,之後的2024年12月,中國的deepseek開源模型橫空出世,用MOE混合專家架構在保證推理能力的情況下大幅度降低了模型成本。陳茜矽谷101聯合創始人:你在被拉去救火Llama 4之前,手上在研究什麼?田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:我們這邊在做一些關於推理的一些研究。主要是關於思維鏈,包括思維鏈的形態和訓練的方式做了一些研究。o1是去年9月份出來的,其實我們在o1出來之前,就注意到非常長的思維鏈會對整個模型的scaling law(縮放法則)產生影響。圖片來源:arxiv其實FAIR組中,田淵棟等研究員已經在著手思維鏈的研究,但這樣對推理能力的前沿探索並沒有及時傳達到Llama模型的工程上。Gavin Wang前Meta AI工程師,從事Llama 3後訓練:Llama 4規劃的時候,就會感覺到這個地方可能領導層的方向有一些變化。我認為總體來說他們還是想要支援Meta本身重點去推的一些產品,就是Llama本身的生態,多模態肯定是其中的一個重點。但是DeepSeek在1月份的時候橫空出世,它們的推理能力非常的強。推理能力在當時也是討論的其中一個方向,但是因為Meta本身的生態,它們更看重多模態,沒有重點去做推理。但是當DeepSeek出現了以後,那時我實際上已經離開了Llama的團隊,不過據說當時他們有在討論說是不是要重新把推理的地方撿起來,但這個地方可能優先順序上有一些衝突,加上時間也非常的有限,就導致大家加班加點地做了很多的嘗試,非常得忙。我覺得DeepSeek的出現肯定是造成了公司裡面資源還有優先順序管理上的一些混亂。還有一點,我覺得Llama 1~3整個模型的架構和組織的架構,是延續了一開始的設計。但是因為Llama 3的成功,大家就希望Llama 4能夠更進一步,能夠做一些更大的工程。那這個時候可能出現了一些問題,我的觀察就是公司比較高層的,像副總裁、資深總監這個層面,他們很多人是比較傳統的基礎架構、電腦視覺背景,可能自然語言處理背景的都比較少。所以可能他們技術層面對於AI原生技術或者是大語言模型這些東西就沒有一個深度的理解和認識。真正懂行的,可能是下面具體做事的一些博士,尤其是我們非常驕傲的是,華人的博士都是技術非常紮實的。但是他們獲得的話語權,或者說在公司內部的資源沒有那麼多。所以說可能不知什麼緣故就造成一種外行管理內行的一些局面出現。圖片來源:DeepSeek因為OpenAI的o1系列和DeepSeek的出現,讓Meta在2025年年初亂了陣腳。於是,高層臨時讓FAIR的研究團隊去支援Llama 4的研發,或者可以直接說是去“救火”,而這個“救火團隊”就是田淵棟帶隊的。田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:我覺得現在很大的一個教訓就是,做這樣的項目不能讓不懂的人來做整個的領導者或者做整個的規劃。如果有些東西出了問題的話,應該是大家說:ok,我們不能在這個時候發佈,我們再往後拖。應該是採用一種,我拖到什麼時候結束能夠正常運作才發佈的階段。而不能說把deadline先定好,不然的話有很多事情是做不好的。我覺得我們組裡面當時很多人非常累,比如說像我是在加州,因為我有幾個團隊成員在東部時區,他們晚上12點給我打電話,他們那邊已經3點鐘了,還在幹活,所以非常的辛苦。為什麼他們那麼辛苦呢?是因為deadline壓得很緊。比如說我們的deadline就是要計畫在某一天要發佈,項目管理就需要從後往前倒退,然後看2月底或者3月初一定要做什麼事情、3月底要做什麼事情。但如果你在做這些事情的時候,你發現這個模型這方面不行,或者說資料有什麼問題,在這種情況下,我覺得有一個很大的問題就是,你怎麼樣能夠讓大家因為你這句話停下來。就比如說,我說這個資料有問題,不行,我這個資料不能用,我們得換一個資料。那這樣的話就多出事了,我們得把整個事情往後延一個星期、兩個星期。但這個事情能不能做到是一個很大的問題。如果在很強的deadline壓力之下,最後結果就是這事情做不了,或者說大家沒有辦法去提出異議,那這樣的話最後的質量就會變得很差。這是一個比較大的問題。陳茜矽谷101聯合創始人:為什麼Meta會有那麼強的壓力在deadline上面呢?因為開源模型,其實它已經是第一了。當然,DeepSeek在年初的時候出來,大家都沒有意料的到。但是為什麼它有那麼強的deadline說我一定要在這個時候把這個東西推出來?田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:應該說有個上面高層定下的deadline,但這個我就不方便說了,可能能你要去問一下相關的人,懂的都懂。圖片來源:Meta我們在這裡基本上能有一些答案了,從Llama 3開始,“將AI產品化”這樣的路線就已經制定,整個模型注重多模態和應用、忙於整合應用和業務,但卻忽略了推理和更前沿的技術研發。這讓天平另一邊的FAIR團隊不得不跨組來“救火”,就這樣,天平失衡了。田淵棟前Meta基礎AI研究(FAIR)團隊研究總監:但實際情況其實是因為前沿模型的競爭太激烈了,所以基本上很難真的去用FAIR這邊的一些文章。雖然有些文章是被用到了,但是我們在交流的過程中還是會存在一些問題。我當時就是在FAIR的時候,我有時候Ping(發資訊給)GenAI的人,他們都不理我,這是什麼情況?但是真的我去了GenAI之後我會覺得,確實我也沒法理他們(FAIR研究員們)。因為太忙了,比如說我半小時不看手機,可能就有20條、30條的消息要去看,有很多的人要找,有很多的事情要決定。所以我也能理解了,在GenAI這樣的環境下,很難有比較長期的思考過程。而祖克柏是如何修復這個失衡的天平呢?他直接空降了一個特種部隊:由Alex Wang帶隊的TBD團隊。04 空降“新王” 28歲Alex Wang獲“無限特權”Meta的AI業務架構如今再一次重組之後,高層也經歷了一系列的動盪。Alex Wang帶領幾十位高薪聘請來的頂級研究員,單獨成立了這個在Meta內部擁有無限特權和優先順序別的特別小組TBD。TBD,FAIR和GenAI一起組成Meta Superintelligence Labs(MSL部門),直接匯報給Alex,而Alex直接匯報給祖克柏。這也意味著,FAIR的Yann LeCun如今也匯報給Alex,而Joelle Pineau此前被要求匯報給GenAI組的負責人Ahmad。我們看到,Joelle已經在今年5月離職,去了Cohere做首席AI官;而Ahmad說實話已經很久沒有什麼聲音了,也沒有被任命負責任何重要的項目;而CPO Chris Cox也被Alex搶了風頭,排除在了AI團隊的直接領導者之外。所以現在的架構就是,28歲的Alex一人獨大的局面。我們聽到過Meta內部各種對Alex和他領導的這支極度有特權小組的不滿,包括TBD團隊裡的人可以三年不用做績效考評、可以不理不回其它任何VP的資訊、Meta AI的所有paper都要給TBD裡面的人去稽核才能給發表。要知道,TBD裡面不少人比較年輕,這是讓很多資深的研究員非常不滿, 反正就是各種內部政治鬥爭感覺又要起來一波。但不可否認的是,特權的等號後面是成績。這個成績對於祖克柏來說,不僅僅是Make Llama Great Again(讓Meta再次偉大),而是“Meta has to win”(Meta必須贏)。在這場AI競賽中,目前的這場重組,也許對於祖克柏來說是最後的一次,也是最重要的機會。而Alex在團隊內部郵件中就寫到他將做出的三個改變:1.集中TBD和FAIR團隊的核心基礎研究力量;2.提升產品和應用研發的融合、且繼續以產品為模型聚焦點;3.成立一個核心基建團隊來支援研究押注。Tom Zhang矽谷資深人才專家:第一條就是把基礎研究、TBD Lab和FAIR更集中化,就讓它兩個更緊密的去結合。所以這回裁掉的一些研究人員,郵件上也說,可能他們的項目沒有那麼高的影響力。你再做一些前沿的研究,但和我們現在沒有關係,因為很多前沿研究是高度抽象的,是從數學的角度,從很多理論的角度,它其實和工程的離得比較遠。第二個就是把產品和模型更緊密地結合,和Alex Wang一起進來的人,有一個就是GitHub的原來CEO。等於祖克柏同時引進了兩個高端人才,一個是Alex Wang,統一來說就是管模型的;一個GitHub前CEO Nat Friedman,他是偏產品的,因為產品才能給這個模型更好的反饋,在用的過程中進行飛輪效應。第三條是組建一個統一的核心基礎設施(Infra)團隊,就把管卡的資料中心團隊更集中化。過去很可能是很散的,好幾個領導都在,你要卡你得來申請。現在卡這個事也是統一來管理。所以這個郵件寫得還是挺清楚的。而Alex能否撐得起祖克柏的押注呢,也許很快我們就會有答案。圖片來源:Bussiness Insider總結一下,Meta在Llama前三代都還是領先的開源模型,引領著開源派去對抗OpenAI和GoogleGemini這樣的閉源派。然而,在Llama 3大獲成功之後,公司高層急於將AI結合產品化,在規劃路線的時候用“產品驅動研發”的思維,將Llama 4的升級聚焦在多模態等工程性能上,但卻錯失了思維鏈(CoT)等推理上的前沿技術時間優勢。雖然當時田淵棟等FAIR的AI科學家已經在研究CoT了,等DeepSeek引發轟動之後,又將FAIR的田淵棟團隊臨時救火最佳化Llama 4上的MoE架構,反而又中斷了CoT和推理上的研發,導致AI前沿技術研究和產品工程這架天平徹底失衡。在採訪過程中,我腦中不止一次閃過歷史上那些閃耀一時的前沿實驗室:貝爾實驗室、IBM Watson Research、HP實驗室等等,但基本都因為無法平衡前沿科研和商業化而日益衰落,十多年歷史的FAIR,曾經是一群理想化AI科學家的烏托邦之地,而如今又成了另一個商業化的犧牲品。你認為這場由Llama 4失敗引發的大重組,是Meta AI的最後機會嗎?歡迎在評論區留言告訴我們。 (矽谷101)
矽谷今夜學中文! Cursor被曝「套殼」中國製造,AI頂級人才全是華人
矽谷AI圈最近魔幻事件,不會中文進不了AI核心小組。開完會,全說漢語,老外懵了!連模型在思考時,也在說中文~如果你有在關注最近矽谷的AI圈子,你會發現最近出現一個神奇的現象。當中國都在學英文看文獻的時候,國外的AI圈都說中文了!簡直是倒反天罡。以Meta為例,如果你不會中文,都混不進核心團隊。正式開會說英文,散會後大家集體用中文嘮嗑。現在換老外懵圈了!前幾周OpenAI一個會議,一進門,三百人的會場整個左小半邊都是華人。更有趣的是,當華人成為AI頂尖人才的認證標籤後,連中國的開源模式也被老外偷師。海外模型「偷師」傳說Cursor最近剛發布2.0版本,並推出了他們的第一個自研模型Composer。但很快打臉就來了,網友發現Composer動不動就給他「說中文」。在包裹的思考過程中,Cursor這個所謂的自研模型說的都是中文。這讓老外再一次懵B。最有趣的是Windsurf,直接承認自己拿著GLM-4.6的定製版本進行微調和強化學習。除了「頂級AI人才說中文」和「模型用中國開源大模型微調」這兩個主動選擇,現在連一些大佬都開始放棄OpenAI和Anthropic而被動選擇中國的開源模型。為什麼?因為模型量大管飽,性能還好,還便宜。最近一個消息真的讓我們感覺老外現在不僅不迷信OpenAI等閉源模型,而且紛紛開始選擇中國的模型了。例如Chamath Palihapitiya表示,他的團隊將大量工作負載遷移到了Kimi K2,因為它的效能顯著更好,而且比OpenAI和Anthropic 都便宜得多。這哥們是美國知名的企業家和投資人,他的聲明還是能夠說明一個問題:中國開源大模型,是真的香!不過評論區還是有些冷靜的聲音,說這哥們早期投資了Groq(不是馬斯克那個Grok)。而這次他們團隊從Bedrock(據說是前20大客戶)遷移到Groq上的Kimi K2,因為模型的效能更優!但背後其實可能為了宣傳Groq的服務。這次Cursor為什麼在思考過程頻繁「說中文」,網友們也總結出兩個主要原因:1. 自研難度與成本過高。以Cursor的資源體積,從零預訓練一套強模型的可能性很小,更像是在開源的SOTA智能體模型上做二次訓練;因此出現「說中文」的情況並不奇怪,這更像是底座與訓練資料選擇的結果。2. Composer的滯後與避戰。Composer大機率是用「幾個月前」的開源SOTA做微調,但大模型迭代極快:等推向市場時底層已落後。於是既不願與當下最新的開源SOTA正面對比,又對底層細節諱莫如深;即便融資可觀,仍難擺脫「更多是個殼子」的質疑。總之還是一句話,中國的開源模型,真香。從國外數據網站的統計數據就能看出來。在能力這塊,中國開源穩居第一梯隊在Artificial Analysis Intelligence指數榜單上,除了排在前幾名是閉源的OpenAI的GPT-5、Google的Gemini 2.5、xAI的Grok、Anthropic的Claude 4.5以外,緊隨其後的都是開源模型。而且,大部分都是中國模型:MiniMax-M2、DeepSeek-V3.1、Qwen3-235B-A22B、GLM-4.6、Kimi K2。而開源老祖Meta的Llama,以及相關的微調版本,都得排到他們後邊。而在Coding指數榜單上,依然如此,DeepSeek V3.1要比Google的Gemini 2.5 Pro還要好。智能體榜單上,Kimi、GLM和Qwen也排到了前面。如果按照開源和閉源劃分,全球AI模型的能力中,開源真的很能打。不要忘了,這只是能力榜單,如果再考慮中國開源模型的價格,確實就真香了。在隨著時間,AI能力增長這件事上,雖然OpenAI一直遙遙領先,但MiniMax、DeepSeek、Qwen、GLM、Kimi追改的速度一點都沒有落下。這波AI浪潮,不僅改變了世界科技的走向,甚至對於人才標籤的認知也同樣被改寫。說起來,能把單一頂尖人才的薪水公開喊價到上億美金,也就是前段時間Meta的祖克柏首創的。矽谷頂級華人有那些?首先是Meta。在剛組成幾個月的超級智慧實驗室(Meta Superintelligence Labs)中,最初的44人團隊裡差不多有一半都是華人。其中,趙晟佳和後來加入的宋颺,分別擔任首席科學家和研究負責人。MSL首席科學家,趙晟佳(Shengjia Zhao)。趙晟佳本科畢業於清華大學,史丹佛大學電腦科學博士學位。2022年6月畢業後就加入了OpenAI技術團隊。工作經驗僅有3年的他,履歷上已有了多項輝煌戰果。還在OpenAI時,他是多項里程碑突破背後的關鍵人物。引爆全球AI浪潮的ChatGPT的初始團隊成員GPT-4的核心貢獻者OpenAI首個AI推理模型o1的核心研究員,與OpenAI聯合創始人Ilya Sutskever一同被列為「奠基貢獻者」深度參與mini系列的構建,包括4.1和o3負責OpenAI合成資料團隊作為開啟AI「思考」能力的第一個推理模型,o1的成功,直接推動了整個產業在「思維鏈」技術上的發展熱潮。延伸閱讀:清華校友趙晟佳,出任Meta超級智慧首席科學家! GPT-4核心功臣MSL研究負責人,宋颮(Yang Song)。宋颮本科就讀於清華大學數理基礎科學班,博士畢業於史丹佛電腦科學專業,研究方向聚焦生成模型與多模態推理。在學術界,他以「擴散模型」研究聞名,是該領域的技術奠基者之一。他曾在Google大腦、Uber ATG、微軟研究院等機構實習,擁有豐富的工業與理論背景。2022年加入OpenAI後,他組成「策略探索」團隊,圍繞更大規模、更複雜數據、更高維模態進行方法論探索與系統落地。擴展閱讀:突發! Meta剛從OpenAI挖走了清華校友宋颮比起Meta,OpenAI團隊裡的華人其實更多。每逢重磅發布,從長長的貢獻者名單到直播現場,都少不了華人科學家的身影。不過,擔任高階主管職位的,就只有首席研究官陳信翰(Mark Chen)了。陳信翰的母親邱瀞德是台灣清華大學教授,現任資訊系統與應用研究所所長;父親陳建任曾任亞光電董事長。他高中時曾隨家人從美國回台。在新竹實驗中學的雙語部就讀時,他接連在數學競賽AMC10、AMC12和AIME中取得滿分,並憑此優異成績進入麻省理工學院(MIT)。在MIT獲得數學和電腦科學雙學位後,陳信翰進入一家自營交易公司從事量化投資工作,負責為股票和期貨開發機器學習演算法。在OpenAI的七年時間裡,陳信翰從研究科學家逐步晉升為首席研究官,負責模型開發和公司整體研究工作。在此期間,他領導了多項里程碑式的項目,包括o1系推理模型、文字到圖像模型DALL-E,以及融入視覺感知的GPT-4等等。值得一提的是,剛以突破性進展登上Nature封面的Google量子人工智慧團隊,他們的處理器總監Yu Chen也是華人。Yu Chen先後在中國科學技術大學取得物理學理學士學位,並在明尼蘇達大學取得凝聚態物理學博士學位。在加州大學聖塔芭芭拉分校做了4年博士後研究後,他於2014年加入Google,擔任量子研究科學家。除了這些AI頂尖人才,還有很多耳熟能詳的華人大佬。例如輝達的CEO 黃仁勳、AMD的CEO 蘇姿丰、英特爾的陳立武等等。開源「電廠」,好用又便宜除了人才和模型訓練,許多提供API的平台公司,也紛紛連結中國的開源模型。例如Vercel的老闆Guillermo Rauch就表示,鑑於GLM-4.6的出色表現,「在nextjs.org/evals中排名第三,並且是前五名中唯一的開源模型」。現在,他們不僅提供GLM-4.6的API服務,而且價格也是最低的。10月22日,Airbnb CEO Brian Chesky在訪談中表示,Airbnb的客服AI現在由13個模型組成。關鍵是,他公開承認Airbnb「在很大程度上依賴Qwen來支援AI客服。」甚至表示Qwen比OpenAI的產品更好更便宜。除了這些平台類公司無需開發基礎以外,像Cursor這種一直被喊套殼的公司,想要從零開始預訓練一個模型花費不菲,而且是針對Coding領域的特定模型,純粹預訓練得不償失,那該在怎麼辦?就像網友說的,最好的方法就是找一個開源模型去微調。那現在全世界開源領域最好的模型也就是中國耳熟能詳的那幾家了。而且不僅開源,而且開源選擇的協定都是最友善的。網友們還在Windsurf中直給提問,你是誰,誰開發了你?Windsurf的模型直接回答我就是「GLM」~如果說AI是新時代的電力,那麼以上這些跡象正在表明,我們正在從「世界工廠」轉變為AI的「世界電廠」。透過開源,我們正在搶佔全球AI時代的基礎設施定義權。當一個開源的中國模型能提供80%的效能,而成本只有20%時,選擇是顯而易見的。當這個模型能提供100%甚至110%的效能(如DeepSeek-V3.1在編碼上的表現),而成本依然低廉時,它就從「備選項」變成「最優解」。Cursor被網友抓包時的尷尬,恰恰揭露了矽谷開發者的一種矛盾心態:身體可能很誠實地擁抱中國模型,但在宣傳上仍試圖維持「矽谷原創」的政治正確。最後總結一下,「倒反天罡」的不僅是AI人才中華人的佔比,更重要的技術流向。當矽谷的工程師們為了優化成本和性能,不得不開始研究GLM和Qwen的文檔時,這場關於下一代AI技術浪潮的牌局,才算真正進入了最精彩的下半場。One More Thing不過我們也不能「高興」太早,在AI領域的人才上,華人現在一種標籤。但是,如果看看各大科技公司的CEO,你會發現,印度老哥們也不甘示弱。例如Google的CEO劈柴哥,Sundar Pichai。例如微軟的CEO,納德拉Satya Nadella。例如IBM的CEO,Arvind Krishna。例如Adobe的CEO,Shantanu Narayen。例如霍尼韋爾的CEO,Vimal Kapur。以上這些CEO們都是印度老哥,其中不乏AI科技領域的掌舵人,例如劈柴哥和納德拉。參考資料:https://x.com/FuSheng_0306/status/1983894938669433044https://x.com/auchenberg/status/1983901551048470974https://x.com/AI_Whisper_X/status/1983819229737652336https://x.com/artificialanlys/status/1983915999998230932 (新智元)
下一個300萬!全球AI人才爭奪戰,中國的“機會窗口”來了?
國際金融論壇(IFF)今年7月發佈的報告顯示,全球AI人才總量約300萬人,其中美國佔約三分之一,中國佔比22.4%,排名第二。更為驚人的的是,目前在中國內地工作的AI人才中,高達42%擁有美國的工作或學習經歷。然而,矽谷正經歷一場特殊的人才遷徙——中國AI科學家在美國完成技術積累後加速回流。資料顯示,2023年已有47位美企華人AI專家回國創業,較2022年增長62%。而根據媒體統計,自2024年開始,大批來自中國的世界頂尖科學家回國任職。包括,普林斯頓核聚變專家劉暢和美國埃默裡大學教授胡懿娟回歸北京大學,電腦科學家和區塊鏈專家陳婧回到母校清華大學任教,多模態人工智慧大咖齊國君紮根西湖大學,AI製藥領域重量級學者符天凡加盟南京大學電腦學院,劍橋大學卡文迪許實驗室博士後潘林楓加盟上海交通大學,癌症科學家孫少聰加盟首都醫科大學,美國國家工程院院士陳滬東落地浙江大學能源工程學院等等。最近一例頗為引人注目的無疑就是,全球頂尖AI科學家、IEEE Fellow許主洪(Steven Hoi)已加盟阿里通義,轉向通義大模型的相關研發工作。許主洪擁有超20年AI產業和學術經驗,是新加坡管理大學終身教授、曾任新加坡南洋理工大學終身副教授,在AI領域發表了300多篇頂級學術論文,論文被引用超過5萬次,曾被史丹佛大學評為全球頂尖1%的AI科學家之一。在此之前,另一位全球AI產業轟動的是來自Deepseek的潘梓正了。前輝達實習生,在2023年夏天毅然放棄了美國的機會,選擇加入北京的DeepSeek。當時深度求索團隊僅有3名成員,潘梓正成為公司的第四名員工。後來,他成為DeepSeek-R1模型的關鍵開發者之一。這讓哈佛大學教授格雷厄姆·艾利森也不得不感嘆,美國錯失了這位AI領域的“錢學森”。如上所述頂尖科學人才的回歸並非個例,已初步形成一種潮流。這一方面是由於美國科技裁員潮迫使華人科技精英另尋出路,尤其是川普上台之後大幅削減科研經費以及不友好的簽證政策更起到一種推波助燃的作用。根據《自然》雜誌日前發佈的一項資料:在接受調查的美國科學家中,有75%的人表示正在考慮離開美國。與此同時,中國對包括海外華人在內的科研人員吸引力越來越大。根據官方資料顯示,中國每年投入的研究與試驗發展(R&D)經費自2020年以來增長近40倍。2024年中國研發經費投入超過3.6兆元人民幣,同比增加8.3%。目前研發經費總量僅次於美國,位居全球第二。更重要的是,隨著中國科技產業的蓬勃發展,尤其是人工智慧、自動駕駛、機器人等產業需求的落地,這為技術的商業化提供了廣闊的天地,也為參與的科技人員提供了豐厚的經濟回報。如中國AI公司不僅給予頂尖技術人才高額的薪資,同時給予股權激烈,綜合下來,其回報將是美國同崗位的3倍以上。這也造就了中國史上最大的留學生“歸國潮”。如2023年歸國的留學生突破30萬人,是近十年來的歷史新高;不僅如此歸國留學生中大部分簡歷都想當硬核,有麻省理工、史丹佛博士後;也有Google、Meta、輝達的高級工程師等。這令美國專家不得不發出警告:“中國人才是美國ai的秘密武器,美國將無人可用!”根據國際金融論壇的報告預測,到2030年底,全球AI人才增長量將達280萬人以上,五年時間實現接近100%的增長。如上所述,種種跡象表明,這場全球化的人才爭奪戰才剛剛開始。在美國愈發封閉的人才政策的當下,中國以全球科技產業最大“試驗場”的獨特優勢正吸引越來越多科技人才的加入,尤其是尖端的AI人才!可以說,這場橫跨太平洋的AI人才遷徙,正在重塑全球技術競爭格局。 (飆叔科技洞察)
這些年輕科學家不再滿足於“追趕美國”
在很長一段時間裡,矽谷是全球AI人才的終點站。而中國曾是最大的人才輸出地,把一代又一代頂尖AI人才送往彼岸。如今,這種單向流動正在悄然轉向。Digital Science的一份報告指出,美國已經開始對中國出現AI人才淨流出的趨勢。優秀的青年學者,正在以更快的速度選擇回到中國[1]。來自史丹佛大學的另一份報告則提出,美國已經不再是AI人才的首選目的地。“美國的高校和研究機構現在更像一個人才跳板,美國提供了高水平的資源、經驗和人脈,但最終這些積累被帶回中國,成為支撐本土AI領域發展的一部分”。[2]過去十年,中國AI研究人員從不到10000人,增加到52,000人,平均每年以近30%的速度擴張。更重要的是,他們多數還不到三十五歲,卻已頻繁出現在NeurIPS、CVPR等國際頂會上。一個龐大、年輕且充滿銳氣的人才群體正在成形。“青年科學家正在成為新一輪科技發展的主角,我們要把聚光燈給到他們,提供更多的資源幫助他們,”在外灘大會的第二屆螞蟻InTech科技獎頒獎現場,螞蟻集團副總裁、首席技術官何征宇如是說。在去年螞蟻集團20周年之際,首次發起了面向學術界的螞蟻InTech科技獎,希望發掘並支援那些在中國電腦以及交叉學科領域的優秀青年學者,尤其是那些對推動關鍵技術發展具有重要貢獻的青年學者。今年的螞蟻InTech科技獎又全面升級,除了繼續遴選10位青年學者,提供20萬元/人的“科技獎”資助外,還首次增設了5萬元/人的博士生“獎學金”,提供對“青年學者-博士生”的全周期支援。本屆整體參評規模達去年3倍,海外申報者佔比超20%,其中包括牛津、耶魯、史丹佛等高校。最後的獲獎學者中,不少有海外經歷,他們帶著在頂尖實驗室錘煉出的經驗從海外歸來,把更鋒利的方法投向中國這個更複雜、更火熱的現場,去解決那些真正棘手的根本性問題,並在這裡規劃自己更長遠的藍圖。01. 無人區的探索第二屆螞蟻InTech科技獎得主、南京大學電腦學院教授王利民從蘇黎世聯邦理工學院回國之後,致力於開發一個完全由視訊大模型驅動的自動駕駛系統:車上的攝影機源源不斷輸入畫面,模型即時完成感知、預測與決策。他希望這一模式能替代傳統的模組化系統,成為車輛的大腦,從根本上提升自動駕駛的安全性。在人工智慧的諸多賽道里,視訊大模型一直是最難啃的骨頭。文字可以拆成詞,圖像是靜止的畫面,而視訊意味著連續不斷的洪流。機器要在這股洪流裡,不僅識別一個動作、一張畫面,還要理解前後關係,甚至預測接下來會發生什麼。在全球範圍內,這一方向長期缺乏成熟的框架,幾乎沒有可供借鑑的路徑。王利民和團隊選擇在無人區起跑,推出了國內首個大規模視訊理解基礎模型InternVideo。在全球AI研究的坐標系裡,InternVideo的出現意味著一個新的議題由中國學者提出並推動。“這是一個有前瞻性的選擇。”王利民回憶,當時他們在世界範圍內幾乎沒有可以借鑑的路徑,只能自己摸索著向前。也正因為如此,InternVideo才能在推出後迅速成為全球參照,被NVIDIA推出了COSMOS世界模型作為資料引擎關鍵技術使用,並被圖靈獎得主楊立昆在提出V-JEPA世界模型時多次拿來對比。在電腦視覺之外,還有一種更科幻的感知方式,第六感。不靠攝影機,而用空氣裡的無線電波看見世界,這種聽起來像古早科幻小說設想的技術,現在其實已經落地。它的大名叫做無線感知,但第二屆螞蟻InTech科技獎得主、北京航空航天大學的張扶桑教授喜歡叫它第六感,這項技術所做到的,正是調動人類五感察覺之外,WiFi、4G/5G這類本就無處不在的訊號,識別呼吸、心跳、跌倒與動作。這條路徑的優勢,在於天然的非侵擾。許多家居與養老場景,尤其是衛生間,並不適合安裝攝影機,而無線感知只需要一個嵌入路由器或浴霸的小模組,就能完成無接觸監測。如果把感知模組裝上機器人或無人機,還能實現全天候看護。家中摔倒的老人、可能被遺落在車後座的孩子,他們的安全都可以由這只看不見的手來保護。“如果為機器人配備這種感知能力,它將能夠超越人類自身的感知極限,在眾多工中提供更高效的服務,未來的應用前景極為廣闊,”張扶桑表示。然而,這一領域也面臨著巨大挑戰。無線訊號最初並非為感知而設計,其本身複雜且容易受到干擾,要從中提取出穩定、可用的規律,對精度提出了極高要求。更重要的是,無線感知作為一個研究方向,從興起到現在不過十年左右,許多基礎理論仍屬空白,需要從零開始探索。在這片“無人區”中,張扶桑提出了無線感知模型,成功量化了電磁波受人體和環境影響的機制,並解答了諸如感知極限與穩定性等一系列根本性問題。該理論被國際同行譽為“里程碑式的工作”,並被納入全球首部無線感知專著。張扶桑表示:“目前我們已經與國際頂尖團隊並跑,甚至在若干方向上實現了領先。”無線感知不僅是一項科研突破,更將成為未來通訊基礎設施的重要組成部分。6G已將“通訊感知一體化”列為核心特性,這意味著感知能力將與通訊功能一樣,成為下一代網路的基本配置。張扶桑的目標是將這一能力深度融入未來的標準體系,助力中國在全球6G競爭中佔據關鍵地位。在張扶桑眼裡,這一代青年科學家展現出持續迸發的潛力與創新活力,因此對他們給予充分的支援與激勵至關重要。“與早年條件有限的情況不同,如今的青年科學家從一開始就具備國際視野,同時充滿獨特的想像力和創造力。”這正是螞蟻InTech科技獎關注的重點。不僅僅獎勵已經完成的成果,更在意的是它們所釋放出的未來潛力。一種技術如何被應用,如何推動行業前進,如何在下一輪競爭中形成突破。這些,才是評審最看重的部分。螞蟻集團副總裁、首席技術官何征宇說,螞蟻集團非常注重多元化的青年人才生態,已經與清華大學、浙江大學十余所高校成立了聯合實驗室,與北京大學、上海交通大學開展了系統的人才培養項目,與多個學術組織連續五年推出了科研基金。這些舉措的目的只有一個——讓有志於科研的人才有更多實踐、轉化的機會,讓更多科研成果更快走向社會,服務民生。“科技的發展從來不是孤立的,相信用技術去推動應用的發展,最終實現技術普惠,為每個人帶來生活的便利,是我們不變的願景。”02. 向心力一種新的、圍繞著中國AI場景的向心力正在形成。2025年7月,中國投資和技術促進辦公室(ITPO China,隸屬聯合國工業發展組織)發佈的報告顯示,全球AI人才的格局,正在發生結構性重組。研究團隊分析了2015年至2024年間20萬名研究人員撰寫的9.6萬篇AI學術論文,並據此繪製出人才版圖。中國的AI研究人員,從2015年的不足萬人,增長到2024年的5.2萬人,年復合增速高達28.7%。這一規模已接近美國的6.3萬人。更值得注意的是,中國AI人才的增長幾乎完全由博士和博士後群體驅動,構成了一個龐大、年輕、受過高等教育的AI人才庫[3]。除了留學歸國的年輕AI學者,本土培養的力量同樣不可小覷。史丹佛大學與胡佛研究所聯合發佈的調查發現:DeepSeek的研究人員中,超過一半沒有學習和留學的經驗[4]。正因如此,Digital Science的報告做出了大膽的預言,“考慮到擁有一個年輕、充滿活力且受過高等教育、具備AI素養的勞動力群體,我們應預期中國將湧現一波與DeepSeek類似的創新浪潮[5]。”在哈佛醫學院的八年裡,張帆逐漸成為瀰散磁共振(dMRI)研究領域的關鍵人物。他研發的開源平台SlicerDMRI,已成為全球腦影像研究和臨床實踐的重要工具,國際醫學資料庫ExpertScape將他評為dMRI 領域全球前1%專家。回到電子科技大學後,他利用AI深度學習演算法,通過影像技術建構出腦神經纖維的分佈,又把原本需要1個多小時的腦神經纖維提取工作,縮短到了幾分鐘內即可完成,極大的提升了效率和精度。在臨床治療領域,該技術能夠幫助一些需要急救的病人——比如腦出血的患者——快速完成影像腦神經纖維的快速提取。對於醫療資源匱乏的地區,這項技術能夠有望幫助醫生縮短診斷時間,為搶救爭取黃金窗口期。這位第二屆螞蟻InTech科技獎得主說,“十幾年前,我讀博時出國參加會議,更多是去學習,會場上主要的聲音都來自海外學者。但現在完全不同了,很多研究是我們在引領,海外學者會主動來合作。”過去十年,中國的AI學者更多處在追隨的位置,正是他們的快速成長,讓中國AI的追趕顯得格外突出。今天,他們已經從追趕轉向自主創新,開始在部分方向上定義議題、引領合作。青年科研力量正在改變未來的走向,他們既是在縮小差距的一代,也是要去定義新議題的一代。螞蟻InTech科技獎得主、上海交通大學人工智慧學院助理教授、上海創智學院全時導師李永露用“勢能”和“動能”來形容中美AI發展的關係。他認為,北美在AI方向憑著深厚積累,具備足夠的“勢能”。但隨著更多年輕學者的成長,中國同樣展現出巨大的潛力與發展“動能”。在攻讀博士時,他觀察到實驗室裡的機器人演算法在固定場景中動作準確,但一旦換一個杯子的形狀、在地板上多一些水漬,就會立刻出錯。幾十年來,機器人始終缺乏泛化能力,它們無法像人一樣,在陌生環境中靈活應對。這種困境促使他提出一個形象的比喻:培養機器人,就像培養一個孩子。小孩先學會模仿,再通過不斷嘗試和糾正獲得新技能。為此,他和團隊建構了首個結構化人類行為知識引擎,把2000萬條人體—物體互動狀態和381種物體屬性歸納為可遷移的知識規則,為機器人“上學”提供教材。他建構的行為知識引擎,被圖靈獎得主Yoshua Bengio在多模態學習相關論文中引用。2025年,他作為獨立通訊作者獲得ICRA HRI最佳論文獎,與來自MIT、史丹佛、Google、NVIDIA的團隊同台競爭。“我們希望AI能像人一樣,從複雜物理世界中抽象出規律、價值觀甚至美學”,李永露說,“在這個過程中能留下一個里程碑,那怕只是墊腳石,也算推動了這個時代”。在螞蟻InTech科技獎的頒獎現場,身在美國的圖靈獎得主傑克•唐家拉也通過視訊告訴這些來自中國的年輕科學家,“科研之路並非一帆風順,但註定會極有收穫”,並勉勵獲獎的年輕科學家們“大膽一點,忠於本心,要相信你們的研究能夠改變世界,定義未來”。03. 在這裡,你幾乎可以買到任何零件“在中國,你幾乎能夠買到任何機器人零件,而且都比國外便宜”,李永露這樣提到回國做研究的體驗。李永露所從事的是具身智能研究,經常需要去裝配、改造機器人,此時,擁有完備的硬體產業鏈的中國就展現出了“巨大優勢”。在中國,李永露幾乎沒有體驗過為了一個零件排隊很久的情況,很多機器人研究者在國外做研究時需要等很久的昂貴零件,在國內很容易就能找到便宜的“平替”了。得益於低廉的製造成本和更易實現規模化應用的廣闊市場,“中國在產業鏈完備性以及綜合性研究落地方面具有明顯優勢”,張扶桑教授向《知識分子》表示。在無線感知這一研究領域中,國外的研發工作雖然較為深入,但主要集中在醫療領域。相比之下,中國的應用場景則更為多元。除了醫療,從提升安全性的無人駕駛技術,到可實現“出風避人”的智能空調,相關研究覆蓋廣泛。“國內相關產業不僅數量眾多,而且發展熱情高漲。”張扶桑進一步解釋道,美國在演算法等基礎技術方面依然領先,而中國憑藉豐富的行業需求,為技術提供了真實的測試環境和持續最佳化的機會,從而加速了產品的成熟與完善——這也正是他在中國從事無線感知研究過程中所切身感受到的優勢。這位年輕科學家甚至認為:“也許就像當年的電商行業,技術或許起源於歐美,但我們在及時配送的時效性、貨物的種類齊全程度上,如今已經遠遠超越了歐美。”而對於電子科技大學的年輕教授張帆而言,在中國,他體會到的巨大優勢首先來自這裡豐富的資料。張帆所從事的是數字醫學研究,回國前,他曾在哈佛醫學院工作過8年,回國後,他發現“國內的資料採集速度完全不一樣”,在哈佛醫學院的附屬醫院,對於某種特定類型的腫瘤手術,他們一年只能積累幾十個病例,但在國內,幾個醫院聯合起來,幾乎只要幾周就能達到這個資料量……張帆感嘆,中國龐大的醫院網路、海量的病人、以及極其多樣的疾病類型,為AI醫療影像和資料分析的研究建立了一個非常好的資料基礎。“正常來說,可能需要10幾年才能達到歐美目前的水平,但憑藉這些優勢,中國很有可能用5年就能達到他們同等等級的技術水平。”張帆則告訴《知識分子》,在中國做醫療AI,不僅沒有美國的繁瑣流程,還有來自國家、科研機構和企業等多方的支援和鼓勵。“我現在在研的國家級項目,既有國家自然科學基金委的,也有國家科技部的。就在最近,我們還獲批了一個校級的醫工交叉項目,是和四川省人民醫院合作的……國家層面還有專門針對AI+的政策傾向和專項支援。國務院最近發文,專門支援AI技術本身的發展以及它與其他領域的交叉融合。基金委和科技部等資助機構也都有AI相關的專項,去支援從事AI研究的學者,把技術應用到各個層面。”當然,還有來自螞蟻集團這樣的企業資助和獎勵,螞蟻的InTech科技獎20萬元的資助也許不算最多的,有時候也能成為一次關鍵實驗、一台急需裝置的轉折點。李永露想用這筆獎金購買一台機器人;而王利民改善一下自己的科研條件,暫時解決一下目前算力不足的問題;張帆更是覺得,有助於推動學術成果的落地,他整在考慮把獎金用於科研成果的實際轉化。這些鬆綁與支援的結果便是,“目前,國內一個很顯著的特點,就是我們這些做醫療AI的學者和產業界的聯絡非常緊密。現在很多實驗室裡的技術,能非常快地落地成為產品。現在去醫院,會發現很多診療系統背後都有中國公司在支撐……”張帆說。04. 長期承諾在世界科技強國中,企業成為基礎研究的重要資助者,已是大勢所趨。換言之,基礎研究不僅需要公共財政的托底,也需要來自產業與社會的長期承諾。2021年美國國家科學和工程統計中心(NCSES) 的資料顯示,當年美國聯邦政府提供了40%的基礎研究資助,而企業提供了36%,幾乎是同樣重要。相比之下,中國的格局仍然相對單一:2020年,國內92% 以上的基礎研究經費來自政府,企業的貢獻僅為4%。2018年,《國務院關於全面加強基礎研究的若干意見》就提出,要通過稅收槓桿、共建研發機構、聯合資助、慈善捐贈等方式,引導企業和社會力量加大投入[6]。自2018年開始,騰訊的科學探索獎,阿里的青橙獎等多個民間資助項目開始探索社會力量對科研的資助。這不僅是一種榮譽象徵和資金支援,更是一種對制度創新的探索。在這樣的背景下,螞蟻集團自去年開始設立InTech科技獎,它並非面向成熟的科學巨擘,而是將目光投向科研曲線尚在上升階段的青年學者。同時,獎項體系還專門設定了博士生獎學金,這意味著,它不是單點式的鼓勵,而是把青年科研人看作一個完整的生態,從博士到獨立學者都在支援鏈條之中。螞蟻InTech的科技獎完全公益化運作,面向在全球高校、科研院所及新型研發機構中全職從事電腦科學研究與實踐的中國青年學者。獎項強調三大導向:理論探索、技術突破、工程實踐,覆蓋通用人工智慧、具身智能、數字醫學、資料處理與安全隱私四大方向。企業可以通過長遠的方式參與科研,支援那些在基礎研究一線的年輕人。對處於科研黃金期的青年學者而言,這樣的鼓勵和支援往往意味著他們能更堅定地選擇一條原始創新的道路,也代表了一個更開放的舞台,讓他們的研究既能被學界認可,也能產業與社會看見。AI領域,企業支援科研的意義比其他學科更關鍵。在傳統學科裡,企業往往只能通過資助影響科研,而在AI領域,企業自身就是關鍵的科研機構。史丹佛大學2024年發佈的《人工智慧指數報告》指出,工業界正在主導AI 前沿研究。2014年前,機器學習模型的發佈主要由學術界完成。而到2023年,工業界獨立開發的模型已達到51個,而學術界只有15個。更值得注意的是,這一年共有21個重量級模型由學術界與工業界合作推出,創下歷史新高。科研與產業的邊界,正在AI這一領域被不斷打破[7]。螞蟻集團向來強調在研究上的投入。僅在2024年1月到11月,螞蟻研究團隊就在國際頂會上發表了300多篇論文,其中46%聚焦AI領域,涵蓋經濟性、可信性、效率與安全四大方向。值得注意的是,這些論文裡有35篇被收錄為Oral(現場報告),佔比約12%。科研成果的另一種衡量方式,是開源。螞蟻迄今已經累計開源2187個程式碼倉庫,貢獻超過100個社區頭部開放原始碼專案。很多成果不止停留在學術意義上,而是快速進入實際應用。比如2023年開放原始碼的DB-GPT,在一年間就獲得近14萬Star,被上百家企業整合到生產系統中,覆蓋金融、政務、網際網路等場景。同年推出的SkySense,則以20億參數成為全球規模最大、任務最全、精度最高的多模態遙感基礎模型[8]。這類成果的背後,是產業和科研雙向流動的結果。根據喬治城大學資料庫的統計,過去五年,全球3.56% 的電腦科學類論文至少有一位工業界作者。在這一比例裡,中國學者的貢獻佔23.58%,網際網路企業的科研產出質量與影響力快速提升[9]。中國的網際網路大廠,如今已成長為不容忽視的中國科研力量。而在AI 這樣一個產業和科研緊密交織的領域,企業能否以更長期的姿態支援科研,不僅決定著今天的競爭格局,也關乎未來的原始創新能否真正生長。參考文獻:[1]Digital Science. (2025, July).New report shows China dominates in AI research.[2]Hoover Institution. (2025).Deep peek: DeepSeek AI’s talent and implications for U.S. innovation.[3]The Chosun Ilbo. (2025, July 16).China’s AI talent pool surges, nearing US levels.[4]Hoover Institution. (2025).Deep peek: DeepSeek AI’s talent and implications for U.S. innovation.[5]Digital Science. (2025, July).New report shows China dominates in AI research.[6]國務院. (2018年1月31日). 《關於全面加強基礎科學研究的若干意見》.[7]Stanford University Institute for Human-Centered AI. (2024).AI index report 2024.[8]螞蟻技術ANTTECH. (2024).螞蟻集團2024科技生態白皮書| 過去這一年,螞蟻工程師平均每天發了一篇頂會論文.微信公眾號“.[9]財經網. (2024年12月30日). 《螞蟻集團發佈2024科技生態白皮書,AI專利和論文均有大幅提升. (知識分子)
阿里再開一局!高德上線掃街榜,發力到店業務
進入9月,關於阿里有一個保密項目的消息就傳得沸沸揚揚。有的猜是閃購的升級戰役、有的猜是AI有大動作,也有人從近期高德大力招聘AI人才推測,是跟高德有關。10日上午,阿里在園區舉辦發佈會。一走進會場,看到滿場的“走進人間煙火”橫幅,大家恍然大悟:果然是到店業務。但也有人疑惑,為什麼從一張榜單入手,畢竟更直接的方式通常是上補貼,打團購。據多個阿里內部人士及高德員工表示,高德掃街榜項目從6月就啟動了,在做線下調研的時候,收到商家們的反饋和痛點。所以,重塑評價體系成為高德發力到店業務的第一步。10億使用者線下消費的必經之路所有線下消費,都從“出發”開始,而高德就站在這個起點。據阿里財報會的最新資料,高德已經是一款服務10億使用者、日活超1.7億的國民級應用。或許很多人還不知道,阿里使用者規模最大的兩大APP,第一個是淘寶,第二個就是高德。高德還公佈了一組最新資料,每天超1.2億人次在高德發起生活服務消費探索,高德地圖覆蓋全國超700萬個餐廳點位。生活服務的使用者心智明確,需求巨大。所以,高德為什麼要做生活服務?是使用者用行動把它推上了這個位置。此前,高德已進行了多輪戰略升級:2021年啟動打車業務;2023年成為中國最大的網約車聚合平台之一;2024年高德打造“一體化出行服務平台”。成績也不錯。今年2月,高德地圖首次實現盈利。不久前,高德剛剛宣佈全面AI化,打通高德與真實世界深度連接的服務鏈路。由從導航工具到出行服務,再到生活服務,高德已成長為一艘服務10億使用者、覆蓋吃喝玩樂衣食住行的“隱形航母”。現在這艘航母,駛向了到店“戰場”。比流量更核心的是真實行為但高德掃街榜最核心的競爭力,不是超級流量,而是行為資訊的真實性。如果你連續三周繞路5公里去吃它,那它一定有點東西。高德提供的就是這種真實客觀“物理信用”:使用者導航過去,是“意圖”;停留45分鐘,是“深度消費”;重複到訪,是“忠誠”;繞路專程,是“真愛”……高德掃街榜產品經理李剛介紹:作為AI時代的產品,高德掃街榜與目前常用的評價體系,在演算法、邏輯上有本質不同:掃街榜的商家綜合評分,納入了導航、搜尋、到店、收藏等真實行為,在此基礎上檢驗評論的真實性、專業度、時效性、內容質量等維度,再通過AI模型驅動計算得出分數,成為掃街榜的排名依據。也就是說,消費者對餐廳寫的評價只是其中的影響因子之一,不能決定結果,而且AI演算法的加權會持續不斷進化,多維度資料交叉驗證、予以校準,確保最終評分的客觀真實。阿里一直說,要用技術解決商業難題。高德選擇在“910”當天推出掃街榜,或許可以看作是這一使命感的延續。阿里再開一局,高德成到店業務超級入口到店業務一直是線下生活服務的核心。9月伊始,阿里再開一局,以高德作為超級入口,發力到店業務。阿里巴巴集團CEO吳泳銘在最新的分析師會議上說,阿里未來要做的一個大消費版圖,是購物和生活服務的超級入口。前期由淘寶主導的閃購突圍,讓淘寶作為線上購物的超級入口已經行程。那線下生活服務的超級入口呢?阿里把這張牌交給了高德。一旦高德把10億使用者的“去那”和“吃啥”“玩啥”“買啥”打通,將是對整個到店行業的重新定義。 (中國新聞周刊)
尷尬,中國培養全球47%的AI人才,留在國內佔18%,大部分去美國了
AI時代,很多人認為最重要的是GPU晶片,其實真正的核心是AI人才。如果沒有人才,那怕給你一堆GPU晶片,也毫無意義。相反,如果人才足夠厲害,GPU晶片差一些,同樣可以搞出最厲害的AI模型,比如Deepseek。所以,AI時代,AI人才的爭奪也開始進入白熱化階段。那麼問題就來了,全球AI人才,具體是怎麼樣分佈的?有機構發佈了一張AI人才流動圖,讓我們一看究竟。如下圖所示,是AI人才的三個階段,第一個階段是本科生階段,第二個階段是研究生階段,第三個階段是畢業後的工作情況。可以看到,在本科階段,中國培養了全球47%的AI人才,遠高於美國、歐洲、韓國等地,佔到了全球的近一半。而這47%的AI人才,大多是國內的頂尖學校,比如北大、清華、浙大、中國科大等學校。但是這47%的AI人才,在本科畢業後,有很大部分,去了國外繼續學習,大部分是去了美國,少部分去了歐洲、韓國、澳大利亞等地。只有不到一半選擇繼續在中國深造。研究生畢業後,選擇在中國深造的這些AI人才,又有一部分流失了,去了美國等地。而選擇在海外留學的AI人才中,最終回國工作的非常少,大部分還是留在了美國,以及留在了國外工作。資料顯示,本科階段這47%的AI人才,最終工作點,可能只有18%左右,選擇在中國工作,另外的30%左右,都在國外工作,特別是在美國工作。另外,從全球的AI人才來看,在美國工作的佔到了57%,是全球最精英(前2%)AI人才的首選就業目的地,使得美國成為全球最大的AI人才聚集地。而留在中國的AI人才,實際只佔全球的12-15%左右,這個差距還是不小的。不過最近幾年,大家也看到了,美國對國外的頂尖科學家層層設檻,各種調查等,導致越來越多的頂尖人才離開了美國,特別是華人科學家們,回國的最多,所以希望美國繼續他的騷操作吧,讓國外的這些頂級AI人才,都回國了才好。 (科技專家)