中國AI研究員的性格、魅力和真誠……讓人倍感親切。
這是艾倫研究所(Ai2)的研究員Nathan Lambert,在最近結束中國之行後,發自內心的一番感慨。
在Nathan眼裡,中國的LLM圈子簡直是天堂,大家彼此尊重、即便立場不同也客客氣氣的。
反觀大洋彼岸的御三家,他突然有點沒眼看。
天天激情互噴,跟部落爭霸似的……
並非場面客套話。
這次來中國的36小時,Nathan幾乎把中國AI圈打卡了個遍,月之暗面、智譜、清華、美團、小米、千問……都有深度交流。
在和大量一線AI研究員、學生聊完天后,Nathan得出了這個結論:
這裡的AI玩家,在合作共贏。
基於此,Nathan寫下長文,分享了他此次中國行期間令他印象深刻的種種事蹟——
- 所有實驗室都有點怕字節,所有人都敬佩DeepSeek。
- 北京簡直跟矽谷一樣,他36小時內跑了6家AI公司。
- 他問一名中國研究員對AI風險的看法,對方困惑地愣住了——這似乎是個不合適的問題。
- 美團、小米這種公司也會自研大模型,這在中國是理所當然的事。
- 從筆記本上抬起頭,總能看到地平線上的起重機,彷彿中國工程師文化的一種具象化。
實在太真誠了,連MiniMax都跑來前排圍觀,表示希望下次Nathan的「中國行」能把上海和深圳也安排上。
以下是整理後的文章節選。
Enjoy。
中國研究員的心態
Nathan在文中花了大篇幅聊一個事:為什麼中國實驗室這麼擅長追趕前沿?
他的核心判斷是,文化。
今天做一個好的LLM,靠的是從資料到架構到RL演算法,全端每個細節的打磨。每個環節都能榨出一些提升,但怎麼把這些提升拼到一起,是一個極其複雜的多目標最佳化問題。
有時候某個天才研究員的工作,需要為模型的整體工作讓路。
在美國,這種事經常引爆衝突。
Nathan透露了個瓜:Llama團隊據傳就是因為內部政治鬥爭過重而崩盤的。
大家都想讓別人按自己的想法做事,有實驗室需要花錢安撫頂級研究員,才能讓他們別再抱怨自己的想法沒被採納。
據此,他得出一個結論:
過強的Ego和野心,會妨礙做出最好的模型。
而中國這邊,他觀察到一個微妙差異:
中國實驗室的核心貢獻者有大量都是在讀學生,在這裡,學生被當成同事直接參與核心研發。
他們會願意做那些不那麼Sexy的工作,無所謂,只要能讓模型變好就行。
反觀美國呢?OpenAI、Anthropic、Cursor這些頂級公司乾脆就不開實習。
Google這類公司名義上會有和Gemini相關的實習,但事實上,大家會擔心實習生會被隔離在邊緣區域,接觸不到核心工作。
但中國經驗證明,學生的參與,反而能大幅加快行進速度。
除此之外,這些學生還帶來了一個意想不到的優勢:全新的視角。
過去幾年LLM的關鍵範式從Scaling MoE,到Scaling RL,再到Agent,每一次轉換都需要瘋狂吸收新的上下文。
學生恰恰最擅長這個。他們擅長快速學習,也樂於放下一切預設,一頭紮進去。
Nathan還注意到一件有意思的事。當他問中國研究員對AI的經濟影響或長遠社會風險有什麼看法時,很多人的反應是——
愣了一下。
不是不想回答,是真的覺得不關他們事。他們的任務就是做出最好的模型,其他的事,不是他們操心的範圍。
相比之下,美國文化更強調為自己發聲。
作為科學家,你越能為自己的工作發聲,就越容易成功。
而矽谷文化也在推動一種新的成名路徑,也就是成為明星AI科學家。所以大家樂忠於上Dwarkesh、Lex Fridman這種超級播客節目。
一位研究員引用了Dan Wang那個經典說法,很精闢:中國是工程師治國,美國是律師治國。
工程師考慮的是解決問題,而律師考慮的,是定義問題。
概括一下,Nathan覺得有四點比較重要的文化差異:
1、更願意做那些不那麼光鮮,但能提升最終模型的工作。
2、剛進入AI建構領域的人,不受上一輪AI炒作周期的路徑依賴束縛,因此能更快適應新的現代技術。
3、更少的自我意識,讓組織結構能稍微更好地擴張,因為更少有人試圖鑽組織系統的空子。
4、大量人才非常適合解決那些已經在別處有概念驗證的問題。
北京=矽谷
Nathan的北京游挺有意思。
他說北京簡直像灣區。隨便走兩步就是一個競爭對手的辦公室。
他下了飛機,去酒店的路上順便就拐進了阿里巴巴北京園區。然後在36個小時內,他依次去了智譜、月之暗面、清華、美團、小米、零一萬物。
線下交流中,他向研究員們八卦中國的人才爭奪情況怎麼樣。回答是:
跟美國差不多。
跳槽很正常,主要看當前那個團隊氛圍最好。
但有一點跟美國很不一樣。
在中國的AI圈,實驗室之間更像是一個生態,而不是互相廝殺的部落。在很多私下交流中,大家對同行都是尊重的。
所有實驗室都對字節跳動和豆包保持高度關注,在Nathan看來,字節是中國少數走閉源路線推進的大模型玩家。
所有人都敬佩DeepSeek,認為它是研究品味最好的實驗室。
這讓Nathan很驚訝,和美國研究員的線下對話,火藥味可比這濃多了。
但在中國,大家似乎冥冥中形成了一種默契的共識。
還有一點他覺得很奇怪——
中國研究員談到商業化的時候經常聳聳肩,說:那不是我的事。
而美國這邊,從資料供應商到算力到融資,人人都對各種生態等級的產業趨勢如數家珍。
中國AI產業的真實樣貌
聊完文化,Nathan接著聊了聊產業層面他觀察到的幾個關鍵差異。我挑幾個最有意思的說。
1、中國AI需求的早期訊號
一直有一種說法:中國AI市場會比較小,因為中國公司不太願意為軟體付費。Nathan認為這個判斷只對了一半。不願意花錢的部分對應的是SaaS生態,這在中國確實很小。但中國有一個龐大的雲端運算市場。
關鍵問題在於:企業在AI上的花費,最終會走SaaS的路線還是雲的路線?
Nathan的感受是,AI更接近雲,而且沒有人在擔心圍繞新工具是否能長出市場。
2、中國公司的技術自研執念
為什麼美團、螞蟻集團這種公司也在自己做大模型?
西方人可能會覺得奇怪。
但在Nathan看來,中國人的邏輯是:LLM顯然會成為未來科技產品的核心,所以必須自己掌握。
不過,雖然自研,但也開源。
先訓一個通用底座,開源出去讓社區幫忙打磨,內部再微調一個版本用到自己的產品裡。
開源不是信仰,是實用主義——它能獲得社區反饋,能回饋開源生態,也能幫助他們更好地理解自己的模型。
3、算力不足
輝達仍是訓練的黃金標準,每個實驗室都因為晶片不夠而受限。
4、資料產業不夠成熟
Nathan聽說過Anthropic和OpenAI動輒花1000萬美元以上買單個RL訓練環境,每年累計花費數億美元來推動前沿。
他很好奇,中國實驗室是不是也在從美國公司買這些環境?或者有鏡像的中國供應鏈?
答案是:有資料產業,但質量參差不齊。
所以自己做更靠譜。一般來說研究員們會親自花大量時間搭RL訓練環境,字節和阿里這種大公司則有內部資料標註團隊。
尾聲
Nathan文章最後的一段話,關乎「瞭解」。
Nathan表示,來之前就知道自己對中國瞭解甚少,走了一圈之後反而更強烈地感受到,自己根本不瞭解這塊土地。
中國不是一個能用規則或公式來概括的地方,它有完全不同的動力學和化學反應。
如此古老且深厚文化,卻又與當下的技術建設完全交織在一起。
在Nathan跟幾乎所有中國領先AI實驗室交談後,他發現中國有很多特質和直覺,是很難用西方的決策框架去建模的。
他不明白,為什麼這些實驗室要開源自己好不容易訓練出來的模型。
它們不會認為自己建構的每一個模型都必須開源,但都非常有意願支援開發者、支援生態,並且把開源進一步瞭解模型的一種方式。
這些公司建構LLM,並不是因為追逐熱點,想在新潮技術裡刷存在感。
這一切的背後,是一種Nathan沒有想過強烈的深層願望:
把技術棧掌控在自己手中。
這也讓Nathan在文章結尾,直言自己有些許焦慮:
如果說我不希望美國實驗室在AI的每個領域都保持明確領先——特別是在開源模型這塊——那我就是在騙人。
我是美國人,這是一個誠實的偏好。
我希望開源生態能在全球繁榮。這能為世界創造更安全、更可及、更有用的AI。
但現在的問題是,矽谷是否能保住這個領導地位?
歸根結底,依舊是在談中國開源文化這件事。
關於這一點,Nathan說了一句非常有畫面感的話,很適合用作結尾:
當我從筆記型電腦上抬起頭,總能看到地平線上的一簇簇起重機。
這跟中國的開源精神,顯然是一脈相承的。 (量子位)
