所有實驗室都怕字節，所有人都在誇DeepSeek！美國研究員36小時中國AI行

2026/05/08

•

中國AI研究員的性格、魅力和真誠……讓人倍感親切。

這是艾倫研究所（Ai2）的研究員Nathan Lambert，在最近結束中國之行後，發自內心的一番感慨。

在Nathan眼裡，中國的LLM圈子簡直是天堂，大家彼此尊重、即便立場不同也客客氣氣的。

反觀大洋彼岸的御三家，他突然有點沒眼看。

天天激情互噴，跟部落爭霸似的……

並非場面客套話。

這次來中國的36小時，Nathan幾乎把中國AI圈打卡了個遍，月之暗面、智譜、清華、美團、小米、千問……都有深度交流。

在和大量一線AI研究員、學生聊完天后，Nathan得出了這個結論：

這裡的AI玩家，在合作共贏。

基於此，Nathan寫下長文，分享了他此次中國行期間令他印象深刻的種種事蹟——

所有實驗室都有點怕字節，所有人都敬佩DeepSeek。
北京簡直跟矽谷一樣，他36小時內跑了6家AI公司。
他問一名中國研究員對AI風險的看法，對方困惑地愣住了——這似乎是個不合適的問題。
美團、小米這種公司也會自研大模型，這在中國是理所當然的事。
從筆記本上抬起頭，總能看到地平線上的起重機，彷彿中國工程師文化的一種具象化。

實在太真誠了，連MiniMax都跑來前排圍觀，表示希望下次Nathan的「中國行」能把上海和深圳也安排上。

以下是整理後的文章節選。

Enjoy。

中國研究員的心態

Nathan在文中花了大篇幅聊一個事：為什麼中國實驗室這麼擅長追趕前沿？

他的核心判斷是，文化。

今天做一個好的LLM，靠的是從資料到架構到RL演算法，全端每個細節的打磨。每個環節都能榨出一些提升，但怎麼把這些提升拼到一起，是一個極其複雜的多目標最佳化問題。

有時候某個天才研究員的工作，需要為模型的整體工作讓路。

在美國，這種事經常引爆衝突。

Nathan透露了個瓜：Llama團隊據傳就是因為內部政治鬥爭過重而崩盤的。

大家都想讓別人按自己的想法做事，有實驗室需要花錢安撫頂級研究員，才能讓他們別再抱怨自己的想法沒被採納。

據此，他得出一個結論：

過強的Ego和野心，會妨礙做出最好的模型。

而中國這邊，他觀察到一個微妙差異：

中國實驗室的核心貢獻者有大量都是在讀學生，在這裡，學生被當成同事直接參與核心研發。

他們會願意做那些不那麼Sexy的工作，無所謂，只要能讓模型變好就行。

反觀美國呢？OpenAI、Anthropic、Cursor這些頂級公司乾脆就不開實習。

Google這類公司名義上會有和Gemini相關的實習，但事實上，大家會擔心實習生會被隔離在邊緣區域，接觸不到核心工作。

但中國經驗證明，學生的參與，反而能大幅加快行進速度。

除此之外，這些學生還帶來了一個意想不到的優勢：全新的視角。

過去幾年LLM的關鍵範式從Scaling MoE，到Scaling RL，再到Agent，每一次轉換都需要瘋狂吸收新的上下文。

學生恰恰最擅長這個。他們擅長快速學習，也樂於放下一切預設，一頭紮進去。

Nathan還注意到一件有意思的事。當他問中國研究員對AI的經濟影響或長遠社會風險有什麼看法時，很多人的反應是——

愣了一下。

不是不想回答，是真的覺得不關他們事。他們的任務就是做出最好的模型，其他的事，不是他們操心的範圍。

相比之下，美國文化更強調為自己發聲。

作為科學家，你越能為自己的工作發聲，就越容易成功。

而矽谷文化也在推動一種新的成名路徑，也就是成為明星AI科學家。所以大家樂忠於上Dwarkesh、Lex Fridman這種超級播客節目。

一位研究員引用了Dan Wang那個經典說法，很精闢：中國是工程師治國，美國是律師治國。

工程師考慮的是解決問題，而律師考慮的，是定義問題。

概括一下，Nathan覺得有四點比較重要的文化差異：

1、更願意做那些不那麼光鮮，但能提升最終模型的工作。

2、剛進入AI建構領域的人，不受上一輪AI炒作周期的路徑依賴束縛，因此能更快適應新的現代技術。

3、更少的自我意識，讓組織結構能稍微更好地擴張，因為更少有人試圖鑽組織系統的空子。

4、大量人才非常適合解決那些已經在別處有概念驗證的問題。

北京=矽谷

Nathan的北京游挺有意思。

他說北京簡直像灣區。隨便走兩步就是一個競爭對手的辦公室。

他下了飛機，去酒店的路上順便就拐進了阿里巴巴北京園區。然後在36個小時內，他依次去了智譜、月之暗面、清華、美團、小米、零一萬物。

線下交流中，他向研究員們八卦中國的人才爭奪情況怎麼樣。回答是：

跟美國差不多。

跳槽很正常，主要看當前那個團隊氛圍最好。

但有一點跟美國很不一樣。

在中國的AI圈，實驗室之間更像是一個生態，而不是互相廝殺的部落。在很多私下交流中，大家對同行都是尊重的。

所有實驗室都對字節跳動和豆包保持高度關注，在Nathan看來，字節是中國少數走閉源路線推進的大模型玩家。

所有人都敬佩DeepSeek，認為它是研究品味最好的實驗室。

這讓Nathan很驚訝，和美國研究員的線下對話，火藥味可比這濃多了。

但在中國，大家似乎冥冥中形成了一種默契的共識。

還有一點他覺得很奇怪——

中國研究員談到商業化的時候經常聳聳肩，說：那不是我的事。

而美國這邊，從資料供應商到算力到融資，人人都對各種生態等級的產業趨勢如數家珍。

中國AI產業的真實樣貌

聊完文化，Nathan接著聊了聊產業層面他觀察到的幾個關鍵差異。我挑幾個最有意思的說。

1、中國AI需求的早期訊號

一直有一種說法：中國AI市場會比較小，因為中國公司不太願意為軟體付費。Nathan認為這個判斷只對了一半。不願意花錢的部分對應的是SaaS生態，這在中國確實很小。但中國有一個龐大的雲端運算市場。

關鍵問題在於：企業在AI上的花費，最終會走SaaS的路線還是雲的路線？

Nathan的感受是，AI更接近雲，而且沒有人在擔心圍繞新工具是否能長出市場。

2、中國公司的技術自研執念

為什麼美團、螞蟻集團這種公司也在自己做大模型？

西方人可能會覺得奇怪。

但在Nathan看來，中國人的邏輯是：LLM顯然會成為未來科技產品的核心，所以必須自己掌握。

不過，雖然自研，但也開源。

先訓一個通用底座，開源出去讓社區幫忙打磨，內部再微調一個版本用到自己的產品裡。

開源不是信仰，是實用主義——它能獲得社區反饋，能回饋開源生態，也能幫助他們更好地理解自己的模型。

3、算力不足

輝達仍是訓練的黃金標準，每個實驗室都因為晶片不夠而受限。

4、資料產業不夠成熟

Nathan聽說過Anthropic和OpenAI動輒花1000萬美元以上買單個RL訓練環境，每年累計花費數億美元來推動前沿。

他很好奇，中國實驗室是不是也在從美國公司買這些環境？或者有鏡像的中國供應鏈？

答案是：有資料產業，但質量參差不齊。

所以自己做更靠譜。一般來說研究員們會親自花大量時間搭RL訓練環境，字節和阿里這種大公司則有內部資料標註團隊。

尾聲

Nathan文章最後的一段話，關乎「瞭解」。

Nathan表示，來之前就知道自己對中國瞭解甚少，走了一圈之後反而更強烈地感受到，自己根本不瞭解這塊土地。

中國不是一個能用規則或公式來概括的地方，它有完全不同的動力學和化學反應。

如此古老且深厚文化，卻又與當下的技術建設完全交織在一起。

在Nathan跟幾乎所有中國領先AI實驗室交談後，他發現中國有很多特質和直覺，是很難用西方的決策框架去建模的。

他不明白，為什麼這些實驗室要開源自己好不容易訓練出來的模型。

它們不會認為自己建構的每一個模型都必須開源，但都非常有意願支援開發者、支援生態，並且把開源進一步瞭解模型的一種方式。

這些公司建構LLM，並不是因為追逐熱點，想在新潮技術裡刷存在感。

這一切的背後，是一種Nathan沒有想過強烈的深層願望：

把技術棧掌控在自己手中。

這也讓Nathan在文章結尾，直言自己有些許焦慮：

如果說我不希望美國實驗室在AI的每個領域都保持明確領先——特別是在開源模型這塊——那我就是在騙人。

我是美國人，這是一個誠實的偏好。

我希望開源生態能在全球繁榮。這能為世界創造更安全、更可及、更有用的AI。

但現在的問題是，矽谷是否能保住這個領導地位？

歸根結底，依舊是在談中國開源文化這件事。

關於這一點，Nathan說了一句非常有畫面感的話，很適合用作結尾：

當我從筆記型電腦上抬起頭，總能看到地平線上的一簇簇起重機。

這跟中國的開源精神，顯然是一脈相承的。 (量子位)

科技