最近美國國會開始針對DeepSeek。4月24日,眾議院能源與商務委員會致函DeepSeek 首席執行官梁文鋒,要求最晚在5月28日前回覆一系列問題,全面披露AI模型訓練使用的資料類型與來源、使用者資料處理和共享情況、資料安全保障措施、是否使用美國技術及是否存在模型蒸餾、模型輸出是否受意識形態影響、是否接受中國政府資助,以及是否收到政府索取資料的請求等。
國會的常設委員會基於立法和監督職責行使調查權,可以發出普通調查函(Informal Letter Request)、要求提供檔案、聽證會質詢、提供宣誓證詞等,必要時還可以發出“國會傳票”(Congressional Subpoena),不配合可能犯下“藐視國會”罪,導致罰款或坐牢。給川普關稅出主意被罵慘了的納瓦羅,就曾因收到國會調查1月6日國會山騷亂的傳票拒不出席,被扔進大牢關了四個月。
近年來,國會越來越多地給中國企業發出調查函,要求回答各種問題或提供各種資訊。從委員會給DeepSeek的函來看,這不是“國會傳票”,而只是沒有法律強制力的普通調查函,理論上可無須理會。但完全不理的話,可能招來更麻煩的傳票。上月,眾議院美中戰略競爭特別委員會致函中國三大電信營運商,要求提供其在美業務相關資訊,三家公司沒有回覆,結果該委員會4月24日出了傳票,強制要求配合調查。
另一選擇是簡單和原則性地回覆信函,但這可能就需要關注相關的“主權”與合規問題,因為中國法律對境內個人和企業配合外國官方機構的問詢有相關的“阻斷”規定和資料出境審查要求。從國際法上看,調查函或許因其非正式性質和缺乏法律意義上的後果,而不屬於司法或執法行為,但傳票則因其強制性和嚴重法律後果,可能涉嫌域外管轄、侵犯中國的主權。這個問題我沒有深入研究過,但國際法專家們似乎應予關注。
更早之前,眾議院美中戰略競爭特別委員會發佈了一份題為《揭秘DeepSeek》的報告,與之配合的還有一家美國調查公司Exiger高級研究員(曾在該委員會工作)主筆的報告,題為《DeepSeek的欺騙:中國軍方和政府資助下DeepSeek的Al研究》。
我認真讀了那兩個報告,還是熟悉的配方和味道,但客觀地說質量真的......這不,一些嚴肅的美國專家都看不下去了,今天有人專門寫了一篇很長的文章,逐條批駁了這兩個報告。該文作者Paul Triolo現為奧爾布賴特石橋集團的合夥人,是美國知名的科技政策專家,對中美兩國科技政策和產業有非常深的理解,因此觀點整體比較客觀和理性。
說實話,兩國關係目前是這樣的氛圍,美國很多智庫和專家好像都在比誰對中國更“鷹派”,誰能提出更多關於中國AI“國家安全威脅”的論點。一個美國專家此時能發出這樣客觀的聲音,多少讓人有點意外。但這其實應該是兩國政策研究者本該有的樣子——用客觀事實和嚴肅的研究說話,而非完全基於意識形態和國籍血統隨便給一家私營企業扣帽子,甚至“有罪推定”地去羅織各種“證據”。
當然,中國企業自己也會反思,是不是因為過於不透明才招致了外部的誤解。在保護好核心技術和商業秘密基礎上儘可能做到更透明,往往讓很多蓄意抹黑不攻自破。例如,DeepSeek的開源和透明,反而成為反擊污名化最有效的武器。Paul Triolo在這篇文章中指出:“DeepSeek在研究內容和研究人員的公開透明程度甚至超過了其他AI公司,指稱DeepSeek存在任何‘欺騙’,簡直是毫無道理。”
出於對作者的敬意,我聯絡了他,在徵得其授權後,把該文全文翻譯並行布,僅供研究和討論使用。英文原文及上述提到的相關報告、信函等連結附在文末。
最近,美國國會下屬中國問題特別委員會發佈了一份關於DeepSeek的報告,題為《DeepSeek揭秘》(DeepSeek Unmasked),但這份報告嚴重誤解了該公司及其技術。有意思的是,下文還提到了一家諮詢公司發佈的另一份類似的報告,也試圖“揭露”DeepSeek所謂的“欺騙行為”。由於這兩份報告都可能被用作將DeepSeek列入美國商務部實體清單,或對其採取其他限制措施的理由,因此它們值得進行認真分析。實際上,這兩份報告與其說是獨立調查,不如說是試圖將DeepSeek描繪為與中國政府存在聯絡的努力,而且兩份報告都反映了對中國、對DeepSeek以及對技術創新的嚴重誤解。
國會特別委員會報告的“調查結論”包括:
首先,DeepSeek並沒有將美國人的資料“輸送”到中國。其手機應用程式的運行方式與大多數AI聊天應用類似,推理過程中自然會使用部分中國本地的基礎設施。這正是大模型推理的常規運作模式。此前有報導稱DeepSeek與中國移動存在關聯,而中國移動除了營運龐大的5G網路之外,也營運著位於中國的資料中心,因此這種聯絡並不意外——因為AI聊天應用的查詢通常需要被分發到中國的資料中心中的GPU上進行推理處理。這裡所謂的“美國人的資料”,基本上只是使用者的查詢內容,這些查詢本身並不包含任何個人隱私資訊。DeepSeek手機應用收集的個人資料量非常少,遠低於其他同類移動應用。此外,DeepSeek部署在美國伺服器、並整合到如Perplexity等應用中的模型,全部是在本地運行的,不會將任何資料回傳到中國。
其次,DeepSeek並不存在所謂的“暗中操控”結果。所有由中國公司開發的AI模型都必須遵守中國《網路安全法》的相關審查要求,由國家網際網路資訊辦公室(網信辦)進行監管。這一點早已廣為人知,稱之為“暗中”並不精準。有意思的是,當DeepSeek的應用在美國本地伺服器上執行階段,生成的結果並不受到審查。
第三,雖然存在關於DeepSeek在訓練過程中使用了更先進的美國模型輸出進行蒸餾的指控,但目前沒有任何確鑿證據證實此事,蒸餾在DeepSeek V3和R1模型訓練中究竟扮演了多重要的角色也尚不明確。從DeepSeek公開發佈的論文來看,其所詳細描述的創新方法,在解釋模型性能時顯然起到了更關鍵的作用。
第四,正如我之前詳細說明過的,DeepSeek用於訓練其模型的先進GPU,都是在美國出口管制尚未限制對華出口的時期合法獲得的。市面上流傳的一些說法,稱DeepSeek掌握了一個包含5萬顆H100 GPU的大型叢集,但根據與眾多行業內部人士及瞭解中國高端GPU供應情況的人的交流,這種說法已經被證實是沒有依據的。此外,DeepSeek將其模型開源,並在研究論文中詳細披露了訓練和最佳化方法,這些都清晰表明:DeepSeek的最佳化策略是專門為了克服其可用硬體資源的限制而設計的,包括一批A100 GPU和少量H800 GPU——而這些硬體都是在H800也被列入出口管制清單之前獲得的。無論如何,很明顯,DeepSeek會繼續利用現有的輝達GPU資源,同時也在尋求使用國產AI硬體開發下一代模型,特別是來自華為的硬體,比如目前已經部署在CloudMatrix 384叢集中、並在國內市場銷售的昇騰910C晶片。未來,DeepSeek還可能利用華為硬體和雲服務的進一步升級,比如傳聞中的昇騰910D以及昇騰920系列處理器。
關於所謂“中國軍方和政府資助DeepSeek研究”的報告,其實相當牽強。
大約在《DeepSeek揭秘》報告發佈的同時,諮詢公司Exiger也發佈了一份關於DeepSeek的報告,這類“研究”在近期針對中國企業的報導中很常見。這份報告充滿了將關係錯誤歸因、無端指控DeepSeek存在“欺騙”行為的低級錯誤。 報告標題為《DeepSeek的欺騙:中國軍方和政府如何資助DeepSeek的AI研究》,但這一標題完全不精準,因為DeepSeek的研發資金完全來自其母公司幻方資本(High Flyer Capital)的投資,這一事實有清晰的檔案記錄支援。
所謂的“欺騙”指控更是荒謬至極,因為整個報告所依據的,只是公開可獲取的研究論文,引用的作者也都是在AI社區中很常見的類型。事實上,DeepSeek在研究內容和研究人員公開透明程度上,甚至超過了其他AI公司。在這種情況下,指稱DeepSeek存在任何“欺騙”,簡直是違背常理的。更值得注意的是,撰寫這份報告的一位作者,曾在美國國會中國問題特別委員會工作,但在這份報告中並未明確披露這一背景。因此,如果要說那裡存在“欺騙”,那倒是這份報告本身在包裝成一份“經過深入研究、客觀中立分析”的檔案時,存在嚴重誤導。實際上,它完全不是。
這份報告本身的前提就是具有誤導性的。
沒有任何證據表明所謂“解放軍資金”在任何方面促進了DeepSeek的成功。DeepSeek完全由其創始人梁文鋒及其避險基金幻方資本(High Flyer Capital)出資,公司的大部分重要研究工作都是內部完成並公開發表的,包括最近在開源周期間上傳至Github的五篇重要論文。Exiger在報告中並未提供任何證據,能夠證明DeepSeek因任何由解放軍資助的研究項目而受益。Exiger所謂的關聯,幾乎可以肯定是錯誤理解或不精準的。考慮到過去兩三年,DeepSeek主要依靠自身研發力量,並且擁有一批A100和H800等級的輝達GPU叢集,其研究團隊是否能從所謂的“解放軍贊助研究”中獲得任何實質性好處,本身就是極其站不住腳的推測。作為一個研究了中國科技體系和國防工業超過35年的人,並且深入研究過DeepSeek及其發展歷程,我可以明確地說,認為像DeepSeek這樣的公司需要依賴所謂“解放軍研究項目”的想法是極不可信的。
此外,Exiger報告還存在一些非常基本的錯誤,比如將DeepSeek極少數幾位員工畢業於中國頂尖理工大學這一事實,錯誤地解讀為與軍事有關。報告中提到所謂的“國防七子”,並以此作為軍事聯絡的證據,但並未提供任何具體證據,僅僅因為極少數DeepSeek研究人員畢業於這幾所學校就做出推斷。實際上,DeepSeek絕大多數員工畢業於其他知名高校,比如浙江大學。認為單純從“國防七子”畢業就等同於與軍事體系有關,這種邏輯是許多“開源情報”報告中的典型問題。這種做法只是膚淺地將中國機構之間簡單串聯起來,缺乏對中國高等教育體系及相關制度的真正瞭解。事實上,基本瞭解中國高等教育的人都知道,這些學校如今已是中國頂尖的理工類大學,相當於美國的哈佛、麻省理工等。所謂的“軍事屬性”,在1960年代確實較為突出,但到了今天,國防七子已劃歸工信部管理,不再屬於軍事院校體系。
值得注意的是,在胡佛研究所今年4月發佈的一份關於DeepSeek人才背景的報告中,研究方法更加嚴謹、論調也更加客觀。這份報告參考了DeepSeek自2023年以來公開發佈的五篇主要研究論文中完整、透明的人員署名資訊。報告的兩位作者——埃默森·約翰斯頓(Emerson Johnston)和艾米·澤加特(Amy Zegart)——在文中甚至沒有提到“國防七子”。他們發現,DeepSeek研究人員的主要來源是中國科學院及其他一些著名綜合性大學,而不是與軍事體系直接關聯的機構。
約翰斯頓(Johnston)和澤加特(Zegart)還發現,DeepSeek的研究人員中有一小部分與美國高校有聯絡,但整體來看,他們得出的結論是,DeepSeek的人才構成顯示出與國際經驗有關的特徵,這表明與上一代研究人員相比,中國當前的AI人才隊伍對美國經驗的依賴大幅降低。因此,DeepSeek研究人員大多畢業於中國科學院和其他知名綜合性大學,而與“國防七子”有關聯的人數極少,在這份詳細報告中,沒有任何人被明確歸屬於國防七子院校,這並不令人意外。
其他研究過DeepSeek團隊教育背景的學者也指出,他們大多數人的學歷背景主要來自中國最知名的理工科高校。正如雪梨科技大學澳中關係研究院副教授Marina Zhang所描述:
“DeepSeek團隊中的許多成員曾參與國家級人工智慧項目,比如清華大學智能產業研究院b和北京大學的王選電腦研究所,在那裡,他們將前沿學術研究與實際產業經驗相結合。這種從實驗室研究到產品開發的順利過渡,是DeepSeek能夠迅速發展的關鍵因素。”
Exiger的報告還陷入了一個“政府人才引進項目”的套路,這是許多“開源情報”諮詢公司慣常使用的手法,試圖通過挖掘所謂的政府關聯來證明中國企業與政府存在聯絡,但往往對這些人才項目的真實內涵和功能缺乏正確理解。 事實上,中國的各類政府人才計畫,如“千人計畫”、“長江學者計畫”和“百人計畫”,主要目的是吸引海外受訓的華人科學家和外國專家回國,尤其是在關鍵的科技與工程(STEM)領域。參與這些項目通常意味著與中國國家或政府機構之間存在某種臨時的正式關係或合作,但更多時候,這只是為了獲得科研聲望或項目資助的一種途徑,並不必然意味著直接隸屬於軍事或敏感部門。
考慮到DeepSeek研究人員中只有極少部分有海外留學背景,且胡佛研究所的報告也指出,這些研究人員從一開始就計畫回國發展,因此,Exiger報告中引用的人才計畫關聯,在理解DeepSeek是否存在政府支援問題上,充其量是無關緊要的。
過去,這種類型的“開源情報”報告經常被用作美國政府針對中國企業採取行動的前奏。例如,中國本土晶圓代工龍頭中芯國際,就在2020年8月一份類似報告發佈後,於當年12月被列入美國商務部實體清單。那時,所謂中芯國際與中國軍方存在聯絡的“證據”,也主要是基於一些非常薄弱的與軍工體系相關聯機構的聯絡,與本次Exiger對DeepSeek的指控模式如出一轍。
不過,當時美國商務部在將中芯國際列入實體清單時給出的官方理由是:
“我們不會允許先進的美國技術被用來幫助一個日益具有敵意的對手建設其軍隊。中芯國際與中國軍工體系的關係、中國積極推動‘軍民融合’政策以及國家主導的補貼政策,使中芯國際成為中國利用美國技術支援其軍事現代化風險的典型例子。”
隨後,當中芯國際被美國國防部列入1260H名單(即“中國軍事企業”名單)時,中芯國際發佈聲明予以否認,並指出:
“公司強烈反對美國國防部的這一決定,認為該決定反映了美國國防部對公司業務和技術最終用途的根本性誤解。”
通過對中芯國際客戶結構的分析可以看到,該公司絕大部分業務實際上服務於民用市場,包括大量外國企業客戶。 而美國在出口管制中常引用的“軍民融合”標準本身從未有過清晰界定, 針對1260H名單所指控的所謂軍事關聯,一些中國公司(例如小米)曾成功提出法律挑戰,證明這類指控背後的證據基礎往往非常薄弱。
所謂的“軍民融合”理由,實際上是一種便利的兜底式說法,當“開源情報”研究人員找不到明確證據證明企業與中國軍方或軍工體系存在關聯時,往往就會訴諸於這一概念。通常情況下,就像中芯國際(SMIC)一樣,這類指控從未認真評估過一家企業與政府或軍事體系相關機構之間,到底存在多少實際聯絡或推斷聯絡,是否足以構成將整個公司歸類為“助力軍事目標”的合理依據。實際上,以中芯國際和DeepSeek為例,兩家公司的商業模式,即使有聯絡,也只是非常間接甚至可以忽略不計的,與真正的軍事應用幾乎沒有關係。
關於DeepSeek的新一批“報告”,顯然也屬於這種支撐極其薄弱的美國政府行動藉口,儘管歷史上這並沒有阻止美國對一些中國公司採取實際措施。但如果真正深入瞭解DeepSeek,就會得出截然相反的結論:DeepSeek之所以成功,恰恰是因為從一開始就是由一家私募基金(幻方資本)投資支援,並且由CEO梁文鋒的個人願景驅動發展的,而並非出自任何產業政策推動,也不是靠政府資助。儘管所謂的“開源情報”研究者極力想要證明DeepSeek與政府之間有聯絡,事實卻並不支援這一點。 (東不壓橋研究院)