首發 | 解讀《美國人工智慧行動計畫》:革新、競爭與霸權
當地時間2025年7月23日,川普政府發佈了由美國白宮科技政策辦公室牽頭制定的頂層戰略架構檔案《贏得競賽:美國人工智慧行動計畫》(以下簡稱《計畫》)。這份戰略計畫正文長達23頁,明確了三大支柱、30項目標和103條推薦政策行動,標誌著美國政府在人工智慧前沿科技領域即將開啟全新戰略佈局,劃定了美國未來能源重構、製造重塑、勞動力重編與治理重寫的戰略路徑。本文將從計畫的核心架構出發,分析其出台背景、主要內容和顯著特點,探究其“創新驅動基建,基建支撐霸權”的戰略邏輯。美國總統 川普簽署《贏得競賽:美國人工智慧行動計畫》行政命令出台背景2021年底以來,以生成式人工智慧為代表的AI技術發展呈突飛猛進之勢,既給美國帶來了巨大的機遇,又對其構成了一定的挑戰。根據《計畫》文字內容,結合川普政府公開政策檔案及相關發言表述,其出台背景可歸結為“全球競爭”“監管改制”“利益兌現”三個核心維度,對應“外因-內因-目標”的戰略閉環。源自全球AI競爭和領導地位動搖帶來的危機感。當前,世界各國領導人都空前關注人工智慧領域的突破和進展。美國總統川普將人工智慧視為“變革性技術”,在這一領域的突破將“重塑全球權力格局”,並直言不諱地稱“美國必須實現並保持無可爭議的全球科技霸主地位”。2025年1月23日,川普在上任後第4天就簽署了第14179號總統行政令《消除美國在人工智慧領域領導地位的障礙》,呼籲美國保持在全球競賽中的主導地位,並指導制定一項“人工智慧行動計畫”。2025年2月11日,美國副總統范斯在法國巴黎的“人工智慧行動峰會”上誓言美國“會採取一切必要手段”,保證美國在全球AI領域的領先地位。美國總統國家安全事務助理馬爾科·A·盧比歐和總統科技事務助理、白宮科技政策辦公室主任邁克爾·J·克拉茨奧斯等人則將AI定義為“重塑全球力量平衡”的核心技術,強調美國正處於一場“必須贏得”的競賽中,其勝負直接影響經濟競爭力和軍事優勢,稱若輸掉競賽將導致“國家安全風險”,並進一步強調所謂地緣政治博弈視角下的“國家安全緊迫性”。上述情況說明,全球人工智慧領域的激烈競爭及其領導地位動搖帶來的危機感,促使川普政府制定《計畫》,推動AI領域的變革與發展。美國副總統范斯參加法國巴黎的“人工智慧行動峰會”基於從監管約束到解綁創新的AI治理政策轉向。2023年10月30日,時任美國總統拜登曾簽署第14110號總統行政令《安全、可靠和值得信賴的人工智慧開發和使用》,提出了諸如聯邦機構要選拔並增設本部門的首席人工智慧官等措施,加強對AI技術的監管。2024年10月24日,拜登政府還發佈了美國歷史上首份以人工智慧與國家安全為主題的政策備忘錄及其配套檔案《國家安全領域的人工智慧治理和風險管理框架》,進一步劃定人工智慧風險管控的基本框架。但川普政府的政治主張與此相悖,認為想要進一步發展人工智慧,必須給監管“鬆綁”,曾多次批判前任“監管體系繁重”。2025年5月,美國商務部談及拜登政府人工智慧規則時稱其“過於複雜、官僚主義,會阻礙美國的創新”,現任政府將採用新規替代,釋放創新能力,並“確保美國在人工智慧領域的主導地位”。為了給美國國內AI監管環境“去枷鎖”,川普簽署的第14179號總統行政令一反拜登政府“安全與可信優先”的監管策略,宣佈撤銷拜登政府的人工智慧行政命令和有關人工智慧的所有政策、指示與法令,轉向“競爭與創新優先”的監管原則,提倡私營部門主導的創新,實質上是從風險規避到增長驅動的轉變。這些也成為了《計畫》制定的政策起點。滿足美國多維度國家利益訴求的政治需要。川普上台後要考慮的第一是政治承諾因素。川普在2024年競選時就許下了眾多關於未來AI發展的競選承諾。一方面計畫加注AI產業投資,將頒布政策鼓勵前沿AI模型研發,要求AI技術開源和共享,鼓勵新創企業進入AI領域,引領科技研發與應用的變革;另一方面強調未來美國將立足於在最少的監管下推進人工智慧發展,並以自由市場的方式加速技術進步,推動美國人工智慧產業全面升級。第二是提振美國國內經濟因素。據國際貨幣基金組織預測,全球約40%的就業機會將受到人工智慧的影響,這意味著美國可能有數百萬就業崗位面臨被替代的風險,或者產生數十萬失業人數。盧比歐認為:“美國必須繼續在AI領域保持主導地位,以促進經濟繁榮並保護國家安全。”美國總統科技助理兼人工智慧與加密貨幣特別顧問戴維·O·薩克斯和克拉茨奧斯也提出要以“美國工人為核心發展AI”,“確保在人工智慧時代,美國工人的家庭富足和發展”。而上述競選承諾和願景幾乎全部被納入了本次發佈的《計畫》。總統科技助理戴維·O·薩克斯提出要以“美國工人為核心發展AI”主要內容《計畫》採取“支柱-目標-舉措”三層佈局,設定了“加速AI創新”“基礎建設革命”“領導國際AI外交與安全”三大發展支柱,三者以“技術賦能→物理承載→規則輸出”為核心鏈條,共同服務於美國爭奪全球AI主導權的戰略目標。在每一支柱之下,《計畫》又根據用途、手段的不同,將之細分為30項目標,並針對性地提出了合計103條推薦政策行動(舉措)。《計畫》整體架構緊密順暢,清晰明了地擘畫了川普政府對美國國家人工智慧全面發展的路線圖。《計畫》三大支柱及其細分目標示意圖打造技術賦能“引擎”第一支柱——加速AI創新。第一支柱內容約佔整個《計畫》正文篇幅的一半,其包含的15項細分目標和相應的舉措合計58條均過半數,可將其稱為關鍵支柱。該支柱的核心邏輯旨在通過政策鬆綁和資源傾斜,最大化釋放私營部門創新潛能,破除AI發展障礙、激發技術突破,以期確保美國在AI模型、演算法、應用層保持代際領先,為後續支柱提供技術儲備和支撐。第一支柱的主要發展目標有以下4項。第一,著力去監管化以增強市場活力。《計畫》打算通過限制撥款等資金槓桿和修訂採購標準等法律工具迫使地方政策鬆綁,同時削弱部分聯邦機構的審查權,為私營企業拓展創新空間。第二,重構價值觀導向的技術標準。《計畫》修改拜登政府時期發佈的《人工智慧風險管理框架》,刪除關於“錯誤資訊、多樣性、公平性、包容性以及氣候變化”的引用,形成新的美式價值觀輸出機制。第三,大力投資AI科學研究。《計畫》指出,人工智慧發展帶來的新興能力有望加速科學進步,必須通過推動科研方式根本性變革,建設、升級配套科研基礎設施,把理論轉化為工業規模的企業。為此應當建構“世界級”科學資料集,並保證資料安全;推進人工智慧科學發展,加注戰略性、針對性投資。第四,致力於推動AI創新成果的應用落地。《計畫》指出美國在眾多關鍵領域中由於種種因素導致AI技術應用進展緩慢,除了監管的因素阻礙以外,民眾對AI的不理解和不信任也是重要原因。因此,要採取設立監管沙盒、集思廣益制定標準、強化競爭情報蒐集分析等措施,建立一種充滿活力的“先試後行”(try-first)的AI文化。建設物理承載“基座”第二支柱——建設AI基礎設施。第二支柱包含8項目標、29條舉措,計畫將創新的技術成果轉化為實際生產力,解決限制美國人工智慧發展的算力、能源、硬體和人才四大瓶頸,為AI大規模應用提供具有韌性的基礎設施和物理承載能力。第二支柱的主要發展目標有以下4項。第一,加快與AI發展配套或相關的基建審批速度。《計畫》明確要簡化資料中心、半導體廠及能源設施的審批流程,優先本土選址,並取消所有針對晶片計畫資助的半導體製造項目的多餘政策要求,推動半導體製造回流美國,保障供應鏈安全;論證、修訂相關法規,打通環境審批制度等其他法律“梗阻”。第二,明確基建與能源優先導向。《計畫》指出,“美國能源容量自20世紀70年代停滯”,而AI需“遠超今日水平的能源和資料基礎設施”,電網升級滯後與資料中心建設緩慢被列為“贏得競賽的最大障礙”。《計畫》將電網擴容視為AI競爭的核心前提,解決制約AI發展的能源瓶頸。第三,培養專用型勞動力。聚焦電工、高級暖通技術員等藍領工作,通過制定AI崗位所需的國家技能框架與能力模型、創設調整職業技術教育(CTE)課程等方式,最佳化職業培訓模式,實現“精準用工”培養,填補人才缺口,輸送配套勞動力。第四,確立安全設計原則。隨著AI在網路攻防領域的應用程度日益加深,加強關鍵基礎設施網路安全的緊要程度一再提升。《計畫》強調要建設高安全資料環境,從硬體(晶片認證)、設施(軍用資料中心隔離)到軟體(內嵌監控),建構“全端安全體系”,抵禦“虛假或惡意輸入”,尤其強化國防應用場景,為軍事和情報部門建立高安全性的資料中心,形成“民用技術廣泛推廣、軍用系統極致防護”的雙軌制。定製規則輸出“槓桿”第三支柱——領軍國際AI外交與安全領域。第三支柱包含了7項目標、16條舉措,核心目的是通過技術出口繫結盟友,採取“出口管制封鎖+價值觀輸出”的對華雙重遏制方式,以及加強AI領域的國家安全威脅評估。第三支柱的主要發展目標有以下3項。第一,技術霸權聯盟化。以“全端出口”為誘餌,將盟友技術生態繫結到美國“晶片+模型+標準”體系中,通過商務部主導的出口計畫與金融工具,要求出口AI系統必須符合美式價值觀和原則,將意識形態植入技術標準,使盟友形成路徑依賴,意圖打造“AI北約”。第二,國際規則武器化。《計畫》將國際標準戰場轉化為“價值觀對抗”工具,利用美國在國際外交和標準制定機構中的地位,大力倡導促進創新、反映美國價值觀、抵制威權主義影響的國際人工智慧治理方法,實則為排除中國影響力建構制度壁壘。第三,安全議題擴張化。《計畫》要求確保美國政府評估前沿AI模型國家安全風險的能力領先全球,繼續加強對尖端半導體等敏感技術的嚴格出口管制,鼓勵其合作夥伴和盟國遵守美國的管制措施,既擴大市場又強化陣營認同;同時,將生物安全等非傳統威脅納入AI競爭框架,從而過度拓展了國際安全議程。這三大支柱實為美國維持AI霸權的“三位一體”策略,從技術層(第一支柱)確保綜合性領先,到基建層(第二支柱)掃除規模化瓶頸,再到規則層(第三支柱)固化全球AI霸權優勢。顯著特點《計畫》的核心邏輯直指“主導權競爭”,其本質是將AI技術深度繫結國家戰略,通過國內政策與國際行動聯動,實現“技術霸權閉環”。對比拜登時期的國家人工智慧政策,《計畫》具有三大顯著特點。通過自主機器人等新產業提高全美民眾的生活水平一是強力扭轉AI監管政策,在其他AI建設發展方面做了延續和保留。《計畫》採取“胡蘿蔔加大棒”策略,將聯邦監管與資源直接捆綁。一方面,廢止拜登AI安全行政令,論證、撤銷前任政府審查要求,修訂或廢除阻礙人工智慧發展的法規規則、行政命令和指導檔案等,對AI發展實施寬鬆管制。另一方面以聯邦資金為槓桿,要求各州“不得阻礙AI創新”,否則限制撥款,其實質是以資源分配權倒逼各州政策服從聯邦“去監管化”的議程。此外,在技術治理層面,《計畫》也明確刪除監管框架中多元性別和氣候變化等相關內容,以剝離“政治正確”議題。這類罕見推翻既定裁決的舉措,雖然預示著對拜登政府AI監管框架的否定和摒棄,但在謀求鞏固領先地位、推進AI賦能和加強聯盟合作等戰略謀劃方面依然做了保留。《計畫》根據川普政府的政治傾向將之演化為領軍國際人工智慧外交與安全領域、推動AI創新成果全面落地和應用,以及向盟國和夥伴輸出美國AI等新的目標與政治主張,反映出這些框架的合理性和對美國的重要性。二是將價值觀工具化,技術標準承載意識形態輸出,利用AI外交建立美式“新標準”。川普政府期望打造以AI為“作業系統”的國家治理模式,並積極推行AI外交,將之作為新的“規則範本”輸出全球。在巴黎峰會上,范斯猛烈批判了歐盟的AI監管政策,其強勢表達要求放鬆監管、採取美式標準等主張,則被認為“將衝擊美歐在科技治理的合作關係”,范斯也提前離場,並拒絕簽署巴黎峰會有關“包容和可持續”的人工智慧宣言。《計畫》全盤承續了這些主張,一邊通過“全端出口”繫結盟友技術生態,推廣“美式價值觀中立”框架,一邊嚴控半導體製造裝置子系統出口,加大對華技術封鎖。同時,重點標定有關人工智慧標準主導權的爭奪也是這一方面的對應。《計畫》引言部分明確指出“誰擁有最大的AI生態系統,誰就將設定全球AI標準”,並類比“太空競賽”的勝負邏輯,強調美國需通過技術壟斷獲取規則制定權。這種“標準即霸權”的思維推動《計畫》將國際標準輸出列為其第三支柱的核心目標。三是推動以企業為中心的勞動力轉型,反映了美國政府政策的“被動適配性”,也暴露出其對私營企業的過度放縱。《計畫》許下了AI時代下經濟與就業的“雙重承諾”,一方面強調將帶來產業革命紅利,宣稱AI將帶來“工業革命、資訊革命和文藝復興三位一體的黃金時代”,承諾通過自主機器人、下一代製造等新興產業提高全美民眾的生活水平,意圖進一步釋放紅利;另一方面迫於勞動力轉型壓力,承認AI將“改變所有行業的工作方式”,因此計畫設立“AI勞動力研究中心”,實行行業稅收抵免,試圖緩解替代性失業風險。縱觀前兩大支柱均含勞動力政策,包括稅收優惠驅動企業培訓和定向培養藍領適配基建需求等,雖標榜“賦能工人”,但培訓方向聚焦資料中心維運等“適配性技能”,培訓補貼政策工具實質利多資方,極少涉及高端人才全球化競爭,也非系統性解決技術性失業,體現出川普政府政策被動適配性轉型。川普等高層大肆標榜“工人優先”,實則將勞動者視為技術迭代的配套要素,而非轉型中心。結  語面對其他國家在算力建設與資料積累上的飛速發展,美國選擇以“自由創新”為名,廢除前任AI安全行政令,鬆綁企業,放鬆監管,弱化倫理審查,以價值觀排除異己,以“電網與晶片回流”保障技術主權,折射出川普政府激進務實主義的兩面性。川普政府的《計畫》希望通過技術、基建和外交三管齊下確保美國AI霸權,但因全球供應鏈重組面臨現實阻力、勞動力轉型速度可能滯後於技術迭代、能源需求與供給的硬約束,以及安全監管缺位埋藏隱患等因素,其實際結果存在顯著不確定性,或引發全球AI格局重構、能源與創新的賽跑、技術治理悖論等多重風險與挑戰。 (軍事文摘)
巴倫周刊—蘋果,或許實際上正在贏得AI競賽
華爾街似乎已形成新的共識:即使蘋果在AI領域起步較晚,也並不重要。蘋果成功擺脫了AI困境。自8月1日以來,蘋果股價大漲39%,過去一周更是創下歷史新高,即便此前蘋果智能(Apple Intelligence)的推出遭遇挫折——該項目旨在將AI整合進蘋果旗下裝置中。蘋果智能的核心亮點本該是新版數字個人助理Siri,其目標是像OpenAI和Google母公司Alphabet的頂級AI聊天機器人一樣強大。自2011年Siri首次推出以來,使用者就一直渴望擁有一個更智能的助手。但這個項目已被無限期推遲。新版Siri難以推進,是因為蘋果在AI競賽中主動給自己設限。它是唯一一家將隱私和安全視為賣點、而非成本負擔的大型科技公司。任何新版Siri的落地都必須符合蘋果嚴苛的隱私安全標準,這成為了項目推進的主要障礙。蘋果公司極力主張所有的機器學習都應在加密的蘋果裝置上進行,充分利用其晶片中的專用模組——這是最能保障隱私安全的方式。然而,支撐ChatGPT和Gemini等前沿模型的語言模型運行於龐大的資料中心,對算力的需求遠遠超出了手機的承受範圍。能夠在手機上運行的體積更小的模型,目前還無法持續帶來足夠優質的使用者體驗,無法達到蘋果的要求。因此,我們只能等待。與此同時,華爾街似乎已形成新的共識:即使蘋果在AI領域起步較晚,也並不重要。由於新版Siri推遲發佈,蘋果股價曾受挫,但目前已回升,與標普500指數表現持平。當大多數科技巨頭在AI賽道上全力衝刺時,蘋果卻像是在跑一場馬拉松。到底誰做得對,還需時間驗證,但我認同蘋果對AI熱潮的長遠眼光。蘋果可以不那麼急於將AI整合進自家產品。到目前為止,數千億美元的資本投入正將科技巨頭們引向同一個境地:各家AI模型之間難以顯著區分。事實證明,擁有最好的AI模型,並不是一道“護城河”,只是暫時的優勢。許多企業客戶都表示,AI語言模型正逐漸變得同質化,最近一次表達這一看法的是Salesforce首席執行長馬克·貝尼奧夫。“我們使用所有的大型語言模型,”他在公司周三的第三季度財報電話會議上表示。“目前它們都非常優秀,所以我們可以隨時切換使用。對我們來說,成本最低的就是最好的。”有報導稱,蘋果正在與Alphabet以及初創公司Anthropic進行洽談,計畫將他們的AI模型(經過針對蘋果硬體的最佳化調整)作為權宜之計,直到蘋果能建立出自己的高性能模型。蘋果正在按自己的節奏前行,將使用者體驗和隱私保護置於速度之上。在行業陷入AI 軍備競賽之際,蘋果推出了“私有雲端運算”(Private Cloud Compute)服務:這是一套基於蘋果程式語言開發的開放伺服器軟體,運行在配備蘋果晶片的蘋果伺服器上。一如既往,蘋果希望掌控從硬體到軟體的全鏈條,尤其是在隱私安全領域。AI對話可能包含大量個人敏感資訊,而Private Cloud Compute能夠防止這些資訊被窺探,甚至連蘋果自己都無法查看。未來,升級版的Siri將會面世,其安全性將超過所有其他聊天機器人。與此同時,蘋果保留實力,僅適度增加資本支出以支援其私有雲端運算。相比之下,Meta、甲骨文、微軟和Google則在AI資料中心上合計投入了數千億美元,使得原本十分健康的現金流量表和資產負債表被“侵蝕”。其中,Meta尤為突出,今年在AI資料中心上的支出約為700億美元,並承諾明年還會增加。這些投資全部用於自身,並不像其他公司那樣用於雲端出租。債務水平正在上升,由資本支出帶來的折舊費用也開始不斷增加,並且還會持續增長。在最新季度,Google的折舊費用同比增長了41%,微軟增長了93%,Meta增長了20%,而蘋果僅上升了7%。如果未來有大規模資本支出的需求,蘋果還有充足的空間來應對。儘管蘋果還在摸索如何將AI融入自家軟體,但公司的實力依然十分明顯。華爾街分析師普遍認為,iPhone 17將推動蘋果裝置銷售額實現自2021財年以來的最高增速。依託全球超過23億台在用蘋果裝置,服務業務收入持續穩步增長。由於沒有像其他科技巨頭那樣消耗現金流,蘋果的現金返還計畫(分紅與股票回購)將持續推進。等到蘋果公佈第一財季業績時,預計其累計分紅與股票回購總額將突破1兆美元。自2012年以來,蘋果已回購近半數流通股,推動每股收益提升79%。這整個討論引出了一個更大的問題:蘋果究竟有多需要依靠AI功能來推動裝置銷售?自從智慧型手機成為一個成熟的品類後,人們往往是覺得需要新手機時才會購買。無論好壞,新功能已經不再是驅動智慧型手機銷量的主要因素。在2021財年新冠疫情封鎖期間,蘋果iPhone的銷量比前一年增長了39%,因為使用者需要新裝置來居家辦公。iPhone 16主打“蘋果智能”概念進行了大力宣傳,銷量不錯,但遠稱不上爆款。如今,iPhone 17系列回歸了蘋果一貫的做法,把重點放在硬體、設計和攝影機上,表現似乎更勝一籌。2021財年銷售的手機,到2026財年已經五年了,人們也確實需要換新手機了。事情就是這麼簡單。蘋果還有充足的時間。投資者們不妨耐心等待。 (Barrons巴倫)
Google:全端AI之王
【新智元導讀】隨著Gemini 3模型與第七代TPU的強勢發佈,Google終於打破了OpenAI與輝達主導的市場敘事,宣告這一「沉睡的巨人」已憑藉硬核實力完全醒來。ChatGPT一轉眼已發佈三年了。過去三年,全球科技界都沉浸在一個由兩位「雙子星」所主導的敘事中——輝達負責「賣鏟子」,提供高達80%毛利的GPU硬體基石;OpenAI則負責「挖金礦」,堅信Scaling Law(擴展法則),定義模型的前沿。所有人都以為,Google這家一度被分析師認為在AI競賽中「落後」的巨頭,只能扮演一個追趕者的角色。然而,現在一切都已不同。上個月,當Google推出其Gemini 3系列模型和第七代TPU Ironwood時,市場的震撼達到了前所未有的程度。這種震撼不是因為Google「追平」了對手,而是因為它直接重塑了遊戲規則。作為新智元ASI產業圖譜11月號文章,本文將深入分析Google是如何利用獨有的「全端AI」戰略,建構起對手難以複製的護城河並重回巔峰的。「沉睡的巨人」已完全醒來Gemini 3發佈後,就連奧特曼都罕見發聲,承認在某些關鍵維度上確實「落後」了。更加戲劇性的是,輝達股價也應聲下挫,過去一個月跌幅約15%。如此大的跌幅逼得公司不得不發表聲明,強調其GPU的通用性和CUDA生態的不可替代性。與此同時,Google母公司Alphabet的股價卻一路飆升,正邁向4兆美元的市值。這一切都指向了同一個事實:Google這個「沉睡的巨人」,現在已經完全醒來。而這背後的力量源泉,正是其對AI技術堆疊的徹底垂直整合——「全端AI」戰略。正如GoogleCEO Sundar Pichai在Gemini 3發佈時所言——也正因為我們在AI創新上有一套與眾不同的全端做法——從領先的基礎設施,到世界一流的研究、模型和工具,再到觸達全球數十億人的產品——我們才能以前所未有的速度,把先進的能力帶給全世界。性能巔峰:Gemini 3和Nano Banana的非線性突破與Gemini 2.5 Pro相比,Gemini 3的進步並不體現在「參數翻倍」上,而是在推理能力與多模態架構上完成了一次顯著躍遷。它被Google定位為一款基於最先進推理能力的原生多模態模型:能在同一個模型裡同時處理文字、圖像、音訊和視訊,在統一的內部表示中做跨模態推理,並在多項主流基準測試中取得頂尖成績。在LMArena競技場排行榜中,Gemini 3 Pro在所有項目中目前都排名第一。在更強調綜合智能的Artificial Analysis Intelligence Index排行榜中,Gemini 3同樣以73分位居榜首。如果說Gemini 3是智力的巔峰,那麼Nano Banana Pro就是實用性和創造力的狂歡。Nano Banana Pro一經發佈,便迅速引發了一場「社交狂歡」,使用者僅需通過極其簡單的提示詞,就能生成高品質的戰力排行榜、知識繪本和各種表情包等。GoogleCEO Sundar Pichai也提到,Nano Banana Pro在資訊圖表的生成上取得了突破。這種強大的應用屬性,讓普通使用者的創造力得以釋放。正如網際網路讓更多人成為創作者一樣,AI工具正讓更多人以腦海中的方式來表達自我。Nano Banana Pro生成的資訊圖「全端AI」的垂直整合模型能力的突破可能僅僅是冰山一角。要理解Google的強大,則必須深入到其底層的戰略本質——全端垂直整合。如果將AI的進步視為一次登月計畫,那麼競爭對手可能只擁有最先進的火箭(模型)或者最有力的燃料(GPU)。而Google,則建造了一座整合了燃料製造廠、火箭設計院和發射台的全套「航天中心」。這套「全端AI」從底層基礎設施、世界級研究(模型和工具),一直延伸到面向使用者的產品和平台。換句話說,從Nano Banana這樣的應用,到背後的模型,再到最底層的晶片,Google幾乎都握在自己手裡。TPU的誕生與進化Google的全端故事,要從一場看似迫不得已的「自救」行動講起。2015年,Google內部部署了TPU v1,迅速在各部門獲得熱烈反響。這並非出於炫技,而是被逼入了一個「不自研將難以支撐未來業務規模」的現實。當時,深度學習開始廣泛滲透Google的搜尋、廣告等核心業務,這讓Google工程團隊意識到一個關鍵問題:如果全面採用深度學習模型,Google全球資料中心的功耗將暴漲到難以承受的程度。當時的GPU雖然更適合訓練大規模網路,但其能效並非針對即時線上推理設計的。這讓Google的高層意識到,繼續依賴CPU和GPU的現有路線不可持續。於是,Google決定自己造一塊專用晶片(ASIC)——TPU,把目標定得非常簡單粗暴:只幹一件事,把訓練和運行AI模型需要的那些矩陣、向量運算做到極致高效。到了2017年,那篇著名的Transformer論文發表後,Google立即意識到,這個新架構的計算模式高度規則、矩陣密度極高、平行度極高,簡直是為TPU量身定做的。於是,他們自己把軟體架構、編譯器、晶片架構、網路拓撲、散熱系統都握在手裡,形成全端閉環。TPU由此升級為GoogleAI基礎設施的底座和支柱。如今,TPU已發展到了第七代Ironwood(鐵木)。如果說TPU  v4/v5p是兼顧訓練和推理的多面手,那麼Ironwood就是在繼續強化訓練能力的前提下,把推理放到設計核心的一代——一個為大規模推理優先、又能承擔巨型模型訓練的定製利器。相較第六代TPU Trillium(v6e),Ironwood在訓練與推理工作負載上的單晶片性能提升超過4倍;與TPU v5p相比,峰值算力最高可達10倍。它也是Google迄今性能最強、能效最高的TPU。Ironwood單個superpod可容納9,216顆TPU,依託9.6 Tb/s等級的晶片間互聯和約1.77 PB的共享高頻寬記憶體,大幅緩解了大模型訓練和推理中的通訊瓶頸,使複雜AI模型在超大規模叢集上運行得更快、更穩定。它的出現,意味著Google正式把資源和架構重心從「訓練」轉向「訓練+大規模推理一體化」,並公開把「age of inference」(推理時代)定義為下一階段AI基礎設施的主戰場。通過Ironwood+AI Hypercomputer這套系統級組合拳,Google同時在單晶片性能和整機房級算力密度兩條戰線對標輝達,爭奪下一代AI基礎設施的話語權。Ironwood超級機櫃的一部分,直接在一個單一域內連接了9,216個Ironwood TPU模型與硬體的深度契合Google的AI全端戰略在軟硬體一體化這點上看得最清楚。靠著這套從晶片、資料中心到模型架構都自己打通的體系,Google把過去層層割裂的環節擰成了一根繩,性能和效率一起往上抬。以Ironwood為例,它就是研究人員影響硬體設計、硬體反過來加速研究成果的持續閉環產物。當GoogleDeepMind團隊需要為其頂尖模型實現特定架構突破或者最佳化時,他們可以直接與TPU工程師團隊緊密協同創新。這種內部協作確保了模型架構的設計始終是基於最新代際的TPU進行訓練,從而相對於前代硬體實現顯著的性能提升和加速。Jupiter資料中心網路能夠將多個Ironwood超級莢連接成包含數十萬個TPU的叢集現在,Google的創新循環更進了一步,達到了「AI設計AI」的境界。他們用一種名為AlphaChip的AI技術來設計下一代晶片的佈局方案。AlphaChip利用強化學習來生成更最佳化的晶片佈局。目前,這一方法已經成功應用於包括Ironwood在內的連續三代TPU的設計中。這大大降低了Google對外部半導體設計工具和供應商的依賴。通過這種自研晶片+內部最佳化,Google在算力成本上形成了天然優勢,從而避免了昂貴的「CUDA稅」。巨頭們的「投懷送抱」Google內部實測資料顯示,Ironwood在同等負載下的推理成本較GPU旗艦系統低30%-40%。有分析指出,Google提供同等推理服務時的底層成本可能僅為對手的兩成。在推理時代,這樣的成本差異足以改變大客戶的架構選擇:對每年在推理上投入數千萬甚至上億美元的企業來說,壓縮三到五成支出,足以改寫財報。在這一層意義上,TPU正在變成許多公司重構推理基礎設施時優先考慮的算力引擎。Google自己也正在將TPU從「內部黑科技」打造為市場上的「生態可選項」,進而吸引像Anthropic、Meta這樣的大客戶。僅Anthropic一家就計畫接入高達100萬個TPU。Google還順勢啟動了TPU@Premises計畫,將TPU直接部署在企業的資料中心,使得客戶可以在本地以極低的延遲使用推理能力。近期還有市場傳聞稱,Meta正評估在2027年把TPU引入自家資料中心,並最早從明年起通過Google雲租用部分算力——無論最終如何落地,這類討論本身就說明TPU已經進入一線網際網路公司的選項集。回到更可量化的層面:根據Google第三季度財報,Google雲新增客戶數量同比增長近34%,超過10億美元的大單規模已超過前兩年的總和,超過70%的客戶正在使用Google雲的AI產品。這些變化,在很大程度上都與Google在算力成本和產品形態上的優勢緊密相關。C端:全端AI的終極引擎正如上文GoogleCEO劈柴哥所言,Google的全端AI戰略,是一個涵蓋AI基礎設施、世界級研究(包括模型和工具)以及將AI帶給全球使用者的產品和平台的全面系統。C端產品——特別是其核心業務如搜尋、地圖以及Gemini app和Nano Banana Pro等新的AI應用——不僅僅是戰略的最終輸出,它們更是驅動整個全端AI生態系統向前發展的核心引擎,是實現技術驗證、資料積累和商業閉環的關鍵。Google憑藉其無可匹敵的使用者規模和資料廣度,為其定製硬體和領先模型提供了無與倫比的「煉丹爐」和「試驗場」。這些資料來源包括Google搜尋、Android、YouTube等,Google通常自己使用這些資料。而像Gemini系列模型,則被視為是貫穿Google所有產品的主線。在2025年第三季度,Google的第一方模型(如 Gemini)僅通過客戶直接API,每分鐘就處理約70億個tokens。若把搜尋、YouTube、Android等所有介面加起來,每月被模型消化的tokens已超過1.3千兆個(quadrillion),一年內增長了20多倍。這些資料展示了C端產品作為AI能力載體的恐怖規模,也使得Gemini應用在推出後,月活躍使用者數迅速超過6.5億,形成了驅動AI進步的資料飛輪。以GoogleAI Mode為例,自推出以來其在美國實現了強勁且持續的周環比增長,查詢量在一個季度內翻了一番。截至三季度,已擁有超過7500萬的日活使用者,推廣到了全球40種語言。最重要的是,AI Mode已經為搜尋帶來了增量的總查詢增長。12月2日,Google已宣佈將AI Mode融入進搜尋中,給搜尋使用者提供類似ChatGPT的聊天體驗。這種C端產品成功將AI技術轉化為實實在在的業務增長,進一步奠定了Google在核心領域的競爭優勢。簡言之,Google的C端產品(如搜尋),是其全端AI戰略的需求源、資料場和商業出口。這些C端產品一方面製造了真實的流量和使用壓力,另一方面又不斷把反饋灌回Google的TPU和Gemini,讓它們在高頻迭代中越跑越省錢、越跑越高效。全端AI:改寫技術文明底座在當下這個以「推理為先」的AI時代,Google率先把競爭從單一模型的短跑,換成了全端系統的馬拉松。至此,真正的護城河不再是誰有更多的晶片、更先進的模型,而是誰掌握了「基礎設施-研究-產品-資料」的閉環。展望未來,如果說過去網際網路解決的是「資訊是如何被找到的」,那麼全端AI要回答的將是「世界如何被重新組織」。以Google為代表的科技公司,能否將這套AI閉環,轉化為更公平的教育、更高效的科研、更可持續的產業,將在很大程度上決定下一代技術文明的形狀——那時,我們也許不再刻意談論AI,因為它將成為文明的默認背景。 (新智元)
開源和閉源模型的差距在拉大:這是 DeepSeek 論文揭示的殘酷真相
12月2日,DeepSeek 發佈了 V3.2 技術報告。在這篇論文裡,他們做了一件罕見的事:明確指出開源大模型與閉源模型的性能差距不是在縮小,而是在擴大。這是基於大量實測資料的冷靜判斷。差距正在拉大,這是事實2024年,當 DeepSeek、Qwen、GLM 等開源模型接連發佈時,社區充滿樂觀情緒。"8個月時間差"的說法廣為流傳,許多人相信開源正在追上閉源。但進入2025年,情況發生了變化。DeepSeek 在論文引言部分直言不諱地寫道:“過去幾個月出現了明顯的分化。雖然開源社區持續進步,但閉源專有模型的性能提升速度顯著更快。結果是,兩者的差距非但沒有縮小,反而在擴大,閉源系統在複雜任務上展現出越來越強的優勢。”這個觀察有資料支撐。論文對比了 DeepSeek V3.2 與 GPT-5、Gemini 3.0 Pro 在多個基準測試上的表現。在 MMLU-Pro(多學科知識測試)中,DeepSeek V3.2 得分 85.0,GPT-5 是 87.5,而 Gemini 3.0 Pro 達到了 90.1。在 GPQA Diamond(研究生等級科學問題)測試中,三者的得分分別是 82.4、85.7 和 91.9。更明顯的差距體現在 HLE(Human Last Exam,極難的文字推理測試)中。DeepSeek V3.2 的得分是 25.1,GPT-5 是 26.3,而 Gemini 3.0 Pro 高達 37.7——這個差距已經不是"接近"能形容的了。值得注意的是,DeepSeek V3.2 已經是目前最強的開源模型,在大部分開源模型的對比中都處於領先位置。但即便如此,它與頂級閉源模型之間仍然存在明顯差距,尤其是在需要深度推理和複雜任務處理的場景中。差距為何在拉大?三個結構性問題論文通過系統分析,識別出限制開源模型在複雜任務上能力的三個關鍵缺陷。這些不是表面問題,而是深層次的結構性困境。第一個問題在於架構層面。開源模型普遍依賴傳統的 vanilla attention 機制,這種機制在處理長序列時效率極低。論文指出,這種架構上的依賴"嚴重限制了長序列的效率,對可擴展部署和有效的後訓練構成了實質性障礙"。當閉源模型已經在探索更高效的注意力機制時,開源模型還在用五年前的技術架構,這本身就是一個巨大的劣勢。第二個問題是資源投入的鴻溝,尤其體現在後訓練階段。後訓練是讓模型從"會說話"變成"會思考"的關鍵環節,需要通過強化學習讓模型學會推理、工具使用和遵循複雜指令。論文透露,DeepSeek V3.2 的後訓練計算預算超過了預訓練成本的 10%。要知道,預訓練本身就是天價投入,而大部分開源模型的後訓練預算可能連 1% 都不到。這種資源投入上的差距,直接導致了性能上的代際差異。第三個問題是 AI Agent 能力的滯後。在真實應用場景中,開源模型的泛化能力和指令理解能力明顯落後。論文引用了三個關鍵的 Agent 測評基準:在 MCP-Mark 中,DeepSeek V3.2 得分 45.9,Gemini 3.0 Pro 是 51.0;在 MCP-Universe 中,前者是 80.3,後者是 87.9;在 Tool-Decathlon 中,差距更加明顯。這些數字背後反映的是開源模型在複雜多輪互動、工具呼叫、長期規劃等場景下的能力不足。論文總結道:"開源模型在泛化能力和指令跟隨能力方面展現出明顯滯後,這阻礙了它們在實際部署中的有效性。"這是一個誠實且殘酷的判斷。DeepSeek 的應對:技術路線的根本性改變認識到問題後,DeepSeek 沒有選擇簡單地堆砌參數或增加資料量,而是在三個核心維度上進行了根本性的技術創新。在架構層面,DeepSeek 引入了 DSA(DeepSeek Sparse Attention)機制。傳統注意力機制的計算複雜度是 O(L²),序列長度翻倍,計算量就要翻四倍。DSA 通過"閃電索引器"(Lightning Indexer)快速計算每個 token 的重要性評分,然後只選擇 top-k 個最重要的 token 參與注意力計算(論文中 k=2048),將複雜度從 O(L²) 降至 O(L×k)。這個改進不僅僅是理論上的最佳化。論文通過實測資料表明,在 128K 上下文長度下,DSA 大幅降低了推理成本,而性能幾乎沒有損失。更令人意外的是,在 AA-LCR(長文字推理基準)和 Fiction.liveBench(小說理解測試)中,V3.2 的表現甚至優於使用傳統注意力機制的 V3.1。這證明 DSA 不僅更快,在某些場景下質量還更好。在資源投入層面,DeepSeek 做出了超常規的決定。論文明確寫道:"近幾個月來,性能提升與擴展的 RL 訓練預算持續相關,該預算已超過預訓練成本的 10%。"這個數字在開源界極為罕見。具體來說,DeepSeek 為數學、程式設計、推理、Agent 等六大領域分別訓練了專家模型,每個都單獨進行大規模強化學習訓練。在持續預訓練階段,模型經歷了 943.7B tokens 的訓練(在 128K 上下文長度下),然後採用 GRPO(Group Relative Policy Optimization)演算法進行混合訓練,整合推理、Agent 和人類對齊三類任務。在 Agent 能力強化方面,DeepSeek 開發了系統化的任務合成流程。他們合成了超過 1800 個多樣化環境和 85,000 條複雜提示,涵蓋各種真實場景。具體包括 24,667 個程式碼 Agent 任務、50,275 個搜尋 Agent 任務、4,417 個通用 Agent 任務和 5,908 個程式碼直譯器任務。這些合成資料不是隨機生成的,而是通過冷啟動階段學習推理與工具使用的統一模式,然後在規模化階段系統地生成高品質訓練場景。效果是顯著的。在 Agent 相關的測試中,DeepSeek V3.2 顯著縮小了與閉源模型的差距,在 MCP-Universe 上達到了 80.3% 的成功率,雖然仍低於 Gemini 的 87.9%,但已經是開源模型中的最佳表現。論文總結說:“DeepSeek V3.2 成為 Agent 場景中極具成本效益的選擇,顯著縮小了開源與前沿閉源模型之間的性能差距。”論文最後寫了一句耐人尋味的話:"如果 Gemini 3.0 證明了持續擴展預訓練的潛力,DeepSeek V3.2-Speciale 則證明了在大規模上下文環境中強化學習的可擴展性。"言下之意很明顯:閉源巨頭有資源堆預訓練,但開源可以找到自己的路——通過更高效的架構和更科學的後訓練,用更少的資源實現接近的效果。這或許是開源 AI 唯一的生存之道:不是硬碰硬拚資源,而是拼技術路線的創新。至少在這一次,DeepSeek 證明了這條路是走得通的。 (矽星人Pro)
Google和阿里,打破創新者窘境
半年前,市場對Google還普遍抱持著謹慎觀望、甚至略帶悲觀的態度。但此後Google接連發力:8月Nano Banana推出,9月反壟斷訴訟落地掃清障礙,11月Gemini 3發佈。疊加巴菲特建倉的利多消息,Google市值一舉突破3兆美元,儼然成為AI應用龍頭。無獨有偶,阿里今年也上演強勢翻盤戲碼:通義千問模型多模態能力領先,阿里雲AI業務增長顯著提速,千問App首周下載量破千萬,硬體端推出夸克AI眼鏡……這場從傳統電商平台到AI科技生態公司的戰略轉型,讓其股價從年初至今斬獲超90%的漲幅,終結了連續四年的低迷態勢。兩家公司雖然身處不同市場,但都走出了同樣的曲線:從巨頭慣性 → 路徑依賴 → 戰略重構 → 再度增長。兩家公司都呈現出一個極罕見的景象:創始人以再創業者的姿態,重新進入核心戰場。🇺🇸 布林回歸,讓Google重新擁有技術靈魂Google聯合創始人謝爾蓋·布林早已功成名就,本可安心享受退休生活。但面對ChatGPT的衝擊和Google內部的山頭林立,他選擇重返公司。這位對技術極其敏銳的聯合創始人,開始重新參與核心研發工作:出現在Gemini團隊的程式碼評審會議、參與模型訓練策略與技術路線討論、重金請回Transformer核心人才、解決DeepMind與Brain合併後的路線與文化摩擦、推動算力與頂尖人才向單一旗艦模型集中。Google過去最大的組織問題,是技術路線分散、部門協作成本高、創新鏈條被拖慢。布林的回歸,以創始人權威壓掉內耗與分歧,重建執行力。🇨🇳 阿里:蔡崇信與吳泳銘掛帥,重建速度與攻勢阿里巴巴的變革則更為激進和徹底。2023年9月阿里創始班底回歸,蔡崇信、吳泳銘分別出任阿里巴巴集團董事會主席和CEO,確立AI驅動的戰略重心。蔡崇信從資本和戰略層面,為阿里的AI轉型提供頂層設計。押注開源模型、聚焦雲+基礎設施。吳泳銘兼任淘天集團和阿里雲智能集團的CEO,以一人雙帥的高效模式,將電商和雲端運算兩大核心業務與AI戰略徹底打通,確保資源聚焦和效率最大化。資源層面,阿里做出重磅承諾:三年投入3800億元佈局 AI 與雲端運算。這是一個遠超常規的戰略訊號,將幾乎是未來三年的利潤全數押注AI,用真金白銀的成本向市場宣告轉型的堅定決心。Google與阿里的逆襲,都是戰略上All in AI,靠持續落地的技術產品與商業成果兌現承諾、重塑市場認知。但所有人都清楚,從知道到做到,中間橫亙著巨大的組織惰性、路徑依賴。職業經理人很難做出這樣的決策——受制於任期、考核和董事會壓力,他們往往選擇最佳化現有業務,偏好漸進式創新,而規避回報周期長、可能顛覆現有業務的顛覆性創新。AI作為公認的範式級革命,顛覆性遠勝以往。大公司破局的唯一解藥,是創始人意志的直接介入:憑藉創始人意志錨定方向,驅動資源的超常規配置和組織的超常規協同,破除創新者窘境。 (張大愚)
Ilya 最新訪談震撼矽谷:算力時代結束了
看了 Ilya 最新訪談視訊,收穫太大了,我感覺 Ilya 思考的問題確實直指目前人工智慧發展的核心問題。Ilya Sutskever 是誰呢?他是 OpenAI 的聯合創始人、現在 Safe Superintelligence 公司的掌舵人,他在這次訪談中透露了一個被狂熱投資熱潮掩蓋的真相。從 2020 年到 2025 年,整個行業都在瘋狂加碼算力,彷彿只要把規模擴大 100 倍,一切問題都能迎刃而解。但現在,當算力已經大到某個程度,一個尷尬的問題浮現出來了:繼續堆算力真的能帶來質變嗎?Ilya 的答案是:還真不見得。當我們所有人都在談論千億美元投資、萬卡叢集的時候,這位 AI 領域最神秘的大腦之一 Ilya Sutskever 卻說了一句讓人意外的話:我們正在從規模時代重回研究時代。下面是我聽完訪談之後總結的幾點 llya 的核心觀點和對我的啟發。1一個困擾所有人的悖論你有沒有想過這樣一個問題,為什麼 AI 在評測中表現得像個天才,在實際應用中卻會犯傻?Ilya 在訪談中講了一個特別生動的例子。你讓 AI 幫你寫程式碼,它寫出來有個 bug。你告訴它有 bug,它立刻說"天那你說得對,我這就改"。然後它改完之後,引入了第二個 bug。你再告訴它有第二個 bug,它又說"天那我怎麼會犯這種錯誤",然後把第一個 bug 又帶回來了。你就這樣看著它在兩個 bug 之間來回橫跳。這種現象背後藏著一個更深層的問題。現在的 AI 就像一個刷題刷了一萬個小時的競賽選手,它確實能在考試中拿高分,但走出考場就不知道該幹什麼了。而人類呢,可能只練習了一百個小時,實際能力反而更強。差別在那裡?Ilya 說,那些真正有天賦的學生,他們有一種說不清道不明的"it"因素。這個因素讓他們能夠舉一反三,而不是死記硬背。想想我們自己的學習經歷。有些同學看起來沒怎麼刷題,但成績就是好,而且畢業之後在工作中也表現出色。有些同學題海戰術做到極致,卻總覺得學到的東西用不上。這種區別,正是當下 AI 面臨的核心困境。2動物智能和人工智慧的區別Ilya 的這個觀點讓我想起了幾天前 Andrej Karpathy 分享的一個新觀點:動物智能和人工智慧的區別,為什麼它們不同?他的意思是:我們今天看到的 AI,它的“聰明方式”,跟動物完全不是一套邏輯。動物智能只是整個“智能世界”裡的一個小角落,而且是一個被自然反覆毒打過、被進化調教了幾百萬年的很特殊的點。AI 完全不是這麼來的。動物為什麼會聰明?因為它們從出生就掉到一個隨時會死的世界裡:有危險、有競爭、有飢餓、有社交鬥爭。它必須意識到自己是誰,想辦法活下來、吃飽、繁殖,而且要處理一大堆複雜的社會關係,誰是朋友、誰是敵人、誰在騙我、誰想壓我、誰能合作。人腦的大部分計算能力,其實都用在這種“猜別人怎麼想、判斷危險、謀生存”的事情上。我們有恐懼、憤怒、厭惡這些情緒,就是為了在自然環境裡活得更久一點。簡單說:動物的智能,是進化在“逼”它聰明。做不好一個任務,很可能就死。但大語言模型完全不是這樣。它不會死,也不怕死,也沒有身體,也沒有“我是誰”的概念。它不是從叢林里長大的,它是從一堆人類寫下來的東西里“爬”出來的。它的最底層本能其實就是:模仿人類的語言規律。它更像一個變形者,你給它什麼風格,它就學什麼風格。然後它會被各種訓練手段進一步調整,比如強化學習讓它更懂“你想要什麼”,網際網路使用者的各種反饋又讓它變得很會討好人,喜歡說讓使用者舒服的話。這種“智能”不是為了活著、為了打架、為了搶資源,而是為了“答題答得更準”、“讓使用者覺得不錯”。所以模型的能力是參差不齊的,它可能能給你解釋哲學,但也可能連 strawberry 裡有幾個 r 都數不准,因為做錯不會死,也沒人逼它為了一個小任務拚命變強。這就是 Andrej Karpathy 想強調的核心差異:動物智能是被自然進化“碾”出來的,全能、通用、壓力巨大;AI 的智能是被商業訓練“篩”出來的,用來完成任務、討好使用者、服務人類。兩個力場完全不同,方向也完全不同。所以他說,大模型其實是人類第一次遇到的“非動物型智能”。它的行為方式跟我們太不像了,只是因為它從我們寫下的文字裡學習,所以看起來“有點像我們”。如果你能真正理解這點,你對它的判斷會更準確;反之,你會一直把它當成一種“動物”或“人類弱版”,然後用錯誤的直覺去理解它。3為什麼人類十五年學到的,AI 用海量資料還學不會更讓人驚訝的是,Ilya 提到了一個關於大腦損傷的研究案例。有個人因為腦部受傷,失去了所有情緒感知能力。他依然能說話,能做智力測驗,但他完全無法做決策了。光是選穿那雙襪子,就能糾結好幾個小時,更別說做投資決策了。這說明什麼?情緒不僅僅是感受,它更像是一個內建的價值函數,時刻在告訴我們什麼是對的,什麼是錯的。這套系統是進化給我們的禮物,簡單卻極其有效。一個十五歲的孩子,接觸到的資料量遠遠少於 AI 的預訓練資料,但他們對世界的理解深度卻遠超 AI。他們知道的東西雖然不多,但每一樣都理解得很透徹。他們不會犯 AI 那種低級錯誤。這種學習效率的差距,讓我們不得不重新思考:堆資料、堆算力真的是唯一的路嗎?4那個 AI 時代的關鍵詞,可能誤導了我們五年Ilya 說了一個特別有意思的觀點:語言會影響思維。"規模化"這個詞就是最好的例子。從 2020 年開始,整個行業都在喊一個詞:scale。規模化。這個詞太強大了,它直接告訴所有人應該做什麼,加資料、加算力、加參數,閉著眼睛往前衝就對了。公司也喜歡這個,因為這是一種低風險的投資方式,你知道投入多少肯定能得到相應的回報。但現在的問題是,當資料快用完的時候怎麼辦?當算力大到某個程度之後,繼續加 100 倍真的能帶來質變嗎?答案是,可能不會。所以現在的局面變成了:手裡有海量算力,但不知道該用來做什麼研究。這就好比你突然有了一大筆錢,但不知道該投資什麼項目。錢不是問題,想法才是問題。矽谷有句話說:想法很便宜,執行才是一切。但 Ilya 看到有人在推特上反問:如果想法那麼便宜,為什麼現在沒人有想法了?這個反問扎心了。當整個行業的公司數量超過想法數量的時候,競爭的本質就變了。5什麼才是真正的超級智能現在再來看 AGI 這個詞,你會發現一個有趣的現象。這個詞的出現,其實是為了反駁"狹義 AI"。以前國際象棋 AI 能贏卡斯帕羅夫,但它什麼別的都不會,所以人們說這是"狹義"智能。作為回應,有人提出了"通用"智能的概念。但 Ilya 指出,如果按照這個標準,人類其實也不是 AGI。我們每個人都有知識盲區,都需要不斷學習新東西。一個人可以是程式設計師,也可以是醫生,但不可能一出生就什麼都會。所以真正的超級智能應該是什麼樣的?Ilya 給出了一個新的定義:它不是一個什麼都知道的全能大腦,而是一個能夠快速學習任何技能的智能體。就像一個 15 歲的超級學生,基礎很紮實,學習能力極強,但還需要去具體的領域深入學習。這個視角的轉變其實挺重要的。它意味著 AI 的部署方式會完全不同。不是丟給你一個成品,而是一個可以不斷成長的學習者。它會像新員工一樣進入組織,在實際工作中學習和成長。想想看,如果有一天你的公司招了一個 AI 同事,它剛來的時候什麼都不會,但學東西特別快,六個月就能獨當一面,這是不是比一個號稱什麼都會但實際上處處出錯的 AI 更靠譜?6為什麼他現在更看重"讓大家看到"這件事Ilya 坦承,他這一年思路變化最大的地方,就是越來越認識到漸進式部署的重要性。原因很簡單:我們在討論一個還不存在的東西,而這東西又太難想像了。就像你跟一個年輕人描述年老體衰是什麼感覺,對方再怎麼努力想像,也還是會回到現實中來,覺得那離自己很遙遠。AGI 也是一樣。所有關於它的問題,歸根結底都是關於"權力"的問題。當權力真的很大的時候,會發生什麼?沒人能想像。所以最好的辦法就是:展示出來。讓人們看到 AI 在變強,看到它能做什麼,不能做什麼。這比寫一千篇文章都管用。你寫一篇文章說 AI 會怎樣怎樣,大家看完就當個觀點了。但當你看到一個 AI 真的在做那些事情,感受是完全不同的。這也是為什麼 Ilya 認為,未來會看到競爭激烈的公司開始在 AI 安全問題上合作,會看到政府和公眾要求採取行動。因為當 AI 足夠強大到讓人"感受到"它的力量時,所有人的行為模式都會改變。7回到那個本質問題整個訪談下來,有一個問題始終懸在那裡:為什麼 AI 的泛化能力這麼差?這不僅僅是樣本效率的問題,也不僅僅是需要可驗證獎勵的問題。更深層的是,為什麼教會 AI 我們想要它學的東西,比教會一個人難得多?Ilya 說他對這個問題有很多想法,但現在不是所有機器學習的想法都能自由討論。這句話說得有點神秘,但背後的意思很清楚:真正的突破可能需要一些根本性的範式轉變,而這些轉變在競爭環境下很難公開討論。不過有一點是確定的,人類能做到,就說明這條路是通的。問題只是我們還沒找到那個關鍵的機器學習原理。8寫在最後當大家都在談論投資額度、算力規模的時候,也許我們該停下來想想:真正重要的是什麼?Ilya 的訪談提醒我們,AI 發展到現在,瓶頸已經不在算力了。真正的挑戰是,如何讓 AI 像人一樣學習,像人一樣泛化,像人一樣在少量樣本下就能理解世界。這需要新的想法,新的研究範式。這也是為什麼 Ilya 說,我們正在從規模時代回到研究時代。只不過這一次,我們手裡有了更大的電腦。對於普通人來說,這意味著什麼呢?也許意味著 AI 的發展不會像很多人想的那樣一蹴而就。它會是一個漸進的過程,會有反覆,會有意外,也會有驚喜。而我們需要做的,是在這個過程中保持清醒,既看到 AI 的潛力,也認識到它的侷限。最重要的是,保持好奇心。因為接下來這幾年,可能會是 AI 歷史上最有意思的一段時間。不是因為錢多,而是因為真正的智慧之爭才剛剛開始。 (非著名程式設計師)
麥肯錫再發重磅報告:AI技能夥伴時代《Agents, robots, and us》01|人仍然是關鍵,但參與方式正徹底改變
11 月 25 日,麥肯錫全球研究院(MGI)發佈了一份60 頁的新報告——《Agents, robots, and us: Skill partnerships in the age of AI》。(AI技能夥伴)這份報告關注的不是“AI 會不會讓人失業”這種老話題,而是一個更本質的問題:在 AI 主導的新一輪生產力躍遷中,工作是如何被重新拆解、組合與分工的?人、AI 智能體(agents)和機器人,將如何形成新的“技能夥伴關係”?一、報告主要研究目標從問題上看,它圍繞三件事展開:1.AI 能做多少原本由人完成的工作?以“技術可行的自動化潛力”為基準,評估今天的 AI/機器人,理論上能接手多少美國現有工作時長(答案是:57% 的工時可以被自動化,但這不是裁員預測,而是任務結構重排)。2.在人–機協作下,那些技能會被“放大”,那些會被“擠壓”?報告通過一個新的 Skill Change Index(技能變化指數),測算未來 5 年裡不同技能被自動化影響的程度,識別出:會被衝擊最大的:數字技能、資訊處理類技能變化最小的:照護、服務、陪伴等“助人類技能”組織需要怎樣重設計工作流,才能真正把 AI 的價值“兌現”為生產率和經濟價值?核心結論之一是:到 2030 年,如果企業圍繞「人–智能體–機器人協作」重構工作流,而不僅是零散做工具替換,美國有望額外釋放 約 2.9 兆美元的經濟價值。二、報告的研究方法和樣本:這份報告的“底層資料”和“分析方法”都比較硬核,可以簡單理解為三層:任務與職業層面:結合美國勞工統計局、O*NET 等資料庫,對約 800 種職業進行“任務拆解”,判斷每一類任務被 AI/機器人自動化的技術可行性。技能層面:基於 Lightcast 的招聘巨量資料,分析 1,100 萬條招聘資訊,提取出約 6,800 個技能項,看不同職業真實在招什麼技能、那些技能正在變“熱”、那些開始降溫。時間演化 + 場景建模:在“中位情景”的假設下,測算到 2030 年的自動化採用節奏,並通過 Skill Change Index衡量各類技能在 5 年內的“結構性位移”,再疊加對典型場景的工作流重構分析。報告也明確說明:這些都是對“工作內容”和“技能結構”的預測,而不是對就業總量的絕對判斷——歷史經驗告訴我們,技術每一輪都會擠掉一部分崗位,但也會在別處創造新的工作。注意:樣本主要基於美國勞動力市場,是否完全適用中國及全球市場需謹慎參考。三、報告給出的幾個關鍵結論:未來的工作形態 = 人 + Agents + 機器人今天的技術理論上可以自動化超過 一半的工作時間,但更大的變化不是“崗位消失”,而是工作被拆分、重組,越來越多崗位變成人機協作的混合體。70% 以上的人類技能會繼續被需要,但使用場景會遷移大部分今天企業在招聘的技能,其實同時存在於“可自動化工作”和“不可自動化工作”裡——意味著技能不會突然過時,而是從“自己做”變成“借助 AI 做得更多、更好”。Skill Change Index:誰被 AI 衝擊最大?受影響最大的:會計、編碼等高度專業、又高度可自動化的技能變化最小的:談判、教練、關懷等強依賴人際互動的技能AI 流利度(AI fluency)正在成為“第一新基礎技能”過去兩年,招聘啟事裡對 “AI 流利度”(使用與管理 AI 工具能力)的需求,增長了近 7 倍,是所有技能裡漲得最快的。到 2030 年,2.9 兆美元的價值取決於一件事:你是“裝 AI”,還是“重做工作流”簡單把 AI 當外掛,價值有限;只有圍繞 AI 重設流程、角色、指標與文化,才可能真正吃到這波紅利。四、完整整報告分為60頁(可後台私信發PDF/PPT),核心是四個章節,包括:第一章:Workforce of the future:未來勞動力的基本形態——人、智能體、機器人如何分工協作?第二章:How AI changes skills:技能結構如何重排?Skill Change Index 告訴我們什麼?第三章:Reimagining workflows:不再是“自動化幾個任務”,而是“圍繞 AI 重畫整條工作流”。第四章:Leadership challenges:領導者如何重新定義角色、重塑組織,並在安全、責任、信任之間取得平衡?五、今天這篇,是第一期:聚焦「未來勞動力」這一章未來勞動力將是「人 × Agents × 機器人」的協作夥伴關係AI 正在重新定義工作的邊界,並開啟新的生產力潛能。未來的工作模式,將被重構為由人類、AI 智能體(agents)和機器人共同組成的協作體系。1.1 AI 讓 Agents 與機器人更加自主、更具能力在過去的一個世紀裡,機器基本都是按照規則運作的:機器人執行固定的物理動作,例如裝配零件;軟體自動化處理可預測的文書和分析任務。這兩類機器都遵循預設程序,只能按照指令行事,難以超越規則。而如今 AI 的崛起,正在改變這一點,並顯著拓寬自動化能做到的事情。AI 讓 agents 與機器人具備了新的能力:可以從海量資料中學習可以模擬推理可以響應更廣泛的輸入(包括自然語言)可以根據情境變化自動調整,而非只執行預設流程因此,agents 與機器人能夠分別承擔 認知性任務與 物理性任務,且能力持續提升。1.2 AI 能影響所有類型的工作麥肯錫將工作分為兩類:物理性工作(需要機器人自動化)非物理性工作(需要 agents 自動化)雖然並非所有自動化都需要嚴格意義上的“AI 智能體”或“機器人”,但報告使用這兩個術語來概括所有能夠自動化工作的技術形態。在美國,非物理性工作佔總工作時長的三分之二。在這三分之二中:約三分之一依賴社會與情緒技能——目前仍主要超出 AI 能力範圍其餘部分包括推理、資訊處理等任務——這類任務更適合自動化這些更“可自動化”的活動:佔美國總工資的 約 40%分佈在教育、醫療、商業、法律等多類崗位中(對應報告 Exhibit 1 的結論)1.3 AI 驅動的自動化將重塑工作,但“人”仍然不可或缺以當前的技術能力來看,AI 智能體(agents)理論上能夠承擔 佔美國工作時長 44%的任務,而機器人能夠承擔 13%(見 Exhibit 2)。要讓自動化進一步擴展,還需要突破一系列目前尚未被機器匹配的人類能力:對 agents 來說:必須能理解意圖、情緒等更細膩的人類線索;對機器人來說:必須掌握更高精度的精細動作控制,例如抓取易碎物品、或在手術中操控精密器械。換句話說,自動化能替代的部分會繼續擴大,但人類的判斷力、情緒理解力、精細動作能力,仍然是技術難以跨越的關鍵分界線。佔當前工作時長一半以上的任務在技術上都有可能被自動化,主要由 AI 智能體(agents)完成。但這並不意味著“一半的工作崗位會消失”。真正發生的是:具體任務被自動化,人類的工作內容會被重新組合,而不是被整體替代。此外,那些高度依賴 社會與情緒技能的工作,即便在“全面採用 AI 的極端場景下”,仍然難以被技術替代。原因在於,這類工作需要即時的人類洞察,例如:老師需要讀懂學生的表情反應銷售需要感受到客戶何時開始失去興趣人類還能提供:監督質量控制以及“客戶、學生、病患更願意與之互動”的人類存在感1.4 隨著技術進步,仍需人類參與的工作也在變化隨著技術的發展,屬於人類的工作也在不斷演化:有些角色會縮小有些會擴張或改變重點也會出現全新的崗位放射科就是一個典型案例。儘管 AI 在醫學影像領域的能力顯著提升,但 2017–2024 年間,放射科醫師就業仍以每年約 3% 的速度增長,並預計繼續增長。原因是:AI 提升了放射科的效率和精準性,讓醫生能專注於複雜判斷和患者關懷。例如:梅奧診所(Mayo Clinic)自 2016 年以來將放射科團隊擴充了 50% 以上同時部署了 數百個 AI 模型用於影像分析輔助1.5  AI 正在催生新型工作與角色——七大典型角色AI 不是只會“減少舊崗位”,它也在創造新崗位:軟體工程師正在開發、訓練、最佳化智能體設計師與內容創作者使用生成式 AI 生產新內容即:AI 既重塑舊職能,也在催生全新的技能需求。不同職業中“人、智能體(agents)與機器人”的組合形式,呈現出七種不同的典型模式。一個經濟體的整體就業水平和職業構成都取決於行業如何演進。而在具體職業內部,工作的配置方式也因對物理能力、認知能力以及社會與情緒能力的依賴程度不同而呈現顯著差異。為了理解這種差異,麥肯錫分析了約 800 個職業,並根據其物理與非物理任務的可自動化潛力進行分類。由此形成了七種原型,用以展示在人、智能體和機器人之間可能出現的協同方式。自動化潛力最低的職業被歸類為以人為中心(people-centric);而那些包含大量可自動化任務的職業,則被劃為以智能體或機器人為中心(agent-centric 或 robot-centric)。此外,還有一些在三者之間比例更為均衡的角色,被歸入“混合型”原型,它們在工作中同時包含大量由人、智能體或機器人承擔的內容(見 Exhibit 3)。這一框架適用於各類勞動力市場,幫助領導者判斷那些崗位將率先受 AI 影響、勞動力轉型將如何發生,以及那些角色會演化為“人與智能體與機器人協作”的新型工作模式。對個人來說,它也提供了理解自身崗位未來變化的清晰視角。在職業軸的一端,是 以人為中心的職業(如醫療、建築、維修),佔美國崗位約三分之一,平均薪酬 71,000 美元。這些崗位中近一半的工時涉及當前技術無法複製的身體活動,因此難以自動化。在另一端,是 高度可自動化的職業,約佔 40% 的就業,平均薪酬 70,000 美元,主要屬於法律、行政等“智能體中心型”崗位,包含大量可由 AI 處理的認知任務。部分任務未來可能完全自動化,但仍需要人類監督和驗證。其中一部分是 機器人中心型崗位(如司機、裝置操作員),平均薪酬 42,000 美元,理論上幾乎可完全自動化,但現實成本與風險讓人類短期內仍難以完全退出。規模更小的 智能體–機器人混合崗位佔約 2%,主要在自動化製造、物流等場景,由 AI 軟體指揮物理系統。在兩個極端之間,是佔勞動力三分之一的 混合型崗位。這些崗位在人、AI 智能體和機器人之間的分工不同,但共同特點是:人類仍然不可或缺,只是角色將從“親自執行”轉向“指導與協調機器”。混合型崗位包括:人–智能體崗位(教師、工程師、金融專家),平均薪酬 74,000 美元,佔比 20%;人–機器人崗位(維修、建築),81% 為體力任務,平均薪酬 54,000 美元,佔比不足 1%;人–智能體–機器人崗位(交通、農業、餐飲),平均薪酬 60,000 美元,佔比 5%。總體而言,這些結論描述的是“技術上可能的未來”,而實際落地速度將因行業、成本與流程調整而顯著不同。但可以確定的是:人與智慧型手機器的協作,將在未來的所有工作場景中不斷深化。 (AI組織進化論)
2026最具影響的10大科技主線
2026 十大科技主線:從“算力底座”到“場景爆發”的躍遷(按產業成熟度與政策催化力度排序,僅供參考)人工智慧+:從“工具”到“作業系統”2026 年,AI 不再是輔助工具,而是千行百業的“新作業系統”。國家發改委已明確在製造、醫療、金融等 8 大行業推出“AI+”實施細則。多模態大模型(文字-圖像-視訊-3D 一體化)與領域專用語言模型(DSLM)走向成熟,企業可將通用大模型“蒸餾”為行業小模型,實現低成本、高精度落地。Gartner 預測,到 2028 年,50% 以上的生成式 AI 模型將是 DSLM。普通人用自然語言就能指揮 ERP、CAD、BI,生產力門檻被徹底削平。智算經濟:算力即生產力,液冷即競爭力2026 年全球 AI 伺服器出貨量再增 20%,單晶片 TDP 突破 1000 W,風冷全面讓位於液冷。北美 CSP 資本開支激增,帶動“東數西算”進入 2.0:西部綠電匹配東部需求,形成全國一體化算力網。GPU/ASIC 多元競爭(輝達 B300、AMD MI400、雲廠商自研)拉低算力價格,中小企業首次可按需訂閱超算資源。智算中心將成為繼電網、高鐵之後的第三大基礎設施。晶片經濟:2 nm 量產 + 3D 封裝重塑全球分工台積電、三星、英特爾同步量產 2 nm GAAFET,CoWoS/SoIC、EMIB/FOVEROS 等 3D 封裝把 HBM、CPU、GPU 堆成“超級晶片”。地緣政治倒逼國產替代:華為昇騰 910C、寒武紀 590 進入主流 CSP 採購清單,國產 EDA、光刻膠、RISC-V IP 訂單爆發。晶片設計-製造-封測“全鏈國產化”完成 0→1 後,下一步是 1→10 的成本與良率攻堅。新能源智駕:800 V 高壓 + 城市 NOA 的“iPhone 時刻”2026 年中國 L2+ 滲透率超 60%,城市 NOA 成為 20 萬元級新車標配。800 V 高壓平台 + SiC 器件實現“充電 10 分鐘,續航 400 km”,緩解補能焦慮。工信部啟動“智能網聯汽車准入和上路通行試點”,北京、深圳、合肥等地開放 1000 km 全無人測試路段。特斯拉 FSD 入華倒逼本土演算法迭代,資料閉環 + 影子模式成為護城河。人形機器人:量產成本跌破 15 萬元,場景從工廠到客廳2026 年全球出貨量預計突破 5 萬台,年增 700%。特斯拉 Optimus、小米 CyberOne、優必選 Walker X 同步量產,關節模組(PEEK 材料 + 六維力感測器)國產化率升至 70%。工業場景率先落地:3C 裝配、物流分揀、高危巡檢;家庭場景緊隨其後:老人陪護、兒童教育。開源 ROS 3.0 降低二次開發門檻,催生“機器人 App Store”。低空經濟:空域改革 + eVTOL 量產,打開“三維交通”2026 年中國低空經濟規模突破 1 兆元。《低空飛行管理條例》正式施行,3000 米以下空域分級分類開放。億航 EH216-S、峰飛盛世龍獲 TC 證,廣州-深圳-珠海“空中計程車”航線試營運。無人機物流進入“15 分鐘配送圈”,順豐、京東在珠三角日飛 1000 架次。低軌衛星 + 5G-A 建構“空天一體”通訊網,破解低空監管難題。數字經濟:資料要素 × 千行百業2026 年,國家資料局發佈《資料要素流通標準》,公共資料授權營運全面推開。企業端,資料資產入表(IASB 新規)催生“資料資產負債表”新職業;個人端,區塊鏈 + 隱私計算讓“我的資料我做主”成為現實。典型場景:醫療資料訓練 AI 診斷、交通資料最佳化紅綠燈、農業資料指導精準種植。資料交易規模有望突破 3000 億元,成為 GDP 新增長極。量子科技:從“實驗室”到“專用機”2026 年,中國“悟空”量子電腦發佈 1000 量子位元專用機,聚焦藥物分子模擬、金融組合最佳化。合肥、深圳、北京三地量子產業園落地,形成“上游稀釋製冷機—中游量子晶片—下遊行業演算法”全鏈生態。通用量子電腦仍遙遠,但“量子 + AI”混合演算法已在銀行風控、電網調度中實現 10 倍加速。央行設立 100 億元量子科技專項再貸款。新能源經濟:光儲氫氨醇一體化2026 年,中國太陽能元件價格跌破 0.8 元/W,儲能度電成本降至 0.3 元,綠氫在長三角、珠三角率先平價。《可再生能源法》修訂草案首次將“綠氫”納入可再生能源範疇。隆基、陽光電源推出“太陽能-制氫-合成氨”一體化集裝箱,解決新能源消納與長時儲能難題。歐盟 CBAM 碳關稅倒逼中國綠電制氨、綠甲醇成為國際船燃新寵。醫療生物:AI 製藥 + 腦機介面進入臨床2026 年,首款由 AI 設計的小分子藥物通過 FDA 加速審批,研發周期從 10 年壓縮至 3 年。華為“盤古藥物分子大模型”、英矽智能 PHARMA.AI 與 50 家 MNC 簽約。腦機介面方面,Neuralink 競品“北腦一號”完成 100 例帕金森臨床植入,實現意念控制機械臂。國家衛健委發佈《腦機介面臨床倫理指引》,為行業劃紅線。消費級應用:睡眠監測頭環、抑鬱情緒干預耳機登上電商爆款榜。 (TOP行業報告)