#AGI競賽
蘭德智庫—生存還是毀滅?大國AGI競賽或觸發“預防性戰爭”
導讀近期,蘭德智庫發佈重磅報告,聚焦通用人工智慧(AGI)突破對地緣政治穩定的衝擊,並首次系統評估了國家採取“預防性行動”阻止對手率先掌握AGI的風險邏輯與觸發條件。AGI為何被視為“國家生存威脅”?各國又會採取那些預防措施?本期將帶你深入瞭解AGI競賽中的潛在衝突情景。一、AGI作為“國家生存威脅”的四大能力報告將AGI可能帶來的顛覆性影響歸納為四類:—— 超級進攻與網路攻防能力,其他國家將無法保護自己的進攻性軍事和網路力量;—— 戰略防禦屏障,當敵方攻擊時(尤其是大規模核打擊)具有不可摧毀性;—— 爆炸式經濟增長,重塑國際權力分配;—— 大規模資訊操控,可以有效操縱和重新程式設計敵對政治系統的資訊控制工具,直接干預他國內政。報告指出,一旦某一國家確信對手即將獲得上述能力,就可能將AGI視為“不可接受的生存威脅”。二、預防性行動與歷史鏡鑑報告將國家可選策略置於“競爭—合作—破壞”光譜上(由溫和到極端):1.預防性行動加速追趕(Run Faster):最明顯的應對辦法就是拚命訓練、加班趕工,跑得更快。如果能憑實力反超對手,問題自然解決。合作或利誘(Co-opt):另一組選項是與(包括潛在獲勝者在內的)其他國家合作或加以利誘,以達成雙贏安排。比如,技術共享、聯合研發、市場准入換取安全承諾。預防性行動(Preventive Action):從出口管制、資料投毒、網路攻擊到針對資料中心或研發設施的軍事打擊,乃至預防性戰爭。預防性行動的最極端形式就是預防性戰爭。2. 歷史鏡鑑通過對1914年德國對俄預防性戰爭、1981年以色列空襲伊拉克核設施、2025年美以對伊朗核設施聯合空襲等案例的比較,報告認為AGI與核武器在“不可容忍的延遲後果”與“高度不透明的發展進度”上具有相似性,因此預防性動機會被顯著放大。經濟-技術破壞:最溫和的預防性措施——例如冷戰期間美國主導的巴黎統籌委員會(CoCom)機制,曾嚴格限制向蘇聯出口先進技術。定點物理破壞:伊朗和以色列都曾對伊拉克奧西拉克核反應堆實施空襲,以阻止薩達姆·侯賽因的核武器項目。預防性戰爭:英國曾先後對中立國丹麥(1801 年和 1807 年)和法國(1940 年 7 月和 8 月)發動海軍攻擊,以防止其主力艦隊落入拿破崙法國和納粹德國之手。過去70年,從出口管制到空襲核反應堆,人類已經用遍了“預防性工具箱”。當AGI被視為“下一個核武器”時,這些工具會被再次拿出來,而且使用門檻更低、決策時間更短、誤判空間更大。三、兩大沖突情景1. 阻止霸權當一國判斷對手即將率先實現AGI且優勢不可追趕時,可能冒險發動破壞行動。在 AGI 競賽中,若一國預計對手將率先撞線,它就仍有動機在“還能動手”的階段去阻撓或拖延威脅——那怕手段只是孤注一擲。現實主義國際關係學者早就指出,當一個國家即將成為全球霸主時,其他大國會被倒逼著聯手阻止它。一旦對手拿到AGI,就可能利用新獲得的“超能力”發動攻擊或訛詐;若這等於自己必敗甚至亡國,那麼對更強大對手發動一次高風險突襲也可能是“理性選擇”。在這種情況下,預防性行動可以發生在兩個時間點: AGI 競賽終點前夜,最終獲勝者的身份變得清晰,勝負已隱約可見; AGI 黎明期間,在控制 AGI 的國家剛取得突破、尚未把 AGI 轉成實戰能力,有時間實施其新創造的軍事潛力之前。2. 保護壟斷率先取得AGI的國家為防止追趕者翻盤,也可能先發制人地壓制潛在競爭者。“已取得 AGI 的強國”為了維護自身地位,主動採取預防性行動來威懾、壓制或消滅潛在乃至現實的威脅。先拿到 AGI 的國家,即便沒有征服世界的野心,也可能強烈傾向於“提前動手”——只要發現任何對手似乎有能力複製其成就。正如某些分析家所言,如果美國率先取得 AGI,那將獲得“不可追趕的戰略優勢”,其核心含義就是:有能力支配,甚至必要時摧毀任何試圖挑戰其領導地位的後來者。四、導致不穩定的因素當兩個國家在AGI競賽中感到“必須搶先行動”時,局勢就容易變得不穩定。影響這一局勢的因素包括:對AGI軍事能力的認知——如果相信AGI能“零傷亡滅國”,就可能覺得“再不行動就完了”;AGI轉化速度——如果部署迅速,衝突風險增加;對AGI防禦效果的信任——如果相信AGI能攔截核導彈,威懾力會變弱;優勢持續時間——優勢越短,先發衝動越強;國家意圖的可信度——只要被視為“可能統治全球”,就會激發預防性攻擊;技術擴散風險——如果AGI難以控制,危險性更大等。儘管有各種因素推動預防行動,但實際決策還受到政治、心理和社會因素影響,領導人通常會權衡成功的可能性與風險,從而影響是否採取激烈措施。 (稻香湖下午茶)
阿里Qwen3真能以1/3參數成本撬動AI大格局?
4月29日凌晨,阿里巴巴宣佈開源新一代通義千問模型Qwen3(千問3),這款被官方稱為“國內首個混合推理模型”的大模型,以參數量僅為DeepSeek-R1的1/3、成本下降70%、性能全面超越全球頂尖模型的亮眼表現,迅速登頂全球開源模型榜單。01國內首個混合推理模型Qwen3首創的“混合推理模型”架構,將人類認知的“快思考”(直覺反應)與“慢思考”(深度推理)機制融入同一模型。當面對簡單問答時,模型僅啟動22B參數實現“秒級響應”,而遇到複雜數學推導、程式碼生成等任務時,則呼叫全量參數進行多步驟深度思考。Qwen3提出的“快思考(直覺決策)”與“慢思考(深度推理)”整合架構,本質是對人類雙系統思維的AI化重構。·快思考層:基於輕量化子模型實現毫秒級響應,處理常識問答、簡單決策等高並行場景;·慢思考層:啟動複雜推理模組,通過動態路由機制攻克數學證明、程式碼生成等需深度思考的任務;·混合編排系統:即時評估任務複雜度,在能耗、時延、精度間實現動態平衡,相比傳統單一架構推理效率提升40%以上(據阿里內部測試資料)。這種“彈性計算”模式打破了“越大越好”的慣性思維,使模型在參數量減少67%的情況下,仍在MMLU、GSM8K等核心基準測試中超越DeepSeek-R1 5-8個百分點。動態資源分配機制,使得其30B參數的MoE版本性能超越上代32B密集模型,實現10倍以上的性能槓桿。對比DeepSeek-R1的671B總參數和37B啟動參數,Qwen3以235B總參數、22B啟動參數的“輕量級”設計,在AIME25奧數測評中斬獲81.5分(超越DeepSeek-R1的79.8分),LiveCodeBench程式碼測試突破70分(超過Grok-3的68分)。這種“四兩撥千斤”的效果,源於其預訓練資料量達36T的龐大規模,以及後訓練階段多輪強化學習的精準調優。值得注意的是,Qwen3系列覆蓋了從0.6B到235B的多樣化參數規模,並支援高達128K的上下文窗口長度。這種“參數階梯化”佈局既滿足了邊緣裝置(如手機、IoT)的輕量化需求,又為高性能計算場景提供了旗艦級模型選擇。而MoE架構的引入,進一步實現了“小而強大”的目標——例如,Qwen3-235B-A22B在僅啟動9.4%參數的情況下,性能已超越全參數運行的上一代模型。02性能登頂全面碾壓全球頂尖模型Qwen3的發佈直接挑戰了全球開源模型的競爭格局。根據官方披露,其在ChatBot Arena、GPQA、AIME24/25等權威評測中,性能全面超越DeepSeek-R1、OpenAI-o1、Grok-3等對手。以邏輯推理能力為例,在Meta首席科學家楊立昆領銜設計的“最難評測榜”LiveBench中,Qwen3-32B的得分超過OpenAI-GPT-4.5preview和Google-Gemini2.0,展現出接近人類專家的複雜問題解決能力,而在BFCL(函數呼叫精準性測試)和LiveCodeBench(動態程式設計評測)中,Qwen3的程式碼糾錯和API呼叫精準率領先行業標竿5%-8%。同時,Qwen3的預訓練資料量達36兆token(Qwen2.5的2倍),涵蓋119種語言和方言,通過Qwen2.5-Math、Qwen2.5-Coder等專家模型合成高品質數學與程式碼資料。03模型成本最佳化的“摩爾定律”正在形成Qwen3的突破不僅在於性能提升,更在於商業化門檻的顛覆性降低。其旗艦版Qwen3-235B-A22B僅需4張H20顯示卡即可部署,視訊記憶體佔用僅為同類模型的1/3。相較於DeepSeek-R1需要數十張高端顯示卡的部署成本,Qwen3的硬體投入下降65-75%。這種成本優勢直接反映在API服務定價上,開發者可通過“思考預算”設定靈活控制推理資源消耗。這種成本優勢的底層邏輯,是阿里雲在模型架構與工程實現的協同創新。通過將非思考模式無縫整合到MoE架構中,Qwen3在保持2350億總參數規模的同時,日常互動場景的實際算力消耗僅相當於220億參數模型。這種設計思路與DeepSeek-R1追求極致參數規模(671B)形成鮮明對比,標誌著中國AI產業從“暴力堆料”向“精準效能”的戰略轉型。簡單來說,Qwen3的突破性在於首次實現“性能提升+成本下降+開源開放”三位一體——·訓練成本:依託阿里自研的“分階段知識蒸餾”技術,將千億參數模型的知識遷移至300億級架構,訓練能耗降低60%;·推理成本:混合架構使簡單任務無需喚醒大參數模組,日常場景推理費用可控制在GPT-4 Turbo的1/20;·生態槓桿:作為國內首個支援MoE(混合專家)結構的開源模型,開發者可自由拆解組合功能模組,大幅降低定製化成本。這意味著AI應用的經濟學模型被改寫——當10億美元級訓練投入不再是入場券,中小企業將真正獲得與大廠同台競技的機會。04中美技術路線的再次分野阿里此次開源8款Qwen3系列模型(含2款MoE和6款密集模型),允許免費商用的策略,直接衝擊了DeepSeek-R1建立的開源生態優勢。此前DeepSeek雖開源了R1模型,但其660億參數規模對中小開發者仍存在部署門檻。而Qwen3-0.6B到235B的全系列覆蓋,特別是僅需手機端等級算力的0.6B版本,極大拓展了AI模型的落地場景。值得關注的是,Qwen3與DeepSeek-R1的技術路線差異折射出中美AI競賽的新態勢:前者通過強化學習最佳化小模型性能(95.6分人類偏好對齊得分超越OpenAI-o1),後者則持續衝擊參數邊界。這種分化在硬體層面同樣顯著——Qwen3對國產H20顯示卡的深度適配,與DeepSeek依賴輝達高端晶片形成對比,暗合中國算力自主化戰略。05點評AGI競賽的下半場儘管Qwen3在多項指標上實現突破,但行業仍存隱憂,一方面,混合推理模型對複雜任務的分層處理機制,可能在高階邏輯鏈場景暴露系統誤差;另一方面,開源生態的繁榮需要配套工具鏈支援,當前魔搭社區與HuggingFace的整合度尚待驗證。阿里披露的未來計畫——擴展資料規模至100T、延長上下文至百萬token、融合多模態能力——預示著更激烈的AGI競賽。這場以小博大的技術革命,或許正在改寫全球AI規則書。當參數規模不再是性能的唯一標尺,中國科技企業展現的架構創新與工程化能力,正在為後摩爾定律時代的智能計算開闢新航道。 (壹零社)