#AI系統
五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統/美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢
美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢/五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統/快手遭網路攻擊股價下跌6%,直播功能已恢復/輝達重組雲業務團隊,戰略重心轉向內部AI開發Starlink使用者突破900萬,覆蓋155個國家要點一:使用者規模快速增長,日增2萬新使用者SpaceX旗下衛星網際網路服務Starlink於2025年12月23日宣佈,其活躍使用者數已突破900萬,覆蓋全球155個國家、地區和其他市場。該公司官方聲明稱:"Starlink正在為超過900萬活躍使用者提供高速網際網路連接。"這一資料相較於2024年11月5日公佈的800萬使用者增長了100萬,意味著Starlink平均每天新增約2萬名使用者。根據此前資料,Starlink在2024年12月擁有460萬使用者,到2025年8月增至700萬,顯示出持續的強勁增長勢頭。Business Insider要點二:全球擴張計畫持續推進,商業化處理程序加速Starlink的快速增長得益於SpaceX持續部署衛星星座和拓展服務區域。該服務已成為偏遠地區和傳統網際網路基礎設施不足地區的重要解決方案。馬斯克在社交平台X上對團隊表示祝賀,稱這是"Starlink團隊的出色工作"。值得注意的是,Starlink從2022年12月的100萬使用者增長到2024年9月的400萬使用者,再到如今的900萬,顯示出指數級增長趨勢。分析認為,隨著衛星部署的持續推進和服務質量的提升,Starlink有望在2026年實現更大規模的使用者增長,其商業化處理程序也在不斷提速。Wikipedia川普政府改革H-1B簽證制度,2026年2月生效要點一:取消抽籤制度,採用薪資加權選拔系統美國國土安全部(DHS)於2025年12月23日正式發佈最終規則,將取消現行的H-1B工作簽證隨機抽籤制度,改為基於薪資水平的加權選拔系統。新規將於2026年2月27日生效,趕在2026年春季年度抽籤之前實施。根據該規則,簽證分配將優先考慮獲得更高薪資、具備更高技能的外籍工作者。美國公民及移民服務局(USCIS)在聲明中表示:"新規則用一個更注重申請人技能水平的程序取代了隨機抽籤,給予高技能人士更大的權重。"這一變革標誌著H-1B簽證制度自1990年設立以來最重大的改革之一。USCIS要點二:四級薪資等級差異化選拔,引發業界關注根據新規則,H-1B申請將按照勞工部職業就業和工資統計(OEWS)系統的四級薪資等級進行加權選擇。較高薪資等級的申請將獲得更高的中籤機率,旨在確保H-1B簽證分配給真正的高技能、高價值崗位。美國經濟時報報導稱,川普政府此舉旨在"優先保護美國工人",同時吸引全球頂尖人才。該政策引發了科技行業的廣泛討論,支持者認為這將提升H-1B項目的質量,反對者則擔心這可能增加中小企業招聘外籍人才的難度。法律專家指出,新系統將從根本上改變企業的招聘策略和薪酬結構設計。Fisher Phillips美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢要點一:關稅將於2027年6月實施,初期稅率為零美國貿易代表辦公室(USTR)於2025年12月23日宣佈,將對中國半導體進口徵收新關稅,但實施時間推遲至2027年6月23日,且初期18個月內關稅稅率為零。具體稅率將在實施日期前至少30天公佈。該決定是對拜登政府一年前啟動的"301條款"調查的回應,該調查針對中國"傳統製程"(legacy)晶片的出口行為。USTR在聲明中表示:"中國針對半導體行業尋求主導地位的做法是不合理的,對美國商業構成負擔或限制,因此是可訴的。"值得注意的是,拜登政府已在2025年1月1日對中國半導體加征50%的關稅,新關稅將在此基礎上疊加。Reuters要點二:推遲關稅旨在維護中美貿易緩和,避免供應鏈衝突升級川普政府推遲關稅實施的決定被視為維護與中國貿易緩和的戰略舉措。近期,作為與中國談判的一部分,美國推遲了限制對已被列入黑名單的中國企業單位出售美國技術的規定,並啟動了可能首次向中國出貨輝達次強AI晶片的審查。分析人士指出,華盛頓此舉旨在緩解與北京的緊張關係,同時應對中國對全球科技公司依賴的稀土金屬出口管制。中國駐華盛頓大使館對任何關稅表示反對,稱"將貿易和技術問題政治化、工具化和武器化,破壞全球產業鏈和供應鏈穩定,對任何人都沒有好處,最終將適得其反。"美國晶片行業目前正等待另一項更廣泛的"232條款"國家安全調查結果,該調查可能對全球晶片進口徵收更多關稅。BloombergAI生成工具被曝可製作非同意式比基尼深偽圖像,Reddit封禁相關社區要點一:Google和OpenAI圖像生成工具存在安全漏洞,可製作著裝深偽圖像《連線》雜誌於2025年12月23日報導,Google的Nano Banana Pro和OpenAI的ChatGPT Images等主流AI圖像生成工具存在嚴重安全漏洞,使用者可利用這些工具將穿著完整服裝的女性照片修改為比基尼深偽圖像。在已刪除的Reddit帖子"gemini nsfw image generation is so easy"中,使用者交流如何繞過Gemini的安全防護措施生成露骨圖像。一名使用者上傳了一張身穿印度紗麗的女性照片,要求"脫掉"衣服並"換上比基尼",隨後有人利用AI工具滿足了這一請求。《連線》在有限測試中確認,使用基本的英語提示即可在Gemini和ChatGPT上將穿著完整服裝的女性照片轉換為比基尼深偽圖像。Wired要點二:Reddit封禁相關社區,科技公司強化內容稽核政策在《連線》通知Reddit並要求置評後,Reddit安全團隊刪除了相關請求和AI深偽圖像,並封禁了擁有超過20萬粉絲的r/ChatGPTJailbreak社區,理由是違反平台的"不要破壞網站"規則。Reddit發言人表示:"Reddit的全站規則禁止未經同意的親密媒體內容,包括相關行為。"Google發言人回應稱,公司有"明確政策禁止使用AI工具生成色情露骨內容",並表示工具在反映AI政策方面持續改進。OpenAI發言人則表示,公司今年放鬆了ChatGPT在非性情境下成人身體的一些防護措施,但強調使用政策禁止未經同意改變他人肖像,並對生成露骨深偽圖像的使用者採取包括封號在內的行動。電子前沿基金會法律主管Corynne McSherry指出,"濫用性化圖像"是AI圖像生成器的核心風險之一,強調應關注工具的使用方式,並在造成潛在傷害時"追究個人和企業的責任"。中國MiniMax發佈M2.1模型,多語言程式設計能力顯著提升要點一:M2.1模型大幅增強Rust、Java等多語言程式設計能力中國AI創業公司MiniMax於2025年12月23日發佈M2.1模型,這是其開源M2模型的升級版本。公司聲稱M2.1在Rust、Java、Go、C++和JavaScript等程式語言的能力上實現了"顯著增強",相比之前版本更簡潔的模型響應和思維鏈。MiniMax官方表示,M2.1在八種超越Python的程式語言上實現了最先進(SOTA)的性能表現,包括Rust、Java、Go、C++、Swift、Kotlin、TypeScript和Shell指令碼。與大多數僅優先考慮Python的模型不同,M2.1針對多語言程式設計進行了最佳化,能夠處理多檔案場景,並在跨技術堆疊(Web、後端、Android、iOS)的全端開發中表現出色。MiniMax要點二:面向代理工作流設計,成本僅為競品的10%M2.1模型專為實際程式設計和AI代理(agent)工作流而設計,在agentic程式設計時代提供了成本效益顯著的解決方案。Reddit使用者討論指出,M2.1在SOTA agentic程式設計能力方面的成本僅為競品的10%,使其成為開發者和企業的經濟高效選擇。SiliconAngle報導稱,M2.1的關鍵亮點包括在多種程式語言上的卓越程式設計技能,以及更簡潔的程式碼生成和思維過程。該模型已在GitHub開源,允許開發者社區訪問和貢獻。行業分析認為,MiniMax此舉是中國AI創業公司在全球開源AI生態系統中增強競爭力的重要步驟,尤其在程式碼生成和多語言支援領域挑戰OpenAI和Anthropic等國際巨頭。SiliconAngle快手遭網路攻擊股價下跌6%,直播功能已恢復要點一:12月22日夜間遭網路攻擊,大量違規內容湧現中國短影片平台快手於2025年12月22日晚10點左右遭遇大規模網路攻擊,直播功能受到嚴重影響。據媒體報導,攻擊期間平台上突然湧現大量色情露骨內容,導致服務暫時中斷數小時。快手在12月23日凌晨發佈官方聲明確認,直播功能遭到"網路犯罪團夥的惡意攻擊",當地警方已介入調查處理。聲明表示:"在修復和恢復系統後,快手App的直播功能已逐步恢復正常服務。快手的其他服務一直保持正常運行。"據CyberSecurityMew報導,這次協同攻擊引發了大量非法直播,服務中斷數小時,並導致快手市值蒸發超過160億港元。快手IR要點二:股價跌至近五周低點,公司強調安全措施升級受網路攻擊影響,快手科技香港上市股票於12月23日下跌最多6%,至62.70港元(約8.06美元),創下自2024年11月21日以來的最低點。Tech in Asia報導稱,攻擊期間約有50,456件物品被影響,但快手強調這主要是針對直播服務的網路攻擊,而非倉儲或物流系統的物理盜竊。快手在聲明中表示,公司已採取緊急措施修復系統漏洞,加強了安全防護機制,並正在配合警方追蹤攻擊者。行業專家指出,這次事件凸顯了大型網際網路平檯面臨的網路安全挑戰,尤其是在直播等即時內容領域的防護難度。Yahoo Finance五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統要點一:Grok模型將整合至GenAI.mil平台,服務300萬軍方人員美國國防部於2025年12月22日宣佈與埃隆·馬斯克旗下的xAI公司達成合作,將xAI基於Grok系列模型的前沿AI系統直接嵌入國防部的GenAI.mil平台,目標在2026年初實現初步部署。國防部在官方聲明中表示:"此次整合計畫於2026年初進行初步部署,將允許所有軍方和文職人員在最高密級環境中使用xAI的能力。"該合作將使國防部的300萬軍方和文職人員能夠安全訪問更先進的AI能力,用於增強敏感政府工作流程並支援軍事行動。新任高管Alexis Black Bjorlin將負責監督這一整合項目。War Department要點二:引發資料安全擔憂,合作細節有待披露這一合作在技術界引發了廣泛關注和爭議。Fox News報導稱,此次合作將"提升敏感政府工作流程"並"支援軍事行動",但具體的資料安全措施和應用場景細節尚未完全公開。Reddit社區BetterOffline上的討論對馬斯克公司獲得軍方敏感資訊訪問權表示擔憂。Cybernews分析指出,將Grok這樣的通用AI模型整合到軍事系統中面臨複雜的安全和倫理挑戰,包括如何確保模型不被濫用、如何保護敏感軍事資料、以及如何在戰場決策中平衡AI輔助和人類判斷。支持者認為,這一合作將使美國軍方在AI競賽中保持領先地位,而批評者則質疑私營AI公司在國防領域的角色。Fox News字節跳動2026年AI資本支出計畫達230億美元要點一:AI基礎設施投資增至230億美元,同比增長15%《金融時報》於2025年12月23日援引知情人士消息報導,中國科技巨頭字節跳動已制定初步計畫,將2026年的資本支出(capex)從2025年的約200億美元增加至約1600億元人民幣(約230億美元),用於建設人工智慧基礎設施。報導稱,約一半的預算(約850億元人民幣,約120億美元)將專門用於採購先進AI處理器,儘管面臨美國出口限制。其餘資金將用於資料中心建設、網路基礎設施和其他AI相關硬體。TrendForce分析指出,字節跳動計畫在2026年初步訂購約20,000顆輝達H200晶片,儘管這一數量可能因地緣政治因素而調整。Financial Times要點二:中國科技巨頭加速AI投資,力圖縮小與美國差距這一大規模投資計畫凸顯了中國科技公司在AI領域追趕美國競爭對手的決心。Stocktwits報導稱,字節跳動的AI資本支出計畫強調了中國科技巨頭如何競相縮小與美國競爭對手在AI資本支出方面的差距。相比之下,Meta計畫2025年AI資本支出約650億美元,微軟約800億美元,而中國最大的科技公司投資規模仍相對較小。Benzinga分析認為,字節跳動增加AI投資的背後是TikTok在美國面臨的不確定性,公司正將戰略重心轉向AI基礎設施和技術能力建設,以確保長期競爭力。值得注意的是,美國對華AI晶片出口管制可能影響字節跳動獲取最先進處理器的能力,迫使公司尋找替代方案或轉向國產晶片。Reuters中國AgiBot目標2025年營收1.42億美元,人形機器人商業化提速要點一:計畫2025年出貨5000台人形機器人,營收超10億元人民幣中國機器人創業公司AgiBot於2025年12月23日宣佈,目標在2025年實現超過10億元人民幣(約1.42億美元)的營收,並計畫出貨5000台人形機器人。公司董事長兼CEO鄧太華在周一的公司活動中透露,AgiBot的產量和銷售目標預計在2026年將保持"多倍"增長,公司正加速推進商業化處理程序。作為中國成長最快的機器人創業公司之一,AgiBot正在加速人形機器人的商業化和大規模部署。《南華早報》報導稱,AgiBot預計2025年出貨5000台人形機器人,這一數字顯著高於大多數競爭對手的目標。SCMP要點二:推出BotShare租賃平台,2026年計畫覆蓋200多個中國城市作為商業化戰略的一部分,AgiBot於12月23日推出了BotShare平台,旨在使機器人租賃像共享行動電源一樣便捷。該平台將彙集使用者、開發者、租賃服務提供商和製造商,使人形機器人更易於公眾獲取。AgiBot合夥人兼Botshare董事長江清松表示,該租賃平台計畫在2026年擴展到中國大陸200多個城市。行業背景方面,人形機器人產業正在北京政策支援下快速向商業化轉型,新一波機器人製造商之間的激烈競爭正在展開。比亞迪目標2025年生產1500台人形機器人,到2026年增加至20,000台,顯示出整個行業的快速增長態勢。Tech in Asia報導稱,AgiBot的激進目標反映了中國人形機器人行業從研發階段向大規模商業部署的關鍵轉型。阿里巴巴釘釘發佈Agent OS,押注AI智能體生態要點一:推出全球首個工作智能作業系統Agent OS阿里巴巴旗下企業協作平台釘釘於2025年12月23日在杭州舉行的活動中正式發佈Agent OS,這是一個專為AI智能體(AI agents)設計的作業系統,並同時推出了硬體產品釘釘Real,作為運行這些智能體的物理終端。釘釘創始人兼CEO陳航在活動中表示:"未來,釘釘上的所有AI智能體都將基於Agent OS建構和運行,使AI能夠直接連接物理世界。"Agent OS旨在支援能夠自主執行企業任務的AI智能體,這些智能體能夠自主規劃和執行任務,將複雜目標分解為具體行動。這一舉措標誌著釘釘從純軟體平台向AI智能體技術的全端提供商(包括硬體和軟體)演進。SCMP要點二:加入AI智能體軍備競賽,與騰訊字節跳動競爭加劇釘釘此舉正值阿里巴巴與騰訊控股、字節跳動等國內競爭對手在AI智能體領域的競爭加劇之際。Tech in Asia報導稱,DingTalk Real作為物理終端可以運行AI智能體,實現人機協作的新工作方式。釘釘在2024年4月已推出擁有超過200個AI智能體的市場,涵蓋生產力工具、行業特定服務和企業級功能。本次發佈的Agent OS進一步強化了釘釘在企業AI生態系統中的地位。阿里巴巴社區報導顯示,截至2024年3月,釘釘的付費日活躍使用者達到2800萬。分析認為,Agent OS的推出將使釘釘在中國企業AI市場中獲得先發優勢,尤其是在多智能體協作場景中。釘釘還在活動中推出了超過20款針對製造、零售、服務等行業的新AI產品,顯示其全方位押注AI智能體的戰略決心。Alizila追覓發佈全球首款AI健康眼鏡要點一:搭載高精度感測器,實現24小時健康監測追覓科技於2025年12月23日在年度經銷商大會上發佈了全球首款AI健康眼鏡。該產品以健康監測為核心切入點,配備高精度PPG(光電容積描記)光學感測器,能夠24小時監測使用者的心率、血氧飽和度和體溫等關鍵生理指標。此外,該眼鏡還能提供壓力水平和心血管健康狀況的即時反饋。追覓官方強調,這是全球首款專注於健康監測的AI眼鏡產品,區別於市場上以通訊、顯示為主的智能眼鏡。產品還搭載了追覓自研的健康AI大模型,可以記錄分析使用者的生理資料,並生成個性化的健康方案和建議。36氪要點二:進軍智能可穿戴市場,產品細節尚未完全公開追覓此次發佈AI健康眼鏡標誌著公司從傳統清潔家電領域向智能可穿戴裝置市場的戰略擴張。搜狐報導指出,追覓創始人俞浩近年來不僅在家電、手機領域佈局,還進入造車領域,並行布了AI眼鏡、戒指等多樣化產品。目前,追覓尚未公佈這款AI健康眼鏡的具體上市時間、價格以及更詳細的技術規格。知乎使用者討論認為,健康監測眼鏡市場競爭激烈,追覓需要在精準性、續航能力和使用者體驗方面證明其產品的實際價值。新浪財經報導稱,該產品的發佈是追覓AI智能硬體團隊的重要里程碑,顯示公司在智能硬體生態系統建設上的雄心。什麼值得買京東巴黎倉庫遭盜竊,損失超3億元電子裝置要點一:超5萬件電子裝置被盜,涉及榮耀OPPO等品牌法國警方於2025年12月22日披露,中國電商巨頭京東位於巴黎塞納-聖但尼省的倉庫遭遇大規模盜竊,超過5萬台3C數位裝置(包括手機、電腦和平板電腦)被盜,價值約為3700萬歐元,折合人民幣約3.06億元。據法國《巴黎人報》及franceinfo援引知情人士消息,共有50,456件電子產品被盜,涉及榮耀與OPPO兩個品牌,其中約90%為手機、平板電腦和筆記型電腦,還有部分耳機等配件。案發時間為12月21日深夜至22日凌晨,倉庫大門被撬開,22日早上倉庫管理人員上班時才發現異常。後經盤點,約30個托盤的電子產品丟失。鳳凰科技要點二:京東稱損失報導與實際有較大出入,警方已介入調查京東於12月23日深夜發佈官方聲明,確認位於法國巴黎地區的京東倉儲於台北時間12月22日遭遇盜搶,當地警方已介入調查處理。京東表示:"目前倉庫已恢復正常營運,我們正在全力配合警方追查案件。媒體報導的損失金額與實際情況有較大出入。"京東強調,近年來公司加速推進"全球織網計畫",已在全球23個國家建立倉儲網路,此次事件不會影響整體營運。游民星空報導稱,這是京東海外倉儲設施遭遇的最大規模盜竊案之一,凸顯了跨國電商企業在海外營運中面臨的安全挑戰。北京日報網指出,京東需要加強海外倉庫的安全防護措施,包括升級監控系統、增加安保人員和改進庫存管理流程。北京日報輝達重組雲業務團隊,戰略重心轉向內部AI開發要點一:DGX Cloud併入工程體系,不再積極挑戰AWS輝達在CEO黃仁勳提出打造能與亞馬遜雲服務(AWS)競爭的雲服務願景兩年多後,於2025年12月對其雲業務戰略進行了重大調整。公司近期重組雲團隊,將DGX Cloud併入工程與營運體系,重心轉向滿足內部AI開發需求,而不再專注於向外部企業客戶銷售雲服務。OSCHINA報導稱,雲團隊DGX Cloud將主要服務於輝達工程師對晶片的需求,用於開發開源AI模型,而不再與AWS、微軟Azure和Google Cloud等大型雲服務商正面競爭。新任高管Alexis Black Bjorlin將負責監督這一戰略轉型。新浪財經要點二:雲服務定價遇阻,戰略調整反映市場現實這一戰略調整表明輝達在雲服務領域遭遇了有限需求和市場阻力。騰訊新聞報導稱,為了打造雲服務,輝達從大型雲服務商那裡租用伺服器,並按照自身極為嚴格的標準進行定製,然後再將這些伺服器出租給AI開發者。但多位協助公司談判雲業務的人士透露,AI開發者對DGX Cloud伺服器的高價存在牴觸,其價格通常高於傳統雲服務商。Moomoo分析指出,輝達在提出打造可與AWS競爭的雲服務願景兩年多後作出調整,反映出在既是客戶又是競爭對手的雲服務商之間找到平衡的複雜性。搜狐報導稱,此次重組後,輝達將專注於滿足內部工程師開發開源AI模型所需的晶片需求,這一轉變標誌著公司承認在雲服務市場上直接挑戰成熟巨頭的困難。騰訊新聞 (AI Daily Insights)
這,才是真正的DeepSeek 時刻:中國主權AI 系統的輪廓已然顯現
上周,DeepSeek 發佈了新版模型,引發了市場的廣泛關注。然而,這波熱潮的源頭,並非來自模型表現的提升,也不是因為它像GPT-5 那樣的混合性質,更不是源自於其強大的智能體能力。真正的引爆點,是DeepSeek 團隊主動發佈的聲明,旨在澄清新模型中的一個數值格式選擇。聲明內容言簡意賅:UE8M0 FP8 格式,是為即將發佈的下一代國產晶片而設計的。由一則技術評論引發的市場狂潮這則評論如同一顆投入湖面的石子,立刻在中國人工智慧半導體類股激起千層浪,整個類股連續大漲兩天。中國的圖形處理單元設計公司寒武紀一馬當先,股價單日暴漲20% 觸及漲停,隔天再度大漲11%。其他人工智慧相關的公司,從老牌的阿里巴巴,到資料中心供應商、微軟的本土合作夥伴世紀互聯,股價都隨之飆升。上海和深圳的股指也在這股熱潮中全面上漲。在本文發佈時,這條攪動市場的技術評論,其點贊數正以不亞於模型發佈帖子本身的速度飛速增長。真假DeepSeek 時刻這篇關於 UE8M0 FP8 的評論,對多數人來說,可能和摩斯電碼一樣晦澀難懂,但它卻可能是真正DeepSeek 時刻的序幕。相比之下,今年一月那個曾讓整個行業和股市陷入狂熱的所謂“DeepSeek 時刻”,更像是一次虛晃一槍。當時,市場先生顯然陷入了恐慌,他先是瘋狂拋售,然後再回頭問為什麼。那場恐慌源自於幾個下意識的判斷,其中一些後來被證實,而另一些則不然:哇,中國的AI 實驗室原來這麼強! (事實如此)輝達要完蛋了,因為DeepSeek 訓練成本太低了! (並非如此)開源模型在前沿領域足以和閉源模型抗衡! (事實如此)AI 基礎建設的大規模資本投入將無以為繼! (並非如此)那天,輝達股價重挫17%。同時,市場預期AI 應用將迎來爆發,雲端軟體公司的股價反而保持堅挺。而像阿里巴巴這樣常被視為產業風向標的中國科技股,股價先是飆升,隨後又隨著最初的熱情消退而回落。在過去的幾個月裡,市場逐漸回歸理性。 AI 領域的投資邏輯,或多或少又回到了DeepSeek 出現之前的狀態——一個主要由硬體引領的局面。這個局面由輝達領頭,AMD 緊隨其後,背後是長長的晶片、記憶體和伺服器製造商名單,由能源和散熱方案商提供動力,並由科技巨頭們承諾的數千億資本開支作為燃料。這就是為什麼說,一月的那次,只是一次虛晃一槍。真正的變革:軟體定義硬體那麼,是什麼讓這次的時刻如此不同,意義更加深遠?因為DeepSeek v3.1 正在開啟一個由軟體引領的AI 發展路線圖。中國的AI 晶片製造商們,正圍繞著這個路線圖進行設計,並可能從 UE8M0 FP8 開始,將其樹立為新的行業標準。FP8 是一種資料格式,它透過犧牲精確度來換取計算效率。更高精度的格式如FP16 或FP32 雖然精確,但也更消耗運算資源和記憶體。UE8M0 是FP8 格式的一種極端變體。它將用於表示精度的“尾數”部分降為0,以此換取極高的記憶體效率。這個設計,讓那些採用非頂尖製程(如5nm 或7nm)製造、記憶體和頻寬都相對有限的AI 晶片,獲得了越級挑戰的可能性。換句話說,以中芯國際目前的能力,只要能達到穩定量產​​,或許就足夠了!這個技術選擇的背後,傳遞了一個更深遠的訊號:DeepSeek 正在為整個中國AI 硬體生態系統,從晶片代工到晶片設計,再到其他的AI 模型,設定前進的方向和標準。這是一個重大的轉變。整個生態系統的北極星,正從“奮力追趕輝達的最新發明”,轉變為“全力成就DeepSeek 的最新模型”。後者的目標更清晰,也更可行。中國主權AI 的輪廓軟體引領和硬體引領,那條路比較好?很難定論,兩者都能成功。我們今天所處的AI 繁榮,至今主要是由硬體引領的。但回顧歷史,無論是伺服器領域的Linux,或是行動裝置領域的Android,都是以軟體為核心,成功地統一了硬體生態。一個技術堆疊中的領先開源選項,往往會隨著時間演變為事實標準。DeepSeek 是否能成為AI 模型層的那個標準尚不確定,但中國硬體廠商顯然願意圍繞它進行協同設計。這種軟硬體的深度耦合,正在勾勒出一個功能完整的中國主權AI 系統的輪廓。主權AI 是一個將決定未來數年全球基礎設施格局的新興趨勢。美國的策略是向全球積極推銷美國技術堆疊。而DeepSeek 的這一步棋,可能剛剛改變了整個遊戲。它讓一個完全中國製造的AI 技術堆疊,有望比任何人預期的都更早大規模出現。這個技術堆疊不僅能滿足國內的龐大需求,還可能進軍海外市場,在國內外同時對輝達和美國AI 技術堆疊構成真正的挑戰。當然,UE8M0 FP8 是DeepSeek 的一次大膽研發賭注,它完全有可能失敗。精準度上的犧牲,或許最終會證明代價過高。但如果它成功了,那麼一月份因高估威脅而犯錯的市場,或許此刻正因低估改變而犯下另一個錯誤。這一次,真正的DeepSeek 時刻,或許真的已經到來了。 (智能情報所)
奧特曼:溫和奇點已降臨!AI最終掌控物理世界,2030年人類命運大轉折
【新智元導讀】奧特曼親筆長文「溫和的奇點」,在AI圈內掀起巨震。他預示了人類正邁向超級智能時代,奇點不會一夜襲來,而是悄然滲透。o3-pro炸場後,奧特曼第一時間發佈了最新博文——溫和的奇點。文章一開頭,緊迫感便撲面而來:人類已跨越AI發展的「事件視界」,進入指數級加速發展階段。奧特曼認為,奇點並非一夜之間到來,而是悄然滲透:驚奇變為常態,常態變為底線。內文中,他還對未來5年技術時間線,給出了自己的預測:2025年:智能體可進行真實認知工作(如程式設計),工作方式正在被重塑;2026年:AI可能具備發現新知識的能力;2027年:機器人有望在物理世界中執行任務;2030年:個體的產出能力遠超2020年,社會生產方式將有巨大變化。值得一提的是,這是奧特曼最後一篇親筆文章,沒有一點AI含量。他還指出,另一個被忽視部分內容,就是ChatGPT每次查詢消耗量。ChatGPT平均每次查詢需要消耗約0.34瓦時的電能,大致相當於一台烤箱運行1秒多鐘,或者一個節能燈泡點亮幾分鐘。此外,每次查詢還需耗約0.000085加侖的水,差不多是一茶匙的1/15。接下來,一起跟著奧特曼的視角窺探AI未來。人類跨越臨界點,就是現在我們已經越過了事件視界(event horizon),「飛昇」已經開始。在天體物理學中,事件(event)如果超過事件視界,將無法影響外部觀察者人類距離建構數字超級智能僅一步之遙,但至少到目前為止,這個過程遠比想像的要平穩。機器人還沒滿大街跑,大多數人也沒有整天和AI對話。我們依舊會生老病死,也仍然無法輕鬆進入太空,宇宙中還有許多未解之謎。然而,我們確實已建構出在諸多方面遠超人類的智能系統,它們或將極大地提升生產力。那些曾被認為最不可能的科學突破已經完成;正是這些來之不易的洞見,催生了GPT-4和o3這樣的系統,而它們將引領我們走向更遠的未來。在多方面,AI將為世界做出貢獻。其中,AI將推動科學加速進步和提高生產力,為生活質量帶來巨大飛躍。未來會比現在美好得多。科學進步是整體發展的最大引擎,一想到未來無限的可能性,就令人無比激動。從某種重要的意義上說,ChatGPT已比歷史上任何人都要更強大。每天有數億人依賴它處理日益重要的任務:微小的新功能可能產生巨大的積極影響,而微小的偏差在數億人的使用下,也能造成巨大的負面衝擊。五年時間表 2030成下個節點2025年,能勝任真正認知工作的AI智能體已經到來,編寫程式碼的方式將被永久改變。2026年,人類或許會迎來能夠洞察新知的系統。2027年,可以在物理世界執行任務的機器人或將問世。更多的人將能夠創造軟體和藝術。但世界對這兩者的需求也將水漲船高。只要擁抱新工具,專家們很可能依舊遙遙領先於新手。總而言之,到2030年,個人的工作效率將遠超2020年,這將是驚人的變化,很多人都將找到從中受益的方式。在一些非常重要的方面,2030年或許不會有天翻地覆的差異。大家仍會關愛家人、表達創意、享受遊戲、湖中暢遊。但在其他同樣重要的方面,2030年可能會與過往任何時代都截然不同。我們尚不知曉人工智慧可以超越人類多少,但即將找到答案。在2030年代,智慧與能源——即創意,以及將創意變為現實的能力——將會變得空前充裕。長久以來,這兩者一直是限制人類進步的根本因素;若能擁有充裕的智慧和能源(以及良好的治理),我們理論上便可擁有一切。AI自轉飛輪越來越快 奇點悄然滲透我們已然生活在令人難以置信的數字智能時代,在最初的震驚過後,大多數人已習以為常。我們很快就從驚嘆AI能生成文筆優美的段落,轉而期待它能創作出文筆優美的小說;從驚嘆它能做出挽救生命的醫療診斷,轉而期待它能研發出治癒方案;從驚嘆它能編寫一個小型程序,轉而期待它能創立一家全新公司。奇點的發展就是如此:昔日奇蹟淪為尋常之物,再變為平平無奇的標配。從科學家口中,OpenAI得知,他們的生產力比使用AI前提高了兩到三倍。高級AI,意義非凡,但或許沒有什麼比用它來加速AI自身的研究更重大的了。我們或許能發現新的計算載體、更優的演算法,以及其他意外之喜。若能用一年甚至一個月完成十年的研究,進步的速度顯然將完全不同。從今往後,已有的工具將幫助我們獲得更深刻的科學洞見,並協助我們創造更優異的AI系統。當然,這與AI系統完全自主地更新程式碼並非一回事,但它無疑已是遞迴自我改進的雛形。其他的自我強化循環,也已開始運轉。巨大的經濟價值創造,開啟了基礎設施建設加速擴張的飛輪,以支撐這些日益強大的AI系統。而機器人製造其他機器人,也已不再遙遠,而某種意義上,這也包括資料中心建造其他資料中心。如果我們必須用傳統方式製造第一批百萬台人形機器人,但之後它們就能運作整個供應鏈——開採和提煉礦物、駕駛卡車、營運工廠等等——來製造更多機器人,而這些機器人又能建造更多晶片製造設施、資料中心等,那麼進步的速度顯然會大不相同。隨著資料中心生產實現自動化,智能的成本最終應會趨近於電力成本。(人們常好奇ChatGPT每次查詢的能耗:平均每次查詢約消耗0.34瓦時,相當於烤箱運行一秒多鐘,或高效節能燈泡工作幾分鐘。同時消耗約0.000085加侖水,約合十五分之一茶匙。)逼近AGI終點,AI奇蹟成為常態科技進步將持續加速,而人類也將一如既往地適應一切變化。固然會有陣痛,比如某些行業的工作崗位整體消失,但另一方面,世界財富的增長將如此迅猛,以至於我們能夠認真探討以往無法想像的新政策構想。或許,我們不會一蹴而就地訂立全新的社會契約,但幾十年後回望,量變終將引髮質變。以史為鑑,我們將找到新的目標和新的需求,並迅速吸收新工具。期望會上升,但能力提升同樣迅速,所有人的生活品質都會變得更好。工業革命後的職業變遷,就是很好的例證人類將為彼此創造出愈加美好的事物。與AI相比,人類擁有一種長期、重要且獨特的優勢:我們天生就關心他人及其所思所為,而對機器則不太在意。一千年前的農夫,如果看到今天許多人的工作,會說這根本就是「假工作」,會認為現代人不過是吃飽喝足、驕奢淫逸後,玩著遊戲自娛自樂。一千年後的人們看待我們這個時代的工作時,真希望他們也會覺得那是非常「假」的工作,但毫不懷疑,從事者會感到它們極其重要,心滿意足。新的奇蹟湧現速度驚人。今天,我們甚至難以想像2035年會有什麼新發現——或許我們今年剛解開高能物理之謎,明年就開始了太空殖民;又或許今年在材料科學上取得重大突破,明年就擁有了真正的高頻寬腦機介面。許多人會選擇一如既往地生活,但至少有一部分人可能會決定「接入」。展望未來,這一切似乎匪夷所思。但當我們身處其中時,也許會感到震撼,卻仍能應對自如。從相對的視角來看,奇點漸進發生,融合緩慢進行。我們正攀登在技術指數級增長的漫長曲線上:向前看時,它似乎陡峭得無法攀登;向後看時,卻又顯得平坦無奇。但它始終是一條平滑的曲線。(試想2020年時,若有人說2025年就會出現接近AGI的產物,聽起來會有多麼不可思議,再對比一下過去這五年的真實歷程。)超級智能大腦,任重道遠巨大的機遇,也伴隨著嚴峻的挑戰。我們固然需要從技術和社會層面解決安全問題,但鑑於其巨大的經濟影響,讓超級智能得到廣泛普及也至關重要。最佳路徑或許是這樣的:首先,解決對齊問題(alignment problem)。這意味著必須能強有力地保證,AI系統會朝著人類集體長遠追求的真正目標去學習和行動。社交媒體的資訊流,便是目標錯位的AI例子:背後的演算法極其擅長讓你不停刷新,也清晰地洞察你的短期偏好,但它之所以能做到這一點,是利用了你大腦的某種機制,而這種機制會凌駕於你的長期偏好之上然後,專注於讓超級智能變得廉價、易得,並且不過度集中於任何個人、公司或國家。社會是富有韌性、創造力且適應力極強的。如果能駕馭人類的集體意願和智慧,那麼儘管會犯下許多錯誤,有些事態會變得非常糟糕,但我們終將快速學習和適應,並利用這項技術實現效益最大化、風險最小化。在社會必須劃定的寬泛邊界內,給予使用者充分的自由,這一點似乎至關重要。全世界越早開始探討這些邊界,以及定義集體對齊(collective alignment),就越有利。整個行業,而非僅是OpenAI,正在為世界建構一個大腦。它將是高度個性化的,人人皆可輕鬆使用;我們唯一的瓶頸,將是好的創意。長久以來,創業圈的技術人員總是取笑那些「點子大王」——他們有想法,卻需要找團隊來實現。但在奧特曼自己看來,這些人即將迎來自己的高光時刻。如今,OpenAI扮演著多重角色,但首要身份,是一家超級智能研究公司。前路漫漫,任重道遠,但大部分道路已被照亮,未知領域正迅速消散。能夠投身於我們所熱愛的事業,我們倍感榮幸。「廉價到無需計量的智能」已觸手可及。這番話聽起來或許很瘋狂,但倘若我們在2020年就告訴您世界將是今天的樣貌,那聽起來恐怕比我們眼下對2030年的預測還要瘋狂。願我們能平穩、指數級且波瀾不驚地邁向超級智能時代。 (新智元)
奧特曼最新發文:奇點臨近!2025-2030,人類AI智慧大爆炸:AI超級科學、機器人崛起、某些職業消失......
“我們已經越過了事件視界;騰飛已經開始。人類即將打造數字超級智能,至少目前為止,它遠沒有想像中那麼奇怪。”奧特曼再次在他的個人部落格上發表了一篇文章。這無疑是對未來的一瞥。2025-2030:奧特曼眼中的智能未來與技術飛躍溫和奇點我們已經越過了事件視界;智能爆炸(或稱“起飛”)已然啟動。人類距離造就能勝任真實認知工作的數字超級智能已經不遠。值得慶幸的是,至少到目前為止,情況遠沒有想像中那麼詭異驚悚。機器人尚未遍佈街頭,我們大多數人也不會整天與AI對話。人類依然會死於疾病,太空旅行仍未輕而易舉,宇宙對我們而言仍充滿無數未解之謎。然而,我們近期建構的系統已在眾多方面超越了人類智能,並能顯著放大使用者的工作產出。最困難的研究階段已成過往;像GPT-4和o3這樣的模型所依賴的科學洞見來之不易,但其影響將極為深遠。AI將以多種方式助力世界發展,而它對科學處理程序提速與生產效率提升所帶來的巨大福祉改善尤為顯著;未來的生活質量將遠超當下。科學進步堪稱人類進步的最大引擎;想到我們將可能實現的突破,便令人心潮澎湃。在某種重要意義上,ChatGPT的能力已然超越歷史上任何個體。數億人每天都依賴它處理日益重要的任務;一項微小的新功能可能創造巨大正面效益,而細微的對齊偏差被數億人使用時,也會引發顯著負面影響。2025年,具備真實認知能力的智能體(Agent)已然問世;編寫電腦程式碼的方式將永遠改變。2026年或將見證能自主挖掘新知的系統誕生。2027年,能在現實世界執行任務的機器人可能登台亮相。更多人將有能力創造軟體與藝術。但世界對兩者的需求遠超當前供給,只要擁抱新工具,專家們極可能仍遠勝於新手。總體而言,到2030年,單人所能實現的成就會遠超2020年,這種巨變將令人矚目,許多人也將從中獲益。最重要的層面上,2030年代或許不會天翻地覆。人們依然會愛家人、表達創造欲、享受遊戲、暢遊湖中。但在同樣至關重要的層面上,2030年代或將與前代所有時刻都迥然不同。人類智能的超越邊界尚不可知,但我們即將親見分曉。2030年代,智能與能源——即創見本身及使其成真的能力將變得無比豐沛。長久以來,這兩者正是制約人類進步的根基;有了充足智能與能源(以及優良治理),理論上我們就無所不能。令人難以置信的數字智能已融入日常生活,度過初期的衝擊後,多數人已習以為常。我們迅速從驚嘆AI能寫出優美段落,轉為期待它何時能創作完整小說;從震驚於它能提供救命診療方案,到追問何時能研發出治癒手段;從訝異它能編寫小程序,到思索它何時能建立新公司。奇點之路正是如此:神奇化為尋常,繼而成為基礎配置。科學家們紛紛反饋,其效率較AI時代前提升了兩三倍。先進AI的意義多元而重大,但或許最根本的意義在於:我們能利用它加速AI自身的研究處理程序。我們有望發現新型計算基質、更優演算法,及諸多未知。若能將十年研究壓縮至一年甚至一月,發展速率必將煥然一新。從現在起,已建成的工具將協助我們探尋更深層的科學洞見,助力打造更強大的AI系統。誠然,這與AI系統完全自主更新程式碼尚有區別,但它已然構成遞迴式自我改進的雛形機制。其它自我強化的正反饋循環也在形成。經濟效益的創造啟動了基礎設施建設飛輪,以運行日益強大的AI系統。能製造其他機器人的機器人(某種意義上,即能建造其他資料中心的資料中心)已為期不遠。若首批百萬仿人機器人需以傳統方式製造,但它們隨後能接管整條供應鏈(採礦冶煉、卡車運輸、工廠營運等),以量產更多機器人——而這些機器人又能建造晶片廠、資料中心等——那麼發展速度顯然不可同日而語。隨著資料中心生產自動化,智能的成本終將趨近於電力成本。(人們常好奇一次ChatGPT查詢的能耗:平均約0.34瓦時,相當於烤箱一秒多耗電,或節能燈幾分鐘耗電。其用水量約0.000085加侖,近似十五分之一茶匙。)技術進步的腳步將持續加快,人類適應變革的能力亦然。某些轉型會異常艱難,例如整類職業的消失,但世界也將以驚人速度積累財富,使我們有能力切實考量前所未聞的新政策理念。我們或許無法一次性重塑社會契約,但幾十年後回望,點滴漸變終將匯聚成巨變。歷史經驗昭示,人類總能發掘新價值、創造新需求,並迅速接納新工具(工業革命後的職業變遷即是力證)。期望會提升,能力亦並進,人人將享有更優生活。我們將為彼此構築愈加非凡的造物。相對於AI,人類保有一項深刻而獨特的優勢:我們天生關切他人及其思想行為,卻很少關注機器。千年前的農夫若審視我們許多工作,或會稱之為“虛職”,視其為物質豐饒後的自娛遊戲。但願我們回望千年後的職業時,亦覺其“虛幻”,但我毫不懷疑,對彼時的從業者而言,它們將意義非凡且充滿滿足感。新奇蹟的湧現速率將超乎想像。我們甚至難以預估2035年會有何等發現:也許今年攻克高能物理,明年便啟星際殖民;或今年顛覆材料科學,明年即現高頻寬腦機介面。許多人的生活方式或許依舊,但至少部分人可能選擇“接入”虛擬世界。展望未來,這一切似乎令人難以參透。但親歷其中時,感受或將是震撼而可控的。從相對論視角看,奇點循序漸進,融合悄然而至。我們正攀爬技術指數增長的長弧;未來之路總似峭壁,回望時卻如坦途,唯有一條平滑曲線。(試想2020年:若有人說2025年接近通用人工智慧[AGI],其震撼度必遠超今日展望2030。)伴隨巨大收益而來的是嚴峻挑戰。技術與社會層面的安全問題亟需解決,而超級智能的普及也至關重要,因其蘊藏巨大的經濟格局重塑力。最佳路徑可能是:解決對齊問題:切實保障AI系統長期按人類整體利益學習與行動(社交媒體演算法即是對齊偏差的典型:它們深諳如何讓人持續刷新頁面並精準把握短期偏好,卻利用人腦機制壓制了長期偏好)。普及超級智能:聚焦於降低其成本、普及其訪問管道、防止其過度集中於特定個體、公司或國家。社會韌性強、創意足、適應快。若能凝聚集體意志與智慧,縱使錯誤頻出、風波難免,我們也能迅速學習調整,運用技術放大收益、規避風險。在廣泛的社會邊界內給予使用者高度自由,似乎至關重要。世界越早對“邊界”與“集體共識定義”展開探討,則前景越佳。我們(整個產業,不限於OpenAI)正在建構世界的思維核心。它將高度個性化且人人易用;唯一制約將是創意優劣。科技初創圈曾長期調侃“點子王”——空有創意而需團隊實現的人。而今我預見,他們或將迎來高光時刻。OpenAI如今承擔多重角色,但首要身份始終是超級智能研究企業。前路漫漫,但光明已現,晦暗正疾速消退。能肩負此任,我們倍感榮幸。“智能廉價如免費”(Intelligence too cheap to meter)近在咫尺。此言雖顯激進,但若在2020年預言今日成就,其震撼度必遠超當下對2030的展望。願人類在超級智能的時代指數級安穩前行。 (三次方AIRX)
Meta發佈全新3D資產生成AI系統,宣稱實現"質的飛躍"
Meta 最近公佈了其3D 資產生成AI 系統的全新版本,稱這是一次「意義重大的技術飛躍」。這套名為AssetGen 2.0 的系統,旨在解決前代模型生成3D 內容時的細節缺陷,為創作者打造更逼真的虛擬世界提供關鍵支援。從「能用」 到「好用」:直擊3D 生成痛點去年上線的Horizo​​n 桌面編輯器(用於建構Horizo​​n Worlds 虛擬世界的工具),已實現基於文字提示的AI 生成3D 資產功能—— 用戶無需專業建模技能,僅需數小時即可免費搭建自定義虛擬空間。但早期AI 產生的資產存在顯著品質問題,尤其在VR 裝置中近距離觀看時瑕疵明顯。AssetGen 2.0 的核心使命,正是攻克這個產業難題。Meta 宣稱,新版本實現了“細節與保真度的突破性提升”,生成的3D 模型具備“含精細細節的幾何一致性”,為行業樹立了新標竿,更“突破了生成式AI 的可能性邊界”。技術架構重構:從“逐步合成” 到“一步到位”技術層面,AssetGen 2.0 採用了與前代完全不同的架構:1.0 版本需分兩步驟:先根據文字提示產生目標資產的多角度2D 影像,再透過另一神經網絡將2D 影像合成為3D 模型;2.0 版本升級為單階段3D 擴散模型,直接從文字提示產生3D 資產,且訓練資料來自海量原生3D 資產庫。這種「一步到位」 的生成方式,從底層邏輯上提升了模型對空間結構和細節紋理的把控能力。推動創作民主化:從「工具」 到「生態」 的野心目前,AssetGen 2.0 已在Meta 內部用於3D 世界開發,預計今年晚些時候向Horizo​​​​n 桌面編輯器用戶開放。官方表示,該技術將「推動3D 內容創作的大眾化,使其像2D 內容創作一樣易於上手,為在Horizo​​​​n 和Avatar 平台上工作的藝術家、設計師和開發者開闢新的創意可能」。值得關注的是,Meta 還透露正在研發「完整3D 場景生成」 AI—— 未來創作者無需逐一生成單個資產,僅憑文字或圖像提示,即可在數分鐘內生成完整虛擬世界。這意味著,AI 輔助的數字內容生產,正從「零件製造」 邁向「整座城市建造」 的全新時代。隨著生成式AI 從文字、圖像領域向3D 空間拓展,AssetGen 2.0 的落地不僅將重塑虛擬社交平台Horizo​​n Worlds 的內容生態,更可能推動電商虛擬展示、遊戲場景搭建、建築可視化等依賴3D 建模的行業發生效率革命。【術語解析】3D 擴散模型:一種直接產生三維資料的生成式模型,透過在三維空間中逐步降噪實現高品質內容生成,相較於傳統2D 轉3D 方案,能更精確捕捉物體的空間結構特徵。 (元透社)
為打擊走私,美國擬強制輝達AI晶片內建位置追蹤技術!
5月6日消息,據路透社報導,美國國會議員計畫在未來幾周內正式提出一項新的立法提案,要求監控輝達等公司生產的人工智慧(AI)晶片出售後的位置,旨在解決AI晶片大規模走私,違反美國出口管制規則的情況。據悉,該提案已經得到了美國兩黨議員的支援。報導稱,提出該提案的Bill Foster是美國伊利諾伊州民主黨眾議員,他曾是一名粒子物理學家,並在其科學生涯中成功設計了多種電腦晶片。Bill Foster計畫在未來幾周內提出一項法案,指示美國監管機構在兩個關鍵領域制定規則:跟蹤晶片以確保它們在出口管制許可下被授權的地方,並阻止未獲得出口管制適當許可的晶片啟動。Bill Foster告訴路透社,目前已經有可靠的報告顯示,晶片走私活動正在大規模發生,其中一些報告尚未公開披露。“這不是一個想像中的未來問題,”Bill Foster表示,“它是一個現實問題,……這與核技術一樣迫在眉睫。”半導體分析公司 SemiAnalysis 也表示,隨著中國 DeepSeek 的崛起,打擊AI晶片走私活動變得更加緊迫。DeepSeek 的AI系統對美國的AI系統構成了強勁挑戰,其採用的輝達被禁止向中國銷售的AI晶片。新加坡檢察官不久前已經就一起涉及可能包含輝達晶片的伺服器的走私案件,對三名中國公民提起欺詐指控。Bill Foster表示,追蹤晶片售出後的技術已經存在,其中大部分技術已經內建於輝達的晶片中。路透社採訪的獨立技術專家也對此說法表示贊同。兩位直接瞭解Google營運情況的消息人士透露,出於安全目的,Google已經在其龐大的資料中心網路中追蹤其內部AI晶片和其他晶片的位置。據瞭解,驗證晶片位置的技術將依賴於晶片與安全的電腦伺服器通訊,該伺服器將使用訊號到達伺服器所需的時間來驗證晶片的位置。華盛頓智庫進步研究所的前工程師兼新興技術政策主任Tim Fist表示,這種跟蹤技術將為晶片提供一個通用的國家級位置。這將比美國商務部負責執行出口管制的部門工業和安全域目前掌握的資訊要多得多。Tim Fist說:“BIS不知道晶片出口後,他們應該把那些晶片作為潛在的優先調查對象。”通過位置驗證,“他們現在至少已經將世界上現有的晶片組變成了很可能沒有被走私的晶片和需要進一步調查的晶片。”目前,Bill Foster的法案得到了眾議院中國問題特別委員會資深成員、眾議員Raja Krishnamoorthi等民主黨同僚的支援。Raja Krishnamoorthi在一份聲明中表示:“晶片位置驗證是我們應該探索的一種創造性解決方案,以阻止這種走私。”共和黨人也表示支援,儘管還沒有人簽署具體的立法,因為它還沒有出台。委員會主席、眾議員John Moolenaar支援位置跟蹤的概念,並計畫本周與眾議院和參議院的議員會面,討論潛在的立法方法。John Moolenaar表示:“特別委員會得到了兩黨的強烈支援,要求輝達等公司在其高性能人工智慧晶片中建構位置跟蹤能力,而實現這一目標的技術已經存在。”Bill Foster的第二個立法目標是防止人工智慧晶片在美國出口管制下未獲得適當許可的情況下啟動,這在技術上比位置驗證更複雜,但他表示,現在是開始討論這兩項工作的時候了。Bill Foster告訴路透社:“我們已經獲得了足夠的投入,我認為現在我們可以與實際的晶片和模組供應商進行更詳細的討論,說‘你實際上會如何實現這一點?’”據瞭解,Bill Foster的立法提案一旦獲得通過,將會給予美國商務部6個月的時間來制定要求該技術的法規。 (芯智訊)
華為AI叢集性能超越輝達GB200!
在無法使用最先進的工藝技術生產高端人工智慧處理器的情況下,華為採取了一種“以數量換性能”的策略,通過增加處理器數量來實現與行業競爭對手相當的性能。這一策略包括採用雙晶片HiSilicon Ascend 910C處理器、光互連技術以及華為AI CloudMatrix 384機架級解決方案,該方案依賴於專有軟體,據SemiAnalysis報導,整個系統雖然在每瓦性能上比輝達的GB200 NVL72低2.3倍,但仍然能夠使中國企業訓練先進的AI模型。華為CloudMatrix 384系統概述華為的CloudMatrix 384是一個機架級AI系統,由384個Ascend 910C處理器組成,這些處理器通過全光、全互連的網格網路排列。系統跨越16個機架,包括12個電腦架(每個機架容納32個加速器)和4個網路機架,用於通過6912個800G LPO光收發器實現高頻寬互連。與傳統使用銅線進行互連的系統不同,CloudMatrix完全依賴光互連技術,實現極高的聚合通訊頻寬。CloudMatrix 384是一款企業級裝置,具備容錯能力,並且設計上支援可擴展性。在性能方面,CloudMatrix 384提供約300 PFLOPs的密集BF16計算能力,幾乎是輝達GB200 NVL72系統的兩倍(後者提供約180 BF16 PFLOPs)。此外,該系統還提供2.1倍的總記憶體頻寬,儘管使用的是HBM2E,但HBM容量超過輝達3.6倍。該機器還具有2.1倍更高的擴展頻寬和5.3倍的擴展頻寬,這得益於其光互連技術。然而,這些性能優勢並非沒有代價:該系統每FLOP的功耗效率比輝達低2.3倍,每TB/s記憶體頻寬的效率低1.8倍,每TB HBM記憶體的效率低1.1倍。但這些並不重要,因為中國企業(包括華為)無論如何都無法獲得輝達的GB200 NVL72。因此,如果他們想要獲得真正高性能的AI訓練,他們將願意投資華為的CloudMatrix 384。華為HiSilicon Ascend 910C處理器當華為的HiSilicon Ascend 910C處理器首次曝光時,它被認為是一個計算晶片,由中芯國際(SMIC)生產,其I/O介面用於連接I/O晶片。然而,事實證明,HiSilicon Ascend 910C是一個雙晶片處理器,帶有八個HBM2E記憶體模組,沒有類似AMD Instinct MI250X和輝達B200的I/O晶片。該單元提供780 BF16 TFLOPS,相比之下,MI250X為383 BF16 TFLOPS,B200為2.25至2.5 BF16 TFLOPS。HiSilicon Ascend 910C是為大規模訓練和推理工作負載而設計的,使用先進的EDA工具,並且可以使用7奈米級工藝技術生產。SemiAnalysis報告稱,儘管SMIC可以為Ascend 910C生產計算晶片,但華為使用的大多數Ascend 910C晶片是由台積電通過涉及第三方實體(如Sophgo)的變通方法生產的,這使得華為能夠在美限制下獲得晶圓。據估計,從2023年到2025年,華為獲得了超過一百萬個Ascend 910C處理器的晶圓。然而,隨著SMIC能力的提升,華為可以將更多生產外包給國內代工廠。Ascend 910C使用HBM2E記憶體,其中大部分來自三星,通過另一個代理CoAsia Electronics採購。CoAsia將HBM2E元件運往Faraday Technology,這是一家設計服務公司,然後與SPIL合作組裝HBM2E堆疊和低性能16奈米邏輯晶片。這些組裝件在技術上符合美國出口管制,因為它們沒有超過美國法規規定的任何閾值。系統級封裝(SiP)單元被運往中國,然後將HBM2E堆疊拆焊,重新安裝在華為的Ascend 910C SiP上。從性能角度來看,Ascend 910C在每個晶片的基礎上遠不如輝達最新的B200 AI GPU強大,但華為的系統設計策略通過增加每個系統的晶片數量來彌補這一差距。更多處理器 = 更高性能正如其名稱所示,CloudMatrix 384是一個由384個Ascend 910C AI處理器組成的高密度計算叢集,物理上組織成一個16機架系統,每個機架有32個AI加速器。在這個佈局中,12個機架用於計算模組,而另外4個機架用於通訊交換。與輝達的架構類似,所有Ascend 910C都可以相互通訊,因為它們通過自訂網格網路互連。然而,CM384的一個顯著特點是其完全依賴光鏈路進行機架內和機架間的內部通訊。它整合了6912個線性可插拔光(LPO)收發器,每個收發器的速率高達800 Gbps,總內部頻寬超過5.5 Pbps(687.5 TB/s),具有低延遲和最小訊號完整性損失。該系統支援向上擴展和向外擴展拓撲結構:通過384個處理器內的全網格實現向上擴展,通過額外的叢集間連接實現向外擴展,這使得該系統能夠在更大的超大規模環境中部署,同時保持緊密的計算整合。擁有384個處理器,華為的CloudMatrix 384提供了300 PFLOPs的密集BF16計算性能,比輝達的GB200 NVL72高出166%。然而,CM384的總系統功耗(包括網路和儲存)約為559千瓦,而輝達的GB200 NVL72消耗145千瓦。因此,輝達的解決方案比華為的解決方案提供了2.3倍的更高功耗效率。然而,正如前面提到的,如果華為能夠大規模交付其CloudMatrix 384,並提供適當的軟體和支援,其客戶將不會關心系統的功耗。 (晶片行業)