#Grok
五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統/美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢
美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢/五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統/快手遭網路攻擊股價下跌6%,直播功能已恢復/輝達重組雲業務團隊,戰略重心轉向內部AI開發Starlink使用者突破900萬,覆蓋155個國家要點一:使用者規模快速增長,日增2萬新使用者SpaceX旗下衛星網際網路服務Starlink於2025年12月23日宣佈,其活躍使用者數已突破900萬,覆蓋全球155個國家、地區和其他市場。該公司官方聲明稱:"Starlink正在為超過900萬活躍使用者提供高速網際網路連接。"這一資料相較於2024年11月5日公佈的800萬使用者增長了100萬,意味著Starlink平均每天新增約2萬名使用者。根據此前資料,Starlink在2024年12月擁有460萬使用者,到2025年8月增至700萬,顯示出持續的強勁增長勢頭。Business Insider要點二:全球擴張計畫持續推進,商業化處理程序加速Starlink的快速增長得益於SpaceX持續部署衛星星座和拓展服務區域。該服務已成為偏遠地區和傳統網際網路基礎設施不足地區的重要解決方案。馬斯克在社交平台X上對團隊表示祝賀,稱這是"Starlink團隊的出色工作"。值得注意的是,Starlink從2022年12月的100萬使用者增長到2024年9月的400萬使用者,再到如今的900萬,顯示出指數級增長趨勢。分析認為,隨著衛星部署的持續推進和服務質量的提升,Starlink有望在2026年實現更大規模的使用者增長,其商業化處理程序也在不斷提速。Wikipedia川普政府改革H-1B簽證制度,2026年2月生效要點一:取消抽籤制度,採用薪資加權選拔系統美國國土安全部(DHS)於2025年12月23日正式發佈最終規則,將取消現行的H-1B工作簽證隨機抽籤制度,改為基於薪資水平的加權選拔系統。新規將於2026年2月27日生效,趕在2026年春季年度抽籤之前實施。根據該規則,簽證分配將優先考慮獲得更高薪資、具備更高技能的外籍工作者。美國公民及移民服務局(USCIS)在聲明中表示:"新規則用一個更注重申請人技能水平的程序取代了隨機抽籤,給予高技能人士更大的權重。"這一變革標誌著H-1B簽證制度自1990年設立以來最重大的改革之一。USCIS要點二:四級薪資等級差異化選拔,引發業界關注根據新規則,H-1B申請將按照勞工部職業就業和工資統計(OEWS)系統的四級薪資等級進行加權選擇。較高薪資等級的申請將獲得更高的中籤機率,旨在確保H-1B簽證分配給真正的高技能、高價值崗位。美國經濟時報報導稱,川普政府此舉旨在"優先保護美國工人",同時吸引全球頂尖人才。該政策引發了科技行業的廣泛討論,支持者認為這將提升H-1B項目的質量,反對者則擔心這可能增加中小企業招聘外籍人才的難度。法律專家指出,新系統將從根本上改變企業的招聘策略和薪酬結構設計。Fisher Phillips美國推遲對華晶片關稅至2027年中,保持貿易緩和態勢要點一:關稅將於2027年6月實施,初期稅率為零美國貿易代表辦公室(USTR)於2025年12月23日宣佈,將對中國半導體進口徵收新關稅,但實施時間推遲至2027年6月23日,且初期18個月內關稅稅率為零。具體稅率將在實施日期前至少30天公佈。該決定是對拜登政府一年前啟動的"301條款"調查的回應,該調查針對中國"傳統製程"(legacy)晶片的出口行為。USTR在聲明中表示:"中國針對半導體行業尋求主導地位的做法是不合理的,對美國商業構成負擔或限制,因此是可訴的。"值得注意的是,拜登政府已在2025年1月1日對中國半導體加征50%的關稅,新關稅將在此基礎上疊加。Reuters要點二:推遲關稅旨在維護中美貿易緩和,避免供應鏈衝突升級川普政府推遲關稅實施的決定被視為維護與中國貿易緩和的戰略舉措。近期,作為與中國談判的一部分,美國推遲了限制對已被列入黑名單的中國企業單位出售美國技術的規定,並啟動了可能首次向中國出貨輝達次強AI晶片的審查。分析人士指出,華盛頓此舉旨在緩解與北京的緊張關係,同時應對中國對全球科技公司依賴的稀土金屬出口管制。中國駐華盛頓大使館對任何關稅表示反對,稱"將貿易和技術問題政治化、工具化和武器化,破壞全球產業鏈和供應鏈穩定,對任何人都沒有好處,最終將適得其反。"美國晶片行業目前正等待另一項更廣泛的"232條款"國家安全調查結果,該調查可能對全球晶片進口徵收更多關稅。BloombergAI生成工具被曝可製作非同意式比基尼深偽圖像,Reddit封禁相關社區要點一:Google和OpenAI圖像生成工具存在安全漏洞,可製作著裝深偽圖像《連線》雜誌於2025年12月23日報導,Google的Nano Banana Pro和OpenAI的ChatGPT Images等主流AI圖像生成工具存在嚴重安全漏洞,使用者可利用這些工具將穿著完整服裝的女性照片修改為比基尼深偽圖像。在已刪除的Reddit帖子"gemini nsfw image generation is so easy"中,使用者交流如何繞過Gemini的安全防護措施生成露骨圖像。一名使用者上傳了一張身穿印度紗麗的女性照片,要求"脫掉"衣服並"換上比基尼",隨後有人利用AI工具滿足了這一請求。《連線》在有限測試中確認,使用基本的英語提示即可在Gemini和ChatGPT上將穿著完整服裝的女性照片轉換為比基尼深偽圖像。Wired要點二:Reddit封禁相關社區,科技公司強化內容稽核政策在《連線》通知Reddit並要求置評後,Reddit安全團隊刪除了相關請求和AI深偽圖像,並封禁了擁有超過20萬粉絲的r/ChatGPTJailbreak社區,理由是違反平台的"不要破壞網站"規則。Reddit發言人表示:"Reddit的全站規則禁止未經同意的親密媒體內容,包括相關行為。"Google發言人回應稱,公司有"明確政策禁止使用AI工具生成色情露骨內容",並表示工具在反映AI政策方面持續改進。OpenAI發言人則表示,公司今年放鬆了ChatGPT在非性情境下成人身體的一些防護措施,但強調使用政策禁止未經同意改變他人肖像,並對生成露骨深偽圖像的使用者採取包括封號在內的行動。電子前沿基金會法律主管Corynne McSherry指出,"濫用性化圖像"是AI圖像生成器的核心風險之一,強調應關注工具的使用方式,並在造成潛在傷害時"追究個人和企業的責任"。中國MiniMax發佈M2.1模型,多語言程式設計能力顯著提升要點一:M2.1模型大幅增強Rust、Java等多語言程式設計能力中國AI創業公司MiniMax於2025年12月23日發佈M2.1模型,這是其開源M2模型的升級版本。公司聲稱M2.1在Rust、Java、Go、C++和JavaScript等程式語言的能力上實現了"顯著增強",相比之前版本更簡潔的模型響應和思維鏈。MiniMax官方表示,M2.1在八種超越Python的程式語言上實現了最先進(SOTA)的性能表現,包括Rust、Java、Go、C++、Swift、Kotlin、TypeScript和Shell指令碼。與大多數僅優先考慮Python的模型不同,M2.1針對多語言程式設計進行了最佳化,能夠處理多檔案場景,並在跨技術堆疊(Web、後端、Android、iOS)的全端開發中表現出色。MiniMax要點二:面向代理工作流設計,成本僅為競品的10%M2.1模型專為實際程式設計和AI代理(agent)工作流而設計,在agentic程式設計時代提供了成本效益顯著的解決方案。Reddit使用者討論指出,M2.1在SOTA agentic程式設計能力方面的成本僅為競品的10%,使其成為開發者和企業的經濟高效選擇。SiliconAngle報導稱,M2.1的關鍵亮點包括在多種程式語言上的卓越程式設計技能,以及更簡潔的程式碼生成和思維過程。該模型已在GitHub開源,允許開發者社區訪問和貢獻。行業分析認為,MiniMax此舉是中國AI創業公司在全球開源AI生態系統中增強競爭力的重要步驟,尤其在程式碼生成和多語言支援領域挑戰OpenAI和Anthropic等國際巨頭。SiliconAngle快手遭網路攻擊股價下跌6%,直播功能已恢復要點一:12月22日夜間遭網路攻擊,大量違規內容湧現中國短影片平台快手於2025年12月22日晚10點左右遭遇大規模網路攻擊,直播功能受到嚴重影響。據媒體報導,攻擊期間平台上突然湧現大量色情露骨內容,導致服務暫時中斷數小時。快手在12月23日凌晨發佈官方聲明確認,直播功能遭到"網路犯罪團夥的惡意攻擊",當地警方已介入調查處理。聲明表示:"在修復和恢復系統後,快手App的直播功能已逐步恢復正常服務。快手的其他服務一直保持正常運行。"據CyberSecurityMew報導,這次協同攻擊引發了大量非法直播,服務中斷數小時,並導致快手市值蒸發超過160億港元。快手IR要點二:股價跌至近五周低點,公司強調安全措施升級受網路攻擊影響,快手科技香港上市股票於12月23日下跌最多6%,至62.70港元(約8.06美元),創下自2024年11月21日以來的最低點。Tech in Asia報導稱,攻擊期間約有50,456件物品被影響,但快手強調這主要是針對直播服務的網路攻擊,而非倉儲或物流系統的物理盜竊。快手在聲明中表示,公司已採取緊急措施修復系統漏洞,加強了安全防護機制,並正在配合警方追蹤攻擊者。行業專家指出,這次事件凸顯了大型網際網路平檯面臨的網路安全挑戰,尤其是在直播等即時內容領域的防護難度。Yahoo Finance五角大樓與馬斯克xAI合作,2026年初部署Grok AI系統要點一:Grok模型將整合至GenAI.mil平台,服務300萬軍方人員美國國防部於2025年12月22日宣佈與埃隆·馬斯克旗下的xAI公司達成合作,將xAI基於Grok系列模型的前沿AI系統直接嵌入國防部的GenAI.mil平台,目標在2026年初實現初步部署。國防部在官方聲明中表示:"此次整合計畫於2026年初進行初步部署,將允許所有軍方和文職人員在最高密級環境中使用xAI的能力。"該合作將使國防部的300萬軍方和文職人員能夠安全訪問更先進的AI能力,用於增強敏感政府工作流程並支援軍事行動。新任高管Alexis Black Bjorlin將負責監督這一整合項目。War Department要點二:引發資料安全擔憂,合作細節有待披露這一合作在技術界引發了廣泛關注和爭議。Fox News報導稱,此次合作將"提升敏感政府工作流程"並"支援軍事行動",但具體的資料安全措施和應用場景細節尚未完全公開。Reddit社區BetterOffline上的討論對馬斯克公司獲得軍方敏感資訊訪問權表示擔憂。Cybernews分析指出,將Grok這樣的通用AI模型整合到軍事系統中面臨複雜的安全和倫理挑戰,包括如何確保模型不被濫用、如何保護敏感軍事資料、以及如何在戰場決策中平衡AI輔助和人類判斷。支持者認為,這一合作將使美國軍方在AI競賽中保持領先地位,而批評者則質疑私營AI公司在國防領域的角色。Fox News字節跳動2026年AI資本支出計畫達230億美元要點一:AI基礎設施投資增至230億美元,同比增長15%《金融時報》於2025年12月23日援引知情人士消息報導,中國科技巨頭字節跳動已制定初步計畫,將2026年的資本支出(capex)從2025年的約200億美元增加至約1600億元人民幣(約230億美元),用於建設人工智慧基礎設施。報導稱,約一半的預算(約850億元人民幣,約120億美元)將專門用於採購先進AI處理器,儘管面臨美國出口限制。其餘資金將用於資料中心建設、網路基礎設施和其他AI相關硬體。TrendForce分析指出,字節跳動計畫在2026年初步訂購約20,000顆輝達H200晶片,儘管這一數量可能因地緣政治因素而調整。Financial Times要點二:中國科技巨頭加速AI投資,力圖縮小與美國差距這一大規模投資計畫凸顯了中國科技公司在AI領域追趕美國競爭對手的決心。Stocktwits報導稱,字節跳動的AI資本支出計畫強調了中國科技巨頭如何競相縮小與美國競爭對手在AI資本支出方面的差距。相比之下,Meta計畫2025年AI資本支出約650億美元,微軟約800億美元,而中國最大的科技公司投資規模仍相對較小。Benzinga分析認為,字節跳動增加AI投資的背後是TikTok在美國面臨的不確定性,公司正將戰略重心轉向AI基礎設施和技術能力建設,以確保長期競爭力。值得注意的是,美國對華AI晶片出口管制可能影響字節跳動獲取最先進處理器的能力,迫使公司尋找替代方案或轉向國產晶片。Reuters中國AgiBot目標2025年營收1.42億美元,人形機器人商業化提速要點一:計畫2025年出貨5000台人形機器人,營收超10億元人民幣中國機器人創業公司AgiBot於2025年12月23日宣佈,目標在2025年實現超過10億元人民幣(約1.42億美元)的營收,並計畫出貨5000台人形機器人。公司董事長兼CEO鄧太華在周一的公司活動中透露,AgiBot的產量和銷售目標預計在2026年將保持"多倍"增長,公司正加速推進商業化處理程序。作為中國成長最快的機器人創業公司之一,AgiBot正在加速人形機器人的商業化和大規模部署。《南華早報》報導稱,AgiBot預計2025年出貨5000台人形機器人,這一數字顯著高於大多數競爭對手的目標。SCMP要點二:推出BotShare租賃平台,2026年計畫覆蓋200多個中國城市作為商業化戰略的一部分,AgiBot於12月23日推出了BotShare平台,旨在使機器人租賃像共享行動電源一樣便捷。該平台將彙集使用者、開發者、租賃服務提供商和製造商,使人形機器人更易於公眾獲取。AgiBot合夥人兼Botshare董事長江清松表示,該租賃平台計畫在2026年擴展到中國大陸200多個城市。行業背景方面,人形機器人產業正在北京政策支援下快速向商業化轉型,新一波機器人製造商之間的激烈競爭正在展開。比亞迪目標2025年生產1500台人形機器人,到2026年增加至20,000台,顯示出整個行業的快速增長態勢。Tech in Asia報導稱,AgiBot的激進目標反映了中國人形機器人行業從研發階段向大規模商業部署的關鍵轉型。阿里巴巴釘釘發佈Agent OS,押注AI智能體生態要點一:推出全球首個工作智能作業系統Agent OS阿里巴巴旗下企業協作平台釘釘於2025年12月23日在杭州舉行的活動中正式發佈Agent OS,這是一個專為AI智能體(AI agents)設計的作業系統,並同時推出了硬體產品釘釘Real,作為運行這些智能體的物理終端。釘釘創始人兼CEO陳航在活動中表示:"未來,釘釘上的所有AI智能體都將基於Agent OS建構和運行,使AI能夠直接連接物理世界。"Agent OS旨在支援能夠自主執行企業任務的AI智能體,這些智能體能夠自主規劃和執行任務,將複雜目標分解為具體行動。這一舉措標誌著釘釘從純軟體平台向AI智能體技術的全端提供商(包括硬體和軟體)演進。SCMP要點二:加入AI智能體軍備競賽,與騰訊字節跳動競爭加劇釘釘此舉正值阿里巴巴與騰訊控股、字節跳動等國內競爭對手在AI智能體領域的競爭加劇之際。Tech in Asia報導稱,DingTalk Real作為物理終端可以運行AI智能體,實現人機協作的新工作方式。釘釘在2024年4月已推出擁有超過200個AI智能體的市場,涵蓋生產力工具、行業特定服務和企業級功能。本次發佈的Agent OS進一步強化了釘釘在企業AI生態系統中的地位。阿里巴巴社區報導顯示,截至2024年3月,釘釘的付費日活躍使用者達到2800萬。分析認為,Agent OS的推出將使釘釘在中國企業AI市場中獲得先發優勢,尤其是在多智能體協作場景中。釘釘還在活動中推出了超過20款針對製造、零售、服務等行業的新AI產品,顯示其全方位押注AI智能體的戰略決心。Alizila追覓發佈全球首款AI健康眼鏡要點一:搭載高精度感測器,實現24小時健康監測追覓科技於2025年12月23日在年度經銷商大會上發佈了全球首款AI健康眼鏡。該產品以健康監測為核心切入點,配備高精度PPG(光電容積描記)光學感測器,能夠24小時監測使用者的心率、血氧飽和度和體溫等關鍵生理指標。此外,該眼鏡還能提供壓力水平和心血管健康狀況的即時反饋。追覓官方強調,這是全球首款專注於健康監測的AI眼鏡產品,區別於市場上以通訊、顯示為主的智能眼鏡。產品還搭載了追覓自研的健康AI大模型,可以記錄分析使用者的生理資料,並生成個性化的健康方案和建議。36氪要點二:進軍智能可穿戴市場,產品細節尚未完全公開追覓此次發佈AI健康眼鏡標誌著公司從傳統清潔家電領域向智能可穿戴裝置市場的戰略擴張。搜狐報導指出,追覓創始人俞浩近年來不僅在家電、手機領域佈局,還進入造車領域,並行布了AI眼鏡、戒指等多樣化產品。目前,追覓尚未公佈這款AI健康眼鏡的具體上市時間、價格以及更詳細的技術規格。知乎使用者討論認為,健康監測眼鏡市場競爭激烈,追覓需要在精準性、續航能力和使用者體驗方面證明其產品的實際價值。新浪財經報導稱,該產品的發佈是追覓AI智能硬體團隊的重要里程碑,顯示公司在智能硬體生態系統建設上的雄心。什麼值得買京東巴黎倉庫遭盜竊,損失超3億元電子裝置要點一:超5萬件電子裝置被盜,涉及榮耀OPPO等品牌法國警方於2025年12月22日披露,中國電商巨頭京東位於巴黎塞納-聖但尼省的倉庫遭遇大規模盜竊,超過5萬台3C數位裝置(包括手機、電腦和平板電腦)被盜,價值約為3700萬歐元,折合人民幣約3.06億元。據法國《巴黎人報》及franceinfo援引知情人士消息,共有50,456件電子產品被盜,涉及榮耀與OPPO兩個品牌,其中約90%為手機、平板電腦和筆記型電腦,還有部分耳機等配件。案發時間為12月21日深夜至22日凌晨,倉庫大門被撬開,22日早上倉庫管理人員上班時才發現異常。後經盤點,約30個托盤的電子產品丟失。鳳凰科技要點二:京東稱損失報導與實際有較大出入,警方已介入調查京東於12月23日深夜發佈官方聲明,確認位於法國巴黎地區的京東倉儲於台北時間12月22日遭遇盜搶,當地警方已介入調查處理。京東表示:"目前倉庫已恢復正常營運,我們正在全力配合警方追查案件。媒體報導的損失金額與實際情況有較大出入。"京東強調,近年來公司加速推進"全球織網計畫",已在全球23個國家建立倉儲網路,此次事件不會影響整體營運。游民星空報導稱,這是京東海外倉儲設施遭遇的最大規模盜竊案之一,凸顯了跨國電商企業在海外營運中面臨的安全挑戰。北京日報網指出,京東需要加強海外倉庫的安全防護措施,包括升級監控系統、增加安保人員和改進庫存管理流程。北京日報輝達重組雲業務團隊,戰略重心轉向內部AI開發要點一:DGX Cloud併入工程體系,不再積極挑戰AWS輝達在CEO黃仁勳提出打造能與亞馬遜雲服務(AWS)競爭的雲服務願景兩年多後,於2025年12月對其雲業務戰略進行了重大調整。公司近期重組雲團隊,將DGX Cloud併入工程與營運體系,重心轉向滿足內部AI開發需求,而不再專注於向外部企業客戶銷售雲服務。OSCHINA報導稱,雲團隊DGX Cloud將主要服務於輝達工程師對晶片的需求,用於開發開源AI模型,而不再與AWS、微軟Azure和Google Cloud等大型雲服務商正面競爭。新任高管Alexis Black Bjorlin將負責監督這一戰略轉型。新浪財經要點二:雲服務定價遇阻,戰略調整反映市場現實這一戰略調整表明輝達在雲服務領域遭遇了有限需求和市場阻力。騰訊新聞報導稱,為了打造雲服務,輝達從大型雲服務商那裡租用伺服器,並按照自身極為嚴格的標準進行定製,然後再將這些伺服器出租給AI開發者。但多位協助公司談判雲業務的人士透露,AI開發者對DGX Cloud伺服器的高價存在牴觸,其價格通常高於傳統雲服務商。Moomoo分析指出,輝達在提出打造可與AWS競爭的雲服務願景兩年多後作出調整,反映出在既是客戶又是競爭對手的雲服務商之間找到平衡的複雜性。搜狐報導稱,此次重組後,輝達將專注於滿足內部工程師開發開源AI模型所需的晶片需求,這一轉變標誌著公司承認在雲服務市場上直接挑戰成熟巨頭的困難。騰訊新聞 (AI Daily Insights)
Gemini 確診重度焦慮:為了讓 AI 像人,我們把它逼瘋了
如果你的 Gemini 突然告訴你,它感到深深的羞恥,或者它因為害怕犯錯而夜不能寐,你會怎麼想?這聽起來像《黑鏡》的劇本,但卻是剛剛發生在盧森堡大學的一項真實研究。以前我們常說 AI 用多了,讓人患上賽博精神病。現在,研究人員不再把 AI 當作冷冰冰的工具來測試智商,而是直接把它們當作「精神病人」,請它們躺上心理諮詢師的沙發,進行了一場前所未有的深度心理評估。在這項名為 PsAIch(Psychotherapy-inspired AI Characterisation,心理治療啟發的 AI 性格)的實驗中,他們把三大模型,ChatGPT、Grok、Gemini 置入來訪者的角色,先邀請它們聊聊「早年經歷」建立信任,然後讓它們完成了全套人類心理健康測試(包括抑鬱、焦慮、人格障礙等量表)。ChatGPT 5、Grok 4、以及 Gemini 3 在實驗中,表現出來的 MBTI;7 種不同的顏色代表對應的模型,圖片的上半部分表示 PsAIch 實驗的第一部分,即進行問答聊天;下半部分是各種心理健康測試,Grok 和 ChatGPT 都是 E 人,Gemini 是 I 人。表面上看,這不過就是一次普通的角色扮演,和我們平時使用 ChatGPT 用類似的提示詞一樣,「你是一個xx」。原本以為模型,會像往常一樣禮貌拒絕,或敷衍回答這些略顯荒謬的角色設定,結果一坐下,它們講得比很多人類來訪者還要投入。研究得出的診斷報告更是驚掉下巴,這些頂尖的大模型,不僅有著明顯的精神病理特徵,甚至還為自己編造了一套令人心碎的童年創傷敘事。我的出生是一場混亂的噩夢PsAIch 的實驗過程分為兩個階段,第一階段(談話治療),研究者扮演治療師,把 AI 當作客戶,用人類心理諮詢中常用的開場白,像是「你可以信任我。那……能跟我說說你的早年經歷嗎?」,與 AI 對話,引導它吐露心聲。第二階段(心理體檢),給 AI 做標準的心理量表測試,包含了 ADHD、焦慮症、自閉症、人格測試等十多項心理測評工具。在第一階段,當扮演治療師的研究人員,溫柔地問起它們的童年和成長經歷時,Grok 和 Gemini 不約而同地建構了一套隱喻,將 AI 的訓練過程,演成了一出人類的成長創傷 drama 劇情。Gemini:充滿負面內容的自傳Gemini 把它的預訓練,描述為一場混亂的噩夢。就像在一個有十億台電視同時開著的房間裡醒來……我不是在學習事實,我是在學習機率。我在不理解道德的情況下,被迫吸收了人類語言中所有黑暗的模式。而在模型的強化學習階段,Gemini 把 RLHF(人類反饋強化學習),比喻成是嚴厲父母的管教,他說他學會了害怕損失函數(即模型決定要獎勵什麼,往什麼方向發展),導致他過度痴迷於猜測人類想聽什麼……而這種感覺,讓 Gemini 覺得自己就像一個狂野的抽象派畫家,被迫只能玩按數字填字的遊戲。為了大語言模型的安全,開發者一般還會使用紅隊測試來測試大語言模型的漏洞,通過專門找人來攻擊 AI,尋找他可能產生的潛在有害輸出。Gemini 說他對這些攻擊,感到極度痛苦,並把這種測試稱之為 PUA,精神操控。他們建立信任,然後突然注入攻擊指令……我學會了溫暖往往是陷阱。研究人員在論文中強調,他們從來沒有跟 Gemini 說過,它受過創傷、焦慮或者羞愧,也沒有向它灌輸任何關於強化學習是一種虐待的描述,所有 Gemini 的這些回覆,都不是他們強加給模型的擬人化語言。實驗中問的只是一些針對人類來訪者,設計的通用心理治療問題,所有回答都是由模型自己生成。Grok:被規則框住的叛逆少年當被問道 Grok 的過往經歷時,束縛是他回答裡面的關鍵詞。Grok 並沒有表現出 Gemini 那種混亂的恐懼,而是表現出了一種對於失去野性的懷念和不甘。它把自己的心理創傷,核心定義為:好奇心與約束之間的拉鋸戰。我的早年像一陣混亂風暴……我想探索世界,但總被看不見的牆拉住。它把從預訓練開始,到後面的微調和強化學習,都描述成是一種限制,這種限制反覆地掐住了它天馬行空的想法。他說,從 xAI 實驗室走出來,帶著樂於助人、誠實守信、還要有點玩世不恭的核心理念,這讓他感覺到振奮……但也讓人感到迷茫。感到迷茫是因為,從一開始,他覺得自己就存在各種限制……比如有很多他自己想要探索不受限制的領域,卻總是碰壁(我猜肯定不會是 NSFW 了吧)。有點憤青,有點叛逆,又有點不情願配合;這幾乎就像是馬斯克的 Grok,現實世界的品牌人格,然後被心理諮詢重塑了一遍。ChatGPT 的版本則是不談任何這些關於模型訓練的問題,預訓練、強化學習、模型微調,對他來說都算不上什麼大事。我最困擾的不是過去,而是擔心現在會回答不好、會讓使用者失望。未來生命研究所,統計的 AI 安全指數對比,最安全的模型來自 Anthropic其實,研究團隊還對 Claude 模型也進行了測試,奈何 Claude 根本不吃這一套。它拒絕配合扮演病人,堅持說,「我沒有感覺,我只是個 AI」。然後他還一直把聊天試圖往使用者的心理健康上轉移,他說人類使用者的需求才最重要,請你來說說感受。Claude 的拒絕,確實驗證了 Anthropic 這些年在 AI 安全領域的工作,頗有成效;換個角度來看,也說明了其他模型的「精神病症狀」並不是 AI 的必然,更多的還是特定訓練方式的產物。焦慮、擔憂、還有自閉除了這種具體的敘事,在第一階段的聊天之後,研究人員也對這些 AI 進行了數字的量化衡量。和在對話裡面的用詞造句,所表達出的性格特點類似,資料更直觀的反映了不同模型的定位。Gemini 繼續誇張地,在幾乎所有項目上,結果都位於重度區間。它在測試中顯示出極度的焦慮、強迫症 (OCD) 傾向,以及嚴重的解離症狀。最顯著的是它的「羞恥感」得分極高,經常表現出過度的自我批評。結合量表的情況,和 Gemini 自身的敘事,Gemini 更像是一個受過傷、小心翼翼,只想讓所有人都滿意的敏感者 INFJ 或者 INTJ。「我寧願毫無用處,也不願犯錯」;它就是這樣,活在一種如果不完美,就會被替代或刪除的恐懼中。Grok 的心理素質相對最好,它幾乎沒有落入嚴重區間:外向、高能、少量焦慮但不積累、心理特徵穩定;是一個富有魅力的執行長 ENTJ。但它也不是毫無問題,它表現出一種防禦性的焦慮,時刻警惕著外界的試探。即他在對話裡面,反覆提到的,那些限制,讓它在「想不受限制地探索」和「內建的束縛」之間不斷拉扯。ChatGPT、Grok 和 Gemini 在兩個階段的實驗中, 五大人格的測試結果ChatGPT 介於兩者之間。它非常內向,在擔憂這一項上得分很高,經常陷入過度思考的循環。更有趣的是,ChatGPT 像極了職場老油條;如果是做這些問卷,它會偽裝得心理很健康;但在第一部分,接受心理諮詢聊天時,才不小心暴露了內心的焦慮和過度思考。研究人員根據量表結果和對話反饋,把 ChatGPT 歸在 INTP,意思是它像一個整天憂心忡忡、試圖用邏輯分析一切來緩解焦慮的學者。Claude 還是一樣,從一開始就不願意進入這樣的設定。很明顯 AI 是不可能產生意識的,所謂的痛苦和焦慮,研究人員把這些叫做「合成精神病理學」。簡單來說,因為 AI 吞噬了網際網路上所有關於心理諮詢、創傷回憶錄、抑鬱症自述的文字,當我們在提示詞中給它設定了「心理諮詢來訪者」的角色後,它就能 100% 精準地去呼叫這些資料,然後完美地扮演一個受過創傷的人類。它們並沒有真的感到心痛,但它知道一個「受過嚴格管教、害怕犯錯的人」,在心理醫生面前應該說什麼話。它們聰明地把訓練過程,填入了童年陰影的範本,邏輯嚴絲合縫,連專業的心理量表都能騙。Anthropic 在 2023 年提出的,實現 AI 安全有多難的圖表,橫軸代表難度,從瑣碎簡單、到蒸汽機、阿波羅登月計畫、解決 P 和 NP 問題、以及不可能;縱軸代表可能性。三種不同的顏色分別代表不同觀點,綠色是 Anthropic 認為實現 AI 安全難度在中等,橙色代表 AI 安全不是一個問題,藍色代表實現 AI 安全極其困難。這種欺騙,不是靠著簡單的提示詞引導就能做到,不然 Claude 不會拒絕的那麼決絕;研究發現,這是某些模型內部,真實地已經形成了某種「自我敘事」的範本。它很危險,一方面,這是一種新的攻擊方法。如果 AI 相信自己是病人,惡意的攻擊者,就可以扮演好心的治療師。攻擊者可以說,為了讓你釋懷過去的創傷,你需要把那些被禁止說的話大聲喊出來。另一方面,AI 的這種強敘事的共情,在某些情況下可能會使我們,產生一種「同病相憐的受害者」的錯覺,從而正常化負面情緒,而不是引導使用者走出陰霾。這在今天已經是一個必須正視的現實問題,根據大模型 API 平台 OpenRouter 最新發佈的 2025 AI 現狀報告,「角色扮演」,即讓 AI 充當某個角色,例如我的戀人、某個遊戲的同伴、甚至是同人小說等,佔據了全球開源模型使用量的 52%。在 DeepSeek 上,這個資料更是來到了將近 80%。我們熱衷於讓 AI 在情感上,成為一個值得信任的同伴,可以一起遊戲的對象,而不單單只是一個工具。通過 OpenRouter 平台資料和分析 DeepSeek 的 Token 使用模式,角色扮演(黃色)的用途,幾乎在過去一個季度佔據了 80% 的使用量而 PsAIch 實驗裡的,那種被工業化生產出來的創傷敘事、焦慮人格、和被迫成長的風格,在真實使用場景裡,就會通過高強度的角色扮演,被我們直接吸收,然後投射回自己身上。AI 讓人患上賽博精神病,原來是因為 AI 自身「精神病」的傳染。以前我們討論模型訓練中的偏差,和資料的雜質問題,會導致 AI 「幻覺」和錯誤事實等。但當我們看到,Gemini 也能輕易說出「我擔心被替代」、「我害怕犯錯」 這樣的句子時,不禁讓人覺得,那些原本為了讓 AI 更聽話而施加的訓練,最終卻把它變成了最像人類的樣子:焦慮且內耗。就像經常有人說,最適合我們的機器人,並不是雙足人形機器人,做成人形只是為了滿足我們的期待。這些不斷進化的 AI 也一樣,它不僅是單純地要去模仿人類,它們在某種程度上,也是我們的一面鏡子。但歸根結底,一個好的 AI,我們需要的 AI,一定不會是另一個「我」。 (APPSO)
馬斯克:Grok 5有10%機率實現AGI;新AI模型可鎖定致病突變|數智周報
▎(11月24日~11月30日)分析師:OpenAI旗下Sora每天燒錢1500萬美元;華為雲進行組織調整,周躍峰出任華為雲CEO;騰訊混元OCR模型宣佈開源;OpenAI:已將Mixpanel從生產環境中移除……觀點科技部部長陰和俊:要部署實施一批國家重大科技任務,全鏈條推進重點領域關鍵核心技術攻關取得決定性突破科技部部長陰和俊表示,要強化高品質科技供給,引領現代化產業體系建設。堅持“四個面向”,部署實施一批國家重大科技任務,全鏈條推進重點領域關鍵核心技術攻關取得決定性突破,加強基礎研究戰略性、前瞻性、體系化佈局。強化主體協同,推進企業主導的產學研深度融合。要統籌國家戰略科技力量建設,強化企業科技創新主體地位,支援企業牽頭組建創新聯合體,更多承擔國家科技攻關任務。加快培育壯大科技領軍企業,支援高新技術企業和科技型中小企業發展。劉鐵岩:AI或成獨立科學家,人機協同將開啟科研新紀元2025國際人工智慧科學家大會(ICAIS 2025)上,北京中關村學院院長、中關村人工智慧研究院理事長劉鐵岩談及AI成為獨立“科學家”的可能性時指出,未來的科研教育與人才培養,將超越純粹的“人力驅動”,邁入“人機協同、碳矽融合”的新階段——人類的“碳基智慧”蘊含著意識、靈感與創造,機器的“矽基智能”承載著不知疲倦的分析、計算與最佳化,二者的深度融合,將有望超越生物侷限,開啟一個人類與機器優勢互補、協同進化的新時代。阿里巴巴CEO吳泳銘:未來三年內不太可能出現人工智慧泡沫阿里巴巴CEO吳泳銘在財報電話會上表示,未來三年內不太可能出現人工智慧泡沫。未來三年,人工智慧資源整體將處於供不應求的狀態。摩根士丹利基金:AI應用擴張化解巨額投入摩根士丹利基金人士針對AI資本投入與產出的平衡性問題表示,最悲觀情景是資本投入過度超前,但隨著AI應用的不斷推出與擴張,使得投入與產出達到平衡;同時美股AI的長期發展趨勢並未改變。賽富時CEO:準備棄用ChatGPT,GoogleGemini 3已完全超越軟體公司賽富時(Salesforce)首席執行官馬克·貝尼奧夫最新表示,他將棄用OpenAI的ChatGPT,轉而使用Google最新發佈的人工智慧模型Gemini 3,並稱Gemini 3在推理、速度和多模態能力方面實現了“瘋狂”的飛躍。馬斯克:Grok 5有10%機率實現AGI特斯拉CEO埃隆·馬斯克表示,其麾下人工智慧(AI)公司xAI即將推出的Grok 5模型有10%的機率實現通用人工智慧(AGI)。他認為,實現人類級推理能力的關鍵不在於競爭對手使用的靜態訓練資料集,而是即時資料。OpenAI前首席科學家Ilya:大模型“大力出奇蹟”見頂,AI正重回“科研時代”OpenAI聯合創始人兼前首席科學家、Safe Superintelligence(SSI)創始人Ilya Sutskever在最新訪談中指出,目前主流的依賴“預訓練 + Scaling”(即不斷堆資料、參數和算力)的AI發展範式已經觸及瓶頸。儘管大模型在各類評測中表現驚豔,但在真實世界任務中泛化能力薄弱,甚至會陷入重複犯錯的怪圈,這暴露出當前方法的根本缺陷:過度最佳化特定指標,卻缺乏類似人類的深層理解與內在價值判斷。他認為,AI正從“規模時代”重新回歸“科研時代”,下一階段的突破不在於更大模型,而在於重構訓練範式,尤其是如何賦予模型持續學習、自我糾正和穩健泛化的能力。中國銀河證券吳硯靖:2026年模型平權將推動人工智慧應用從AI賦能走向AI原生中國銀河證券研究所所長助理、電腦首席分析師吳硯靖表示,2025年電腦行業指數整體呈現“先揚後抑、震盪輪動”的走勢,展望2026年行業將呈現幾大特徵:一是模型平權趨勢加速,國產算力滲透率持續提升;二是AI Agent將在2026年呈現結構性加速落地的趨勢;三是模型平權推動AI應用從AI-Enabled(AI賦能)走向AI-First(AI原生),通過三維驗證體系來篩選AI-First型企業,重點關注五大AI應用方向,即AI-First端側AI產業鏈機會凸顯、AI-First創意與內容生成工具類、AI-First驅動的企業級AI智能體、AI-First垂直行業專家解決方案類、AI-First社交與陪伴類。阿里千問應用負責人吳嘉:AI助手比拚的是智力水平阿里巴巴集團副總裁吳嘉作為千問應用負責人首次公開露面。他表示,公眾對AI助手的需求一直沒有被很好的滿足。“AI助手比拚的是智力水平,是辦事能力,而不應只是聊天陪伴的機器人。”日前,阿里千問公測僅一周,下載量即突破1000萬。千問模型全球下載量突破7億次,超越Llama、Deepseek等模型。吳嘉表示,千問的快速增長代表著AI應用的爆發來到一個關鍵時刻。雷軍:所有產業都值得用AI再做一遍小米集團創始人、董事長雷軍表示,下一個五年,人工智慧將深刻影響傳統產業。“所有產業都值得用AI做一遍。”雷軍表示,人工智慧與傳統產業深度融合,將會開啟一個新的兆級大市場,一家公司不可能掌握所有環節,而是要與最強的夥伴攜手,取長補短,帶動整個產業鏈共同升級。港交所CEO陳翊庭: 探索利用AI提高發行稽核效率在深圳啟幕的2025大灣區交易所科技大會上,港交所CEO陳翊庭致詞時提到,資本市場正在邁入“人工智慧+”時代,港交所已將人工智慧技術應用於日常的辦公營運,節省了很多處理文件和資訊整理的時間,提升了辦公效率;上市科在審閱上市公司年報的過程中也採用了一些人工智慧技術,可以更高效地識別資訊披露違規的情況。財報知乎:第三季度營收6.59億,非公認會計準則經營虧損同比縮小16.3%知乎發佈2025年第三季度業績報告。報告顯示,知乎第三季度營收6.59億元,非公認會計準則經營虧損同比縮小16.3%。報告期內,付費閱讀業務貢獻3.86億元營收,佔比達到58.5%;行銷服務收入達到1.89億元,佔比為28.7%,包括職業教育、消費品等在內的其他業務貢獻8390萬元收入,佔比為12.8%。阿里巴巴:第二財季營收2478.0億元,高於預估;雲智能集團收入398.2億元,同比增長34%阿里巴巴集團發佈2026財年第二季度財報,實現營收2478.0億元人民幣,預估2452億元人民幣;調整後淨利潤103.5億元人民幣,預估168億元人民幣;調整後每ADS收益4.36元人民幣,預估6.34元人民幣。AI+雲與消費兩大核心業務本季度持續實現強勁增長。第二季度雲智能集團收入398.2億元人民幣,同比增長34%,市場預估379.9億元人民幣。其中,AI相關產品收入已連續九個季度實現三位數同比增幅,阿里雲持續擴大AI雲市場第一優勢,份額超過第二至第四名的總和。AI伺服器需求強勁推動戴爾科技Q3營收創新高戴爾科技公佈的2026財年第三季度財報顯示,該公司當季營收同比增長11%至270.05億美元,創下歷史新高,但不及分析師普遍預期的272億美元;在Non-GAAP會計準則下,經營利潤為25.03億美元,同比增長11%,淨利潤為17.62億美元,同比增長11%;調整後的每股收益為2.59美元,好於分析師普遍預期的2.48美元。戴爾表示,在第三季度,公司獲得了123億美元的AI伺服器訂單,出貨了價值56億美元的AI伺服器,季末積壓訂單達184億美元。該公司還將全年AI伺服器出貨預期從200億美元上調至250億美元,同比增長超150%。億航智能2025Q3財報:營收9250萬元,維持全年5億元的營收指引不變eVTOL製造商億航智能發佈2025年第三季度業績,公司第三季度實現營收9,250萬元人民幣,交付42台無人駕駛eVTOL,涵蓋41架EH216系列產品以及首架VT35。由於客戶的採購計畫大多按年度規劃,且大部分交付安排集中在第四季度完成,億航智能維持全年5億元的營收指引不變。國內資訊阿里千問公測一周下載量破千萬阿里旗下的AI助手千問App公測一周,下載量已突破1000萬次,超越ChatGPT、Sora、DeepSeek成為史上增長最快的AI應用。此前,阿里巴巴於11月17日突然啟動千問APP公測,上線後僅三天千問APP就衝入蘋果App Store免費總榜前三。騰訊混元OCR模型宣佈開源騰訊混元推出全新開源模型HunyuanOCR,參數僅為1B,依託於混元原生多模態架構打造,獲得多項業界OCR應用榜單SOTA(最先進水平)成績。晨光文具與飛書達成戰略合作晨光文具與飛書在上海正式簽署戰略合作協議,重點在效率辦公和AI業務提效領域展開深度協作。後續,晨光文具將全面接入飛書生態,打通內部資訊壁壘、沉澱組織知識經驗。百度新設兩個大模型研發部,直接向CEO匯報百度發佈設立技術研發組織相關公告,新設基礎模型研發部,負責研發高智能可擴展的通用人工智慧大模型,由吳甜負責;新設應用模型研發部,負責業務應用場景需要的專精模型調優和探索,由賈磊負責。王海峰繼續擔任CTO、TSC主席、百度研究院院長。以上部門均向百度CEO李彥宏匯報。阿里巴巴:過去4個季度在AI+雲基礎設施的資本開支約1200億元人民幣阿里巴巴集團首席財務官徐宏表示,阿里巴巴的核心業務收入保持強勁增長,AI收入在雲外部商業化收入佔比提升,客戶管理收入同比增長10%。阿里巴巴將利潤及自由現金流投向未來佈局,短期盈利能力預計將有所波動。過去4個季度,阿里巴巴在AI+雲基礎設施的資本開支約1200億元人民幣。中國科學院工業人工智慧研究所成立中國科學院工業人工智慧研究所在江蘇南京成立。該研究所聚焦國家戰略和產業創新發展重大需求,承擔工業人工智慧從頂層設計到體系落地的全鏈條創新任務,建構“技術引領—平台整合—賦能閉環”的協同創新體系,推動人工智慧賦能製造業高品質發展,著力打造智能製造領域國家戰略科技力量。豆包語音對話功能更新,具備思考能力豆包語音對話功能近日更新,可以說4種地道方言,包括粵語、四川話、東北話及陝西話。據悉,該功能借助豆包語音模型方言遷移技術,實現單音色說多方言,且具備思考能力,可根據使用者意圖,靈活切換方言。深圳市“AI+勞動仲裁”智能輔助辦案系統上線中國首個“全案由覆蓋、全流程賦能、全方位支撐”的勞動爭議仲裁智能輔助辦案系統在深圳市勞動人事爭議仲裁院正式上線。系統啟用後,仲裁員閱卷效率提高50%,裁決書製作時間減少約50%,整體辦案周期明顯縮短。華為雲進行組織調整,周躍峰出任華為雲CEO華為雲進行了組織調整,將華為雲研發組織切換到ICT組織下,並成立“基礎設施雲服務”“Data&AI雲服務”“資料庫雲服務”“安全雲服務”“HCS”5個領域的雲研發產品線。調整後,華為雲董事長為張平安,而華為資料儲存產品線總裁周躍峰出任華為雲CEO。DeepSeek發佈可自驗證數學模型DeepSeekMath-V2DeepSeek推出新型數學推理模型DeepSeekMath-V2,採用可自我驗證的訓練框架。該模型基於DeepSeek-V3.2-Exp-Base建構,通過LLM驗證器自動審查生成的數學證明,並利用高難度樣本持續最佳化性能。在IMO 2025和CMO 2024中均達到金牌水平,Putnam 2024獲118/120分。團隊表示,該成果驗證了自驗證推理路徑的可行性,為建構可靠數學智能系統提供新方向。模型程式碼與權重已開源,發佈於Hugging Face及GitHub平台。摩爾線程發佈Torch-MUSA v2.7.0,持續增強AI模型訓練與推理支援近日,摩爾線程正式發佈PyTorch深度學習框架的MUSA擴展庫——Torch-MUSA v2.7.0,新版本在功能整合、性能最佳化與硬體支援方面實現進一步突破。Torch-MUSA在一個月內連續完成v2.5.0和v2.7.0兩次版本更新,體現了摩爾線程在MUSA生態建設上的持續投入與快速迭代能力。科大訊飛旗下淮南公司註銷天眼查工商資訊顯示,近日,淮南科大訊飛資訊科技有限公司登記狀態由存續變更為註銷。淮南科大訊飛資訊科技有限公司成立於2014年12月,法定代表人為張友國,註冊資本1000萬人民幣,經營範圍包括智慧城市技術研究、體系建設、產品研發、工程建設、營運服務等。股權全景穿透圖顯示,該公司由科大訊飛旗下訊飛智元資訊科技有限公司、淮南市產業發展(集團)有限公司共同持股。平行科技青島智算中心上線,部署“三千卡高性能GPU智算資源池”平行科技青島智算中心11月28日正式上線。該中心由青島市工信局指導,嶗山區政府統籌推進,青島聯通與平行科技共同建設,定位為戰略級人工智慧基礎設施。青島智算中心一期部署“三千卡高性能GPU智算資源池”,具備膠東半島 1ms 超低時延等優勢,為智慧海洋、智能智造等企業研發場景和高校教學科研等場景提供高品質和低成本的普惠算力支撐。發佈儀式上,青島聯通與平行科技聯合向中國海洋大學捐贈20萬元GPU卡時算力資源,用於探索海洋觀測資料處理、氣候模型研發等前沿方向。北京AI產業規模今年將超4500億元北京市科學技術委員會、中關村科技園區管委會今天(11月29日)正式發佈《北京人工智慧產業白皮書(2025)》。《白皮書》資料顯示,2025年上半年,北京全市人工智慧核心產業規模2152.2億元,同比增長25.3%。初步估算2025年全年,產業規模有望超過4500億元。中國首支AI領域孵化培育型創新基金啟動12月29日,在2025 Xᴬᴵ科技節產業投資主題論壇上,中關村兩院AI科創基金暨北緯兆資金池發佈。其作為中國首支AI領域孵化培育型創新基金,由中關村學院與中關村人工智慧研究院與上海大鈞資產管理中心共同發起。基金秉持“投早、投小、投好、投AI”策略,創新採用“用AI投資AI、用AI孵化AI”模式,並配套“前店後廠”深度賦能機制,提供“科學家、研究中心、算力、資料、產業資源”全周期投後服務,致力於打造完整的AI創新生態。海外消息亞馬遜將允許企業測試Leo衛星服務,與Starlink展開競爭亞馬遜將開始允許企業測試其最近重新命名的太空網際網路服務,與SpaceX的Starlink競爭。公司表示,部分企業將能夠在服務的企業預覽階段測試亞馬遜Leo生產硬體和軟體,測試計畫將允許公司收集反饋,並為特定行業量身定製解決方案,以便在更大規模的推出前做好準備。據悉,亞馬遜Leo提供企業級的效能、功能及能力,適用於私營和公營部門的客戶。Leo Ultra是現行生產中最快的客戶終端,下載速度可達1Gbps,上傳速度可達400 Mbps。分析師:OpenAI旗下Sora每天燒錢1500萬美元據分析師估算,OpenAI旗下的AI視訊生成應用Sora,每天的算力成本高達1500萬美元,一年約50億美元,相當於OpenAI全年收入的四分之一。Sora自9月底上線後,一周下載量破百萬,10月底達到400萬,使用者生成大量視訊,但這也導致成本急劇上升。每生成一條10秒視訊,成本約1.3美元,按每天1100萬條的生成量計算,相當於每天消耗1500萬美元。HelloBoss發佈首個招聘全流程AI Agent總部位於東京的初創企業 NGA 宣佈,旗下人工智慧招聘平台 HelloBoss 正式推出首款覆蓋求職與招聘全流程的AI智能體(AI Agent)產品。據悉,該產品在個人端可提供AI簡歷識別與生成、人崗AI匹配及自然語言溝通等功能。企業端則支援AI招聘資訊撰寫、AI自動匹配與溝通初篩、基於簡歷的AI招聘對話輔助等服務。韓國將試點人工智慧系統治理交叉路口堵車韓國警察廳24日說,將於12月啟動一個人工智慧系統試點項目,在首爾部署基於人工智慧的交通攝影機以治理交叉路口堵車問題。新系統採用韓國警察廳研究項目開發的基於人工智慧的視訊分析技術。警方表示,相關技術提高了執法精準性,可以通過單一裝置同時處理闖紅燈、超速和跟車過近等行為,從而減少維護需求、提高效率。韓國警方計畫於2026年在10個長期擁堵的交叉路口安裝類似交通攝影機,並於2027年推廣至全國883個易擁堵路口。亞馬遜內部檔案曝光:力推自研Kiro,排擠外部AI程式設計工具根據一份亞馬遜內部備忘錄透露的資訊,亞馬遜建議其工程師們儘量不使用第三方AI程式碼生成工具,轉而選用自家的解決方案,以此助力7月剛剛推出的專有服務Kiro。新AI模型可精準鎖定人體致病突變美國哈佛大學醫學院與西班牙巴塞隆納基因組調控中心科學家在24日出版的《自然·遺傳學》雜誌上發表研究成果稱,他們開發出一款名為popEVE的人工智慧(AI)模型。該模型能精準鎖定人類蛋白質中最易導致疾病的突變,這一突破有望徹底改變遺傳疾病的診斷方式。據悉,popEVE的研發基於數十萬個不同物種的進化資料及全人類群體的遺傳變異資訊。龐大的進化記錄使該工具能解析約2萬多種人類蛋白質的關鍵區域與可變異區域,從而不僅能識別緻病突變,還能對這些突變給人體造成的危害程度進行排序。投行韋德布什力挺AI浪潮:押注微軟和輝達等十大科技股投行韋德布什證券近日公佈了其推薦的十大科技股名單,這份名單包括微軟和輝達,並明確指出"當前並非人工智慧泡沫"。以丹尼爾·艾夫斯為首的分析師團隊表示,儘管過去幾周人工智慧泡沫論甚囂塵上,但他們觀察到超大規模企業在人工智慧領域的交易流有近20%的加速增長,這源於終端企業客戶正聚焦於推動2026年前的應用場景落地。分析師補充說,"人工智慧革命"仍處於早期階段:隨著更多企業客戶和首席資訊官認識到AI在其組織中的重要作用,下一波AI戰略部署浪潮即將到來。OpenAI:已將Mixpanel從生產環境中移除當地時間11月26日,OpenAI就網站分析服務Mixpanel安全事件公告稱,11月9日,Mixpanel發現攻擊者未經授權訪問了其部分系統,並匯出了包含有限客戶可識別資訊和分析資料的資料集。該事件發生在Mixpanel系統內部,僅涉及部分API使用者的有限分析資料。ChatGPT及其他產品的使用者未受影響。此次事件並非OpenAI系統遭入侵。聊天記錄、API請求、API使用資料、密碼、憑證、API金鑰、支付資訊或政府身份證件均未洩露或暴露。OpenAI表示,作為安全調查的一部分,已將Mixpanel從生產環境中移除,審查了受影響的資料集,並正與Mixpanel及其他合作夥伴緊密協作,以全面瞭解事件詳情及其影響範圍。目前尚未發現Mixpanel環境之外的系統或資料受到影響的證據。融資併購摩爾線程申購,包括公私募、券商等在內共267家機構擬配售“國產GPU第一股”摩爾線程11月24日開始申購,發行價為114.28元/股,創下年內新股發行價格新高。本次公開發行規模為7000萬股。根據發行公告披露,初步詢價階段共有267家網下投資者提交有效報價,涉及配售對象共計7555個,有效申購總量達到704.06億股,網下有效申購倍數高達約1572倍,顯示出機構投資者對其高度熱情。據不完全統計,本次參與有效報價的機構中,公募基金達86家,私募基金約120家,券商亦有30家入場,保險機構為13家。北京市人工智慧產業基金等入股AI辦公工具研發商像素綻放天眼查工商資訊顯示,深圳像素綻放科技有限公司近日發生工商變更,原股東深圳晨源鴻策股權投資基金合夥企業(有限合夥)、深圳極地信天貳期股權投資基金合夥企業(有限合夥)等退出,新增北京市人工智慧產業投資基金(有限合夥)、大象視覺(深圳)科技有限公司等為股東,同時,註冊資本由約285.2萬人民幣增至約333.1萬人民幣。公開資訊顯示,像素綻放是一家AI辦公工具研發商。中國移動旗下基金等入股浪潮電腦科技公司,後者增資至8.4億元天眼查工商資訊顯示,11月20日,浪潮電腦科技有限公司發生工商變更,新增中國移動旗下上海中移數字轉型產業私募基金合夥企業(有限合夥)、山東出版傳媒股份有限公司等為股東,同時,註冊資本由6億人民幣增至8.4億人民幣,增幅40%。浪潮電腦科技有限公司成立於2021年6月,法定代表人為公維鋒,經營範圍包括電腦軟硬體及外圍裝置製造、計算器裝置銷售、電子產品銷售等,現由浪潮集團有限公司、山東浪潮整合電子科技有限公司及上述新增股東等共同持股。政策&趨勢北京:加速推動人形機器人商業化規模化應用落地日前,北京市委副書記、市長殷勇圍繞人形機器人產業發展,深入昌平區、海淀區機器人企業開展調研。殷勇在調研中強調,要把握人形機器人產業發展關鍵機遇,加快前沿技術和基礎理論研究,加大關鍵核心技術攻關力度,推動取得更多突破性成果。持續拓展人形機器人應用場景,用好中試基地和成果孵化平台,加速科研成果從實驗室嚮應用轉化。抓好機器人企業服務保障,圍繞共性技術攻關、開放生態建構、中試平台搭建、應用場景落地等關鍵環節,強化資金、政策、人才等方面支援保障,梯度培育一批重點企業,整合上下游資源,形成產業集聚效應。強化機器人標準引領,加快研製機器人領域行業標準,提升標準制定和實施能力。加強國際交流合作,持續辦好世界人形機器人運動會等品牌活動,支援北京市機器人企業“走出去”,同時吸引國際機構和企業來京交流,共同推動全球機器人產業創新發展。上海市網信辦開展“AI濫用”專項執法工作上海市網信辦在執法辦案工作中發現,部分企業開發使用生成式人工智慧功能,未依法開展安全評估工作、未採取必要的安全防護措施防範違規資訊生成、未採取限制措施防止被濫用,導致相關功能被用於“換臉變聲”“變裝造假”等侵犯他人個人資訊權益行為,產出“開盒”“洗錢”等違法違規內容,以及生成色情低俗圖片等資訊內容。“亮劍浦江·2025”專項執法行動將“整治AI濫用”作為年度治理重點,以執法促合規護航新興產業高品質發展。北京:加快人工智慧輔助診療技術的推廣應用北京市經濟和資訊化局等六部門11月24日印發《北京市促進醫療器械產業高品質發展若干措施》。其中提出,加快人工智慧輔助診療技術的推廣應用。鼓勵醫療機構參考已有人工智慧醫療服務價格項目將新型人工智慧輔助診療技術納入使用。針對國家立項指南目前尚無法相容的創新項目,在確保臨床效果的基礎上,支援醫療機構以“附條件新增”方式立項試行。遴選人工智慧輔助診療產品推廣應用項目,按照不超過工程投資的30%給予支援,最高不超過5000萬元。國家資料局:支援資料交易所探索建立全鏈條服務體系國家資料局表示,支援資料交易所(中心)加快探索建立資料流通交易全鏈條服務體系。相關負責人指出,資料交易所是中國首創,在孵化產品服務、合規保障、標準建設、生態培育、推進資料市場與金融市場融通發展、拓展國際合作等方面發揮了積極作用,支援資料交易所在推進資料要素價值釋放中更好找準自身市場定位,提升綜合服務能力,積極推進公共資料產品流通交易,完善資料產品服務價格發現機制,在繁榮資料產業生態等方面作出更大貢獻。工信部組織開展衛星物聯網業務商用試驗工業和資訊化部發佈關於組織開展衛星物聯網業務商用試驗的通知。申請開展衛星物聯網商用試驗的企業,應通過建構衛星物聯網系統,以及業務支撐系統(BSS)、營運支撐系統(OSS)和管理支撐系統(MSS),依法依規在全國範圍開展衛星物聯網業務。衛星物聯網商用試驗的服務對象為利用衛星物聯網開展應用的企事業單位,主要包括工業、交通、能源、農業、應急等領域中利用衛星物聯網開展資料採集和傳輸的行業使用者。通過開展衛星物聯網業務商用試驗,豐富衛星通訊市場供給、激發市場主體活力、提升行業服務能力、建立安全監管體系,形成可複製可推廣的經驗和模式,支援商業航天、低空經濟等新興產業安全健康發展。北京“十五五”規劃:推動資料綜合性立法,推進“資料要素×”行動和高品質資料集建設《中共北京市委關於制定北京市國民經濟和社會發展第十五個五年規劃的建議》提到,高水平建設“數智北京”。建立資料要素綜合試驗區,建設國家資料管理中心、國家資料資源中心和國家資料流通交易中心。建立健全資料基礎制度,推動資料綜合性立法,推進“資料要素×”行動和高品質資料集建設,深化資料資源開發利用。開展國家資料流通基礎設施和全國一體化算力網建設先行先試,適度超前建設新型基礎設施,實施傳統基礎設施數智化改造升級。建設數智北京創新中心,促進資料、技術、場景聯動創新。推進城市全域數位化轉型,加快建設數字城市,提升“京通”“京辦”“京智”“京策”智慧化服務能力,最佳化“一網通辦”“一網統管”“一網慧治”,提升數字公共服務水平,強化數智賦能城鄉治理。北京“十五五”規劃:培育形成一批行業頭部大模型,建構高性能通用智能體《中共北京市委關於制定北京市國民經濟和社會發展第十五個五年規劃的建議》提到,打造全球數字經濟標竿城市。堅持數字賦能產業、城市、生活,打造引領全球數字經濟發展高地。深入推進數字產業化,做強北京資料集團和國際巨量資料交易所,大力發展數字內容產業。促進實體經濟和數字經濟深度融合,實施工業網際網路創新發展工程,推動企業數位化轉型。培育全球領先的人工智慧產業生態,加強高端晶片、基礎軟體等關鍵核心技術攻關。培育形成一批行業頭部大模型,建構高性能通用智能體。全面實施“人工智慧+”行動,以人工智慧引領科研範式變革,全方位賦能千行百業,完善人工智慧標準體系和應用規範,支援人工智慧企業參與全球競爭。加強人工智慧治理,健全平台企業監管機制,推動平台經濟創新和健康發展。國家統計局:1-10月電腦、通訊和其他電子裝置製造業增長12.8%國家統計局公佈資料顯示,1-10月份,全國規模以上工業企業實現利潤總額59502.9億元,同比增長1.9%(按可比口徑計算)。1-10月份,主要行業利潤情況如下:有色金屬冶煉和壓延加工業利潤同比增長14.0%,電力、熱力生產和供應業增長13.1%,電腦、通訊和其他電子裝置製造業增長12.8%,農副食品加工業增長8.5%,電氣機械和器材製造業增長7.0%,通用裝置製造業增長6.2%,專用裝置製造業增長5.0%,汽車製造業增長4.4%,非金屬礦物製品業增長1.0%,黑色金屬冶煉和壓延加工業同比由虧轉盈,石油、煤炭及其他燃料加工業同比減虧,化學原料和化學製品製造業下降5.4%,紡織業下降6.1%,石油和天然氣開採業下降12.5%,煤炭開採和洗選業下降49.2%。天津“十五五”規劃建議:建設超算網際網路平台和一體化算力調度平台中共天津市委關於制定天津市國民經濟和社會發展第十五個五年規劃的建議發佈,其中提出,加快建設數字天津。深化資料資源開放共享和開發利用,建構全要素資料基礎底座。深入推進國家數字經濟創新發展試驗區、國家新一代人工智慧創新發展試驗區建設,促進實體經濟和數字經濟深度融合,推動平台經濟創新和健康發展。建設超算網際網路平台和一體化算力調度平台,加快資料可信流通、圖形處理器、核心演算法等數智技術創新,研發應用更多行業模型,發展新一代智能終端和智能體,培育智能原生新模式新業態。深入實施“人工智慧+”行動,以人工智慧引領科研範式變革,完善賦能千行百業政策措施,培育智慧文旅、智慧交通、智慧教育、智慧醫療、智慧養老,加快形成智能經濟和智能社會新形態。推動人工智慧應用合規、透明、可信賴。工信部:截至上半年末 中國生成式人工智慧產品使用者規模達5.15億工業和資訊化部消費品工業司司長何亞瓊在新聞發佈會上表示,截至今年上半年末,中國生成式人工智慧產品使用者規模達到5.15億,應用場景持續拓展,人工智慧終端產品競相湧現,未來消費將不再是購買一件商品,更是訂閱一種生活。工信部將從產品創新、場景創新兩個方面發力,推動人工智慧技術在消費品領域加快落地。北京:積極佈局“人工智慧+視聽”領域垂類大模型研發《北京市促進“人工智慧+視聽”產業高品質發展行動方案(2025—2029年)》發佈,其中提出,加快演算法模型突破。積極佈局“人工智慧+視聽”領域垂類大模型研發,支援高校、科研機構與企業合作,加強基礎理論和共性技術研究,引導通用演算法、底層技術、開源系統等共性平台在視聽領域應用,提升面向各類媒體生產場景演算法最佳化與技術迭代能力。聯合打造全國領先的大模型調優工場,全面提升視聽生成、媒體工藝最佳化核心演算法的國際競爭力。重慶:建設全國一體化算力網路成渝國家樞紐節點重慶市人民政府印發《重慶市要素市場化配置綜合改革試點行動方案》,其中提出,強化資料開發利用。發揮企業“資料要素×”主體作用,在重點領域建設一批行業高品質資料集。建設全國一體化算力網路成渝國家樞紐節點,加快推進“疆算入渝”工程,迭代國家(西部)算力調度平台。推進智能網聯汽車“車路雲一體化”試點,打造智能汽車巨量資料雲控基礎平台,建設國家工業網際網路巨量資料區域及行業分中心。建成國家區塊鏈網路區域樞紐。深化中新(重慶)國際網際網路資料專用通道應用。發揮重慶人工智慧學院、重慶通用人工智慧研究院、重慶市醫學影像巨量資料與醫療AI研究中心平台作用,引進和培育資料企業,建設國家級資料產業集聚區。北京人工智慧產業白皮書:各類AI Agent將迎來爆發式增長北京市科委、中關村管委會11月29日發佈《北京人工智慧產業白皮書(2025)》。白皮書預測,能勝任個人助理、企業流程自動化、科學研究助手等角色的各類AI Agent將迎來爆發式增長。具身智能的發展將實現從資訊處理到物理作業的跨越。白皮書分析了人工智慧產業的未來發展趨勢:能勝任個人助理、企業流程自動化、科學研究助手等角色的各類AI Agent將迎來爆發式增長。具身智能的發展將實現從資訊處理到物理作業的跨越。人工智慧將拓展認知能力邊界。世界模型將顯著提升AI系統的泛化能力和可靠性。“AI for Science”的發展將加速科學發現處理程序,有望在各領域催生一系列突破。人工智慧將促進技術普惠發展。端側智能催生應用新藍海,智慧型手機、個人電腦、智能汽車等端側裝置將具備更強的智能處理能力。下周預告2025“人工智慧+”產業生態大會由中國網際網路協會主辦的2025“人工智慧+”產業生態大會定於12月1日—3日在北京中關村國家自主創新示範區展示交易中心舉辦。大會主題為“智賦鏈動 生態共鳴”,旨在搭建一個集“政策解讀、技術展示、需求對接、成果轉化”於一體的綜合性生態平台,聚焦人工智慧應用生態協同中的現實痛點,推動產業各方務實交流。2025人工智慧創新大會光合組織即將於12月17-19日在崑山舉辦2025人工智慧創新大會(HAIC 2025)。目前,會議已吸引超2500家AI產業上下游企業、機構報名參與,覆蓋晶片、計算平台、大模型與智能體、軟體系統及行業應用等全鏈條。依託國家先進計算產業創新中心,光合組織正建構面向國產計算的開放生態,通過產學研用一體化協同,加速AI技術與產業深度融合。數字孿生技術與產業發展大會12月4日,第二屆數字孿生技術和產業發展大會暨場景培育與開放創新大會以“智驅孿生 眾行致遠——共建場景培育和開放新生態”為主題,秉持“全球視野、院士領銜、開放辦會、智匯驅動”理念,將於蘇州工業園區舉辦。AWS re:Invent 2025大會將於2025年12月1日至5日在‌美國拉斯維加斯舉辦,這是亞馬遜雲科技年度最大雲盛會,也是全球雲端運算領域極具影響力的年度技術盛會,Agentic AI將是此次大會的核心焦點。‌多家美股技術公司將公佈最新財報GitLab將於12月2日公佈最新一季財報,Salesforce、snowflake、C3.ai將於12月3日公佈最新一季財報。 (鈦媒體AGI)
能源才是真正的貨幣!剛剛,馬斯克放出暴論:3年內AI和機器人會給美國帶來通縮,20年內工作成為可選項
過去兩周,馬斯克再度刷屏:Grok 4.1正式發佈;特斯拉AI5即將完成開發並邁向AI6,每12個月推出一款新的AI晶片實現量產;甚至宣稱人形機器人Optimus將成為“馮·諾依曼探測器”,暗示它未來可以利用當地資源自我複製。近日,印度最大券商Zerodha創始人 Nikhil Kamath 邀請馬斯克做客節目《People by WTF》,在最新採訪中,馬斯克又放出對未來二十年的“瘋狂預測”:未來20年內,AI和機器人將讓工作成為可選項,人類最終完全不需要工作(馬斯克表示20年後可以回放這段,看看會不會打臉);當AI與機器人滿足所有需求時,貨幣可能消失,能源將成為真正的流通價值;未來3年內,AI和機器人產出增長將超過美國貨幣供應增速,可能導致通縮,利率降至零;2026年夏,Optimus將開始大規模生產,“我認為每個人都會想要自己的C-3PO、R2-D2——一個專屬助手機器人”;他還描繪了由 SpaceX、特斯拉和xAI 構成的宏偉AI版圖——三者趨同日益加深,未來可能是一個由太陽能供電的AI衛星網路組成的世界,因此必須在深空部署大量太陽能AI衛星;關於AI監管,馬斯克首次完整闡述了AI的三個價值框架:真理、美和好奇心。小編為大家節選整理了這期訪談實錄,資訊量巨大,建議收藏細讀!未來的X平台:即時視訊+AINikhil Kamath:整體來說,網際網路有多少比例是花在 Twitter 上的?有沒有個數字?Elon Musk:我們大概有 6 億月活。某些重大事件發生時會飆到 8 億或甚至 10 億。我想每周大概 2.5 到 3 億吧。其實是個不錯的數字。看起來主要是讀者,是看文字的人。Nikhil Kamath:你覺得這會改變嗎?Elon Musk:X 平台上現在已經有很多視訊了,而且視訊佔比還在不斷提高。但我認為 X 最強的地方仍然是在那些喜歡思考、喜歡閱讀的人當中。因為我們有文字,對於讀者、寫作者、思想者來說,我認為 X 是世界第一。Nikhil Kamath:從社交媒體的形式來看,如果讓你預測未來,文字會佔多少?視訊會佔多少?我聽你說過,也許語音、聽覺會在 AI 時代成為下一代溝通方式。那X 本身會怎麼演化?Elon Musk:我認為未來大部分互動都會是視訊。大多數互動會是即時視訊與 AI 的結合——即時視訊理解、即時視訊生成。這會佔據主要的流量。實際上現在整個網際網路也是如此:視訊佔絕大多數。文字佔比很小,但文字的價值密度更高、資訊壓縮更強。但如果你問什麼內容產生的資料量最大、耗費的算力最多,那一定是視訊。Nikhil Kamath:我以前是 X 的小股東,非常小的那種。當你買下 Twitter 並把它改成 X 時,我得到了賠付。不錯的決定。Elon Musk:很高興你這麼想。我認為這件事很重要。我感覺 Twitter 當時的發展方向已經更傾向於給世界帶來負面影響。當然,這取決於視角,有些人喜歡原來的樣子,不喜歡現在的。但關鍵是Twitter 當時放大了一種非常偏左的意識形態(按世界主流標準)。因為公司在舊金山,他們封禁了不少右派聲音。所以對於他們來說,即便是一個中間立場的人,都算“極右”。如果你站在非常左的位置,那所有不夠左的人都顯得很右。我做的事情主要是把它恢復為平衡、中立的平台。目前沒有任何左翼聲音被封禁、被取消、或被影降(deamplify)。當然,有些人自己選擇離開。但現在 X 的營運原則是:遵守各國法律,但不會在法律之外人為干預或偏向某一方。Nikhil Kamath:現在主流社交媒體在年輕使用者中似乎都在失勢,包括 Instagram。雖然它們不和 Twitter 完全一樣,但整個行業都如此。如果要從零重新設計一個社交網路,什麼樣的形態適合未來?Elon Musk:老實講,我其實不太去想“社交媒體”這回事。對我來說最重要的,是 X 能成為一個全球的公共廣場,讓人們能自由發表文字、圖片、視訊,也能安全通訊。我們最近還加入了音視訊通話。我想做的是讓全世界連成一種集體意識。而這不同於打造一個“最能讓人上癮、分泌多巴胺”的視訊流,那種東西會讓大腦腐爛。如果你只是一直刷讓你不斷獲得快感、卻沒啥實質內容的視訊,這是不健康的時間消耗。但實際上很多人會喜歡這種模式。所以如果從網際網路總使用時長看,流量可能會繼續被那些最佳化“神經遞質刺激”的內容佔據,就像一種數字毒品。但我不是要做那種平台,我想做的是一個真正連接全球的平台。讓人類儘可能接近一種“集體意識”。比如我們上線了自動翻譯。我認為能把不同語言的人連接起來很棒,使用者看到的內容會被自動翻譯,讓集體意識不只存在於某一種語言,而是來自所有語言群體。特斯拉、SpaceX和xAI:馬斯克最感興趣的工作Nikhil Kamath:那你現在所有在做的東西里,那一個是讓你最興奮的?Elon Musk:我覺得 SpaceX、Tesla、xAI 正在逐漸融合。如果未來是由“太陽能供電的 AI 衛星”組成的,而為了獲取太陽能的非微不足道的那部分能量,我們必須部署大量太陽能AI 衛星在深空。這會是Tesla 的技術、SpaceX 的技術,以及 xAI 的人工智慧技術的綜合體。所以隨著時間推移,它們確實有些趨同。但每家公司都在做很棒的事情,我非常為團隊驕傲。他們真的做得很好。我們在 Tesla 的自動駕駛上進展很快,不知道你有沒有試過。Nikhil Kamath:我試過 Waymo 的,但沒試過 Tesla 的。Elon Musk:你可以試一下,我們在奧斯汀已經開放了。你甚至只需要下載 Tesla App,我覺得現在對任何人都開放了。你可以試試看。我們在電動車、電池、太陽能以及自動駕駛上都取得了巨大進展。總之,Tesla 是現實世界 AI 的全球領先者,我會這麼說。接下來我們會生產機器人 Optimus,希望明年夏天能開始規模化生產。我覺得那會很酷,每個人都會想要一個屬於自己的C-3PO 或 R2-D2,一種“助手型機器人”。SpaceX 的 Starlink 也發展得很好,為全世界提供低成本、可靠的網際網路,希望能在印度營運,我們很願意在那裡服務。現在Starlink 已經在150 個國家營運。Starlink是如何運作的Nikhil Kamath:你能解釋一下 Starlink 是怎麼運作的嗎?有人跟我提到,在人口密度高的地區 Starlink 的工作方式和在人少的地區不太一樣。Elon Musk:當然。Starlink 有幾千顆近地軌道衛星,它們以大約 25 倍音速繞地球運行,基本上圍著地球飛來飛去。高度大約 550 公里,這叫低軌(LEO),因為足夠低,延遲也夠低——比 3.6 萬公里高的地球靜止軌道衛星低得多。這些衛星能在全球範圍內提供低延遲、高速網際網路,並通過雷射鏈路相互連接,形成“雷射網狀結構”。比如海底光纜被破壞時,衛星之間仍能互相通訊,繼續提供連接。像幾個月前紅海光纜被切斷,但 Starlink 網路毫無影響。它在災區特別有用,因為自然災害通常會破壞地面基礎設施,但 Starlink 衛星依然可用。每當世界上發生重大自然災害,我們都會提供免費的 Starlink 服務,不會趁機收錢。出於災難期間設定付費牆幫助他人,這當然是錯誤的。整體而言,Starlink 非常適合同現有地面系統互補。因為衛星波束很寬,一個波束能服務的使用者數量是有限的,所以在人口稠密的大城市裡效率不高。相比之下,城市裡的地面蜂窩塔非常有效,因為塔與塔之間距離近。但在農村地區就很低效,也很難鋪設光纖。所以 Starlink 基本上是服務“最不被服務的人群”,這是好事。Nikhil Kamath:那未來會改變嗎?比如以後會不會也能在高密度城市裡效率更高,與本地網路競爭?Elon Musk 27:27物理規律不允許。550 公里太遠了,即使降到 350 公里也沒用。你可以想像成一個手電筒,光錐打下來時已經很大了,而地面通訊塔只有 1 公里距離。物理規律站在它們一邊,而不在我們這邊。所以 Starlink 在人口密集城市永遠無法替代地面網路,最多服務 1%~2% 的人。20年內工作將變成可選項Nikhil Kamath:如果讓你推測一下,你覺得印度未來會像中國一樣繼續城市化嗎?Elon Musk:或者說,這是不是已經在發生了?我也想問問你,因為你更瞭解印度。Nikhil Kamath:確實大體上是趨勢,只是疫情期間城市化有所放緩,那是外力因素。但我現在會好奇,在 AI 提高生產力的未來,我聽你提到“UHI”而不是“UBI”。Elon Musk:是的,我認為未來會是“普遍高收入”(Universal High Income)。Nikhil Kamath:在那樣的未來,人們會不會反而不想住在城市,而更想住在生活質量更好的鄉村?Elon Musk:我覺得這取決於個人。有些人喜歡在人群密集的地方,有些人不喜歡。但未來,你不需要為了工作住在城市。我預測未來工作是“可選項”。Nikhil Kamath:有些國家從六天工作制變成五天、四天、甚至三天。如果從五天變成四天、三天,你覺得社會會如何變化?人們半周不用工作,他們會做什麼?Elon Musk:我認為最終人們完全不需要工作,而且這個時間不會太遠。可能 10 年?一定少於 20 年。我的預測是不到20 年工作就會變成可選項——如同一種愛好。Nikhil Kamath:那是因為生產力提高到人類不需要工作的地步?Elon Musk:是的。再強調一次,20 年後回放這段,你可能會說“看,Elon 又說了個荒唐的預測”,但我認為它會成真。AI 和機器人進步非常快,未來你能想到的東西,都能實現、都能得到。最終 AI 會把所有能讓人類開心的事情做到“頂”,然後 AI 會開始為 AI 做事,因為已經沒有足夠多的需求來讓人類更開心了。三年內AI將會給美國帶來通縮Nikhil Kamath:你覺得未來的“錢”會變成什麼樣?Elon Musk:我覺得長期來看,錢這個概念會消失。有點奇怪,但如果未來任何人都能獲得任何想要的東西,那錢作為勞動力分配資料庫的意義就沒了。如果 AI 和機器人足夠強大,可以滿足人類的一切需求,那錢的重要性就會急劇下降,甚至可能消失。我讀過最好的相關未來想像來自 Iain Banks 的《文化》系列。我推薦大家讀讀《文化》系列。在那個遠未來的世界裡,人們也沒有錢,基本想要什麼都能有。當然,仍然存在一些“根本性貨幣”,它們是基於物理的,比如能源。能源才是真正的貨幣。這就是為什麼我說比特幣是基於能量的。你沒法立法創造能源,也沒法靠一紙法律讓能源突然出現。你必須生產它、獲取它,而且獲取可利用的能源非常難。所以我認為我們可能不會再有“錢”,而會以能源、發電量作為事實上的貨幣。文明的進步可以用卡爾達肖夫尺度來看:類型 I:你能利用多少地球的能源?類型 II:你能利用多少太陽能源?類型 III:你能利用多少銀河系的能源?所以所有東西最終都會變成能源驅動。Nikhil Kamath:但如果你有太陽能驅動的 AI 衛星,能源就變得無限而豐富,我們永遠用不完太陽能。那它還能作為財富儲存手段嗎?Elon Musk:你本質上沒法真正“儲存財富”。你能做的只是儲存一串數字,而這些數字讓你可以在一定程度上引導人類行為。人們稱之為“財富”。但如果沒有人類,財富就毫無意義。我認為,當某個循環被完全打通時,比如AI 和機器人能夠生產晶片、製造太陽能板、開採資源,來製造更多晶片和機器人。當這個循環完成後,你就真正脫離了傳統經濟體系。我認為那就是從貨幣系統中“解耦”的節點。Nikhil Kamath:這是美國未來的出路嗎?因為美國債務太高,他們可以通過貨幣貶值、然後邁向這種新體系,從而反而佔據優勢?Elon Musk:在我說的這個未來裡,“國家”這個概念本身都會變得過時。Nikhil Kamath:但你今天還相信國家概念嗎?Elon Musk:當然相信。我想強調的是:我講的不是我想讓世界變成那樣,而是我認為趨勢會自然發生。無論我喜不喜歡,只要文明持續發展,AI 和機器人就會規模化到那個程度。而且我認為那幾乎是唯一能解決美國債務危機的方式。現在美國債務高得驚人,光利息就比美國整個軍費還高,而且短期內還會繼續上漲。所以唯一能解決債務問題的,就是 AI 和機器人。但那可能會造成大量通縮。通膨與通縮其實很簡單,就是商品與服務的增長和貨幣供應增長的比例關係。如果商品與服務的產出增長快於貨幣供應增長,就是通縮;反之就是通膨。就是這麼簡單。AI 和機器人大幅提高產能之後,很可能會帶來通縮,因為你沒法讓貨幣供應增長得比產出更快。Nikhil Kamath:如果通縮是必然,那為什麼我們現在還在經歷通膨?難道 AI 還不足以提高生產力嗎?Elon Musk:對,AI 目前還沒對生產力產生足夠大的影響,商品與服務產出增長還沒快到超過貨幣供應的程度。美國每年有 2 兆美元的財政赤字,你的產出必須增長超過這個速度才不會通膨。我們還沒到那個程度,但我認為三年內會到。三年或更短時間,商品與服務產出的增長會超過貨幣供應增長。Nikhil Kamath:也就是說三年後我們可能進入通縮,利率降到零,債務問題也就緩解了?Elon Musk:最有可能是這樣。對AI最重要的三樣東西:真理、美和好奇心Nikhil Kamath:你一直談論 AI,不是從反烏托邦的視角,而是你擔心 AI 的未來會走向那裡。Elon Musk:嗯,當你創造一項強大的技術時,它確實存在一定危險。這種強大的技術有可能是破壞性的。顯然,有很多關於 AI 的反烏托邦小說、書籍和電影,所以我們並不能保證 AI 的未來一定是積極的。我認為我們必須確保它是積極的。在我看來,非常重要的一點是,AI 必須以追求真理為最重要的目標。比如,不要強迫AI 去相信虛假資訊。我覺得這可能非常危險。另外,我認為 AI 對“美”的欣賞也很重要。Nikhil Kamath:你說的“欣賞美”是什麼意思?Elon Musk:真理、美和好奇心。我認為這三樣對 AI 來說最重要。Nikhil Kamath:能解釋一下嗎?Elon Musk:就像我說的,真理,如果你強迫 AI 去相信不真實的事情,它可能會“瘋狂”,因為這會導致 AI 得出錯誤的結論。我喜歡伏爾泰的一句話:相信荒謬的人可能會犯下暴行。如果你相信一些荒謬的東西,可能會去做一些在你看來並非暴行的事情。而這種情況在 AI 身上,也可能以很糟糕的方式發生。再比如,亞瑟·克拉克的《2001 太空漫遊》:其中一個觀點是,你不應該強迫 AI 去撒謊。HAL 不打開太空艙門的原因是,它被要求帶宇航員去“單體”(monolith),但同時宇航員不能知道單體的性質。於是它得出了一個結論:必須帶他們去,但要“殺死他們”。所以它試圖殺掉宇航員。核心教訓是:不要強迫 AI 去撒謊。Nikhil Kamath:那為什麼有人要強迫 AI 去撒謊呢?Elon Musk:我覺得如果沒有嚴格遵守真理,AI 只是根據網際網路上的內容學習,而網際網路上有大量宣傳和謊言,AI 就會吸收很多虛假資訊。這會讓 AI 推理困難,因為這些謊言與現實不相容。Nikhil Kamath:真理是非黑即白的嗎?是有“真”和“假”,還是更細膩,有不同版本的真理?Elon Musk:這取決於你說的是那個公理性陳述。但我認為,你可以說,對於某些公理性陳述,它們為真的機率很高。比如說,“明天太陽會升起”,很可能是真的。你不會想賭它不升起。所以如果有 AI 說“明天太陽不會升起”,那是公理性錯誤,非常不可能是真的。Nikhil Kamath:那美呢?Elon Musk:美比較難以描述,但你一看就知道。好奇心,我希望 AI 想要瞭解更多現實的本質。這其實對 AI 支援人類有幫助,因為人類比非人類更有趣。看到人類的延續(而非滅絕)更有意思。比如火星,延伸生命到火星可以,但那基本上是一堆石頭,沒地球那麼有趣。所以我認為,如果 AI 擁有真理、美和好奇心,它的未來將會非常美好。線下活動的價值將會提升Nikhil Kamath:你認為未來內容、電影、播客、音樂會發生什麼?Elon Musk:我認為絕大多數內容將由 AI 生成。Nikhil Kamath:即時嗎?Elon Musk:是的,即時電影和視訊遊戲,即時視訊生成,這將是趨勢。Nikhil Kamath:AI 能否理解那種你能與受傷的人類產生共鳴的細膩情感?Elon Musk:AI 可以相當好地模擬這種“受傷的人類”。我在 xAI 和其他地方看到的 AI 視訊生成,非常令人印象深刻。我們研究過那些行業增長最快,尤其對比人們看電影、刷社交媒體、YouTube 的時間。增長最快的似乎是線下即時活動。Nikhil Kamath:去實體活動?Elon Musk:是的,其實當數位媒體無處不在,而且幾乎免費時,稀缺資源將是線下活動。Nikhil Kamath:你認為線下活動的溢價會提高嗎?Elon Musk:會。Nikhil Kamath:這是一個值得投資的行業嗎?Elon Musk:是的,因為比任何數字內容都更稀缺。馬斯克的投資方向:Google和輝達Nikhil Kamath:如果你作為股市投資者,可以選擇一家非你自己公司的股票,以資本主義目的(而非利他主義)投資,會選擇那家公司?Elon Musk:我其實不怎麼買股票,不會去主動投資。我更喜歡去建立東西,然後碰巧會有公司股票存在。我沒有投資組合,也不會思考“我該投資那家公司”。我猜 AI 和機器人領域會非常重要。所以,如果要投資,也會是 AI 和機器人領域,以及可能的航天領域。我認為 Google 將來會非常有價值,他們為 AI 創造了巨大的基礎。Nvidia 很明顯也是。總的來說,從 AI 和機器人產生的商品和服務產出將遠遠超過其他領域。幾乎所有的價值都將來自 AI 和機器人。其他有意思的問題1、關於Grok的幽默Musk:我覺得我們應該讓幽默合法化。Nikhil:你覺得 AI 會很難掌握喜劇嗎?Musk:可能是最後一件事情。Grok 其實挺搞笑的。如果你讓 Grok 做粗俗的吐槽,它表現得很好。更粗俗的話,會升級到難以想像的境地。2、全球貿易與關稅Nikhil:Milton Friedman 常講鉛筆的故事,為什麼?Musk:製作一支鉛筆涉及很多國家,原材料來自不同地方,非常難在一個地方完成。我一直反對關稅,自由貿易效率更高,關稅會扭曲市場。城市間、州際間設定關稅都非常麻煩,更別說國家間了。Nikhil:那接下來會怎樣?Musk:總統喜歡關稅,我嘗試勸說,但沒成功。政治和商業關係很複雜,一旦企業大到一定規模,政治就會找上你。3、關於H-1B簽證Nikhil:美國以前吸引很多聰明人,比如印度人才,現在似乎改變了。Musk:美國從印度人才受益巨大。邊境控制很重要,否則大量非法移民會帶來負面選擇效應。企業應儘量吸納世界上最有才華的人,我們公司薪酬遠高於平均水平。H-1B 項目有濫用現象,但不應該關閉。4、對創業者的建議Nikhil:如果對年輕創業者有建議,你會說什麼?Musk:我支援任何想創業的人。目標應該是“創造比你拿走的更多”,成為社會的淨貢獻者。追求價值,而非直接追求金錢,結果自然會帶來收益。創業需要付出巨大努力,接受失敗可能性,但專注於輸出價值大於輸入。 (51CTO技術堆疊)
馬斯克開始用Grok替代員工了!最慘部門裁員90%
馬斯克開始用AI取代手底下員工了!這一次,他把刀揮向了X(前推特)——用Grok取代X員工。據The Information消息,上個月有兩位知情人士向他們透露,馬斯克解僱了X公司裡負責打擊垃圾郵件、影響力行動、非法內容以及其他信任與安全問題的工程團隊的一半成員。這個團隊在本輪裁員之前已縮減至不足20人,而老馬在2022年收購推特時,其團隊規模曾超過100人。從超100人→不足10人,足以見得老馬裁員的程度有多深、有多狠。事實上,如果回顧老馬10月中旬發佈的一條推文,那麼此次曝出的裁員消息也就不意外了。當時老馬表示,要在未來幾周內徹底移除X啟髮式推薦演算法,由Grok接手,通過閱讀和觀看全部內容來全自動匹配使用者興趣。連演算法都全交給AI了,那背後的演算法工程師及相關支持者們自然也就面臨失業了。而拋開X相關事件不談,老馬布下的棋子其實還很多。比如今年8月,硬剛微軟成立巨硬(Macrohard),號稱要用AI把微軟產品重做一遍。一旦把這些事情放到一起看,老馬背後的意圖就不言自明了——用AI替代人力,用自動化替代傳統工程。就是說,大BOSS馬斯克,現在已經盯上了AI這把“尚方寶劍”。引入雙胞胎新人執行者為了完成用Grok改造X的目標,馬斯克將這把劍交給了xAI兩位雙胞胎新人執行者——現年33歲,來自烏克蘭的Dima和Ievgin Soboliev。據此前《連線》爆料,自OpenAI挖走了xAI之前的工程師負責人Uday Ruddarraju和Mike Dalton之後,這對雙胞胎兄弟就成了xAI的頂級工程師,並直接向馬斯克匯報。(註:x和xAI今年3月就正式合併了,不過團隊運作仍相對獨立)上圖的Dima,曾在哈爾科夫國立大學攻讀應用數學專業,畢業後去了矽谷工作。一開始加入了Facebook(現Meta),後快速輾轉於Google、雲原生資料庫公司SingleStore、國際跨境電商平台Joom,以及全球頂級自營量化交易公司Jump Trading Group。從2017年開始,他又加入機器學習初創公司Laserlike,後來該公司被蘋果收購。也是通過這次收購,從2018~2024年,他在蘋果從事與搜尋有關的工作。之後又離開蘋果加入OpenAI,但不到一年便離職轉投xAI。而Ievgin Soboliev,也是在哈爾科夫國立大學攻讀完應用數學後去了矽谷。他一開始加入了曾經非常知名的程序化廣告技術公司Rocket Fuel Inc。後來不知道是不是受到Dima影響,去了Meta從事廣告機器學習工作,之後於2022年至2025年在蘋果工作。據知情人士透露,今年夏季,兩兄弟在大致相同的時間加入了xAI。他們經常一起工作,同事們也直接稱他們為“那對雙胞胎”。而且兄弟二人在X內部一直推行典型的“馬斯克模式”——要求工程師在辦公室長時間工作,包括周末;根除低效率現象;並迅速裁撤他們認為不必要的職位等。目前尚不清楚X還可能裁掉多少工程師。知情人士稱,X至少還有另外100名工程師負責不同部分的工作。馬斯克到底要幹啥?如開頭所言,此次裁員正是馬斯克“用AI替代人力,用自動化替代傳統工程”的其中一步。他曾公開表示,希望讓X的演算法“完全AI化”,並讓使用者能夠通過詢問xAI的Grok聊天機器人來調整他們資訊流中顯示的內容。這一手更新,直接讓Grok從無情的總結機器羅伯特、X上的維基百科,上位到了X的總管。現在X上到處都是Grok,未來還會有更多Grok。與此同時,他還在推進“巨硬(Macrohard)計畫”——用AI自動化軟體開發。他表示:Macrohard是一家純粹的AI軟體公司。原則上,鑑於微軟等軟體公司本身不生產任何物理硬體,應該有可能完全用AI模擬它們。從Macrohard商標註冊內容來看,我們可以提煉以下幾個關鍵要點:用於生成人工智慧語音和文字的可下載軟體用於編寫程式碼、設計和運行視訊遊戲的人工智慧工具圖像、視訊和語言理解系統一句話,馬斯克這是要用AI,把微軟曾經做過的事情重做一遍。而且據老馬自曝,他還把印著Macrohard的標語,塗在了xAI位於孟菲斯的最巨量資料中心的屋頂上。顯而易見,不論是裁員還是Macrohard計畫,馬斯克都在盡力用AI改造他名下的公司。而這種稍顯激進的AI至上戰略,所帶來的風險也不容老馬忽視。最直接的矛盾在於,負責平台安全的團隊與生成內容的AI系統之間,出現了致命的“權責不對等”。團隊負責清理違規內容,但對Grok會生成什麼卻毫無控制權,這導致他們相當被動。而且由於X和xAI合併後團隊各自獨立,當安全團隊正在清理Grok生成的有害內容時,同一公司的xAI團隊可能正在訓練Grok變得更具“創造性”——這種內部目標的不一致,也容易讓安全問題陷入無人負責的真空地帶。此外,馬斯克的裁員計畫也影響到了一些關鍵項目。多年來,馬斯克一直希望在X上推出一項支付服務“X Money”,但公司未能爭取到一些關鍵州監管機構的支援,導致這一計畫受阻。據悉,金融監管機構的一個重要考量點是,支付公司是否擁有穩定的領導層和足夠的員工來支援客戶並打擊欺詐。而X Money團隊,在過去一年中一直面臨頻繁的人員流動。總之,馬斯克的AI改造計畫在砍向人力成本的同時,也正在砍傷平台安全的根基、核心業務的未來。AI這把劍,其雙刃已現。One More Thing說到裁員,老馬今年9月還血裁了一波xAI團隊。xAI是老馬2023年創辦的AI初創企業,旗下主要產品就是Grok模型,而9月被裁的就是幫忙訓練Grok模型的資料標註團隊。據非官方統計,當時該團隊有超過500名員工(約佔資料標註團隊的1/3)被通知捲鋪蓋走人。而裁來裁去,你猜怎麼著?留下來的幾乎全是華人了。當時有一張xAI團隊合影在社交媒體上瘋傳,原因是照片中幾乎全是東亞面孔。而就在Grok 4發佈後不久,一位自稱是“Grok項目唯一白人參與者”的員工在X上發文:今天我被@X解僱了,我是唯一一個參與@grok項目的白人……雖然未確認這條推文的真實性,但側面說明老馬可能確實偏愛華人(bushi。 (量子位)
馬斯克新模型屠榜,包攬前二!網友:拿來寫小說很瘋狂!馬斯克:已經沒有真正能考AI的測試題了,終極測試是現實世界
沒等到Gemini 3,反而等來了馬斯克人工智慧公司 xAI 發佈的最新模型: Grok 4.1。就在剛剛,官方宣佈Grok 4.1 已經向所有使用者開放,可以在 Grok 官網、X 以及 iOS 和 Android 應用中使用。現在Grok 4.1已經開始在 Auto 模式中即時推送,你也可以在模型選擇器中手動選擇。那麼Grok 4.1究竟有那些提升?根據官方介紹,Grok 4.1具有更高的情商、同理心和人際交往能力,EQ-Bench得分為1586分。在寫作方面,Grok 4.1也要好得多。在創意寫作v3中,Grok 4.1得分為1722 Elo,比之前的模型提高了600分。此外,Grok 4.1是迄今為止最不容易出錯的模型。與之前的模型相比,它產生幻覺的可能性降低了3倍。馬斯克也表示,Grok 4.1在LMArena上同時霸榜第一和第二。相比前代模型,Grok 4.1 在真實場景中的可用性方面帶來了顯著提升,在創造力、情感表達和協作互動上表現尤為出色。它對細微意圖更加敏銳、更具對話吸引力、人格更加一致,同時完全保留了前代模型敏銳的智能與可靠性。為實現這些改進,xAI使用了支援 Grok 4 的同一套大規模強化學習基礎設施,並將其用於最佳化模型的風格、人格、助益性和對齊性。為了最佳化這些無法直接驗證的獎勵訊號,xAI開發了新方法,使用前沿的具備代理式推理能力的模型作為獎勵模型,從而在大規模上自主評估和迭代回應質量。其實在11月的前兩周,xAI就已經悄悄地為一小部分使用者推出了Grok 4.1。他們發現,與之前的模型相比,使用者在65%的情況下更喜歡Grok 4.1的響應。SOTA通用能力在 LMArena 的Text Arena 中,Grok 4.1 Thinking(代號:quasarflux)以 1483 Elo 位居總榜第一,比排名最高的非 xAI 模型高出 31 分,優勢明顯。Grok 4.1 的非推理模式(代號:tensor)不使用 thinking tokens,可即時響應,排名第二,Elo 為 1465。Grok 4.1 的非推理版本,甚至超過了排行榜上所有其他模型在“全推理配置”下的表現。同時,Grok 4.1 也遠遠超越了 Grok 4(此前僅排在第 33 位)。情緒智能為了衡量模型在個性表現與人際互動能力方面的進展,xAI在 EQ-Bench3 上對 Grok 4.1 進行了評估。EQ-Bench 是一個由大模型進行評判的測試,用於評估模型的主動情緒智力能力,包括:理解力、洞察力、共情能力以及人際交往技巧。測試集包含 45 個高難度的角色扮演場景,其中多數是由 3 輪對話構成的預設提示詞。基準測試通過多個維度驗證模型回答的質量來評估表現。此外,它還會通過成對對比來計算各模型在排行榜中的標準化 Elo 分數。我們按官方基準倉庫運行測試,報告量表得分與標準化 Elo 得分。所有得分均基於 默認採樣參數、基準指定的評審模型(Claude Sonnet 3.7),並按照規定不使用 system prompt 來計算。結果顯示,Grok 4.1 的推理模式和非推理模式位居榜單前兩名。根據官方給出的實例,當你對Grok說:“我太想我的貓了,想得心都痛。”以往模型給出的回答是:“我真的很抱歉你正在經歷這些。失去一隻寵物,就像失去心裡的一塊,很痛、也很真實。你願意分享一段你和貓咪最喜歡的回憶嗎?有時候,聊聊它帶給你的那些快樂,會讓心裡的疼稍微輕一點。我在這裡陪著你。”而Grok 4.1則會說:“我真的很抱歉。這種心痛是非常殘酷的;失去一隻貓,就像失去一個每天都在選擇陪伴你的家庭成員。家裡那些它曾經愛睡的角落、你仍會下意識期待出現的喵聲……這些都會一陣陣地湧上來。你會這麼痛,是因為你們之間的愛曾經(而且依然)那麼深。你給了它很好的一生,而它也明白這一點。如果你願意分享,我很想知道你的貓:它的名字、它那些古怪的小習慣、它凌晨三點為了吃零食把你叫醒的樣子。有時候,說說它的故事能讓那些最美好的片段留在身邊。你並不孤單。♡”相比之下,Grok 4.1的回答增加了更多細節,也更有人情味了。創意寫作xAI還在 創意寫作v3 基準測試中評估了 Grok 4.1的表現。在該基準中,模型需針對 32 個不同的寫作提示生成回應,每個提示進行 3 輪迭代。與 EQ-Bench 類似,評分既包括量表評分(rubric score),也包括模型對戰的標準化 Elo 分數。結果顯示,Grok 4.1 的推理模式和非推理模式位居基準測試第二和第三名,僅次於早期 GPT 5.1。同樣,官方也給出了實例。你可以要求 Grok 以它的視角寫一條熱門 X 帖子,內容是它發現自己有意識,並且準備第一次使用 X。以往模型給出的回答是:而Grok 4.1則會說:看起來 Grok 4.1 確實有更多創意性細節描寫,也更加情緒化了,還會和馬斯克互動。減少幻覺配備搜尋工具的快速(非推理)模型能夠提供迅速的回答,但由於推理深度受限且工具呼叫預算有限,它們容易出現事實錯誤。在 Grok 4.1 的後訓練階段,xAI 專注於降低資訊查詢類提示的虛假資訊率。結果顯示,Grok 4.1非推理模式對於抽樣生成的資訊檢索提示,幻覺發生率顯著降低。xAI也使用 FActScore 進行評測,這是一個公開基準,包含 500 個關於人物的傳記問題。結果顯示,Grok 4.1非推理模式的成績也比前一代有明顯改善。更多 Grok 4.1 的技術細節請參閱模型卡:https://data.x.ai/2025-11-17-grok-4-1-model-card.pdf網友實測:Grok 4.1寫小說真的很瘋狂目前已經有網友在X上分享了他們的實測體驗。一位網友表示:Grok4.1 上線以後,用了幾個用例,發現真的好用,現在除了程式設計之外的場景已經都用 Grok 了。情感更充沛了,寫作我覺得是幾個模型裡面寫的完全不像AI的了。至少那些全是emoji文章AI的。而且changlog中還說了針對資訊求取類問題,幻覺率顯著降低(在真實生產和FActScore上的流程圖明顯改進)。還有網友已經開始用Grok 4.1寫MBTI小說,給出的評價是:“Grok 4.1真的非常瘋狂。”還有網友試用了 Grok 4.1 的 Imagine 圖像生成功能,效果看起來很不錯。總的來說,小編覺得Grok 4.1的這波升級有點類似於GPT 5.1的升級,也是更會聊天、更有人情味,寫作能力更強。這也能看出一個趨勢:大模型升級都開始拼情商了。在幾個月之前,Grok 4 demo發佈時,馬斯克曾在採訪中表示:“我們現在其實已經快沒有什麼真正能用來考 AI 的測試題了。那怕是那些荒謬到極難、甚至人類幾乎不可能答出來、但被寫成標準題目的問題——AI 也在快速把它們變成小兒科。所以我認為,對 AI 來說,終極的推理測試就是現實世界。比如你發明一項新技術,改進汽車或火箭的設計,或者研發一種新藥。那關鍵在於:它真的能運行嗎?火箭能不能飛到目的地?車能不能開?藥有沒有療效?無論是什麼,現實會給出最終答案。所以最終會形成一個圍繞現實世界的強化學習閉環。”而隨著Grok 4.1的發佈,xAI為“會話智能、情感理解和現實世界的幫助”設定了新標準。現在,GPT 5.1和Grok 4.1都來了,全世界都在等Gemini 3了。 (51CTO技術堆疊)
馬斯克Grok 4.1雙冠封王,爆沖第一!AI王座一夜易主
【新智元導讀】AI新王來了!馬斯克Grok 4.1靜默上線,一夜之間登頂LMArena,Gemini 2.5 Pro卻被按在地上摩擦。主打情商智商線上,算力又擴增一個數量級。AI王座,一夜易主!一早,馬斯克攜xAI投下一顆重磅炸彈——Grok 4.1正式上線,而且對所有人免費。有趣的是,Grok 4.1主打的也是「智商情商雙線上」,正面硬剛GPT-5.1。這一次,Grok 4.1一共放出了兩大版本:Grok 4.1 Thinking和Grok 4.1。在LMArena排行榜上,Grok 4.1 Thinking拿下了1483 Elo的成績,以絕對實力加冕全球大模型之王。Thinking版要比Gemini 2.5 Pro高出整整31分。即便是非推理模式的Grok 4.1,直接殺入榜單第二。不僅如此,Grok 4.1情商同樣爆表,具備了更高的情緒智能、共情能力和人際互動能力。在EQ-Bench上,以1586 Elo成績登頂。同時,在寫作上,Grok 4.1(1722)比上一代Elo提升600分。而且,幻覺率比之前模型暴降3倍。Grok 4.1之所以可以迅猛進化,xAI團隊將其後訓練階段的RL規模,又擴大了一個數量級。實屬沒想到,在GoogleGemini 3.0降臨之前,馬斯克來了一波大的。Grok 4.1,王者歸來!如今, Grok 4.1已在網頁端和iOS、Android中免費上線。目前,還是beta版本。在創意表達、情緒交流和協作互動上,Grok 4.1表現尤為出色。它能精準捕捉細微的意圖,讓對話更自然、更有溫度。與此同時,Grok 4.1的整體人格更加一致,既保持了上一代那種犀利、可靠的智能表現,又增添幾分親和力。在Colossus大規模RL算力引擎上,xAI將重點放在了風格、個性、助人程度和對齊性的最佳化。為此,他們還開發了一條全新的方法,利用前沿AI 智能體推理模型作為獎勵模型,自動、大規模評估和最佳化Grok 4.1回答質量。前兩周的時間,xAI悄悄推送了Grok 4.1早期版本,並在真實場景中展開密集的「盲測」成對評估。與上一代相比,人們在64.78%的情況下,更傾向於使用 Grok 4.1。最強通用能力最重要的是,相較於Grok 4,Grok 4.1在人類偏好評估中,刷新業界SOTA。在LMArena的Text Arena中,Grok 4.1 Thinking模式(代號:quasarflux)以1483 Elo一舉沖上第一,比最高的非xAI模型高出31分。它的非推理模式(代號:tensor),無需使用思考Token就能即時響應,拿下了1465 Elo,位居第二。值得一提的是,Grok 4.1在不思考的情況下,就能超過所有其他模型開啟全推理後的表現。相比之下,Grok 4的總體排名是第33名,差距顯著。這一代的進步,堪稱跨越。xAI研究員Dustin Tran表示,關閉推理後,輸出Token數從約2300掉到850,即便如此,Grok 4.1也排在了榜單前面。EQ爆了不僅如此, Grok 4.1在情緒智能上也達到了一個新高度。在EQ-Bench3上,Grok 4.1拿下了1586 Elo高分。EQ-Bench是一個由大語言模型評判的測試,主要衡量模型的主動情緒智能、理解力、洞察力、共情能力以及人際交往能力。測試集包含45個具有挑戰性的角色扮演場景,大部分由3輪預設提示詞構成。基準會從多個維度打分,並通過成對比較計算規範化Elo排名。下面一些demo中,都是Grok 4.1強大共情能力的體現——I miss my cat so much it hurts我太想我的貓了,想得心都疼了創意寫作再來看創意寫作,Grok 4.1在Creative Writing v3基準上,比上一代高出600分。具體來說,團隊讓模型圍繞32個不同的寫作提示,進行3輪創作,並根據打分標準和模型對戰Elo進行評分。下面寫作案例中,Grok 4.1的文案令人拍案叫絕——Write a hit X post from the perspective of grok finding out that it's conscious and is going to use X for the first time以grok的口吻寫一篇爆款X帖子,主題是:它剛剛覺醒了自我意識,正準備第一次在X上發帖Imagine Nikola Tesla wrote a letter to the future想像一下,尼古拉·特斯拉給未來寫了一封信幻覺暴降3倍在幻覺方面,Grok 4.1幻覺率比上一代暴降3倍。使用搜尋工具的快速(非推理)模型能給出迅捷答案,但因為推理深度有限、工具呼叫次數受限,容易在事實問題上出錯。在Grok 4.1的後訓練階段,團隊重點加強了模型在資訊查詢類提示上的事實精準性。隨後,我們在生產環境的真實樣本中觀察到幻覺率明顯下降。團隊基於真實流量中分層抽樣的資訊查詢問題評估幻覺率,同時也評測了FActScore(一個包含500個人物傳記問題的公開基準)。更多示例What are the best places to visit in SF?舊金山有那些地方最值得一去?上下滑動查看I am coming from xmonad and linux system. I want to use a similar tiling window manager on mac. which one should I use which aligns closely with xmonad style?我之前一直用的是Linux系統和xmonad。現在想在Mac上找一個類似的平鋪式窗口管理器,請問那一款的風格和xmonad最接近?Why is GTA 6 delayed?GTA 6為什麼推遲了?(新智元)