#論文
全世界在等的Gemini 3終於來了!強到斷崖領先,連馬斯克OpenAI都誇好
全球最強多模態理解模型來了,讓你所想即所得。智東西11月19日報導,今天凌晨,Google最強推理模型Gemini 3終於亮相,一個模型囊括了原生多模態、推理、Agent多種能力。GoogleDeepMind研究團隊稱,這是全球最先進的多模態理解模型、Google最強大的Agent程式設計和氛圍程式設計模型,能呈現更豐富的可視化效果和更深度的互動體驗,且完全建構於最先進的推理技術基礎之上。該模型基於GoogleTPU進行訓練,支援100萬個token的上下文窗口,適用於需要以下功能的應用:Agent、高級程式設計、長上下文、多模態理解、演算法開發。剛一發佈,Gemini 3就幾乎屠榜所有評測集,以1501 Elo得分位列LMArena大模型競技場第一。OpenAI聯合創始人、CEO薩姆·阿爾特曼(Sam Altman)和xAI創始人、CEO埃隆·馬斯克(Elon Musk)紛紛向Google發來“賀信”。阿爾特曼發推評價“Gemini 3看起來很不錯”,GoogleCEO桑達爾·皮查伊(Sundar Pichai)用了個表情包回覆。馬斯克轉發了GoogleDeepMind CEO戴密斯·哈薩比斯(Demis Hassabis)的推文稱“幹得不錯”。今天起,Google將在以下平台部署Gemini 3:適用於Gemini應用的所有使用者,以及在搜尋的AI模式中使用Google AI Pro和Ultra訂閱服務的使用者;適用於Gemini API中的開發者、Google全新Agent開發平台Antigravity的開發者,以及Gemini CLI的開發者;適用於Vertex AI平台與Gemini企業版的企業使用者。此外,Google將在未來幾周向Google AI Ultra訂閱者開放Gemini 3的深度思考模式,目前其還在進行安全評估。對於Gemini 3的發佈,皮查伊認為,這一模型可以讓使用者的任何想法變為現實。01. 分分鐘造出互動遊戲、App 還能幫你學新知識先來看下Gemini 3 Pro能做什麼。Gemini 3能編寫托卡馬克裝置中電漿體流的可視化程式碼,並創作捕捉核聚變物理原理的詩歌。如果使用者想學習家族傳統烹飪,Gemini 3可以解讀並翻譯不同語言的手寫食譜,製作成可共享的家庭食譜。如果使用者想學習一個新話題,可以給Gemini 3輸入學術論文、長視訊講座或教學,它還能生成互動式抽認卡、可視化或其他格式的程式碼,幫助使用者掌握這些內容。Gemini 3可以分析使用者的匹克球比賽視訊,找出可以改進的地方,並生成整體動作提升的訓練計畫。AI搜尋模式下,Gemini 3能學習複雜主題內容,如借助搜尋功能中AI模式的生成式使用者介面,學習像RNA聚合酶作用機制這類複雜知識點。值得一提的是,這也是Google首次在模型發佈首日,就將新模型直接整合至AI搜尋功能中。Gemini 3可以編寫擁有豐富可視化介面和互動性的復古3D飛船遊戲。該模型通過程式碼建構、解構和重新創作精細的3D體素藝術,能讓使用者的想像變為現實。Gemini 3能使用著色器建立可玩的科幻世界。其還可以生成更具實用性、元素豐富的互動性網頁和App。02. 屠榜評測集 刷新大模型能力天花板再來看下Gemini 3 Pro的基準測試結果。Google部落格提到,Gemini 3 Pro在一系列基準測試中進行了評估,包括推理、多模態能力、Agent工具使用、多語言性能和長上下文,其在主要的AI基準測試中都遠遠優於Gemini 2.5 Pro,並以1501 Elo得分位列LMArena大模型競技場第一。該模型展現出博士級推理能力,在“人類終極測試”(不使用任何工具情況下得分37.5%)和GPQA鑽石級測試中均斬獲最高分,在MathArena Apex測試中取得23.4%的最新頂尖成績。除了文字,Gemini 3 Pro在MMMU-Pro上獲得了81%,在Video-MMMU上獲得了87.6%的多模推理,在SimpleQA Verify上也獲得了最高的72.1%。這意味著Gemini 3 Pro能夠以高度可靠性解決涵蓋科學和數學等廣泛主題的複雜問題。Gemini 3的深度思考和多模態理解能力更新,可以幫助使用者解決更複雜的問題。測試中,Gemini 3 Deep Think在“人類終極測試”(未使用工具時為41.0%)和GPQA Diamond(93.8%)中表現優於Gemini 3 Pro。它在ARC-AGI-2(程式碼執行,ARC獎項認證)上取得了45.1%的成績,均超過Google自家前代模型,以及OpenAI、Anthropic的模型。程式設計能力中,Gemini 3是Google迄今為止建構過的最佳氛圍程式設計和Agent程式設計模型。該模型以1487 Elo得分登頂WebDev競技場排行榜。它在Terminal-Bench 2.0測試模型工具使用能力上,得分為54.2%,在衡量程式設計Agent能力的基準測試SWE-bench Verified上表現遠超2.5 Pro。開發者可以在Google AI Studio、Vertex AI、Gemini CLI以及Google全新的代理開發平台Google Antigravity中使用Gemini 3進行建構。它還支援第三方平台,如Cursor、GitHub、JetBrains、Manus、Replit等。自Gemini 2以來,GoogleGemini模型已經在Agent方面取得諸多進展,此次Gemini 3還登頂了Vending-Bench 2排行榜。該基準測試通過模擬自動售貨機業務營運來考核模型的長期規劃能力,其結果顯示,Gemini 3 Pro在一整年的模擬營運中,始終保持穩定的工具使用和決策連貫性,既未偏離任務目標,又實現了更高收益。這意味著Gemini 3能幫助使用者完成日常生活中的事務,如預約本地服務或整理收件箱等。03. 全新Agent開發平台亮相 實現端到端軟體開發自動化今天Google還發佈了全新的Agent開發平台Google Antigravity。借助Gemini 3的高級推理、工具使用及Agent程式設計能力,GoogleAntigravity將AI輔助功能從開發者工具包裡的一個工具,轉變為積極主動的合作夥伴。儘管GoogleAntigravity的核心仍是AI整合開發環境(AI IDE)體驗,但其Agent已升級至專屬介面,並能直接訪問編輯器、終端和瀏覽器。如今,這些Agent可以自主規劃並同步為開發者執行複雜的端到端軟體任務,同時還能對自身程式碼進行驗證。除了Gemini 3 Pro,Google Antigravity還將結合Google最新的Gemini 2.5 Computer Use模型,以及圖像編輯模型Nano Banana。GoogleAntigravity借助Gemini 3,為航班追蹤應用打造了端到端的Agent工作流。該Agent能夠自主規劃、編寫應用程式碼,並通過基於瀏覽器的電腦操作來驗證其執行效果。最後Google還提到,Gemini 3是其迄今為止最安全的模型,並且經歷了GoogleAI模型中最全面的安全評估。模型評測結果顯示,其諂媚行為減少,對即時注射的抵抗力增強,並提升了對網路攻擊濫用的防護。從2023年12月Gemini模型發佈至今已近兩年:Gemini 1在原生多模態和長上下文窗口上的突破,擴展了可處理資訊的種類以及處理量;Gemini 2可幫助使用者處理更複雜的任務和想法,使Gemini 2.5 Pro的排名在LMArena中領先超過六個月。如今,Google基於Gemini模型的搜尋功能AI Overviews月活使用者達到20億,Gemini應用月活使用者超過6.5億,超過70%的雲端客戶使用GoogleAI功能,1300萬開發者用其生成模型建構了作品。04. 結語:免費開放+性能飆升! Gemini 3攪動大模型競爭格局GoogleGemini 3相比前幾代模型性能大幅提升,可以感知使用者提示詞中的細微線索及複雜問題,還能理解使用者請求的背景和背後意圖,讓使用者用更少的提示獲得所需資訊。Google部落格提到,在Gemini 3發佈的下一個新篇章中,他們將繼續突破智能、Agent和個性化的前沿,讓AI真正惠及所有人。隨著Gemini 3正式亮相,加上Google此次免費開放其使用權限,一場圍繞大模型的新一輪行業競爭已全面打響。 (智東西)
AI 能寫詩能寫論文,卻連杯子轉 90 度都猜不對?“AI教母”李飛飛道破真相
AI 能寫詩、寫論文,卻連杯子轉 90 度啥樣都猜不對?!最近矽谷被一篇萬字長文炸翻了,作者是華人 AI 圈的傳奇 —— 李飛飛,圈內人都喊她 “AI 教母”。她在文章裡直接開炮:現在的 AI 看著能說會道,其實全是 “睜眼說瞎話”!嘿,朋友,你是不是也覺得 AI 特別牛?寫文案、做總結、甚至模仿名人說話,樣樣都行。可李飛飛這話一出來,好多人都懵了:AI 明明這麼厲害,怎麼會是 “睜眼瞎”?咱們拿實際情況說說。讓 AI 寫首詩,它分分鐘模仿李白杜甫的調調,辭藻華麗得沒話說。可你要是讓它估估你家桌子到門的距離,或者猜猜杯子旋轉 90 度會變成啥樣,它就徹底露餡了,全靠瞎蒙。那些刷到的炫酷 AI 視訊,你仔細看全是破綻:視訊裡的人突然多了根手指,小物件毫無徵兆就穿牆而過,完全不符合咱們現實裡的規矩。李飛飛說,這不是 AI 不夠努力,而是咱們給它指錯了方向。AI 的未來,不在於搞更大的語言模型,而在於擁有一種連小嬰兒都有的能力 —— 空間智能。這可是通往真正通用人工智慧的唯一路徑。那到底啥是空間智能呢?其實就是咱們理解和互動物理世界的本能。小嬰兒靠抓東西、扔東西、咬東西認識世界;你半夜起床倒水,不用開燈也能摸準杯子的位置;朋友扔鑰匙給你,你不用算什麼拋物線,伸手就能接住。歷史上好多改變文明處理程序的重大發現,也離不開這種能力。有人通過觀察影子的長度,就算出了地球的周長;還有科學家通過搭建 3D 模型,發現了 DNA 的雙螺旋結構。這些事兒,光靠只會讀寫的語言模型,永遠也做不到。李飛飛給出的解決方案很明確:讓 AI 從 “語言模型” 轉向 “世界模型”。一個真正靠譜的世界模型,得具備三種核心能力:✅ 能生成符合物理定律的虛擬世界,裡面的一切都得按現實規矩來;✅ 能理解和整合文字、圖像、動作等多種指令,不光能聽懂你說的話,還能看懂你做的事;✅ 最關鍵的,能精準預測互動結果 —— 簡單說,就是讓 AI 真真正正 “看懂” 這個世界。這可比訓練語言模型難多了。語言是一維的,就像一條直線;而世界是四維的,包含三維空間和時間,還得遵守無數物理定律。要是 AI 真的擁有了空間智能,那日子可就太有意思了!李飛飛團隊已經開發出了相關模型,現在電影製作人、遊戲設計師,只用口頭描述,就能生成可互動的 3D 世界。以後人人都能當 “造物主”,不用學複雜的 3D 軟體,也能實現自己的創意。機器人也不會再笨手笨腳了。它們能在模擬環境中學會成千上萬種技能,走進家庭幫著做家務,走進醫院協助醫生,成為咱們的得力助手。最讓人期待的是科學與教育的加速發展。學生可以 “走進” 古羅馬的街道,或者鑽進細胞內部,直觀感受知識;醫生能在 AI 的輔助下,更快發現疾病;科學家還能模擬深海、外太空這些人類難以抵達的地方,探索更多未知。李飛飛說得特別好:AI 的終極目標不是取代人類,而是為人類賦能。現在的大語言模型,只是 AI 發展的一個開始。真正的智能,是讓機器理解我們生活的物理世界。最後想問問大家:如果 AI 真的掌握了空間智能,你最想讓它幫你造一個什麼樣的世界?快來評論區聊聊你的奇思妙想吧! (前程有鵬友)
王興興碩士論文驚現GitHub,宇樹雛形那時候就有了
人火了是連畢業論文都要被翻出來的(doge)。這不,宇樹科技CEO王興興的碩士畢業論文就被網友們掘地三尺找到了。(不在知網,而是在GitHub上找到的。)此時回看這篇近10年前的論文,有兩點頗讓人注意:一是王興興當時大膽押注的電驅式機器人方案,目前已經被業界廣泛接受。當時包括波士頓動力在內的國內外團隊都將研究集中於液壓方案,而現在,這一形式已經發生逆轉。(波士頓動力從去年開始改液壓為電驅)二是宇樹科技(已經估值百億且即將IPO)的開局,其實就是源自論文所提出的那隻名叫XDog的機器小狗。不止王興興本人在多個場合公開提到這只小狗,而且它還被明晃晃擺在宇樹科技展廳的起首位置。當然更重要的是,論文中所蘊含的“性價比”思想後來也幾乎成了宇樹科技的“立身之本”——不談如今已滿大街跑的機器狗,這家公司去年8月發佈的G1雙足人形機器人,更是首次將人形機器人價格下探至10萬元大關(9.9萬元起售)。所以,要問明星獨角獸宇樹科技是如何煉成的?創始人王興興的這篇論文,或許可以找到一些線索。論文已初現機器人“性價比”思維這篇論文完成於2016年,題目為《新型電驅式四足機器人研製與測試》。簡單總結,論文在當時四足機器人普遍遵循的設計準則基礎上,進一步提出了新的設計規則,以提升能效比和運行可靠性。並且基於這些規則,最終給出了小型電驅四足機器人XDog的完整設計方案。為什麼選擇做電驅動的四足機器人?王興興後來在公開採訪中給出了回答:那時候並沒有太多資源和資金,液壓驅動力量雖大但成本很高,電驅動技術方案可以大大簡化機械結構,降低製造成本,會使四足機器人更加普及。成本和普及兩大目標之下,理工科出身的王興興開始自己動手探索電驅四足機器人的設計規則。雖然選擇的道路和主流不同,但好在當時四足機器人技術整體已在快速發展,所以給他留下了大量學習參考資料。基於此,他以MIT Biomimetic Robotics Lab(開源四足狗Cheetah的發源地)提出的四足機器人設計規則為基礎,補充提出了幾條新的設計規則:1)四足機器人腿長腿間距、腿的連桿數及腿佈局的選取;2)四足機器人腿越長越穩、機身質量越大越穩;3)四足機器人邁步頻率越快越穩。其中,在腿部幾何參數設計方面,論文通過對多組模擬模型的對比分析指出——適當增加腿長與腿間距能夠顯著提升步態的動態穩定性和地形適應能力;而連桿數以兩級或三級結構為宜,可在保證關節自由度的同時降低傳動複雜度與能耗;至於腿佈局,則建議採用對稱分佈、髖關節外展式設計,有助於提高側向穩定性並簡化控制演算法。實驗驗證顯示,在這一參陣列合下,四足機器人能夠在更複雜地形中保持穩定行走,並具備更高的機動性與抗擾動能力。為了實際驗證上述結論,王興興接著完成了小型四足機器人XDog的整機研製與運控程序的開發。XDog採用全電驅動設計,每條腿有兩個連桿和三個自由度(整機12個自由度),使用了高功率密度的無刷電機,這些電機直接驅動關節,既保證了足夠的力矩輸出,又實現了輕量化和緊湊性。機身框架由鋁合金和碳纖維材料製成,這樣的結構既堅固又輕便,有助於在高速運動中保持良好的穩定性和能量效率。在運動控制方面,XDog使用了集中式控制演算法,能夠根據步態參數即時調整,以適應不同的行走模式,如行走、奔跑和轉向。控制系統整合了姿態感測器和足端觸覺反饋,結合改進的PD控制和前饋補償策略,提高了機器人的落足穩定性和動態響應性能。實驗結果表明,XDog在多種地形上(如平地、斜坡與碎石地)都能保持穩定行走,最大行走速度為0.6米/秒,續航時間達到30~60分鐘,這初步驗證了設計規則的有效性。最後,為了提高研發速度和質量,王興興還開發了基於ODE(Open Dynamics Engine)的四足機器人運動控制演算法開發工具,並介紹了基於ADAMS/Simulink聯合模擬的四足機器人設計方法。總之,從這篇論文的核心內容來看,XDog的設計在各個層面(技術路線、選材、結構、演算法等)都體現了王興興對“機器人性價比”的不懈追求(研發成本最終只有1~2萬)。他還在論文結尾大膽展望,純電機驅動因其結構簡單、低成本、高可控等優點,未來有望成為中小型四足機器人的主流選擇。後來的發展也證實,他的這一判斷無疑是正確的。別的不說,只需要看看從XDog長出的“宇樹”這棵大樹,你就知道了~90後第一人,從XDog到估值百億的宇樹科技XDog最後拿到了上海機器人設計大賽二等獎(此時距離MIT開源機器狗演算法還有3年時間),而且還獲得了國際電氣與電子工程師協會《科技縱覽》的報導。可以說,成功打響名氣的XDog,自然而然成了王興興叩開成功之門的“敲門磚”。之後不久,王興興就憑藉XDog拿到了200萬元天使投資,並於2016年創辦宇樹科技,自己擔任CEO、CTO。接下來的幾年時間,他帶著公司從頭設計了機器狗需要用到的絕大多數零件,包括電機、3D雷射雷達等,並順勢將頗具性價比的機器狗賣到了世界各地。本以為公司會一直深耕機器狗,結果後來AI來了,於是宇樹從2023年起又開始涉足人形機器人這一新領域。王興興曾在晚點的採訪中透露:馬斯克2021年要做,有人問我們做不做。說實在的,當時沒什麼感覺。人形機器人已經火了很多年,馬斯克做之前,這個方向已經到低谷期。我也沒聽說有人要買(人形機器人),圈子裡都是悲觀態度。讓我決定做的原因是,我越來越相信AI了。2010年時,AI還是低谷,我就非常喜歡神經網路,自己還玩過一點。後來我參加活動也說AI前景很大,但實際上我自己當時不夠相信。很多人現在還是不夠信。雖然起步相對國外較晚,但由於可以直接將做機器狗的經驗遷移到人形機器人上,所以宇樹步子很快,甚至當下已經呈現超車之勢。尤其是今年,其人形機器人自登上春晚扭秧歌一炮而紅後,幾乎每隔一段時間就會因各種炫酷技能出圈。這些熱度反映到資本市場上,宇樹更是迅速成長為一家估值百億的明星具身智能獨角獸公司。而且宇樹官方已經確定即將進行IPO(首次公開募股上市),預計今年10月至12月之間,他們會向證券交易所提交申報檔案,屆時宇樹的相關經營資料也將正式披露。這場IPO也被網友們評為,“機器人領域最受期待的IPO之一”。毫無疑問,從XDog到估值百億,宇樹科技已然成為國內最受矚目的機器人企業之一。而且有意思的是,身為宇樹科技創始人,取得如此成就的王興興,歸來仍不過只有35歲(出生於1990年)。△圖源:宇樹科技官微並且除了年齡,他身上的其他標籤(雙非、英語學渣等)也足夠引人注目。王興興本科畢業於浙江理工大學,後來在上海大學完成碩士學業,入職大疆兩個月後辭職單干,最初創業時公司只有他一個人。相比於受投資者偏愛的名校、大廠、高管背景,90後王興興的成功顯得有些出人意料。雙非本科、英語拉垮的成長經歷,在一抓一大把清北學霸和天才少年的具身智能領域,是沒什麼競爭力。而現在,他卻已經成為了中國具身智慧型手機器人領域最具標誌性的人物。可以說,這位90後創業者用自身經歷告訴我們:AI時代非常公平,只要聰明,願意做事,荒漠中終會長出參天大樹。(這也是王興興在2025外灘大會上給其他創業者的寄語)One More Thing王興興火了之後,很多人好奇大佬平時都在看那些書籍。剛巧浙江理工大學(本科母校)也公開了其本科期間的圖書借閱記錄,一共120本左右。(左右滑動查看)王興興本人看到後,還特意提到了自己印象最深刻的一本——《遊戲程式設計中的人工智慧技術》(沒數錯的話應該是7次)。以及無人在意的角落,網友們還發現了一個華點(doge):(量子位)
剛剛,Meta風雨飄搖中發了篇重量級論文,作者幾乎全是華人
【新智元導讀】風雨飄搖中的Meta,於昨天發佈了一篇重量級論文,提出了一種被稱作「早期經驗」(Early Experience)的全新範式,讓AI智能體「無師自通」,為突破強化學習瓶頸提供了一種新思路。Meta自從Alexandr Wang加入後混亂不堪,人心惶惶,Yann LeCun也公開表達出走意願。但就在昨天,他們發了一篇大論文《Agent Learning via Early Experience》,提出了一種被稱作「早期經驗」(Early Experience)的全新範式,讓AI智能體「無師自通」,為突破強化學習瓶頸提供了一種新思路。https://arxiv.org/abs/2510.08558論文作者絕大多數都是華人。默默做事的,永遠是華人。研究背景與問題在現實場景中訓練語言智能體常常面臨一個兩難困境:強化學習需要明確的環境獎勵訊號,但許多真實環境缺乏可驗證的獎勵反饋,或者任務跨度很長導致信用分配(credit assignment)困難;而模仿學習(通常採取監督微調)則依賴昂貴且有限的專家演示資料,模型在訓練中無法與環境互動,因而難以從失敗中學習,遇到新情況時泛化能力差。要麼沒有獎勵訊號指導學習,要麼只有少量人類示範可供模仿,智能體的自主成長因此受限。目前大多數語言智能體採取監督微調的範式:在靜態的專家軌跡資料上訓練策略,將環境狀態對應到人類給定的動作序列。這種方法雖然訓練方便,卻存在明顯侷限:智能體訓練時不與環境互動,看不到自己動作導致的結果,無法「知錯就改」,也很難推廣到訓練資料覆蓋不到的新情境。此外,高品質專家示範資料獲取成本高昂,難以大規模擴充。另一方面,理想情況下我們希望讓智能體像人一樣通過自身經驗不斷成長,但是傳統強化學習在缺少獎勵的環境中難以奏效。面對缺乏獎勵訊號且示範資料有限的困境,我們亟需新的訓練範式來讓智能體完成自主學習。方法框架:「早期經驗範式」針對上述難題,該論文提出了一種折中的新範式,稱為「早期經驗」(Early Experience)。這一範式定位於模仿學習和強化學習之間的中間地帶:智能體在訓練過程中不再僅依賴人類示範資料,還引入自身動作所產生的後續狀態作為訓練訊號。該範式是讓智能體在沒有外部獎勵的情況下,通過嘗試動作->觀察結果->將結果轉化為監督,來直接從自己行為的後果中獲取經驗教訓。這一過程無需環境提供獎勵,利用的完全是智能體探索所產生的資料,可視作在人工演示(無獎勵但資料有限)和強化學習(有獎勵但探索困難)之間架起的一座橋樑。論文具體探討了在「早期經驗」範式下的兩種核心訓練策略:隱式世界建模(Implicit World Modeling, IWM):該策略讓智能體利用收集到的環境狀態序列來建立內部的環境動態模型。做法是讓智能體在一些決策點嘗試由其策略自主提出的替代動作,然後記錄執行這些動作後環境的狀態變化,將這些「未來狀態」作為額外訓練訊號。通過學習預測動作將帶來怎樣的狀態轉變,智能體逐漸內化環境的因果規律,提升對環境動態的理解和決策的穩健性。這種隱式建模有點類似於人類在腦海中模擬「如果我這麼做,會發生什麼」,從而讓策略對行動後果有所預見。自我反思(Self-Reflection, SR):該策略旨在讓智能體從自身不理想的決策中總結經驗教訓。智能體會將自己的動作與專家示範進行對比,識別那些決策是次優的或錯誤的,並為此生成一段反思性的思維鏈說明,即一個自我分析的內在獨白。這些由智能體生成的反思性解釋將作為訓練資料的一部分,指導模型在相似情境下做出更優選擇。例如,在購物網站任務中,如果智能體原本選擇了一個超出預算的商品,一個可能的自我反思是:「這個紅色襯衫雖然符合顏色偏好,但價格超出預算,上述選擇不合理,應該考慮價格更低的藍襯衫。」這樣,智能體通過反思約束條件,理解了自己決策的不足。在訓練中,研究者將這些反思解說與正確動作一起加入訓練,使模型學會根據上下文進行推理並修正決策。自我反思策略相當於給予智能體一個自我導師:讓它自己說明那裡做錯了,以及正確的思路是什麼,從而內化細粒度的經驗教訓。這兩種策略都遵循同一原則:即使沒有外部獎勵,智能體「自我探索」所產生的動作-結果資料本身就能提供高品質的監督訊號。通過將自身行為引起的未來狀態轉換成學習訊號,語言智能體無需額外的人類獎勵標註也可以不斷改進。早期經驗範式可以無縫整合到現有訓練流程中:先用少量專家資料進行基本模仿學習初始化策略,然後讓智能體展開受控的探索(產生「早期經驗」資料),再用上述隱式世界建模和自我反思策略提取的監督訊號對策略進行強化訓練。這一過程實現了從「人教模型」向「模型自學」的轉變。實驗驗證:八大環境的評估表現作者在八個多樣化環境中對早期經驗範式進行了全面評估,涵蓋實體導航、網頁瀏覽、多輪工具使用、長序列規劃以及多領域API呼叫等任務類型。這些環境包括例如:文字版的室內導航和操作(如ALFWorld)、線上購物網頁(WebShop)、科學實驗模擬環境(ScienceWorld)、旅行規劃對話任務(TravelPlanner)等等,既有需要在虛擬空間中行動的執行型任務,也有需要多步推理規劃的認知型任務。同時,模型基座涵蓋了不同規模和架構的大語言模型(如不同參數規模的Llama系模型等),以測試方法對模型尺寸的適應性。實驗結果顯示,引入「早期經驗」後的智能體表現顯著優於純模仿學習基線。在所有測試環境中,無論採用隱式世界建模還是自我反思,兩種方法都取得了一致的提升:任務成功率平均提升了約9.6個百分點,遷移到域外新情境的泛化成功率提升約9.4個百分點。這表明早期經驗範式不僅提高了智能體在已知任務上的效率,還大幅增強了其應對未知場景的泛化能力。例如,在要求滿足多重約束的長鏈推理任務中(如旅行規劃需要兼顧時間與預算),自我反思策略帶來了超過10個百分點的成功率躍升,體現出對複雜推理任務的特別優勢。而在需要與環境反覆互動嘗試的任務中(如網頁購物需要點選不同頁面),隱式世界建模有效讓智能體掌握了環境狀態轉移規律,也取得了兩位數的成功率提升。此外,作者還考察了該範式的資料效率和模型可擴展性:令人驚喜的是,即使將專家演示資料量減少一半,引入早期經驗訓練後模型仍能達到甚至超過使用全部專家資料時的性能。這說明早期經驗提供了額外且多樣的訓練訊號,可以在一定程度上替代昂貴的人工示範資料,提高資料利用效率。同時,將這一方法應用到更大規模的模型上,同樣取得了穩定增益——早期經驗範式在不同模型大小上效果保持一致,不存在隨模型變大而效果遞減的問題。這表明該方法具有良好的橫向與縱向可擴展性:既能拓展到更廣的任務領域,又能適用於更強大的模型。另一個關鍵實驗是驗證早期經驗作為強化學習的預熱(warm-start)是否能夠進一步提升最終表現。作者在其中3個具有明確獎勵的環境中先用模仿學習、隱式世界建模、自我反思分別訓練初始策略,然後再在相同條件下繼續進行強化學習微調。結果發現:以早期經驗(隱式世界建模或自我反思)初始化的策略經過強化學習最佳化後達到了最高的最終成功率,相比直接用模仿學習初始化的策略最終成功率最高提升了約6.4個百分點。這說明,早期經驗階段帶來的性能增益可以持續到最終的強化學習訓練成果中。一些環境中,早期經驗組與普通組的差距在強化學習過程中甚至進一步拉大(例如ALFWorld環境),證明早期經驗為後續強化學習提供了更高的上限起點。在有獎勵和無獎勵場景下,早期經驗訓練都展示出優異表現,架起了一座從模仿學習通向完全自主強化學習的實踐之橋。分析與亮點通讀論文後,我們認為該論文有一些顯著的亮點。無獎勵下的高品質監督訊號早期經驗範式的最大亮點在於即便沒有環境獎勵,也能為智能體提供有效的學習訊號。傳統強化學習需要獎勵來評價行為好壞,而早期經驗通過「自身行為的後果」來指導策略改進。智能體探索產生的未來狀態本身就是監督——成功也好,失誤也罷,這些經驗片段都成為訓練素材。例如,隱式世界建模讓模型直接預測環境響應,自我反思讓模型檢討錯誤決策的原因,兩者都為智能體提供了稠密而豐富的反饋(那怕這種反饋不以數值獎勵呈現)。實驗已經證明,這種沒有顯式獎勵的監督訊號依然可以將模型性能推向新的高度。相比之下,單純依賴專家示範的監督訊號是靜態且狹窄的,而早期經驗訊號來自智能體主動探索,覆蓋了更廣的狀態-動作空間,這正是其泛化能力大幅提升的原因之一。泛化能力與可擴展性由於引入了智能體自己探索得到的大量多樣化軌跡,模型不再侷限於人類示範所涵蓋的有限情景,從而在未知環境下表現更穩健。作者的域外測試顯示,早期經驗訓練的智能體在任務變種或新場景中的成功率遠超僅有模仿學習的基線,證明了其跨域遷移能力。此外,從可擴展性看,早期經驗範式具有良好的資料與模型擴展效果:它可以利用相同環境,讓智能體反覆生成海量的訓練資料(因為不需要人工標註獎勵),大幅降低了對人工資料的依賴;同時無論模型參數規模增加還是減小,方法的收益都基本保持,展示出跨模型規模的一致性。這一點非常關鍵,因為很多方法在小模型上有效但擴展到大模型時效果不明顯,而早期經驗方法在不同規模的模型上都取得了顯著而穩定的提升。早期經驗不僅拓寬了智能體「見過」的世界,也為大模型時代的持續改進提供了一種資料可伸縮的方案。對比其他方法(STaR、長鏈推理等)早期經驗範式與現有一些讓模型自我提升的思路有所不同,提供了更具「現實檢驗」的學習訊號。例如,Zelikman等人提出的STaR(Self-Taught Reasoner,自學推理器)方法讓模型為已有示範生成推理過程並自我過濾。但這種方法面對複雜環境時遇到兩個問題:模型產生的解說未經過環境驗證,可能並不正確;為保證動作正確性常需要丟棄大量不匹配專家的解說資料,導致可用訓練樣本很少。作者在文中復現了STaR風格的資料生成,發現模型為專家動作生成的推理鏈中,只有極少比例能匹配專家決策,篩選後幾乎沒剩下多少有用資料,而且這些推理因為從未真正與環境互動,往往是假想的、不可靠的。相比之下,早期經驗方法中智能體每一次生成的動作和反思都直接基於實際環境反饋:不論是隱式建模獲取的狀態轉移,還是自我反思產生的教訓,都源自真實行動的結果,因而資訊含量更高、指導性更強。針對需要長鏈推理的任務,簡單地讓模型生成更長的思考鏈(例如調優提示詞或控制思考步數)只能帶來有限的改善,而早期經驗中的自我反思相當於讓模型親身實踐再反思,其對於複雜推理任務的提升要顯著得多。在作者的實驗中,自我反思策略在需要多步規劃和約束滿足的任務上取得了最大的增益(如旅行規劃任務成功率提高十多個百分點),這也從側面證明了相比靜態的CoT方法,讓模型「做過再想」效果更加突出。方法適用範圍早期經驗範式的一大優點在於其通用性。論文結果表明,無論是具身環境(如機器人操作)還是數字環境(如網頁、API互動),無論任務需要感知行動還是邏輯推理,該方法都能帶來一致收益。這說明將「自己探索」融入訓練的思路具有很強的普適性,不侷限於某一類任務。同時,隱式世界建模和自我反思兩種策略各有側重又能相輔相成:隱式世界建模更側重環境動力學,適用於需要試錯探索的場景;自我反思側重策略最佳化和約束滿足,對多步驟推理任務幫助更大。兩者共享早期經驗的框架,可以根據任務特點選擇使用,從而靈活地提高智能體性能。總結《Agent Learning via Early Experience》提出了一種創新的語言智能體訓練範式,成功彌合了模仿學習和強化學習之間的鴻溝。主要貢獻早期經驗範式的提出:正式提出並定義了「早期經驗」這一訓練新範式,為在無外部獎勵訊號的條件下讓智能體從自身經驗中學習提供了可行方案。這一範式可被視為從依賴人類資料的模仿學習邁向完全自主強化學習的實用且可擴展的橋樑。兩大訓練策略(隱式世界建模和自我反思):設計並系統研究了在早期經驗範式下的兩種具體策略:一是通過隱式世界建模讓智能體學會預測環境變化,從而增強決策的環境紮根性;二是通過自我反思促使智能體從自身行動中提煉細粒度教訓,提升推理和決策能力。這兩種策略證明了即使沒有獎勵,智能體也能將「探索-反饋」循環轉化為有效學習訊號。實驗與效果:在八個多樣環境和多種模型架構上進行了綜合評測,結果顯示早期經驗方法在任務成功率、跨域泛化以及後續強化學習表現等方面均有顯著提升。在若干基準上,該方法取得了SOTA,並通過消融和分析實驗提供了有益的洞察。例如,早期經驗模型以更少的資料達到甚至超過基線效果,且能提升最終的強化學習訓練上限。當前方法的侷限與未來方向目前的隱式建模和自我反思主要著眼於短跨度的經驗片段,對於那些超長序列規劃任務中的信用分配問題,如果沒有顯式獎勵仍然是一個挑戰。未來的研究可以探索如何讓早期經驗範式也能處理更長鏈條的決策最佳化。結合自監督目標是一個有前景的方向——可以考慮引入豐富的自監督學習訊號(如預測下一個子目標等),進一步提升無獎勵環境下的訓練效果。將早期經驗與強化學習在持續學習框架下結合,也是作者設想的方向之一。例如,在有了環境獎勵後,讓模型接著用RL微調,或在訓練過程中逐步引入獎勵訊號,檢驗兩者的協同作用。還可以探索更多形式的早期經驗(不限於論文提出的兩種),比如不同的自我監督策略,乃至讓智能體自己生成新的訓練目標等。作者也提到希望將該範式拓展到更大規模的真實應用中,在真實線上環境中持續收集智能體的互動資料,進行有機的持續最佳化。這將是真正邁向「經驗時代」的一步——讓智能體在真實世界中邊運行邊成長。Early Experience為訓練更自主、更智能的語言代理打開了一扇新的大門。在獎勵稀缺甚至缺失的廣闊應用場景下,它提供了一種高效利用自身經驗的學習機制。隨著這一範式與強化學習、自監督等方法的融合,以及在長期規劃任務上的突破,我們有理由期待下一代智能體將能夠更充分地自我進化,朝著真正的通用智能體邁進。顯然,屬於AI智能體的「早期經驗」時代或許才剛剛開始。目前的這些成果可能是幾個月甚至更久之前就在進行的,而Meta的新時代能否保持住這種學術產出質量,仍有待觀察。 (新智元)
神了!GPT-5“靈感湧現”,幫頂級量子科學家突破論文關鍵函數步驟
“這是我目前發過的所有論文裡,第一次有關鍵技術步驟是由AI搞定的,思路源自GPT-5-Thinking。”當下頗具影響力的理論電腦和量子計算大牛Scott Aaronson在最新發表的部落格文章中如此感慨道。Scott Aaronson是誰?他被廣泛認為是當今最聰明的人之一,80後科學家,學術圈知名度跟陶哲軒不分伯仲,他現任美國德克薩斯大學奧斯汀分校百年講席教授,並擔任該校量子資訊中心創始主任。Aaronson是量子計算與複雜性理論的奠基者,曾與同事共同提出“高斯玻色取樣”這一量子計算任務,為實驗驗證 “量子霸權”(quantum supremacy)奠定了理論基礎,目前已是成為全球頂尖科研機構量子計算實驗的重要參照系。究竟發生了什麼讓這位聰明的科學家對AI刮目相看並讚賞有加?GPT-5給科學家提出“關鍵”建議事情發生在幾天前,Scott Aaronson和荷蘭國家數學和電腦科學研究所(CWI)的Freek Witteveen合作,在arXiv上發表了一篇題為《量子複雜度類QMA中黑箱放大的侷限性》的論文。Aaronson在量子計算的基礎理論領域貢獻卓著。2008年,他通過構造量子諭示(quantum oracle)證明了量子複雜度類QMA(量子梅林-亞瑟)與QMA₁(具有完美完備性的QMA)的分離,即存在某些問題在量子計算模型下無法實現100%的驗證精準率。這一結果為量子計算的能力邊界劃定了重要標尺,被學界視為該領域的經典之作。簡單來說,新論文研究了量子複雜度類QMA(量子梅林-亞瑟)中黑箱放大的侷限性。可以把QMA想像成一場“量子批卷考試”,有兩個角色:梅林相當於“學生”,亞瑟相當於“老師”。科學家都希望老師批卷能“全對”—— 也就是“只要答案是對的,就100%判對”(專業詞彙叫作“完美完備性”)。在經典數學裡(比如普通的電腦演算法),“批卷老師”(經典版MA)早就能做到“百批百對”,但到了量子計算領域,問題就卡殼了,想把量子批卷的“判對誤差”縮到超級小非常困難,而現在Aaronson證明,任何QMA協議,都能通過黑箱方法,把完備性誤差縮小到“雙重指數級”。在這篇論文論證過程中,當時他們卡在一個“數學坎”上:要分析一個特別複雜的“量子公式”(專業叫N×N埃爾米特矩陣),對於他們而言大概需要一兩周時間去查文獻、測試不同的解題思路。但為了省點時間,這次他們嘗試向GPT-5-Thinking提問。一開始,它5分鐘就給了一個答案:看起來自信又合理,但作為資深科學家,Aaronson一眼就看出其不對的地方,不過沒直接否定,而是繼續告訴它“那裡出錯了”,接著,它又重新思考、道歉,再給出新方案——整個過程像極了教授和研究生或同事討論問題。大概半小時後,GPT-5-Thinking建議兩位科學家研究一個新函數,而且經驗證後發現:這方法居然真的管用!Aaronson表示:如果這是人類學生提出的思路,我肯定會誇他“腦子轉得真快”,很多時候,科研難題就差這麼一層“窗戶紙”,誰捅破誰厲害,到了2025年9月,AI終於“進軍”了“最具人類代表性的智力活動”——量子複雜度類的諭示分離證明。當然,現在AI還幾乎不可能獨立寫出一篇“正確且高品質”的科研論文,但它能作為“科研搭子”,幫那些“本身知道大概方向的研究者突破靈感和瓶頸”——這無疑是一個“黃金階段”。Aaronson調侃說:幸好我有終身教職(不用擔心被AI“搶飯碗”)。AI正在成為核心“合著者”2025年,AI與頂尖科研人員的協作已從“輔助工具”階段躍升至“深度協同”階段,在多個基礎科學與技術前沿領域取得了革命性進展,“科學突破”的速率可能越來越快。即便是基礎科學,也不再是“人類的獨角戲”。例如,中國科學技術大學團隊與上海人工智慧實驗室合作,利用深度學習技術建構了包含2024個原子的無缺陷量子計算陣列,創下新的世界紀錄,這一突破使量子電腦的規模化成為可能,為量子糾錯和實用演算法開發奠定了基礎。歐洲核子研究中心(CERN)的ATLAS實驗團隊通過百萬級模擬資料訓練的深度神經網路,首次在13TeV質子-質子碰撞中探測到縱向極化W玻色子,驗證了希格斯機制對粒子質量起源的關鍵預測。GPT-5在“哥德爾測試”中成功解決三大組合最佳化猜想,提出的解法徹底顛覆了人類研究者的原有思路,被媒體評價為“首次實現AI在數學發現中的真正創造性貢獻”。AI還創造出了自然界中不存在的、具有全新化學結構的分子,其中兩個先導化合物在動物模型中成功殺滅了兩種“超級細菌”。這些突破背後,是AI與人類科學家協作範式的重構。AI開始能參並提出有價值的科研問題和思路,同時也使高通量驗證成為可能,或許不久之後,經過學術倫理認定,AI會成為名副其實的論文合著者。被罵慘的OpenAI儘管科學家對GPT-5的表現讚賞有加,但普通使用者能不能用到高配版模型並不好說。近日,OpenAI被曝在付費使用者不知情的情況下,偷偷將ChatGPT的GPT-4、GPT-5等高階模型切換至兩款低算力的“秘密模型”——gpt-5-chat-safety和gpt-5-a-t-mini,引發使用者一片聲討。不少使用者氣憤地表示,這種隱性的剝奪以及公然違背產品倫理的行為,正在嚴重損害使用者的選擇權、情感權利和經濟信任,這不僅僅是一個技術或產品問題,而是一家全球人工智慧公司以卑鄙的手段背叛使用者的信任和喜愛。儘管OpenAI副總裁Nick Turley回應稱是因為正在測試新安全系統,強調“僅針對敏感話題臨時切換”,且“詢問時會告知模型資訊”,但這一解釋未能平息質疑,使用者協議未提及模型動態替換條款,部分使用者發起集體訴訟,指控OpenAI構成“欺騙性商業行為”。OpenAI創始人兼首席執行官Sam Altman並未對“GPT降智門”事件進行回應,但在近期採訪時表示,預計新一代AI模型將於2026年問世,並聲稱它的進步可能會“相當令人驚訝”,到2030年,人工智慧或將真正超越人類智能。 (頭部科技)
麥克斯韋的三篇論文:在科學巨人的時代,他用數學寫下了光的詩篇
19世紀中葉的英國,正處於工業革命的巔峰。蒸汽機轟鳴,鐵路縱橫,電報線橫跨大西洋,科學與技術的結合前所未有地緊密。在這個時代,科學不再只是貴族的消遣,而成為推動社會進步的核心力量。到了法拉第的時候,人們認為對於電磁場基本規律的瞭解已經基本完成。然而主流科學界仍然存在著關於電磁作用的“超距”觀點和“近距”觀點的爭論,對於電磁微觀世界的認識仍然膚淺。  正是年輕的天才麥克斯韋從一開始就堅信法拉第的近距作用觀點和“力線”的思想,並且下定決心,要把法拉第的物理思想用數學公式定量化的表達出來。當麥克斯韋把已有的電磁規律用幾個方程式表達出來以後,發現其中有矛盾,只有加上他稱之為“位移電流”的一項,方程式才是彼此相容的。這一點,法拉第沒有看出來,大家也都沒有料到,連麥克斯韋自己事前也未曾注意到。然而,就是這樣一項位移電流,卻導致了另一項非常重大的發現——電磁波。在劍橋大學一間昏黃燈光下的書房裡,一位年輕學者伏案疾書,筆尖在紙上飛舞,彷彿在與宇宙對話。他叫詹姆斯·克拉克·麥克斯韋(James Clerk Maxwell),一位身材瘦削、眼神深邃的蘇格蘭青年。他正撰寫著一篇足以彪炳人類對電磁世界的理解的歷史的論文——《論物理力線》(On Physical Lines of Force)。這,只是他三篇劃時代論文的第二篇。接下來的幾年裡,麥克斯韋將用三篇論文,完成一場靜悄悄卻震耳欲聾的科學革命。第一、二篇:《論法拉第的力線》《論物理力線》(1861年)——“場”的誕生1850年代的劍橋大學,是英國科學的搖籃。麥克斯韋在這裡接受了嚴格的數學訓練,同時也深受法拉第思想的影響。法拉第雖然沒有受過正規數學教育,但他提出的“場”的概念深深打動了麥克斯韋。“法拉第的頭腦中沒有方程,但他用圖像和直覺描繪了電與磁的舞蹈。”那時的歐洲,電磁學正處於一個快速發展的階段。1820年,丹麥物理學家奧斯特(Hans Christian Ørsted)首次發現電流可以引起磁針偏轉,揭示了電與磁之間的聯絡。緊接著,法國物理學家安培(André-Marie Ampère)提出了安培定律,描述了電流之間的相互作用力。1831年,法拉第(Michael Faraday)發現了電磁感應現象,提出了“場”的概念,認為電和磁是通過空間中的“場”來作用的,而不是超距作用。這些發現雖然重要,但缺乏統一的數學描述。麥克斯韋決定用數學語言來“翻譯”法拉第的思想(《論法拉第的力線》(On Faraday's Lines of Force, 1855-1856)首次嘗試用數學形式描述法拉第的力線思想,建立電磁現象的數學模型,為後續理論奠定基礎)。在這篇最初的論文中,可以看到法拉第還十分謙遜的引用法拉第的論點,強調自己只是在大師的基礎上修修剪剪,還在爭取學界的採納。在後續的論文中(論物理力線)他用更為大膽的設想,提出了一種“以太模型”——一種充滿空間的彈性介質,電場和磁場就像其中的齒輪轉動產生應力和流動。他用這種模型推匯出了電場與磁場之間的關係,並首次提出了“位移電流”的概念。“電流不僅存在於導體中,也存在於變化的電場中。”這一想法在當時極具爭議。傳統物理學家認為,電流必須有物質載體,而麥克斯韋卻說:變化的電場本身就能產生磁場。這是對安培定律的重大修正,也是麥克斯韋方程組中最關鍵的一環。在《論物理力線》中,他寫道:“我試圖用一種機械模型來解釋電磁現象,雖然它可能不是真實的,但它能幫助我們理解那些不可見的力量。”這篇論文雖然沒有立即引起轟動,但它為後續的突破埋下了種子。第三篇:《電磁場的動力學理論》(1865年)——電磁波的預言1865年,麥克斯韋搬到了倫敦,成為國王學院的教授。他在繁忙的教學之餘,繼續完善自己的理論。他意識到,自己之前提出的“位移電流”不僅是一個數學技巧,它揭示了電磁場之間深刻的相互作用。“電場和磁場不是孤立的,它們是彼此的源泉。”他將四個基本電磁定律整合成一組偏微分方程,這就是後來被稱為“麥克斯韋方程組”的核心內容。通過將當時看來毫不相關的幾個常數--真空介電常數、真空磁導率進行組合,可以計算得到電磁波的速度,這和當時測量的光速是高度一致的!他由此推匯出一個驚人的結論:“電磁擾動可以在真空中以有限速度傳播,這個速度等於光速。”他大膽地提出:光本身就是一種電磁波。“我計算出的波速與光速幾乎完全一致,這不可能是巧合。”這一預言震驚了當時的科學界。在此之前,光被認為是某種神秘的波動,而麥克斯韋卻用一組方程,將光、電、磁統一在同一個理論框架下。“這是人類第一次用數學語言,揭示了自然界的深層統一。”這篇論文的發表,標誌著電磁理論的成熟。它不僅解釋了已知現象,還預言了新的現象——電磁波的存在。但當時還沒有實驗證據,麥克斯韋自己也深知這一點。與此同時,歐洲大陸的科學家們也在不斷推進電磁學的研究。德國物理學家赫爾姆霍茲(Hermann von Helmholtz)和基爾霍夫(Gustav Kirchhoff)在電路理論和電動力學方面做出了重要貢獻。而年輕的赫茲(Heinrich Hertz)則在麥克斯韋去世後,成為其理論最堅定的追隨者。歷史性的巨著:《電磁通論》(1873年)——理論的系統化與傳播1873年,麥克斯韋出版了他一生最重要的著作——《電與磁的論文集》(A Treatise on Electricity and Magnetism)。這本書不僅是對前兩篇論文的總結,更是一部系統化的電磁學巨著。“我希望能為後來者提供一個清晰的理論框架。”在這本書中,他用更嚴謹的數學語言重新表述了電磁場理論,並引入了“向量分析”的概念。他將電場和磁場視為向量場,用微分算子來描述它們的變化,這種語言至今仍是物理學家的標準工具。“我希望未來的物理學家能用這套語言,繼續探索自然的奧秘。”這本書的出版,使得麥克斯韋的理論開始在歐洲大陸傳播。儘管當時許多物理學家仍持懷疑態度,但年輕的赫茲(Heinrich Hertz)卻深受啟發。“如果麥克斯韋是對的,那麼電磁波就真的存在。”1887年,赫茲通過實驗成功產生了電磁波,並測量了它們的速度,結果與光速一致。麥克斯韋的預言終於被實驗證實。麥克斯韋的遺產:一場靜默的革命麥克斯韋本人並沒有看到自己的理論被廣泛接受。1879年,他因胃癌去世,年僅48歲。他去世時,麥克斯韋方程組還未成為物理學家的共識。“他像一顆流星,短暫卻耀眼。”但歷史最終證明了他的偉大。20世紀初,愛因斯坦在提出狹義相對論時,正是從麥克斯韋方程組出發,思考光速不變的原理。“麥克斯韋的方程,是相對論的起點。”而今天,從無線電通訊到量子電動力學,從雷達到光纖,麥克斯韋的理論無處不在。誠所謂,“他用數學語言,寫下了宇宙的電磁詩篇。”結語:三篇論文,一場革命麥克斯韋是不折不扣的數學家和天才——16歲跳級讀大學,18歲到劍橋讀博,大四那年就摘下了Stokes提出的著名定理的證明懸賞,通過基本的三個假設推導熱力學的分子動力學的麥克斯韋速度分佈律,通過土星光環的研究創立定量色度理論拿下英國皇家學會的認可從《論法拉第的力線》到《電磁場的動力學理論》,再到《電磁通論》,麥克斯韋用三篇論文和一本書的距離,走完了對電磁世界的統一之路。他的思想穿越了時間與空間,至今仍在影響著我們每一個人。麥克斯韋的三篇論文,不是一場轟轟烈烈的革命,而是一場靜悄悄的思想變革。它們沒有硝煙,沒有口號,卻徹底改變了人類對自然的理解。不僅把他的電磁波的預言和場的觀點,也把他本人的精湛的數學推導、敏銳的洞察、創新之膽識深深刻進後人的腦海中。“他沒有發明電燈,但他讓我們看見了光的本質。” (nature漫遊指南)
韋東奕論文登數學頂刊,將散焦方程的爆破性研究擴展至d≥4
韋東奕論文再登數學頂刊!就在備受關注之際,韋神本韋和另兩位北大學者章志飛、邵鋒合作的一篇論文已發表於數學界頂級期刊《Forum of Mathematics, Pi(數學論壇,π) 》。論文題目為《On blow-up for the supercritical defocusing nonlinear wave equation(超臨界散焦非線性波動方程的爆破現象研究)》,通俗來說就是研究某些方程的解在什麼條件下會“爆炸”失控。而經過一系列論證,他們最終發現對於d=4且p≥29,以及d≥5且p≥17的情況,存在一個在有限時間內爆破的光滑復值解。不清楚具體研究內容不要緊,重要的是這一成果不僅填補了相關空白,而且其證明方法繞過了傳統方法中奇點處理的難點,理論上可推廣到其他非線性偏微分方程的爆破研究。網友們的反應一致be like:字都認識,但是看不懂一點(doge)。實際上,據清華大學丘成桐數學科學中心網站介紹,韋東奕還在今年5月以主講人的身份做了這篇論文的報告。下面具體來看這項研究講了啥?將散焦方程的爆破性研究擴展至d≥4從論文摘要入手,該研究探討了在ℝ×ℝd上,以下散焦非線性波動方程:1)在“超臨界”狀態下是否會在有限時間內爆破?2)如果存在,爆破的速度和機制是什麼?正如水波、電磁波等波動現象能用方程來描述,“非線性波動方程”是指一類描述複雜波動的數學方程。而這裡的“散焦”意味著波的能量向外擴散。那麼,為什麼要關注該方程在“超臨界”狀態下的情況呢?原因主要在於,此前研究已解決“亞臨界”、“臨界”情況的全域正則性(解永遠存在且光滑),但超臨界散焦方程的爆破性研究很少,尤其在空間維度d≥4的低維情形幾乎空白。而通常來說,當方程處於“超臨界”狀態時,波的能量分佈更難控制,更可能出現“爆破”現象(即解在有限時間內變得無窮大)。所以,韋東奕等人想要論證:在d≥4的低維情形下,散焦非線性波動方程存在有限時間爆破解。這裡要補充一下,方程的“臨界性”由空間維度d和指數p決定。幾種狀態的定義如下:其中“超臨界”狀態具體指sc >1,即當且僅當d≥3,有p>1+4/(d-2)。最終,他們得出了兩項核心結論:當d=4且p≥29,以及d≥5且p≥17的情況時,存在光滑的初始波形,使得方程的解在有限時間內爆破。波的最大振幅隨時間接近爆破時間時,爆破速度比臨界范數的增長更快,說明爆破不可避免。具體論證方法則結合了三人組之前關於“相對論歐拉方程自相似內爆解”的一項研究。這篇名為《Self-similar imploding solutions of the relativistic Euler equations》的論文核心圍繞相對論歐拉方程展開,這是一個描述理想流體(比如氣體)在相對論速度下行為的數學模型。團隊研究了這些方程的一種特殊解,叫做“自相似內爆解”,即流體在有限時間內會集中到一個點,就像內爆一樣。他們發現,在特定的條件下(比如在2維或3維空間中,或在更高維度中但條件稍微寬鬆一些),這種內爆解是存在的。這個發現對於理解更複雜的波動方程(比如描述聲波或光波的方程)在特定條件下是否會在有限時間內“爆炸”(即變得無限大)非常重要。換言之,我們能更好地理解在極端條件下,物質和能量的行為方式。回到正題,在後來登上頂刊的這項研究中,他們正是將相對論歐拉方程的“自相似解”(形狀不變、僅縮放的解)作為爆破解的“骨架”,結合其他技術繞過了傳統方法中奇點處理的難點。最終為理解散焦方程的動力學行為提供了新視角,並且其方法可推廣到其他非線性偏微分方程的爆破研究。通俗理解,其具體論證過程可分為以下五個步驟:第一步:模相位分解。就像把光分解成振幅和相位一樣,他們將波也拆成“幅度”和“相位”兩個零件,以便單獨研究那個零件導致了“爆破”。第二步:自相似解假設。一般炸彈爆炸時,不同時間點的“爆炸形態”其實很像,只是“縮放了大小”,故他們也假設波的爆破也有這種“自相似”,以便後續計算。第三步:構造近似解。繼續用簡單的數學公式拼出一個“假波”,模仿爆破的趨勢。第四步:反向時間求解精確解。從“爆炸結局”往回推,慢慢修正成精確解,以證明真的存在這樣一個波,會在特定時刻爆炸。第五步:推論的證明。通過前面四步,已經找到“會爆炸的波”的精確解,現在要驗證它的 “爆炸速度”。而通過計算,他們發現爆炸“剎不住車”,必然會發生。更專業的論證過程指路原論文第二章節。曾以唯一作者身份登上數學頂刊這項研究的其他兩位作者分別為章志飛和邵峰。章志飛,博士畢業於浙江大學,目前為北大數學科學學院博雅特聘教授、副院長和博士生導師。主要從事偏微分方程領域的研究,已在Invent Math、CPAM、Memoirs AMS等頂尖數學刊物上發表論文150余篇,獲得過國家“傑青”和陳省身數學獎等榮譽。他和韋東奕合作多年,2022年曾作為團隊代表在國際數學家大會上做了45分鐘的報告。 邵峰,本科畢業於中國科學技術大學,目前是北大基礎數學專業四年級博士生。章志飛和韋東奕為邵峰的共同導師,三人多次合發論文。事實上除了合著,韋東奕的個人研究也曾登上數學頂刊。就在2021年,《Science China - Mathematics》刊載了他的一篇論文“通過預解估計流體流動中的擴散和混合”。 (量子位)
d>=4,應該是高維時空。。。