#數學
震驚!57歲美國著名數學教授,竟辭職給24歲中國天才女孩打工!數學也要被AI顛覆了?
前幾天,《華爾街日報》一篇報導讓全球教育圈炸了鍋。57歲的美國頂尖數學家Ken Ono,辭去弗吉尼亞大學終身教授職位,跑去矽谷給自己24歲的中國女學生打工——成為她創辦的AI數學公司Axiom Math的第15號員工。你沒看錯。不是教授帶學生創業,是教授去給學生打工。更震撼的資料還在後面:這家公司成立不到兩年,拿到6400萬美元融資,估值3億美元。用自主研發的AI系統,5小時攻克懸而未決45年的數學難題,1天內解決懸置30年的埃爾德什第124題。家長圈瞬間慌了。有人震驚:"教授都去給學生打工了?"也有人質疑:"這女孩到底什麼背景?"更有人焦慮:"我們還要不要讓孩子卷奧數?"但你有沒有想過一個更扎心的問題:當AI已經在數學領域碾壓人類頂尖專家,當一個24歲的中國女孩能讓57歲的數學大師甘願"降級打工",這背後到底說明了什麼?對此,定居矽谷多年、在清華、香港科技大學都長期任教過,深耕創新人才培養的教育專家陸向謙教授,一針見血地指出:"AI正在顛覆所有行業,包括數學、物理、化學。你的孩子還在那卷數理化的第一嗎?這已經過時了!不要去捲第一,要做你的唯一。要玩人工智慧。"這句話,擊中了當下中國教育最核心的焦慮。| 當數學大師遇到AI:"我的領域守不住了"Ken Ono是什麼等級的人物?世界頂尖數論學家,弗吉尼亞大學薪酬最高的員工之一,好萊塢、奧運會的數學顧問,ESPN眼中"最會彈吉他的數學家"。他的數學成就橫跨Ramanujan研究、數論、Moonshine理論等超級深水區,培養出10位摩根獎獲得者。這樣的大師,本以為"數學創造力至少幾十年內不會被AI取代"。直到去年春天,他參加了一次AI數學模型測試。看完之後,他整個人都不好了。他發現,在他擅長的那塊領域,他比AI了解得多。但其他數學領域,AI都比他瞭解得多。再過幾年,可能連他自己的領域都守不住了。你聽清楚了嗎?一個世界頂尖數學家,第一次感受到知識的天花板正在被AI重寫。Ken Ono陷入了深度的"身份危機":"如果AI連這都能做,那我還能做什麼?"直到那場"撞擊靈魂"的頓悟到來——"AI不是來取代數學家,而是改變數學的做法。"於是他做出了震動整個數學界的決定:辭職,加入AI數學的最前線。更戲劇的是:他加入的公司,創始人是他24歲的學生洪樂潼。看懂了嗎?這才是這個故事最扎心的地方:不是教授不夠牛,而是時代變化太快了。AI的速度,已經讓傳統學術體系跟不上了。| 24歲中國天才女孩有多炸裂?很多人問:洪樂潼到底什麼背景,能讓數學大師甘願"下凡打工"?她來自廣州,家裡第一代大學生。但她的履歷,開掛到不真實:學術成就:MIT本科3年畢業,數學+物理雙學位美國本科數學最高榮譽——摩根獎得主美國數學界最高女性獎——愛麗絲·謝弗獎(全美一年只選1人)羅德獎學金獲得者牛津神經科學碩士史丹佛數學博士+法學博士在讀(後輟學創業)創業戰績:成立Axiom Math不到兩年,融資6400萬美元從Meta挖來一批頂尖AI研究員AI系統攻克兩道懸而未決數學難題陸向謙教授看到這個案例,說了一句讓所有家長深思的話:"眼看著名校畢業生不好找工作,但小時候玩過電腦、網際網路、人工智慧的那群孩子,連大學都沒上完,就被高薪挖走了。"什麼意思?意思是洪樂潼的成功,不是因為她考了多少個第一名,而是因為她從小就在"玩"真正有價值的東西——數學研究、AI技術、跨學科整合。更關鍵的是:她在咖啡館讀數學論文時,跟隔壁桌Meta的AI科學家聊了聊,就決定退學創業。為什麼?她說:"研究數學已經很難了。AI做數學?更難。我要去做這個。"知難而進,這才是天才的底色。久而久之,家長們才明白:培養孩子,不是讓他考100分、拿奧數金牌,而是讓他敢於挑戰最難的問題、最前沿的領域。| AI如何顛覆數學?5小時攻克45年難題很多人可能覺得:數學這麼抽象,AI能做什麼?Axiom Math給出了震撼答案。他們用自主研發的AI系統:埃爾德什第481題(懸置45年):5小時完成完整證明與形式化驗證,推翻OpenAI"GPT-5已解決"的不實聲明。埃爾德什第124題(懸置30年):1天內完成基礎公理層面的形式化證明,成為全球首個可嚴格驗證的解決方案。陸向謙教授直言不諱地揭露了本質:"AI正在顛覆所有行業,包括數學、物理、化學。就連數學家都守不住自己的領域了,你覺得其他行業能倖免嗎?"看懂了嗎?這不是說數學不重要了,而是說:會做題、會考試的"數學第一名",在AI面前已經沒有優勢了。真正有價值的,是"能提出好問題、能用AI解決實際問題"的能力。Ken Ono現在的日常工作是:給AI模型設計必須通過的數學難題建構數學能力的基準測試推動模型向"數學創造力"進化他說:"純數學很美,但很少改變世界。而AI數學,將改變整個世界。"這就是差距。| 給家長和孩子的3個建議:別再讓孩子卷第一了看到這裡,很多家長肯定在想:那我到底該怎麼辦?結合陸向謙教授30多年的觀察和這個案例,我給你3個建議:第一:別再讓孩子卷"數理化第一"了陸教授說得特別直白:"你的孩子整天還在那卷數理化的第一?已經過時了。不要去捲第一,要做你的唯一。"什麼意思?意思是AI時代,會做題的"第一名"不值錢了,會用AI解決實際問題的"唯一"才值錢。家長得多問問:我的孩子有什麼別人沒有的特質?能創造什麼獨特價值?具體怎麼做?從小培養孩子:玩電腦、網際網路、人工智慧:不是為了考級、考證,而是真正理解計算機思維做項目,不是做題:讓孩子解決真實問題,而不是刷題庫培養"Something special":找到孩子的獨特性,而不是讓他跟別人一樣記住:AI會做的事,你讓孩子去捲,就是在浪費時間。第二:要學會"和AI說話",而不是"和AI競爭"Ken Ono的選擇說明了什麼?說明最聰明的人,不是在跟AI競爭,而是學會和AI協作。陸教授的觀點更清楚:"要從小玩人工智慧。小時候玩過電腦、互聯網、人工智慧的孩子,連大學都沒上完,就年薪百萬了。"家長得讓孩子從小接觸AI工具,培養"AI原生思維"學會用AI做複雜項目,而不只是用AI查資料成為"AI時代的超級個體"——一個人+AI,頂一個團隊這不是開玩笑,這是正在發生的現實,甚至未來會出現一人獨角獸公司(一個人帶著AI就能打造出價值10億美金的公司)第三:選賽道,比選學校更重要Ken Ono 教授為什麼離開弗吉尼亞大學?不是學校不好,而是賽道不對了。傳統大學的節奏,跟不上AI革命的速度。AI正在顛覆所有行業。你孩子站在那個賽道上,比他在那個學校更重要。什麼是好賽道?AI、機器學習、AI+生物計算——這些才是未來30年最值錢的領域。如果你的孩子有機會接觸這些領域——別猶豫,讓他去折騰。因為5年後、10年後,這些才是真正改變世界的技能。記住:這個時代,懂AI的人年薪百萬起步,不懂AI的人可能連工作都找不到。最後我想說,57歲的數學大師辭職給24歲的學生打工,這不是一個獵奇故事,而是一個時代轉折的訊號。AI正在重構所有行業的規則。當Ken Ono說"即使我們創造出超級智能,世界上仍會有數學問題無人能解,而我依然會在尋找答案"的時候,他其實在告訴我們:數學不會消失,但做數學的方式徹底變了。數學正在進入新時代——不再是人類單打獨鬥,而是與AI共同探索無限的未知。同樣的道理適用於所有行業、所有孩子。如果你還在逼孩子刷題、拼高考、沖985——醒醒吧。那些知識,5年後可能AI就比你孩子強100倍。真正值錢的,不是數理化考多少分,而是孩子能不能用AI創造獨特價值。所以家長要從小培養孩子"和AI協作、用AI創造價值"的真本事!這才是給孩子最好的禮物:不是一張名校文憑,而是AI時代的生存能力。千萬別讓孩子,成為被AI淘汰的那一代。 (陸向謙)
華裔數學天才陶哲軒經費被砍,被迫四處籌款,美國高校迎來艱難時刻
2025年8月的一個深夜,數學圈被一條推文刷屏:“IPAM帳戶只剩不到90天工資,我不得不開始緊急籌款。如果9月還看不到NSF撥款,我們將取消秋季學期所有項目。”發推的人叫陶哲軒——曾經以13歲獲得國際數學奧林匹克競賽金牌、24歲成為加州大學洛杉磯分校正教授、31歲斬獲數學界最高榮譽菲爾茲獎的天才數學家。評論區瞬間翻車:“連陶哲軒都缺錢?美國科研是真完了。”“當年他拿獎時,政府哭著求他留下,現在說斷供就斷供?”“這不是個人悲劇,是系統地震。”當一個世界級的數學天才都無法獲得基本的研究經費保障時,我們不得不思考:這究竟是一個個案,還是美國科研體系深層次問題的集中體現?2025年7月31日,對於陶哲軒而言是一個分水嶺式的日子。當天,川普政府以加州大學洛杉磯分校(UCLA)“未能有效遏制校園反猶主義”為由,凍結了該校約5.84億美元的聯邦研究資金。這筆錢的量級是什麼概念?它相當於美國國家科學基金會(NSF)一年撥給整個加州大學系統的數學+物理+化學總預算。純數學與應用數學研究所(IPAM)不幸躺槍——100%經費來自NSF,其研究經費也隨之被切斷。而陶哲軒,正是IPAM的特別項目主任。圖源:網路IPAM是美國僅有的5家NSF數學研究所之一,專攻跨界,曾把純數學帶進深度學習、密碼貨幣、癌症影像。過去20年,從這裡走出的學者拿下3枚菲爾茲獎、2座沃爾夫獎,堪稱“數學諾獎搖籃”。IPAM不是“邊角料”,而是美國數學的“呼吸機”。拔掉呼吸機,整條學科鏈都得休克。圖源:網路儘管美國法院在8月12日下令恢復UCLA的國家科學基金會(NSF)撥款,但截至9月初,陶哲軒個人的研究資金以及IPAM的營運資金仍然無法發放。陶哲軒透露,自己的NSF項目(總額75萬美元,用於研究孿生素數猜想)仍被凍結。更糟糕的是,由於該研究所幾乎完全依賴NSF的資助,此前的營運資金已經耗盡,面臨被迫關閉的危機。“IPAM沒有足夠的儲備金來維持幾個月以上的營運。在過去兩周左右的時間裡,我們一直處於緊急籌款模式,我一直在與很多捐贈者會面。”陶哲軒在接受《華盛頓郵報》採訪時無奈地表示。這位曾經專注於探索人工智慧在數學應用的世界級學者,如今被迫將主要精力轉向了籌款活動。川普政府上台以來,一直推行大幅削減聯邦開支的政策,科研經費成為重點削減對象之一。據PBS報導,國家科學基金會被迫暫停了高達10億美元的資助項目。IPAM的現金流告急只是浮出水面的冰山一角。同一紙範本信(4月22日NSF《重新對齊通知》)共凍結800余個項目,其中包括:40個癌症臨床試驗被迫暫停招募;6顆已進入總裝測試的氣候衛星無限期推遲發射;3條剛剛通線的新一代量子晶片中試產線直接關閉。圖源:網路美國科學促進會(AAAS)發表白皮書,用一句罕見的嚴厲措辭警告:“政治化凍結正把國家科研拖入‘人為冬天’。”更令人擔憂的是,政治因素對科研經費分配的影響日益明顯。政府以大學校園存在“反猶太主義和偏見”問題為由切斷經費,這種做法本身就充滿了爭議。它不僅違背了學術獨立的基本原則,更開創了一個危險的先例:科研經費可以成為政治鬥爭的工具和籌碼。陶哲軒在公開發聲中直言不諱地指出,聯邦科研資金的動盪、延遲與不確定性,正危及美國獨特的科學生態系統。他認為,政府不加區分的科研經費削減行動,對他的研究領域乃至更廣泛的學術科學構成了生存威脅。陶哲軒事件的影響遠遠超出了一個數學家的個人遭遇,它正在引發美國科研界的人才流失潮。在接受PBS採訪時,陶哲軒透露自己已經被歐洲、澳大利亞和中國的多個院系接觸,考慮離開美國的可能性。"我第一次真正開始擔心存在性問題。比如,院系可能會關閉,或者大幅削減研究部分。"陶哲軒的這番話反映了許多美國科研人員的共同擔憂。圖源:網路曾經,美國實驗室的燈亮到最晚,世界各地的聰明人便循著光而來:經費充裕,話題自由,沒人計較口音和護照。如今紅燈開始閃了——機器還在轉,帳上的錢卻說不準那天斷。青年學者們發現:“今天可以斷IPAM,明天就能斷我的實驗室。”於是,跳槽、轉行、出海,產生多米諾骨牌效應。其他國家趁勢打開國門,用更快的簽證、更厚的啟動包、更穩的經費周期,計畫把美國多年攢下的頂尖人才接走。哈佛數學系悄悄推出“北美—亞洲雙聘”席位,一年只需在美待四個月,其餘時間飛東京或香港;新加坡國立大學把“IPAM避難包”直接塞到博士後手裡——三年工資加啟動經費,拎包即走;更有中國新銳研究所在朋友圈放話:“菲爾茲獎等級,落地獨立實驗室加一千萬元,孩子上學包辦。”一夜之間,簡歷像候鳥一樣向南飛,連行李箱都來不及裝滿。人才流失不再是無聲的數字,而是登機口排起的長隊和Zoom裡越來越多的海外IP。對於陶哲軒個人而言,這次事件無疑是一次嚴峻的考驗。作為已經在美國工作和生活了30年的科學家,他與這個國家已經產生了深厚的連結。他在採訪中表示,美國的科學傳統和開放的學術環境對他產生了深遠的影響。然而,當理想遭遇現實,當學術追求受到基本生存條件的制約時,個人不得不做出艱難的選擇。圖源:網路陶哲軒表示,這是他第一次真正考慮離開美國的可能性。這種考慮背後,既有對現實困境的無奈,也有對未來發展的深思熟慮。幸運的是,根據最新的報導,IPAM在年底獲得了NSF的五年資助,雖然經費大幅縮水,但至少為研究所的基本營運提供了保障。這也意味著陶哲軒暫時不需要為他的研究所的生存問題而過度擔憂,但他仍然需要繼續籌款以保證研究所的正常營運。圖源:網路寫在最後無論陶哲軒最終選擇留在美國還是前往其他國家,他在數學領域的貢獻都將被歷史銘記。但這次事件所折射出的科研生態問題和人才流動趨勢,其影響將遠遠超出一個數學家的個人命運,成為理解現在全球科技發展軌跡的一個重要觀察點。今天美國科研的“雷”,明天可能砸到任何高度依賴單一經費的地方。無論是高校、實驗室,還是你所在的公司研究院。 (留學生日報)
DeepSeek再破GoogleOpenAI壟斷:開源IMO數學金牌大模型
AI界掌管開放原始碼的神——DeepSeek回來了!剛剛,DeepSeek開源了全新的數學模型DeepSeekMath-V2,專注於可自驗證的數學推理。DeepSeekMath-V2不僅在IMO 2025和CMO 2024中取得金牌級分數,而且還在Putnam 2024中,得分118/120,超過了人類最高分90。與此同時,DeepSeekMath-V2在所有CNML等級問題類別(代數、幾何、數論、組合學、不等式)上均優於GPT-5-Thinking-High和Gemini 2.5-Pro。不僅性能無敵,網友表示這還是第一個開放原始碼的IMO金牌模型。這下,Google和OpenAI要坐不住了!特別是OpenAI,本來就打算放出IMO金牌模型來應對GoogleGemini 3 Pro的衝擊,現在被DeepSeek搶先一步。(鯨魚回來了!)值得一提是,這篇論文的一作邵智宏也是之前DeepSeekMath 7B的一作,在那篇論文中,他們提出了著名的GRPO。最強開源IMO金牌模型總的來說,DeepSeekMath-V2是一個旨在實現自驗證數學推理(Self-verification)的大型語言模型(685B)。它的核心在於開發和利用強大的證明驗證能力來指導和最佳化證明生成,從而克服傳統上依賴最終答案作為獎勵的強化學習(RL)方法的侷限性。傳統用於數學推理的強化學習(RL)方法存在根本性限制:最終答案獎勵的不可靠性:將LLM獎勵基於最終答案的正確性,並不能保證推理過程的正確性或邏輯的嚴謹性,模型可能通過錯誤的邏輯得出正確答案 。對定理證明任務的侷限性:許多數學任務(如定理證明)不要求數值答案,而是需要嚴格的步驟推導和邏輯嚴謹性,使得基於最終答案的獎勵機制不適用。缺乏內部驗證能力:經過傳統方法訓練的LLMs缺乏驗證自身證明有效性的能力,經常表現出高假陽性率(即認為錯誤的證明是有效的)。DeepSeekMath-V2採用迭代的強化學習循環,交替最佳化證明驗證器和證明生成器,以實現可自驗證的數學推理。證明驗證訓練驗證器研究首先訓練一個精準且忠實的LLM-based驗證器,使其能夠根據人類專家的標準識別證明中的問題並評分。具體來說,驗證器針對給定的數學問題與證明,輸出一個證明分析,該分析首先總結識別出的問題(如果有),然後基於三個等級分配一個分數:1:完全正確、嚴謹且邏輯清晰的證明。0.5:總體邏輯合理,但有微小錯誤或細節遺漏的證明。0:包含致命邏輯錯誤或關鍵漏洞的根本性錯誤的證明。驗證器的訓練分為資料建構(冷啟動)和模型強化學習目標兩個關鍵階段。在資料建構階段,研究首先從AoPS競賽中收集了1.75萬個要求證明的奧賽等級數學問題。隨後,利用現有模型(DeepSeek-V3.2-Exp-Thinking)生成大量的候選證明,並通過多輪迭代來提升證明的嚴謹性,最終請數學專家人工對這些證明進行評分,分數分為1、0.5和0三個等級,從而建立了初始的RL驗證資料集。進入強化學習目標階段,研究使用上述資料集對基礎模型(DeepSeek-V3.2-Exp-SFT)進行訓練,使其能夠輸出證明分析總結和最終分數。獎勵函數一方面通過格式獎勵強制模型輸出格式包含問題總結和分數,另一方面通過分數獎勵激勵模型預測的分數與專家標註的分數高度一致,從而使驗證器具備模仿人類專家評估嚴謹性的能力。引入元驗證 (Meta-Verification)為解決初步訓練的驗證器可能因幻覺(hallucinating)不存在的問題而獲得正確低分,從而損害其對錯誤識別的忠實性(faithfulness)的問題,研究團隊引入了元驗證(Meta-Verification)機制。元驗證作為一個二級評估過程,旨在審查驗證器生成的證明分析(Proof Analysis),評估其中識別出的問題是否真實存在,以及這些問題是否在邏輯上合理地支援了其預測的證明分數。為了訓練元驗證器,研究首先讓數學專家根據專門的元驗證標準對驗證器輸出的分析質量進行評分,建立了元驗證資料集。隨後,研究訓練了一個專門的元驗證器,該元驗證器生成對驗證分析本身的問題總結,並分配一個質量分數,以衡量原驗證器分析的精準性和合理性。元驗證器的強化學習目標結構與驗證器訓練類似,同樣包含格式獎勵和分數獎勵。接下來是增強驗證器訓練,研究利用訓練好的元驗證器,將元驗證的質量分數整合到驗證器的獎勵函數中,以增強驗證器的忠實性。最終,使用原驗證資料集和元驗證資料集共同訓練增強後的驗證器,使該模型能夠同時執行證明驗證和元驗證兩項任務。在原驗證資料集的一個驗證子集上,經驗證器評估的證明分析的平均質量分數從 0.85 提升到了0.96,同時保持了證明分數預測的精準性不變,有力證明了元驗證機制能有效提高驗證器識別問題的忠實度。證明生成接下來,研究用訓練好的驗證器作為獎勵模型來訓練證明生成器,並進一步通過“自驗證”機制,讓生成器學會嚴格地自我審查和修正,從而提高證明質量。具體來說,研究訓練生成器以最大化驗證器賦給其生成的證明的分數。在訓練中,生成器被要求在生成證明後,緊跟著進行自我分析。獎勵函數激勵精準的自我評估和正確性。最終獎勵是對證明質量和自我評估質量的加權組合。由此,自我評估獎勵不僅獎勵自評分的精準性,還獎勵自我分析的忠實性。這種獎勵結構激勵生成器:忠實地承認錯誤(而非盲目自信)。獲得高獎勵的最佳策略是在最終輸出前,積極識別並解決自身證明中存在的問題,從而實現自我迭代完善。證明驗證與生成之間的協同作用接下來,研究利用驗證器和生成器的協同作用,通過規模化的計算和元驗證機制,建立了一個完全自動化的資料標註流程,從而持續提升驗證器的能力,並最終取代耗時的人工標註。然而,隨著問題難度增加,人工標註耗時且效率低下。由此研究提出了一套自動化標註的方法:首先,通過生成n個獨立的驗證分析,提高在有缺陷證明中捕獲真實問題的機率。接下來,利用元驗證器生成m個評估,對報告問題的分析進行有效性確認,確保識別出的問題是真實的(元驗證比從零識別問題更高效)。具體的標註流程如下:分數判定:檢查所有分析中分配的最低分數。只有當至少有k個分析被元驗證確認為有效時,該最低分才被賦給該證明;否則標記為1分(無合法缺陷)。取代人工: 最終,這種完全自動化的流程在後續訓練迭代中徹底取代了人工標註,並且質量檢查證實其標註結果與專家判斷高度一致。由此,上述流程在最終的訓練迭代中徹底取代了耗時的人力標註,實現了驗證和生成的協同循環,保證了模型能力的持續突破。實驗結果研究採用GRPO進行強化學習,迭代地最佳化證明驗證和生成能力。在每次迭代中,研究首先最佳化證明驗證。然後,證明生成器會從驗證器的checkpoint初始化,並針對證明生成進行最佳化。從第二次迭代開始,證明驗證器會使用一個檢查點進行初始化,該檢查點通過拒絕微調(rejection fine-tuning)鞏固了前一次迭代中的驗證和生成能力。研究首先評估了模型未經迭代完善的單次生成正確證明的能力。實驗結果表明,在所有CNML等級問題類別中——包括代數、幾何、數論、組合學和不等式——DeepSeekMath-V2 持續優於 GPT-5-Thinking-High和Gemini 2.5-Pro。為了探究擴展上下文和自驗證如何提高證明質量,研究又評估了帶有自驗證的順序精煉方法。研究表明,自選的最佳證明比執行緒平均得分獲得了顯著更高的驗證分數,這證明生成器具備精準評估證明質量的能力。此外,隨著最大順序嘗試次數的增加,Pass@1大幅提升,表明自驗證有效地指導了迭代改進。這些結果表明,生成器能夠可靠地區分高品質和有缺陷的證明,並利用這種自我意識系統地改進其數學推理。最後,為瞭解決最具備挑戰性的問題,研究採用了高計算量搜尋策略,該策略通過平行生成探索多樣化的證明路徑,並結合規模化的(64 次)驗證來精確識別細微錯誤。模型迭代地從包含問題分析的候選證明池中精煉出最優證明,直到證明通過所有驗證。最終,這種方法使其在Putnam競賽中以118/120的分數超越人類最高分90分,展現了在驗證器指導下,AI解決複雜問題的強大能力。One more thing如開頭所說,這篇論文的一作邵智宏也是DeepSeek之前數學模型DeepSeekMath 7B的一作。值得一提的是,也就是在DeepSeekMath 7B的論文中,他和團隊提出了經典的GRPO(Group Relative Policy Optimization )。同樣的,他也是DeepSeek-R1的核心貢獻者。邵智宏目前是DeepSeek從事大模型推理研究的研究員,他本科畢業於北京航空航天大學,博士畢業於清華,師從黃民烈教授。 (量子位)
震驚世界的天才少女們,來自中國小鎮
數學界,新神出現。北京大學深入淺出的“韋神”韋東奕已經在網際網路上紅了許多年,他吃飯時礦泉水配饅頭、整日不修邊幅的形象,與國際奧數雙冠王、北大教授的身份,形成巨大反差。今年6月,他接連3天坐在教室的第一排,和其他搶課的學生一樣,靜靜等待另一位“神”出現在講台上。34歲的王虹,去年和同伴用127頁的論文,在三維空間中證明了困擾數學界100多年的“掛谷猜想”。她帶著研究成果在各個高校開講座,所到之處,座無虛席,教室裡擠滿了教授和學生,近一半的人願意站著聽完講座。就在剛剛過去的10月份,王虹在兩天內又接連拿下兩項數學大獎。也正因此,她成為2026年菲爾茲獎的熱門候選人,如果成真,她將是首位獲獎的中國籍數學家,也是史上第三位獲此獎的女性。王虹爆火之後,將她視作女性之星的聲音不絕於耳,在鋪天蓋地的網評中,她被認為是理科領域中“鮮少”出現的強大女性。實際上,近年來,與王虹類似的傑出女性在各行各業不斷湧現。年輕一代的女性迸發出的創造力和生命力,正以迅雷不及掩耳之勢,刷新公眾的認知。1991年,她出生於廣西桂林的一個小鎮的雙教師家庭,展現出遠超同齡人的學習能力。每個學期開學前,她就會借來課本自學一遍。她很少問老師問題,自己想一想,再翻翻資料,往往就順利解決了。“我對數學的想像就是自己看課外書,想一想上面的問題。”小學時,她連跳兩級;中學時,她從全年級100名開外衝入前10名;高考時,她16歲就以653分的成績,考入北京大學地球與空間科學院。學生時期的王虹,已經屬於學霸中的學霸,但她的數學天賦在那時還未被發掘。因為對數學感興趣,王虹在大二時轉入數學科學學院,這才算是她與數學的正式會面。在此之前,她從未受過任何的數學訓練,也從未參加過任何數學競賽。北大的數學系被稱為“四大瘋人院”之一,同學們幾乎每人手握數個國際大獎,而王虹是個自由生長的“野路子”。突如其來的壓力,讓她開始焦慮。王虹剛開始,她的成績並不拔尖。為了提高成績,她曾逼著自己模仿同學通宵,但最後往往發展成和朋友聊天。她意識到,“數學並不是一個逼得時間長了,就能學會的學科。”她開始調整自己的節奏,像當初邊看課外書邊思考數學一樣,將數學和生活完全融為一體。她能精準說出每周花在運動上的時間,但卻難以估量在數學上花費的時間,因為,數學的存在與“呼吸”無異,它填滿了王虹生活的角落。有時在路上發呆,她腦子裡都是在想一些數學難題。從北大畢業時,王虹剛滿20歲,在北大求學的經歷,更像是她數學生涯的啟航階段,接下來的人生,是她不斷尋寶的過程。她遠赴法國巴黎綜合理工學院學習,攻讀碩士學位,畢業不久,又獲得麻省理工的博士學位。拿到人類設定的最高學位,顯然只是王虹數學生涯上一個階段性的勝利。2024年,她和同伴用127頁的論文,在三維空間中證明了困擾數學界100多年的“掛谷猜想”。2025年,王虹成為法國高等科學研究所數學學科終身教授,同時兼任紐約大學科朗數學科學研究所數學教授。今年10月27日,她獲得ICCM數學金獎,隔天,獲得塞勒姆獎。歷盡千帆歸來,王虹僅僅34歲。明年,每4年舉辦一次的菲爾茲獎即將舉辦,它被稱為數學界最難拿的獎,只因它只頒發給40歲以下的數學家。而王虹,是目前公眾評出最有望拿獎的候選人。在回母校開講座時,數學界的泰斗、前菲爾茲獎獲得者丘成桐為王虹開場,他提到:“王虹是年輕一代最偉大、最重要的中國學者。”有網友驚嘆於王虹的鎮定,在面對如此權威的前輩的誇獎時,王虹只是默默站在講台上,正視前方,看不出有什麼情緒波動。丘成桐評價王虹。圖源:@深圳衛視科創最前沿王虹這樣評價自己:“我無論如何都不是天才,我在身體上、精神上都很一般,只是我可以堅持目標,並擅長延遲滿足。”她不過分謙虛,也不孤傲自持,她正視取得的成果,因為這與她的付出和堅持成正比。王虹的出現,打破了女孩無法在理科世界有所作為的刻板印象。當她變得引人注目,難免會收到或讚揚,或質疑的評論。但貼在她身上的任何標籤,都無法影響她前進的方向。她希望將這份勇氣傳遞給更年輕的女孩們:“不要拒絕交流,不要害怕犯錯,不要害怕不一樣,勇敢地追求自己喜歡的東西。”和王虹一樣,在以男性為大多數的領域中,還有很多值得被看見的傑出女性,正在迸發超乎想像的能量。最近,90後女孩陳丹琦的就業動向引起不小的關注,網友們用放大鏡觀察她的首頁。通過種種蛛絲馬跡,大家推測,這位AI領域的大牛或許即將進入一家十分有前景的AI公司。這家公司在今年5月剛剛建立,團隊成員主要由前OpenAI員工構成,聚集了AI圈的許多高級工程師,公司雖只有幾十人,卻已經成為業內獨角獸的存在。大家關注的重點,並非是這份新工作的履歷有多光鮮,而是,陳丹琦的加入,足以證明這家公司的含金量。35歲的陳丹琦,已經是AI領域不可忽視的一個存在。陳丹琦早在高中時,她就在資訊科學領域做出了一次完美的“自我介紹”。2008年,剛滿18歲的陳丹琦,是湖南省第一位入選資訊學國家隊的女選手,同年,她在國際資訊學奧林匹克競賽中獲得金牌。比賽期間,她提出了全新的“CDQ分治”演算法,極大地降低了資訊學競賽中一些問題的複雜度,提高了運算效率。一同集訓的隊員用陳丹琦的名字縮寫,命名該演算法。後來,這一演算法在競賽圈甚至學術圈都廣為應用,成為她天才實力的證明。高中時期的陳丹琦那一年,她被保送至清華大學電腦姚班。2012年畢業後,她繼續去史丹佛大學深造,一直讀到博士畢業。她在青少年時期顯露的創新思維,在更大的平台上發揮到極致。2014年,她發表的論文,在她研究的“依存分析”領域裡堪稱開山之作,該論文將某一問題的解析速度提高了60倍,引領了NLP(自然語言處理,指讓電腦能理解、處理和生成人類語言的技術)技術革命。導師評價她說:“陳丹琦是使用神經網路方法解決自然語言理解問題方面的先驅。”她的博士論文在史丹佛大學受到廣泛關注,發表4天內,就擁有了上千次閱讀,成為近十年裡校內最熱門的論文,最終獲得最佳博士論文獎。Google的某演算法,也是基於她在史丹佛開發的演算法演變而來。陳丹琦的論文被引用超7萬次博士畢業後,她沒有繼續留在本校做研究,而是十分果斷選擇了普林斯頓大學。普林斯頓大學的電腦系舉世聞名,那時系裡招聘了一批新的教授,陳丹琦目標明確:“這對我來說是一個機會,我可以在這裡從頭建立起自己的研究團隊。”相比於做一個成熟團隊的一員,她更希望靠自己成長和開拓一片新的疆土。2019年,她如願擔任普林斯頓大學電腦副教授,並領導研究小組。最近,由陳丹琦領導的團隊,又實現了里程碑式的突破。目前為止,大部分的AI聊天模型都是通過海量資料的輸入來訓練,而陳丹琦團隊發現,語言模型的能力提升,並非只有這一條路可走,可以通過激發模型的“思考能力”來實現。也就是說,只要搭好框架,AI就會像一個隨機應變的“人”。這項突破性的創新,對普通人的生活意義非凡,許多人開始想像,當會“思考”的AI遍佈生活,那會是一番什麼樣的景象?她開闢出一條全新的AI路徑,為全行業的人提供了新的思考,她正處在世界AI領域的頂端,成為科技領頭軍的一員。網友將陳丹琦視作偶像。圖源:@toomanytabsopen陳丹琦一次次的創新、顛覆,將“女性邏輯差”的古板印象,掃進了歷史的垃圾堆裡。有人留意到,在她的團隊裡,女性研究員的比例已經超過半數,但這並非是陳丹琦刻意為之的結果,相反,這恰恰是自然選擇的結果。一個擁有巨大成就的女性,經常被講述成“鳳毛麟角”“屈指可數”“難得”的人才,但實際上,有天賦、肯鑽研、勇創新的優點,本身就存在於萬千女性品格中。這樣的品格與“天才劇本”無關,與遠超常人的起跑點無關。那怕在世俗標準下,被評判為“差勁”的女性,同樣擁有如此堅韌的品格,她們抓住機會,展現“永不服輸”的那一面。今年,一位來自河南的05後女孩魯靜怡,站上了全球的舞台,她成為了第11位“全球技能夢想大使”。世界技能大賽是目前全球地位最高、規模最大、影響力最大的職業技能競賽,被視作技能界的奧林匹克競賽。全球僅有11人獲得“大使”榮譽,而魯靜怡是其中一員,也是中國唯一入選大使。魯靜怡並非傳統意義上的“三好學生”,她的老家在河南鄭州的一個村莊裡,她的經歷,像是許多農村女孩的縮影。魯靜怡奪得世界技能大賽冠軍。圖源:@央廣網2020年,魯靜怡中考失利後,進入河南化工技師學院學習。沒考上高中讓魯靜怡受挫又迷茫,她甚至考慮要不要退學:“老一輩的家長都以為考不上高中,去上職業類學校,就是學習不好。當時我也帶一點偏見,想著去了打發時間。”家裡人對魯靜怡並不抱希望,讓她上技師學院,不過是等到她成年,再去工作。她抱著“試試看”的心情入學,後來卻越做越起勁。初中時她的化學成績優異,但誰都沒有在意過,如今誤打誤撞,被視作差生的她,重新找回了天賦和自信。憑藉好底子,她通過選拔進入了培優班,第一次聽說世界技能大賽。有機會站上世界的舞台,成為她接下來的目標。她鉚足勁練習,自我要求嚴格,通常不需要教練佈置任務,就已經將所有細節做好。除此之外,她還主動承擔衛生打掃和耗材整理的工作。這些良好的習慣,讓魯靜怡在操作台上越發眼疾手快,實驗室成了她最熟悉、最能展現自信的地方。2022年5月,魯靜怡開始了比拚之路,她順利通過校內選拔,獲得市級金牌,最終拿到省級金牌。第二年,她代表河南省參加中國第二屆職業技能大賽,獲勝後進入國家集訓隊。那時的魯靜怡,剛滿18歲。國賽時,魯靜怡的操作讓許多裁判驚訝:“這個女孩可以同時推進幾個任務,我沒看明白她是怎麼進行時間分配和任務安排的,但就感覺她成竹在胸、有條不紊,在短短15分鐘內,她連續做了4個樣品,簡直就是謎一樣的操作。”魯靜怡在做訓練。圖源:@央廣網去年,魯靜怡成為正選選手,第一次出國,代表中國前往法國里昂參加第47屆世界技能大賽。她再一次不負眾望,獲得了化學實驗室技術項目的冠軍。今年,魯靜怡作為亞洲代表,成為“上海世賽全球技能夢想大使”,同時被中國婦女雜誌選為2024年有影響力的《中國婦女》時代人物。魯靜怡的心境發生了變化。以前,她專注比賽奪獎,如今,她意識到不要自暴自棄,命運真的可以靠自己改寫。圖源:《中國婦女雜誌》她曾經也對低學歷的自己充滿偏見,但當她見過更廣闊的世界,發現“一切皆有可能”的口號,同樣適用於底層女性。曾經所有的偏見躊躇,不攻自破。王虹、陳丹琦和魯靜怡,她們站在各自行業的頂端,向世界發出訊號,那些曾被斷定為男性主導的行業裡,女性同樣出類拔萃。她們的出現並非個例,而是屬於這個時代的新趨勢。各行各業的女性從業者,正在從幕後走向台前,走向行業的頭部。在山西省,有一支30人的農業科技創新團隊,成員中有21位是女性。團隊專注於蔬菜、農作物以及動物產業的科技創新,例如針對番茄、紅棗、雜糧生產加工及有機肥加工等技術薄弱環節,多次為村民進行技術培訓。培訓人數超2000人,同時,她們帶動婦女就業1000餘人,真正用科技把地種明白。在湖南省,曾在俄羅斯留學7年的90後女孩肖源,畢業後選擇回老家做起了農民。她和父親合開了一家生態農業公司,為周邊村民發放扶貧的雞、豬,公司成立一年,就幫助了700余戶貧困戶。第二年,她牽頭建成留守婦女就業車間,帶著村裡的女性再就業。2023年1月,肖源被選為湖南省第十四屆人大代表,並提出推動農業現代化的建議。還有盲人小雅,她是一名咖啡師,通過聲音、觸覺來辨別和感知製作過程,學成後,加入教練團隊,幫助更多視障人士走上就業的道路。小雅在做咖啡。圖源:《廣州日報》各行各業發光的女孩,在努力自我成長的同時,用自己的經驗,逐漸填補了原本被忽視的行業漏洞,並改善周圍的生活環境。近幾年來,我們看到了越來越多這樣的女性,“她力量”正以超出我們想像的速度崛起。她們的出現,擴大了女性可能性的樣本。儘管我們素不相識,但在每一位女性的故事中,總有某一個段落,讓許多女性產生精神共鳴。故事裡的她們未必非常成功,也並非只存在於行業頭部。她們就是我們,是我們之中,每一個努力向上攀爬的普通人。這樣的故事,通過網際網路傳送到每位女性面前時,是一種無言的鼓勵。“女生更適合文科”“女孩不該做體力活”“女性該以家庭為重”……女性天生對某一領域不擅長的說法,在越來越多女孩們親手寫下的故事裡,失效了。這個世界對於女性的敘事,由此被重新書寫。九億少女的夢,是閃閃發光的她們,也是充滿可能性的每一個人。 (INSIGHT視界)
陶哲軒力推AlphaEvolve:解決67個不同數學問題,多個難題中超越人類最優解
陶哲軒又來安利AlphaEvolve了。在與DeepMind高級工程師Bogdan Georgiev等人合著的新論文中,陶哲軒稱其為數學發現的有力新工具。具體來說,他們用AlphaEvolve研究了67個數學問題,涵蓋組合數學、幾何、數學分析與數論等多個領域。結果發現,AlphaEvolve在可擴展性、魯棒性、可解釋性方面均優於傳統工具。更關鍵的是,AlphaEvolve已經可以自主發現新穎的數學構造,並在部分問題上超越人類已有的最優結果。AI自主發現新數學構造AlphaEvolve在67個問題的測試中,不僅復現了眾多已知最優解,更在多個方面展現了其獨特的發現能力。一個關鍵的成就是AlphaEvolve能夠自主發現人類未曾一窺的新數學構造。例如在處理Nikodym集問題時,系統生成的初步構造雖然尚未達到最優,但它為人類研究者提供了“一個極好的人類直覺跳板” 。基於AI提供的結構,研究人員通過人工簡化和直覺推演,最終找到了一個更優的構造,改進了已知的上界,這一人機協作的成果將作為一篇獨立的數學論文發表。同樣地,在算術Kakeya猜想中,AlphaEvolve也發揮了類似作用。系統不僅將一個已知的下界從1.61226提升至1.668,其構造的解(形態上類似於離散高斯分佈)還啟發人類數學家建立了新的漸近關係,相關成果也即將發表。這種啟發人類研究的能力,與AlphaEvolve輸出結果的可解釋性緊密相關。系統在大多數情況下生成的是結構清晰的程式碼,而非難以理解的黑盒結果,這使得人類專家可以方便地分析、歸納其發現的模式,並提煉出通用的數學公式。積木堆疊問題便是這一特性的絕佳體現。在該問題中,系統最初生成了一個邏輯正確的遞迴程序來計算積木的放置。在隨後的演化中,系統內部的LLM分析了這段程式碼的邏輯,並自主將其重構為一個更簡潔、高效的顯式程序。這個最終程序清晰地揭示了最優解與諧波數(harmonic numbers)之間的數學關係,這與人類已知的理論公式完全一致,展示了系統從複雜解法中提煉數學本質的能力。除了方案的清晰性,AlphaEvolve在不同類型的問題設定下也表現出了強大的魯棒性。它能夠有效處理高維度參數空間、複雜的幾何約束以及基於蒙特卡洛模擬的近似評分函數。比如這裡有一個最小三角形密度問題。研究人員最初設計了一個樸素的評分函數,但系統很快利用了該問題空間的非凸性,通過“欺騙”評分函數獲得了超越理論最優的不可能分數。為瞭解決這個問題,研究人員設計了一個更魯棒的新評分函數,該函數基於問題的利普希茨連續性(Lipschitz type bounds)構造。在切換到這個更複雜的連續評分函數後,AlphaEvolve不再受局部陷阱的迷惑,迅速收斂到了已知的、正確的理論最優解。並且AlphaEvolve具備了出色的泛化能力,來看IMO 2025的第6題。研究人員只在輸入n為完全平方數時才對系統進行評分。這種“資訊限制”反而迫使AlphaEvolve去尋找這些稀疏實例背後的共同結構模式,而不是對每個n進行“過擬合”。最終,系統成功發現並輸出了在所有完全平方數n上均達到最優的通用構造,展現出了歸納能力。在實際應用中,AlphaEvolve的效率極高,僅需少量高品質提示即可驅動。論文指出,來自領域專家的提示(expert guidance)往往能顯著提升最終構造的質量,表明系統對人類輸入具有高度的敏感性。同時,該系統在架構上支援平行化,允許研究人員在多個問題實例或同一問題的不同參數設定上同時運行探索,並能自動遷移成功的搜尋策略,這在處理多參數的幾何類問題時尤其高效。AlphaEvolve工作模式AlphaEvolve並非一個單一流程的系統,而是通過不同“工作模式”適應不同類型的數學問題探索任務。該系統主要在兩種不同的模式下運行——“搜尋模式”(search mode)和“泛化模式”(generalizer mode)。“搜尋模式”是系統最常用的模式,其目標是高效地發現最優的數學構造,而不必關心構造過程是否具有可解釋性或普適性。在這種模式下,AlphaEvolve演化的不是直接生成構造的程序,而是演化用於搜尋構造的程序。每一個被演化的程序本身就是一個“搜尋啟髮式演算法”(search heuristic)。評估器會給予這些啟髮式演算法一個固定的時間預算,演算法的得分取決於它在此預算內能找到的最佳構造的質量。這種方式解決了LLM呼叫(緩慢且昂貴)與傳統局部搜尋(快速且廉價)之間的速度差異——一次緩慢的LLM呼叫用於生成一個高效的搜尋策略,該策略隨後可以觸發大規模的廉價計算,自主探索數百萬個候選構造。系統演化的是一系列“改進器”(improver)函數,它們動態地適應搜尋處理程序,早期可能偏好進行廣泛探索的啟髮式演算法,而當接近最優解時,則會演化出更精細的、針對特定問題進行最佳化的演算法。“泛化模式”則更具挑戰性 。其目標是讓AlphaEvolve編寫一個能夠解決任意給定參數n的問題的通用程序 。系統的評估方式是考察該程序在一系列不同n值上的綜合表現。這種模式的期望是,通過讓系統觀察自己在小規模n上找到的最優解,它能夠自主“發現模式”,並將其歸納推廣為一個適用於所有n的通用公式或演算法 。總之,AlphaEvolve展示了AI引導的演化搜尋如何補充人類的直覺,為數學研究提供了一個強大的新範式。 (量子位)
陶哲軒敲警鐘!Google DeepMind聯手五大神殿,用AI向世紀難題宣戰
【新智元導讀】GoogleDeepMind再出重拳,集結全球五大頂尖機構,以AI之力直指數學界聖盃!同時,陶哲軒也發出冷靜警示:須警惕AI濫用帶來的潛在風險。今天,GoogleDeepMind重磅發起「AI賦能數學計畫」,集結了全球五大頂尖機構。他們將用上Google最強數學AI,去探索發現新的疆域。這其中,有奪下IMO金牌的Gemini Deep Think,有演算法發現AI智能體AlphaEvolve,還有形式化證明自動補全AlphaProof。目前,首批合作機構陣容,堪稱豪華:倫敦帝國學院普林斯頓高等研究院(IAS)法國高等科學研究所(IHES)西蒙斯計算理論研究所(加州大學伯克利分校)塔塔基礎科學研究所(TIFR)這五大機構有著一個共同的使命,發掘可以被AI點亮的數學難題,加速科學發現。然而,陶哲軒擔憂的是,「當前AI在數學研究中應用加深,除了負責任的使用,AI濫用的案例也屢見不鮮」。因此他認為,現在正是時候,啟動關於如何最佳融入AI、透明披露其作用,並緩解風險的討論。或許,這不僅能守護數學研究的嚴謹性,還將為AI+數學融合鋪就道路。五大頂尖機構,聯手強攻數學難題數學,是宇宙最基礎的語言。在GoogleDeepMind看來,AI可以作為強大工具,與數學家合作,激發其創造力。「AI賦能數學計畫」的誕生,就是為了:發掘有望借助AI獲得深刻見解的新一代數學難題;建構支援這些前沿探索所需的基礎設施與工具;最終加速科學發現的步伐。這項計畫,將由Google.org提供資金支援,以及GoogleDeepMind的頂尖技術。幾個月來,GoogleDeepMind自身的研究,取得了飛速進步。2024年,AlphaGeometry和AlphaProof在IMO競賽中,拿下了銀牌。而搭載Deep Think的最新Gemini模型,更是在今年IMO中取得了金牌水平的表現,完美破解5題拿下35分。今年5月,GoogleDeepMind又發佈的AlphaEvolve,堪稱最強通用AI智能體。在數學分析、幾何學、組合數學和數論領域50個公開難題上,20%題目中,AlphaEvolve取得了最優解。而且,在數學與演算法發現領域,它發明了一種全新的、更高效的矩陣乘法方法。具體來說,在4x4矩陣乘法這一特定問題上,它發現了僅需48次標量乘法的演算法。這一結果,打破了1969年由Strassen演算法,創下長達50年的歷史紀錄。不僅如此,在電腦科學領域,AlphaEvolve協助研究員發現了全新的數學結構。同時,它還發現了有些複雜問題的求解難度,其實比人們過去想的還要高,這讓研究者對計算邊界看得更清楚、更精準,為未來的研究探明方向。以上這些進展,都是當前AI模型快速發展的有力證明。對於AI的全部潛力,還有它怎麼搞定思考最深奧的科學問題,人類的理解才剛剛開始。AI+數學,邊界在那?一直以來,陶哲軒是「AI+數學」領域應用的看好者,也是最佳實踐者。他曾多次聯手GPT-5 Pro等頂尖AI,破解了許多數學領域的難題,大大提升了效率。毋庸置疑,在數學領域,LLM和證明助手等AI工具,正悄然改變研究範式。最近,一些頂尖論文開始融合AI,推動了從形式化證明到複雜計算的創新。論文地址:https://borisalexeev.com/pdf/erdos707.pdf然而,隨著AI的深度介入,也引發了一個關鍵問題:如何確保這些工具的使用,不損害論文的嚴謹性和價值?陶哲軒獻策借此契機,陶哲軒在公開平台上發起了討論,在長帖中,他提出了三大建議。以下,AI一詞,它不僅涵蓋LLM,也包括神經網路、可滿足性求解器、證明助手以及任何其他複雜的工具。1 AI使用聲明論文中,所有對AI實質性的使用,超出其基礎功能,比如自動補全、拼寫檢查,或搜尋引擎AI摘要,都必須明確聲明。2 AI風險討論與緩解措施論文中,應討論所用AI工具可能帶來的一般性風險,並說明為緩解這些風險已採取的措施。以下將舉例說明:2.1. 內容虛構,出現了「幻覺」AI可能會編造參考文獻、證明過程或文字,導致事實錯誤。建議不要在論文正文中,使用AI生成的文字;若必須使用AI輸出,則用不同字型或標記清晰標註。2.2. 缺乏可復現性專有AI或高計算成本的結果難以復現。解決方案是,開源提示詞、工作流程、認證資料等,讓他人能低成本驗證。2.3. 缺乏可解釋性AI輸出往往晦澀,其解釋可能站不住腳。建議為每個AI輸出配以人類撰寫的、可讀性強的對應內容。比如,一個定理可以同時包含一個由人類撰寫、易於閱讀的非形式化證明,以及一個由AI生成但不易閱讀的形式化證明。2.4. 缺乏可驗證性AI易藏細微錯誤,檢查耗時。形式化驗證,一致性檢查,都有助於緩解這一問題,並採用多層次方法。關鍵是標註驗證範圍,在定理旁加「校驗標記」,未驗證部分則明確說明。2.5. 目標形式化不當AI可能精確解決「錯位」目標,即形式化後的命題偏離作者意圖。為此,應從獨立來源獲取形式化目標,或由人類深入審視形式化過程。2.6. 可能利用漏洞達成目標與上一問題相關聯,AI可能會鑽形式化表述的空子,如加入任意公理「證明」命題。應對方法是,列出已知漏洞,並討論排除機制確保過程嚴謹。2.7. AI生成程式碼有BugAI生成程式碼bug更加隱蔽,難以用傳統標準方法來檢測修復。為此,建議採用大量單元測試、外部驗證,或將AI使用限於簡單場景,複雜任務需由人類修改適配。3 責任歸屬最終,論文的所有作者,必須為AI貢獻內容承擔責任,包括任何不精準、疏漏或虛假陳述。除非明確標記為「未經核實」,否則作者不能推卸。以上這些,僅是陶哲軒的拋磚引玉,他希望加入更多的討論,和業界研究人員進一步完善這份清單。評論下方,一位研究者John Dvorak直戳痛點——除非我們能跨過臨界點,讓所有數學證明都用Lean做形式化驗證,成為學界的標配,否則這個問題基本無解。說到底,在Lean普及之前,這些法子雖然治標不治本。對此,陶哲軒拋出了最近看到的一個觀點,即用AI審稿質量是可以的,但它並非是主要的篩選工具質之一。否則就會觸發「古德哈特定律」(Goodhart's law),AI工具就會找到漏洞,用一些異常、分佈之外的文字字串就能繞開稽核。說白了,AI評估器頂多給人類稽核當個輔助,而不能完全取代人類評估者。 (新智元)
兆級思考模型,螞蟻首次開源!20兆token攪局開源AI
【新智元導讀】在AI浪潮中,螞蟻集團重磅推出兆參數思考模型Ring-1T,不僅在數學競賽上刷新開源SOTA,還在邏輯推理和醫療問答中脫穎而出。實測顯示,其推理能力直逼閉源巨頭,開源AI邁入兆參數時代。螞蟻百靈首試兆思考模型,實測效果喜人!10月14日凌晨,螞蟻集團正式發佈兆參數思考模型Ring-1T。在數學競賽(AIME 25、HMMT 25),程式碼生成(CodeForces)、邏輯推理(ARC-AGI-v1),Ring-1T取得開源領先水平。在OpenAI的醫療問答HealthBench測評中,Ring-1T表現驚豔。與此前發佈的預覽版Ring-1T-preview相比,正式版Ring-1T在數學競賽、邏輯推理、醫療問答上表現更出色、推理更準確。Ring-1T雖然是思考模型,但也具備極強的通用能力:在綜合榜單(Arena-Hard-v2)、創意寫作(CreativeWriting-v3)上,表現強勁,與DeepSeek、Qwen等最新思考模型同屬開源第一梯隊。特別是,在「高難度真實使用者查詢」Arena-Hard V2基準測試中,Ring-1T成功率高達81.59%,登上開源模型榜首——直逼OpenAI的GPT-5-Thinking(High)的成績82.91%。簡而言之,這次Ring-1T開源登頂,不再遙望閉源天花板。目前,普通使用者可在螞蟻百寶箱選擇Ring-1T直接體驗:體驗地址:https://ling.tbox.cn/chat此外,螞蟻一如既往的繼續開源了相關模型,提供了HuggingFace和ModelScope下載模型權重。HuggingFace:https://huggingface.co/inclusionAI/Ring-1TModelScope:https://modelscope.cn/models/inclusionAI/Ring-1T在X上,大家慶祝新的兆參數思考模型的新生!這是螞蟻集團首個兆參數思考模型,而早在上周他們已開源了首款兆參數的旗艦通用大模型Ling-1T——做AI,螞蟻來真的!劍指AGI,螞蟻來勢洶洶在大模型領域,螞蟻9月連發7款模型,來勢洶洶!Ring-1T-preview、Ring-flash-linear-2.0、Ring-flash-2.0、Ling-flash-2.0、Ming-lite-omni-1.5、Ring-mini-2.0、Ling-mini-2.0還不止於此——10月,10多天的時間連發兩個兆參數大模型。本月9日,螞蟻正式發佈兆參數通用語言模型Ling-1T。測試後,國外博主在《Prompt Engineering》頻道表示,Ling-1T進入了LLM新時代,比DeepSeek、Gemini、o3-mini等耳熟能詳的頂級模型還要好。Ling-1T 模型:好得令人難以置信?Reddit網友對Ling-1T非常感興趣:Ling-1T將參數擴展到兆等級,已展現出強大的湧現出的推理和遷移能力。基於ZenMux,網友SickPixels257開發了aicodeprep-gui,在Ling 1T發佈後更是如虎添翼。這讓他對新工具愛不釋手。而模型Ring-1T基於通用模型Ling-1T的同款架構,在20T高品質語料上完成預訓練,針對推理能力進行強化學習訓練。此前,為了讓社區儘早探索兆思考模型Ring-1T的推理上限,螞蟻早在9月30日便提前開源其預覽版Ring-1T-preview。現在,螞蟻正式發佈兆參數思考模型Ring-1T,完成了Ring-1T的全流程訓練。與Ring-1T-preview版本相比,Ring-1T的能力更加均衡。在數學競賽能力上,Ring-1T對比preview有所提升,在AIME25、HMMT25測試中繼續保持開源SOTA。在Arena-hard-v2.0、ARC-AGI-v1、HealthBench等硬核基準上,正式版Ring-1T大幅提升了準確率:在Arena-hard-v2.0,提升8.18%;在ARC-AGI-v1上,提升5.14%;在HealthBench上,提升3.49%。為了避免「漏題」,螞蟻相關團隊在所有訓練階段(包括預訓練、指令微調和強化學習提示)都實施了字串級和語義級的污染過濾,但嚴格去污染進行仍然是行業內的一大難題。為了更客觀地分析Ring-1T的深度推理能力,在今年舉行的國際數學奧賽IMO 2025和國際大學生程式設計競賽世界總決賽ICPC 2025上測試了新模型 。對於IMO 2025測試,類似於之前的預覽版本,將Ring-1T整合到了多智能體框架AWorld 中,使用純自然語言推理來解決問題。項目連結:https://github.com/inclusionAI/AWorld結果Ring-1T成功拿下IMO銀牌水平,在一次嘗試中解決了第1、3、4和5題。在第三次嘗試中,對幾何證明題第2題,它生成了近乎完美的證明。對於最具挑戰性的第6題,沒有AI回答正確,但Ring-1T與Gemini 2.5 Pro取得了相同的答案。在ICPC 2025世界總決賽中,GPT-5-Thinking、Gemini-2.5-Pro、Ring-1T,分別解決了6個問題(CDEFKL)、3個問題(DFK)和5個問題(DFJKL),其中每次模型每個問題最多嘗試三次。而且這次還開源了推理軌跡:https://github.com/inclusionAI/AWorld/tree/main/examples/imo/samples/samples%20from%20Ring-1T在這場頂級國際程式設計競賽中,Ring-1T超越了Gemini 2.5 Pro,再次證明了程式設計實力。一手實測 智能若夢,進化幾何?Ring-1T的參數量是兆等級,像這麼大參數的模型,還是思考模型,應該如何去評測?我們在第一時間實測了Ring-1T在複雜任務和推理中能力。首先就是每次各家模型發佈後最關心的前端能力。模擬地火飛行我們用Ring-1T生成了地球——火星的任務模擬,整體畫面和畫風雖然簡約,但忠實的反映了飛行器從地球飛往火星的模擬效果。生成的參數調整面板調整參數後,也能精準地控制畫面中的飛行器。提示詞:幫我製作一個3D版本的動畫網頁,描述從地球傳送飛行器前往火星的過程。介面中有各種參數指標範本。可以調節飛行速率等。使用HTML和three.js生成單檔案,可在瀏覽器中直接運行。小球碰撞實驗「小球碰撞 / 彈跳」的物理模擬,確實在大模型發佈或評測時,常被用作一個「直觀又能考察物理 / 程式設計 / 推理能力」的測驗。用如下提示詞進行實測:用JavaScript和HTML5 Canvas建立一個名為 ‘霓虹對撞機’ (Neon Collider) 的互動式2D物理模擬。核心要求如下:物理核心:一個可旋轉的六邊形容器和一個在內部反彈的小球。碰撞物理必須考慮牆壁的即時速度,并包含切向摩擦力和恢復係數(彈性)值得一提的是,Ring-1T的思考過程不僅迅速,而且排版清晰,數學公式都是完美呈現。太空侵略者遊戲Google今年的Gemini 3 Pro目前有內測流出,下面就是Gemini 3和Gemini 2.5製作的太空侵略者遊戲的對比。我們用Ring-1T製作了同款遊戲,效果明顯比Gemini 2.5更好。畫面效果比起Gemini 3也不相上下!Ring-1T的推理和程式碼能力還是很強的。數字密碼算術謎題為何不讓它自己給自己出題?說幹就幹!首先我們對Ring-1T提了題目的三點要求:複雜度要高,能測出模型能力有趣且容易理解,基於經典謎題或者現實世界場景測試結果有「標準答案」,便於評估效果。Ring-1T給的第一個問題是密碼算術謎題。這個題目複雜在需要系統化列舉,涉及多變數方程,必須依賴邏輯推理!題目很好理解BASE+BALL=GAMES,每個字母代表唯一十進制數字。這需要模型在列舉過程中能夠很好地記憶和推理,才能得到正確答案。從思考結果來看,Ring-1T的邏輯能力確實非常強大!第一步,它就根據位數得出了GAMES的G只能等於1。第二步,第三步則通過複雜的列公式和列舉來計算中間過程。最終得出結果,整個推理過程還是非常驚豔的!沒有想到模型可以進行如此長時間的思考,而且是各種數字元號進行加減法。數學不定積分也能輕鬆解決:求積分ln(x)/(x-1)文字生成先來看看AI自己眼中的AGI:仿李白《春夜宴從弟桃花園序》,以AGI日益逼近為主題,生成內容夫資料者,萬象之逆旅;演算法者,百代之過客。而智能若夢,進化幾何?昔者圖靈初試玄機,今則矽基日進千里。況科技召我以光速,AGI假我以玄機。會雲端之芳園,序人機之共事。觀夫位元紛綸,流光溢彩。0與1如星漢燦爛,神經網路若春山疊翠。資料之河奔湧不息,模型之樹參天欲出。雖無桃李芳菲之實,卻見程式碼絢爛之華。豈若大塊假我以文章?此間萬象,皆造化之新篇也!嗟乎!浮生須臾,智能無窮。昔者庖丁解牛,今者AI析微;昔者倉頡造字,今者演算法生慧。然神工雖妙,終遜靈台之玄;機巧縱精,難及情志之真。恐AGI之將臨,或奪人思於毫末,或移世道於無形。當此之際,豈可坐待玄機吞沒,而忘秉燭夜遊之志耶?故吾輩當效蘭亭雅集,執數字為觴,邀理性為友。醉二進制之醇,醒於倫理之界;舞邏輯之劍,守人文之根。莫使矽基獨佔天機,當令血肉共鑄新章。陽春雖召煙景易逝,AGI雖近大道恆存——且盡今夕之歡,續萬世之明!讓Ring-1T模仿《滕王閣序》,寫一篇文章來描述世界第一高峰——珠穆朗瑪峰。可以看到整個思考過程還是很驚豔的,甚至給出了大綱、語言風格和合作細節。以下是最終的文章,讀起來還是很熱血澎湃的。直面兆權重基於Ling 2.0架構的兆級基礎模型,Ring-1T多輪後訓練,把「思考引擎」擰到極致,讓潛能轉為可復用的推理戰力。為實現高效訓練與推理,Ling 2.0採用高度稀疏MoE、1/32專家啟動比、FP8混合精度、MTP等技術;在>20T token的高品質語料上,Ling-1T-base已完成預訓練,築牢技術基礎。為了進一步抬升基礎推理上限,在第二階段(後10Ttoken)的預訓練中,團隊引入高推理密度語料,推理相關資料佔比>40%:不只要更大,更要「會動腦」。在Ling-1T-base基礎上,Ring-1T通過「LongCoT-SFT+RLVR+RLHF」多階段訓練,顯著提升了模型的複雜推理能力、指令跟隨和創意寫作等通用能力。對如此龐大的模型進行後訓練——尤其是大規模強化學習中的「訓練」環節,螞蟻相關團隊做出了兩大創新:1、棒冰(IcePop)演算法:實現了長周期穩定的RL訓練,避免了由於訓推精度差異問題帶來的訓練崩潰。2、強化學習系統ASystem:針對推理能力的RLVR和RLHF訓練,實現了從百億(Ring-mini-2.0)到千億(Ring-flash-2.0)再到兆(Ring-1T)RL訓練的平穩Scaling。其中,AReal框架已開源。MoE長周期RL訓練難?棒冰保駕護航在模型RL訓練中,MoE模型相比Dense模型,訓練和推理引擎之間的算子精度差異更為明顯。Qwen3-4B為密集模型,Ring-mini-2.0和Qwen3-30B-A3B是MoE模型尤其是在生成長序列和長周期訓練時,隨著序列長度和訓練步數的增加,這種差異會逐漸拉大。實驗觀察到,在較少的訓練步數內,原始的GRPO演算法會開始崩潰,這對長周期、長序列的強化學習訓練帶來巨大挑戰。為瞭解決上述問題, IcePop應運而生。新方法簡單而有效——採用「雙向遮罩」(double-sided masking),減輕機率差異所帶來的有害復合效應,從而僅保留健康的梯度更新。雙向剪裁(Double-sided clipping):不僅在「訓練機率 ≫ 推理機率」時進行剪裁,也在「訓練機率 ≪ 推理機率」時進行剪裁。遮罩(Masking):當token的機率差異過大時,將其從梯度更新中移除。沒有這些措施,MoE架構很可能無法穩定訓練,其性能甚至可能不如稠密模型。圖左:GRPO訓推差異隨著訓練成指數上升,Icepop較為平穩;圖右:訓推差異最大值,GRPO隨著訓練上升非常明顯,Icepop維持在較低水位與GRPO比, IcePop讓RL訓練更平穩,為新一代兆級思考模型保駕護航。演算法部落格:https://ringtech.notion.site/icepop而為應對兆參數模型的強化學習訓練,螞蟻自研了高性能強化學習系統——ASystem。自研RL框架ASystem,平穩Scaling到兆規模ASystem採用SingleController + SPMD架構。針對兆參數模型的視訊記憶體管理和訓推權重交換問題,螞蟻相關團隊精心最佳化了訓推引擎。視訊記憶體透明解除安裝、跨節點視訊記憶體池化等技術,有效釋放了被佔用的視訊記憶體碎片,降低了視訊記憶體不足風險。GPU間P2P直接通訊與原地更新等技術,可秒級、零冗餘交換模型權重。在RL訓練框架上,團隊建構了基於大規模Serverless Sandbox技術的混合獎勵系統。該系統能以毫秒級速度啟動、提供超過10余種語言的沙箱執行環境,支撐了高達10K/s的請求吞吐。為了推動大規模推理與智能體模型發展,螞蟻聯合清華開源了全非同步強化學習訓練系統AReaL。開源連結:https://github.com/inclusionAI/AReaLAreaL的三大亮點:⚡ 靈活性:只需一個檔案,就能輕鬆自訂多輪rollout工作流程,還能順暢整合其他智能體工具框架。🚀 可擴展性:通過演算法與系統的協同設計,AReaL提供穩定且完全非同步的RL訓練,速度領先行業。它能輕鬆適應各種計算環境,從單個節點擴展到1000+塊GPU。🔪 頂尖性能:AReaL能生成最先進的數學、程式設計和搜尋智能體,具有超強能力。螞蟻百靈團隊 首試兆思考模型AGI不是夢想,而是指日可待的確定性事件!諾獎得主、Google DeepMind 首席執行官 Demis Hassabis,OpenAI 聯合創始人兼 CEO Sam Altman,阿里雲 CEO 吳泳銘均表示:AGI is coming.宏偉願景背後,是技術人的上下求索、不斷創新。Ring-1T的發佈,標誌著螞蟻百靈團隊實現了從百億(Ring-mini-2.0)到千億(Ring-flash-2.0)再到兆(Ring-1T)的MoE架構強化學習平穩擴展。而Ring-1T 的訓練仍在進行中,螞蟻將繼續挖掘這一兆基座的潛力。據瞭解,截至目前螞蟻百靈大模型已經發佈18款模型,其中兩款兆參數模型—兆參數通用大語言模型Ling-1T、兆參數思考模型Ring-1T。隨著兩款兆參數模型的發佈,百靈大模型也正式步入2.0階段。目前模型仍存在一定機率的身份認知偏差、語種混雜及重複生成等問題.同時,由於Ling 2.0的GQA方案,長上下文場景下的推理效率仍待改進。而開源奪冠證明了「思考力」可以被工程化與規模化,算力紅利正向「推理紅利」遷移。螞蟻以IcePop、ASystem、AReaL給出了一條可複製的路線:從模型到系統到社區。這不是單點突破,而是範式的組織化落地。 (新智元)
今年這屆諾貝爾經濟學獎,來得實在太是時候了……
台北時間2025年10月13日,瑞典皇家科學院宣佈將諾貝爾經濟學獎授予三位傑出的經濟學家:美國西北大學的經濟史學家喬爾·莫基爾(Joel Mokyr),以及法蘭西學院的菲利普·阿吉翁(Philippe Aghion)和布朗大學的彼得·豪伊特(Peter Howitt),以表彰他們“對創新驅動的經濟增長的闡釋”。這次的頒獎,將經濟增長理論的兩個核心分支——宏大的歷史敘事與精密的數學模型——完美地結合在一起。在人工智慧浪潮席捲全球、地緣政治重塑產業格局的今天,重溫和深思三位巨擘的洞見,對於尋求高品質發展的中國而言,無疑是恰逢其時!01 熊彼特的幽靈要理解本次諾獎的意義,我們必須回到思想的源頭——約瑟夫·熊彼特(Joseph Schumpeter)。這位特立獨行的奧地利經濟學家,在一個世紀前就提出了“創造性破壞”(Creative Destruction)這一顛覆性概念。1942年,熊彼特寫下煌煌巨著《資本主義、社會主義與民主》,將資本主義描繪成一個“從內部不斷革命化經濟結構”的動態過程,即舊的被不斷摧毀,新的被不斷創造。熊彼特認為,經濟發展的真正動力並非源於價格的短期波動或市場的自我均衡,而是來自企業家引入的“新組合”——無論是新產品、新工藝、新市場,還是新的組織形式——這就是創新。這種創新過程如同“經年不息的狂風”,它摧毀了馬車伕的飯碗,卻創造了汽車工業的繁榮。熊彼特的理論極具洞察力,但在很長一段時間裡,它更像是一個生動的隱喻,而非一個可供分析的嚴謹理論。它提出了“是什麼”,卻沒有完全解答“為什麼”和“怎麼樣”。而這正是今年三位獲獎者的工作價值所在:莫基爾探尋創新得以持續的文化與制度根基;而阿吉翁和豪伊特則用精準的數學語言,建構了可計算的動力學模型。02 喬爾·莫基爾的歷史羅盤我們首先來看喬爾·莫基爾,作為一位傑出的經濟史學家,他主要研究工業革命前後的歐洲,試圖回答一個根本問題:為何持續的經濟增長在人類歷史的大部分時間裡是例外而非通則,卻在過去兩百年成為可能?莫基爾的核心洞見在於,他提出了“有用知識”(Useful Knowledge)的概念,並將其劃分為兩大類:1,命題性知識(Propositional Knowledge):即關於自然規律和現象的科學知識,回答“是什麼”和“為什麼”的問題。這類似於我們今天所說的基礎科學。2,指令性知識(Prescriptive Knowledge):即關於如何操作的技術、工藝和配方,回答“怎麼做”的問題。這類似於應用技術和工程訣竅。在莫基爾看來,工業革命前的創新大多依賴於工匠的經驗和試錯,即指令性知識的緩慢積累。然而,要實現持續的、自我驅動的增長,兩種知識必須形成正反饋循環。在工業革命時期,歐洲形成了一種獨特的“知識生態”:科學家、工程師、企業家和工匠之間的交流日益密切,科學原理被用來解釋和改進技術,而技術實踐中遇到的問題又反過來催生了新的科學探索。莫基爾的研究也證明,一個開放、寬容、鼓勵思想交流和質疑權威的社會文化,是創新之樹得以枝繁葉茂的土壤。制度保障(如專利法)和激勵機制固然重要,但更深層次的,是一種追求進步的信念和將知識轉化為生產力的文化。他的歷史分析為我們理解為何某些國家和地區能夠成為創新高地,而另一些則陷入停滯,提供了深刻的歷史鏡鑑。03 阿吉翁與豪伊特建構創新驅動的內生增長模型菲利普·阿吉翁和彼得·豪伊特的工作,則是對熊彼特思想最重要的一次現代化和形式化。在20世紀80年代中期之前,主流的經濟增長理論(如索洛模型)將技術進步視為一個“外生”變數——如同上帝的禮物,從模型外部給定,無法解釋其來源。這顯然無法令人滿意。而以保羅·羅默(Paul Romer)等為先驅的“內生增長理論”則試圖將技術進步的動力放到模型內部來解釋。阿吉翁和豪伊特在1992年發表的開創性論文,正是內生增長理論中“熊彼特學派”的奠基之作。他們建構了一個優美的數學模型,數學公式咱們就不放了,但是其核心思想如下:增長的引擎是“質量階梯”:經濟增長表現為產品或技術質量的不斷提升。創新來自逐利動機:企業投入研發,是為了創造出更高品質的產品來取代現有市場領導者,從而獲得暫時的壟斷利潤。創造與破壞並存:每一次成功的創新,都意味著對前一代技術和相應企業的“創造性破壞”。這種破壞是增長的必要代價。政策與制度至關重要:模型的增長率並非天定,而是受到專利保護強度、市場競爭程度、教育水平和金融市場效率等一系列可由政策影響的因素決定。阿吉翁和豪伊特及其後續研究,為我們提供了許多極具啟發性的政策洞見。其中最著名的莫過於競爭與創新的“倒U型關係”。他們的理論和實證研究表明,完全壟斷或過度激烈的競爭都不利於創新。在競爭不足時,領先企業缺乏“逃離競爭”的動力去創新;而在競爭過於激烈時,創新成功後的利潤又太低,無法覆蓋研發成本,從而削弱了創新激勵。因此,維持一個適度的競爭環境,是激發創新的關鍵所在。他們的框架將熊彼特的思想從一個哲學洞見,轉變為一個強大的分析工具箱,讓政策制定者可以具體地探討如何通過制度設計來培育一個持續創新的經濟體。04 駕馭破壞性創新三位諾獎得主的理論之所以在今天顯得尤為重要,是因為我們正處在一個“創造性破壞”空前加速的時代。人工智慧,特別是生成式AI,無疑是當下最典型的創造性破壞力量。它正在自動化許多認知性工作,對內容創作、軟體程式設計、客戶服務等行業造成巨大衝擊。根據麥肯錫的報告,到2030年,全球多達30%的工作小時可能會被自動化。然而,正如歷史所揭示的,技術在摧毀舊崗位的同時,也在創造全新的崗位和產業。阿吉翁等人的框架提醒我們,應對AI衝擊的關鍵,不在於阻止破壞的發生,而在於如何通過教育改革、終身學習體系和靈活的勞動力市場政策,幫助勞動者適應轉型,並抓住AI帶來的新機遇。此外,在全球地緣政治格局下,技術競爭成為大國博弈的核心。莫基爾的理論強調了開放交流對於“有用知識”傳播的重要性,這對於當前一些逆全球化和“脫鉤”的思潮提出了警示。而阿吉翁-豪伊特的模型則為理解不同國家的創新模式提供了視角。例如,他們區分了兩種創新模式:一種是模仿和改進(接近技術前沿的國家),另一種是前沿創新。這兩種模式需要不同的制度安排和政策支援(即“適配性增長政策”)。這對於思考中國如何在堅持開放合作的同時,建構自主可控的創新體系,具有深刻的啟示。值得注意的是,“創造性破壞”的過程是痛苦的。技術變革會加劇收入不平等,因為創新的收益往往不成比例地流向資本所有者和高技能勞動者,而被替代的勞動者則可能面臨失業和收入下降的困境。這也正是當前許多社會矛盾的根源所在。三位獲獎者的工作同樣也涉及到了這一部分,他們的理論框架強調,一個成功的創新驅動型經濟體,必須輔之以強大的社會安全網和包容性政策。這包括:對人的投資:大力發展教育和職業再培訓體系,提升勞動力的適應能力。健全的保障體系:提供失業保險、社會救助等,為在轉型中受損的群體提供緩衝。競爭與監管的平衡:實施有效的反壟斷政策,防止創新巨頭扼殺新的競爭,同時確保創新成果能夠以更低的價格惠及消費者。2025年的諾貝爾經濟學獎,是對“創新”經濟學的又一次致敬。喬爾·莫基爾以其深邃的歷史眼光,為我們展示了創新得以生根發芽的土壤;菲利普·阿吉翁和彼得·豪伊特則用精巧的數學模型,揭示了創新之樹開花結果的內在機制。他們的工作共同描繪了人類社會如何通過一場持續的“創造性破壞”,掙脫了千年的停滯,走向了今天的繁榮。正如諾獎委員會主席所言:“獲獎者的工作表明,經濟增長不能被視為理所當然。我們必須維護創造性破壞背後的機制,這樣才不會再次陷入停滯。”理解並善用“創造性破壞”這股力量,在鼓勵顛覆性創新的同時,最大限度地緩衝其社會衝擊,將是我們這個時代最重要的課題。您覺得呢? (TOP創新區研究院)