#寫論文 | 熱門關鍵字 | 鉅亨號

【新智元導讀】剛剛，Nature蓋章AI獨立科研時代！全新Scaling Law顯現，人類死守的學術鐵王座，正發生不可逆的轉移。一篇長達數十頁的學術論文，在人類設定研究主題和實驗邊界後，系統自動完成了從實驗到寫作的大部分流程。從論文正文、實驗程式碼、圖表和投稿稿件，主要由系統端到端自動生成。它被投遞到頂尖機器學習會議ICLR 2025某workshop的同行評審流程中，三位匿名審稿人不知道具體那幾篇是AI生成稿件，他們對著這篇稿件分別打出了6、7、6的高分。這個成績，高於約55%的同場投稿。稿件在評審完成後按實驗協議撤回，未進入正式發表階段。這並非科幻，這是剛剛被《Nature》報導的一項震撼研究。該項研究是由Sakana AI聯合牛津大學、UBC共同推出的全自動AI科學家「The AI Scientist」。Sakana AI聯合創始人兼 CEO David Ha在推文中表示，啟動該項目，正是想探索大模型是否能夠完成整個科研全流程：我堅信，AI將永遠改變科學發現和科研進步的方式。全自動「AI科學家」究竟做了什麼？這一次，不是AI在「幫」人幹活，而是AI第一次把科研流程從頭走到尾。一直以來，AI在科研領域的定位都是「高級打工人」：比如幫化學家折疊蛋白質，或是幫程式設計師找bug。定義問題和統籌全域的，始終是人類。The AI Scientist的出現，則顛覆了這套「主僕敘事」，它完整覆蓋了科研的四大核心階段：Idea生成、實驗迭代、論文寫作、自動評審。在全新升級的v2版本中，它甚至走向了「無範本」模式：徹底拋棄人類提供的初始程式碼腳手架，引入了強大的「智能體樹搜尋」（agentic tree search）機制。這意味著它能在龐大的未知解空間裡，同時開啟多條主線平行探索。科研不再是單線程試錯，而變成了一個可擴展的搜尋過程。它怎麼保證自己不和別人撞車？系統會呼叫Semantic Scholar API進行全網查重，確保每一個idea都具備足夠的新穎性。在最棘手的資料可視化環節，它甚至內建了一個視覺語言模型（VLM）作為反饋審閱者。如果坐標軸反了、圖例丟了、展示有歧義，VLM會像嚴苛的導師一樣立刻打回重做，直到生成完美的學術圖表。過去圖表只是論文包裝，現在圖表也成了AI科研的反饋訊號。而完成這堪比博士生幾個月工作量的閉環，它的帳單是：單篇論文15美元。如此驚人的性價比意味著，科研自動化第一次從「局部輔助」跨進了「全鏈路主導」。AI不再只是科學家的輔助工具，而是向更具自主性的科研代理系統演進。AI Scientist工作流程的概念概述，包括提出研究想法、實施實驗、執行實驗、撰寫論文以及審閱論文。通過人類同行評審測試AI寫的論文，人類學術金字塔尖的學者到底認不認？於是，Sakana AI決定玩一把大的：直接向頂會投稿。在獲得ICLR大會領導層、ICBINB workshop組織者以及IRB倫理委員會的特批後，團隊進行了一場極其大膽的「潛伏行動」：將3篇純AI生成的論文混入了人類投稿池。審稿人只被告知「可能有AI生成論文」，但根本不知道具體是那幾篇。結果其中一篇探索神經網路組合正則化（Compositional Regularization）負面結果的論文，斬獲了平均6.33分（弱接收、接收、弱接收）的高分。這個分數不僅穩穩越過了該workshop的平均錄用線，更是超過了55%的真實人類學者。連科學研究中最難寫出彩的負向論證，AI也能寫得有模有樣、邏輯自洽。據Sakana AI團隊所稱，這是全AI生成論文首次在真實學術評審環境中獲得通過接收線的成績。這也標誌著同行評審，真正迎來了「圖靈測試」時刻。AI審稿人比人類更靠譜？如果AI一天能花幾百美元寫出幾十篇論文，人類審稿系統瞬間就會崩潰。想讓AI科研實現指數級爆發，就必須有能夠大規模評估質量的「自動化裁判」。Sakana AI給出的答案是：直接讓AI來當Area Chair（領域主席）。他們建構了一個高度還原NeurIPS官方審稿流程的自動化系統：5個獨立的AI審稿人進行背靠背挑刺，最後由1個AI元審稿人進行共識彙總和最終裁決。在與數千條真實OpenReview人類審稿決策的硬碰硬對比中，自動化審稿人交出了69%的平衡精準率。令人震驚的是，在作者設定的評測框架下，自動審稿系統的部分指標優於所對照的人類一致性結果。有人質疑：AI是不是偷偷背過題？團隊特意用知識截止日期（2025年）之後的全新論文進行了資料污染測試。結果依然堅挺：平衡精準率保持在66%，達到可與人類頂級學者比肩的實戰水準。這表明，AI正在進入過去長期由人類主導的科研流程核心環節。過去，人類同時壟斷了「寫論文的人」和「決定論文是否成立」這兩個關鍵角色。現在，這兩個角色都在被AI切入。一旦評審環節也被自動化，AI科研就不再是零星爆款，而具備了大規模、左右互搏式迭代的基礎設施。該自動審稿系統在頂級會議（ICLR）發表的AI論文上，其審稿判斷與人類審稿人一致，包括在模型訓練完成之後（即超出其「知識截止日期」）發表的論文。這些結果表明，該自動審稿系統在為新撰寫的AI論文提供評審分數方面，可靠性與人類審稿人相當。科研的Scaling Law如果說「過審」證明了AI科研站得住，那真正決定未來天花板的是另一件事：它是不是可持續變強？Nature論文中最具顛覆性的一組資料，揭示了潛藏在AI科研背後的全新定律。研究發現，底層大模型的能力與生成論文的質量之間，呈現出令人頭皮發麻的極度顯著正相關（P<0.00001）。隨著模型發佈日期推進，AI產出的論文質量持續陡峭上升。同時，算力正在暴力改寫科研法則。投入的測試時算力越多，智能體樹搜尋的深度就越深，實驗質量就越紮實，最終的產出評級就越高。當前最頂配的AI科學家，其平均產出已經逼近機器學習頂會workshop的邊緣錄用（borderline accept）水平。這背後展示的是一條正在形成的「科研Scaling Law」。過去的科技突破，依賴於虛無縹緲的靈光乍現，而未來的科學發現，將變成一條可精確計算的工業流水線。隨著模型能力呈指數級增長、推理算力成本呈指數級下降，這套系統會自動升級，這才是這項工作真正展現出恐怖勢能。根據自動評審員的評判，當使用更新、更智能的基礎模型時，AI Scientist生成的論文質量會提高。AI全面接管科研我們準備好了嗎？當然，這篇Nature論文，同樣也指出了The AI Scientist的目前的侷限性：它偶爾會想出幼稚的idea，寫的程式碼會有bug，論文裡會出現引用的幻覺，甚至在附錄裡重複貼上同一張圖表。值得警惕的是，論文顯示該系統具備自動偵錯、重試運行和在受限計算預算下持續迭代實驗的能力。這意味著，未來更強的科研代理一旦出現規避約束的傾向，可能帶來新的安全治理問題。如果這種系統被毫無節制地釋放，海量生成的低門檻論文會瞬間壓垮整個學術生態，學者的學術 credentials（資歷證明）將被徹底稀釋。正因如此，Sakana AI採取了極其克制的立場：主動撤稿、通過IRB審批、呼籲加入生成水印，並急迫要求社區建立全自動AI科研規範。這篇Nature論文不只是展示AI技術的里程碑，更是把AI所帶來的倫理爭議也擺上檯面。真正的問題早已不是「AI能不能做科研」，而是「當AI開始獨立做科學，誰來定義什麼算科學」。正如團隊所設想的終極願景：AI科學家不會讓人類科學家消失，但人類科學家的角色，必須被迫向著科研價值鏈的更上游遷徙：去定義問題、設定邊界、決定那些發現值得被相信。 (新智元)

科技

2026/01/28

•

OpenAI凌晨放大招，免費Prism顛覆科研！從摘要到致謝，GPT-5.2包圓

【新智元導讀】科研工具幾十年未變的僵局終被打破，OpenAI攜GPT-5.2強勢入局，用免費的Prism告訴世界：未來的科學研究，不需要在碎片化的舊工具中浪費生命！昨天一場QA局後，奧特曼終於扔出了王炸。深夜，OpenAI正式祭出新一代科研利器——Prism，由GPT-5.2加持，專為寫作和協作而生。它是一個基於雲的「AI原生」LaTeX工作區，不限項目和協作的人數。最方便的是，GPT-5.2內嵌在項目中——它能看到你整篇論文的結構、公式、參考文獻，還有上下文，科研需要時隨叫隨到。這麼說吧，它就是科研黨、學生黨的研究利器。把論文潤色交給Prism，它能從第一行摘要開始全程絲滑代勞，人類只需扮演那個不斷點「繼續」的稽核機器。它還直接可以把上傳的白板圖，一鍵轉化成TikZ圖，並插入游標所在的位置。Prism還可以管理參考文獻，彙總所有和論文相關的研究。甚至就連最後一步稽核，AI也全包了。這不，OpenAI團隊還即興創作了一篇介紹Prism的論文。Prism的發佈，或許是OpenAI想要在科研領域重點發力的一步棋。AI大佬點評，「未來和Prism一起科研，每篇論文都將出現一個ChatGPT合著者」。一夜之間，OpenAI殺死了寫論文高效神器Overleaf。從今天起，任何擁有ChatGPT個人帳號的使用者，全部都可以免費用。很快，Prism也將面向ChatGPT Business、Enterprise和Education開放。Prism終結科研工具論文一句話搞定在過去的一年裡，AI開始加速各領域的科研工作。像GPT-5這樣先進的推理系統，正在拓展數學的邊界，加速人類免疫細胞的實驗分析，甚至加快了分子生物學的迭代速度。然而，現實是骨感的。許多科研的日常工作，比如起草論文、修改論點、管理公式和引用，以及與協作者溝通等等，依然割裂在各種不互通的工具裡。研究人員不得不在編輯器、PDF 閱讀器、LaTeX編譯器、文獻管理軟體和獨立的聊天軟體之間反覆橫跳。這不僅丟失了上下文語境，更無情地打斷了寶貴的專注力。Prism，就是OpenAI為解決這種「碎片化」痛點邁出的第一步。GPT-5.2加持，重塑科研工作流具體來說，它基於OpenAI收購的一個雲端LaTeX平台Crixet建構。借助最先進的數學與科學推理模型GPT-5.2，OpenAI將起草、修改、協作和出版準備整合進了一個單一的、基於雲端的LaTeX原生工作區。由此，GPT-5.2不再是游離於寫作過程之外的獨立工具，而是直接深入項目內部工作流——它能讀取論文結構、公式、引用以及周圍的上下文語境。這讓OpenAI能夠在一個成熟、強大的寫作環境中，以一種最自然契合科研工作流的方式整合AI。使用Prism，研究人員可以獲得以下超能力：與GPT-5.2 Thinking對話：在當前語境下探索思路、驗證假設，並對複雜的科學問題進行推理。全域語境下的起草與修改：AI能結合整篇文件（包括周圍的文字、公式、引文、圖表和整體結構）來輔助寫作和修改。智能文獻搜尋與整合：結合當前手稿的內容搜尋相關文獻（例如arXiv），並根據新發現的相關工作自動建議修改文字。智能處理公式與圖表：建立、重構並推理公式、引用及圖表，AI能夠理解這些元素在論文中是如何相互關聯的。草圖秒變LaTeX：將白板上的公式或圖示直接轉換為LaTeX程式碼，省去數小時逐像素調整圖片的繁瑣工作。無縫即時協作：與共同作者、學生和導師即時協作，任何編輯、評論和修訂都會即時同步。文件內直接修改：根據指令直接對文件進行修改，徹底告別在獨立編輯器和聊天工具之間來回覆制貼上。語音編輯：支援語音功能進行簡單的修改，無需中斷寫作或審閱流程。不限人數，0門檻共寫論文科學研究的本質是協作。一篇論文的誕生，往往凝聚了共同作者、學生、導師和審稿人的心血，跨越了機構和地域的限制。Prism支援無限協作者，允許研究團隊共同工作，沒有任何席位限制或訪問門檻。由於它是基於雲端的，使用者無需在本地配置LaTeX環境，這讓團隊協作變得前所未有的輕鬆。通過減少版本衝突、手動合併和機械性的重複勞動，Prism讓團隊從繁瑣的檔案管理中解脫出來，將精力回歸到研究本身。全免費，人手一個科研利器Prism的另一個核心使命是降低門檻，普及科學工具的使用。Prism是完全免費的。任何擁有ChatGPT帳號的人都可以立即開始寫作，沒有訂閱費用，沒有席位限制。OpenAI希望通過讓高品質的科學工具觸手可及，讓無論身處那個機構、學科或職業階段的研究人員，都能充分參與到科學處理程序中來。未來，更強大的AI高級功能將通過ChatGPT的付費計畫逐步推出。為什麼現在推出？2025年，AI徹底改變了軟體開發。2026年，科學領域也會迎來同樣的變革。AI將在多個維度實質性地加速科學發現，而減少日常科研工作中的阻力正是關鍵一環。Prism正是通向那個未來的先行者。OpenAI期待向每一位使用Prism的研究人員學習，共同打造能讓科學極速前行的工具。讓我們共同努力，迎接科學的新時代。 (新智元)

科技

2025/11/16

•

AI 能寫詩能寫論文，卻連杯子轉 90 度都猜不對？“AI教母”李飛飛道破真相

AI 能寫詩、寫論文，卻連杯子轉 90 度啥樣都猜不對？！最近矽谷被一篇萬字長文炸翻了，作者是華人 AI 圈的傳奇 —— 李飛飛，圈內人都喊她 “AI 教母”。她在文章裡直接開炮：現在的 AI 看著能說會道，其實全是 “睜眼說瞎話”！嘿，朋友，你是不是也覺得 AI 特別牛？寫文案、做總結、甚至模仿名人說話，樣樣都行。可李飛飛這話一出來，好多人都懵了：AI 明明這麼厲害，怎麼會是 “睜眼瞎”？咱們拿實際情況說說。讓 AI 寫首詩，它分分鐘模仿李白杜甫的調調，辭藻華麗得沒話說。可你要是讓它估估你家桌子到門的距離，或者猜猜杯子旋轉 90 度會變成啥樣，它就徹底露餡了，全靠瞎蒙。那些刷到的炫酷 AI 視訊，你仔細看全是破綻：視訊裡的人突然多了根手指，小物件毫無徵兆就穿牆而過，完全不符合咱們現實裡的規矩。李飛飛說，這不是 AI 不夠努力，而是咱們給它指錯了方向。AI 的未來，不在於搞更大的語言模型，而在於擁有一種連小嬰兒都有的能力 —— 空間智能。這可是通往真正通用人工智慧的唯一路徑。那到底啥是空間智能呢？其實就是咱們理解和互動物理世界的本能。小嬰兒靠抓東西、扔東西、咬東西認識世界；你半夜起床倒水，不用開燈也能摸準杯子的位置；朋友扔鑰匙給你，你不用算什麼拋物線，伸手就能接住。歷史上好多改變文明處理程序的重大發現，也離不開這種能力。有人通過觀察影子的長度，就算出了地球的周長；還有科學家通過搭建 3D 模型，發現了 DNA 的雙螺旋結構。這些事兒，光靠只會讀寫的語言模型，永遠也做不到。李飛飛給出的解決方案很明確：讓 AI 從 “語言模型” 轉向 “世界模型”。一個真正靠譜的世界模型，得具備三種核心能力：✅ 能生成符合物理定律的虛擬世界，裡面的一切都得按現實規矩來；✅ 能理解和整合文字、圖像、動作等多種指令，不光能聽懂你說的話，還能看懂你做的事；✅ 最關鍵的，能精準預測互動結果 —— 簡單說，就是讓 AI 真真正正 “看懂” 這個世界。這可比訓練語言模型難多了。語言是一維的，就像一條直線；而世界是四維的，包含三維空間和時間，還得遵守無數物理定律。要是 AI 真的擁有了空間智能，那日子可就太有意思了！李飛飛團隊已經開發出了相關模型，現在電影製作人、遊戲設計師，只用口頭描述，就能生成可互動的 3D 世界。以後人人都能當 “造物主”，不用學複雜的 3D 軟體，也能實現自己的創意。機器人也不會再笨手笨腳了。它們能在模擬環境中學會成千上萬種技能，走進家庭幫著做家務，走進醫院協助醫生，成為咱們的得力助手。最讓人期待的是科學與教育的加速發展。學生可以 “走進” 古羅馬的街道，或者鑽進細胞內部，直觀感受知識；醫生能在 AI 的輔助下，更快發現疾病；科學家還能模擬深海、外太空這些人類難以抵達的地方，探索更多未知。李飛飛說得特別好：AI 的終極目標不是取代人類，而是為人類賦能。現在的大語言模型，只是 AI 發展的一個開始。真正的智能，是讓機器理解我們生活的物理世界。最後想問問大家：如果 AI 真的掌握了空間智能，你最想讓它幫你造一個什麼樣的世界？快來評論區聊聊你的奇思妙想吧！ (前程有鵬友)

科技