GoogleGemini殺入科學界！一日兩登Nature，AlphaFold只是開胃菜

2026/05/24

•

【新智元導讀】Google把科學研究的三個核心瓶頸：假設生成、計算發現、文獻洞察拆解為三個可由AI深度輔助的模組，並同日發表兩篇Nature論文，為假設生成和計算發現兩大環節提供支撐。

5月19日，在Google I/O的窗口期，Nature同日上線兩篇論文。

一篇介紹ERA（Empirical Research Assistance，經驗性研究助手），這是一套由大模型加樹搜尋驅動的系統，目標是讓AI自動寫出用於計算實驗的專家級科學軟體。

另一篇介紹Co-Scientist（AI 合作科學家），這是一套多智能體架構，讓AI持續生成、批判、細化科研假設，隨測試時計算量擴展，假設質量持續提升。

兩篇論文的發佈方均是Google。發佈的時間點，也選在了Google官方宣佈「Gemini for Science」工具集上線的同一天。

兩篇論文同日登上Nature，與Gemini for Science工具集的發佈同一時刻落地，釋放出這樣一個訊號：Google是在用同行評審為整套工具鏈做信用背書。

這是AlphaFold之後，Google在科學領域推出的又一項重磅成果。

一日兩篇Nature

Gemini接管兩段科研流水線

緊跟在兩篇論文後面的，是一份100多家機構的名單。

Google官方稱，已與100多家機構合作驗證新系統和工具，包括史丹佛大學、帝國理工學院、Crick Institute（克里克研究所）、ICML、STOC、NeurIPS、美國國家實驗室等。

同時還建立了由博士生、產業研究員和諾獎得主等組成的「可信測試者」社區，並與 ICML、STOC、NeurIPS等會議試點同行評審輔助工具。

Google在推出AI工作台的同時，還發出兩篇Nature論文，為整套工具鏈做信用背書。

先看ERA論文。

ERA的定位是經驗性研究助手，主要任務是替科學家寫出專家水準的實驗軟體。它的底層是大語言模型加樹搜尋，目標是把一個質量指標拉到最高。

這套系統在Nature論文裡交出了一份亮眼的成績單：

生物資訊學方向，ERA獨立發現了40種新的單細胞資料分析方法，在公開榜單上跑贏所有人類提交的方法。

流行病學方向，ERA在傳染病住院數預測任務上產出14個獨立模型，全部超過CDC的整合模型。

此外還覆蓋地理空間分析、斑馬魚神經活動預測、數值積分，這些都是Nature論文裡可復現的實驗。

ERA論文中寫道，這套系統不只是會跑程式碼，它能把外部的研究思路吸進來，組合出專家水準的解法。

再看Co-Scientist。

Co-Scientist是基於Gemini的多智能體系統，核心機制是「點子錦標賽」（idea tournament）。

多個智能體之間不斷生成、辯論、批判、細化假設，再用測試時計算擴展（test-time compute scaling）持續提升假設質量。

論文重點驗證了三個生物醫學場景：藥物再利用、新靶點發現、抗微生物耐藥機制解釋。

其中急性髓系白血病（AML）的藥物再利用候選和協同組合療法，已經在體外實驗中得到驗證，驗證方包括史丹佛醫學院的研究者。

兩篇論文都瞄準了科研最耗時的兩個環節，一個是寫計算實驗軟體環節，另一個是生成可驗證的科研假設環節。

三個Labs原型

把科學方法拆成三段

除了Nature論文之外，這次Google還同步開放了三個Labs實驗原型，對應科學方法的三個核心環節。

第一個是Hypothesis Generation（假設生成），底層是Co-Scientist，有Nature論文支撐。

多個智能體之間通過點子錦標賽生成假設，每一條主張都附帶可點選的citation（引用溯源）。

Co-Scientist多智能體系統的工作循環：生成、辯論、進化假設三個階段，由Generation、Reflection、Ranking、Evolution、Meta-review、Proximity、Supervisor等多個專門智能體協作完成

Co-Scientist「點子錦標賽」機制運行示意。智能體之間基於Elo評分系統對假設進行迭代排序，過程中持續注入新知識，擴大假設空間的探索範圍

第二個是Computational Discovery（計算發現）。

底層是AlphaEvolve加ERA，ERA論文剛登上Nature，AlphaEvolve則有Google DeepMind自家獨立背書。

這套引擎平行生成數千個程式碼變體，每個變體自動評分，讓原本要靠人工耗時數月摸索的複雜建模路徑被壓縮到機器搜尋的範圍裡。太陽能預測和流行病學是Google官方點名的兩個場景。

第三個是Literature Insights（文獻洞察）。

底層是NotebookLM，目前沒有Nature背書，定位是早期預覽。功能上把文獻結構化成可搜尋的屬性表格，能直接產出報告、幻燈片、資訊圖、音視訊概覽。

除了工作台之外，Google還發佈了一套Science Skills，整合了30多個生命科學資料庫和工具，包括UniProt、AlphaFold Database、AlphaGenome API、InterPro等。

這套Skills跑在類似Google Antigravity這種智能體平台上，可以把過去要在十幾個資料庫之間來回跳的結構生物資訊學和基因組分析流程，拼成一個鏈路。

Google研究團隊的早期測試裡，Science Skills在AK2基因相關的罕見遺傳病分析中產出了關於潛在機制的新洞察。一項本來要數小時的複雜分析，被壓到分鐘級。

Google Antigravity在Science Skills加持下分析AK2基因變體的實際操作畫面，整個工作流用自然語言指令在分鐘級完成

百年化工巨頭多次失敗的問題

這樣解決了

除了兩篇Nature論文背書之外，Google還甩出了另一張牌：BASF農業解決方案。

BASF面對的問題足夠複雜：180個生產基地、5000多條價值鏈，單一產品的物料清單有時深達30層，橫跨不同生產地點和區域。

人類規劃員每天要做數千個本地決策，但沒有人能即時看清局部決策如何影響整張全球供應鏈網路。

BASF高級供應鏈副總裁Goetz Krabbe說道，「此前我們多次嘗試用確定性模型建數字孿生，均告失敗。」

Google的目標並非讓AI取代人類決策，而是建立一套決策支援體系。

他們給AlphaEvolve輸入了一段「種子程序」，作為基礎規劃邏輯，再喂入三年歷史資料，包括庫存水平、市場需求和實際產出記錄。AlphaEvolve開始生成程式碼變體，自動發現供應鏈運作的內在規律。

最終，AlphaEvolve自動提煉出了三條在傳統建模中需要領域專家手工編碼的規則：

生產整合（如何把小批次生產合併以最佳化產線時間）；動態安全庫存（如何用參數處理季節性波動）；網路級協調（如何對應不同生產層級之間的依賴關係）。

相比最初的種子模型，最新一輪AlphaEvolve的運行結果在精準率上實現了超過80%的相對提升。

BASF下一步要用這套數字孿生覆蓋整個全球生產網路，作為情景預測和最佳化的基礎。

據Google官方稱，Daiichi Sankyo、Bayer Crop Science和美國能源部旗下的國家實驗室（Genesis Mission項目）也已接入Co-Scientist。瑞典金融科技公司Klarna則用AlphaEvolve把一個大型Transformer模型的訓練速度提升了一倍，同時改善了模型質量。

爭奪「可信驗證」的入場券

Nature論文，只是Google在「AI for Science」整套佈局裡搶佔信用制高點的一個重磅動作，目的是給工具鏈增加一層科學社區背書，讓研究者面對系統時有一個「這經過同行評審」的心理錨點。

Google目前公開的合作機構已經超過100家，覆蓋史丹佛大學（肝纖維化方向）、Imperial College London（抗菌素耐藥性方向）、Crick Institute（多年合作項目）。

可信測試者從博士生一路覆蓋到諾貝爾獎得主，每個人都在真實科研場景中給系統找漏洞。

更值得關注的是Google正在推進的一件相關事件：與ICML、STOC、NeurIPS等頂級學術會議合作，開發智能體同行評審工具PAT（Paper Assistant Tool，論文助手工具）和ScholarPeer。

這意味著科學可信度基礎設施，正在成為新的競爭場地：誰的AI建議能被引用，誰的假設經得起審計，誰的系統能被頂級期刊工作流接入，誰就能在未來的科研生態裡紮根。

OpenAI 4月推了GPT-Rosalind，主打生物學、藥物研發和轉化醫學的前沿推理。

Anthropic把Claude for Life Sciences接入AWS Marketplace，對接Databricks和Snowflake做大規模生物資訊學分析。

Google這次壓上了Nature論文、100多家機構、ERA和Co-Scientist。

三家公司都把「科學」單獨拆出來做成了產品線。接下來競爭的，將是那個平台的工具鏈能成為科學家信賴並依賴的首選。 (新智元)