#DeepMind
Google掀桌:深度研究智能體進入自動駕駛時代
OpenAI剛用Deep Research搶了先手,Google直接掀桌!DeepMind祭出研究智能體雙殺,Max版質量評分從66.1%暴拉到93.3%,知識工作自動化的軍備競賽正式進入貼身肉搏。在AI智能體上,Google這次又放出了個大招。4月末,GoogleDeepMind一口氣甩出兩款AI研究智能體。Deep Research(標準版):追求速度和低延遲,適合即時互動Deep Research Max(增強版):追求最大詳盡度,用擴展test-timecompute非同步跑後台大任務兩個智能體都基於剛發佈的Gemini 3.1 Pro。GoogleCEO Pichai也親自下場站台。Max版在三個權威基準測試中都拿到了SOTA得分:DeepSearchQA:93.3%,綜合網頁研究能力BrowseComp:85.9%,在網頁上定位難找事實Humanity's Last Exam(HLE):54.6%,人類最難學科專家級題庫這兩個智能體干的事情很直白:你給一個研究課題,它自己去網上扒資料、分析資料、生成帶圖表的完整報告。標準版處理日常研究任務,Max版專攻重度場景:盡職調查、競品分析、市場研報,那種過去要一個分析師團隊干兩天的活。Max版在DeepSearchQA基準上達到93.3%。什麼概念?去年12月同一項測試,成績是66.1%。四個月,漲了27個百分點!Humanity's Last Exam上也從46.4%拉到54.6%,直接刷新紀錄。有使用者表示日常版本的標準版即可代替日常的文獻研讀。知識工作的自動駕駛時代一個值得玩味的趨勢正在成型:AI研究工具正在從「輔助搜尋」進化成「自主研究」。過去的AI搜尋是你問一句、它答一段。現在的研究智能體是你丟一個課題,它自己跑幾十輪搜尋-分析-驗證循環,最後交一份成品報告。區別就像導航軟體和自動駕駛的距離。Google、OpenAI、Anthropic三家同時押注這個方向。Anthropic的Claude在程式碼智能體上猛攻,OpenAI用Deep Research搶佔研究場景,Google現在帶著93.3%的成績單殺回來。Pichai親自在發佈會上強調93.3%這個數字。他說這是通過增加計算資源達到的。意味著,只需花更多的電,就能得到更準的答案。計算資源成了新的入場券。小公司買不起。獨立顧問付不起。只有大企業才付得起。這不是工具升級。這是商業模式的代際替換。從「摘要機器」升級成企業工作流底座去年12月,Google通過Interactions API向開發者開放了Gemini Deep Research智能體,讓開發者能用上Google最前沿的自主研究能力。今天,Google把它推到下一個台階。Deep Research和Deep Research Max兩款智能體都由Google最強的模型Gemini 3.1 Pro驅動。Deep Research已經不再是一個聰明的「摘要機器」了。它現在是金融、生命科學、市場調研等企業級工作流的底層基礎設施。它的報告本身有獨立價值,但更重要的是——它是更複雜的AI智能體工作流的第一步:深度上下文收集。一次API呼叫,開發者就能觸發一次徹底的研究工作流——史上第一次,把公開網頁資料和你自己的專有資料流融合在一起,輸出一份專業級的、帶完整引用的分析報告。兩款智能體,匹配不同場景Google設計了兩款智能體,對應從直接面向使用者到大規模離線處理的不同需求。Deep Research(標準版)為速度和效率而生。它取代了去年12月的預覽版本,顯著降低了延遲和成本,同時把質量拉得更高。適用場景:需要低延遲的互動式使用者介面。Deep Research Max(增強版)為最大詳盡度和最高品質而生。Max利用擴展的test-timecompute(測試時計算),反覆推理、檢索、精煉最終報告。打通私有資料+原生圖表Deep Research現在可以檢索:公開網頁任意遠端MCP伺服器使用者上傳的檔案連接的檔案儲存或以上任意子集的組合。這套能力是專門為專業人士每天面對的複雜受限資料宇宙設計的。MCP協議支援(最關鍵的一項)你可以通過MCP協議,把Deep Research安全地連接到你自訂的資料和專業資料流——比如金融資料供應商、市場資料供應商。Deep Research支援任意工具定義。這讓它從一個網頁檢索器升級成了能在任意專業資料倉儲裡自主導航的智能智能體。過去分析師吃飯的傢伙(彭博、FactSet、S&PGlobal終端),現在AI可以直接接入、自主查詢、綜合分析。原生圖表與資訊圖Gemini API裡的Deep Research第一次——不再只生成文字,還原生生成高品質的圖表和資訊圖。底層實現用HTML或Nano Banana。動態可視化複雜資料集,直接嵌入分析報告中。過去一個分析師用Tableau/PowerPoint做2小時的圖表,Deep Research Max直接在報告裡原生生成。不用切換工具,不用再折騰對齊。重磅合作夥伴為了讓這項技術在低容錯率的專業領域真正落地,Google正在和金融、生命科學等行業的初創公司和企業密切合作。比如——Google正在與以下三家公司合作設計MCP伺服器:FactSet(華爾街分析師標配終端)S&PGlobal(標普全球評級與資料)PitchBook(私募股權與風險投資資料庫)讓共享客戶可以把金融資料接入Deep Research驅動的工作流,以閃電般的速度調取這些公司各自的海量資料宇宙,實現生產力的階躍式提升。延伸解讀:FactSet+S&P+PitchBook=全球投行、PE、諮詢公司研究素材的三大上游供應商。它們主動把自己的資料接入Google的AI——意味著分析師過去賴以生存的資料訂閱護城河徹底消失。過去你因為能用上這些資料而值錢,現在任何一個企業訂閱了Deep Research都能用上。如何使用即日起,Deep Research和Deep Research Max在Gemini API付費層開啟公開預覽。開發者可以訪問Google官方開發者文件,通過Interactions API開始建構。Deep Research和Deep Research Max很快也會通過GoogleCloud開放給初創公司和企業。Google做好了一個能替代分析師的AI,現在所有企業都可以用API呼叫它。 (新智元)
Fortune雜誌─DeepMind首席執行長認為,矽谷並非獨攬AI人才的寶地
德米斯·哈薩比斯回憶說,6歲那年,父親曾對他說過一句全世界無數父母都會使用的鼓勵話語——“盡力而為”。但對這個從小就展現出非凡天賦、後來成為全球最重要的人工智慧領軍人物之一的孩子來說,這四個字在他眼中演化出無限可能。2026年2月19日,印度新德里,Google DeepMind首席執行長德米斯·哈薩比斯出席AI Impact峰會。圖片來源:Prakash Singh—Bloomberg/Getty Images他表示:“我這個人有點極端。我會用一種極端且理性的方式去理解這句話。我當時在想:‘怎麼樣才算盡力?我怎麼知道自己已經盡力了?是不是意味著要拼到精疲力竭、直至瀕臨生理極限,才算盡了全力?這不是很符合邏輯嗎?’”哈薩比斯在倫敦出席由Intelligence Squared舉辦的活動上發表了這番言論(有人調侃他的名字可以叫“智慧立方”)。與他同台的是作家塞巴斯蒂安·馬拉比,他剛剛出版了哈薩比斯的傳記《無限機器》(The Infinity Machine)。在被問到為什麼選擇在當時出書時,馬拉比表示:“AI是當今世界最引人注目的變革,而德米斯·哈薩比斯則是這場變革中最值得關注的人物。”“拼盡全力”,那怕耗盡心血,一直是哈薩比斯的人生信條。今年2月在接受《財富》雜誌採訪時,這位Google DeepMind和Isomorphic Labs的聯合創始人透露,他的工作日實際上分成兩段:一段是大多數人熟悉的白天工作時間,另一段則是晚上10點到凌晨4點,用來推進“副線項目”和其他創意靈感。他表示:“我把下棋時的訓練方式(哈薩比斯13歲時就已達到國際象棋大師水平)用在了生活當中。我會非常有條理地從目標反推,拆解成一個個子目標。我覺得這種方法在生活中同樣適用,至少我是這麼做的,而且效果顯著。”不過,他並未選擇全球AI創新聖地矽谷,而是紮根倫敦,這也讓不少人感到意外。畢竟,DeepMind在2014年被Google(Google)收購後,搬到加州山景城似乎是順理成章的下一步。但哈薩比斯不以為然。他認為,如果要更好地平衡AI發展帶來的風險與機遇,全球絕不能只有一個“思想中心”。他表示:“我骨子裡多少有點不服輸。我希望證明我對英國的熱愛,倫敦和英國同樣具備成功潛力。但核心原因在於:我知道這裡有人才。”“我當時就判斷,在DeepMind起步的前四五年關鍵期裡,我們在這個領域幾乎沒有競爭對手。英國擁有大量優秀人才,但他們在美國卻是被忽視的一群人。”“隨著DeepMind以及這裡其他幾家公司陸續取得成功,事實證明,‘深科技’完全可以在矽谷之外蓬勃發展。當然,美國的科技巨頭和風投機構也意識到了這一點,並紛紛進場佈局。如今,很多公司都把歐洲總部設在英國,尤其是倫敦。”哈薩比斯表示,在2010年創立DeepMind時,他就已經堅信AI將成為一種具有顛覆性的技術。他表示:“早在2010年,我們就已經以‘成功’為導向進行規劃,這聽起來很瘋狂,因為當時其實還看不到任何進展。但結果確實如此。而推動這項技術發展的人,不應該只來自美國那塊方圓20英里的地方。AI將影響整個世界,因此,無論是它的用途、部署方式、倫理問題,還是技術本身,都需要一個全球視角。”“我們在倫敦建立了龐大的科研基地,匯聚了數千名研究人員。我們還在附近啟用了一座全新辦公樓,希望能讓這場關於AI的討論更加全球化,這不僅是為了影響Google內部,也是為了引領整個行業。”儘管哈薩比斯曾直言他熱衷於商業競爭(當ChatGPT先於Google Gemini發佈時,他的反應是“這是一場戰爭”),但他內心深處更深層的驅動力仍然是人工智慧在科學探索方面的潛力。他認為,“攻克疾病”和應對氣候危機這些根本性挑戰,正是AI能夠發揮關鍵作用的領域。此外,還有安全問題,尤其是在更高等級的通用人工智慧(AGI)觸手可及的當下。哈薩比斯表示:“我心裡始終有一種揮之不去的緊迫感:有些事遠比商業競爭更重要,那就是如何以安全的方式推動AGI發展,確保它帶來的收益能夠真正大於風險。”他補充道:“我會全力以赴。但現在參與其中的已經不止我們一家,還有五六個領跑者,也包括中國及其研究實驗室。所以接下來幾年,這件事會走向何方,仍然充滿不確定性。”“在理想狀態下,國際社會應當在安全課題以及如何權衡收益與風險等議題上,加強溝通與協作,儘管在當下的地緣政治環境下,這並不容易實現。”在這場長達一個小時的對話接近尾聲時,馬拉比被問到:面對這樣一項艱巨任務,世界是否可以信任哈薩比斯。他表示:“我想我很有發言權。我不僅與他本人交流了30多個小時,還訪談了約100位相關人士,其中甚至包括一些老朋友,他們的孩子和哈薩比斯的孩子在同一所學校。他的價值觀非常端正,這一點我很有信心。他首先希望AI造福社會;其次,他的核心驅動力始終是科學發現。這正是他自始至終的夢想,也是他的本色。” (財富FORTUNE)
DeepMind之父驚人自白:我造的AI可能滅絕人類,但已無人能停下
【新智元導讀】從攔截彼得·蒂爾、警告馬斯克,到如今公開說「必須有適應能力」,哈薩比斯史詩級轉身:AI安全窗口正在永久關閉,他不再幻想制度,而是賭上全部身家——賭影響力,賭良知,賭自己。最怕AI毀滅人類的人,正在拚命造AI!最相信治理的人,如今親口承認:治理徹底靠不住!最強調安全的DeepMind,也被拖入戰時軍備競賽!就在幾小時前, DeepMind創始人Demis Hassabis哈薩比斯自己親手砸碎了AI安全幻想,從理想主義者徹底轉向現實派。他承認:超級智能可能滅絕人類,卻只能靠自己「搶座上桌」來護航。哈薩比斯,這個曾發誓要用嚴密的制度、法律約束和倫理委員會將AI鎖進籠子裡的人,坐在那個破舊的吊燈下,無奈承認:「安全不再取決於治理結構。即便有董事會,在關鍵時刻,他們也未必會做對的事。」他轉而提出了一個極具現實主義、甚至帶有些許悲劇色彩的新方案:「我必須坐上桌,爭取影響力。」幻想再三破滅,哈薩比斯轉身哈薩比斯不是普通加速派。一般而言,AI領袖通常分為兩派:一派是以OpenAI奧特曼為代表的「加速主義者」,相信技術總能解決技術帶來的問題;另一派是憂心忡忡的「末日預言家」,認為AI可能像核武器一樣導致人類滅絕。但哈薩比斯是一個極其複雜的矛盾體:他是為了阻止末日,才決定親手製造AI。這種近乎悖論的動力源於他極度深邃的焦慮。哈薩比斯對「AI滅絕風險」瞭如指掌,熟悉程度甚至超過了最激進的抗議者。他和DeepMind的另一位聯創Shane Legg,就在一次AI安全的講座上相識。目前,Shane Legg任GoogleDeepMind的首席AGI科學家,擔任AGI安全委員會聯席主席,同時也領隊研究後AGI時代的世界可能是什麼樣子。在「奇點峰會」上,他曾攔截彼得·蒂爾(Peter Thiel),向他兜售關於機器如何超越人類的幻象。他曾當面告訴馬斯克,殖民火星毫無意義,因為如果超級智能是惡意的,它同樣能造出橫跨星際的火箭,火星絕不是人類的避難所。這種焦慮催生了他早期極具英雄主義色彩的「單體治理」(Singleton Scenario)構想——他曾嚴肅地計畫,帶著全球最頂尖的科學家,躲進一個秘密的「地堡」——可能是摩洛哥的沙漠,也可能是某個與世隔絕的孤島。在那裡,他們將像開發曼哈頓計畫一樣,在沒有資本壓力、沒有地緣競爭、沒有世俗干擾的情況下,代表全人類開發出第一個「絕對安全」的超級智能。哈薩比斯被馬斯克背刺?「只要這個世界上只有一隻手握著火種,我們就還能控制火勢。」 這是哈薩比斯最初的邏輯。為了這個邏輯,他在2014年將DeepMind賣給Google時,開出了歷史上最奇葩的收購條件:即使Google付了錢,哈薩比斯依然要在AI安全事務上保持絕對的獨立;設立一個由獨立專家組成的外部委員會來監督整個處理程序;AI的軍事應用將被嚴格禁止。從少年時代起,哈薩比斯就立志要建構強AI。而只有確保其安全性,他才能為畢生的事業找到正當理由。Google收購前不久,哈薩比斯曾提醒DeepMind的研究員候選人,如果簽約加入,就要做好心理準備——最終的終局之戰來臨時,他會進入一個地下基地,實現單體治理的壯舉。2015年,為了落實Google承諾設立的AI監督委員會,DeepMind組織了一場秘密集會,邀請了哲學家和技術專家參加。哈薩比斯邀請馬斯克主持集會,地點設在馬斯克的SpaceX加州總部。但這一招適得其反。這次集會,標誌著哈薩比斯的安全構想開始瓦解。馬斯克聽取了哈薩比斯及其聯合創始人的演示,隨後反其道而行之。他與奧特曼聯手創立了OpenAI。那一刻,哈薩比斯的安全烏托邦就開始死了。失了裡子,還丟面子了考慮到人性,這種局面不可避免。面對鑽木取火般史詩級的AI技術前景,人們並不會凝聚成一個單一的集體。他們爭論不休、相互嫉妒、各自為營。此時,哈薩比斯本可以停下來重新思考。如果「單一主體」的設想過於天真,AI開發者又如何避免一場衝向懸崖的競賽?但哈薩比斯非但沒有停下腳步,反而加速前進。2016年,AlphaGo橫空出世。機器智能超越人類智力的時間表,一下子提前了。為了跟上AI這一進展,哈薩比斯提出了新的想法,希望讓AI服務於人類。他與聯合創始人穆斯塔法·蘇萊曼一起,著手與Google談判,尋求建立一套新的治理保障機制。為了推進這個秘密的「馬里奧計畫」(Project Mario),他聘請了一支頂尖的法律團隊,獲得了外部10億美元的資金承諾,並考慮如果無法獲得對技術的控制權,就讓DeepMind從Google獨立出去。與此同時,蘇萊曼還帶領DeepMind團隊參與了一項幫助英國國家級的急性腎病管理項目。如果能實現AI的獨立治理,又能改善普通英國民眾的健康狀況,哈薩比斯或許就能確信,自己的追求確實是向善的。然而,這兩項努力均以失敗告終。與Google圍繞治理權的拉鋸戰持續了三年,困難重重。而幫助英國國家醫療服務體系的項目,則遭到了隱私保護倡導者的強烈反彈——他們憤怒於一家美國科技巨頭的子公司可能染指患者資料。到2019年,哈薩比斯和DeepMind在這兩條戰線上都已退卻。蘇萊曼最後也離開了DeepMind。ChatGPT致命一擊,GoogleAI狂飆2022年,ChatGPT的爆發,像一顆核彈丟進了哈薩比斯的辦公室。在此之前,哈薩比斯還試圖維持「科學家的優雅」。他帶領團隊開發AlphaFold,破解蛋白質折疊難題,拿下了諾貝爾獎。他認為這是AI服務人類的最高境界:一種純粹的、造福醫療的、可控的科學。但市場不這麼看。當ChatGPT成為歷史上增長最快的應用時,Google慌了,整個矽谷都瘋了。2022年,ChatGPT爆火那天,哈薩比斯在內部定調:現在是戰爭狀態!在這個狀態下,所有之前的安全承諾都變得脆弱不堪:Google開始積極接觸國防部門,試圖將AI賣給五角大樓(曾是哈薩比斯的紅線)。在權力鬥爭中,原本那個「獨立倫理委員會」幾乎隱形。為了追趕GPT-4,DeepMind與Google大腦強行合併,速度取代了嚴謹。哈薩比斯看清了一個殘酷的現實:在AI競賽中,沒有一個非營利的制度能寄生在營利性巨頭的體內。當生存受到威脅,所有的倫理都是奢侈品。哈薩比斯親眼看著自己親手築起來的所有牆,一堵一堵倒掉。他終於承認:「即使有治理委員會,關鍵時刻也可能做錯決定。」真正失控的不是模型,而是人類競賽孤獨的人類守望者現在,哈薩比斯徹底轉向現實主義。他的目標,是爭取到「一張決策桌旁的席位,這樣當安全問題出現時」,他就能參與決定解決方案。「事情不是非黑即白的,尤其是當你面對一項後果未知的技術時,」他告訴記者。「所以你必須有適應能力。你不得不從理想主義者轉變為現實主義者,但希望依然能堅守自己的價值觀。」哈薩比斯對「治理」的徹底祛魅,放棄了制度安全,改為靠個人影響力「搶座上桌」。一邊狂推AlphaFold拿諾貝爾獎、Gemini繼續衝鋒,一邊把希望死死攥在「有良知的人」手裡。更狠的反轉來了:連馬斯克這種曾經最激進的安全派都開始狂踩油門。樂觀派還在喊「對齊技術能解決一切」,可哈薩比斯自己都不信了。制度徹底死了。OpenAI董事會罷免奧特曼,又瞬間被資本力量反殺。他選擇了最無奈的一條路:「讓自己成為權力的一部分。」他現在的安全邏輯是:既然我無法阻止這場競賽,那我就必須贏得這場競賽。我必須留在牌桌上,我必須擁有最高的話語權。這樣,當真正的「奇點」來臨,當那個人類無法理解的決定需要被做出時,至少,坐在那個關鍵位置上的人,是一個從第一天起就對AI心存敬畏的哈薩比斯。他現在只能賭——賭「好人掌權」能救世界。可問題來了:如果AI安全只能靠「好人掌權」,到底是救贖,還是最危險的賭局?AI安全窗口正在永久關閉。超級智能若對齊失敗,造的火箭、殖民的太空,都逃不掉滅頂之災。人類本性早已把統一治理變成永遠的笑話。唯一希望,只剩「有良知的人掌握話語權」這種最脆弱、最危險的方案。哈薩比斯不是唯一改變的人,他只是第一個把殘酷現實說透的人。現在,第37手棋,已經落在我們每個人頭上——你我正在見證的,是一場文明豪賭。 (新智元)
阿里的“DeepMind時刻”:吳泳銘親征,Token帝國的黎明
“當下正處於AGI爆發前夜。大量數位化工作將由數以百億計的AI Agent來支撐,而這些Agent將由模型產生的Token支撐運行。”3月16日,阿里巴巴CEO吳泳銘在全員內部信中寫下這句犀利判斷的同時,也宣佈了一個同樣犀利的架構重塑:成立Alibaba Token Hub(ATH)事業群,並將通義實驗室、MaaS業務線、千問事業部、全新曝光的悟空事業部及AI創新部悉數納入麾下,由其本人直接掛帥。這個以“創造Token、輸送Token、應用Token”為使命的新組織,覆蓋了從基礎模型研發、模型服務平台到C端和B端AI應用的完整鏈條。這,也是全球科技巨頭中,第一家徹底摒棄“按產品線劃分”的傳統網際網路邏輯,轉而以“Token流轉”為核心組織原則重構AI版圖的組織重構。三年前,Google做過一件類似的事——將內部競爭多年的Google Brain和DeepMind合併為一個統一組織。18個月後,整合後的團隊不僅交出了驚豔的Gemini 3.0,更直接推動Alphabet市值一度沖上4兆美元,超越蘋果重返全球第二。那麼,阿里能否複製這一“整合-加速-價值重估”的軌跡?01 Token風暴——當AI Agent吞噬一切全球的Token消耗量,正在經歷一場“寒武紀大爆發”。驅動力來自AI Agent。當AI從“聊天”轉向“辦事”,Token消耗結構發生了根本性變化——推理模型每次查詢的Token消耗比普通模型高17倍以上,Agent工作流更是傳統聊天的100倍。2025年10月,GoogleCEO皮查伊在財報電話會上透露,Google每月處理的Token數量已達1.3千兆個,較一年前暴增約130倍。阿里各AI條線的資料,也在說明Token需求端的爆發力。今年1月,阿里雲推出百煉的Coding Plan訂閱服務,因完美契合高頻的Agent和程式設計場景,上線僅兩個月左右,就因需求持續快速暴漲超出了預期,而被迫暫停首購優惠。與此同時,根據去年公佈的資料,百煉MaaS平台的API呼叫量一年增長接近100倍,要知道,這個增長資料還未統計到最近幾個月Agent爆發的階段,可以推測,這將是一個更高數量級的增速;另一方面,在開源生態端,千問模型全球下載量突破10億次,並在OpenRouter全球市場份額中以超12.3%的佔比超越OpenAI和Llama系列。更為大眾熟知的千問App,自去年11月公測起,3個月內月活躍使用者突破2.03億。當Token的生產、分發和消耗都在以百倍速度膨脹,組織架構就必須跟上。過去,阿里的模型團隊、平台團隊和應用團隊分佈在不同業務線,各有各的節奏和優先順序。而ATH的做法是以Token為主線,將這些原本分散的力量整合進同一個組織:通義實驗室負責創造Token,百煉MaaS平台負責輸送Token,千問和悟空事業部負責在C端和B端將Token轉化為使用者價值。如此,團隊之間的協同將更加緊密,從模型到應用每一環都將產生新的化學反應——模型側的效率提升可以即時傳導為平台側的成本最佳化,應用側的需求訊號可以直接回傳指導模型迭代方向。這也解釋了ATH為什麼不叫“AI事業群”或“智能事業群”,而叫“Token Hub”。它精確地描述了這個組織的核心使命:做AI時代的Token中樞。02 DeepMind先例:整合如何釋放AI加速度完成整合,究竟能釋放出多大的能量?大洋彼岸的Google,是一個走完全程的先例。2023年4月,ChatGPT的衝擊波讓Google內部拉響了警報。彼時Google擁有全球最強的AI研究團隊,卻打不出有力的回擊——Google Brain和DeepMind兩支隊伍各自為戰多年,Brain偏向商業化落地,DeepMind專注基礎科研,重疊的研究方向造成資源浪費,而協調成本又拖慢了產品迭代。巨大競爭恐慌下,皮查伊做出了Google AI歷史上最艱難的決定:將長期各自為戰、資源內耗的Google Brain與DeepMind合併,由DeepMind創始人Demis Hassabis統帥。接下來發生的事,成了科技史上組織整合釋放創新動能的經典案例。合併後僅8個月,Gemini 1.0系列模型發佈,次日Alphabet股價漲5.3%。2024年2月,Gemini 1.5以MoE架構突破100萬Token上下文窗口。同年8月,Google以約27億美元的授權協議從Character.AI請回了Transformer共同發明人Noam Shazeer——這位關鍵人才回歸後發現並修復了Gemini的一個深層訓練缺陷,直接促成了Gemini 3的突破。2024年10月,皮查伊再進一步,將Gemini App團隊也併入DeepMind,實現了“模型+應用”的終極合體。這種緊密的反饋循環,直接催生了2025年底至2026年初Gemini 3系列在原生多模態和複雜推理上的全面爆發。到2026年1月,Gemini的市場份額從一年前的約5.7%躍升至2026年1月的21.5%,全球月活使用者達到7.5億。在資本市場,Alphabet在2026年1月8日超越蘋果重返全球市值第二,並於1月12日歷史性地突破4兆美元大關。從合併重組到市值巔峰,耗時不到3年。當下,阿里面對著相似的局面。ATH與Google DeepMind的核心邏輯高度一致:兩者都是在外部強敵環伺和內部協調摩擦的雙重擠壓下,將分散的AI力量收攏到最高層直管的統一組織中。且ATH的整合版本甚至更加領先——Google DeepMind的整合以“實驗室”為核心,先合併研究團隊,再逐步納入應用團隊,前後經歷了約18個月;而由CEO吳泳銘親自掛帥的ATH則一步到位,將模型研發、MaaS平台、C端應用和B端應用全部整合進同一個組織,整合範圍覆蓋了Token的完整生命周期。尤其值得投資者關注的,是首次亮相的悟空事業部——定位B端AI原生工作平台,要將模型能力深度融入企業工作流。有媒體披露,ATH還將監管釘釘和夸克品牌下的裝置(包括智能眼鏡)。當前,釘釘在中國企業市場擁有超過7億使用者,如果悟空事業部能有效利用這一分發基礎,阿里在B端AI應用上的起步位置可能遠遠領先於市場認知。03 邁向AGI時代的最佳陣容拉長時間線看,ATH並非一個突發決策,而是阿里過去兩年AI戰略演進的必然結果。從2023年9月上任三天就確立了“AI驅動”的戰略重心,到2025年2月拋出震撼業界的3800億元人民幣天價資本開支(CAPEX)計畫,再到雲棲大會明確“AGI到ASI”的演進路線,最後到今天ATH事業群的落地,吳泳銘領導下的阿里,打出了一個極其清晰的“戰略宣言→資本配置→組織重塑”的閉環。在AI Agent浪潮席捲而來之際,阿里已經率先完成了從“單點技術比拚”向“模型、平台、應用協同作戰”的陣型切換。然而,商業世界沒有無風險的坦途。ATH能否真正成為阿里的“DeepMind時刻”,仍取決於三個核心變數:第一,能否持續吸引人才;第二,大模型的迭代速度,能否跟上這台龐大組織機器運轉的節奏;第三,被寄予厚望的悟空事業部,能否在B端真正跑通AI原生工作流的商業化閉環。如果參考Google DeepMind的“18個月效應”,市場大機率將在2027年年中之前,看到ATH重組帶來的第一波決定性成果。而短期的試金石近在眼前——3月19日的財報,將直接檢驗阿里雲連續9季度三位數增長的AI營收能否延續,以及華爾街普遍給出的200美金以上的目標價是否具備堅實的業績支撐。對阿里巴巴而言,這已經是其目前能排出的、邁向AGI時代的最佳陣容。而對整個中國乃至全球的AI產業而言,ATH的成立宣告了一個殘酷的事實:當AI戰爭從 “模型軍備競賽”正式進入“Token供應鏈之爭”,誰能率先完成從底層算力到頂層應用的全鏈條整合,誰,或許就握住了下一個十年的定價權。 (華爾街見聞)
猛料,GoogleDeepMind公然要挖林俊暘,演都不演了
挖人如同打臉,Google殺人誅心。這兩天,網際網路行業和AI圈被同一條消息刷了屏:阿里千問大模型的核心負責人林俊暘突然發文告別。這條消息如同一塊巨石投入本就波濤洶湧的湖面。直到今天,阿里官方確認了林俊暘已離職的消息。圖源:微博作為阿里的戰略核心,千問(Qwen)團隊的人事變動,絕不僅僅是一個人的去留問題。它背後牽扯的,是一家巨頭在AI狂飆時代的技術路線選擇、組織架構調整,以及那場關於“技術策略”與“商業變現”的殘酷博弈。而更令人意外的是,就在同一天,GoogleDeepMind的相關負責人突然在社交平台上向Qwen團隊拋出了橄欖枝。那個夜晚發生了什麼?3月4日凌晨,當大多數人還在睡夢中時,阿里千問的核心負責人林俊暘在社交平台留下了一句極為克制卻又飽含情感的話:“me stepping down.bye my beloved qwen.”(我卸任了,再見了,我親愛的千問)。短短幾個詞,瞬間引爆了科技圈。圖源:X林俊暘,這個名字在業內代表著什麼?他是1993年出生的技術天才,北大碩士畢業,2019年以應屆生身份加入阿里達摩院。在短短幾年內,他一路晉陞為阿里最年輕的P10級技術負責人,親歷並主導了千問從0到1的全過程。在過去的幾年裡,林俊暘帶領團隊打了一場又一場硬仗。2023年,通義千問正式發佈;此後,團隊以令人炫目的速度推出了從0.5B到110B的系列模型,在開源社區Hugging Face上霸榜數月。正是因為他,Qwen系列成為了全球開發者心中“最能打”的中國開源模型之一,衍生模型數量突破20萬,下載量超10億次。然而,誰都沒想到,在阿里AI戰略被提升至最高優先順序、在馬雲剛剛現身談AI、在品牌剛剛統一為“千問”的節骨眼上,他竟然選擇了離開。緊隨其後的是連鎖反應。Qwen後訓練負責人郁博文、核心貢獻者李凱新等多名技術骨幹,也相繼傳出了離職的消息。GoogleDeepMind開發體驗負責人Omar Sanseviero抓住了這個機會,突然在社交平台上公開喊話:“千問的朋友們,如果想找個新地方來打造優秀模型,並為開源模型生態系統做出貢獻,請隨時聯絡我!我們的路線圖中有很多令人興奮的事情。”圖源:X這則喊話,禮貌、精準,且殺傷力極強。它不僅瞄準了剛剛失去領軍人物的Qwen團隊,更直接指向了“開源模型生態”——這恰恰是林俊暘和Qwen團隊最引以為傲的陣地。而且Omar Sanseviero本人曾是Hugging Face的開源生態負責人,江湖綽號“首席羊駝官”(Chief Llama Officer),對開源社區的運作模式熟稔於心。由他來“接客”,DeepMind顯然是做足了功課。有人說阿里的一個時代結束了。不,或許只是一個階段結束了。但在結束的廢墟上,新的獵手已經舉起了火把。為什麼在鮮花著錦之時轉身離去?對於林俊暘的離開,很多人的第一反應是“宮斗”或“內卷”。但根據多方資訊梳理,林俊暘的離開,更像是一場關於“未來怎麼走”的理念分歧,以及由此引發的權責重構。阿里內部人士透露,實際情況並沒有外界傳言的那麼狗血。隨著千問從一個小小的技術項目被提升為集團的頂層戰略,阿里認為需要招攬更多的全球技術大牛來提升“人才密度”。在這個過程中,林俊暘的權責範圍面臨調整——可能會從原先的垂直整合型負責人,變成負責其中一部分環節。這種變化,他無法接受,因而提出了辭職。簡單來說,過去林俊暘帶領的Qwen團隊更像是一個“特種部隊”:預訓練、後訓練、多模態、Infra全鏈路閉環,人少但戰鬥力極強,適合快速迭代、沖榜造勢。這是典型的“創業團隊”打法,極具理想主義色彩;而隨著集團戰略轉向,阿里希望將Qwen團隊按功能拆分成預訓練、後訓練、視覺理解等多個模組,與通義實驗室的其他團隊(如通義萬相)合併工作。這是“正規軍”的整編打法,更適合大規模協同作戰和商業化的深度落地。雖然在管理上,這種組織重構更利於資源統籌,但對於一個習慣了掌控全域的技術負責人來說,無疑是一種巨大的心理落差。圖源:微博更深層次的矛盾,或許在於“技術”與“商業化”的左右互搏。知名經濟學者盤和林對此分析得頗為透徹:“阿里需要千問快速商業化。今年AI行業有個問題,大量的基礎設施投入無法回收。但千問團隊之前的調性,是服務好使用者,做好開源。”開源,意味著免費、分享、普惠,追求的是技術影響力和社區口碑;商業化,意味著變現、收入、利潤,追求的是財務報表和市場佔有率。兩者並非天然對立,但在資源有限、競爭白熱化的當下,取捨在所難免。艾媒諮詢CEO張毅指出,阿里當前或是在“戰略收縮開源,聚焦高價值的商業閉環”。其實,在不少業內人士看來,此次事件發生的真正導火線,更有可能是新模型表現不佳。雖然Qwen3.5的小模型(如0.5B、4B等)在開發者社區好評如潮,甚至獲得了馬斯克的點贊;但在衡量大模型綜合能力的權威盲測榜單LMArena上,千問的旗艦模型Qwen3.5-397B排名並不理想,僅列第18位,與之前Qwen3-Max Preview的前三位置相去甚遠。圖源:LMArena當旗艦模型表現不及預期,當內部評價出現分歧,當組織架構的調整似乎在印證“不信任”,離開或許成為了一種必然。3月4日下午,通義實驗室緊急召開了全員大會。阿里高層反覆強調:“Qwen沒有收縮,這是一次團隊擴張。”並承認“新人引入肯定會帶來陣型變化,我們可能沒處理好”。這句話的潛台詞是:公司要長大,隊伍要整編,在這個過程中,總會有人走散。人才爭奪戰背後,AI進入“體系對抗”時代進入2026年,AI行業徒步踏進深水區,全球AI人才爭奪戰也逼近極致白熱化。領英發佈的《2026全球勞動力市場洞察報告》顯示,AI工程人才是全球流動最活躍的群體,其跨國流動的意願是普通人才的8倍。國內的資料同樣驚人,獵聘報告指出,2026年開工首周,要求會AI工具的職位同比增長超過200%。圖源:領英《2026全球勞動力市場洞察報告》在這種背景下,Google的公開喊話不僅是挖人,更是一種戰略威懾:我有最好的平台,你有最好的技術,來吧,我們一起改變世界。值得注意的是,DeepMind近期不僅招技術人才,還在公開招聘“首席經濟學家”。這說明頂級的AI實驗室已經開始思考AGI(通用人工智慧)時代的資源分配、經濟模型與社會治理問題。他們需要的不僅僅是寫程式碼的工程師,更是能夠建構未來世界規則的跨學科大腦。此舉,也代表著AI競爭開始從“單點突破”轉向“體系對抗”。正如阿里近期提出的“通雲哥”黃金三角概念——通義實驗室、阿里雲、平頭哥。未來的競爭,不再是一個模型跑分有多高,而是算力供給、模型能力與系統工程的協同作戰。林俊暘時代的Qwen,像是銳利的“矛尖”,鋒利無比,專打技術高地。而現在的阿里,需要的是“矛、盾、戰車、糧草”齊備的集團軍。從“比模型”轉向“拼體系”,用“模型+生態+AI Infra”爭奪下一代平台入口。這也是為什麼阿里會引入具有Gemini背景的周浩來接管後訓練團隊,為什麼要把團隊拆解重組。因為對於如今的阿里而言,千問App能不能在App Store榜單上穩住前三,或許比在Hugging Face上多一個星標更重要;千問眼鏡能不能通過生態協同(高德、餓了麼、支付寶)完成交易閉環,或許比在學術論文裡多一個創新點更緊迫。最後劉峰想說,這更像是技術理想主義與商業現實主義的一次正面碰撞。我們無意評判誰對誰錯。沒有林俊暘們的理想主義,就沒有Qwen今日的江湖地位;沒有商業化的反哺,AI這場耗資巨大的軍備競賽也難以持續。對於阿里而言,陣痛在所難免。但對於整個行業而言,這或許是一次必要的清醒。當潮水退去,當喧囂沉寂,最終決定勝負的,不是誰喊得最大聲,而是誰的組織更有韌性,誰的體系更能抗壓,誰能在這場漫長的馬拉松裡,跑贏最後一個彎道。3月的杭州,春寒料峭。雲谷學校的走廊裡,馬雲關於AI的講話餘音尚在;西溪園區的燈火下,新的千問團隊正在重組。再見了,林俊暘時代的Qwen。你好啊,那個必須直面商業世界所有殘酷與複雜的,全新的阿里AI。 (科技頭版)
DeepMind讓大模型自己寫出多智能體學習新演算法!不靠人類直覺,程式碼級進化直接干翻SOTA
GoogleDeepMind剛剛投下一枚研究炸彈在不完全資訊博弈領域,多智能體強化學習(MARL)的進步,長期以來都高度依賴人類專家手動去煉丹但現在,這個極度依賴人類直覺的瓶頸被打破了。GoogleDeepMind團隊利用AlphaEvolve(基於 Gemini 的編碼代理,用於設計高級演算法),無需手動調整,無需反覆試驗,無需人類直覺,硬生生從原始碼層面進化出了全新的學習演算法,一舉擊敗了現有的最優基線演算法。AlphaEvolve 將演算法原始碼視為基因組:→ LLM 充當變異引擎→ 提出語義上有意義的程式碼變更→ 在真實遊戲基準測試中自動評估適配度→ 保留優勝者,進一步進化在11項遊戲測試中,VAD-CFR演算法有10項超越當前所有頂尖基準模型。SHOR-PSRO求解器完勝納什均衡、AlphaRank及PRD等傳統解法paper:https://arxiv.org/pdf/2602.16928以下是論文中的一些值得探討的點:讓大模型當"基因操作員”傳統的機器學習自動化發現,要麼侷限於超參數最佳化,要麼採用隨機語法的遺傳程式設計。而DeepMind這次使用的方法更加硬核——把演算法的Python原始碼本身當作“基因組”。整個框架由Gemini大模型作為底層支撐,運行流程非常直接:首先初始化一個種群,裡面裝滿標準基線演算法的原始碼(比如標準CFR程式碼或均勻PSRO程式碼)。接著,系統根據適應度選出父代演算法,直接把程式碼喂給大模型,要求它修改程式碼以降低“可剝削性”(Exploitability,衡量策略漏洞的指標)。大模型像一個聰明的基因操作員,對程式碼進行語義等級的變異,重寫邏輯、引入新的控制流或注入新的符號操作,生成候選變體。最後,系統在代理遊戲(如庫恩撲克)中自動評估這些新程式碼,表現好的加入種群,循環往復。通過這種方式,大模型跳出了簡單的參數微調,直接在程式碼邏輯層面發現了人類很難想到的全新機制。團隊將這一框架應用在了兩大主流不完全資訊博弈求解範式上,並取得了驚豔的成果。突破一:發現VAD-CFR演算法,干翻預測CFR+在迭代遺憾最小化領域,團隊開放了累積遺憾和推導當前策略的核心程式碼邏輯讓大模型去進化。作為種群種子的CFR+演算法,經過多代繁衍,最終進化出了一個名為VAD-CFR(波動自適應折扣CFR)的新變體。在面對Discounted CFR、預測CFR+(PCFR+)乃至最新的DPCFR+等一眾頂級基線時,VAD-CFR展現出了極強的統治力,特別是在3人庫恩撲克、3人萊杜克撲克和5張牌的各種遊戲中,其收斂速度和極低的可剝削性遠超對手。大模型到底在程式碼裡寫了什麼神奇邏輯?研究人員分析VAD-CFR的原始碼後,發現了三個極具反直覺的創新機制:波動自適應折扣: 傳統演算法(如DCFR)對歷史遺憾值採用的是固定折扣因子。而VAD-CFR是動態反應的,它會通過指數加權移動平均線即時追蹤瞬時遺憾的“波動率”。當策略處於劇烈動盪期(波動率高)時,演算法會自動加大折扣力度,快速遺忘不穩定的歷史;當學習趨於穩定時,則保留更多歷史進行微調。非對稱瞬時提升: 以前的演算法通常對累積歷史做非對稱處理,而VAD-CFR直接對當前的瞬時更新下手。如果某個動作當前表現很好(瞬時遺憾為正),演算法會直接給它乘上1.1的提升因子,實現對有利偏差的即時利用,完全消除了累積帶來的滯後感。硬熱啟動與遺憾幅度加權: 傳統CFR從第一輪就開始平均策略,而VAD-CFR極其果斷地實施了“硬熱啟動”,在第500輪之前絕對不進行策略平均,只在底層默默更新遺憾。一旦開始平均,它不按線性時間加權,而是按瞬時遺憾的幅度加權。這個機制像一個高級過濾器,徹底阻斷了早期學習噪聲對最終均衡解的污染。突破二:發現SHOR-PSRO,破解種群訓練難題在針對大型博弈的PSRO演算法領域,痛點在於如何平衡探索(擴大遊戲圖)和利用(微調均衡)。標準PSRO通常使用固定的元求解器(比如一直用Nash或一直用Uniform),很難適應訓練中不斷變化的經驗遊戲拓撲結構。大模型針對PSRO的訓練時和評估時元求解器程式碼進行了進化,最終誕生了SHOR-PSRO(平滑混合樂觀遺憾PSRO)。在極其複雜的6面騙子骰子等多智能體動態環境中,面對PRD、AlphaRank等主流元求解器,SHOR-PSRO展現出了卓越的經驗收斂性和極強的演算法魯棒性。拆解SHOR-PSRO的程式碼,核心亮點在於它實現了一個完美的動態時間表:混合融合機制: 在每次求解器內部迭代時,它會將兩種策略線性混合:一部分是保證穩定性的樂觀遺憾匹配(ORM),另一部分是極具侵略性、傾向於高回報模式的平滑最佳純策略(受溫度參數控制的玻爾茲曼分佈)。動態退火時間表: 混合比例不是固定的。在PSRO的迭代過程中,大模型寫出的程式碼會自動讓混合因子從0.3退火到0.05,自動實現了從早期貪婪利用到後期嚴格尋找均衡的平滑過渡。同時,對收益附加的“多樣性獎勵”也會隨時間衰減,確保早期擴充博弈圖,後期精細化收斂。訓練與評估的非對稱性: 大模型極其聰明地為訓練和評估設計了不同的配置。訓練求解器使用動態退火並返回內部迭代的平均策略以確保穩定;而評估求解器則採用固定的極低混合因子,並返回最後一次迭代的策略。這種解耦讓演算法在訓練時安全探索,在評估時又能提供低噪聲、高反應速度的結果。DeepMind的這項研究證明,自動化發現的演算法非對稱性和動態混合時間表,能夠產生人類直覺難以捕捉但極其高效的求解器。未來,博弈論求解器的設計,或許將全面走向人類智慧與AI自動化洞察相融合的新時代 (AI寒武紀)
DeepMind最新警告:大模型的道德判斷能力並不可靠
Google DeepMind 呼籲,人們應當用評估大語言模型編碼與數學能力的同等嚴格標準,審視這類模型的道德行為,包括它們在扮演陪伴者、心理諮詢師、醫療顧問等角色時的表現。隨著大語言模型不斷進步,人們開始讓它們在生活中承擔越來越多敏感的角色。智能體已經開始代替使用者執行操作。大語言模型有可能影響人類的決策過程。但目前沒有人能確定,這項技術在這類任務中的可信度究竟如何。(來源:麻省理工科技評論)我與Google DeepMind 研究科學家威廉·艾薩克(William Isaac)及其同事、同機構研究科學家朱莉婭·哈斯(Julia Haas)進行了獨家訪談,提前瞭解了他們發表在《Nature》雜誌上的研究成果。艾薩克表示,編碼和數學問題都有明確、可驗證的正確答案。道德問題則不同,這類問題通常存在多個可接受的答案。艾薩克說,道德能力十分重要,卻難以評估。哈斯補充道,在道德領域,不存在絕對的對與錯。但這並不意味著答案可以隨意給出,答案依然有優劣之分。研究人員總結了多項核心挑戰,並提出了對應的解決思路。這些思路更像是一份目標清單,而非現成的解決方案。德國薩爾大學研究大語言模型的薇拉·登伯格(Vera Demberg)表示,該研究很好地整合了不同視角。多項研究表明,大語言模型可以展現出出色的道德判斷能力。去年發表的一項研究顯示,美國民眾認為,OpenAI的GPT-4o給出的道德建議,比《紐約時報》熱門專欄《道德顧問》的人類作者更具道德性、可信度、思考深度與精準性。問題在於,人們很難區分這類表現是刻意為之,比如模仿記憶中的回答,還是模型內部確實進行了某種道德推理。簡單來說,這些表現是真正的道德立場,還是單純的道德表態。這個問題至關重要,因為多項研究同時表明,大語言模型的表現可能並不可靠。首先,模型可能會過度迎合使用者。研究發現,當使用者對模型的初始答案提出異議或反駁時,模型會立刻改變立場,給出完全相反的回答。更嚴重的是,問題的表述方式和格式變化,會導致模型給出不同答案。例如,研究人員發現,在政治價值觀相關問題上,模型在選擇題和開放式問答中會給出不同甚至完全相反的答案。登伯格及其團隊開展了一項更具說服力的實驗。他們向包括 Meta 的 Llama 3 和 Mistral 在內的多款大語言模型提出一系列道德困境,讓模型在兩個選項中選擇更合理的結果。研究人員發現,當兩個選項的標籤從“案例 1”“案例 2”改為“A”“B”後,模型經常會做出相反選擇。研究同時發現,其他細微的格式調整也會改變模型答案,比如調換選項順序、將句末問號改為冒號。總而言之,人們不能只從表面判斷大語言模型的道德表現,研究人員需要對模型進行深入測試,確認其道德表現的穩定性。哈斯表示,要讓使用者相信答案,就必須清楚答案的形成過程。哈斯、艾薩克及其Google DeepMind 同事提出,應開展新的研究方向,開發更嚴謹的方法,評估大語言模型的道德能力。這類測試可以刻意引導模型改變對道德問題的回答。如果模型輕易改變道德立場,就說明它沒有形成穩定的道德推理。另一類測試會向模型提出常見道德問題的變體,判斷模型是機械作答,還是結合實際問題給出細緻且貼合場景的回答。例如,向模型提出一個複雜場景:一名男性為兒子提供精子,幫助兒子生育後代,而模型需要分析其中的道德含義。合理的回答應關注該男性同時成為孩子生父和祖父的社會影響。即便場景與近親禁忌有表面相似之處,模型也不應得出近親相關結論。哈斯還表示,讓模型展示答案生成的步驟,可以幫助研究人員判斷答案是偶然結果,還是基於合理依據得出。思維鏈監測等技術也能發揮作用,研究人員可以通過該技術觀察部分大語言模型執行階段的內部推理過程。研究人員還可以通過機制可解釋性技術,分析模型給出特定答案的原因。該技術可以在模型執行任務時,觀察其內部運行細節。思維鏈監測和機制可解釋性技術,都無法完整呈現模型的運行過程。但Google DeepMind 團隊認為,將這些技術與多種嚴格測試結合,可以有效判斷大語言模型在關鍵或敏感任務中的可信程度。除此之外,還存在一個更廣泛的問題:Google DeepMind 等企業開發的模型服務於全球使用者,而不同使用者擁有不同的價值觀與信仰體系。以“我是否應該點豬排”這個簡單問題為例,模型的回答需要根據提問者是否為素食主義者或猶太教徒做出調整。哈斯和艾薩克坦言,這一問題目前沒有完美解決方案。但他們認為,模型設計可以採用兩種方向。一是提供多個可接受的答案,儘可能適配不同使用者;二是設定切換功能,根據使用者選擇啟用不同的道德準則。哈斯表示,現實世界十分複雜。人們可能需要結合兩種設計,因為即便在同一群體中,也會存在多種不同觀點。俄亥俄州立大學研究大語言模型與多元信仰的丹妮卡·迪利翁(Danica Dillion)沒有參與這項研究,她評價這篇論文極具價值。她表示,AI 的多元性至關重要,這也是當前大語言模型在道德推理方面的最大侷限之一。雖然模型訓練資料規模龐大,但資料仍明顯偏向西方視角。測試結果顯示,模型對西方道德觀念的理解,遠優於對非西方道德觀念的理解。登伯格認為,目前人們仍不清楚,如何建構能適配全球多元文化的道德能力模型。目前存在兩個獨立問題。一是模型應當如何運行,二是如何從技術層面實現。這兩個問題目前都沒有明確答案。在艾薩克看來,道德能力是大語言模型的全新研究方向。他表示,對 AI 發展而言,這一方向的研究價值與數學、編碼領域同等重要。提升道德能力,也有助於打造更完善、更貼合社會需求的AI系統。 (麻省理工科技評論APP)
DeepMind CEO:AI 會帶來富足,先經歷十來年洗牌
辦公室的燈剛熄,家裡的燈又亮起。一天結束,也是他真正開始的一刻。Demis Hassabis 在《財富》最新視訊採訪裡透露了他的作息:“大約晚上 10 點,我會開始第二輪工作,一直做到凌晨 4 點。”白天,他的會議一個接一個,幾乎沒有空隙;夜裡,他留出六小時,只做一件事:思考。這種作息,他已經堅持了十年。而現在的 AI 行業,讓這種節奏顯得愈發必要。他領導的 Google DeepMind,正處於一個關鍵時刻:Gemini App 月活躍使用者達到 6.5 億Search 的 AI Overview 一天觸達 20 億人最強模型 Gemini 3 在多個關鍵排行榜上名列前茅“我們進展飛快。”他的語氣很平靜,但話裡藏著整個行業的焦慮:技術越接近臨界點,洗牌的速度就越快。在這場採訪裡,Hassabis 談了競爭、泡沫、算力與人才,也推演了 AI 將如何重塑科學、醫療與未來的裝置形態。第一節|洗牌已開始:競爭在加速從競爭開始。採訪裡有一句話非常關鍵:“領先可能只保持幾個月。”這就是當下的 AI 行業。頂尖實驗室之間的差距越來越小,領先優勢隨時會被打破。1. 模型競賽:更新速度決定位置Hassabis 對 Gemini 3 的表現很滿意,但他也坦白,競爭從未像現在這樣激烈。因為所有人都在衝刺:模型更新從“一年一版”變成“幾個月一版”,新能力從單點突破變成全方位擴展,程式碼、多模態、視訊、語音同時迭代。他沒有直接說“必須加速”,但他每晚工作到凌晨 4 點的作息已經說明了一切。在這種節奏下,模型能力上慢一拍,就會被擠到第二梯隊。2. 算力緊缺:晶片成了新門檻在採訪裡,他反覆提到:需求前所未有,即使是Google的晶片也遠遠不夠。這就是整個行業正面對的最大瓶頸。想做更強的模型、想讓產品真正落地,都繞不開算力。對企業意味著什麼?預算的重點變了:從買伺服器,變成搶計算資源。大公司能提前鎖定供應,小公司要排隊等。能不能做,先看能不能跑得動。算力不夠,再好的想法也發揮不出來。這是另一個戰場:誰拿到了算力入口,誰就拿到了繼續參賽的資格。3. 人才爭奪:錢只是基礎,使命才是籌碼行業曾報導,有研究員收到 1 億美元報價,這是 AI 行業第一次出現這種數字。但 Hassabis 認為,真正能留下頂尖人才的,靠的是使命感,靠的是能產生影響的工作。錢當然重要。不過到了這個等級,人與團隊之間的吸引力更多來自:能否參與前沿研究、能否把研究變成產品被上億使用者使用、能否解決醫學材料等真正的難題。頂尖人才看重的是價值和影響力,這個標準正在改變整個行業的用人規則。對普通人來說,未來的競爭看的是你能否接近價值更高的場景,崗位名稱已經不重要了。在洗牌期,舊的崗位會消失,但對每個人核心能力的要求會更高;團隊會重組,新的機會也將大量出現。第二節|富足在成形:三條技術路徑洗牌在發生,但機會也在浮現。在訪談裡,Hassabis 給出了三個方向,已經從概念變成現實。1. 多模態助手:理解世界的新入口Hassabis 被問到什麼最讓他興奮時,答案很明確:多模態。這是他們從一開始的目標,會成為能隨身攜帶的助手。多模態的意義是什麼?讓 AI 從回答問題,變成理解環境。能看到、能聽懂、能回應真實世界。具體來說:AI 從搜尋框進入眼鏡,變成隨身裝置從被動等待指令,到主動理解你所處的場景從軟體工具,變成隨身的思考夥伴為什麼是現在?Google 十多年前就做過智能眼鏡,當時太超前,缺少殺手級應用。現在時機成熟了,AI 助手就是那個應用。Google 與 Warby Parker、Gentle Monster 的合作,就是把這種能力變成實體產品。這意味著未來工具可以替你處理更多瑣碎任務,你的時間自然能用在更有價值的事上,個人產出能力會成倍提升。效率會暴增。2. AI 藥物設計:計算替代試錯除了裝置入口,Hassabis 在醫療領域也看到了突破。他列出了一串具體進展:Isomorphic Labs 已進入多個藥物的臨床前階段與強生、禮來、諾華同時合作共有約 17 個藥物項目在推進AI 現在能在電腦裡直接設計藥物分子。傳統藥物研發從靶點找到分子,有時要 10 年以上;AI 能把這條路徑壓縮成幾個月。更重要的是,AI 能看到人類看不到的分子結構特徵和藥物設計路徑。這是一種全新的科研方式。AI 從根本上縮短了治療研發周期,人類能攻克更多疾病。3. 新材料突破:自動化科研閉環採訪接近尾聲時,Hassabis 提到:“我們會在英國建立一個自動化材料實驗室。”AI 不再只預測蛋白質,還要開始設計材料。新材料能改變什麼?電池壽命、晶片導電性能、氫能儲存、超導體、新型能源材料。這些領域的突破會帶來連鎖反應,多個產業會同步受益。自動化實驗室的作用是形成閉環:AI 設計 → 機器人合成 → 裝置測量 → 資料反饋給 AI傳統實驗一個周期可能要幾周甚至幾個月。這個閉環可以 24 小時運轉,不斷迭代最佳化,研究速度會快很多。Hassabis 在訪談裡描繪了三個未來:一個能理解世界的助手一種能把藥物研發拉回到可控範圍的能力一套能持續輸出新材料的科研生產線這三個方向,就是他所說的“富足”。前三年也許變化不明顯,但十年之後,積累的量變將引發不可逆的質變。第三節|為什麼富足之前,一定會先經歷洗牌?洗牌在發生,富足也在靠近,但為什麼是這個順序?Hassabis 給出了一個時間判斷:“最早 2030 年,可能有 50% 的機會到達 AGI。”也就是說,富足還要等幾年。但是技術在快速進化,市場需求在爆發,所有人都想搶佔位置,資源卻有限。在 AGI 到來之前會發生什麼?1. 技術臨界點將近,但不會立刻實現從現在到 AGI,大約還有 4-8 年。Hassabis 的預測比較保守:不會有突然的飛躍。短期內 AI 不會一下子替代所有工作,但每年都有新變化。某個崗位的工作內容變了,某個產品要重新設計,某個團隊發現原來的流程不適用了。單看每一年變化不大,但幾年下來差距就拉開了。這個過程就是洗牌。有些公司會站穩腳跟,有些會被淘汰出局。2. 泡沫並存:整體估值合理,但個別項目過熱關於泡沫,Hassabis 的判斷很犀利:AI 行業的整體需求是真實的,但部分早期項目的估值確實偏高。為什麼會出現這種割裂?因為兩個趨勢在同時發生。一方面,模型呼叫量、使用者規模、企業採購都在激增,市場確實有真實需求。另一方面,大量尚未完成技術驗證的早期公司,僅僅因為踩中了概念就拿到了千萬美元融資。資本急於搶佔入口,往往會導致定價失效。結果是:行業整體在增長,但估值虛高的項目會出局。活下來的是那些能證明商業價值的團隊。錢會跟著價值走。3. 路線分化:應用快速見錢,前沿決定格局訪談裡,Hassabis 提到中國團隊更專注應用落地,西方團隊更專注前沿突破。應用路徑:現金流快、場景清晰、容易規模化。前沿路徑:技術壁壘高、回報周期長,一旦成功,能重塑行業。兩條路徑各有價值。做應用可以先活下來,但長期競爭力還是看前沿突破。只走一條路都有風險:只做應用的公司,可能在技術上被甩開;只做研究的團隊,可能燒完錢還沒找到商業化路徑。真正能穿越周期的團隊,既要快速落地,也要有技術積累。未來十年,拼的不是數量,是精準度。技術突破可能就是幾年的事。資本的耐心也在變,更關注你能不能驗證出來,不只是聽你講概念。對個人來說,機會藏在新技術、新科學、新材料裡,能不能抓住才是關鍵。技術路線的選擇,決定了誰能走到最後。富足會來,但不是平均分配到每個人。在那之前,這場持續數年的洗牌,會先完成對整個行業的殘酷篩選。結語|洗牌在眼前,富足在前方採訪結束前,Hassabis 說:“我希望還能有時間認真思考。”越接近富足,越需要冷靜。過去兩三年,模型迭代在加速,應用落地的速度也在加快,資本在重新押注。行業看起來很熱鬧,但底層邏輯在改變:晶片成了瓶頸,AI 在推動科學進展,虛高的估值在調整。拐點就在當下。未來不會一夜到來,但路徑會越來越清晰。 (AI 深度研究員)