GoogleGemini登頂App Store:從DeepMind戰略看AI下一個爆發點

最近,GoogleGemini憑藉“Nano Banana”的爆火,在美App Store下載量超越ChatGPT,成為免費榜排名第一的應用。

就在前幾天,這一爆款AI應用的真正締造者——諾貝爾化學獎得主、GoogleDeepMind CEO戴米斯·哈薩比斯(Demis Hassabis)現身All-In Summit 2025,進行了一場引人深思的分享,並全面闡述了GoogleAI戰略佈局。

哈薩比斯現場沒有過多強調模型參數,而是從GoogleAI應用產品視角,勾勒出了一幅人工智慧深入現實世界、賦能多領域變革的路徑圖。

他的觀點明確而深刻:我們正邁入一個AI全面爆發的時代——這不再是單點技術的迭代,而是一場系統級、多模態、跨領域的協同進化。

從語言模型到世界模型,從蛋白質結構預測到藥物研發,從機器人控制到通用智能(AGI)的探索,哈薩比斯的敘述超越了產品和公司的範疇,指向一個更宏大的命題:AI 是否能夠真正理解世界、參與世界,甚至改造世界?

Gemini:多模態引擎重塑人機互動

在哈薩比斯的構想中,Gemini遠不止是一個多模態大模型。它既不侷限於對話,也不僅是搜尋的延伸,而是一種新型的“環境智能”。

它能夠即時感知使用者所在場景,理解圖像、聲音、動作甚至意圖,並作出相應反饋。

例如,當你手持手機環顧四周,Gemini 可以識別街道標誌、店舖類型、行人動態,並主動提供導航或建議;當你指著一份文件說“這裡需要修改”,它不僅能理解“這裡”所指的具體位置,還能就內容邏輯提出建議。

這種能力已不再是傳統意義上的“自然語言處理”,而是對物理和語義環境的深度融合。

哈薩比斯強調,Gemini 的核心突破在於其作為“下一代使用者介面”的定位。它正在被嵌入至Google的全線產品——Gmail、Workspace、地圖、搜尋引擎——成為連接人類意圖與數字服務的智能中介。

其價值不在於回答問題本身,而在於如何在對的時間、以對的方式、提供對的幫助。

這意味著:AI 正在從“等你提問”走向“主動理解”,從“文字互動”走向“場景融合”。

Genie:從生成內容到模擬世界

如果說 Gemini 是“理解現實”,那麼 Genie 就是在“生成現實”。

Genie可以根據一句指令——比如“一個雨後的小鎮房間,窗外有月光”——即時生成一個完全可互動的虛擬場景。更為驚人的是,這個世界並非預先渲染完成,而是依據使用者的注視點和行為動態生成。你沒看到的地方,尚未“存在”;你所見之處,才被逐幀建構。

這種能力背後,是 Genie 對物理規則、運動邏輯、空間關係的隱式學習。

它通過分析海量視訊與遊戲片段,自主歸納出物體如何移動、光影如何變化、人與環境如何互動——本質上,它是一種通過資料驅動的“世界模擬器”

哈薩比斯指出,這遠不同於傳統的遊戲引擎(如Unity或Unreal),後者依賴人工預設規則和資產。

而Genie展示的,是一種源於真實世界資料、卻又能創造新環境的生成能力。這不僅為遊戲、影視、虛擬現實帶來變革,更將成為機器人訓練、科學模擬、甚至城市模擬的基礎設施。

換句話說,Genie 標誌AI 正式從“內容生成”邁入“世界建構”。

機器人:多模態能力的終極體現

在DeepMind的實驗室中,搭載Gemini的機器人已經能夠聽懂諸如“把黃色積木放進紅色桶裡”這樣的指令,並精準執行。這背後是語言、視覺與動作控制的統一建模。

哈薩比斯特別指出,機器人技術的瓶頸從來不只是硬體,更是“理解”。

傳統機器人依賴於預程式設計動作或孤立視覺識別,而Gemini賦予它們的是語義等級的環境理解與任務推理能力。

例如,當你說“放回原處”,機器人能明白“原處”指那裡,並回憶之前動作的上下文。

他透露,DeepMind 正在推進兩條路徑:一是打造通用機器人軟體平台(類似Android for Robots),使不同形態的機器人可共享同一套智能系統;二是開發特定場景下垂域深度最佳化的端到端機器人(類似蘋果軟硬一體模式)。

儘管目前機器人仍處於“早期階段”,但哈薩比斯相信,未來五到十年將是其真正爆發的時間窗口。

關鍵在於:AI 是否能夠穩定、可靠地在物理世界中執行指令,並適應人類為其設計的非結構化環境。

AlphaFold:從諾貝爾獎到藥物革命

2025年,哈薩比斯憑藉AlphaFold 獲得諾貝爾化學獎,但這在他看來“只是一個起點”。

AlphaFold 解決了生物學中一個百年難題——蛋白質結構預測,將原本數年的時間的實驗過程壓縮至幾分鐘。

但哈薩比斯的目標遠不止於此。

他創立的 Isomorphic Labs 正在建構一套完整的AI藥物研發系統,涵蓋從靶點發現、分子設計、毒性預測到實驗推薦的全流程。

目前,Isomorphic 已與多家頂級藥企達成合作,並已有六個藥物靶點進入研發管道。

他們的目標是將藥物開發周期從“十年十億美金”壓縮到“幾年甚至更短”,並顯著提高成功率。

哈薩比斯將這套系統比喻為“科學搜尋引擎”:輸入疾病,輸出潛在藥物方案。

更重要的是,它是一個持續學習的系統:每一次成功或失敗都會反饋給模型,使其越來越精準。

這不僅是一場技術革命,更是一種方法論的重構:科學研究正在從“經驗驅動”轉向“資料驅動+AI生成”。

真正的AGI:尚未走完的最後一步

儘管AI取得了顯著進展,但哈薩比斯對當前系統的侷限保持清醒認識。

他明確反駁了目前“模型已達到博士水平”的說法,指出如果換個問法,AI可能連高中數學題都會答錯。

哈薩比斯表示,我們離真正的通用人工智慧(AGI)仍有距離。他指出當前模型的四大侷限:

1. 真正的推理能力缺失:模型可以複述知識,卻難以提出全新理論或跨領域類比。

他舉了一個例子:讓現在的模型只掌握1901年的知識,然後看它能不能像愛因斯坦一樣在1905年提出相對論?這才是檢驗AGI的標準。

2. 穩定的一致性的不足:同一問題不同問法可能導致回答不一致甚至自相矛盾。真正智能的系統應該在所有輸入方式下保持穩定表現。

3. 持續學習的困境:當前大多數模型只能通過離線訓練提升能力,不會在日常互動中越用越聰明。

4. 科學直覺的空白:偉大科學家與普通學者的區別往往在於直覺判斷能力,現在的AI還無法在不同領域間發現共性並應用到新問題中。

在哈薩比斯看來,AGI 不是一個參數更多、規模更大的模型,而是一種能真正理解世界、進行創造性思考的系統。要實現這一目標,可能還需五到十年甚至更久的關鍵突破。

最後,AI 的價值不在技術本身,而在其與世界的關係

哈薩比斯的分享清晰地傳遞出一個訊號:AI 的發展正從“模型競爭”走向“系統能力”的整合。

它的未來不再侷限於對話或生成,而是深度融合進環境、裝置、科研和產業之中。

對於行業而言,這意味著:

評估AI項目的標準不應再是“模型多大”,而是“能否真正跑通場景”;

未來的競爭焦點將是多模態、跨平台、可落地的系統能力;

人工智慧的價值,終將體現在它對真實世界的影響中。

我們正在進入一個AI全面爆發的時代。它不是一次技術爆炸,而是一場靜默滲透的結構性變革——而這場變革,才剛剛開始。 (紅熊AI)