2025年11月19日,Gemini 3發佈。Sundar Pichai在Google官方部落格上寫道:Gemini 3是我們目前最智能的模型,目標是讓使用者把任何想法變成現實。這一次,Google不是單獨發佈一個模型,而是第一次把推理能力、多模態理解和智能體能力打包整合,形成一整套AI平台。Gemini 3 發佈即上線:整合到搜尋的AI Mode、登陸Gemini App和AI Studio,企業可在 Antigravity 部署智能體,開發者能使用Deep Think模式。覆蓋規模達到20億搜尋使用者,背後是Google一年近千億美元的AI投資。那麼,Gemini 3到底強在那?通過復盤發佈會、技術演示 和CEO訪談,我們提煉出三個維度:執行能力 - 從回答問題到完成工作分發效率 - 從獨立產品到系統嵌入生態護城河 - 從工具升級到平台重構這才是這場發佈的真正含義。第一節|任務執行:從回答問題到完成工作Gemini 3 在發佈當天就創造了一個紀錄:以1501分登頂LMArena排行榜(全球AI模型競技場),成為首個突破1500分的模型。(Gemini 3 Pro:多數基準測試中都處於領先水平)在人類的最後考試這個包含博士級難題的基準測試中,得分37.5%,相比上一代的21.6%接近翻倍。在GPQA Diamond(衡量博士級推理能力)上達到91.9%,在數學推理的MathArena Apex上取得23.4%的最新最高分。但這些數字背後,真正重要的是什麼?1、從基準測試到真實任務DeepMind CEO Demis Hassabis在訪談中強調,Gemini 3最大的進步在於推理能力。它能夠同時進行多步驟的思考,而以前的模型常常會思路中斷、失去條理。這種能力的提升,在實際應用中意味著什麼?在Gemini Agent的演示中,你可以直接說去整理我的收件箱,它會自動掃描郵件內容、按重要性分類、標記需要回覆的事項、起草回覆建議、將相似郵件歸類整理。整個過程不需要你逐步指導,不需要你監督每一步。或者在氛圍編碼場景中,Hassabis提到模型跨越了實用性門檻。在技術演示中,你只需一次性輸入幫我做一個《饑荒》風格的2D遊戲,能在世界中行走和收集材料進行製作,Gemini 3就能自動生成符合風格的畫面、角色控制系統、材料收集機制、完整的製作介面和可直接運行的程式碼。2、從對話到任務執行的轉變這種多步驟推理能力帶來的,是AI工作方式的根本性改變。設想一個日常場景:你對 AI 說,幫我寫一封感謝郵件,要提到昨天會議的三個要點,附上相關的兩張圖片和會議紀要連結。Gemini 3 的設計目標,是讓你只說一次,它自動分解步驟:調取會議記錄提煉核心要點從文件庫檢索圖片生成分享連結組織成郵件語氣輸出完整草稿用Google Labs 副總裁 Josh Woodward 的話說,他們的目標不是那種機械的一問一答,而是更自然、更智能的對話。更值得注意的是,團隊現在關注的新指標是:AI能幫助你在一天中完成了多少任務。不是回答了多少問題,不是生成了多好的內容,而是完成了多少任務。這個指標的轉變,折射出Google對AI能力邊界的重新定義。過去,你是指揮官,AI是士兵,你下一個命令,它執行一個動作。現在,你是老闆,AI是助理,你說一個目標,它自己想辦法完成。從1501 的模型跑分,到收件箱整理的實際演示,再到完成任務數的指標轉變,Gemini 3 的強,不在於它更聰明,而在於它能幹事。Google再次要證明的,不是模型跑分更高,而是 AI 能真正幫你把事做完。第二節|分發效率:發佈當天覆蓋數十億使用者Gemini 3 創造了另一個記錄:Google首次在發佈當天,就把新模型直接整合到搜尋的AI Mode中。這意味著什麼?搜尋的AI Overviews已經覆蓋20億月活使用者,Gemini App月活超過6.5億,1300萬開發者在使用生成模型,70%的雲客戶在使用AI服務。發佈當天,Gemini 3就開始服務這個規模的使用者群。這是完全不同的分發路徑。1、從零到數十億的時間差當前,大多數 AI 公司採用的是“獨立產品”模式,使用者需要主動訪問特定網站或應用、註冊帳號、學習使用介面。無論是ChatGPT、Claude還是其他 AI 產品,都需要使用者主動改變使用習慣。Gemini 3 的路徑完全不同。使用者不需要下載新應用,不需要註冊帳號,不需要學習新介面,只需要像往常一樣打開搜尋或文件,AI 能力就在那裡。Josh Woodward 談到,Google新產品功能之所以讓人興奮,是因為 AI 的融入是無縫的,使用者無需改變任何習慣就能獲得幫助。2、嵌入的具體形態這種分發效率的背後,是Google把Gemini 3嵌入到使用者每天都在用的入口裡:在搜尋中,你搜尋“RNA聚合酶是如何工作的”,AI Mode會即時生成帶有互動式可視化的沉浸式佈局。不是給你一堆連結,而是直接用程式碼生成可互動的科學動畫。在Gmail中,Gemini直接在郵件介面幫你起草回覆、理解上下文、生成建議,不用切換應用,不用複製貼上。在Android系統裡,它接替Google Assistant,用語音幫你跨應用完成任務。比如:你說幫我找到上周和張總的會議紀要,然後發給李經理,它會自動搜尋、找到檔案、打開郵件、完成傳送。在Docs中,它根據文件內容快速總結、補全材料、生成圖表,就在你正在編輯的文件裡。Google能做到這一點,因為這些產品已經在使用者的手機和工作流裡。Gemini 3不需要獲取新使用者,只需要讓現有工具變得更智能。AI 的終局不是一個超級應用,而是一套嵌入式能力。模型只是底層技術,真正的護城河,是那些使用者每天都要用的入口。第三節|生態護城河:只有Google能走的路前兩節展示了Gemini 3能做什麼和如何快速到達使用者。但還有一個更關鍵的問題:為什麼是Google能做到這些?答案是 Sundar Pichai 所說的差異化的全端式方法。從晶片到資料中心,從模型到產品,從使用者到開發者,Google控制了整條鏈路。1、別人需要的,Google已經有了對比很明顯:目前 OpenAI 和 Anthropic 仍然需要說服使用者下載產品、向雲服務商租用算力、與其他平台談整合。Google的使用者已經在用Gmail和搜尋,自己生產TPU晶片,產品矩陣已經覆蓋工作和生活的各個場景。這不是能花錢買到的,也不是能快速建立的。2、不可複製的三層優勢這種全端控制帶來的優勢,體現在三個層面:第一層是算力自主。OpenAI 2025年前9個月算力支出超過86億美元,Anthropic向Azure購買300億美元算力,都需要向雲服務商租用。Google自研TPU,成本和性能自己掌控,這直接決定了能否在發佈當天服務數十億使用者。第二層是資料閉環。搜尋每天數十億次查詢,Gmail數百億封郵件,YouTube數十億次觀看,這些資料既是訓練素材,也是持續最佳化的反饋。其他公司要麼花錢買資料,要麼面對版權訴訟。第三層是產品矩陣。Gemini 3可以在搜尋中測試理解能力,在Gmail中測試生成能力,在Android中測試智能體能力,每個產品都是真實的能力驗證場。這三層優勢疊加,形成了一個其他AI公司無法複製的閉環:自主算力讓大規模部署成為可能,海量資料讓持續最佳化成為現實,產品矩陣讓能力驗證貫穿全鏈路。Demis Hassabis 把 DeepMind 稱為Google的引擎室,為整個Google生態提供AI動力。而Sundar把Gemini稱為推動智能、智能體和個性化前沿的引擎,這意味著Google不是在做一個更好的 AI 工具,而是在重構計算的底層邏輯。當 AI 成為所有數字服務的新介面層,要做的不是一個產品,而是重構整個生態。這就是 Gemini 3真正強的地方:它是唯一一個在發佈當天就讓數十億人用上的 AI。而這,是其他 AI 公司都很難做到的。結語|三個維度,一個答案回到標題的問題:Gemini 3到底強在那?第一,強在能幹事。1501 Elo登頂排行榜,但更重要的是能完成整件事,而不只是回答一個問題。第二,強在能快速到達。發佈當天覆蓋數十億使用者,因為它嵌入了Gmail、搜尋、Android這些使用者每天都在用的工具。第三,強在生態護城河。從自研TPU到產品矩陣,Google控制了從晶片到使用者的整條鏈路。這三個維度合在一起,構成了Gemini 3 真正的強:不只是跑分更高,而是使用方式被改變了。AI 不再是一個你偶爾打開的對話方塊,而是嵌入在你每天工作流裡的執行系統。從獨立APP到嵌入式能力的轉變,正在成為 AI 應用的新共識。同期,阿里巴巴也將千問接入旗下搜尋產品夸克等。“對話方塊”到“生活入口”,這或許就是 AI 的下一站。 (AI深度研究員)