#Google
46.5萬次盲測封王!Grok視訊模型屠榜Arena,Google最強對手來了
【新智元導讀】馬斯克親自站台,grok-image-video-720p在46萬次盲測投票中加冕第一,這款xAI「壓箱底」的視訊模型,不僅在基準測試上超過了GoogleVeo 3.1 Fast,使用成本也更低。剛剛,AI視訊領域又迎來洗牌!xAI的Grok圖像轉視訊模型(grok-image-video-720p)登頂「Image-to-Video Arena」排行榜,以1404分的超高ELO評分力壓群雄,位居第一。馬斯克親自發帖為自家Grok Image模型站台,稱它每周都在迭代最佳化。這次,xAI真是拿出了「壓箱底」的東西,他們將Grok Imagine稱作為自己目前最強悍的「視訊+音訊」生成模型。無論是想讓一張靜態梗圖「活」過來,還是憑空用一句話變出大片,甚至是對複雜的電影級鏡頭進行精細打磨,它都能輕鬆搞定。X平台上,網友用Grok製作的視訊已經迅速刷屏,涵蓋電影特效、動畫製作、日常生活等種種場景。從一些基準測試上來看,Grok-imagine-video-720p不僅擊敗了Google強大的Veo模型,而且生成成本也更低。有網友驚呼,這不僅是AI視訊工具的一次進化,更可能直接推動該領域重新「排座次」。還有網友猜想,Grok的強勢出擊,或將掀起新一輪生成式視訊技術的軍備競賽。揭秘Grok Imagine能幹活、成本低的多模態六邊形戰士Grok Imagine是xAI傾力打造的視訊-音訊生成模型,該模型的最新版本Grok Imagine 1.0於2026年2月初發佈。支援生成10秒長的720p高畫質視訊,並在運動平滑度、原生音訊質量(如情感表達的聲音)以及提示詞遵循能力上均實現了跨越式升級。相比較2025年10月發佈的Imagine v0.9版本,它將核心聚焦於視覺質量、多模態能力,成本和延遲的平衡,真正做到了支援端到端的創意工作流。使用者可以通過文字描述或上傳圖像來動畫化內容,還支援後續指令微調場景。具體而言,Grok Imagine展現了三大核心「殺手鐧」:視訊生成與指令遵循能力Grok Imagine的視訊生成能力,主要用來從零開始建立短影片(通常10-15秒長,支援480p或720p解析度)。它能處理多種輸入方式,比如直接用文字描述場景、動作、燈光和心情來生成視訊,或者上傳一張靜態圖片,讓AI給它「加戲」變成動態視訊。在視訊生成方面,Grok Imagine擁有業界領先的指令遵循能力。你給出的指令再複雜,它也能精準理解並執行。零門檻的視訊編輯能力視訊編輯功能更像是給現有視訊「動手術」,Grok Imagine可以讓你能輕鬆修改內容,而不用專業軟體。它支援重新設計場景(比如換背景或風格)、加入或刪除物體(例如加個道具或去掉多餘元素)、控制動作(調整運動軌跡、速度或相機角度)。操作起來簡單:上傳視訊檔案或URL,然後描述你想改啥,比如「把這個視訊裡的車換成飛船,加點爆炸效果」。AI就會根據你的指令生成編輯後的版本,還保持原視訊的核心元素。視訊編輯適合電影剪輯、廣告調整或內容最佳化,編輯後視訊還能帶原生音訊。更快速度與更低成本的平衡在性能表現方面,不僅要變強,還要變快。因為如果生成速度太慢、價格太貴,大家根本不敢放開手腳去嘗試。因此xAI團隊專門針對延遲、並行量和成本進行了極限最佳化。這讓Grok Imagine不僅跑得快,而且用起來更省錢。它強調高品質、成本和延遲的平衡,支援端到端的創意工作流,包括視訊生成、編輯和音訊同步。評測霸榜,力壓Google在基準測試中,Grok Imagine在圖像轉視訊領域表現出色,尤其在使用者偏好投票和性價比上。在Image-to-Video Arena(arena.ai)排行榜上,Grok-image-video-720p以1404分位居第一(基於46.5萬投票,34個模型),領先Google Veo-3.1-audio-1080p(1402分)。https://arena.ai/zh/leaderboard/image-to-video這是一個基於使用者盲測投票的平台,使用Elo評分系統。評測強調真實世界視訊質量和保真度,而非自動化指標。在另一個獨立排行榜Artificial Analysis Image to Video Leaderboard上,Grok以1337 ELO分領先,評估標準包括質量、生成速度和價格。Grok-image-video在風格、主題和格式一致性上得分高,它的API定價約$4.20/分鐘,低於GoogleVeo 3.1 Fast等競品。https://artificialanalysis.ai/video/leaderboard/image-to-video在一些第三方的專業評測中,Getimg.ai認為Grok Imagine最突出的特點是以視訊形式精準遵循指令,當提示詞描述動作、節奏或轉場時,該模型通常能做出看似經過深思熟慮而非偶然的回應。比如,Grok-image-video在原生音訊(唇同步、自然對話)和電影指令遵循(如平移、變焦)上出色。Grok-image-video的另一個特色,是它很好地解決了低延時這一使用者使用痛點。AI視訊模型在使用場景中,僅靠原始質量已不再足夠,往往需要多輪互動,等待結果的時間過長會抑制使用者嘗試的意願,尤其是當每次生成都代價高昂時。基準測試顯示,Grok Imagine在綜合考量質量、延遲和成本時表現出色。這意味著你可以自由地生成、調整和重新生成視訊,而不會覺得每次輸入提示都是一種負擔。Lovera Digital將Grok與Google Veo 3比較,發現Grok易用性高,適合短影片社交內容,但視訊質量有時抖動。它的最佳用例是快速原型,評分表顯示其在創意短片上競爭力強。Grok Imagine在第三方評測中被視為高效、音訊強的選手,尤其適合創意和快速生成,但需注意一致性和安全問題。如果你想親自體驗一下Grok Imagine,目前可以通過官網(grok.com/imagine)和APP免費試用,或通過API整合(Grok Imagine API)。 (新智元)
Gemini 3.1 Pro突襲:推理能力翻倍,Google打響AI"小步快跑"第一槍
引言當行業還在期待GPT-5.3時,Google用一場".1"版本號革命重新定義了AI迭代節奏。2026年2月24日凌晨,Google突然發佈Gemini 3.1 Pro大模型,這是其首次採用".1"小版本號,但升級幅度卻遠超預期。在ARC-AGI-2基準測試中,Gemini 3.1 Pro得分77.1%,是Gemini 3 Pro(31.1%)的2倍還多。這一突破不僅刷新了Google自身的技術紀錄,更標誌著大模型行業正式進入"高頻小步快跑"的新時代。更關鍵的是定價策略:每百萬token輸入僅2美元,輸出10美元,這一價格直接對標Anthropic Sonnet 4.6,在保持性能領先的同時實現了成本的大幅最佳化。Google用行動證明,AI競爭不再是"參數軍備競賽",而是"效率與速度的比拚"。01 技術突破:推理能力的量子躍遷Gemini 3.1 Pro最引人注目的突破在於推理能力的翻倍提升。傳統大模型升級往往聚焦於參數規模或多模態能力,而Google此次選擇了更艱難的路徑——從根本上提升模型的邏輯推理和問題解決能力。ARC-AGI-2基準測試的77.1%得分意味著什麼?這一測試專門評估AI系統的抽象推理能力,要求模型從有限示例中歸納出通用規則,並應用於全新場景。77.1%的得分不僅超越了所有前代Gemini模型,更接近了人類專家的表現水平。對比之下,GPT-5.2在同一測試中的得分為68.3%,Claude Opus 4.6為72.8%。多模態能力的全面進化同樣令人印象深刻。Gemini 3.1 Pro支援100萬token超長上下文窗口,能夠一次性處理整本書等級的文件或大型程式碼庫。在創意程式設計方面,模型能夠直接生成3D版"椋鳥群飛"動畫,並支援手勢追蹤互動,實現了從靜態內容生成到動態互動體驗的跨越。vibe coding能力的同步增強為開發者帶來了全新體驗。模型能夠更好地理解程式碼背後的設計意圖和架構邏輯,而不僅僅是語法正確性。實測資料顯示,在處理複雜演算法重構、架構最佳化等任務時,Gemini 3.1 Pro的精準率比前代提升45%。02 行業意義:從"整數版本"到".1迭代"的範式轉變Google首次採用".1"小版本號,這一看似微小的變化背後,是AI行業發展邏輯的根本性轉變。高頻小步快跑成為新常態。傳統上,大模型迭代以整數版本為單位,升級周期長達數月甚至半年。Gemini 3.1 Pro的發佈預示著,未來AI能力的進化將更加頻繁、更加精細。預計未來6個月內,我們將看到更多".1"、".2"等級的快速迭代,而非傳統的整數版本更新。企業應用更新機製麵臨重構。對於依賴AI服務的企業而言,這意味著需要建立更敏捷的AI應用更新機制。傳統"一年一升級"的節奏將被打破,企業需要能夠快速適配模型能力的持續最佳化,保持競爭優勢。技術競爭維度更加多元。當版本迭代頻率提升,競爭不再侷限於"誰先發佈大版本",而是"誰能持續提供最優體驗"。這要求廠商在模型最佳化、工程效率、生態建設等多個維度保持領先。使用者受益程度顯著提升。更頻繁的迭代意味著使用者能夠更快享受到技術進步帶來的價值。無論是開發者工具的增強,還是消費級應用的體驗最佳化,都將以更快的節奏呈現給終端使用者。03 定價策略:性能領先下的成本最佳化Gemini 3.1 Pro的定價策略同樣體現了Google的戰略思考。每百萬token輸入2美元、輸出10美元的價格,在保持性能領先的同時,實現了對競品的成本優勢。對比分析顯示:相比Anthropic Sonnet 4.6(輸入3美元、輸出15美元),Gemini 3.1 Pro便宜33%相比OpenAI GPT-5.2 Turbo(輸入5美元、輸出15美元),成本優勢更加明顯在相同預算下,企業可以處理更多token量,實現更高的投入產出比中小企業市場成為重點。傳統高性能AI服務主要被大型企業壟斷,而Gemini 3.1 Pro的親民定價,意味著更多中小企業能夠負擔得起頂尖AI能力。這對於加速AI技術普惠、推動行業數位化轉型具有重要意義。開發者生態的吸引力增強。對於個人開發者和初創團隊而言,成本是選擇AI服務的關鍵考量。Gemini 3.1 Pro的性價比優勢,將吸引更多開發者加入Google生態,推動應用創新的繁榮。04 生態佈局:從模型到應用的全鏈路最佳化Gemini 3.1 Pro的發佈不是孤立事件,而是GoogleAI生態戰略的重要一環。Gemini App已全面上線。普通使用者可以通過Gemini App直接體驗新模型,享受比前代更精準的複雜問題解答能力。實測顯示,在處理數學證明、邏輯推理、專業諮詢等任務時,新模型的精準率和響應速度均有顯著提升。API服務的全面升級。開發者可以通過Gemini API快速接入新模型,享受推理能力翻倍帶來的效率提升。Google同時最佳化了API的穩定性和響應速度,確保企業級應用的高可用性。多模態創作工具鏈完善。結合Gemini 3.1 Pro強大的多模態能力,Google推出了全新的創意工具套件,支援"文生視訊+互動"的新型內容形式。這對於內容創作者、教育工作者、行銷人員等群體具有重要價值。企業級解決方案深化。針對金融、醫療、法律等垂直行業,Google提供了基於Gemini 3.1 Pro的定製化解決方案,幫助企業在保持資料安全的前提下,享受AI技術帶來的效率提升。05 競爭格局:三巨頭技術路線的分化Gemini 3.1 Pro的發佈,進一步凸顯了AI三巨頭技術路線的分化。Google的"推理優先"路線。通過持續最佳化模型的邏輯推理能力,Google正在建構差異化的技術優勢。在需要複雜問題解決、專業諮詢、科學計算等場景中,Gemini系列的表現日益突出。OpenAI的"通用能力"路線。GPT系列繼續強化其通用性和適應性,在保持各方面能力均衡的同時,通過規模效應降低成本。但整數版本迭代周期較長,可能面臨敏捷性挑戰。Anthropic的"安全與專業"路線。Claude系列在AI安全、專業任務處理上持續深耕,特別是在程式碼安全、法律合規等垂直領域建立了獨特優勢。但定價相對較高,可能限制其規模化應用。國產大模型的追趕壓力。雖然DeepSeek、智譜GLM-5等國產模型在特定領域表現出色,但在推理能力的系統性提升上仍需追趕。Gemini 3.1 Pro的發佈,為國產模型提供了重要的技術參考和競爭標竿。06 實測體驗:從"工具"到"思維夥伴"的進化對於一線使用者而言,Gemini 3.1 Pro帶來的體驗升級是實實在在的。複雜問題處理能力顯著提升。在測試中,模型能夠準確解答研究生等級的數學證明題,理解複雜的法律條文邏輯,提供專業的醫療諮詢建議。這種能力的提升,讓AI從簡單的資訊檢索工具,進化為真正的"思維夥伴"。長文件理解更加精準。得益於100萬token的上下文窗口,模型能夠準確理解整本書、大型程式碼庫、複雜研究報告的內容。在處理學術論文審稿、程式碼架構評審等任務時,表現接近人類專家水平。創意表達更加豐富。在內容創作測試中,模型不僅能夠生成高品質的文字內容,還能夠創作互動式動畫、設計複雜的資料可視化圖表、製作專業的簡報。這種多模態創作能力,為創意工作者提供了全新的工具。響應速度持續最佳化。官方資料顯示,Gemini 3.1 Pro的響應時間相比前代縮短30%,在處理複雜推理任務時,使用者能夠感受到明顯的流暢度提升。也看到了Gemini新增的製作音樂模組(終於有人挑戰suno了),試了一下做一首30秒的武俠歌曲,完成度也很不錯。gemini給我做的國風武俠電影主題曲07 未來展望:AI發展的新節奏與新挑戰Gemini 3.1 Pro的發佈,不僅是一個產品的升級,更預示著AI行業發展的新節奏。技術迭代的加速度。".1"版本號的出現,意味著技術進步的顆粒度更加精細,迭代頻率更加密集。這要求整個行業建立更加敏捷的研發體系、更加靈活的部署架構、更加智能的測試方法。應用創新的新機遇。更強大的推理能力,將催生更多創新應用場景。從智能教育輔導到專業諮詢服務,從科學計算輔助到複雜決策支援,AI的應用邊界將持續擴展。人才需求的結構性變化。隨著AI能力的快速進化,對AI人才的需求將從"模型訓練專家"向"應用創新專家"轉變。能夠將AI能力與行業需求深度結合的人才,將成為市場的新寵。倫理治理的緊迫性。更強大的推理能力,也帶來了新的倫理挑戰。如何確保AI系統的決策透明、公平、可控,將成為行業必須面對的重要課題。結語Google的這次".1版本突襲",表面上是技術升級,深層則是行業競爭邏輯的根本性轉變。當AI發展從"整數版本躍進"轉向"小數版本迭代",整個行業的節奏、格局、規則都將被重新定義。推理能力的翻倍提升,不僅僅是技術參數的最佳化,更是AI從"資訊處理工具"向"智能思維夥伴"進化的重要里程碑。在這個AI重新定義一切的時代,能夠率先突破推理瓶頸、建構持續最佳化能力的企業,將掌握下一個階段的發展主動權。真正的競爭才剛剛開始。技術優勢需要轉化為生態優勢,單點突破需要擴展為系統領先。對於全球AI產業而言,Gemini 3.1 Pro的發佈既是挑戰,也是機遇。在這個AI從"炫技"走向"實用"的關鍵轉折點,能夠平衡技術創新與商業落地的企業,將引領行業進入更加成熟、務實的新階段。當矽谷醒來時,會發現AI競爭的規則已經改變。這場始於".1版本號"的技術革命,或許將開啟全球AI發展的新篇章——一個更加注重實用性、可及性和可持續性的新篇章。 (遊戲AI說)
Google 的新系統,又延到 2028 年了
過去十年,科技行業最著名的“狼來了”故事之一,就是 Google 要統一 Android 和 ChromeOS。從早年的 Andromeda(仙女座)到後來的 Fuchsia,每一次傳聞都讓外界興奮,但每一次都無疾而終。但這一次,情況可能會發生一些變化了。隨著近期反壟斷法庭內部檔案的曝光以及 Google Android 生態系統總裁的公開表態,Google 在 PC 作業系統上的最終底牌被徹底掀開:ChromeOS 正在被實質性地“吃掉”,未來的 Google PC 將運行在一個以 Android 為絕對核心、內部代號為“Aluminium OS”的全新系統上。圖源:網路然而,原本業內預期能在 2026 年看到的這場“系統大一統”,在近期卻被曝出全面推送時間將延期至 2028 年。那這個延期到 2028 年的新系統,和現有的作業系統相比到底有什麼本質不同?它又憑什麼去挑戰 Windows 和 macOS 呢?Aluminium OS 到底是什麼?要理解 Aluminium OS,首先要打破過去對“ChromeOS 運行 Android 應用”的刻板印象。以前的 ChromeOS,本質上是一個極其輕量級的 Linux 發行版,它的核心是一個巨大的 Chrome 瀏覽器。為了彌補應用生態的匱乏,Google 在裡面塞入了一個 Android 容器(ARCVM)來跑 Android 應用。這種“套殼”方案的體驗極其撕裂:不僅佔用額外的系統資源,且 Android 應用在桌面窗口下的互動、快速鍵支援和生命周期管理都如同災難。圖源:網路Aluminium OS 不再是“在瀏覽器裡跑 Android”,而是直接將系統底層換成了 Android。這意味著,新系統將直接採用 Android 的 Linux 核心分支、Android 的系統框架和應用運行環境。Google 工程師正在將 ChromeOS 優秀的桌面級窗口管理、工作列邏輯以及全功能的桌面版 Chrome 瀏覽器,以系統級元件的形式“嫁接”到全新的 Android 底座上。圖源:網路這與現有作業系統最大的不同在於:它是一個真正的“桌面版 Android”,所有的移動端應用都能以最高性能、最原生的權限在 PC 上運行,徹底消滅了容器帶來的性能損耗。同時,過去 ChromeOS 過度依賴 Web App(PWA),而 Android 過度依賴 Native App。新系統在底層打通了兩者,讓 PWA 和 Android 原生應用享有同等的系統級權限和調度優先順序。對比前任 ChromeOS:從“網頁版”到“全能 AI 載體”如果說 ChromeOS 是一台“必須永遠即時線上的雲端網頁系統”,那麼 Aluminium OS 就是一台真正意義上的“全天候計算裝置”。ChromeOS 的設計初衷是重度依賴雲端,這讓它在網路不佳的環境下顯得極為孱弱。而以 Android 為底座的這套新系統,天生具備強大的本地計算、本地儲存和離線應用能力。它不再是一個單純的“網頁版”,而是擁有完整本地運行邏輯的現代作業系統。圖源:網路從這幾年移動端的發展可以看出,Android 在折疊屏、平板電腦上的演進,已經為其積累了大量的大屏顯示和多工處理經驗。這使得新系統不再侷限於廉價的“上網本”,而是可以無縫擴展到二合一裝置、高端桌面工作站甚至未來的 XR 頭顯裝置中。而端側 AI 的“原生土壤”,是 Google 拋棄 ChromeOS 最核心的導火索。在 Gemini 時代,AI 需要深度介入作業系統的底層介面,呼叫 NPU 算力,並理解使用者的全域螢幕上下文。要在架構老舊、以瀏覽器沙盒為核心的 ChromeOS 上部署深度整合的端側 AI Agent,成本極高且效率低下。而 Android 早就為端側大模型(如 Gemini Nano)做好了底層 API 準備。統一底座,意味著 Google 只需要開發一次 AI 功能,就能跨手機、平板、PC 瞬間鋪開,做到類似華為鴻蒙的“一次開發,多端部署”。挑戰 Windows 與 macOS在 PC 桌面端,微軟的 Windows 和蘋果的 macOS 構築了看似牢不可破的護城河。但隨著 ARM 架構和 AI 的爆發,這道城牆上出現了一道裂縫,Aluminium OS 正是 Google 試圖撬開這道裂縫的利刃。對抗 Windows:沒有歷史包袱的 ARM 原生系統微軟這幾年正在瘋狂推進 Windows on ARM,試圖借助高通驍龍 X Elite 晶片擺脫 x86 的能效劣勢。但 Windows 最大的痛苦在於它沉重的歷史包袱:它必須通過複雜的轉譯層(Prism)去相容過去三十年積累的海量 x86 傳統軟體,轉譯帶來的不僅是性能損耗,還有各種難以預料的 Bug。而 Aluminium OS 是輕裝上陣的。Android 本就是 ARM 架構下最龐大、最成熟的作業系統。 它不需要任何轉譯層,一出生就擁有百萬等級的原生 ARM 應用生態。圖源:網路在未來的驍龍 PC 或聯發科 PC 上,Google 的系統將展現出比 Windows 更極致的能效比和續航表現,這是一種沒有技術債的“降維打擊”。對抗 macOS:用“開放式連續互通”打破蘋果的“圍牆”蘋果之所以能牢牢鎖住高端使用者,靠的是 iPhone、iPad、Mac 之間無縫的“連續互通”體驗——剪貼簿共享、隔空投送、甚至現在的 iPhone 鏡像。而 Google 苦於在 PC 端一直缺乏一個強有力的第一方系統來承接數量龐大的 Android 手機使用者。Aluminium OS 的出現,補齊了 Google 硬體生態的最後一塊拼圖。因為底層同源,未來的 Android 手機與 Google PC 之間,可以實現比蘋果更深度的底層互通。更重要的是,這是一個開放生態:無論是三星、vivo、OPPO、小米還是榮耀,任何 Android 手機品牌都可以接入這個桌面系統生態,用“群狼戰術”去對抗蘋果的封閉花園。為什麼還要延期?顯然,Aluminium OS 是一個極具野心、邏輯也完全自洽的戰略。但從幾年前暗指的 2026 年,拖延到反壟斷檔案中披露的 2028 年才全面推送,Google 的“大象轉身”顯然遇到了劇烈的陣痛。教育和企業市場的“維穩”壓力ChromeOS 佔據了北美 K12 教育市場超過 60% 的份額,這是一隻“會下金蛋的鵝”。教育和企業 IT 管理員最看重的是穩定、安全和易於批次部署。直接把底層換成 Android,意味著原有的管理策略、安全沙盒機制甚至老舊的 Web 外掛都面臨失效風險。為了防止客戶恐慌性地流失到 Windows 或 iPad 陣營,Google 必須給出極其漫長的過渡期,甚至承諾為現有的傳統 ChromeOS 提供長達至 2034 年的維護支援。2028 年全面推送,或許是為了給企業留足 3-4 年的測試和消化時間。桌面級 App 生態的“重塑”需要時間雖然 Android 有幾百萬個 App,但絕大多數依然是只適合豎屏滑動的“大號手機 App”,這也是為什麼Android Pad 體驗一直追不上 iPad 的核心原因之一。要讓 Aluminium OS 具備挑戰 Windows 和 Mac 的生產力,不僅需要解決多窗口拖曳的 Bug,還需要 Adobe、微軟以及各大專業生產力軟體廠商願意為“桌面版 Android”開發具有鍵鼠互動邏輯的專業版本,說服開發者做適配,從來不是一朝一夕的事。反壟斷法庭的陰霾近兩年,Google 面臨著美國司法部前所未有的反壟斷審查壓力(從搜尋壟斷到廣告業務拆分危機)。在這個節骨眼上,如果急於推出一個將 Android 統治力直接延伸到 PC 桌面的“超級系統”,極有可能招來監管機構關於“濫用移動市場支配地位打擊桌面競爭對手”的新一輪猛烈炮火,放緩腳步也是一種規避監管風頭的策略。Google 的一場“賭局”從 2026 延期到 2028,看似是 Google 效率低下的又一次體現,但實際上這或許是這家巨頭近年來最深思熟慮的一次戰略重構。放棄對 ChromeOS 的執念,將所有資源 All-in Android,是 Google 面對 AI 時代和 ARM 時代唯一正確的選擇。2028 年雖然遙遠,但當搭載著 Aluminium OS、深度整合原生大模型、且能與數以十億計的 Android 手機無縫協同的 PC 真正落地時,沉寂已久的桌面作業系統市場,必將迎來一場真正的洗牌。 (硅星人Pro)
比AI殺死SaaS更可怕的敘事:AI和你的競爭對手開始合作
核心論點最近半年,OpenAI、Anthropic、Google這些AI巨頭正在與網際網路各垂直領域的玩家結盟,建構全新的競爭壁壘。這種"AI+盟友"的組合拳,對網際網路領域的競爭對手們形成了三重打擊:流量入口被截流、商業模式被替代、估值邏輯被顛覆。六大標誌性合作事件全景事件1:OpenAI × Stripe × Etsy/Shopify——AI電商閉環的誕生時間: 2025年9月29日事件: OpenAI在ChatGPT中推出"Instant Checkout"功能,與Stripe聯合開發"Agentic Commerce Protocol"(ACP),首批接入美國Etsy賣家,隨後擴展至超過100萬Shopify商戶(包括Glossier、SKIMS、Spanx、Vuori等品牌)。使用者可以在對話中直接完成從商品發現到支付的全流程,無需跳轉任何外部網站。股價衝擊:Etsy (ETSY): 宣佈當天暴漲16%,但次日回吐大部分漲幅Shopify (SHOP): 當天上漲超過6%最大輸家——Google (GOOGL): Fortune雜誌將此事件定義為"對Google搜尋廣告的直接挑戰"。當ChatGPT的7億周活使用者開始在對話中直接購物,Google Shopping和搜尋廣告的商業邏輯面臨根本性威脅競爭分析: 這一事件的本質不是"AI幫你買東西",而是OpenAI正在建構一個繞過Google搜尋、繞過Amazon商城的全新商品發現與交易閉環。Walmart隨後也在10月宣佈接入ChatGPT,Target緊隨其後。而Amazon採取了截然相反的策略——向Perplexity AI的Comet瀏覽器傳送停止侵權函,試圖阻止使用者通過AI平台購買其商品。事件2:OpenAI × Disney——AI內容帝國的IP聯盟時間: 2025年12月11日事件: Disney與OpenAI簽署三年期合作協議,Disney投資10億美元獲取OpenAI股權,同時將200多個迪士尼、漫威、皮克斯、星球大戰IP角色授權給OpenAI的Sora視訊生成工具。使用者可以在Sora中使用這些角色創作短影片內容,部分內容將在Disney+上線。協議第一年為OpenAI獨佔,此後Disney可向其他AI公司授權。股價衝擊:Disney (DIS): 市場反應溫和正面,但DIS全年漲幅僅約1.4%,大幅跑輸標普500競爭層面衝擊最大的是AI視訊賽道: Runway、Midjourney等此前無法獲得頂級IP的AI視訊工具被OpenAI甩開。CNN分析指出,Disney選擇OpenAI而非Google(因"利益衝突太多,光YouTube的競爭就談不完"),也非Midjourney("太小"),形成了一種精準的戰略排他競爭分析: 更深層的衝擊在於——Disney同日向Google發出停止侵權函,指控其"大規模侵犯迪士尼版權"。這形成了一個極具諷刺性的畫面:AI大模型不僅在搶內容平台的使用者,還在幫助傳統IP巨頭建構針對競爭對手的法律護城河。YouTube Shorts、Instagram Reels、TikTok的UGC內容生態,都將面臨來自"AI+正版IP"的降維打擊。事件3:Anthropic Cowork外掛——引爆"SaaSpocalypse"時間: 2026年1月30日發佈,2月3日市場暴跌事件: Anthropic為其Claude Cowork桌面端AI助手發佈11個行業垂直外掛,覆蓋法律、金融、銷售、資料分析、市場行銷、客服等領域。Cowork不同於傳統聊天機器人——它可以規劃、執行多步驟工作流,在本地檔案系統中操作,並通過Model Context Protocol(MCP)連接企業系統。股價衝擊("SaaSpocalypse"——SaaS末日):競爭分析: LPL Financial股票研究主管Thomas Shipp一語道破核心邏輯:"如果內部開發用AI更省時間,我為什麼還要付軟體訂閱費?更重要的是,像Claude Cowork這樣的應用讓非技術使用者也能替代現有工作流。"關鍵的是,這次暴跌不僅僅打擊了直接競爭對手。金融資料提供商(S&P Global、Moody's、Nasdaq Inc.)、印度IT外包巨頭(Infosys、TCS、Wipro)、甚至倫敦證券交易所集團都被波及。市場的恐慌不是"Anthropic會替代Salesforce",而是"AI正在從生產力增強工具變成軟體和服務價值鏈的直接替代品"。僅四天後(2月6日),Anthropic發佈Claude Opus 4.6——一個擅長金融分析和研究的高級模型,進一步衝擊FactSet、S&P Global等金融資料股票。Gartner在研究報告中試圖給市場降溫,稱"SaaS死亡論為時過早",但也承認新模型"暴露了日常知識工作中仍有多少是手工的,因此極易被自動化"。事件4:Perplexity × Tripadvisor——AI搜尋重構旅遊發現時間: 2025年1月9日事件: Tripadvisor與AI搜尋引擎Perplexity達成付費資料授權合作,將其10億條使用者評論、AI摘要、Viator旅行體驗等資料接入Perplexity的對話式搜尋。這是Perplexity在旅遊領域的首個合作夥伴。三年期協議涵蓋資料授權費和佣金分成。競爭影響:Tripadvisor CEO Matt Goldberg在財報電話會中表示,通過Perplexity來的使用者是"增量的"且"高意向的"——轉化率高於傳統流量Tripadvisor月訪問量從2023年初的約1.6億下滑至2025年2月的1.2億,主要受Google AI Overviews衝擊合作的本質是Tripadvisor在"叛逃"——它在Google的生態中受損,轉而擁抱Google的AI競爭對手最大輸家——Google搜尋與Booking.com: 行業分析指出,如果AI對話成為旅行購物的主要起點,沒有原生、無縫交易能力的平台將處於顯著劣勢。Booking.com被迫向各AI平台提供庫存資料——這不是實力的象徵,而是話語權的喪失。每一個合作公告,都是在慶祝Booking.com角色的弱化。事件5:OpenAI × Oracle——3000億美元雲端運算協議時間: 2025年(多階段推進,Stargate項目框架下)事件: OpenAI與Oracle簽署多年期雲端運算和電力容量採購協議,規模達3000億美元。這一交易使Oracle幾乎在一夜之間從傳統資料庫廠商轉型為AI基礎設施的關鍵玩家。股價衝擊:Oracle在2025年9月簽約後股價暴漲約40%但隨後在12月財報後下跌10%,自簽約高點已累計下跌41%Nvidia與OpenAI的戰略合作估值約1000億美元,進一步鞏固了"AI算力聯盟"的格局競爭分析: 這裡的"AI聯手競爭對手"邏輯更為隱蔽——OpenAI同時與Microsoft Azure(2500億+美元)、AWS(380億美元)、Google Cloud建立了深度合作。三大雲廠商本應是競爭對手,卻都在爭當OpenAI的"基礎設施供應商",形成了一種詭異的"共同依賴"關係。FTC對此發佈了專門的6(b)研究報告,調查Microsoft-OpenAI、Amazon-Anthropic、Google-Anthropic三組合作關係的市場影響。事件6:Anthropic × Snowflake / Accenture——企業AI代理的全面滲透時間: 2025年12月事件:Snowflake合作(2億美元多年期協議): Claude模型深度嵌入Snowflake資料雲,12,600+客戶可通過AWS、Google Cloud、Azure呼叫Claude進行結構化和非結構化資料分析。複雜SQL查詢精準率超過90%Accenture合作: 成立"Accenture Anthropic Business Group",約30,000名Accenture專業人員將接受Claude培訓,共同為金融、醫療、公共部門客戶部署AI競爭分析: 這兩個合作的可怕之處在於——Anthropic不是在和企業競爭,而是在通過管道合作夥伴"寄生"在競爭對手的客戶體內。當3萬名Accenture顧問開始向客戶推薦Claude而非Salesforce、ServiceNow或自研方案時,傳統SaaS公司的管道壁壘就被從內部瓦解了。競爭衝擊的傳導機制第一層:流量截流——"發現"環節被AI壟斷OpenAI的ChatGPT每周7億活躍使用者、Perplexity的AI搜尋、Google自身的Gemini——三者正在重新定義"使用者如何發現商品、服務和資訊"。當OpenAI通過Instant Checkout把購物閉環留在對話內,Google Shopping和Amazon的流量入口價值就被稀釋了。第二層:模式替代——SaaS訂閱邏輯被瓦解Anthropic Cowork外掛引發的"SaaSpocalypse"證明了一個殘酷事實:如果AI agent能直接完成法律研究、金融分析、客戶支援的全流程,那麼按座收費的SaaS模式就面臨存續危機。這不是"AI增強SaaS",而是"AI繞過SaaS"。第三層:估值重構——從"增長溢價"到"替代折價"2025年全年,SaaS公司只有71%超出營收預期(全科技類股為85%)。市場正在為"AI替代風險"定價。Salesforce年初至今(截至2026年2月)下跌26%,是道指表現最差的股票之一。關鍵資料圖譜AI合作對不同類股的股價衝擊強度結論與前瞻核心洞察2025-2026年AI大模型的合作戰略,正在從"to B賣API"轉向"與B聯手改變C的行為"。這種轉變的可怕之處在於:你的競爭對手不需要自己建AI——它只需要和OpenAI或Anthropic簽一個合作協議,就能獲得對你的不對稱優勢AI公司不是中立的基礎設施——當OpenAI與Etsy/Shopify結盟時,它事實上成為了Amazon的競爭對手;當Anthropic發佈法律外掛時,它事實上成為了Thomson Reuters的競爭對手排他性正在成為新武器——Disney給OpenAI一年獨佔期的同時,向Google發停止侵權函。未來,"誰先和頂級AI結盟"將成為與"誰先上市"同等重要的戰略選擇前瞻性判斷Anthropic CEO Dario Amodei的預言——"AI可能在未來1-5年內取代半數入門級白領工作"——正在通過產品發佈逐步兌現。Gartner的安撫("SaaS死亡論為時過早")在短期內可能成立,但2850億美元的單日市值蒸發表明,市場已經在為最壞情況預先定價。對投資者的啟示: 在評估任何網際網路公司時,你需要新增一個分析維度——"這家公司是否有可能成為下一個被AI大模型'聯手競爭對手'打擊的對象?" 如果答案是肯定的,那麼無論當前財務資料多麼健康,都需要對估值施加一個"AI替代折價"。 (FinHub)
Google 的新系統,又延到 2028 年了
過去十年,科技行業最著名的“狼來了”故事之一,就是 Google 要統一 Android 和 ChromeOS。從早年的 Andromeda(仙女座)到後來的 Fuchsia,每一次傳聞都讓外界興奮,但每一次都無疾而終。但這一次,情況可能會發生一些變化了。隨著近期反壟斷法庭內部檔案的曝光以及 Google Android 生態系統總裁的公開表態,Google 在 PC 作業系統上的最終底牌被徹底掀開:ChromeOS 正在被實質性地“吃掉”,未來的 Google PC 將運行在一個以 Android 為絕對核心、內部代號為“Aluminium OS”的全新系統上。圖源:網路然而,原本業內預期能在 2026 年看到的這場“系統大一統”,在近期卻被曝出全面推送時間將延期至 2028 年。那這個延期到 2028 年的新系統,和現有的作業系統相比到底有什麼本質不同?它又憑什麼去挑戰 Windows 和 macOS 呢?圍剿“大疆 PoAluminium OS 到底是什麼?要理解 Aluminium OS,首先要打破過去對“ChromeOS 運行 Android 應用”的刻板印象。以前的 ChromeOS,本質上是一個極其輕量級的 Linux 發行版,它的核心是一個巨大的 Chrome 瀏覽器。為了彌補應用生態的匱乏,Google 在裡面塞入了一個 Android 容器(ARCVM)來跑 Android 應用。這種“套殼”方案的體驗極其撕裂:不僅佔用額外的系統資源,且 Android 應用在桌面窗口下的互動、快速鍵支援和生命周期管理都如同災難。圖源:網路Aluminium OS 不再是“在瀏覽器裡跑 Android”,而是直接將系統底層換成了 Android。這意味著,新系統將直接採用 Android 的 Linux 核心分支、Android 的系統框架和應用運行環境。Google 工程師正在將 ChromeOS 優秀的桌面級窗口管理、工作列邏輯以及全功能的桌面版 Chrome 瀏覽器,以系統級元件的形式“嫁接”到全新的 Android 底座上。圖源:網路這與現有作業系統最大的不同在於:它是一個真正的“桌面版 Android”,所有的移動端應用都能以最高性能、最原生的權限在 PC 上運行,徹底消滅了容器帶來的性能損耗。同時,過去 ChromeOS 過度依賴 Web App(PWA),而 Android 過度依賴 Native App。新系統在底層打通了兩者,讓 PWA 和 Android 原生應用享有同等的系統級權限和調度優先順序。對比前任 ChromeOS:從“網頁版”到“全能 AI 載體”如果說 ChromeOS 是一台“必須永遠即時線上的雲端網頁系統”,那麼 Aluminium OS 就是一台真正意義上的“全天候計算裝置”。ChromeOS 的設計初衷是重度依賴雲端,這讓它在網路不佳的環境下顯得極為孱弱。而以 Android 為底座的這套新系統,天生具備強大的本地計算、本地儲存和離線應用能力。它不再是一個單純的“網頁版”,而是擁有完整本地運行邏輯的現代作業系統。圖源:網路從這幾年移動端的發展可以看出,Android 在折疊屏、平板電腦上的演進,已經為其積累了大量的大屏顯示和多工處理經驗。這使得新系統不再侷限於廉價的“上網本”,而是可以無縫擴展到二合一裝置、高端桌面工作站甚至未來的 XR 頭顯裝置中。而端側 AI 的“原生土壤”,是 Google 拋棄 ChromeOS 最核心的導火索。在 Gemini 時代,AI 需要深度介入作業系統的底層介面,呼叫 NPU 算力,並理解使用者的全域螢幕上下文。要在架構老舊、以瀏覽器沙盒為核心的 ChromeOS 上部署深度整合的端側 AI Agent,成本極高且效率低下。而 Android 早就為端側大模型(如 Gemini Nano)做好了底層 API 準備。統一底座,意味著 Google 只需要開發一次 AI 功能,就能跨手機、平板、PC 瞬間鋪開,做到類似華為鴻蒙的“一次開發,多端部署”。挑戰 Windows 與 macOS在 PC 桌面端,微軟的 Windows 和蘋果的 macOS 構築了看似牢不可破的護城河。但隨著 ARM 架構和 AI 的爆發,這道城牆上出現了一道裂縫,Aluminium OS 正是 Google 試圖撬開這道裂縫的利刃。對抗 Windows:沒有歷史包袱的 ARM 原生系統微軟這幾年正在瘋狂推進 Windows on ARM,試圖借助高通驍龍 X Elite 晶片擺脫 x86 的能效劣勢。但 Windows 最大的痛苦在於它沉重的歷史包袱:它必須通過複雜的轉譯層(Prism)去相容過去三十年積累的海量 x86 傳統軟體,轉譯帶來的不僅是性能損耗,還有各種難以預料的 Bug。而 Aluminium OS 是輕裝上陣的。Android 本就是 ARM 架構下最龐大、最成熟的作業系統。 它不需要任何轉譯層,一出生就擁有百萬等級的原生 ARM 應用生態。圖源:網路在未來的驍龍 PC 或聯發科 PC 上,Google 的系統將展現出比 Windows 更極致的能效比和續航表現,這是一種沒有技術債的“降維打擊”。對抗 macOS:用“開放式連續互通”打破蘋果的“圍牆”蘋果之所以能牢牢鎖住高端使用者,靠的是 iPhone、iPad、Mac 之間無縫的“連續互通”體驗——剪貼簿共享、隔空投送、甚至現在的 iPhone 鏡像。而 Google 苦於在 PC 端一直缺乏一個強有力的第一方系統來承接數量龐大的 Android 手機使用者。Aluminium OS 的出現,補齊了 Google 硬體生態的最後一塊拼圖。因為底層同源,未來的 Android 手機與 Google PC 之間,可以實現比蘋果更深度的底層互通。更重要的是,這是一個開放生態:無論是三星、vivo、OPPO、小米還是榮耀,任何 Android 手機品牌都可以接入這個桌面系統生態,用“群狼戰術”去對抗蘋果的封閉花園。為什麼還要延期?顯然,Aluminium OS 是一個極具野心、邏輯也完全自洽的戰略。但從幾年前暗指的 2026 年,拖延到反壟斷檔案中披露的 2028 年才全面推送,Google 的“大象轉身”顯然遇到了劇烈的陣痛。教育和企業市場的“維穩”壓力ChromeOS 佔據了北美 K12 教育市場超過 60% 的份額,這是一隻“會下金蛋的鵝”。教育和企業 IT 管理員最看重的是穩定、安全和易於批次部署。直接把底層換成 Android,意味著原有的管理策略、安全沙盒機制甚至老舊的 Web 外掛都面臨失效風險。為了防止客戶恐慌性地流失到 Windows 或 iPad 陣營,Google 必須給出極其漫長的過渡期,甚至承諾為現有的傳統 ChromeOS 提供長達至 2034 年的維護支援。2028 年全面推送,或許是為了給企業留足 3-4 年的測試和消化時間。桌面級 App 生態的“重塑”需要時間雖然 Android 有幾百萬個 App,但絕大多數依然是只適合豎屏滑動的“大號手機 App”,這也是為什麼Android Pad 體驗一直追不上 iPad 的核心原因之一。要讓 Aluminium OS 具備挑戰 Windows 和 Mac 的生產力,不僅需要解決多窗口拖曳的 Bug,還需要 Adobe、微軟以及各大專業生產力軟體廠商願意為“桌面版 Android”開發具有鍵鼠互動邏輯的專業版本,說服開發者做適配,從來不是一朝一夕的事。反壟斷法庭的陰霾近兩年,Google 面臨著美國司法部前所未有的反壟斷審查壓力(從搜尋壟斷到廣告業務拆分危機)。在這個節骨眼上,如果急於推出一個將 Android 統治力直接延伸到 PC 桌面的“超級系統”,極有可能招來監管機構關於“濫用移動市場支配地位打擊桌面競爭對手”的新一輪猛烈炮火,放緩腳步也是一種規避監管風頭的策略。Google 的一場“賭局”從 2026 延期到 2028,看似是 Google 效率低下的又一次體現,但實際上這或許是這家巨頭近年來最深思熟慮的一次戰略重構。放棄對 ChromeOS 的執念,將所有資源 All-in Android,是 Google 面對 AI 時代和 ARM 時代唯一正確的選擇。2028 年雖然遙遠,但當搭載著 Aluminium OS、深度整合原生大模型、且能與數以十億計的 Android 手機無縫協同的 PC 真正落地時,沉寂已久的桌面作業系統市場,必將迎來一場真正的洗牌。 (不客觀實驗室)
The Information:如果OpenAI估值8300億美元,那Google該值多少?
OpenAI最新融資估值約8300億美元,約為2027年預期收入的14倍;而Google卻僅約6.7倍。按倍數類比,Google與OpenAI之間存在約2倍的“定價尺度差”。分析指出,市場過度放大了AI顛覆的風險,卻忽視了Google、微軟等巨頭在AI轉型中的資源優勢與安全邊際。OpenAI被私募市場抬到8300億美元之際,一個尖銳問題浮出:同在AI賽道,Google為何在二級市場只拿到不到一半的營收估值倍數?本周四,納斯達克指數下跌0.4%,科技股拋壓持續。這看似是2026年2月平淡的一天,但市場深處正湧動著一種劇烈的割裂感:投資者對AI顛覆現有巨頭的焦慮揮之不去,持續壓制著Google等領軍企業的股價;與此同時,OpenAI等未上市的AI龍頭卻在以不斷刷新認知的估值融資。科技媒體The Information分析師Martin Peers剖析道,如果投資者認可OpenAI 8300億美元的估值,那麼從邏輯上講,這對Google應當是利多。根據標普全球市場財智(S&P Global Market Intelligence)的資料,以8300億美元計算,ChatGPT的締造者OpenAI的估值達到了其2027年預計營收的14倍。相比之下,Google目前的交易價格僅為其2027年預計營收的6.7倍。從倍數算術看,這意味著若用同樣的“2027年收入倍數”去衡量,Google對應的估值倍數需要接近當前的約2.1倍才可對齊(14/6.7≈2.1)。需要注意的是,這只是對“定價尺度”的類比。儘管Google近期的表現已優於其他科技巨頭,但年初至今股價仍是下跌狀態。市場看多OpenAI的邏輯在於“高增長溢價”——作為一個仍在建設中的商業體,其收入在未來幾年有望呈爆發式增長。這確實是合理的觀點,但投資者似乎忽略了兩個關鍵事實:盈利能力的鴻溝: OpenAI目前虧損嚴重,且預計未來數年仍將持續燒錢,能否最終盈利仍是未知數。護城河對比: Google幾乎擁有OpenAI在AI領域所具備的一切技術能力(除了不斷的管理層抓馬),且Google擁有OpenAI所不具備的、極其成熟的印鈔機式業務。正如分析師Martin Peers所言:“你會更願意押注誰?”被遺忘的巨頭紅利?在投資者急於逃離科技股的浪潮中,一個顯而易見的趨勢被忽視了:部分巨頭將在AI轉型中變得更加富有和強大。在Peers看來,Google顯然屬於這一類。“一些公司會在AI轉型後變得更強大、更富有。Google顯然會在這類公司之中。”此外,持有OpenAI 27%股份的微軟(Microsoft),以及雲服務霸主亞馬遜(Amazon),同樣具備成為贏家的潛質。儘管過去一年這兩家公司的股價表現讓投資者猶豫不決,但眼下的估值差或許正是獨立思考的契機。對市場而言,Peers的核心不在於給出“Google該值多少”的單點答案,而是提示當下估值體系的兩條主線:一條為OpenAI代表的高倍數“增長下注”,另一條為Google代表的“現金流與確定性折價”。兩者如何再平衡,將取決於市場對AI商業化路徑與競爭格局的再定價速度。 (invest wallstreet)
Google Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?
人們還在津津樂道OpenAI和Anthropic兩家公司的老闆拒絕牽手,以至於握拳高舉的滑稽畫面,另一邊,Google一個反手迭代了模型。而且這次迭代,頗像是狼披上了羊皮——從模型後綴的數字序號看,這是Google最“小”的一次迭代,之前都是從Gemini 2.0到Gemini 2.5這樣的迭代,這次從Gemini 3.0到Gemini 3.1Pro Preview。但是這“.1”的迭代,進步得卻不是一星半點。GoogleCEO皮查伊(Sundar Pichai)表示,新代模型非常擅長處理“超級複雜的任務”。例如將複雜概念可視化、將資料綜合成單一檢視或者將創意項目變為現實。姚順宇也專門在X上發帖為Gemini 3.1 Pro Preview振臂,盛讚:“Gemini不僅僅是一個好模型,更好的模型正在以不可阻擋之勢到來。”需要注意的是,大約一周前,Google推出了“專用推理模式”Gemini 3 Deep Think,專為科學、研究、工程等複雜、開放式問題設計。Demini 3 Deep Think是姚順宇從Anthropic跳槽到GoogleDeepMind之後參與的第一個項目。而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關係,官方表示“直接建構在Gemini 3 Deep Think的經驗和技術之上”。相當於把Deep Think的核心推理提升技術“下放”到更廣泛可用的Pro模型中。01Gemini 3.1 Pro Preview能做什麼既然這次新代模型的突出能力在處理“超級複雜”的任務,那麼普通的對話放一邊,Google的官方博文中,重點給出了幾種示例秀肌肉。第一,通過簡單的提示詞,建立SVG動畫。這個功能前代也有,但是對比之下進步明顯。比如提示詞“生成一個SVG,描繪一隻變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨使用者的滑鼠游標在螢幕上移動。”Gemini 3 Pro生成的動畫背景是單一的白色,變色龍也看起來很呆板,甚至一側有兩隻眼睛。Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景,變色龍身體有黃色斑紋和圓點裝飾,眼睛立體,腿部姿勢自然彎曲。再比如提示詞“生成一個滑動切換開關的SVG,當滑鼠懸停在太陽圖示上時,將其變成發光的月亮,同時背景從明亮平滑漸變到黑暗。採用乾淨的扁平UI風格。”Gemini 3 Pro給出的動畫雖然完成了任務,圖示可以隨滑鼠變化,但是主圖示單一,是一個缺角的圓形圖案,用黃色代表白天,白色代表夜間。Gemini 3.1 Pro生成的動畫要複雜得多,白天是黃日白雲,夜間是月牙繁星,兩套圖示絲滑變換。總而言之,Gemini 3 Pro做的動畫,讓人想起多年前那個“學了三年動畫”的梗。而Gemini 3.1 Pro交付的SVG動畫,已經達到了可以直接使用的效果。第二,建構工程等級系統。Gemini 3.1 Pro已經可以根據一段高複雜度的自然語言指令,直接生成一個集3D渲染、即時太陽星曆計算、API非同步拉取和物理光效於一體的完整互動系統,而不是簡單頁面demo。Google給出的示例中,使用者給出文字指令,Gemini 3.1 Pro生成了建構一個高保真、可互動的3D國際空間站(ISS)軌道追蹤器。使用高解析度的Blue Marble紋理貼圖渲染一個精細的3D地球模型。第三,生成互動式創意系統。在另一個示例中,Google展示了Gemini 3.1 Pro編寫的一個複雜的3D椋鳥群舞(murmuration)模擬。它不僅生成視覺程式碼,還建構了一個沉浸式體驗,使用者可以通過手部追蹤操控鳥群,並聆聽根據鳥群運動變化的生成式配樂。對於研究人員和設計師而言,這提供了一種強有力的方式來原型化感官豐富的介面。第四,將文學主題轉化為可運行的程式碼。這個示例可能是普通人也最容易get到厲害之處的一個。當被要求為艾米莉·勃朗特(Emily Brontë)的《呼嘯山莊》(Wuthering Heights)打造一個現代個人作品集網站時,該模型並未簡單地總結文字內容,而是基於小說的氛圍與情緒進行推理,設計出一個簡潔、當代感十足的介面,建立出一個捕捉主人公精神核心的網站。抽象推理,這種能力的含金量不用多說。02到底有多強?新代模型免不了過一下刷榜這一步。而“.1”的升級,獲得了動輒倍數躍升的成績。根據Google官方博文放出的測試結果,在ARC-AGI-2基準測試中,3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。這也符合3.1 Pro的示例,因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是,抽象推理解謎的能力。此外,在GPQA Diamond(科學知識測試)中,3.1 Pro得分94.3%;智能體類基準MCP Atlas上,得分69.2%;真實網路瀏覽與資訊整合能力的基準BrowseComp上,得分85.9%。這些成績,均超過了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2與GPT-5.3-Codex。GoogleGemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜尋任務上顯著拉開差距,顯示出明顯的Agent傾向,而非單純知識模型。此外,專門做大模型基準測試與對比分析的第三方評測機構也發佈了相關測試結果,大讚Gemini 3.1 Pro在構成Artificial Analysis Intelligence Index的10項評測中領先6項,相較於Gemini 3 Pro Preview在多項能力上顯著提升,尤其是在推理與知識、程式碼能力以及降低幻覺方面進步最大。而且,Gemini 3.1 Pro Preview保持較高的token效率。運行完整Artificial Analysis Intelligence Index約需5700萬token(比Gemini 3 Pro Preview多100萬)。這一token使用量低於其他在最大推理模式下運行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。結合更低的單token定價,Gemini 3.1 Pro Preview在前沿模型中具有成本優勢,運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不過仍約為領先開源模型GLM-5的兩倍。03能力翻倍價格不變Google官方API定價顯示,Gemini 3 Pro/3.1 Pro Preview的收費結構是按token計費的:小於200k tokens時,每百萬token輸入約2美元,輸出價格為4美元。大於200k tokens時,每百萬token輸入4美元,輸出18美元。在上下文快取方面,根據提示詞規模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的儲存費。這個價格,整體上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起來,還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。尤其是結合當下它在模型能力上相當突出,這個價格更顯得極具競爭力。不要忘了,Google這次發佈的只是“預覽(Preview)”,Google很快就會推出正式版。而“.1”的迭代,Google也是在暗示其只是小秀肌肉。目前,開發者可以在AI Studio、Gemini API、Gemini CLI、智能體開發平台Google Antigravity以及Android Studio使用3.1 Pro;企業使用者則可以在Vertex AI和Gemini Enterprise使用;普通使用者在Gemini應用和NotebookLM都能用上,不過後者僅限Pro和Ultra訂閱使用者。各個社區裡已經有不少人迫不及待上手操作,真的就和Google的演示一樣,手搓了不少驚豔的玩意。有人用Gemini 3.1 Pro 生成了一個可互動的 3D 機械級汽車懸架系統模擬器,包含真實幾何結構、連桿約束與即時轉向和行程計算,相當於把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具,接近工程級原型能力。有人用3.1 Pro製作“捉鬼獵人走過一棟鬧鬼的房子”的循環動畫,驚呼“Gemini沒有開玩笑”。總之,Google這回是真憋了個大招。小小一個“.1”,卻把推理和程式碼能力拉得飛起,定價還這麼穩。社區裡滿溢的手搓demo的熱情,也證明了它的能力與實用性。AI圈越來越現實了。模型再強,終究得看帳單值不值。企業開始精打細算每個token的回報,開發者也得掂量掂量性價比。Google這一步,不僅是搶回王座,更是把競爭推向“誰更會過日子”的新階段。且看接下來,捏著拳頭的Anthropic和OpenAI,以及xAI、Meta、微軟等一眾競爭對手該如何應對吧。 (字母AI)