最近這段時間,如果你只看Google的宣傳資料,大機率會覺得Gemini已經快要無敵了。
論視訊生成有Omni,圖片生成有Nano Banana,Gemini 3.5 Flash性能比3.1 Pro還強,Gemini Spark還能幫你自動完成任務。從發佈會到官方部落格,Gemini給人的感覺就像一個六邊形戰士,幾乎每個方向都在進步。
其實前段時間雷科技在報導Google I/O時也給出了盛讚。但這段時間真正用下來之後,小雷卻越來越覺得Gemini 3.5 Flash有點拉。
不是那種跑分不行的拉,也不是能力墊底的拉。恰恰相反,它很多能力依然屬於行業第一梯隊。
問題在於,當宣傳裡的各種新功能真正落到日常體驗上時,總會出現一種說不上來的彆扭感。你明明知道它很強,卻總感覺沒那麼好用;你明明知道很多功能已經上線了,卻總有種自己沒用到的感覺。
這種割裂感在最近的大模型圈其實並不少見:廠商展示的是能力上限,使用者接觸到的卻是實際體驗。前者越來越驚豔,後者卻未必同步提升。
而Gemini 3.5 Flash,可能就是這種矛盾最明顯的代表之一,槽點太多,不吐不快。
額度、路由、能力,
體驗都更擰巴了
先說最容易感受到的問題。
額度。
Google在I/O 2026大會前夕悄悄修改了會員訂閱的額度規則,從固定消息數,改成了基於計算資源的配額(compute-based quota)。
簡單來說,以前Gemini只看互動次數,圖像、視訊、音訊和文字大模型的使用次數都是互相獨立的,每24小時重設一次。
體感下來,Pro會員視訊一天能生成5次,圖片能生成50張,而文字根本用不完。
而在修改之後,Google同時設定了每周限額和每五小時重設的臨時限額。
現在所有的任務用量都會結合Token消耗等進行計算,如果讓模型思考得多,那即使它給你回覆的內容不變,花的錢也比以前更多。
問題是,我怎麼知道一個任務會讓模型消耗多少算力?
不僅如此,之前分門別類的各項功能,現在都被統一歸類為這個用量限額的一部分,不論是視訊、圖片、深度研究還是Agent,只要其中一個功能耗完限額,接下來幾個小時你就啥也別想著幹了。
就我自己的體驗,用Omni Flash生成一個視訊,差不多會消耗Pro訂閱的1/3額度,如果希望修改視訊,那至少要用到Pro訂閱的1/2額度,真就不夠用的。
比額度更影響體驗的,其實是路由問題。
這可不是我的個人感受,最近不少使用者都遇到過類似情況。前面還在正常生成圖片,但是聊著聊著,Gemini突然開始表示自己無法生成圖片,直接告訴你自己只是一個文字模型,對於這類任務無能為力。
最搞笑的是,甚至會出現僅提供文字不出圖的情況。
這種情況偶爾出現還能理解,但頻率高了之後,使用者真的很難搞清楚到底是功能失效了,還是模型切換錯了。
能力層面其實也有類似的問題。
Gemini 3.5 Flash給人的感覺一直是能做,但經常做得不夠穩。同一道數學題或者推理題,有時候回答得相當漂亮,隔幾個小時再問一次,結果可能完全不同。
我測試過幾道經典邏輯題,很多時候它前面的分析過程都沒有問題,推導鏈條看起來也很完整,可到了最後一步,經常會出現一些莫名其妙的失誤。最離譜的是,它還特別自信,答案錯了語氣卻一點沒變。
至於更簡單的計算題,該錯還是錯。
我知道,這種問題對於聊天來說無傷大雅,但如果放到學習、工作甚至程式設計場景裡,影響就完全不一樣了。
好的AI,價格只會越來越貴?
如果說前面的問題屬於體驗層面,那更深層的問題其實來自Google最近的產品和定價策略。
要我說,今年Google最喜歡講的故事就是Agent。
從發佈會到官方宣傳,幾乎所有重點都圍繞著Gemini Spark展開。自動搜尋資料、整理資訊、執行任務,甚至幫使用者完成跨應用操作,聽起來確實很有未來感,也很符合大家對Agent的想像。
問題在於,你Gemini Spark居然需要Ultra訂閱使用者才能使用,該訂閱起價每月99.99美元,最高等級訂閱限時價每月199.99美元(約1352.98元)。
要知道,OpenAI和天下無敵的Codex,只需要每月20美元即可啟用。
於是就出現了一個很有意思的現象:大家看發佈會的時候覺得Gemini天下無敵,打開產品之後第一眼看到的卻是升級按鈕。
這種落差其實比功能缺失更容易影響口碑。因為使用者知道能力存在,也知道效果不錯,但偏偏自己碰不到。
至於程式設計的價格,其實也沒便宜到那去。
要知道,在I/O 2026大會上,GoogleCEO皮查伊可沒少強調Gemini 3.5 Flash的成本優勢。
按照官方價格,Gemini 3.5 Flash每百萬輸入Token收費1.5美元,每百萬輸出Token收費9美元。作為對比,Claude Opus 4.7的API定價為每百萬輸入Token收費5美元,GPT-5.5 Pro則直接來到了每百萬輸入Token收費30美元。
單看價格表,確實便宜不少,甚至有一種薄利多銷的味道。
但價格表這東西看看就好,對於真正用模型的人來說,更重要的是完成同一個任務到底要花多少錢。
Artificial Analysis在Agent評測裡做過統計,Gemini 3.5 Flash跑完整套任務的成本超過1500美元,而Gemini 3 Flash只用了不到300美元,差距直接來到了五倍以上。即便和Gemini 3.1 Pro相比,Flash的整體成本也高出一大截,甚至比GPT-5.5還貴。
問題出在那?
答案很簡單:太能聊了。
在Agent測試裡,Gemini 3.5 Flash平均完成一個任務要接近50輪對話,而很多競品二十來輪就已經收工。別小看這幾十輪差距,每進行一次新對話,模型都要重新讀取之前的歷史記錄,輪次越多,Token就燒得越快。
這就像打車一樣,單公里價格確實便宜,可架不住你繞城跑三圈。最後結帳的時候,使用者看到的永遠是總價,而不是起步價。
AI新矛盾:發佈強的起飛,
使用持續降智
說到底,我並不覺得Gemini 3.5 Flash是一個失敗的模型。
事實上,它依然屬於行業第一梯隊。多模態能力依舊很強,視訊生成依舊不錯,搜尋整合能力依舊是Google的看家本領。很多單項能力放到整個行業裡看,依然相當能打。
問題在於強制縮水的用量限額,和因為算力短缺而頻繁出現的降智問題。
不論Google怎麼宣傳,普通使用者並不關心排行榜,也不關心Gemini 3.5 Flash有多省算力,他們關心的是能不能順利完成任務,能不能穩定輸出結果,能不能不用研究複雜的規則,也不用擔心額度什麼時候突然歸零。
這也是為什麼最近越來越多人開始懷念某些老版本模型。
要知道在大概半年前,Google AI Studio每天還會給免費使用者發放50次Pro模型互動量,令人無限唏噓。
對於Gemini來說,未來最大的希望依然是Agent。
畢竟Google擁有全行業最完整的生態資源,只要未來真的能夠打通搜尋、郵件、日曆、文件和Android系統,讓Agent幫使用者完成更多真實任務,那它依然有機會建立起其他廠商難以複製的優勢。
只是現階段,小雷對Gemini 3.5 Flash的評價顯然不會變。 (雷科技)
