Gemini 3.5 Flash體驗越來越糟糕？免費AI越用越傻，好的AI越來越貴

2026/06/04

•

最近這段時間，如果你只看Google的宣傳資料，大機率會覺得Gemini已經快要無敵了。

論視訊生成有Omni，圖片生成有Nano Banana，Gemini 3.5 Flash性能比3.1 Pro還強，Gemini Spark還能幫你自動完成任務。從發佈會到官方部落格，Gemini給人的感覺就像一個六邊形戰士，幾乎每個方向都在進步。

其實前段時間雷科技在報導Google I/O時也給出了盛讚。但這段時間真正用下來之後，小雷卻越來越覺得Gemini 3.5 Flash有點拉。

不是那種跑分不行的拉，也不是能力墊底的拉。恰恰相反，它很多能力依然屬於行業第一梯隊。

問題在於，當宣傳裡的各種新功能真正落到日常體驗上時，總會出現一種說不上來的彆扭感。你明明知道它很強，卻總感覺沒那麼好用；你明明知道很多功能已經上線了，卻總有種自己沒用到的感覺。

這種割裂感在最近的大模型圈其實並不少見：廠商展示的是能力上限，使用者接觸到的卻是實際體驗。前者越來越驚豔，後者卻未必同步提升。

而Gemini 3.5 Flash，可能就是這種矛盾最明顯的代表之一，槽點太多，不吐不快。

額度、路由、能力，

體驗都更擰巴了

先說最容易感受到的問題。

額度。

Google在I/O 2026大會前夕悄悄修改了會員訂閱的額度規則，從固定消息數，改成了基於計算資源的配額（compute-based quota）。

簡單來說，以前Gemini只看互動次數，圖像、視訊、音訊和文字大模型的使用次數都是互相獨立的，每24小時重設一次。

體感下來，Pro會員視訊一天能生成5次，圖片能生成50張，而文字根本用不完。

而在修改之後，Google同時設定了每周限額和每五小時重設的臨時限額。

現在所有的任務用量都會結合Token消耗等進行計算，如果讓模型思考得多，那即使它給你回覆的內容不變，花的錢也比以前更多。

問題是，我怎麼知道一個任務會讓模型消耗多少算力？

不僅如此，之前分門別類的各項功能，現在都被統一歸類為這個用量限額的一部分，不論是視訊、圖片、深度研究還是Agent，只要其中一個功能耗完限額，接下來幾個小時你就啥也別想著幹了。

就我自己的體驗，用Omni Flash生成一個視訊，差不多會消耗Pro訂閱的1/3額度，如果希望修改視訊，那至少要用到Pro訂閱的1/2額度，真就不夠用的。

比額度更影響體驗的，其實是路由問題。

這可不是我的個人感受，最近不少使用者都遇到過類似情況。前面還在正常生成圖片，但是聊著聊著，Gemini突然開始表示自己無法生成圖片，直接告訴你自己只是一個文字模型，對於這類任務無能為力。

最搞笑的是，甚至會出現僅提供文字不出圖的情況。

這種情況偶爾出現還能理解，但頻率高了之後，使用者真的很難搞清楚到底是功能失效了，還是模型切換錯了。

能力層面其實也有類似的問題。

Gemini 3.5 Flash給人的感覺一直是能做，但經常做得不夠穩。同一道數學題或者推理題，有時候回答得相當漂亮，隔幾個小時再問一次，結果可能完全不同。

我測試過幾道經典邏輯題，很多時候它前面的分析過程都沒有問題，推導鏈條看起來也很完整，可到了最後一步，經常會出現一些莫名其妙的失誤。最離譜的是，它還特別自信，答案錯了語氣卻一點沒變。

至於更簡單的計算題，該錯還是錯。

我知道，這種問題對於聊天來說無傷大雅，但如果放到學習、工作甚至程式設計場景裡，影響就完全不一樣了。

好的AI，價格只會越來越貴？

如果說前面的問題屬於體驗層面，那更深層的問題其實來自Google最近的產品和定價策略。

要我說，今年Google最喜歡講的故事就是Agent。

從發佈會到官方宣傳，幾乎所有重點都圍繞著Gemini Spark展開。自動搜尋資料、整理資訊、執行任務，甚至幫使用者完成跨應用操作，聽起來確實很有未來感，也很符合大家對Agent的想像。

問題在於，你Gemini Spark居然需要Ultra訂閱使用者才能使用，該訂閱起價每月99.99美元，最高等級訂閱限時價每月199.99美元（約1352.98元）。

要知道，OpenAI和天下無敵的Codex，只需要每月20美元即可啟用。

於是就出現了一個很有意思的現象：大家看發佈會的時候覺得Gemini天下無敵，打開產品之後第一眼看到的卻是升級按鈕。

這種落差其實比功能缺失更容易影響口碑。因為使用者知道能力存在，也知道效果不錯，但偏偏自己碰不到。

至於程式設計的價格，其實也沒便宜到那去。

要知道，在I/O 2026大會上，GoogleCEO皮查伊可沒少強調Gemini 3.5 Flash的成本優勢。

按照官方價格，Gemini 3.5 Flash每百萬輸入Token收費1.5美元，每百萬輸出Token收費9美元。作為對比，Claude Opus 4.7的API定價為每百萬輸入Token收費5美元，GPT-5.5 Pro則直接來到了每百萬輸入Token收費30美元。

單看價格表，確實便宜不少，甚至有一種薄利多銷的味道。

但價格表這東西看看就好，對於真正用模型的人來說，更重要的是完成同一個任務到底要花多少錢。

Artificial Analysis在Agent評測裡做過統計，Gemini 3.5 Flash跑完整套任務的成本超過1500美元，而Gemini 3 Flash只用了不到300美元，差距直接來到了五倍以上。即便和Gemini 3.1 Pro相比，Flash的整體成本也高出一大截，甚至比GPT-5.5還貴。

問題出在那？

答案很簡單：太能聊了。

在Agent測試裡，Gemini 3.5 Flash平均完成一個任務要接近50輪對話，而很多競品二十來輪就已經收工。別小看這幾十輪差距，每進行一次新對話，模型都要重新讀取之前的歷史記錄，輪次越多，Token就燒得越快。

這就像打車一樣，單公里價格確實便宜，可架不住你繞城跑三圈。最後結帳的時候，使用者看到的永遠是總價，而不是起步價。

AI新矛盾：發佈強的起飛，

使用持續降智

說到底，我並不覺得Gemini 3.5 Flash是一個失敗的模型。

事實上，它依然屬於行業第一梯隊。多模態能力依舊很強，視訊生成依舊不錯，搜尋整合能力依舊是Google的看家本領。很多單項能力放到整個行業裡看，依然相當能打。

問題在於強制縮水的用量限額，和因為算力短缺而頻繁出現的降智問題。

不論Google怎麼宣傳，普通使用者並不關心排行榜，也不關心Gemini 3.5 Flash有多省算力，他們關心的是能不能順利完成任務，能不能穩定輸出結果，能不能不用研究複雜的規則，也不用擔心額度什麼時候突然歸零。

這也是為什麼最近越來越多人開始懷念某些老版本模型。

要知道在大概半年前，Google AI Studio每天還會給免費使用者發放50次Pro模型互動量，令人無限唏噓。

對於Gemini來說，未來最大的希望依然是Agent。

畢竟Google擁有全行業最完整的生態資源，只要未來真的能夠打通搜尋、郵件、日曆、文件和Android系統，讓Agent幫使用者完成更多真實任務，那它依然有機會建立起其他廠商難以複製的優勢。

只是現階段，小雷對Gemini 3.5 Flash的評價顯然不會變。 (雷科技)

科技