【DeepSeek】被DeepSeek捲到,Google狂殺性價比,新模型得分超R1,速度暴碾4o-mini



Google也開卷低成本模型了。

智東西2月6日報導,今天凌晨Google發佈了性能更強的Gemini 2.0 Pro實驗版,以及主打低價的Gemini 2.0 Flash-Lite預覽版,並且正式開放輕量級的Gemini 2.0 Flash最新版本

其中,Gemini 2.0 Flash-Lite是Gemini 2.0系列的新變體,每百萬tokens 0.3美元,是Google目前最便宜的模型。而Gemini 2.0 Pro實驗版具備原生多模態能力,支援文字和音視訊間的相互轉換。Gemini 2.0 Flash的實驗版於去年12月首發,最新版本為完整版

此外,Gemini 2.0 Flash Thinking實驗版現免費開放使用,還可以訪問、提煉並總結YouTube視訊內容。


GoogleAI Studio產品負責人Logan Kilpatrick在X發帖稱,這幾款“Google史上最強大的模型”現可供所有開發人員使用。


截至發稿,在Chatbot Arena大模型排行榜上,Gemini 2.0 Flash Thinking實驗版和Gemini 2.0 Pro實驗版已沖上榜首,綜合得分反超ChatGPT-4o和DeepSeek-R1,勢頭強勁。


▲Chatbot Arena大模型排行榜Language總榜,綜合考慮了大模型的數學、編碼、多語種處理等方面的能力(圖源:Chatbot Arena官網)


01.

長文字處理價格腰斬,

Pro版拔升編碼推理水平

現在,Gemini 2.0 Flash新版、Gemini 2.0 Pro實驗版和Gemini 2.0 Flash-Lite預覽版,均可以通過GoogleAI Studio和Vertex AI呼叫其API。這些Gemini 2.0模型的變體各自設有不同的價格和性能優勢。

據Google官網資訊,Gemini 2.0 Flash和Gemini 2.0 Flash-Lite側重輕量級部署,兩者的上下文窗口長度最多支援100萬個tokens,並且取消了Gemini 1.5 Flash長文字和短文字處理的定價區別,均統一按單位token計價。Gemini 2.0 Flash現每百萬tokens文字輸出需花費0.4美元,以處理長文字為例,其比Gemini 1.5 Flash的定價便宜了一半

同時,Lite版本針對大規模文字輸出的場景實現了成本最佳化,每百萬tokens文字輸出定價0.3美元。GoogleCEO桑達爾·皮查伊(Sundar Pichai)用“高效且強大”來形容這款模型。


除了推出價格更便宜的新模型Gemini 2.0 Flash-Lite,GoogleGemini 2.0的新變體性能也有所提升。

相比於Lite版,Gemini 2.0 Flash的多模態互動功能更全面一些,按計畫可支援圖像輸出,以及文字、音訊、視訊等模態的雙向即時低延遲輸入和輸出。


而Gemini 2.0 Pro實驗版則是Google自稱旗下在編碼性能和複雜提示方面表現最好的模型。該模型的上下文窗口可達200萬個tokens,通用能力較前代的75.8%提升至79.1%,編碼和推理能力與Gemini 2.0 Flash、Gemini 2.0 Flash-Lite拉開了明顯差距。


Gemini應用程式團隊在X上發帖稱,Gemini Advanced使用者現可通過模型下拉菜單訪問Gemini 2.0 Pro實驗版,Gemini 2.0 Flash Thinking實驗版則免費向Gemini應用使用者開放。

此外,該團隊透露Gemini 2.0 Flash Thinking實驗版可以與YouTube、Google搜尋和Google地圖聯動使用。


02.

衝破DeepSeek低成本優勢,

性能測試比肩V3

受開源、低成本、高性能DeepSeek-R1推出的影響,模型開發成本成為了圈內熱議的話題。

Google2024年第四季度財報剛發佈不久,在電話會議上,皮查伊先是肯定了DeepSeek所實現的成績,但同時也提出Gemini系列模型在成本、性能、延遲三者關係的平衡中,仍處於領先地位,且整體表現優於DeepSeek的V3和R1模型

而從由楊立昆及其團隊搭建的LiveBench大模型性能基準測試排行來看,Gemini 2.0 Flash總體排名高於DeepSeek V3和OpenAI的o1-mini,但落後於DeepSeek-R1和OpenAI的o1


Google此次推出的Gemini 2.0 Flash-Lite,可謂代表Google打出了一張“價格牌”

一位長期關注AI玩法、在X上有近萬粉絲的網友,試用了DeepSeek V3、GPT-4o-mini、Gemini 2.0 Flash。該網友稱新版的Gemini 2.0 Flash在性能和成本上均超過另外兩個模型。


具體來看,Gemini 2.0 Flash每百萬tokens的輸入成本為0.1美元,輸出成本為0.4美元,兩項資料均遠低於DeepSeek V3。該網友在X上寫道:“Gemini 2.0 Flash正式版成本為GPT-4o-mini的三分之一,同時速度是後者的3倍。”



03.

結語:大模型進入新一輪價格戰,

或靠性價比打開應用市場

DeepSeek掀起的這波大模型價格戰,對海外大模型市場的直接或間接影響仍在持續。

Google推出比輕量級還輕量的Gemini 2.0 Flash-Lite,OpenAI向所有使用者免費開放了ChatGPT搜尋功能,Meta內部團隊加緊研究大模型降價策略。

目前來看,大模型領域還沒有那家能穩坐第一的寶座,各項測評資料你追我趕,變相降價吸引和留存使用者。卷性價比也有助於大模型從技術開發,真正走向後續的應用落地。 (智東西)