巔峰一戰!DeepSeek V4與GPT-5.5同日發佈,封閉模型優勢被擊穿

今天,AI大模型圈再次沸騰起來。

OpenAI正式推出GPT-5.5,性能霸榜,在介紹中,OpenAI強調:“這是迄今為止我們智能性最強、使用體驗最直觀便捷的模型,也是邁向全新智能體時代的重要一步。”

緊隨其後,DeepSeek V4預覽版幾小時後火速上線,多個指標取得了比肩世界頂級封閉模型的優異成績,兩大頂級模型同日登場,堪稱開源與封閉模型的又一歷史性隔空交鋒。

從市場層面來看,當前AI大模型行業已從“野蠻生長”進入“精耕細作”的下半場,封閉模型與開源模型的差距被又一次壓縮,值得關注的是,DeepSeek V4預覽版據悉已完成對華為昇騰、寒武紀等主流國產AI晶片的深度協同適配,在全鏈路自主可控方面邁出重要一步。

一起來看看今天的發佈亮點。

GPT 5.5:程式設計與辦公能力全面升級

GPT-5.5具備多項核心能力:精準理解使用者需求、自主完成復合工作,可實現程式碼編寫偵錯、線上調研、資料分析、文件表格製作、軟體操作等任務,也可跨工具連貫完成工作。

此外,GPT-5.5的詞元消耗更低,能夠減少內容重複生成,輸出質量顯著提升,在程式碼能力綜合測評中,GPT-5.5將主流前沿程式碼模型的綜合使用成本壓縮一半。

GPT-5.5在Terminal-Bench 2.0測試中,精準率達82.7%;SWE-Bench Pro測試精準率為58.6%;在Expert-SWE測評中,綜合表現全面超越GPT-5.4。

早期實測顯示,GPT-5.5對整體系統架構的理解能力大幅增強,可梳理故障根源、精準定位修復點位,提前預判程式碼修改對項目其他模組產生的連鎖影響。

另外,GPT-5.5對使用者意圖的理解也更加精準,可流暢完成知識性工作全流程閉環。相較前代版本,GPT-5.5更切合人機協同操控電腦的互動體驗,同時,相較同類模型,GPT-5.5更擅長獨立完成科研工作。

本次升級,GPT的核心定位是“極致智能、直觀易用”。OpenAI聯合創始人兼總裁Greg Brockman表示,本次更新將進一步推動自研“超級應用”佈局,加速邁入智能自主化、直覺化計算的新時代。

Brockman多次強調,GPT-5.5是搭建全域“超級應用”的關鍵基石。OpenAI計畫整合ChatGPT、Codex與AI瀏覽器,打造一體化綜合服務體系,為企業級客戶深度賦能。

定價方面,GPT-5.5在輸入時漲價至5美元/百萬tokens,輸出則為30美元/百萬tokens;高階版本GPT-5.5 Pro的輸入價格為30美元/百萬tokens、輸出則是180美元/百萬tokens。

不難看出,GPT-5.5的整體定價大幅上調,但GPT-5.5 Pro定價與GPT-5.4 Pro保持一致。橫向對比國產模型:小米MiMo v2.5 Pro的百萬級輸入、輸出定價分別為1美元、3美元;MiniMax M2.7為0.30美元、1.20美元;Kimi K2.5為0.44美元、2.00美元,國產大模型成本優勢十分明顯。

大幅漲價超出多數使用者預期,對此OpenAI解釋稱:“GPT-5.5詞元利用效率更高,完成同等業務任務,消耗詞元數量遠少於GPT-5.4。”

V4同一天上線,彰顯技術自信

受智能體技術爆發的驅動,全球大模型迭代節奏加快,競爭也比去年更加激烈。

僅用約五周時間,小米便完成從MiMo-V2-Pro到MiMo 2.5 Pro的升級;從GPT-5.4到GPT-5.5的更新間隔僅7周,高頻高速迭代已成行業常態。

在市場上傳聞了數月的DeepSeek-V4已經算是姍姍來遲,好在性能十分能打,官方技術部落格表示,V4模型的Agent智能體能力、知識儲備、邏輯推理性能全方位升級。

新版本劃分兩大產品線:DeepSeek-V4-Pro,性能對標國際頂級閉源大模型;DeepSeek-V4-Flash,主打輕量化高效推理與超高性價比。

DeepSeek表示,V4-Pro在數學運算與程式碼生成能力上全面超越所有開源競品,在綜合世界知識方面,僅落後於Gemini 3.1-Pro。

如果實測表現與官方表述一致,DeepSeek V4將帶給行業巨大驚喜,有望再度顛覆全球開源大模型市場格局,這可能也是DeepSeekV4選擇與GPT-5.5同日發佈的原因,充分彰顯自身技術底氣。

公開資訊顯示,DeepSeek-V4依託詞元壓縮技術,結合DSA(DeepSeek稀疏注意力機制),長文字處理能力實現跨越式提升,相較傳統大模型架構,有效降低算力消耗與視訊記憶體佔用,自新版本上線起,百萬級超長上下文窗口正式成為DeepSeek全系標配。

V4-Pro整體參數規模達1.6兆,是DeepSeek目前參數體量最大的旗艦模型,輕量化版本DeepSeek-V4-Flash的參數規模也達到2840億。

在計費定價方面,百萬tokens輸入(快取命中),DeepSeek-V4-Flash為0.2元,DeepSeek-V4-Pro為1元;百萬tokens輸入(快取未命中),DeepSeek-V4-Flash為1元,DeepSeek-V4-Pro為12元。

據多方媒體披露,DeepSeek全系模型已完成專項適配最佳化,可相容華為昇騰950PR晶片,有效降低對美國高端算力晶片的依賴。目前官方暫未公開V4訓練階段所用硬體配置,但官方坦言,現階段V4-Pro的性能釋放仍受制約,伴隨華為昇騰950PR超算節點大規模量產交付,今年下半年,DeepSeek或將迎來價格下調。

此次發佈,DeepSeek V4綜合實力在次躋身開源模型頭部梯隊,海外閉源巨頭雖在綜合基礎能力上仍保有領先優勢,但高額呼叫成本已是無法忽視的核心短板。

僅對比GPT-5.5與DeepSeek-V4,二者的綜合使用成本相差幾倍甚至十幾倍。

征戰“詞元經濟”

人工智慧正全面重構各行各業、戰場格局與全球治理體系,過去,誰能依託頂尖算力基礎設施,落地最優通用大模型,誰就有望主導這場AI競賽,但現在變局已來。

相關分析資料顯示,當前美國旗艦模型相對中國同類開源模型的領先幅度只剩下2.7%,美機構調研資料指出:“中國在論文發表量、文獻引用量、專利產出數量、工業機器人裝機量等維度穩居全球首位,自2017年以來,赴美發展的人工智慧科研人才數量銳減89%。”

在全球TOP10大模型榜單中,中國模型獨佔四席。2026年3月,國內每日詞元消耗量突破140兆,“詞元經濟”已成為全新增長極。

野村證券分析認為:“目前國內AI廠商的核心競爭邏輯仍聚焦性價比,依靠低價策略強化市場吸引力。與此同時,國產頂尖大模型與海外前沿產品的技術差距持續縮小,海外B端與C端使用者,已形成真實落地使用需求。”

業內所說的“詞元出口”,本質是模型分發模式的全球化佈局,並非算力資源的跨境商品化。國產出海大模型大多依託海外雲伺服器進行部署,推理運算在境外完成,並未動用國內本土資料中心資源。

對於中美AI企業而言,商業化創收仍是現階段的首要任務。OpenAI關停Sora相關業務、GPT-5.5價格直接翻倍,都是成本壓力的顯現。儘管有資料顯示,OpenAI、Anthropic年化營收分別達到250億美元、300億美元,但實際盈利狀況並不樂觀。

國內企業同樣面臨營收挑戰,2025年,國內頭部AI企業的年營收普遍集中在1億至7億元區間,與投入相比,商業化變現能力仍偏弱。

開源,是未來AI領域競爭的核心軟實力,也是中國模型廠商們實現技術突圍、生態破局、全球化出海競爭的關鍵抓手,有望在AI新格局中掌握更多規則話語權。 (頭部科技)