【DeepSeek】突傳大消息!最新回應來了

DeepSeek又傳來重磅消息。

2月25日,據路透社報導,DeepSeek計畫提前發佈其新一代AI模型R2。該公司最初計畫在5月推出,但目前正在努力盡快推出。DeepSeek表示,新模型將在程式設計能力和多語言推理方面有所提升。

對此,幻方量化相關人士回覆券商中國記者,“以官方消息為準。”

此外,阿里巴巴將於今日晚間全面開源旗下視訊生成模型萬相2.1模型。

值得注意的是,DeepSeek API開放平台今日也宣佈重新開啟API充值服務。由於伺服器資源緊張,該平台曾在2月6日暫停了API服務的充值功能。

DeepSeek-R2要來了?

DeepSeek的下一代模型R2的進展備受市場關注。

2月25日,據路透社報導,DeepSeek計畫提前發佈其新一代AI模型R2。據知情人士透露,R2原定於5月初發佈,但現在公司希望盡快推出。DeepSeek表示,新模型將在程式設計能力和多語言推理方面有所提升。對於R2 的發佈時間表,沒有提供具體細節。

印度技術服務提供商Zensar的首席營運官Vijayasimha Alilughatta表示:“DeepSeek的R2模型發佈可能會成為AI行業的一個關鍵時刻。DeepSeek成功打造了具有高性價比的AI模型,將促使全球公司加速研發處理程序,打破目前由幾家主導企業壟斷的格局。”

對此,幻方量化相關人士回覆券商中國記者,“以官方消息為準。”

此前,有行業人士在Reddit中發帖表示,DeepSeek-R1在編碼和SWE-Bench方面已經與OpenAI匹敵,甚至沒有使用他們最大的突破——強化學習 (RL),這種情況即將改變。“他們正在解決這個問題。未來版本將整合拒絕採樣和非同步評估,使強化學習可用於軟體工程。路線圖非常清晰:DeepSeek-R2將是一次最佳化飛躍,而不是演算法飛躍。如果說DeepSeek證明了什麼,那就是他們解決最佳化問題的能力。”

分析認為,DeepSeek的成功得益於幻方投資十多年來在研究和計算力方面的大量投入。幻方於2020年和2021年斥資12億元人民幣建立了兩個AI超級計算叢集,其中包括約1萬片輝達A100晶片。

據知情人士透露,DeepSeek前員工表示,公司的成功主要歸功於梁文鋒專注於更具成本效益的AI架構。DeepSeek採用了混合專家(MoE)和多頭潛在注意力(MLA)等技術,大大降低了計算成本。

伯恩斯坦經紀公司的分析師在2月初估計,DeepSeek的定價比OpenAI同類模型的收費便宜20到40倍。這也引發OpenAI在本月降價,而Google的Gemini也推出了折扣訪問層級。自R1推出以來,OpenAI還發佈了一款依賴較少計算能力的O3-Mini模型。

此外,DeepSeek API開放平台今日也宣佈重新開啟API充值服務。此前,由於伺服器資源緊張,該平台曾在2月6日暫停了API服務的充值功能。

阿里將發佈視訊生成模型

與此同時,阿里巴巴也傳來一則重磅消息。

據新浪科技從知情人士處獲悉,阿里巴巴將於今日晚間全面開源旗下視訊生成模型萬相2.1模型。今年1月,阿里旗下萬相剛宣佈推出2.1版本模型升級,視訊生成、圖像生成兩大能力均獲得提升。

在視訊生成方面,萬相2.1通過自研的高效VAE和DiT架構增強了時空上下文建模能力,支援無限長1080P視訊的高效編解碼,首次實現了中文文字視訊生成功能,登上VBench榜單第一。

據此前介紹,萬相2.1支援中英文視訊,可以一鍵生成藝術字,還提供多種視訊特效選項,以增強視覺表現力,例如過渡、粒子效果、模擬等。

隨著萬相2.1模型開源,這意味著更多的開發者,將能夠低成本獲取並使用該模型底層程式碼,進而用以開展與自身業務相關的各類視訊生成應用。

值得注意的是,就在今日早間,阿里Qwen團隊在社交媒體宣佈發佈新推理模型——深度思考(QwQ)。這是在QWQ-MAX-PREVIEW支援下,一個基於Qwen2.5-Max的推理模型。QwQ可同時支援深度思考和聯網搜尋,並會展示完整的思維鏈。

Qwen團隊稱,QWQ-MAX官方版本即將發佈,同步會發佈Android和iOS應用程式,還會發佈更小的可在本地裝置部署的模型,如QWQ-32B等。

AI晶片需求激增?宇宙最重要的財報即將來襲

值得注意的是,DeepSeek的崛起一度讓投資者質疑,輝達的尖端晶片是否還是科技公司在人工智慧競賽中的“制勝法寶”?輝達市值1月底曾一天蒸發5930億美元,創下美國公司單日市值損失之最。

不過,事實可能並非如此,DeepSeek的橫空出世,引發各行各業的多家企業紛紛佈局採用DeepSeek,或使得輝達AI晶片需求大增。

據路透社消息,中國企業推出低成本人工智慧模型DeepSeek後,顯著推高了模型使用的輝達人工智慧晶片在中國市場的需求。路透社引述知情人士的消息說,多家網際網路巨頭對同款H20晶片的訂單激增。

兩名知情人士表示,自DeepSeek上個月引起全球矚目以來,中國企業騰訊、阿里巴巴及字節跳動都“大幅增加”對H20的訂單。這三家科技巨頭除了內部需要先進AI晶片外,也提供雲端運算服務,讓其他企業能取得並使用AI工具。

周三美股盤後(台北時間2月27日凌晨),“宇宙最重要的財報”將出爐,“AI晶片霸主”輝達將公佈截至今年1月底的2025財年第四季度業績報告,其AI晶片需求成為市場關注的焦點。

根據LSEG的資料,輝達第四財季收入預計將激增72%,至380.5億美元,為七個季度以來的最低增速。而截至今年4月的2026財年第一季度營收預計將增長60%。 (券商中國)