網友熱評Deepseek新版V3:程式設計堪比最強AI,期待更強R2!

新版V3-0324模型總參數量達6710億、編碼能力媲美Claude 3.7 Sonnet、一個提示詞生成完整登錄頁、開源許可比初代V3更寬鬆……網友:新版V3來了,R2還會遠嗎?



悶聲幹大事!DeepSeek悄然發佈V3新版本。

沒有發佈會,沒有媒體宣傳,3月24日晚間,DeepSeek就這樣“悄悄地”將其最新版V3-0324模型上傳至Hugging Face。



根據社區測試和分析,此次更新雖然不是全新一代模型,僅屬於“小版本升級”,但其程式設計能力已達到與Claude 3.7 Sonnet相當的水平,在某些測試場景中甚至表現更佳。

有網友表示,新版V3較上一代來說,相當於Sonnet 3.6之於Sonnet 3.5的飛躍。



還有網友指出,新版V3模型的編碼能力完全超預期,堪稱目前最強大的免費AI模型。



01 負載平衡策略:更高效的Moe架構

據介紹,DeepSeek V3-0324不是推理模型,採用了具有6710億參數的專家混合模型(MoE),啟動參數370億。

為解決傳統MoE模型中的負載不均衡問題,DeepSeek團隊引入了創新性的“偏差項”機制,旨在幫助V3在訓練過程中有效平衡專家負載,提升模型性能。

此外,V3還採用了節點受限的路由機制,以減少跨節點通訊開銷,提高訓練效率,這對於大規模分佈式訓練至關重要。

這些技術創新使得新版V3在推理速度上實現了顯著提升,使V3能在保持高效計算的同時,擴展到更多節點和專家。


02 程式設計能力再進化:一個提示詞生成完整前端頁面

根據國外開源評測平台kcores-llm-arena的最新測試資料,V3-0324的程式碼能力達到了328.3分,超過了普通版的Claude 3.7 Sonnet(322.3分),接近思維鏈版本的334.8分。

這一成績意味著,新版V3已成為目前程式設計能力最強的開源模型之一。



實際測試中,使用者用一個簡單的提示詞就讓V3-0324生成了整個登錄頁面。



還有使用者直觀地指出,只是點了兩次“continue”,看看生成的程式碼量有多恐怖!

再加上不限時、完全免費的“殺手鐧”,可以說在前端開發層面,新版V3已經打敗了OpenAI的o1-pro和GPT-4.5。



新版V3的審美也很線上,使用者用同樣的prompt生成的網頁畫面,新版V3的設計明顯比上一版要好看得多。

根據prompt:“寫一個精美的落地頁,內容是deepseek v3發佈”,這是上一版V3生成的網頁:



新版V3的落地頁則是這樣:



03 開源協議升級:商業應用門檻大幅降低

不僅技術能力提升,DeepSeek還將V3-0324的開源許可與R1一樣更新為MIT開源許可,這意味著新版V3有著比初代V3更寬鬆的開源使用條件。



公開資料顯示,MIT許可以商業友好著稱,使用該許可的項目可以與商業和專有軟體自由整合。

這一變化對希望在商業項目中應用高性能AI模型的開發者和公司來說,可能是本次更新最具戰略意義的改變。它進一步降低了AI技術的使用門檻,加速了技術普惠處理程序。


04 開源浪潮湧動 商業模型“瑟瑟發抖”

DeepSeek V3-0324的出現表明,開源AI模型正在以驚人的速度追趕甚至在某些方面超越頂級閉源商業模型。這種趨勢正在給OpenAI、Anthropic等商業AI公司帶來前所未有的壓力。

正如海外使用者所評論的:“很高興看到這些開源模型繼續給大公司施壓,促使它們以更低的成本建構更好的模型。”



隨著DeepSeek這樣的開源模型不斷提升性能並放寬使用條件,AI技術的民主化和普惠化處理程序正在加速,一個更加開放、創新的AI生態系統正在形成。

網友不禁感嘆:DeepSeek簡直讓科技普惠成為現實!



還有網友大膽猜測:新版V3來了,R2還會遠嗎? (硬AI)