新版V3-0324模型總參數量達6710億、編碼能力媲美Claude 3.7 Sonnet、一個提示詞生成完整登錄頁、開源許可比初代V3更寬鬆……網友:新版V3來了,R2還會遠嗎?
悶聲幹大事!DeepSeek悄然發佈V3新版本。
沒有發佈會,沒有媒體宣傳,3月24日晚間,DeepSeek就這樣“悄悄地”將其最新版V3-0324模型上傳至Hugging Face。
根據社區測試和分析,此次更新雖然不是全新一代模型,僅屬於“小版本升級”,但其程式設計能力已達到與Claude 3.7 Sonnet相當的水平,在某些測試場景中甚至表現更佳。
有網友表示,新版V3較上一代來說,相當於Sonnet 3.6之於Sonnet 3.5的飛躍。
還有網友指出,新版V3模型的編碼能力完全超預期,堪稱目前最強大的免費AI模型。
為解決傳統MoE模型中的負載不均衡問題,DeepSeek團隊引入了創新性的“偏差項”機制,旨在幫助V3在訓練過程中有效平衡專家負載,提升模型性能。
此外,V3還採用了節點受限的路由機制,以減少跨節點通訊開銷,提高訓練效率,這對於大規模分佈式訓練至關重要。
這些技術創新使得新版V3在推理速度上實現了顯著提升,使V3能在保持高效計算的同時,擴展到更多節點和專家。
這一成績意味著,新版V3已成為目前程式設計能力最強的開源模型之一。
實際測試中,使用者用一個簡單的提示詞就讓V3-0324生成了整個登錄頁面。
還有使用者直觀地指出,只是點了兩次“continue”,看看生成的程式碼量有多恐怖!
再加上不限時、完全免費的“殺手鐧”,可以說在前端開發層面,新版V3已經打敗了OpenAI的o1-pro和GPT-4.5。
新版V3的審美也很線上,使用者用同樣的prompt生成的網頁畫面,新版V3的設計明顯比上一版要好看得多。
根據prompt:“寫一個精美的落地頁,內容是deepseek v3發佈”,這是上一版V3生成的網頁:
新版V3的落地頁則是這樣:
公開資料顯示,MIT許可以商業友好著稱,使用該許可的項目可以與商業和專有軟體自由整合。
這一變化對希望在商業項目中應用高性能AI模型的開發者和公司來說,可能是本次更新最具戰略意義的改變。它進一步降低了AI技術的使用門檻,加速了技術普惠處理程序。
正如海外使用者所評論的:“很高興看到這些開源模型繼續給大公司施壓,促使它們以更低的成本建構更好的模型。”
隨著DeepSeek這樣的開源模型不斷提升性能並放寬使用條件,AI技術的民主化和普惠化處理程序正在加速,一個更加開放、創新的AI生態系統正在形成。
網友不禁感嘆:DeepSeek簡直讓科技普惠成為現實!
還有網友大膽猜測:新版V3來了,R2還會遠嗎? (硬AI)