這兩天,DeepSeek V4 炸了的消息一個接著一個的。
中國的人工智慧可能無需依賴輝達了!
DeepSeek V4 的試行版本 Sealion-lite 洩露,其上下文窗口已擴展至 100 萬個 token,具備原生的多模態推理能力。
根據提前洩露的測試樣本,其程式碼最佳化和邏輯組織能力超越了 V3.2,能夠與 Claude Opus 4.6 和 Gemini 3.1相媲美。
更令人驚訝的是,DeepSeek 這次V4的測試權限提前給予華為等國內晶片製造商,而沒有開放測試權限給輝達和 AMD。
這次的真正關鍵不是 1M token,而在於“誰最先適配晶片”了。
這真是顛覆了整個行業的慣例。
此前,無論是 OpenAI 還是 Google,在發佈之前都會先與輝達共享預發佈版本進行適配最佳化。
而這一次,DeepSeek V4版本直接跳過了這一過程,使得華為昇騰等國產晶片提前獲得了幾周適配最佳化的機會。
據稱,提前適配可以使模型性能提高超過 30%。
這可以被視為一個重要訊號。
在過去三年裡,美國對算力的封鎖策略非常明確:限制GPU的出口,使得中國的人工智慧無法取得突破。
A100、H100都不允許出售,即使是削減版的H800也要受到管控。
然而,DeepSeek去年通過R1證明了以低成本同樣能夠訓練出世界級的模型,這導致輝達單日市值蒸發近6000億美元。
如果DeepSeek V4與華為的組合效果良好,意味著我們不僅能成功訓練模型,還能夠在不依賴於你GPU的晶片的情況下運作。
非常巧合的是,前天輝達的股價下跌了 5.5%。
儘管主要原因是財報發佈後投資者的預期過高,導致的不滿,但 DeepSeek 跳過輝達並選擇華為的舉動,顯然也對市場情緒產生了影響。
據多個消息源透露,DeepSeek V4 將在一周內上線,目前至少有一家推理服務商已經簽署了保密協議,獲得了測試權限。
等發佈後我們會第一時間進行實測~
同時,DeepSeek V4 Lite的一張對比圖在國外引起了廣泛關注!
與現有的Deepseek V3.2思考模型相比,DeepSeek V4 Lite在不開啟思考模式的情況下,生成的SVG影像品質顯著提升。
如果 DeepSeek V4 確實能夠在百萬 token 的上下文中穩定進行倉庫級的推理,這意味著你可以將整個程式碼倉庫或《三體》三部曲這樣的書籍全部放進去讓它一次性理解。
同時,保持 DeepSeek 一貫的低價(傳聞比 GPT-4.5 便宜 20 至 50 倍,且是 MIT 開放原始碼的),這對於所有使用 AI 進行Vibe Coding 程式設計的朋友們來說都是個好消息。
DeepSeek這次V4版本優先測試權限給華為等國內晶片廠商,沒給 NVIDIA 和 AMD 測試權限。
這意味著什麼訊號?
AI大模型公司提早探索改善算力依賴的結構,而不是一直停留在輝達NVIDIA 生態系中。 (AI共生紀)