【DeepSeek】AI格局的迅速演變:DeepSeek的崛起


一匹備受矚目的黑馬

新興AI巨頭

DeepSeek發佈了一系列開源AI模型,在性能上可與當前最先進的AI相媲美,且成本優勢明顯。大型AI企業通常需要投入數億美元進行訓練,而DeepSeek的R1模型訓練成本僅為558萬美元(遠低於OpenAI訓練類似模型所需的5億美元)。


開放權重公開模型

• DeepSeek-V3
GPT-4相當的性能AI模型,部分學習權重(weight)已公開,但並非完全開源。
• DeepSeek-R1
被認為是OpenAI的o1相當模型,同樣提供開放權重。針對小規模、快速推理,社區也開發了多種衍生模型(蒸餾版、量子化版)。

這種“開放權重”的發佈方式,使得研究者和開發者可以自由地改造或重用模型(如進行蒸餾或量子化),但這也帶來了與原模型的許可證和智慧財產權的複雜關係。

“蒸餾”和“量子化”是不同的技術

DeepSeek-R1相關的關鍵詞包括“蒸餾”(Distillation)和“量子化”(Quantization),但二者在本質上是不同的技術。
1.蒸餾(Distillation)

是將大型模型(教師模型)學到的知識轉移到小型模型(學生模型)的一種方法。

• 如果使用其他公司模型的輸出進行再學習,可能會涉及“非法使用”問題。
• 其優點是能夠減少計算成本和記憶體佔用,同時儘可能保持接近原模型的性能。


為什麼“蒸餾”無法被阻止?蒸餾技術本質上是“將其他模型的輸出用於再學習”,而生成的文字是否能被視作著作權作品本身存在爭議。技術上:

• 任何人都可以大量收集生成AI的輸出並進行再學習。
• 即便使用條款禁止,也可以悄悄進行蒸餾操作。
• 只要稍作加工,外界可能就無法識別出源模型的輸出。

這使得現行的規則無法有效制止蒸餾。

2.量子化(Quantization)

通過將模型內部處理的數值(如權重和運算)轉換為更低精度的格式,以加快計算並減少模型的重量。

• 這種方法不會改變原始模型的結構,只會降低數值的精度(例如,將浮動小數點轉換為整數)。
• 量子化能顯著減少記憶體使用量和推理時的能源消耗,但如果過度量子化,可能會導致性能下降。

DeepSeek 極低的訓練成本在 AI 領域引發了廣泛討論。許多人開始質疑,為什麼主流 AI 企業在訓練模型時投入如此高昂的資金,尤其是考慮到類似 “星門計畫”(Project Stargate) 這樣的項目,其 AI 研發預算竟高達 5000 億美元。如果 DeepSeek 提供的資料屬實,這可能會徹底顛覆當前 AI 訓練的成本認知,並迫使行業巨頭重新思考其戰略。

“1.58位元量子化”在DeepSeek-R1上取得了顯著的效果。具體表現為:
• 曾經需要超過80GB的多個GPU才能運行的大型模型,如今可以在較少數量的GPU上運行。
• 運算可以通過“整數加法(或減法)”來處理,這意味著未來這些模型甚至可能在GPU之外的專用硬體上運行。

“通過量子化,儘量減少性能下降”,這種做法堪稱突破性創新。通常,精度過低會顯著降低性能,但DeepSeek-R1的設計成功地平衡了這個問題。

市場反響與使用者增長

DeepSeek-R1的存在再次引發了“開放化會導致蒸餾,開發成本難以回收”的問題。很多AI公司採取“封閉LLM戰略”的原因:

• 即使投入巨額資金訓練大規模模型,一旦公開,模型很容易被蒸餾和量子化,競爭對手能以較低成本複製。
• 因此,許多公司選擇不公開模型,而是在內部系統中使用封閉策略,認為這種方式更為穩妥。

DeepSeek能夠以“OpenAI的數百分之一的成本”製造出與o1相當的模型,充分展示了蒸餾技術的破壞力。


儘管外界存在諸多爭議,但DeepSeek的市場表現無可置疑。它在App Store排行榜上迅速登頂--這一成就甚至連Anthropic和Perplexity都未能達成。如此快速的使用者增長表明,市場對 DeepSeek 模型的需求 極為強勁,這或許預示著 AI 互動方式的重大變革。

DeepSeek對NVIDIA的影響

DeepSeek的突破不僅影響了AI行業,還直接衝擊了 NVIDIA--這一全球領先的AI晶片供應商。長期以來,NVIDIA之所以能保持市場霸主地位,很大程度上依賴於AI企業每年投入數十億美元購買其GPU。然而,DeepSeek證明了:高性能 AI 模型並不需要如此龐大的GPU資源。

這一發現令投資者重新評估GPU需求的長期趨勢,導致 NVIDIA 股價一度下跌 17%。

中國市場上的“AX630C”低功耗AI處理器,憑藉4GB記憶體就能完成語音識別和LLM推理的任務。

• AI的未來將不再依賴於訓練(學習),而是推理(推斷)的最佳化。
• 1.58位元量子化能夠提高與非GPU硬體(如資料流處理器或專用晶片)的相容性,推動AI進入物聯網(Intelligent of Things)裝置。

DeepSeek 的崛起,正在挑戰AI行業的傳統認知。無論它是否會迫使行業巨頭削減成本、引發全球AI競爭升級,還是重塑晶片製造商的市場格局,它的影響都將不可忽視。

AI領域正經歷深刻變革,而 DeepSeek 站在這場變革的最前沿。 (人工世界Artificial World)