【DeepSeek】對晶片算力的影響

2025/02/25

•

DeepSeek 是近年來在人工智慧（AI）領域嶄露頭角的大模型之一，專注於自然語言處理（NLP）與生成式 AI（AIGC）。其核心目標是最佳化 AI 大模型的計算效率，降低訓練成本，同時提升模型推理的性能與可用性。

DeepSeek 通過一系列技術創新，如高效的 Transformer 架構最佳化、混合精度訓練、計算平行最佳化以及分佈式儲存管理，使得 AI 訓練和推理的計算需求大幅降低。這些最佳化不僅提升了 AI 模型在推理端的響應速度，也降低了 AI 應用在實際落地中的算力成本，使得大規模 AI 計算資源的門檻有所降低，推動了 AI 技術的進一步普及。

DeepSeek 在 AI 領域的影響主要體現在以下幾個方面：

1. 提高 AI 計算效率：最佳化的計算架構使得訓練成本大幅下降，同時提升推理階段的執行效率。

2. 降低 AI 模型訓練門檻：減少對高性能 GPU 計算資源的需求，使得更多企業可以在有限預算下訓練 AI 大模型。

3. 促進 AI 應用的普及：高效的推理最佳化降低了 AI 應用的運行成本，有助於推動 AI 在金融、醫療、智能駕駛等多個領域的商業化落地。

4. 影響全球 AI 晶片市場：DeepSeek 可能改變市場對算力需求的結構性認知，進而影響 AI 晶片供應鏈的佈局和投資策略。

#01 AI 大模型對算力的需求趨勢

近年來，AI 大模型的發展速度驚人，從 OpenAI 的 GPT 系列、Google 的 Gemini 到 Meta 的 LLaMA，AI 訓練和推理的算力需求呈指數級增長。這種增長趨勢主要體現在以下幾個方面：

AI 大模型的發展推動了算力需求的持續增長，並形成了從訓練到推理全鏈條的計算產業生態。然而，DeepSeek 的出現可能會改變這一趨勢，它通過最佳化計算架構降低訓練成本，使得 AI 計算市場的需求結構發生潛在變化。

1.1 DeepSeek 對晶片算力市場的短期與長期影響

鑑於 DeepSeek 的技術創新，將從短期和長期兩個層面探討其對 AI 晶片市場的影響：

結構性變化：算力架構多樣化發展

隨著 AI 算力需求的變化，未來可能出現多種計算架構共存的局面，如 RISC-V AI 處理器、異構計算 SoC、低功耗 AI 加速晶片等，以滿足不同場景的 AI 計算需求。
AI 計算晶片的競爭焦點將從“大規模訓練”轉向“高效推理”，未來 AI 晶片設計將更關注功耗最佳化、定製化計算單元，以及適應 AI 演算法快速迭代的能力。

綜上，DeepSeek 在最佳化 AI 訓練成本的同時，也將推動 AI 計算市場從訓練算力主導向推理算力主導的方向轉型。

1.2 DeepSeek 的技術創新

DeepSeek 作為新一代 AI 大模型，在技術上進行了多方面的創新，尤其在模型架構最佳化、訓練方法改進和推理階段最佳化方面，實現了對計算資源的高效利用。其核心目標是降低 AI 訓練成本、減少計算資源消耗，同時提升推理性能，從而在 AI 計算市場上形成競爭優勢。

模型架構最佳化：如何降低訓練成本和計算資源消耗

DeepSeek 通過對 Transformer 結構進行深度最佳化，降低了 AI 訓練對計算資源的消耗，同時提升了算力利用率。其主要技術創新包括以下幾個方面：

相比傳統 FP32 精度訓練，混合精度計算可減少 50% 以上的視訊記憶體佔用，同時提升計算速度，使得 DeepSeek 訓練更高效。

DeepSeek-R1 是參數數量最多的模型，超過600B，但其在互動過程中使用的參數數量相對較少，這可能意味著它在設計上更加高效，或者在實際應用中並未充分利用其全部參數。

訓練方法改進：DeepSeek 的計算效率相比傳統 AI 模型的提升

DeepSeek 在訓練過程中採用了一系列最佳化策略，使得其相比傳統 AI 模型的計算效率大幅提升。

這些最佳化器改進使得 DeepSeek 訓練更高效，所需 GPU 計算資源比傳統模型減少 20%-40%。

推理階段的最佳化：DeepSeek 在推理端的資源消耗

DeepSeek 在推理端進行了多方面最佳化，以降低計算資源需求，提高 AI 應用的響應速度。

這些最佳化確保 DeepSeek 可在不同硬體環境下高效運行，降低企業 AI 應用的成本。DeepSeek 通過架構最佳化、訓練方法改進和推理階段最佳化，使得 AI 計算資源的利用率大幅提升。

相比傳統 AI 模型，DeepSeek 訓練效率提升 50%以上，推理計算成本降低 30%-50%，對晶片算力市場的影響深遠。

1.3 DeepSeek 對晶片算力市場的短期影響

DeepSeek 作為 AI 領域的新型大模型，其在模型架構、訓練方法和推理階段的最佳化，使得 AI 計算資源的使用效率大幅提升。這些技術改進不僅降低了 AI 訓練和推理的算力需求，還對整個晶片市場產生了直接的短期影響，主要體現在以下幾個方面：

訓練算力需求下降：如何影響 GPU 及 AI 伺服器市場

1.4 長期影響：算力需求的演進

隨著 AI 技術的持續發展，DeepSeek 等大模型的最佳化不僅改變了短期的訓練算力需求，也將在長期內塑造 AI 計算市場的演進方向。從推理階段的算力需求增長，到國產 AI 生態的崛起，再到邊緣計算和端側 AI 推理的發展，算力市場將經歷深刻變革。

推理階段算力需求增長：大規模 AI 應用對晶片算力的新需求

圖中展示了DeepSeek的R1模型與其他公司最新模型在常用AI測試中的性能比較。圖表中列出了五個不同的測試類別：編碼（Coding）、定量推理（Quantitative reasoning）、推理和知識（Reasoning and knowledge）、以及科學推理和知識（Scientific reasoning and knowledge）。總的來說，圖中展示了DeepSeek的R1模型在多個常用AI測試中優於其他公司的最新模型，特別是在編碼和定量推理方面表現突出，得分接近滿分。

長期來看，推理算力市場將朝著高效、低功耗、專用化方向發展，並催生出更多 AI 計算架構的創新。

邊緣計算與 AI 端側推理：對低功耗、高算力晶片的需求變化

長期來看，DeepSeek 及 AI 大模型的發展將推動 AI 計算市場向推理計算需求增長、國產 AI 晶片崛起、邊緣計算和端側 AI 普及三大方向發展。未來，全球 AI 計算市場的競爭將更加激烈，國產 AI 計算生態也將迎來前所未有的機遇和挑戰。

#02 總結

隨著 DeepSeek 等大模型的最佳化迭代，AI 訓練的計算成本逐步下降，使得企業和開發者可以更高效地建構和部署 AI 模型。然而，這並不意味著算力市場的整體需求會下降，相反，推理端的算力需求仍在持續增長。AI 技術的發展正在推動算力市場從“訓練為主”向“訓練+推理並重”轉變，這將影響全球 AI 晶片產業格局，並給國產晶片廠商帶來機遇與挑戰。

DeepSeek 通過最佳化 AI 訓練方式降低了算力成本，同時推動了推理端算力需求的增長。短期來看，算力市場可能出現波動，但長期趨勢仍然是算力需求持續增長。國產 AI 晶片廠商迎來了新的發展機遇，同時也需要面對全球競爭和技術突破的挑戰。未來，國產算力產業需要在 AI 計算架構、推理晶片、軟體生態等多個方面持續發力，以實現真正的自主可控 AI 計算生態。

參考：

DeepSeek R1 AI model collects a lot of user data and distorts information about China
What is DeepSeek and why is it disrupting the AI sector? | Reuters
Three things to know as the dust settles from DeepSeek | MIT Technology Review
The Open Source Revolution in AI: DeepSeek's Challenge to the Status Quo - UNU Campus Computing Centre
Does China's DeepSeek-V3 make the computing power advantages of US AI companies less important？
DeepSeek Coder
🚀 Introducing DeepSeek-V3 | DeepSeek API Docs (芯師爺)

【DeepSeek】對晶片算力的影響

#01 AI 大模型對算力的需求趨勢

#02 總 結

#02 總結