【DeepSeek】從50,000顆H100到惡意攻擊：誰在害怕DeepSeek的成功？

2025/01/28

•

DeepSeek的崛起與全球AI市場震盪

近年來，中國的AI技術在全球舞台上取得了顯著突破，尤其是在生成式AI領域。最近，DeepSeek這一來自杭州的初創公司憑藉其強大的AI模型和低成本訓練方式，在全球科技圈掀起了一股強烈的波瀾。

然而，這一切的背後並非風平浪靜。隨著DeepSeek取得的成績逐漸被國際間的關注放大，圍繞其技術突破和資源積累的陰謀論也應運而生，尤其是美國科技圈對於DeepSeek背後“晶片資源”的質疑。

DeepSeek崛起：技術突破與成本優勢

DeepSeek的出現，無疑是中國AI技術發展的一個標誌性事件。

作為一家AI初創公司，它在短短時間內發佈了多個令人震驚的AI模型，其中最具代表性的就是DeepSeek-V3和DeepSeek-R1。這兩款模型不僅在性能上媲美甚至超越了OpenAI的GPT-4和Meta的LLaMA系列，而且在訓練和運行成本上，DeepSeek則顯示出了明顯的優勢。

根據行業的說法，V3模型的訓練成本僅為不到600萬美元，這個價格幾乎是OpenAI同類模型成本的零頭。

這一技術突破對於全球AI行業的意義非凡。長期以來，AI行業被認為是高算力和巨額投資的代名詞，尤其是對昂貴的GPU晶片的依賴，使得像Nvidia這樣的半導體巨頭受益頗豐。但DeepSeek通過其高效的演算法和創新的模型架構，成功打破了這一局面。

這一成就引發了全球範圍內對AI算力需求的重新評估，甚至有分析人士預測，DeepSeek的低成本模型意味著，未來AI大模型的訓練成本將大幅下降，這對於以Nvidia為首的硬體公司來說，無疑是一次巨大的衝擊。

50,000顆Nvidia H100晶片的疑雲

然而，DeepSeek的成功並非沒有爭議。最引人注目的質疑來自美國Scale AI的CEO亞歷山大·王(Alexandr Wang)。

他在1月25日接受CNBC採訪時表示：“DeepSeek發佈了一款性能堪比OpenAI的AI模型，引發了市場恐慌，而這款產品的背後，可能使用了數萬顆Nvidia的H100晶片。” 王在採訪中進一步稱：“DeepSeek顯然擁有50,000顆H100晶片，但他們顯然不能公開這些資訊，因為那會違反美國的出口管制。”

Nvidia的H100晶片是目前市場上最先進的AI訓練晶片之一，其強大的計算能力使得它成為全球AI巨頭公司進行大規模深度學習訓練的首選。然而，根據美國政府的出口管制政策，H100晶片是無法向中國公司銷售的。

因此，王的言論立即引發了境外輿論的廣泛關注和質疑：DeepSeek是否在繞過出口管制，秘密獲取了大量H100晶片?如果真如此，這又意味著什麼?這一言論的背後，是否隱藏著對DeepSeek成功的政治動機?

對此，DeepSeek並未立即回應，但外界的猜測和爭議卻愈演愈烈。雖然DeepSeek的技術突破引人注目，但其背後是否真的存在無法公開的資源和技術來源，已經成為科技圈和國際間的一場博弈。

Janus-Pro：DeepSeek的新突破

1月28日，DeepSeek的最新進展再次震撼了全球AI界。據人工智慧社區Hugging Face資訊顯示，DeepSeek發佈了Janus-Pro這一開放原始碼的多模態AI模型，並且在多個基準測試中表現不凡，超越了OpenAI的DALL-E 3和Stable Diffusion。Janus-Pro是一款突破性的多模態大語言模型(MLLM)，其在視覺理解和生成的能力上展現出獨特的優勢。

Janus-Pro的設計理念顛覆了傳統多模態模型的架構。該模型採用了自回歸框架，並將視覺編碼分為“理解”和“生成”兩個獨立路徑，極大地提升了生成效果和計算效率。這一架構的創新，解決了以往多模態AI在理解和生成過程中的角色衝突，使得Janus-Pro不僅在圖像生成任務中表現突出，在自然語言處理上同樣具備了強大的能力。

Janus-Pro基於其DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base兩款模型進行了開發，並且採用了SigLIP-L作為視覺編碼器，支援高達384x384解析度的圖像輸入。這一技術突破，無疑使DeepSeek在AI行業的競爭力進一步增強。

DeepSeek遭遇大規模惡意攻擊

所有的事情並非均向好的方向發展。1月28日，DeepSeek在官網發佈聲明稱，其線上服務最近遭遇了大規模的惡意攻擊，導致註冊通道繁忙，部分新使用者註冊受限。公司表示，已註冊使用者可以正常登錄，且對外界的理解和支援表示感謝。這一聲明雖然簡短，卻透露出一個不容忽視的訊號：DeepSeek的快速崛起和技術突破，似乎已經引起了某些不滿勢力的關注。

這場惡意攻擊是否與DeepSeek的技術突破有關，尚無定論，但其背後所帶來的影響不容小覷。網路攻擊、資料洩露、虛假資訊等問題，可能都將成為DeepSeek在全球市場競爭中必須面對的挑戰。

美股市場的反應：科技股全線下跌

DeepSeek的快速崛起和技術突破不僅引發了美國科技公司和媒體的關注，也直接影響了美股市場的表現。1月28日，美股三大指數的表現漲跌不一。道瓊斯指數上漲0.65%，但標普500和納斯達克分別下跌了1.46%和3.07%。尤其是半導體類股的崩盤，成為市場焦點。Nvidia的股價大跌16.86%，創下了歷史上最大單日市值蒸發紀錄，市值縮水近5888億美元(約合人民幣4.27兆元)。

這種劇烈波動的背後，很大程度上與DeepSeek的崛起和其低成本、高效能的AI模型直接相關。DeepSeek的技術創新讓整個AI行業的競爭格局發生了變化，特別是對傳統半導體和硬體廠商的衝擊極為明顯。DeepSeek以低廉的訓練成本和靈活的硬體資源組態，顯然讓這些傳統晶片廠商感到前所未有的壓力。

結語：資訊戰中的技術博弈

DeepSeek的成功無疑為全球AI行業帶來了新的思路與突破，但也讓我們看到，技術創新背後不僅僅是演算法和算力的較量，更是資訊戰與資源控制的博弈。從關於晶片數量的陰謀論，到網路攻擊的頻繁發生，再到全球科技股的震盪，這一切都表明，DeepSeek在迅速崛起的同時，已經成為全球科技競賽中不可忽視的一股力量。

在未來，DeepSeek能否繼續保持技術領先，並在全球AI市場中佔據一席之地，將不僅僅取決於其演算法創新和成本優勢，更可能受到政治博弈、國際貿易政策以及資訊戰的深刻影響。隨著AI技術逐漸滲透到各行各業，技術突破背後的爭鬥或許才剛剛開始。 (科技漩渦)

科技