DeepSeek的崛起與全球AI市場震盪
近年來,中國的AI技術在全球舞台上取得了顯著突破,尤其是在生成式AI領域。最近,DeepSeek這一來自杭州的初創公司憑藉其強大的AI模型和低成本訓練方式,在全球科技圈掀起了一股強烈的波瀾。
然而,這一切的背後並非風平浪靜。隨著DeepSeek取得的成績逐漸被國際間的關注放大,圍繞其技術突破和資源積累的陰謀論也應運而生,尤其是美國科技圈對於DeepSeek背後“晶片資源”的質疑。
DeepSeek的出現,無疑是中國AI技術發展的一個標誌性事件。
作為一家AI初創公司,它在短短時間內發佈了多個令人震驚的AI模型,其中最具代表性的就是DeepSeek-V3和DeepSeek-R1。這兩款模型不僅在性能上媲美甚至超越了OpenAI的GPT-4和Meta的LLaMA系列,而且在訓練和運行成本上,DeepSeek則顯示出了明顯的優勢。
根據行業的說法,V3模型的訓練成本僅為不到600萬美元,這個價格幾乎是OpenAI同類模型成本的零頭。
這一技術突破對於全球AI行業的意義非凡。長期以來,AI行業被認為是高算力和巨額投資的代名詞,尤其是對昂貴的GPU晶片的依賴,使得像Nvidia這樣的半導體巨頭受益頗豐。但DeepSeek通過其高效的演算法和創新的模型架構,成功打破了這一局面。
這一成就引發了全球範圍內對AI算力需求的重新評估,甚至有分析人士預測,DeepSeek的低成本模型意味著,未來AI大模型的訓練成本將大幅下降,這對於以Nvidia為首的硬體公司來說,無疑是一次巨大的衝擊。
然而,DeepSeek的成功並非沒有爭議。最引人注目的質疑來自美國Scale AI的CEO亞歷山大·王(Alexandr Wang)。
他在1月25日接受CNBC採訪時表示:“DeepSeek發佈了一款性能堪比OpenAI的AI模型,引發了市場恐慌,而這款產品的背後,可能使用了數萬顆Nvidia的H100晶片。” 王在採訪中進一步稱:“DeepSeek顯然擁有50,000顆H100晶片,但他們顯然不能公開這些資訊,因為那會違反美國的出口管制。”
Nvidia的H100晶片是目前市場上最先進的AI訓練晶片之一,其強大的計算能力使得它成為全球AI巨頭公司進行大規模深度學習訓練的首選。然而,根據美國政府的出口管制政策,H100晶片是無法向中國公司銷售的。
因此,王的言論立即引發了境外輿論的廣泛關注和質疑:DeepSeek是否在繞過出口管制,秘密獲取了大量H100晶片?如果真如此,這又意味著什麼?這一言論的背後,是否隱藏著對DeepSeek成功的政治動機?
對此,DeepSeek並未立即回應,但外界的猜測和爭議卻愈演愈烈。雖然DeepSeek的技術突破引人注目,但其背後是否真的存在無法公開的資源和技術來源,已經成為科技圈和國際間的一場博弈。
1月28日,DeepSeek的最新進展再次震撼了全球AI界。據人工智慧社區Hugging Face資訊顯示,DeepSeek發佈了Janus-Pro這一開放原始碼的多模態AI模型,並且在多個基準測試中表現不凡,超越了OpenAI的DALL-E 3和Stable Diffusion。Janus-Pro是一款突破性的多模態大語言模型(MLLM),其在視覺理解和生成的能力上展現出獨特的優勢。
Janus-Pro的設計理念顛覆了傳統多模態模型的架構。該模型採用了自回歸框架,並將視覺編碼分為“理解”和“生成”兩個獨立路徑,極大地提升了生成效果和計算效率。這一架構的創新,解決了以往多模態AI在理解和生成過程中的角色衝突,使得Janus-Pro不僅在圖像生成任務中表現突出,在自然語言處理上同樣具備了強大的能力。
Janus-Pro基於其DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base兩款模型進行了開發,並且採用了SigLIP-L作為視覺編碼器,支援高達384x384解析度的圖像輸入。這一技術突破,無疑使DeepSeek在AI行業的競爭力進一步增強。
所有的事情並非均向好的方向發展。1月28日,DeepSeek在官網發佈聲明稱,其線上服務最近遭遇了大規模的惡意攻擊,導致註冊通道繁忙,部分新使用者註冊受限。公司表示,已註冊使用者可以正常登錄,且對外界的理解和支援表示感謝。這一聲明雖然簡短,卻透露出一個不容忽視的訊號:DeepSeek的快速崛起和技術突破,似乎已經引起了某些不滿勢力的關注。
這場惡意攻擊是否與DeepSeek的技術突破有關,尚無定論,但其背後所帶來的影響不容小覷。網路攻擊、資料洩露、虛假資訊等問題,可能都將成為DeepSeek在全球市場競爭中必須面對的挑戰。
DeepSeek的快速崛起和技術突破不僅引發了美國科技公司和媒體的關注,也直接影響了美股市場的表現。1月28日,美股三大指數的表現漲跌不一。道瓊斯指數上漲0.65%,但標普500和納斯達克分別下跌了1.46%和3.07%。尤其是半導體類股的崩盤,成為市場焦點。Nvidia的股價大跌16.86%,創下了歷史上最大單日市值蒸發紀錄,市值縮水近5888億美元(約合人民幣4.27兆元)。
這種劇烈波動的背後,很大程度上與DeepSeek的崛起和其低成本、高效能的AI模型直接相關。DeepSeek的技術創新讓整個AI行業的競爭格局發生了變化,特別是對傳統半導體和硬體廠商的衝擊極為明顯。DeepSeek以低廉的訓練成本和靈活的硬體資源組態,顯然讓這些傳統晶片廠商感到前所未有的壓力。
DeepSeek的成功無疑為全球AI行業帶來了新的思路與突破,但也讓我們看到,技術創新背後不僅僅是演算法和算力的較量,更是資訊戰與資源控制的博弈。從關於晶片數量的陰謀論,到網路攻擊的頻繁發生,再到全球科技股的震盪,這一切都表明,DeepSeek在迅速崛起的同時,已經成為全球科技競賽中不可忽視的一股力量。
在未來,DeepSeek能否繼續保持技術領先,並在全球AI市場中佔據一席之地,將不僅僅取決於其演算法創新和成本優勢,更可能受到政治博弈、國際貿易政策以及資訊戰的深刻影響。隨著AI技術逐漸滲透到各行各業,技術突破背後的爭鬥或許才剛剛開始。 (科技漩渦)