【DeepSeek】再曝大消息!

DeepSeek激起千層浪!

輝達出手

1月31日,輝達官宣,上線了搭載DeepSeek-R1的軟體服務。輝達的官網顯示,DeepSeek-R1模型現已作為NVIDIA NIM微服務預覽版提供,開發者可以測試和體驗該API,未來提供可下載的NIM微服務版本。

什麼是NIM服務?這是輝達在2024年新推出的軟體產品,主要輔助AI應用開發。 Forrester副總裁兼首席分析師戴鯤曾向21世紀經濟報導記者表示,NIM是個推理平台,融合了底層的CUDA、對自身和第三方大模型的支援、對主流推理框架和雲平台的整合,可以加速生成式人工智慧模式推理全過程,是NVIDIA企業級AI平台的最後一塊拼圖。

輝達當然是硬體巨頭,更是軟體專家,它也有自己的B端AI服務平台,NIM微服務主要是幫助開發者面向未來創造新的應用,不需要從零寫程式碼。

所以,輝達接入DeepSeek-R1也是豐富自家平台上的模型選項,然後和自家硬體結合,形成一整套軟硬體AI體系。結合NVIDIA AI Foundry和NVIDIA NeMo軟體,企業也可訂製DeepSeek-R1 NIM微服務,以建構特定領域的AI智能體。

R1作為推理模型,輝達在介紹中著重強調了其強大的推理能力,並表示推理需要大量的算力支援。

輝達解析道,DeepSeek-R1採用大規模專家混合(MoE)架構,參數規模高達6710億,是許多流行的開源大模型的10倍。其輸入上下文長度可達128000個Token,每層有256個專家(Experts),每個Token會被併行路由至8個不同的專家進行推理計算。

而要實現R1的即時推理,需要大量高算力GPU,並依賴高頻寬、低延遲的通訊能力,將輸入Token高效路由至所有專家進行推理。結合NVIDIA NIM微服務的最佳化,一個配備8塊H200 GPU並通過NVLink和NVLink Switch互聯的伺服器,即可運行完整的6710億參數DeepSeek-R1模型,實現高達3872 Token/秒的推理吞吐量。

DeepSeek「真香」?

據@玉淵潭天總結,這個春節,DeepSeek火爆全球,隨著熱度而來的還有白宮的國家安全調查,這一操作並不陌生,這段時間美國對華制裁可謂花樣百出。但被白宮點名的這些企業,業績不但沒有下滑,有些產品反而越來越火爆。

事實上,科技巨頭已經下場無縫連接DeepSeek-R1模型服務。

先是微軟,現在已經將DeepSeek-R1模型加入其Azure AI Foundry,開發者可以用新模型進行測試和建構基於雲端的應用程式和服務。同時,微軟也將R1的精煉版本引入“Copilot+PC”,率先提供給搭載驍龍X晶片、英特爾酷睿Ultra 200V處理器的PC裝置,然後是搭載AMD Ryzen AI 9的裝置。

緊接著,AWS(亞馬遜雲科技)也宣佈,使用者可以在Amazon Bedrock和Amazon SageMaker AI兩大AI服務平台上部署DeepSeek-R1模型。

從微軟和AWS的選擇和動作來看,都在用更多、更強大的大模型矩陣,來強化自家的雲端業務。眼下雲廠商正在加大AI轉型力度,外界也最關注AI如何驅動雲成長。

對於輝達、AWS和微軟三家巨頭而言,無論“黑貓還是白貓”,能夠上場應用的模型就是“好貓”。而大家迅速接入DeepSeek模型,一方面是認可DeepSeek的能力,另一方面大家的共識是AI成本在降低,都在為AI普及和應用爆發做更多基礎佈局。

從去年開始,業界大佬就不斷強調成本下降這一觀點,但各有各的邏輯。例如輝達說AI推理成本下降,主要基於算力效率提高。現在,DeepSeek從演算法角度給出了新的解題思路,透過工程創新提高訓練和推理效率,進一步降低成本。

同時,DeepSeek也帶給OpenAI、Anthropic兩大閉源代表更大的競爭壓力。這兩位AI明星已經聚集了巨大資本,2024年都獲得了大額融資。近日Anthropic CEO發文要求加強出口管制;OpenAI動作頻頻,不僅突然宣佈「o3」模型要在周五公佈,還有融資傳聞流出。

據媒體報導,OpenAI正在以3000億美元估值,尋求新一輪的400億美元融資,還有報導稱,軟銀此番項目最多向OpenAI投資250億美元。這也和不久前推出的Stargate(星際之門)計畫,有所呼應。

可以預見,AI賽場上,你追我趕的競爭態勢愈演愈烈,DeepSeek颳起的旋風還將繼續。表面上看,DeepSeek是一家小型初創企業,但它背後的幻方量化已經成長了近十年,公司招募的多是外人眼中的“天才少年”,精悍的團隊讓DeepSeek的敘事席捲全球。

人才,依然是創新的基石,AI繼續吸引著全球最聰明的腦袋、最頂尖的人才投入其中。 DeepSeek的「黑神話」拉開了AI新篇章,這或許是一個新起點,在AI開源世界中,更多的DeepSeek正在孕育中。同時,也讓子彈多飛一會,讓這場圍繞著DeepSeek、成本、AI泡棉、開源閉源的探討越辯越明。

質疑DeepSeek的馬斯克,還得靠AI撐起特斯拉股價

面對DeepSeek的爆火,特斯拉CEO馬斯克卻在社群平台上嗤之以鼻,質疑其低成本訓練,還附和「DeepSeek擁有5萬塊輝達H100晶片」的言論。

在DeepSeek評論區高速衝浪的馬斯克嗅到了一絲危機,但也嘗到了甜頭。

當地時間1月29日美股盤後,特斯拉發表2024年第四季及全年業績報告。報告期間內,汽車業務收入、利潤率、淨利潤、銷量較去年同期均下降,且不如市場預期。

不過,賣車並不是特斯拉的終極目的,正如特斯拉CEO馬斯克多次強調,特斯拉是一家AI公司而並非汽車製造商。

在最近的財報會上,馬斯克稱,「特斯拉有朝一日將依靠自動駕駛車輛和人形機器人成為世界上最有價值的公司,遠超其他公司,特斯拉的價值將遠遠超過其後五大公司總和。 (21世紀經濟報導)