【DeepSeek】難怪Deepseek創始人受到中國總理接見,還上了新聞聯播

Deepseek恐怕做夢都沒料到,一個業餘的AI團隊,轉眼間竟已與華為、TikTok 比肩齊名了。這家成立於2023年的的AI公司Deepseek先是在外網火了,許多人預言:Deepseek很可能會戳破美國史上最大的AI泡沫。

這兩天,總理邀請 Deepseek 創始人梁文鋒參加座談會,相關報導更是登上《新聞聯播》,一時間引發廣泛關注。


(圖為梁文鋒參加座談會)

然後微軟總裁納德拉、祖克柏、連OpenAI的創始人奧特曼都在稱讚Deepseek。甚至整個美國的AI圈都在研究Deepseek發佈的V3和R1大模型。

祖克柏更直接:他呼籲美國政府加緊封鎖中國AI技術,還說Deepseek威脅美國國家安全,他要求所有AI員工上陣研究Deepseek的大模型。


祖克柏很著急,因為支撐Meta 公司股價的就是獨霸市場的開源‌LLaMA模型,這個模型投入已經超過1000億美元,本來還打算在投入650億美金做護城河,結果Deepseek只用了Meta 公司一個高管的工資就能做出超過他們幾年上千億美金研發出開放原始碼的‌LLaMA模型。

最主要的是人家的主業是干“量化交易”的,後面幹了個副業AI大模型出來,竟然威脅到美國的國家安全了。你說祖克柏能不急嘛!!!

Meta 公司原本是想通過開放原始碼的‌LLaMA模型,大規模掌控全球商業公司,甚至他可以通過AI技術決定每個公司的生產力水平,讓他的開源模型成為AI時代的水和電。

而Deepseek出來後,祖克柏直接傻眼了,它不僅讓輝達的股價下跌了,還有可能刺破美國史上最大的AI泡沫。

因為Deepseek改變了整個AI大模型的研發模式,Deepseek出來後,只用了少量晶片和不到600萬美金就訓練出來了,媲美chatgpt O1的模型,成本下降了10倍,效果卻不輸頂尖的大模型。


這樣一來,以後大家對算力的要求降低了太多了,據說AMD已經把Deepseek打包到AMD的解決方案裡面了。

以前所有的公司都認為AI大模型需要大力出奇蹟,需要對算力進行大量的投資,購買大量晶片,而Deepseek改變了這一認知。老外總是想著問題複雜化,而中國人總是化繁為簡。

最最重要的是:Deepseek是按照MIT協議、完全開放原始碼的模型,從程式碼到架構,從理論到訓練方法,您隨便看隨便改隨便用。現在全球多個團隊,宣佈復現了R1的訓練過程。

報導說後來研究人員發現,Deepseek稍微深一些的推理仍然不如西方吃算力的大模型,只是某些場景推理能力省算力。

寫在最後

DeepSeek最大的意義是,低成本戳破美國AI的資本泡沫遊戲,讓AI回歸科研本身,開源打破美國的模型壁壘,讓全世界都可以參與AI研發。

難怪DeepSeek的老闆受到總理接見,還上了新聞聯播。 (盧鬆鬆)