【DeepSeek】攻守之勢異也？DeepSeek 會改變中美科技格局，甚至有可能影響整個開源社區

2025/01/29

•

如果你在 2025 年 1 月 24 日，晚上 9 點 39 分，以“DeepSeek latest news”（DeepSeek 最新消息）為關鍵詞在 Google 進行搜尋，並選取時間周期為過去 24 小時。

當看到結果時，你會有種倒反天罡的錯覺。

“中國新型 AI 模型如何威脅老美主導地位”。。。

“中國人工智慧產業幾乎趕上了美國”。。。

一直靠著“創新”收割全世界的老美怎麼突然開始“狂吹”一家中國公司了？

沒有對比就沒有傷害。

被人們調侃無數次的 OpenAI 不僅不 Open，還在玩著文字遊戲，創造令人摸不著頭腦的模型家族名稱時。

一家中國的非科技本業的公司，以幾乎可以忽略的成本對比，發佈了一個同樣性能，甚至在某些指標上超過“地球上目前最好的推理模型”的模型時，不論是極客、科研工作者或是拿著巨額薪資的科技公司高管，都會有點焦慮。

而且這個模型還開源，並且貼心的幫助 AI 愛好者們蒸餾出各種版本的，可以本地部署的小參數模型。

這種開源且友好的公司，讓全球各地的 AI 愛好者成為其擁躉。

所謂，“自有大儒為我辯經”。

而當一個事物被具有海盜精神的極客們推崇時，他就成為了屠龍的少年。

如果 2022 年底的 OpenAI-ChatGPT3 可以看做是屠龍的少年。

那麼現在的OpenAI-o1 或者 o3（未發佈）已經成長為了新的惡龍。

短短兩年，AI 的發展超過所有人的預料。

正在脫碳入硅的人類似乎並沒有準備好迎接新的時代。

當 Scaling Law 助推了輝達成長為全球第一市值的企業，讓 GPU 成為新時代軍火，讓眾多高管賺的比訓練一個完整的 DeepSeek-V3 還要多時。

創新，陰差陽錯，意料之外，情理之中的發生在中國的土地上。

DeepSeek-R1 的發佈，這是一個可能改變 AI ，甚至是科技界遊戲規則的事件。

雖然，現在並沒有定論 DeepSeek-R1 的技術白皮書一定是未來的方向。

DeepSeek 按照 MIT 協議開源，也沒有公佈全部的訓練資料。

並且有人猜測 DeepSeek 是使用了 ChatGPT 的生成資料來訓練才能達到 500 萬美元訓練一個可以匹敵幾十億美元訓練的模型。

但是，原始的 ChatGPT 也是“吞噬”整個網際網路現有的文字而沒有付出任何成本。

並且，爬滿整個網路的 OpenAI 爬蟲，讓很多小型網站完全癱瘓。

不僅如此。

在大模型領域，也許 OpenAI 並不是第一個吃螃蟹的人。

如果你知道最近有一家叫做智譜的中國公司，“全家”都上了美國商務部清單的話，你可以看下他們發佈的模型時間。

自二戰以來，人類大部分創新不可否認的發生在大洋彼岸。

但是，當解決掉生存問題和經濟問題時，中國人的智慧開始從八九十年代的固有認知中破土重生。

承擔這波任務就是八零後九零後甚至零零後。

Teamblind 是類似於中國脈脈的“實公司名”社交網站。

你必須使用公司後綴的信箱才能進行發言。

在一篇名為“Meta genai org in panic mode”的文章中，網名為“ngi”的 Meta 公司員工爆料了 Meta 高管的現狀——也許祖克柏可能很生氣。

“一切始於 deepseek v3，它讓 Llama 4 在基準測試中已然落後。雪上加霜的是，“那家預算 550 萬訓練費用的不知名中國公司”。

工程師們正瘋狂地剖析 deepsek，試圖從中複製一切可能的東西。我一點都沒有誇張。管理層對如何證明生成式 AI 組織的高昂成本感到擔憂。

當生成式 AI 組織的每一位“領導者”的薪酬都超過了訓練整個 DeepSeek V3 的成本，而我們有數十位這樣的“領導者”時，他們將如何面對領導層？

Deepseek r1 讓事情變得更加可怕。我不能透露機密資訊，但很快這些資訊就會公開。

本應是一個專注於工程的小型組織，但由於一群人想要加入影響力爭奪並人為地膨脹組織內的招聘，結果每個人都受損。”

（這裡插一段，這段英文的翻譯我使用是 DeepSeek-V3的 API 進行翻譯，確切地說，所有目前的英文，我都是用的 DeepSeek 的 V3，效果有多好你也可以看到，並且價格極其便宜，官方送的 10 塊錢，從 1 月 14 號開始高強度使用下，只花了幾毛錢）

“DeepSeek-R1 讓事情變得很可怕。”

世界上第一個出圈的大模型是 OpenAI 的 ChatGPT，當時開閉源之爭的焦點是 Meta 的 Llama，當時還是少年的 Meta 正在試圖屠掉閉源的 OpenAI。

而現在 DeepSeek-R1 在性能上完全接近了 OpenAI，而在開源領域似乎要接棒了 Meta。

OpenAI（背靠微軟，資本寵兒）和 Meta 的戰鬥，突然被 DeepSeek 各打五十大板，這麼看 DeepSeek 確實讓事情變得很可怕。

至於說對開源社區的影響。

有傳言說 OpenAI 內部已經誕生了類似 AGI 的神秘模型。

但是由於其閉源的屬性，外部無從得知這個模型的詳細細節。

但是如果 DeepSeek 的路子被證明是可行的話。

這個故事可就太有趣了。

無需巨額的資金和昂貴的顯示卡，只需要掌握正確的訓練方式，極客們就可以訓練大模型。

而在開源社區這些“先行者”的嘗試中，是否會誕生傳說中的“通用人工智慧”或者“超級人工智慧”，沒有人敢徹底否決。

這將會讓歷史首次發生一幕最戲劇性的畫面。

本來會被巨頭或者資本雪藏用來研製抗癌藥或者“長生不老藥”的 AGI（姑且這麼叫未來可能出現的智能），將在平民和極客中誕生。

而就在剛剛，DeepSeek-R1 在大模型競技場Chatbot Arena中上升了第三名，（順便一提，DeepSeek-V3 在第八名），而且是唯一個開源模型。

Chatbot Arena是由加州大學伯克利分校SkyLab和LMArena研究團隊開發的開放式眾包AI基準測試平台。該平台通過收集超過1,000,000次使用者投票，採用布萊德利-特裡(Bradley-Terry)統計模型對大型語言模型和AI聊天機器人進行排名，並生成即時競技排行榜。

說白了 Chatbot Arena 就是民選“冠軍”。

這類似虎撲每年選舉的全世界最美麗的女人。

現在，我很期待。

我很期待 2025 年的DeepSeek新模型。

更加期待人們用開源 DeepSeek 創造出任何可能的新鮮事物。 (AI進化日誌)