【DeepSeek】攻守之勢異也?DeepSeek 會改變中美科技格局,甚至有可能影響整個開源社區

如果你在 2025 年 1 月 24 日,晚上 9 點 39 分,以“DeepSeek latest news”(DeepSeek 最新消息)為關鍵詞在 Google 進行搜尋,並選取時間周期為過去 24 小時。

當看到結果時,你會有種倒反天罡的錯覺。

“中國新型 AI 模型如何威脅老美主導地位”。。。

“中國人工智慧產業幾乎趕上了美國”。。。

一直靠著“創新”收割全世界的老美怎麼突然開始“狂吹”一家中國公司了?




沒有對比就沒有傷害。

被人們調侃無數次的 OpenAI 不僅不 Open,還在玩著文字遊戲,創造令人摸不著頭腦的模型家族名稱時。

一家中國的非科技本業的公司,以幾乎可以忽略的成本對比,發佈了一個同樣性能,甚至在某些指標上超過“地球上目前最好的推理模型”的模型時,不論是極客、科研工作者或是拿著巨額薪資的科技公司高管,都會有點焦慮。

而且這個模型還開源,並且貼心的幫助 AI 愛好者們蒸餾出各種版本的,可以本地部署的小參數模型。

這種開源且友好的公司,讓全球各地的 AI 愛好者成為其擁躉。

所謂,“自有大儒為我辯經”。

而當一個事物被具有海盜精神的極客們推崇時,他就成為了屠龍的少年。


如果 2022 年底的 OpenAI-ChatGPT3 可以看做是屠龍的少年。

那麼現在的OpenAI-o1 或者 o3(未發佈)已經成長為了新的惡龍。

短短兩年,AI 的發展超過所有人的預料。

正在脫碳入硅的人類似乎並沒有準備好迎接新的時代。

當 Scaling Law 助推了輝達成長為全球第一市值的企業,讓 GPU 成為新時代軍火,讓眾多高管賺的比訓練一個完整的 DeepSeek-V3 還要多時。

創新,陰差陽錯,意料之外,情理之中的發生在中國的土地上。

DeepSeek-R1 的發佈,這是一個可能改變 AI ,甚至是科技界遊戲規則的事件。


雖然,現在並沒有定論 DeepSeek-R1 的技術白皮書一定是未來的方向。

DeepSeek 按照 MIT 協議開源,也沒有公佈全部的訓練資料。

並且有人猜測 DeepSeek 是使用了 ChatGPT 的生成資料來訓練才能達到 500 萬美元訓練一個可以匹敵幾十億美元訓練的模型。

但是,原始的 ChatGPT 也是“吞噬”整個網際網路現有的文字而沒有付出任何成本。

並且,爬滿整個網路的 OpenAI 爬蟲,讓很多小型網站完全癱瘓。


不僅如此。

在大模型領域,也許 OpenAI 並不是第一個吃螃蟹的人。

如果你知道最近有一家叫做智譜的中國公司,“全家”都上了美國商務部清單的話,你可以看下他們發佈的模型時間。


自二戰以來,人類大部分創新不可否認的發生在大洋彼岸。

但是,當解決掉生存問題和經濟問題時,中國人的智慧開始從八九十年代的固有認知中破土重生。

承擔這波任務就是八零後九零後甚至零零後。


Teamblind 是類似於中國脈脈的“實公司名”社交網站。

你必須使用公司後綴的信箱才能進行發言。

在一篇名為“Meta genai org in panic mode”的文章中,網名為“ngi”的 Meta 公司員工爆料了 Meta 高管的現狀——也許祖克柏可能很生氣。

“一切始於 deepseek v3,它讓 Llama 4 在基準測試中已然落後。雪上加霜的是,“那家預算 550 萬訓練費用的不知名中國公司”。

工程師們正瘋狂地剖析 deepsek,試圖從中複製一切可能的東西。我一點都沒有誇張。 管理層對如何證明生成式 AI 組織的高昂成本感到擔憂。

當生成式 AI 組織的每一位“領導者”的薪酬都超過了訓練整個 DeepSeek V3 的成本,而我們有數十位這樣的“領導者”時,他們將如何面對領導層?

Deepseek r1 讓事情變得更加可怕。我不能透露機密資訊,但很快這些資訊就會公開。

本應是一個專注於工程的小型組織,但由於一群人想要加入影響力爭奪並人為地膨脹組織內的招聘,結果每個人都受損。”

(這裡插一段,這段英文的翻譯我使用是 DeepSeek-V3的 API 進行翻譯,確切地說,所有目前的英文,我都是用的 DeepSeek 的 V3,效果有多好你也可以看到,並且價格極其便宜,官方送的 10 塊錢,從 1 月 14 號開始高強度使用下,只花了幾毛錢)


“DeepSeek-R1 讓事情變得很可怕。”

世界上第一個出圈的大模型是 OpenAI 的 ChatGPT,當時開閉源之爭的焦點是 Meta 的 Llama,當時還是少年的 Meta 正在試圖屠掉閉源的 OpenAI。

而現在 DeepSeek-R1 在性能上完全接近了 OpenAI,而在開源領域似乎要接棒了 Meta。

OpenAI(背靠微軟,資本寵兒)和 Meta 的戰鬥,突然被 DeepSeek 各打五十大板,這麼看 DeepSeek 確實讓事情變得很可怕。


至於說對開源社區的影響。

有傳言說 OpenAI 內部已經誕生了類似 AGI 的神秘模型。

但是由於其閉源的屬性,外部無從得知這個模型的詳細細節。

但是如果 DeepSeek 的路子被證明是可行的話。

這個故事可就太有趣了。

無需巨額的資金和昂貴的顯示卡,只需要掌握正確的訓練方式,極客們就可以訓練大模型。

而在開源社區這些“先行者”的嘗試中,是否會誕生傳說中的“通用人工智慧”或者“超級人工智慧”,沒有人敢徹底否決。

這將會讓歷史首次發生一幕最戲劇性的畫面。

本來會被巨頭或者資本雪藏用來研製抗癌藥或者“長生不老藥”的 AGI(姑且這麼叫未來可能出現的智能),將在平民和極客中誕生。


而就在剛剛,DeepSeek-R1 在大模型競技場Chatbot Arena中上升了第三名,(順便一提,DeepSeek-V3 在第八名),而且是唯一個開源模型。

Chatbot Arena是由加州大學伯克利分校SkyLab和LMArena研究團隊開發的開放式眾包AI基準測試平台。該平台通過收集超過1,000,000次使用者投票,採用布萊德利-特裡(Bradley-Terry)統計模型對大型語言模型和AI聊天機器人進行排名,並生成即時競技排行榜。

說白了 Chatbot Arena 就是民選“冠軍”。

這類似虎撲每年選舉的全世界最美麗的女人。


現在,我很期待。

我很期待 2025 年的DeepSeek新模型。

更加期待人們用開源 DeepSeek 創造出任何可能的新鮮事物。 (AI進化日誌)