【DeepSeek】矽谷AI霸權和神話的破滅·續:DeepSeek的開源平權贏得了天下
Web3天空之城·城主:
春節除夕到來之際,DeepSeek黑天鵝在美股放了個大🧨炮仗,把美國人震得暈頭轉向。周一輝達創下了史上最大跌幅,一夜跌去17% 約4650億美金。整個納斯達克大盤跌去了近兩兆美金,納斯達克指數下滑了3%。
城主在DeepSeek R1剛出來之際,寫了一篇文章【矽谷AI霸權和神話的破滅開端:淺談DeepSeek R1的意義】, 目前看來,現實的進展比預期更快,醞釀了幾天後,恍然大悟的金融資本如海嘯一般吞噬了瑟瑟發抖的納斯達克科技股。
有老外在X平台發推,評論DeepSeek用650萬美金蒸發了美國2兆市值。這絕對是人類歷史留名的一刻。(不盡精準,650萬隻是v3模型的宣稱費用,不包括R1)
有趣的是,DeepSeek母公司“幻方量化”就是玩金融的。這宿命的金融收割啊。坊間傳聞,幻方有一個做空NVidia的模型,還有一個笑話是,幻方以後發佈自己的AI大模型就是做空NV的最好手段。
本來城主對這些傳聞都是一笑而過的,不過就在除夕前夜美科技股因為DeepSeek R1而史詩級大跌的同時, 幻方創始人梁文鋒又又又發佈了DeepSeek最新的多模態模型,先不說其中創新的大模型框架,只看其中AI生圖技術,在評測中直接擊敗了OpenAI DALL-E 3和Stable Diffusion。
這節奏真妥妥的;又想到R1發佈的時間正是懂王上台的同一天。。。這大棋論,都快由不得城主不信了。
在這個歷史性時刻(還是中國人的新春佳節),值得好好說道。
今夜美國註定很多人無眠,輝達股票破天荒的跌穿20%, 最後停在17%跌幅, 台積電跌了13%,晶片指數大跌9%,和半導體晶片相關的股票都在跌。
美國的主流新聞輿論已把這個時刻和當年蘇聯首發人造衛星的時刻相提並論。或許多年以後,他們還會想起這一刻被DeepSeek 全控的心理陰影。
城主上一篇文章發出後,評論區留言有一種論調是,DeepSeek把技術開源了,所以老美可以複製技術了 ,然後老美還有更好的算力,所以老美繼續保持領先。。。
但是,如果真相和未來就是這麼簡單, 今天的納斯達克就不會血流成河,跌去兩兆市值。金融的嗅覺一直是最敏感的,儘管有時候過度了。
這幾天真的很熱鬧,看到投資圈的人一直在深挖DeepSeek的內幕後台意義。但說一句不知道是否正確的話,搞金融投資的同學,大多情況下只有當一個事情成為香饃饃時,才使勁去挖掘意義。在DeepSeek爆火之前,採訪這個團隊和創始人的文章只有寥寥一二;而現在,那一兩篇難得的採訪 ,都被翻出來當做重要資料反覆研讀,甚至被翻譯為英文後老外也在逐字研讀。
所有人都在談DeepSeek,各種角度,各種方向。城主簡單說幾個判斷吧。
第一,DeepSeek R1為什麼開源?除了創始人的格局,還有一個因素是, 讓AI自動強化學習的思路從下圍棋的AlphaGo Zero就已經存在, 這個直接強化的訓練方式從邏輯上是非常直接的,即使DeepSeek不發,其他AI團隊早晚也會發現。所以還不如自己先發出來,同時發佈自己的大模型,兩者結合,產生最大的影響力(開源這一點後面還會展開談談)
第二,DeepSeek的核心競爭力除了論文上的原創大模型強化訓練方法,同樣重要的是他們的工程架構實踐,這一點在Perplexity創始人的評論裡就有體現。大家都知道DeepSeek R1是個MOE專家模型,但專家模型的訓練很難把握參數的平衡和訓練程度,簡單的說就是多個專家模型如何能在訓練中同時達到最好水平,用什麼樣的方式來進行這個判斷。另外,DeepSeek成功把8位浮點精度運用在大模型訓練和推理中,所有人都知道這樣能大幅度降低硬體要求,但怎麼做到這點,這就不容易了。更加不用說, DeepSeek的工程架構依託在幻方這個量化交易巨頭多年的實踐積累之上。所有這些,都非一日之功。
第三, 開源醉翁之意不在酒,在於技術平權和打破封鎖。
首先技術平權就是開放原始碼的重要特點。不像封閉的OpenAI,DeepSeek大概想通了一點,作為一種工程技術, 大模型的訓練秘密是難以一直保密的。
本質上,人類對Transformer模型本身為什麼能產生如此驚人的智能能力毫無所知,只知其然,不知其所以然。
如果未來,某個學術團隊真正揭開了Transformer模型讓電腦產生智能響應的秘密,這或許是一個類比其他自然科學保密研究的成果。
但在此之前,對大模型訓練的方法迭代,本質上只是某種工程的嘗試和最佳化。強化學習技術不是新鮮事物,這只是一層紙。
西方團隊沒能第一個找到和突破這層紙,還是因為GPU硬體太容易得到了。人是有惰性的,沒有一個外界的動力,往往就被自己帶偏了。
但這層紙突破後,讓所有人都明白怎麼打造一個頂級AI智能,相當於教科書發給了所有學生,剩下的,就看誰能學習考試拿第一(工程實踐出結果)。而這一點,難道不是中國人的拿手好戲嗎?
最後,如果能通過AI技術平權,直接給予美國晶片鎖死中國的政策致命一擊(從周一納斯達克的表現,已經初見成效),那麼,這對中國而言,依然是個意外的巨大勝利。
什麼,你還要問開源了賺錢怎麼辦?有人覺得幻方還差錢嗎:)
--
可以客觀的說,做AI服務是很難賺到大錢的, 更何況DeepSeek做的是AI開源。
幻方在API服務上的策略是只要在收回成本之上稍有盈利即可。
有很多老美都在打問號:DeepSeek這麼開放原始碼的搞法,怎麼賺錢呢?答案是幻方根本沒打算從DeepSeek中賺錢。
注意,這裡的前提是,母公司幻方作為量化巨頭,實實在在的給了創始人梁文鋒“打平即可”的底氣。
這是背負幾千億估值,不惜和馬斯克打官司也要把自己變成盈利實體的OpenAI無論如何做不到的。這麼多金融資本盯著,燒了這麼多億,如果不想辦法把錢賺回來,很難交代。
所以OpenAI搞了200美刀的o1 Pro訂閱,還號稱要搞個2000刀的訂閱。但現在,DeepSeek完全不講武德的免費開源,直接把天給捅破了。Sam Altman這一周大概很難入睡了
有趣的是,昨晚美股大跌,不搞AI的蘋果甚至漲了幾個點,這個理由也很直接, 如果最頂級的AI已經平權使用,那麼蘋果之前AI進展的落後就可以抹平無視。
跌得最誇張的還是晶片行業,除了輝達,AMD,TSMC和生產晶片裝置的阿斯麥,還有各種半導體指數。這個認知也很簡單,既然AI不需要這麼多算力,那麼多晶片就無人買單了。
如果大家還記得,輝達在AI時代之前,也有過一次大起大落,當時因為區塊鏈加密貨幣概念的火爆而大漲--因為挖礦需要輝達的GPU卡,而區塊鏈概念因為空氣幣暴雷而泡沫破滅後,輝達的估值就一落千丈。但輝達的命很好,因為緊接著就是AI時代的到來,AI繼續需要輝達的GPU,兩者無縫連接。之後就有了所有人都知道的AI第一股NVIDIA輝達。
拜登政府在下台前匆忙搞了個懟天懟地限制全世界算力,甚至連自己盟友都限制的三級算力限製法案,現在看起來有點像個笑話。美國人和資本不再擔心算力的“國家安全”,而是開始擔心自己晶片賣不出去了。真是一個莫大的諷刺。
因此, DeepSeek 這兩天已經被中文網際網路冠以“國運級”事件,某種程度上也非常的恰當,恐怕過去中國為了對抗美國晶片封堵所做的所有努力, 都沒有DeepSeek這一次證明完全不需要那麼多算力也能做出頂級AI大模型的影響來得深遠。算力的需求直接降低了一個數量級之後,對中國和世界的晶片封鎖恐怕就要打一個巨大的問號了。
而這一次對中國的正面影響是立現的:如果說之前,國內希望使用頂級AI API的企業只能絞盡腦汁用各種代理,冒著被國內監管和被美國公司封號的危險去用 - 這顯然是無法成就長久事業的 - 那麼現在, 所有國內希望用AI做事情的企業和個人,包括各種下游應用,各種具身智能,都開心的發現,我們現在可以光明正大的使用世界頂級的AI API了。這次AI的平權,首先直接受益的,是所有中國企業。
當然, 並不是DeepSeek拿出R1,高端AI晶片就沒有需求了。實際上無論是幻方還是其他中國公司,仍然需要大量算力。
但是,DeepSeek R1是一個“種子”, 就像盜夢空間那個埋入人心的種子那樣,這個種子成為了那些企圖以晶片封鎖中國科技進展的人腦海裡一個揮之不去的夢魘 - 還要再封鎖, 是否繼續適得其反,逼得中國人繼續做出本來之前沒必要去實現的重大創新。美國主串流媒體的一些有識之士已經直接指出了這一點。
在上一篇文章裡,有一位美國的老粉絲留言,指出城主文章的出發點還是打臉, 而DeepSeek創始人成功是因為有著世界大同的高度, 然後做了個回覆,兩個留言都有很多的贊同:
其實城主想說的是, 打臉美國某些人,和祈望世界大同發展,人類共同進步完全不矛盾,命運共同體本來就是中國人民的發聲。勤勞的中國人只希望有一個安居樂業的環境,無奈霸道至極的某國絞盡腦汁來打壓而已。對這個情況, 有個網友的留言表達得很好:
一切才剛開始。 昨晚DeepSeek繼續發威,發佈了基準評測超越DALLE-3和Stable Diffusion的原生多模態模型預覽版,據說只用兩百塊卡訓練了2周。DeepSeek這是要把AI界的平權和創新之路走到底了。
這場轟轟烈烈的AI開源平權運動已經席捲了世界,妥妥的出圈讓DeepSeek的app沖上美區榜首。但開放原始碼的意義是什麼,顯然,並不是給DeepSeek和幻方帶來直接收益。
但比錢更重要的是,打破對中國的技術封鎖。這個封鎖最直白的理解如前所說,國人可以自由使用最頂級的AI技術,再也不用偷偷摸摸翻牆去用OpenAI和Claude的API - 這個意義已然極大。
但更重要的封鎖打破, 城主認為是反向的:讓國產技術和世界重新融為一體。在美國宣傳機器的污衊和阻撓下,城主可以看到被洗腦的西方民眾對來中國的技術保持著某種“警惕性”,但DeepSeek以絕對的性能和性價比摧古拉朽的打破了這一切:所有美國頂級大學從MIT到斯坦福的學術研究機構都第一時間把自己用的Llama換成了R1,估計目前沒有人自討無趣的提“使用來自中國的AI大模型是對美的安全威脅”了。
在絕對的實力面前,很多大佬也自覺不自覺的改變了觀點。這幾天傳播最廣的大佬言論莫過於馬克·安德森發推盛讚DeepSeek R1是他多年來印象最深刻的突破,以及作為開源,是給這個世界的巨大餽贈禮物。這個推文在國內以及美國主串流媒體都被廣為報導。
但沒有人提的是, 馬克·安德森對中國科技行業的過往評論很難說友好,只能說他對中國抱有一種全力提防的態度。如果瞭解他過往的公開訪談,我們可以知道,馬克·安德森反對去投資中國科技行業,並以自己從不投資中國而自居,在意識形態裡把中國當做一個最大的對手。
但就這麼一位保守的科技大佬,面對著DeepSeek R1的開源,都不得不發出由衷的讚歎。更不用說各大科技博主在油管的自來水宣傳, 以及美國人民真金白銀的用下載量把DeepSeek app推上蘋果美榜第一寶座。
當美國人民享受著來自東方神秘力量的餽贈,收費200刀的昂貴app訂閱變成了自由免費的產品,囊中羞澀的大學機構得以用極低的費用獲得最頂級的AI的研究支援。我們可以想像,下一次還有人說要封堵中國科技要禁止中國發展要打斷中美學術交流的時候,這些人會怎麼想?
這種潛移默化的宣傳效果,這種對中國封堵的反擊,對人心隔閡的打破,才是真正的“王道”。而這才是城主所理解的,DeepSeek創始人的“格局” -- 我們只需要把事情做到頂級,自然能打破一切桎梏。
前面說過,和開源還有一個相關論調,“DeepSeek把方法公開了,老美把技術複製了,繼續封鎖中國,還是中必輸。”
本來這種沒營養的言論不想再提,但考慮到這種言論還是有其欺騙性,可以簡單討論一下:
DeepSeek確實沒法保證在開放原始碼的路上永遠保持第一,但作為給世界帶來火種的先行者,城主相信只要這個團隊堅持當前成功的工作和研究文化,那麼DeepSeek在AI開源社區的進步飛輪和影響力不會在落後於任何一家頂級組織。而在DeepSeek這一次無私的技術平權公開之後,AI技術這個本來作為全世界共享的先進科學技術,不會再落入被私有大公司控制的局面。而且, 更重要的, 這個持續的AI開源進展將讓中國重回世界科研的舞台中心, 任何說要拒絕來自中國的科學技術交流的言語,從今天起都成為了一個笑話。
--
而對於國人, 還有個比打破西方人心隔閡更重要的意義,那就是DeepSeek的團隊,到目前為止的所有公開資訊, 都在說明這是一個純血本土的團隊,主要成員都是來自國內頂級高校的年輕人 (根據城主瞭解,幻方肯定還是有一些具有海外工作背景的同學,但這不矛盾)這個事實將極大的影響和樹立國人對本土教育的自信。此前很多前往美國的朋友,都是為了讓孩子能夠在美國接受最好的教育。城主也一直認為高等教育是美國的一面旗幟。而這兩年由於眾所周知的原因國內能申請過去美國留學的同學被大幅減少了,做出這些政策的美國zf當然認為不讓中國人接受自己的精英教育理所當然可以阻攔中國發展。
但DeepSeek團隊的情況把這種比較流行的認知悄悄的撕開了一個口子。中國大學本科和研究生教育或許還有不盡人意的地方,但重要的是,依靠本土教育培養出的頂級年輕人才,純血本土團隊是可以做出超一流的成績的。這個事實可以開始改變很多成見,包括一些琢磨著是否要送兒女到美國讀書的父母的想法。
當然,走遍世界開拓視野是很有必要的,但是否意味著必須在某個美國高校學習才能有所成就呢?DeepSeek團隊給了我們一個很好的例子。
DeepSeek 引發的大地震還在持續,其影響之深遠,在美國主串流媒體都口中,都是以“近十年來”的口吻來評論的。DeepSeek事件的出現有其戲劇性,也有必然性。無論在美國還是中國, DeepSeek黑天鵝都在多個角度刷新人們的認知。除非DeepSeek直接躺平,否則這個團隊及其AI成果的影響,還會以一種有趣的方式,持續下去。 (Web3天空之城)