【DeepSeek】服務崩潰,DeepSeek該給金主一個貼金的機會

DeepSeek依然未能從服務崩潰中徹底走出來。



2月1日,就在OpenAI上新o3-mini推理模型同時,DeepSeek深度思考和聯網搜尋功能被爆暫時停止服務。一天之後,經字母榜(ID:wujicaijing)實測,目前DeepSeek深度思考服務已恢復正常,但聯網搜尋仍提示“由於技術原因,暫不可用”。



顯然,借助春節期間產品更新而意外爆火的DeepSeek,已經越來越難以招架蜂擁而來的新增使用者了。

Sensor Tower資料統計顯示,DeepSeek移動應用上線僅18天便斬獲1600萬次下載,幾乎是ChatGPT同期資料的兩倍,目前更是在全球140個市場成為下載量最高的移動應用。

為了擴充算力基礎設施,以滿足更多使用者的訪問需求,“DeepSeek是時候找金主了。”某頭部美元基金投資人陳明(化名)告訴字母榜,DeepSeek是罕見的尚未首輪融資,還以更低成本追平OpenAI的大模型企業,“包括美元基金,國內的投資方,如今都瘋狂地尋找DeepSeek的聯絡方式。”陳明表示。

在陳明看來,投資人需要DeepSeek這個好故事,DeepSeek也不能只靠幻方量化的“零花錢”了。

就在DeepSeek爆火的檔口,作為被追趕對象的OpenAI,還在燒錢的路上繼續狂奔。繼打造高達5000億美元的星際之門計畫後,近期,孫正義被爆再次加碼。據《金融時報》報導,日本軟銀集團正在洽談向OpenAI投資至多250億美元(約合人民幣1813億元),這筆交易將使軟銀成為OpenAI最大金主。

對於立志想實現AGI(通用人工智慧)的梁文鋒而說,在進一步追趕OpenAI的路上,繼續靠幻方量化一家的力量,無疑將變得捉襟見肘。

如何找到屬於DeepSeek的微軟和軟銀,或將是梁文鋒在產品爆火之後,需要給DeepSeek敲定的下一階段新敘事。

梁文鋒也並非真的"不缺錢"。此前在36氪的採訪中,梁文鋒曾提及找過不同的投資方,但由於不少VC(風險投資)對研究有顧慮,有退出需求,希望盡快做出產品商業化,因此專注研究的DeepSeek很難從VC獲得融資。

"DeepSeek 目前的卡點,一個是訓練需要的資料,一個是卡(GPU),卡的背後是電力等等,儘管DeepSeek的性價比路線仍可持續,但仍然需要合作者。"某頭部網際網路大廠資深AI產品經理Bruce告訴字母榜。

如同OpenAI+微軟的合作,對於DeepSeek來說,找個能在算力、資料上補足自身短板的合作者,DeepSeek便能更快地追趕上OpenAI的步伐。

畢竟,根據公開資料,華為海思最新昇騰910晶片,性能參數也只是輝達H100的1/4,更和最新的B200有20倍的性能差。“窮有窮的玩法,但算力越豐富肯定越好。"Bruce說道。

除了蜂擁而至的全球新增使用者對DeepSeek算力提出新需求之外,作為AGI必備前提的多模態之戰,更需要DeepSeek提前儲備好充足的算力資源。這也是奧特曼要斥資5000億美元大搞算力基建的核心所在。

對現在只支援問答、讀圖、讀文件的DeepSeek來說,未來隨著大模型能力擴展到圖片生成、音訊生成和視訊生成領域,其對算力和資金的需求都將呈指數級飆升。

趁著產品爆火的這股東風還在,想要填補資金缺口的DeepSeek,不妨儘早為自己選一選字母。

無論是老 BAT(百度,阿里,騰訊),還是字節這樣的新貴,那個“字母”,會是DeepSeek的“微軟”呢?

"現在對DeepSeek來說,是融資最好的時候。"陳明告訴字母榜,他所在的創投圈子,過年轉發朋友圈,10條有9條跟DeepSeek相關。獵頭開出5-6倍的薪資求挖DeepSeek的員工已經是常規操作,如今的DeepSeek儼然是AI圈當紅炸子雞,再不存在前兩年難從VC拿錢的問題。

從DeepSeek暴打矽谷,再到矽谷科技巨頭"打不過就加入",在陳明看來,聲名鵲起的DeepSeek已經有了自己的故事可講。

在國外,DeepSeek拿到了越來越多的客戶。

受DeepSeek影響一夜市值蒸發近6000億美元的輝達,已經在NVIDIA NIM正式搭載完整版DeepSeek-R1。同一天,亞馬遜跟進。頭部AI應用們,包括Perplexity,Cursor和Windsurf,也都在批次接入DeepSeek。

甚至,和OpenAI繫結,質疑DeepSeek“偷竊”資料的微軟,搶在亞馬遜、輝達前面,率先把DeepSeek-R1部署在了雲服務Azure上。

微軟AI平台副總裁Asha Sharma在官網發文表示,DeepSeek-R1經過了嚴格的紅隊測試和安全評估,包括模型行為的自動評估和廣泛的安全審查,以降低潛在風險。

在國內,登頂iOS應用榜第一併不足以概括DeepSeek熱到發燙的現狀。

回到農村老家過年的陳明,發現往年他提起AI投資一臉迷茫的親戚,“已經開始和我聊DeepSeek了。”村頭沒讀過小學的大媽,最近的抖音視訊是為DeepSeek打call。

儘管熱度空前,但需要注意的是,大模型企業的融資窗口期極短。這方面,月之暗面楊植麟深有體會。在騰訊科技的採訪中,楊植麟提到在2023年2月,月之暗面集中做了首輪融資,"如果delay到4月,基本沒機會了。"為了搶佔大模型的創業窗口期,楊植麟甚至顧不得徹底解決與循環智能老股東的糾紛,畢竟"真正的窗口期就是1個月。"楊植麟說道。

對於梁文鋒而言,抓住這波出圈機會盡快融資無疑是上選,畢竟國內外的競爭對手,已經等不及了。

OpenAI已經率先用o3-mini打響了反擊DeepSeek的第一槍。軟銀正在洽談的250億美元最高融資,則是OpenAI繼續保持自身優勢的另一砝碼。


圖註:奧特曼表示或會開源OpenAI 圖源:reddit平台


儘管性價比路線還可持續進行,但既要接住近期湧入的大批使用者,又要繼續追求AGI,梁文鋒顯然需要更多的錢,對齊OpenAI去拓展自己的算力基礎設施。

“梁文鋒缺的是資料,缺的是算力(卡)。”Bruce告訴字母榜,相比起如今大廠開發的大模型,DeepSeek出圈的正是低成本訓練,而DeepSeek放棄Scaling Law(縮放定律,指訓練大模型時,資料量、算力資源越多,訓練出的模型效果越好)的原因,正是因為需要用最少的卡進行策略最佳化。

"即便是字節,各個組也在搶卡。"Bruce表示,不管是更多的卡,還是更高品質的卡,本質上算力越豐富,訓練出的模型效果也會更好。

根據公開資料,以華為海思最新昇騰910晶片為例,性能參數與輝達A100相近,是H100的1/4,但如果和輝達最新的B200相比,存在大約20倍的性能差距。

可以說,對於背靠幻方量化的DeepSeek而言,眼下當務之急並非是找VC拿錢,單純獲得一筆財務融資,更重要的是找到能在資料和算力上補足DeepSeek短板的合作方,結成如同OpenAI+微軟的聯盟,尋找到自己的戰略投資夥伴。

放眼國內,能在資料和算力上幫到DeepSeek的,恐怕非BAT們莫屬。

在國內大模型行業發展兩年之後,BAT們正取代VC,成為大模型賽道最有力的人民幣玩家。

根據《金融時報》報導,2024年上半年,在AI相關領域,阿里支出高達230億元,同比增長123%。騰訊支出也增至230億元,同比增長176%,部分歸因於對GPU和CPU伺服器的積極投資。

除舊BAT外,浙商證券統計,2024年字節跳動在AI上的資本開支達到了800億元,接近百度、阿里、騰訊的總和(約1000億元)。

對梁文鋒而言,不論是算力資源還是資金支援,BAT們都在成為其最理想的合作夥伴。

那麼,梁文鋒會挑那一個字母進行合作呢?

"如果非要選一家,目前來看阿里可能性更高。"Bruce表示。

在DeepSeek之前出圈的AI六小龍(智譜、月之暗面、百川智能、零一萬物、MiniMax、階躍星辰)中,阿里幾乎投了個遍。

同時,在DeepSeek急需的算力資源方面,阿里也有阿里雲做支撐。

相比起來,同樣有火山引擎雲服務打底的字節,在大模型策略上更多選擇自己做,而非投資。據騰訊科技報導,2023年中,字節跳動一度下場尋覓大模型標的,但在跟Minimax達成SPA(股份認購協議)的最後一刻,選擇了放棄。

“如果字節和DeepSeek合作,內部團隊的臉上也掛不住啊。”Bruce補充道。

對最早宣佈入局AI的百度來說,也存在同樣“重複造輪子”的問題。

至於騰訊,Bruce並不看好,“騰訊去年年初才開始發力AI應用,對大模型的熱情似乎並不高。”

而實際上,不僅梁文鋒需要挑一個字母做助力,BAT們與DeepSeek這樣的大模型合作,也是各取所需。

對於騰訊而言,在這場大模型競逐賽裡,可以通過投資DeepSeek平衡自身的科技投資版圖。畢竟,手握視訊號、微信等重要場景,對大模型興致缺缺的騰訊,也需要注意到來自AI的衝擊。

不管是字節用豆包讓創作者用AI寫直播指令碼、輸出公眾號,還是快手可靈強勢切入影片創作者市場。甚至DeepSeek爆火後,社交平台上“用DeepSeek毒舌吐槽”爆火,長於推理和思考的DeepSeek憑藉頗具“人味”的推理流程和輸出,迅速成了最熱的社交meme。

但騰訊在大模型研發上落後一步,至今尚未有出圈的AI產品。一旦和DeepSeek合作,對騰訊來說,智能創作的場景下無疑有了一張能打的新王牌。

百度和字節,儘管已經各自選擇了自研大模型路線,並有了文小言、豆包等明星產品,但通過投資DeepSeek,無疑可以借助後者的超高人氣,為自家雲服務繫結一個超級大客戶。

被Bruce認為合作可能性最高的阿里,對DeepSeek的需求強度同樣也最高。

在將大模型戰略重心轉向To B後,阿里一度降低了對To C產品的重視力度。這也導致在過去一年,阿里大模型熱度並不高。表現在產品側,落後通義千問近半年上線的豆包,已經憑藉近億月活成為國內大模型應用榜一,同期通義千問APP的月活尚不足前者的1/10。

如果通過投資繫結DeepSeek這個當紅炸子雞,阿里便隨即擁有了一款在聲量和使用者量上能匹敵其他大廠的防禦武器。

同時,阿里雲的先發優勢也在AI時代被競爭對手步步逼近。IDC資料顯示,2024年上半年的GenAI IaaS市場,阿里雲市場份額躍居市場第一,但第二名火山引擎緊隨其後。豆包等一系列產品的使用者增長,助推字節火山引擎雲服務規模快速擴展。

相比百度和字節,通過投資繫結DeepSeek這樣一個雲服務耗資大戶,對阿里雲的意義可能更大。

誰能接住DeepSeek這波潑天流量,就要看梁文鋒的最終選擇了。 (36氪)