#閉源模型
這次DeepSeek沒炸市場,因為它在等一個更大的爆點
2025年初,DeepSeek用R1製造了一個"時刻"。那次發佈的震感,從矽谷傳到華爾街,輝達單日蒸發6000億美元,黃仁勳的財富縮水速度比他簽名的皮夾克還快。全世界的科技媒體集體失語了三天,然後用同一個詞描述他們看到的東西:震撼。一年多後,DeepSeek再次發佈新旗艦,這一次叫V4。但這一次,沒有人蒸發,沒有人失語,中芯國際漲了12%,華虹漲了19%,智譜跌了10%——市場的反應精準、克制、充滿職業感。就像一個早就預判了你出牌的對手,平靜地收走了籌碼。這說明一件事:DeepSeek已經不再是一個"意外",它開始成為一種"預期"。而預期,是比震撼更危險的東西。01被捲出來的,還是算計好的?過去三個月,AI行業的發佈節奏堪稱失控。Claude更新、GPT更新、元寶更新、千問更新,連一向低調的Gemini都開始在發佈會上學會了鼓掌熱場。大模型賽道進入了一種奇異的狀態——每個人都在發佈,每個人都在說自己最強,每個人都在說對手落後自己三到六個月。有趣的是,DeepSeek自己也說V4落後閉源模型三到六個月。外界的第一反應,是覺得這家公司"被捲到了"——在各家轟炸之下,沉默太久,不得不出手。但這個判斷,大機率是錯的。一個真正被競爭對手逼著發佈的公司,不會在發佈聲明裡寫"歡迎來到百萬token上下文的時代",那句話的語氣更像是在宣佈自己打開了一扇門,而不是匆忙翻過了一堵牆。更重要的是,DeepSeek給出的最核心訊號,不是性能數字,而是成本路線圖:等到今年下半年華為昇騰950系列晶片驅動的算力叢集上線,V4的價格將大幅下降。這是一家已經想好了下半場棋局的公司說的話,不是一家被打懵了趕緊應戰的公司。02技術的壁壘,越來越像沙堡理解V4,必須先理解DeepSeek的基本哲學:不爭第一,爭最划算。V4 Pro的參數規模達到1.6兆,但每次推理實際啟動的只有490億。這種混合專家架構(MoE)的本質,是用"按需呼叫"取代"全員上崗"——就像一家諮詢公司,項目來了再叫人,不養閒置顧問。結果是推理成本被大幅壓縮,性能卻不打折扣。與此同時,V4還把上下文窗口擴展到了100萬token。這個數字的實際意義是:你可以把一整個程式碼庫,或者一本幾十萬字的長篇報告,塞進一次對話裡。以前需要分段喂給AI,反覆確認上下文的工作,現在一次解決。這是一個很務實的技術選擇。但問題在於,這些技術優勢,正在變得越來越難以構成護城河。百萬token上下文,Gemini 1.5 Pro早就做到了。MoE架構,幾乎所有一線實驗室都在用。程式碼基準測試第一,上個月是這家,下個月可能是另一家。技術領先的半衰期,正在以季度為單位快速縮短。Union Bancaire Privee的分析師說了一句讓人不舒服但誠實的話:模型性能的差距,對大多數使用者而言將微乎其微。他的意思是,當所有模型都足夠好,"最好"這個詞就失去了意義。接下來的競爭,是價格、是生態、是信任、是誰能把AI塞進人們每天必須用的東西里。DeepSeek當然明白這一點。這也是為什麼他們要談晶片、談成本、談下半年的降價計畫——真正的護城河,不在於跑分領先,而在於成為最便宜的智能基礎設施。03開源是武器,不是善意DeepSeek選擇開源V4,很多人把這解讀成技術普惠或者理想主義。這個解讀是對的,但不完整。開放原始碼的另一面,是一種極其有效的競爭武器。當你把模型權重公開,全球數十萬開發者都可以在你的基礎上建構應用。你不需要花錢推廣,社區會替你傳播;你不需要建立銷售團隊,使用者會自己找上門來。開源是最低成本的使用者獲取策略,同時也是讓競爭對手無法用"護城河"防禦的降維攻擊。OpenAI花了多少錢在品牌行銷上?DeepSeek通過一次開源,把這筆錢省掉了。更深一層的邏輯在於:DeepSeek正在爭奪的,不只是模型市場的份額,而是全球AI應用的底層標準。誰的模型成為開發者默認呼叫的基礎,誰就在未來的應用層擁有了最大的話語權。這是一場關於"默認選項"的戰爭,而不是一場關於"最強模型"的戰爭。四、騰訊和阿里排隊入股,意味著什麼?DeepSeek迄今沒有外部融資。一家沒有拿過任何VC錢的公司,在一年多里連續改變了全球AI的競爭格局,讓輝達的股價坐過山車,讓OpenAI和Google的戰略規劃部門反覆修訂文件。現在,騰訊和阿里據悉正在爭相參與DeepSeek的首輪融資。這個細節,值得仔細咀嚼。騰訊和阿里本身都有大模型,都在砸錢做AI。它們選擇投DeepSeek,不是因為看不上自己的產品,而是因為它們認為DeepSeek代表的那套"極致效率+開源擴散"的打法,將成為未來AI基礎設施的主流範式。投資DeepSeek,某種程度上是在避險一個風險:如果DeepSeek的路線最終贏了,至少我們是股東。但錢進來之後,有一個問題沒有人能確定:DeepSeek還能保持現在的節奏和風格嗎?歷史上,很少有公司能在拿到大錢之後,還能維持原來那種不依賴外部壓力、完全靠內生節奏驅動創新的狀態。這不是質疑,這是一個關於組織基因的真實問題。04尾聲:真正的問題,不是V4夠不夠好如果把V4單獨拿出來打分,答案是:夠好,但不驚豔。它在編碼基準上表現出色,它的成本效率仍然領先,它的開源策略仍然是這個行業裡最聰明的選擇之一。但"夠好",已經是這個行業最沒有意義的評價了。真正值得追問的問題,只有一個:在一個所有人都夠好的世界裡,DeepSeek究竟在競爭什麼?答案藏在他們自己的技術選擇裡:一個1.6兆參數的模型,推理時只啟動490億;一個頂級性能的平台,等華為昇騰上線之後準備大幅降價。他們在競爭的,是成為那個讓AI真正便宜到沒有人需要考慮成本的公司。如果有一天,呼叫一個頂級AI模型的成本,跟發一條簡訊一樣低,那個世界裡的基礎設施提供商,很可能就是DeepSeek。這才是他們真正的長期賭注。至於V4夠不夠好,那是今天的問題。DeepSeek想贏的,是明天。 (鳳凰網財經)
李開復:中美大模型競爭關鍵在於開源與閉源之爭
近日,2025格隆匯·中期策略峰會在深圳南山香格里拉酒店舉行。零一萬物CEO、創新工場董事長李開復博士帶來了《生成式AI:從ChatBot到Agent 的躍進與機會》的主題演講。李開復在演講中指出,未來5到10年最重要的技術領域就是生成式AI驅動的AI 2.0,如不能及時接納AI未來會被淘汰。相比於PC時代、移動網際網路時代,AI 2.0時代全球GDP會迎來更大幅度的增長。中美之爭不是OpenAI和DeepSeek誰強,而是開源與閉源之爭。輝達依然是一個比較穩妥的投資標的,但需尋找合適的買入時機。美國科技巨頭股票“七選一”,可能會選擇微軟。01. 預訓練Scaling Law失效推理Scaling Law成為模型智能增長新範式生成式AI驅動的AI 2.0是有史以來最偉大的技術革命和平台革命,未來5到10年,AI 2.0將快速走出實驗室,賦能千行百業,創造巨大的經濟價值。過去兩年大模型賽道的一個重要趨勢是,大模型的智能在以每年30個點的速度快速提升,同時,AI的推理成本也在以每年降低10倍的速度快速下降,應用層發展的成本擔憂也在逐步解決。這些重要的變化為AI-First應用的爆發,穿透千行百業奠定了堅實的基礎。現階段,預訓練的Scaling Law基本已經結束了。其中一個原因在於,超大規模的GPU集群越來越不好管理。舉例來說,從一張GPU到10張GPU,可能會得到9.5倍算力提升;但是從1萬張GPU到10萬張GPU,算力可能只有2倍的提升。另一個原因則是可用於模型訓練的資料也存在瓶頸,缺乏高品質資料,GPU燒起來也是事倍功半的結果。新的機會在推理階段的Scaling Law。在推理階段Scaling Law的加持下,大模型的智力不但沒有停止成長,而且還會成長得更快。DeepSeek令人佩服的其中一點就在於,它破解並開源了慢思考推理模型,並且得到了媲美頂級閉源模型的優秀性能。02. 中國在開源模型路徑上開始趕超美國李開復在策略會中指出,美國的前沿技術研究是領先中國的,但是中國吸收消化技術快速迭代的能力很強,中國工程能力也處於世界第一梯隊,更可貴的是,中國的創業者很有拚勁,目前看,世界大模型競賽中只有中美兩國,沒有第三方。美國還有一個新的優勢,就是無論是企業(2B)還是消費者(2C),其付費能力都很強,這個中國還趕不上。然而,中國也有新的優勢,就是開源。中美之間的競爭關鍵並不是OpenAI與DeepSeek孰強孰弱,也不是Deepseek追不追得上OpenAI,而是開源與閉源的路線之爭。中國兩大模型都選擇了開源路線,而美國最好的模型仍在閉源。如果按照這種趨勢,美國可能會輸。開源是中國團隊做出的正確決定。阿里巴巴Qwen和DeepSeek的頂級開源模型讓中國優秀大模型能進一步普惠全球,未來一定會在全球大模型創新生態中帶來巨大的紅利。03. 輝達仍是一個比較穩妥的投資標的關於投資標的,李開復表示依然看好輝達。無論是模型預訓練領域、無人駕駛等等,這些領域都離不開輝達的晶片和技術支援,所以輝達的價值還是很大的。未來一段時間,輝達股價也許不會漲幾十倍,但仍有上升空間,是一個比較穩妥的投資。但是,輝達在未來可能會面臨各種利多和利空因素,例如,最新晶片是否能進入中國市場的潛在風險等,這可能會對公司的股價產生相當大的影響。投資者要綜合考慮,理性投資。在美國七巨頭中,李開復坦言自己更看好微軟。因為微軟敢於大膽投資和創新,有發展前景,同時對商業模式有著深刻的理解,能夠清楚地認識到如何實現盈利,這種兼具多種優勢的公司很少。微軟對於大模型的盈利模式就有著清晰的認知。但是微軟的體量很大,未來實現幾十或上百倍的增長可能性較低。儘管如此,如果美國七巨頭裡面只選一家投資,李開復可能會選擇微軟。(格隆匯APP)
Meta將推出閉源模型,並砸數千億美元打造超算叢集
Meta正在醞釀一場驚天大轉向。祖克柏剛剛宣佈要砸數千億美元建造超級計算叢集,但更勁爆的消息還在後面——這家一直高舉開源大旗的公司,正在考慮徹底拋棄開源路線。據知情人士透露,Meta新成立的超級智能實驗室(Meta Superintelligence Labs)上周進行了一場關鍵討論:是否要將公司最強大的AI模型Behemoth從開源轉為閉源。參與討論的包括28歲的首席AI官Alexandr Wang.沒錯,就是那個剛被Meta以143億美元收購了49%股份的Scale AI創始人。開源信仰動搖了要知道,開源可是Meta在AI領域的核心標籤。Meta的AI大佬Yann LeCun曾經信誓旦旦地說:「贏得平台之戰的,將是開放原始碼的那個。」就在今年,中國的DeepSeek 憑藉開放原始碼推出了先進的AI聊天機器人。但現在,情況變了。知情人士稱,Meta已經完成了Behemoth模型的訓練,但因為內部表現不佳而推遲了發佈。更糟糕的是,自從上個月宣佈成立超級智能實驗室後,負責Behemoth模型的團隊已經停止了新的測試。Bindu Reddy(@bindureddy) 評論道:新晉超級富豪團隊正在考慮讓Meta放棄開源 🥲他們本來就不在地圖上,放棄開源會讓他們失去僅有的粉絲 🤷‍♀️太令人失望了燒錢機器全面啟動與此同時,祖克柏正在瘋狂燒錢。他剛剛宣佈,Meta將建造多個吉瓦級(GW)資料中心,第一個名為「Prometheus」的超級計算叢集將在2026年上線。緊隨其後的是「Hyperion」,這個更猛的傢伙最終將擴展到5GW的規模。祖克柏在Facebook上寫道:「我們還在建造多個Titan叢集。僅其中一個就覆蓋了曼哈頓相當大一部分面積。」這是什麼概念?目前大多數資料中心只有幾百兆瓦的容量。1GW相當於一座中型核電站的發電量,可以容納數萬個最先進的GPU。SemiAnalysis報告稱,Meta有望成為第一個上線1GW+超級叢集的實驗室。💪內部大洗牌為了這個宏偉計畫,Meta正在進行徹底的重組。公司已經將整個AI部門更名為「Meta Superintelligence Labs」,由Alexandr Wang擔任首席AI官。在這個部門內,Wang領導著一個由大約十幾名新聘研究人員組成的精英團隊,其中包括他從Scale AI帶來的幾名副手,以及GitHub前CEO Nat Friedman。這個團隊的辦公空間與公司其他部門隔離,就在祖克柏旁邊。值得注意的是,Wang在與Meta約2000名AI員工的問答會上表示,他的小團隊工作將是保密的,但整個AI部門現在都將致力於創造超級智能。他沒有回答AI模型是否會開源或閉源的問題。千億美元豪賭Meta 2025年的資本支出已經達到640-720億美元,而且還在上升。祖克柏認為,廣告業務產生的現金流足以支撐這場豪賭。通過挖角頂尖人才,加上龐大的計算能力,Meta希望能在與OpenAI和Google的競爭中取得領先。如果Prometheus按計畫推出,Meta的網路延遲將下降,訓練周期將縮短,新的收入來源:Meta AI聊天、自動生成的視訊廣告、更智能的眼鏡,將更快到來。但投資者仍在疑惑:這數千億美元何時能回本?特別是在電價和晶片供應都不穩定的情況下。新的計算瓶頸Meta 的吉瓦級叢集建設也標誌著一個新的轉變:計算現在受限於電網線路,而不是矽片。設計如此大規模的電力和液冷系統意味著需要定製電網連接、現場變電站和新的廢熱回收技術,而不僅僅是機架和電纜。Trace Cohen(@Trace_Cohen):萬歲之王:祖克柏的160億美元AI權力遊戲創始人控制權 + Meta的現金引擎 = 競爭對手無法匹敵的膽識當AI計算從「增加伺服器」轉變為「建造小型發電廠」時,遊戲規則已經徹底改變了。當DeepSeek用Meta的開源模型震驚世界時,祖克柏或許意識到了一個殘酷的真相:開放原始碼的榮耀,可能成為別人的嫁衣。從開源到閉源,從理想主義到現實主義,這不僅是技術路線的轉變,更是一家公司在AI軍備競賽中的生存選擇。當計算能力需要以「曼哈頓面積」來衡量,當投入需要以「千億美元」來計算,當競爭對手都在建造自己的「死星」時,Meta還能堅持多久的開源情懷?或許,這就是AI時代的宿命:要麼成為規則的制定者,要麼成為歷史的註腳。而Meta,顯然不想成為後者。 (AGI Hunt)