#閉源模型 | 熱門關鍵字 | 鉅亨號

2025年初，DeepSeek用R1製造了一個"時刻"。那次發佈的震感，從矽谷傳到華爾街，輝達單日蒸發6000億美元，黃仁勳的財富縮水速度比他簽名的皮夾克還快。全世界的科技媒體集體失語了三天，然後用同一個詞描述他們看到的東西：震撼。一年多後，DeepSeek再次發佈新旗艦，這一次叫V4。但這一次，沒有人蒸發，沒有人失語，中芯國際漲了12%，華虹漲了19%，智譜跌了10%——市場的反應精準、克制、充滿職業感。就像一個早就預判了你出牌的對手，平靜地收走了籌碼。這說明一件事：DeepSeek已經不再是一個"意外"，它開始成為一種"預期"。而預期，是比震撼更危險的東西。01被捲出來的，還是算計好的？過去三個月，AI行業的發佈節奏堪稱失控。Claude更新、GPT更新、元寶更新、千問更新，連一向低調的Gemini都開始在發佈會上學會了鼓掌熱場。大模型賽道進入了一種奇異的狀態——每個人都在發佈，每個人都在說自己最強，每個人都在說對手落後自己三到六個月。有趣的是，DeepSeek自己也說V4落後閉源模型三到六個月。外界的第一反應，是覺得這家公司"被捲到了"——在各家轟炸之下，沉默太久，不得不出手。但這個判斷，大機率是錯的。一個真正被競爭對手逼著發佈的公司，不會在發佈聲明裡寫"歡迎來到百萬token上下文的時代"，那句話的語氣更像是在宣佈自己打開了一扇門，而不是匆忙翻過了一堵牆。更重要的是，DeepSeek給出的最核心訊號，不是性能數字，而是成本路線圖：等到今年下半年華為昇騰950系列晶片驅動的算力叢集上線，V4的價格將大幅下降。這是一家已經想好了下半場棋局的公司說的話，不是一家被打懵了趕緊應戰的公司。02技術的壁壘，越來越像沙堡理解V4，必須先理解DeepSeek的基本哲學：不爭第一，爭最划算。V4 Pro的參數規模達到1.6兆，但每次推理實際啟動的只有490億。這種混合專家架構（MoE）的本質，是用"按需呼叫"取代"全員上崗"——就像一家諮詢公司，項目來了再叫人，不養閒置顧問。結果是推理成本被大幅壓縮，性能卻不打折扣。與此同時，V4還把上下文窗口擴展到了100萬token。這個數字的實際意義是：你可以把一整個程式碼庫，或者一本幾十萬字的長篇報告，塞進一次對話裡。以前需要分段喂給AI，反覆確認上下文的工作，現在一次解決。這是一個很務實的技術選擇。但問題在於，這些技術優勢，正在變得越來越難以構成護城河。百萬token上下文，Gemini 1.5 Pro早就做到了。MoE架構，幾乎所有一線實驗室都在用。程式碼基準測試第一，上個月是這家，下個月可能是另一家。技術領先的半衰期，正在以季度為單位快速縮短。Union Bancaire Privee的分析師說了一句讓人不舒服但誠實的話：模型性能的差距，對大多數使用者而言將微乎其微。他的意思是，當所有模型都足夠好，"最好"這個詞就失去了意義。接下來的競爭，是價格、是生態、是信任、是誰能把AI塞進人們每天必須用的東西里。DeepSeek當然明白這一點。這也是為什麼他們要談晶片、談成本、談下半年的降價計畫——真正的護城河，不在於跑分領先，而在於成為最便宜的智能基礎設施。03開源是武器，不是善意DeepSeek選擇開源V4，很多人把這解讀成技術普惠或者理想主義。這個解讀是對的，但不完整。開放原始碼的另一面，是一種極其有效的競爭武器。當你把模型權重公開，全球數十萬開發者都可以在你的基礎上建構應用。你不需要花錢推廣，社區會替你傳播；你不需要建立銷售團隊，使用者會自己找上門來。開源是最低成本的使用者獲取策略，同時也是讓競爭對手無法用"護城河"防禦的降維攻擊。OpenAI花了多少錢在品牌行銷上？DeepSeek通過一次開源，把這筆錢省掉了。更深一層的邏輯在於：DeepSeek正在爭奪的，不只是模型市場的份額，而是全球AI應用的底層標準。誰的模型成為開發者默認呼叫的基礎，誰就在未來的應用層擁有了最大的話語權。這是一場關於"默認選項"的戰爭，而不是一場關於"最強模型"的戰爭。四、騰訊和阿里排隊入股，意味著什麼？DeepSeek迄今沒有外部融資。一家沒有拿過任何VC錢的公司，在一年多里連續改變了全球AI的競爭格局，讓輝達的股價坐過山車，讓OpenAI和Google的戰略規劃部門反覆修訂文件。現在，騰訊和阿里據悉正在爭相參與DeepSeek的首輪融資。這個細節，值得仔細咀嚼。騰訊和阿里本身都有大模型，都在砸錢做AI。它們選擇投DeepSeek，不是因為看不上自己的產品，而是因為它們認為DeepSeek代表的那套"極致效率+開源擴散"的打法，將成為未來AI基礎設施的主流範式。投資DeepSeek，某種程度上是在避險一個風險：如果DeepSeek的路線最終贏了，至少我們是股東。但錢進來之後，有一個問題沒有人能確定：DeepSeek還能保持現在的節奏和風格嗎？歷史上，很少有公司能在拿到大錢之後，還能維持原來那種不依賴外部壓力、完全靠內生節奏驅動創新的狀態。這不是質疑，這是一個關於組織基因的真實問題。04尾聲：真正的問題，不是V4夠不夠好如果把V4單獨拿出來打分，答案是：夠好，但不驚豔。它在編碼基準上表現出色，它的成本效率仍然領先，它的開源策略仍然是這個行業裡最聰明的選擇之一。但"夠好"，已經是這個行業最沒有意義的評價了。真正值得追問的問題，只有一個：在一個所有人都夠好的世界裡，DeepSeek究竟在競爭什麼？答案藏在他們自己的技術選擇裡：一個1.6兆參數的模型，推理時只啟動490億；一個頂級性能的平台，等華為昇騰上線之後準備大幅降價。他們在競爭的，是成為那個讓AI真正便宜到沒有人需要考慮成本的公司。如果有一天，呼叫一個頂級AI模型的成本，跟發一條簡訊一樣低，那個世界裡的基礎設施提供商，很可能就是DeepSeek。這才是他們真正的長期賭注。至於V4夠不夠好，那是今天的問題。DeepSeek想贏的，是明天。 (鳳凰網財經)

科技

2025/07/18

•

李開復：中美大模型競爭關鍵在於開源與閉源之爭

近日，2025格隆匯·中期策略峰會在深圳南山香格里拉酒店舉行。零一萬物CEO、創新工場董事長李開復博士帶來了《生成式AI：從ChatBot到Agent 的躍進與機會》的主題演講。李開復在演講中指出，未來5到10年最重要的技術領域就是生成式AI驅動的AI 2.0，如不能及時接納AI未來會被淘汰。相比於PC時代、移動網際網路時代，AI 2.0時代全球GDP會迎來更大幅度的增長。中美之爭不是OpenAI和DeepSeek誰強，而是開源與閉源之爭。輝達依然是一個比較穩妥的投資標的，但需尋找合適的買入時機。美國科技巨頭股票“七選一”，可能會選擇微軟。01. 預訓練Scaling Law失效推理Scaling Law成為模型智能增長新範式生成式AI驅動的AI 2.0是有史以來最偉大的技術革命和平台革命，未來5到10年，AI 2.0將快速走出實驗室，賦能千行百業，創造巨大的經濟價值。過去兩年大模型賽道的一個重要趨勢是，大模型的智能在以每年30個點的速度快速提升，同時，AI的推理成本也在以每年降低10倍的速度快速下降，應用層發展的成本擔憂也在逐步解決。這些重要的變化為AI-First應用的爆發，穿透千行百業奠定了堅實的基礎。現階段，預訓練的Scaling Law基本已經結束了。其中一個原因在於，超大規模的GPU集群越來越不好管理。舉例來說，從一張GPU到10張GPU，可能會得到9.5倍算力提升；但是從1萬張GPU到10萬張GPU，算力可能只有2倍的提升。另一個原因則是可用於模型訓練的資料也存在瓶頸，缺乏高品質資料，GPU燒起來也是事倍功半的結果。新的機會在推理階段的Scaling Law。在推理階段Scaling Law的加持下，大模型的智力不但沒有停止成長，而且還會成長得更快。DeepSeek令人佩服的其中一點就在於，它破解並開源了慢思考推理模型，並且得到了媲美頂級閉源模型的優秀性能。02. 中國在開源模型路徑上開始趕超美國李開復在策略會中指出，美國的前沿技術研究是領先中國的，但是中國吸收消化技術快速迭代的能力很強，中國工程能力也處於世界第一梯隊，更可貴的是，中國的創業者很有拚勁，目前看，世界大模型競賽中只有中美兩國，沒有第三方。美國還有一個新的優勢，就是無論是企業（2B）還是消費者（2C），其付費能力都很強，這個中國還趕不上。然而，中國也有新的優勢，就是開源。中美之間的競爭關鍵並不是OpenAI與DeepSeek孰強孰弱，也不是Deepseek追不追得上OpenAI，而是開源與閉源的路線之爭。中國兩大模型都選擇了開源路線，而美國最好的模型仍在閉源。如果按照這種趨勢，美國可能會輸。開源是中國團隊做出的正確決定。阿里巴巴Qwen和DeepSeek的頂級開源模型讓中國優秀大模型能進一步普惠全球，未來一定會在全球大模型創新生態中帶來巨大的紅利。03. 輝達仍是一個比較穩妥的投資標的關於投資標的，李開復表示依然看好輝達。無論是模型預訓練領域、無人駕駛等等，這些領域都離不開輝達的晶片和技術支援，所以輝達的價值還是很大的。未來一段時間，輝達股價也許不會漲幾十倍，但仍有上升空間，是一個比較穩妥的投資。但是，輝達在未來可能會面臨各種利多和利空因素，例如，最新晶片是否能進入中國市場的潛在風險等，這可能會對公司的股價產生相當大的影響。投資者要綜合考慮，理性投資。在美國七巨頭中，李開復坦言自己更看好微軟。因為微軟敢於大膽投資和創新，有發展前景，同時對商業模式有著深刻的理解，能夠清楚地認識到如何實現盈利，這種兼具多種優勢的公司很少。微軟對於大模型的盈利模式就有著清晰的認知。但是微軟的體量很大，未來實現幾十或上百倍的增長可能性較低。儘管如此，如果美國七巨頭裡面只選一家投資，李開復可能會選擇微軟。（格隆匯APP）

科技

2025/07/15

•

Meta將推出閉源模型，並砸數千億美元打造超算叢集

Meta正在醞釀一場驚天大轉向。祖克柏剛剛宣佈要砸數千億美元建造超級計算叢集，但更勁爆的消息還在後面——這家一直高舉開源大旗的公司，正在考慮徹底拋棄開源路線。據知情人士透露，Meta新成立的超級智能實驗室（Meta Superintelligence Labs）上周進行了一場關鍵討論：是否要將公司最強大的AI模型Behemoth從開源轉為閉源。參與討論的包括28歲的首席AI官Alexandr Wang.沒錯，就是那個剛被Meta以143億美元收購了49%股份的Scale AI創始人。開源信仰動搖了要知道，開源可是Meta在AI領域的核心標籤。Meta的AI大佬Yann LeCun曾經信誓旦旦地說：「贏得平台之戰的，將是開放原始碼的那個。」就在今年，中國的DeepSeek 憑藉開放原始碼推出了先進的AI聊天機器人。但現在，情況變了。知情人士稱，Meta已經完成了Behemoth模型的訓練，但因為內部表現不佳而推遲了發佈。更糟糕的是，自從上個月宣佈成立超級智能實驗室後，負責Behemoth模型的團隊已經停止了新的測試。Bindu Reddy(@bindureddy) 評論道：新晉超級富豪團隊正在考慮讓Meta放棄開源 🥲他們本來就不在地圖上，放棄開源會讓他們失去僅有的粉絲 🤷‍♀️太令人失望了燒錢機器全面啟動與此同時，祖克柏正在瘋狂燒錢。他剛剛宣佈，Meta將建造多個吉瓦級（GW）資料中心，第一個名為「Prometheus」的超級計算叢集將在2026年上線。緊隨其後的是「Hyperion」，這個更猛的傢伙最終將擴展到5GW的規模。祖克柏在Facebook上寫道：「我們還在建造多個Titan叢集。僅其中一個就覆蓋了曼哈頓相當大一部分面積。」這是什麼概念？目前大多數資料中心只有幾百兆瓦的容量。1GW相當於一座中型核電站的發電量，可以容納數萬個最先進的GPU。SemiAnalysis報告稱，Meta有望成為第一個上線1GW+超級叢集的實驗室。💪內部大洗牌為了這個宏偉計畫，Meta正在進行徹底的重組。公司已經將整個AI部門更名為「Meta Superintelligence Labs」，由Alexandr Wang擔任首席AI官。在這個部門內，Wang領導著一個由大約十幾名新聘研究人員組成的精英團隊，其中包括他從Scale AI帶來的幾名副手，以及GitHub前CEO Nat Friedman。這個團隊的辦公空間與公司其他部門隔離，就在祖克柏旁邊。值得注意的是，Wang在與Meta約2000名AI員工的問答會上表示，他的小團隊工作將是保密的，但整個AI部門現在都將致力於創造超級智能。他沒有回答AI模型是否會開源或閉源的問題。千億美元豪賭Meta 2025年的資本支出已經達到640-720億美元，而且還在上升。祖克柏認為，廣告業務產生的現金流足以支撐這場豪賭。通過挖角頂尖人才，加上龐大的計算能力，Meta希望能在與OpenAI和Google的競爭中取得領先。如果Prometheus按計畫推出，Meta的網路延遲將下降，訓練周期將縮短，新的收入來源：Meta AI聊天、自動生成的視訊廣告、更智能的眼鏡，將更快到來。但投資者仍在疑惑：這數千億美元何時能回本？特別是在電價和晶片供應都不穩定的情況下。新的計算瓶頸Meta 的吉瓦級叢集建設也標誌著一個新的轉變：計算現在受限於電網線路，而不是矽片。設計如此大規模的電力和液冷系統意味著需要定製電網連接、現場變電站和新的廢熱回收技術，而不僅僅是機架和電纜。Trace Cohen(@Trace_Cohen)：萬歲之王：祖克柏的160億美元AI權力遊戲創始人控制權 + Meta的現金引擎 = 競爭對手無法匹敵的膽識當AI計算從「增加伺服器」轉變為「建造小型發電廠」時，遊戲規則已經徹底改變了。當DeepSeek用Meta的開源模型震驚世界時，祖克柏或許意識到了一個殘酷的真相：開放原始碼的榮耀，可能成為別人的嫁衣。從開源到閉源，從理想主義到現實主義，這不僅是技術路線的轉變，更是一家公司在AI軍備競賽中的生存選擇。當計算能力需要以「曼哈頓面積」來衡量，當投入需要以「千億美元」來計算，當競爭對手都在建造自己的「死星」時，Meta還能堅持多久的開源情懷？或許，這就是AI時代的宿命：要麼成為規則的制定者，要麼成為歷史的註腳。而Meta，顯然不想成為後者。 (AGI Hunt)

美股

2024/07/05

•

李彥宏：沒有應用，AI模型一文不值

李彥宏在WAIC 2024上呼籲，不要卷模型，要去捲應用，超級能幹的應用比只看DAU的超級應用更重要，最簡單的就是智能體。 7月4日周四，2024年世界人工智慧大會（WAIC 2024）在上海正式開幕。本屆大會以“以共商促共享，以善治促善智”為主題，將聚焦全球人工智慧領域的前沿技術和創新應用，致力於展示人工智慧如何改變世界、塑造未來。下午13:30開始的產業發展主論壇上，百度創始人、董事長兼CEO李彥宏出席發表主題演講。本文整理出核心觀點如下： 1、同樣參數規模之下，閉源模型的能力比開源模型要更好。當你處在一個激烈競爭的市場環境當中的時候，你需要使讓自己的業務的效率比你的同行更高、成本比你的同行更低，這個時候，商業化的閉源模型是最能打的。

科技