#AI大模型 | 熱門關鍵字 | 鉅亨號 | Anue鉅亨

#AI大模型

OpenAI和輝達，終究還是到了這一步｜AGI焦點

AI頂流們正在加緊“梭哈”晶片。Meta、OpenAI和Anthropic等公司今年以來已簽下了數千億美元訂單。憑此賺得盆滿缽滿的，自然還是“賣鏟人”。在本周ASIC晶片龍頭博通公佈的財報中，一季度（2025年11月至2026年1月）AI半導體收入84億美元，同比大漲106%；Q2預期環比再漲27%達107億美元，同比將暴增143%。此前，輝達的業績更是炸裂，公司同期總營收已達681億美元，同比增長73%，新財季營收預期更是增至780億美元，預計同比增長77%。核心指標全都大幅刷新紀錄。這些公司的掌舵者也對未來一致樂觀。博通CEO陳福陽說，明年，公司光AI晶片營收就能超過1000億美元，比上個財年的公司總營收還高出至少五成。輝達CEO黃仁勳說，在截至2026年底的五個季度中，公司主力晶片Blackwell和下一代晶片Rubin的訂單至少有5000億美元，這個數字是輝達此前年收入的兩倍還多。表面上看，“狂飆突進”仍在加速，甚至每一次破紀錄都像是新的指數級增長曲線的起點。但在風光背後，從晶片到雲，從大模型到應用，一系列技術、產業與社會的變化正在發生，某種約束已若隱若現：Scaling Law（縮放定律）和通用GPU多年來的統治地位受到挑戰，雲廠商巨額Capex（資本開支）的驗證時間窗口縮小，“定製化”和“個性化”等分佈式需求愈發吃重，讓集中式的迅猛增長有落潮之虞。一邊狂賺千億，一邊“友誼破裂”作為AI大模型時代並駕齊驅的造浪者，今年以來，輝達與OpenAI之間的關係明顯鬆動。年初，媒體爆出輝達不滿OpenAI的商業策略，欲大幅削減投資。此後，又有消息稱，OpenAI對輝達最新晶片在推理環節的表現不滿，會繼續探索替代方案。傳言難以證實，但輝達在OpenAI新一輪融資中出資300億美元，相較此前的千億美元投資方案明顯縮水。在3月4日的摩根士丹利TMT會議上，黃仁勳親口表示，這次投資“可能是最後一次”，去年11月被他稱為“一代人僅有一次機會”的千億美元合作大機率會不了了之。為什麼會突然發生這樣的轉變？背後有些行業趨勢值得探討。首先是，Scaling Law和GPU性能提升飛輪，已有觸頂跡象。電腦科學家伊利亞·蘇茨維克（Ilya Sutskever）已表示，此前Scaling Law能夠主導大模型發展，是因為預訓練的道路走通了。誰的大模型喂得越飽，就顯得越聰明。但隨著大模型領域競爭白熱化，高品質、結構化的公開資料實際上已被吃盡。光有算力不足以支撐這條路走到頭。業界對Scaling Law的未來，有很多討論，比如轉向後訓練，轉向推理時擴展，或者改進Transformer核心架構。但拆解這些方法，其關鍵詞多與“提升效能”、“合理分配算力”和“特定領域針對性最佳化”相關聯，實際上，也意味著預訓練階段的性能躍遷不會再現。GPU面臨的境況是相似的。在Scaling Law時代，成熟度高、通用性和靈活性強、適合大規模平行運算的GPU，無疑是大模型的最佳搭檔。其性能在近十年間飛速進化，是大模型能力提升和規模化復刻的重要動力。所以，儘管輝達產品售價極高，毛利率常年在75%左右，還是屢屢供不應求。半導體行業知名研究機構SemiAnalysis分析稱，晶片領域先進製程的演進速度已明顯放緩，典型案例是台積電3nm帶來的性能增幅與成本增加已不成正比。全球計算聯盟GCC資料也顯示，摩爾定律放緩正導致AI晶片性能增幅下滑，2018-2022年間，AI晶片性能年均提升50%，到2023-2025年已降至20%以下（未計入尚未量產投入市場的新一代產品）。而就在2025年，追求特定場景下更極致的性能，功耗更低、體積更小、量產後成本更優的定製化AISC晶片強勢崛起。以GoogleTPU的市場良好反饋為標誌，其市佔比開始向GPU發起挑戰。而包括Meta、亞馬遜、微軟乃至OpenAI等都在加緊自研AISC晶片，2026年預計就將迎來量產和商業化的集中爆發期。資料來源：各公司官網、野村證券、公開報導；作者製表這條技術多元化路線的核心，又是“定製化”“高效能”“低延遲”和“性價比”，實際就是通用硬體效率狂飆的階段已經落幕。從這個視角再來看，OpenAI與輝達之間隱現的“友誼裂痕”，所謂不滿晶片推理表現，是因為GPU不再能通過“暴力破局”來“包打天下”。而所謂對商業策略有疑義，則是在大模型能力“無限增長”故事講不下去後，希望確證能有可觀商業回報維持其需求的穩定。是誰在給輝達們“潑冷水”？當然，性能增幅放緩絕不意味著需求會驟降，反而可能推動更加平穩、持續的增長。而在2025年“DeepSeek衝擊波”中，描述效率最佳化往往導致消耗總量增加的“傑文斯悖論”也屢被提及。不過，前提是盡快切換到更加“細水長流”的發展模式，而目前AI產業的慣性動能，卻與此存在一定錯位。最核心的，是拚命壓縮時間周期可能帶來的系統性病灶。早期以GPU為主的AI晶片，迭代周期約為18-24個月。隨著AI熱潮來臨，需求方競爭壓力加劇，對迭代速度的渴求愈發極端，這讓輝達和Google等將晶片迭代周期壓縮到“年更”。但即使這樣還是不夠。目前，頂尖大模型基本每三個月就要迭代一次。SemiAnalysis創始人迪倫·帕特爾（Dylan Patel）此前在參與The MAD Podcast with Matt Turck播客節目時表示，即使晶片廠商將迭代周期壓縮到半年，也無法很好適配模型進步的速度，也難言確保自身優勢。即使晶片和模型的性能增幅雙雙放緩，這種“賽跑”也未見稍顯的跡象。而考慮到前文提到的製程、技術演進等方面的瓶頸，以及美國能源供給方面愈發緊迫的硬性約束，結果可能演變成跑著跑著增長動能斷檔，甚至雙雙“撞牆”，讓原本可能在斜率放緩中更加平衡的供需被打破。更不可小覷的是這種“賽跑”對Capex的依賴。處在晶片與模型之間，被這種“你追我趕”來回拉扯的雲廠商，承擔了最集中的資本支出，他們往往同時也涵蓋AI業務，投資與回報都面臨風險和壓力。根據亞馬遜、微軟、Google、Meta和甲骨文這五大雲廠商披露的資訊，其2026年Capex總額將超過7000億美元。資料來源：公司財報及電話會議；作者製圖按照較為傳統的算力基礎設施五年折舊周期來計算，大約對應1400億美元的AI銷貨成本，這對AI行業目前的ARR（年度經常性收入）來說是天文數字。雖然OpenAI預計2026年ARR能夠突破450億美元，Anthropic也有望達到類似規模，但這兩巨頭本身的市佔比已接近八成，即使不考慮利潤，行業的淨收入也很難支撐資本開支。而正是由於晶片和模型迭代速度越來越快，市場對折舊周期的計算也產生了疑惑。知名投資人“大空頭”麥可·貝瑞（Michael Burry）自去年起，就一再“炮轟”當下的折舊周期不符合實際，認為如今AI晶片的實際經濟價值可能在2-3年內就會因技術過時而大幅衰減。雖然此類觀點爭議頗多，但如果大模型和晶片的“賽跑”繼續，甚至還要加速，那麼，有關折舊周期的質疑只會越來越多。而且，資本端的超額支出，往往以Scaling Law和大模型性能的繼續躍遷為由。從前文提及的趨勢來看，Scaling Law的退潮，也會讓Capex的狂飆不再“師出有名”。2025年下半年至今，雲巨頭的投資回報率（ROI）愈發成為市場矚目的核心指標，美股對缺乏利潤增長的Capex往往報以拋售，典型如微軟，其公佈的財報營收、淨利均超預期，但股價隨即暴跌10%。而晶片企業即使持續創造新的紀錄，但以去年11月輝達市值從5兆高點回落為節點，市場始終未給出匹配增速的估值溢價，空頭聲音反而愈發顯眼。這些，也構成了時下盛行的“AI泡沫論”的核心焦慮。不過，值得注意的是，相較於泡沫本身的存在與規模，人們看待和對待其方式，可能更加重要。當市場持續不給單純的拼規模、拼速度以正向反饋後，這一趨勢更可能會以幾次陣痛為代價放緩步伐。目前晶片大廠和部分大模型、雲廠商對未來兩年已有明確規劃，迭代速度和支出規模可能仍然維持高位，高盛也預測2025至2027年是AI伺服器出貨量增長最迅猛的三年，其中增速峰值出現在2026年。但在這之後，全產業鏈的增長可能都會面臨結構性放緩。如果只在商業和技術層面考慮，對AI增速形成影響的變數還有很多，但最近兩大標誌性熱門事件，為AI產業的發展，蒙上了一層不確定性陰影。其中一個就是，Citrini Research的《2028全球智能危機》（The 2028 Global Intelligence Crisis）。報告幾乎是以“近未來科幻”的方式，描述了從2025年末起Agent（智能體）登堂入室開始，直到2028年人類社會在新的AI時代可能面臨的窘境。圖片來源：CitriniResearch報告本身是虛構，且先進技術替代人類工作種類，也不是什麼新鮮論調，但是，當下的時點討論這個問題，卻意外引發空前共鳴。畢竟，就在2026年初，OpenClaw、Anthropic的Claude Cowork及一系列Agent外掛的出現，將AI的“替代力”十分直接地擺上了檯面。在種種預警和焦慮下，人類社會加以反制AI嗎？AI發展得越快，替代性危機的發酵就可能越快，但AI落地真實工作場景的實戰能力和可持續性，卻需要進一步探索，但顯然，我們正在看到的景像是，大小公司集體AI化的步調已經加快了。 (鈦媒體)

我被大模型這薪資驚到了！

2026年AI行業最大的機會，毫無疑問就在應用層！字節跳動已有7個團隊全速佈局Agent大模型崗位暴增69%，年薪破百萬！騰訊、京東、百度開放招聘技術崗，80%與AI相關……如今，超過60%的企業都在推進AI產品落地，而真正能交付項目的大模型應用開發工程師，卻極度稀缺！落地AI應用絕對不是寫幾個prompt，調幾個API就能搞定的，企業真正需要的，是能搞定這三項核心能力的人：✅RAG：融入外部資訊，修正模型輸出，給模型裝靠譜大腦✅Agent智能體：讓AI自主幹活，通過工具呼叫（Tools）環境互動，多步推理完成複雜任務。比如做智能客服等等……✅微調：針對特定任務最佳化，讓模型適配業務目前，脈脈上有超過1000家企業發佈大模型相關崗位，人工智慧崗平均月薪7.8w！實習生日薪高達4000！遠超其他行業收入水平！技術的稀缺性，才是你「值錢」的關鍵！具備AI能力的程式設計師，比傳統開發高出不止一截！有的人早就轉行AI方向，拿到百萬年薪！👇🏻👇🏻AI浪潮，正在重構程式設計師的核心競爭力！現在入場，仍是最佳時機！ (AI寒武紀)

全球AI大模型全景解析：ChatGPT、Grok、微軟、Google與中國代表模型同台對比

當前全球人工智慧大模型賽道已形成多元競爭格局，國際陣營與中國本土模型各有技術路線與場景優勢，共同推動AI技術走向普及化、實用化。OpenAI的ChatGPT作為全球通用大模型的標竿，綜合能力均衡全面，在邏輯推理、程式碼編寫、專業創作與多模態理解上保持領先，外掛生態成熟完善，是全球專業辦公、學術研究與海外業務的主流選擇，產品風格嚴謹穩定，適配各類高要求任務場景。xAI的Grok憑藉鮮明特色快速崛起，依託X平台即時資料接入，對全球熱點與時事動態響應迅速，產品風格個性直接、迭代節奏激進，同時與特斯拉車載、智慧型手機器人生態深度聯動，更受科技愛好者與追求前沿體驗的使用者青睞。微軟依託與OpenAI的深度合作及自研佈局，形成了以Copilot為核心的AI體系，全面融入Windows、Office、Azure等生態，在文件處理、表格分析、簡報製作等辦公場景體驗極致，同時整合Claude模型能力，兼顧企業級服務的穩定性與效率，小參數模型Phi系列在輕量化部署上表現突出，成為辦公場景的首選AI助手。GoogleGemini系列以超強多模態能力與超長上下文處理為核心優勢，深度聯動Google搜尋、雲端辦公與Android生態，在長文件解析、多媒體理解、科學計算等領域表現亮眼，是全場景智能體的代表產品。中國大模型立足本土需求，打造出更貼合國內使用者的實用體系。字節跳動豆包定位國民級全能AI，中文理解自然流暢，多模態創作與日常工具呼叫能力突出，深度聯動抖音、剪映、飛書等生態，使用門檻低、普惠性強，適配日常娛樂、內容創作、辦公輔助等全場景。百度文心一言依託知識圖譜與搜尋技術積累，在知識問答、複雜推理與行業解決方案上優勢顯著，政務、金融等企業級服務體系成熟，合規性與穩定性領先。阿里通義千問兼顧開源與閉源雙路線，長文字處理與多語言能力出色，深度融入電商、雲端運算生態，性價比優勢明顯。騰訊混元依託微信、QQ等社交生態，在內容生成、社交場景適配與多模態協同上表現優秀。華為盤古聚焦政企與工業場景，依託鴻蒙與算力底座，在智能製造、智慧城市等領域落地深入，安全可控能力突出。整體來看，國際模型中ChatGPT主打全能均衡，Grok聚焦即時個性，微軟Copilot深耕辦公生態，GoogleGemini領跑多模態；中國模型則以地道中文體驗、本土生態融合、安全合規與高性價比為核心優勢，更適配國內使用者的日常與產業需求。不同模型依託各自技術與生態優勢，覆蓋不同場景與使用者群體，為全球AI應用提供了豐富多樣的選擇。 (趣ai視角)

美股變天了

最近，美股市場出現了非常撕裂的一幕：一邊是散戶股民們還在為AI大模型能力飆升而狂歡，一邊卻是華爾街機構在大舉拋售各種高毛利軟體巨頭，反手將真金白銀塞進了各種重資產“老登股”。這完全違背了過去十幾年來市場對科技股投資的信仰。華爾街給這種現象起了一個代號：HALO交易（Heavy Assets, Low Obsolescence，重資產、低過時率）。此次價值重估，究竟是一時的情緒避險，還是主導未來十年的財富密碼？01Why Now？過去十幾年，輕資產公司一直都被認為是最完美的印鈔機。SaaS等軟體模式建立在無限可擴展性而非物理產品之上。一行程式碼可以瞬間低成本複製給全球萬千客戶，極低的邊際擴張成本帶來了極高的毛利率與估值溢價。尤其是前幾年，任何軟體公司只要宣佈“擁抱 AI”，股價就能原地起飛。比如主打國際語言教學的多鄰國(duo.US)，從2022年至2025年上半年期間，股價一度從70美元飆升至近550美元，3年漲幅高達7倍。而相反，傳統的重資產企業因為需要漫長的時間建廠房、買裝置、耗產能，面臨極高的資本開支與物理摩擦，長期被資金視為笨重且邊緣化的資產。然而，在2026年初，這種信仰正被暴力反轉。市場開始擔憂，無所不能的AI智能體（Agent）會像“吃豆人”一樣，一口口吞噬掉整個輕資產和軟體行業。來源：pngtree如果大模型通過極其簡單的自然語言指令就能瞬間生成一套定製化的企業級工作流，那麼幾行程式碼就能生成的服務將不再具備護城河，傳統軟體公司動輒幾十上百倍市銷率的基本盤恐怕也將被徹底抽空。去魅與破壞並存，於是大量軟體股的遠期預期的崩塌引發了巨大踩踏。這種拋售甚至帶有了強烈的恐慌情緒。那怕一些公司當季的自由現金流依然強勁，但只要被打上“容易被AI程式碼替代”的輕資產標籤，機構就會毫不猶豫地清倉出局。似乎沒有物理護城河，再高的毛利也不堪一擊。因為AI 可以讓虛擬供給無限擴張，但無法創造物理供給。訂票平台Expedia和航空公司——達美航空就是一個很好的對比。未來的AI代理可以直接讀取使用者的日曆、偏好，自動全網比價並完成無感預訂，這種流量分發入口的價值正在被底層大模型急速架空。Expedia作為線上旅遊預訂巨頭，其數位化服務理論上極易被Agent直接取代，未來前景的不明確導致其股價一路下跌。反觀達美航空，手裡握著實打實的機隊，擁有真實的運輸能力，股價今年一路強勢。現在，市場正在瘋狂定價“稀缺性”。邏輯簡單來說就是，程式碼一秒鐘可以複製成千上萬次，但AI大模型永遠無法把旅客從紐約瞬移到倫敦。摩根士丹利主經紀業務（PB）的資料顯示，避險基金淨買入了半導體和全端人工智慧資產（涵蓋電力、科技等人工智慧相關領域），推動這些行業的持倉達到2020年以來的最高水平。另一方面，摩根士丹利的基礎設施軟體組合（MSXXINSW）成為今年拋售力度最大的主題，其持倉量已跌至2020年以來的最低點。而資金爆買重資產，並不僅僅是為了避險。02拆解HALO Trade今年以來，美股的重資產類股一路突飛猛進，其漲幅迄今大幅領跑輕資產類股。高盛在報告中揭示：“自2025年以來，我們新的重資產組合（GSSTCAPI）已經跑贏輕資產組合（GSSTCAPL）達35%。”AI對基礎設施的吞噬，直接造就了極其龐大的增量市場。訓練兆參數的大模型，盡頭是堆積如山的變壓器、液冷裝置和粗壯的銅纜。極高的物理重設成本，漫長的時間周期和工程複雜性，構成了重資產實體估值重估的基石。這條主線覆蓋了電網基建、公用事業、核能以及關鍵材料（工業金屬）等類股。它們披著傳統重資產的外衣，而賺的卻是最前沿科技革命的錢。這些企業之所以股價狂飆，是因為它們直接承接了AI資料中心那如同黑洞般的電力和物理基礎設施需求，而上下游資本開支周期的錯配使得訂單周期被無限地拉長。以電氣裝置為例，北美大型電力變壓器的交貨周期已經從過去的幾個月拉長到了數年。另一方面，全球化效率優先的時代面臨終結，大國博弈日益加劇，跨國企業被迫開啟轟轟烈烈的近岸外包與供應鏈重建。在地緣政治碎片化的背景下，這些昔日被視為邊緣化、重投入的物理資產（尤其是關鍵礦產、本土製造業設施），如今成為了國家安全和經濟運轉不可或缺的底座，一躍成為具有極高戰略價值的“稀缺資源”。程式碼可以一夜之間重寫，但物理產能的建構需要數年甚至數十年。挖掘機履帶的轉動、變電站的澆築、新銅礦的勘探投產，統統是以“年”為時間單位的。供給端的極度缺乏彈性與AI基建的爆發式需求迎頭相撞，造就了無法輕易化解的物理瓶頸。這決定了HALO交易不只是一次短期的資金炒作，而是一場長周期的產業趨勢。物理規律的限制，死死鎖定了這輪行情的下限。那麼，極高的物理複製成本，以及免疫技術顛覆的“低過時率”，符合這兩點要求的行業究竟有那些？摩根士丹利提出的HALO籃子（MSXXHALO）框定了七大結構性支柱產業，分別是：材料、公用事業、鐵路、管道、廢物處理、國防和訊號塔。而高盛的定義則更加廣泛，進一步將電網、運輸基礎設施、重型機械（如福特、通用汽車）、甚至餐飲食品飲料都納入了HALO交易的範疇。順著機構的選股圖譜，資金爆買這些重資產的邏輯可以被拆解為三個層次：其一，做多AI浪潮的物理“賣水人”。這條主線覆蓋了半導體製造裝置與資料中心溫控系統等身處科技競賽的產業鏈。AI晶片先進製程的升級和高密度算力帶來的散熱焦慮，讓這些擁有極高物理製造與專利壁壘的企業，成為了AI產業鏈上確定性最強的硬體收割機。其二，死守物理世界的絕對剛需，理由簡單粗暴：人類依然需要消耗石油、抵禦通膨和運輸實體貨物。這部分資產憑藉嚴苛的資本紀律、強大的終端定價權，成為了高息環境下資金最安心的重裝防守利器。其三，押注逆全球化的產能重估，AI + 周期“雙引擎”加持。譬如電網基建與電氣裝置、工業金屬一季重型機械等。這些類股既迎來傳統周期的更新換代，又吃到了新世界的AI紅利。03軟體股還有未來？當資金都在為物理世界的稀缺性支付溢價時，軟體股的市場未來似乎走向了盲區。2月Anthropic發佈了Claude Cowork的一周內，美國軟體股市值蒸發超1兆美元。這款Agent（智能體）工具能夠繞過軟體操作介面，直接讀取CRM或ERP的底層資料並自動執行工作流。市場擔心如果前端UI介面被AI取代，傳統企業軟體是否將退化成毫無溢價的CRUD（增刪改查）資料庫。但也有觀點提出，AI模型不會毀滅現存軟體，而是將作為“協調層（Orchestration layer）”寄生併疊加在現有系統之上。Anthropic近期推出了10款全新的AI外掛工具，將AI的觸角拓展到投資銀行、財富管理、人力資源(HR)、私募股權(PE)及工程設計等多個垂直場景。這些更新允許企業將其整合到包括賽富時(CRM.US)旗下的Slack、財捷、DocuSign、LegalZoom、慧甚以及GoogleGmail在內的眾多企業應用中。這釋放出了明確的產業訊號：大模型廠商的演進路線是接入現有生態，而非推倒重建。傳統SaaS是工業時代“分工範式”的產物，靠固化流程和按人頭收訂閱費建構壁壘。在AI時代，這種通用軟體的介面和程式碼確實會被即用即棄。但行業SaaS巨頭的護城河還未動搖：沉澱數年的獨佔資料、隱性流程和監管合規規則。大模型再聰明，也無法憑空捏造出一家企業的財務審計規則或供應鏈歷史參數。沒有這些底層資產源源不斷地“喂養”，再前沿的AI智能體也只是無源之水。而對於大模型公司而言，去捲各個垂直細分領域複雜的B2B合規、企業權限管理和沉重的交付流程，毫無規模效應可言。將大模型定位為底層的“通用大腦”或“超級員工”，賦能並嵌入現有的企業級軟體生態，才是收割利潤的最優解。未來，這些SaaS公司或許會成為“企業智能體OS（AIOS）”的初始資料底座，將過去的業務邏輯解構、封裝為可插拔的“能力包（Skill）”。儘管面臨質疑，Salesforce、SAP、Adobe等軟體巨頭近三年的毛利率都在不斷增長，去年都創下了歷史新高。回過頭看，市場可能把“軟體形態的消亡”放大成了“軟體價值的清零”。恐慌情緒砸出的，未來可能是難遇的黃金坑。04尾聲過去十年，華爾街信仰的是“軟體吞噬世界”。而如今AI的狂飆突進，最終在物理世界的堅硬岩盤上撞出了震耳欲聾的迴響。數字世界最極致的繁榮，最終還是要建立在變壓器、銅纜和重型機械這些最沉重、最笨拙的底座之上。 (格隆匯APP)

川普怒斥：瘋子

據環球網2月28日援引路透社報導，美國總統川普怒斥美國人工智慧公司Anthropic的高層為“極端左翼瘋子”，並稱其犯下“災難性錯誤”。事情起因於，有報導稱，美軍在對委內瑞拉的軍事行動中，使用了Anthropic公司旗下的AI大模型Claude。消息被曝光後，Anthropic公司向五角大樓求證該消息是否屬實，並表達了關切。雙方因人工智慧模型使用範圍和條件產生爭端。美國國防部長赫格塞思24日同Anthropic公司CEO阿莫迪舉行會晤，要求對方允許美軍無限制使用Claude。對此，Anthropic公司予以拒絕。五角大樓日前展開極限施壓並威脅將Anthropic公司列為“供應鏈風險”。當地時間26日，該公司發表聲明稱，美國國防部的威脅不會改變公司立場，即該公司模型不應用於在美國國內進行大規模監控以及完全自主武器系統。川普27日為此在社交媒體上公開發火，將Anthropic公司高層稱為“左翼瘋子”，並命令美國政府所有聯邦機構立即停止使用Anthropic公司的技術，威脅如果Anthropic公司在過渡期內拒絕配合工作，他將動用總統全部權力強制其遵守。 (長江雲新聞)

Token出海或迎風口！Kimi+DeepSeek+智譜+MiniMax，籌碼集中概念股出爐

AI大模型服務正面臨嚴峻的算力考驗。進入2026年，人工智慧大模型行業競爭步入白熱化階段。春節前，騰訊元寶、阿里千問、字節跳動豆包等大廠集中發力C端市場，通過各類福利活動掀起使用者“爭奪戰”。春節假期至今，全球大模型賽道融資消息也密集落地，資本熱度持續攀升。然而，伴隨使用者規模與使用頻次的激增，Token（詞元）消耗量顯著增長，大模型服務正面臨嚴峻的算力考驗。春節期間，豆包因春晚高頻互動導致算力承壓，一度暫停視訊通話功能；智譜AI等廠商也因高並行請求採取了API限流等措施。算力供給不足、推理資源緊張，已成為當前大模型規模化落地過程中亟待解決的核心難題。中國國產大模型霸榜OpenRouter自2025年初DeepSeek橫空出世、驚豔全球以來，中國大模型產業快速崛起，憑藉獨特的技術與場景優勢持續霸榜全球。據全球最大的大模型API聚合平台OpenRouter資料顯示，2月平台內前十模型總Token消耗量已突破27兆，國產模型貢獻超過14兆，市場佔比超過50%。其中，MiniMax M2.5以超過5兆的Token消耗位居全球榜首；Kimi K2.5緊隨其後，2月Token總消耗量超過4兆；DeepSeek V3.2、GLM 5分別位列第四、第八位。這些頭部國產大模型，普遍聚焦於程式碼能力與智能體（Agent）自動化任務的能力提升。從春節期間的消耗量來看，2月16日至22日（農曆除夕至正月初六），OpenRouter平台Token消耗量前十的大模型中，中國大模型份額佔比已超60%。其中，MiniMax M2.5、GLM-5 消耗量環比大幅增長，增幅分別達到197%和158%。反觀全球市場，Google、xAI、OpenAI等海外廠商旗下大模型的Token消耗量增速明顯低於國內模型，全球市場份額增長乏力，部分甚至出現負增長。Token消耗量或開啟多年增長模式Token（詞元），即AI處理資訊的最小單位。大模型每生成一個Token，後端的伺服器就得高速運轉，這不僅需要強大的算力，更需要大量的電力。根據業內測算，Token生成的成本結構中，電力及算力的成本佔比超過七成。摩根大通的報告顯示，基於使用者情境的預測，從應用採用的角度出發，Token消耗量或開啟多年增長期。中國的AI推理Token消耗量預計將從2025年的超10千兆增長至2030年的約3900千兆，增幅接近369倍，主要受兩個復合要素推動，一是隨著AI成為搜尋、內容生成、客戶服務和生產力的默認介面，AI在消費者使用者和企業工作負載中的滲透率都在提高；二是用例從對話AI擴展到智能體和多模態輸出（更長的上下文、更多的工具呼叫、更豐富的輸出），即使使用者數量增長放緩，這也會實際增加每個會話的Token。從細分領域來看，隨著時間的推移，推理需求的佔比發生明顯變化。對話AI佔2025年預期Token總消耗量的近一半，預計到2030年逐步下降至高個位數百分比；生活情景AI智能體的份額預計將從2025年的個位數提高至2030年的10%至20%。國產大模型具備電力的算力的雙重優勢對於開發者而言，性價比是硬道理。從國內來看，無論是電力還是算力，都具備顯著的成本優勢，並有望重構AI定價權。從電力來看，國家能源局資料顯示，截至2025年底，中國累計發電裝機容量達38.9億千瓦，同比增長16.1%，發電量佔全球總量的三分之一。中國也成為全球首個全社會用電量突破10兆千瓦時的國家，電力供給充足且成本優勢顯著。AI熱潮之下，美國電價呈現明顯上漲趨勢，進一步凸顯中國電力成本的競爭力。從算力來看，早在2025年10月份，央視網報導，“十四五”時期以來，中國開啟新一輪數字基礎設施大佈局，全國一體化算力網連通東西南北，算力總規模躍居全球第二，不僅為中國數字經濟的成長澆築新的基座，也創造了增長的新機遇。目前，國內多家頭部算力企業已建構起完備的適配體系，在推理環節有效突破海外技術壟斷，伺服器、光模組、散熱等關鍵硬體環節也基本實現自主可控。依託規模化部署、低成本電力供給與演算法持續迭代，國產方案在主流應用場景中的Token生產成本具備明顯優勢。業內普遍認為，國產大模型憑藉更高效的架構設計，逐步降低對高端GPU的剛性依賴；而全球開發者對中國大模型的廣泛選用，進一步拉動國產算力需求呈現爆發式增長。14隻籌碼集中大模型概念股出爐儘管在最近幾個交易日的行情中，算力類股表現有明顯分化，但不可否認的是，算力需求提升是必然趨勢。在以周度進行統計的周期中，國產大模型Token消耗量更是一度超過美國（2026年2月9日至15日），後續優勢持續擴大，多重利多因素的加持下，Token出海有望成為趨勢。證券時報·資料寶根據萬得、同花順等公開資訊梳理，A股市場中屬於智譜、Kimi、DeepSeek及MiniMax主流大模型的概念公司有140余家。從市場表現來看，截至2月27日，這140餘隻概念股今年以來平均漲幅超過13%，傑創智能、藍色游標及中控技術今年以來累計漲幅均超過60%，前2隻個股涉及智譜概念，中控技術則涉及DeepSeek概念。首都線上、金現代、優刻得-W今年以來累計漲幅均超過40%，3家公司均涉及智譜概念。從籌碼變化情況來看，最新股東戶數較2025年年末下降的概念股有14隻，3隻概念股的股東戶數下降幅度超過10%，分別是世紀天鴻、恆為科技及遠光軟體。世紀天鴻最新股東戶數較去年末下降近24%，公司以自身戰略定位和資源稟賦為出發點，結合人工智慧技術已推出了基於大語言模型研發的專注於服務老師的AI智能體“小鴻助教”，並投資了基於人工智慧NLP（自然語言處理）技術、聚焦中小學寫作場景的人工智慧輔助寫作產品“筆神作文”。恆為科技最新股東戶數較去年末下降超過21%。公司2025年2月份表示，其推出的昇騰、DeepSeek一體機分為訓推一體機與推理一體機兩種類型，以“開箱即用+高並行低時延”為核心優勢，覆蓋金融、政務、科研、醫療等眾多垂直行業，助力行業實現智能化升級。遠光軟體最新股東戶數較去年末下降10.6%。目前公司主要接入或適配了智譜、阿里千問、DeepSeek、盤古等大模型。這14隻概念股今年以來平均漲幅超過9%，恆為科技、世紀天鴻、值得買漲幅居前，均超過15%。太極股份、浪潮資訊、宇信科技表現較弱，今年以來股價均呈下跌局面，其中浪潮資訊伺服器市佔率全球領先，涉及DeepSeek及MiniMax概念。(資料寶)

阿里拿下肯德基大單

阿里正在下一盤大旗。2007年，賈伯斯在舊金山Macworld大會現場，掏出初代iPhone附近的星巴克門店打了個電話，宣稱要訂4000杯拿鐵外賣。隨後，他又狡黠地說到，“不，只是開個玩笑，打錯電話了，再見。”霎時，全場爆笑。雖然沒有點單成功，但賈伯斯給所有人展示了一個由iPhone手機連接的新世界。購物、訂餐、出行、娛樂......至此，智慧型手機開始逐步介入我們的生活。而近20年後，這個連接世界的任務可能會逐步交到AI手中。在今年的春節大戰中，阿里千問在全國掀起一波下載熱潮，使用者使用“一句話下單”功能近2億次，意味著AI Agent在全球範圍內大規模實現了執行真實世界任務的功能。未來，像千問這樣的AI Agent ，可能會成為這個連接真實世界的新工具。1. 千問大模型接入肯德基阿里再拿下一單大生意。最近，阿里雲宣佈，肯德基在APP上線了一個新功能——AI智能點餐助手“小K”。該助手基於阿里千問大模型打造，是真正能幫使用者點餐的智能體。使用者打開肯德基APP，動動嘴就能完成從點單到支付的全流程。圖源：微信簡言之，千問App的“一句話辦事”能力正被移植到肯德基App中。而更令人期待的，是它在車內的應用場景。據悉，由千問大模型驅動的智能點餐助手“小K”，不僅能服務手機端，還能無縫接入合作的車機系統。開車時，使用者只需語音吩咐，小K便會自動連接最近的肯德基門店，完成餐品選定與支付，並直接開啟導航引導取餐，整個過程無需動手。圖源：阿里雲公眾號除了對點餐習慣的顛覆，這也是一次對駕駛習慣的顛覆。把點餐這件事從手機螢幕裡解放出來，嵌入了駕駛動線中，更是對“人、車、生活”場景的一次具體落地。從行業視角看，肯德基作為餐飲頭部品牌，將大模型融入核心點餐流程，可能也會成為餐飲零售業智能化轉型的一個風向標。未來，類似的AI Agent可能會出現在更多場景——奶茶店、加油站、影院，大模型將逐漸滲透進日常生活的毛細血管。回顧歷史，我們會發現，阿里千問在C端的大規模鋪開也是從餐飲開始的。剛剛過去的春節AI大戰，千問拿出30億現金，讓使用者下載即得25元代金券，硬生生把AI競賽拉回到了外賣大戰的煙火氣裡。但這看似簡單的撒錢背後，藏著更深層的邏輯。去年4月，馬雲出席活動時曾表示，科技的意義在於“呵護人間煙火”——讓AI更懂人、服務人，使普通人真正受益。圖源：微博而春節的資料給出了回應：使用者在千問上“一句話下單”近2億次，全國平均每10人就有1人通過千問下過單；1.3億人首次體驗AI購物，下沉市場訂單佔比近半，電影票訂單環比增長372倍。圖源：搜狐科技一組組數字表明，千問正在用最親民的方式，讓AI走進千家萬戶的真實世界。2. 千問實現阿里生態的“大一統”總的來說，阿里春節投下的三十億換來的不止是下載和訂單，更是AI成為未來生活新入口可能性的證明。其不僅為阿里即時零售、娛樂演出等其他業務打開了一條新的增長口子，也為我們的未來生活方式提供了新的想像。不得不說，千問App這一套整合阿里生態的打法，將大有可為。值得注意的是，在這樣生態協同的大背景下，除了點單點外賣，千問還有一個十分契合需求的適用場景，那就是智能汽車。最近幾年，幾乎每家車企都在講“智能化”，從車機互動到智駕系統，AI大模型成了新的競爭焦點。而在車企的核心合作夥伴陣營中，千問大模型逐漸成為一張高頻出現的新面孔。近年來，中國一汽、理想、小鵬、比亞迪、吉利、奇瑞、理想、小鵬、蔚來、零跑等車企集體接入阿里雲，覆蓋業務從海內到海外，阿里雲已成為中國車企全球化標配。據鳳凰網科技獲悉，目前，所有中國車企在國內均使用阿里雲；且在它們的出海業務中，阿里雲的使用率也達到了100%。圖源：微信這意味著在汽車這個對穩定性、安全性、即時性要求極高的領域，無論是國內跑還是出海闖，車企們把最核心的智能化任務，交給了同一套技術底座。而相較於其他的AI大模型，阿里在與車企的合作中，正形成一種對傳統車聯網模式的降維式打擊，那就是生態協同。自今年1月千問App全面接入阿里生態以來，它已實現從“大模型對話助手”向具備行動能力的“AI智能體”的關鍵躍遷。這意味著，接入千問大模型，對車企而言，可能相當於接入了中國網際網路商業的半壁江山。在這一體系內，AI不僅能回答問題，更能調度資源、完成交易、規劃行程，成為真正意義上的智能出行管家。我們不妨設想一個典型的駕車出行場景：去看演出、看電影、外出就餐、周邊遊玩——這些日常需求，幾乎都可以通過阿里生態內的應用一站式完成。大麥滿足票務需求，高德提供導航和位置服務，淘寶閃購支援即時購物，支付寶則貫通了從支付到身份核驗的全流程。通過接入千問，這些服務得以在車內以無縫、自然的方式呈現。更為關鍵的是，千問帶來的可能不僅是生態的聚合，還是互動的升維。比如，當你想帶孩子去附近找個能玩又能吃飯的地方，千問所驅動的AI智能體不僅能理解意圖，還能結合即時路況、使用者偏好、票務余量等維度，主動生成一整套定製出行方案，涵蓋目的地推薦、門票預訂、餐廳預約、停車指引等全流程。整體來看，阿里對AI的定位更像是商業基礎設施。通過長期投入，將淘寶、高德、支付寶等核心業務整合為一個生態，讓千問成為使用者與這個系統對話的統一介面。結果是，AI不僅成為了服務全民的助手，還能帶來商業回報。據全球AI產品資料平台AICPB披露，在剛剛過去的春節AI大戰中，千問的曝光量雖然不及豆包，但“Qwen則通過專注於實用、日常的使用場景，展現出了最強的使用者留存率。”這個資料背後，其實藏著一個關鍵的訊號：千問走的不僅僅是燒錢換曝光的老路，還是用場景留人的新打法。而這樣的使用者留存，對阿里在另一戰場的戰鬥來說，也是最好的底氣。今年一開年，市場就傳出消息稱，阿里核心管理層鼓勵淘寶閃購團隊“三年不要有虧損負擔”，同時劍指市場份額第一。圖源：抖音此次春節千問專注的實用場景，本質上也是即時零售的核心戰場。當使用者習慣在千問上“一句話點餐”，其實也在為淘寶閃購培養即時消費的心智。千問負責聽需求、完成交易，淘寶閃購負責背後的商品供應和即時配送，兩者天然咬合。如此看來，千問在C端的大規模鋪開，同時在為淘寶閃購的即時零售大戰提前鋪路。 (電商之家)

中國AI大模型霸榜！

春節期間國產大模型的使用情況可謂如火如荼。OpenRouter最新周度資料顯示，平台前十模型總token量約8.7兆，中國模型獨佔5.3兆，佔比61%。當周token呼叫量前三模型均為國產大模型，分別為Minimax M2.5、Kimi K2.5、GLM-5，呼叫量環比上周分別變動增加197%、下降20%、增加158%。其中，MiniMax M2.5以2.45兆token空降榜首，Kimi K2.5以1.21兆緊隨其後，智譜GLM 5和DeepSeek V3.2分列第三、第五。OpenRouter是全球最大的大模型API聚合平台，可為開發者提供統一API介面，以訪問全球數百種大語言模型。其核心功能包括多模型呼叫、智能路由最佳化和透明的性能排行榜，旨在解決多模型整合複雜和廠商封鎖問題。從該平台提供的資料看，程式設計（Coding）和智能體（Agent）正成為大模型的兩大核心比拚點。OpenRouter整體呼叫量近期大幅攀升。官方確認，M2.5帶動了100K至1M長文字區間的增量呼叫需求，這個區間正是智能體工作流的典型消耗場景。論token呼叫量，在此平台排名前三的國產大模型都聚焦於提升程式設計能力和智能體（Agent）任務的自動化水平，是2026年初國產大模型在應用層面的重要突破。稀宇科技（MiniMax）於2月13日發佈MiniMax M2.5，稱該模型為全球首個為智能體場景原生設計的生產級旗艦模型。其發佈後七天的呼叫量即突破3.07T tokens，憑藉在程式設計和Agent工作流中的卓越性能與極低的成本，成為開發者首選。月之暗面（Moonshot AI）於1月27日發佈KimiK2.5，該模型採用原生多模態架構，能通過調度多達100個“Agent分身”平行工作，將複雜任務效率提升3到10倍。該模型在多個細分榜單（如程式設計、工具呼叫）中均排名第一，其呼叫量遠超Gemini 3和Claude模型。據澎湃新聞報導，該大模型發佈不到一個月，Kimi近20天累計收入已超過2025年全年總收入，增長主要受全球付費使用者及API呼叫量大漲共同推動，其中海外付費使用者數快速增長。智譜於2月12日發佈GLM-5，該模型參數規模進一步擴展，採用了稀疏注意力機制，是其專為複雜系統工程與長程Agent任務設計的旗艦模型。憑藉免費、200K上下文窗口等優勢，該模型發佈後使用者迎來高速增長，智譜對Coding Plan先後進行了限售、漲價等動作，除夕當天官宣全網尋找“算力合夥人”。隨著AI模型應用場景深化，使用者從簡單問答轉向複雜工作流，如讓模型重構程式碼、改寫檔案、生成文件等，以及智能體模式普及，當前token消耗呈現明顯的“通膨”趨勢。性能提升的同時，國產模型仍以性價比優勢出圈。如MiniMax M2.5和智譜GLM-5相比Claude Opus 4.6具備顯著的成本優勢：在輸入環節，MiniMax M2.5與GLM-5的價格均為0.3美元/百萬token，而Claude Opus 4.6則高達5美元/百萬token，是前兩者的約16.7倍；在輸出環節，MiniMax M2.5的價格為1.1美元/百萬token，GLM-5為2.55美元/百萬token，而Claude Opus 4.6的輸出價格達25美元/百萬token，分別是MiniMax M2.5的約22.7倍和GLM-5的約9.8倍。上述國產模型並不能完全反映國內模型廠商的token呼叫量情況。據海通國際證券，資料顯示，火山引擎的大模型日均token呼叫量已從2024年底的2兆增長至2025年底的63兆；阿里雲外部客戶2025年日均token呼叫也已接近5兆，2026年目標至少15-20兆，內部業務日均呼叫則計畫從16-17兆拉到100兆。從全行業看，中國整體日均token消耗2024年初為1000億，2025年中突破30兆，2026年2月主流大模型合計日均token消耗已到180兆等級。東莞證券最新研報表示，隨著國產模型的程式設計、智能體能力提升，其呼叫量大幅增加，國產大模型在程式設計、智能體領域對標全球頭部模型，有望進一步加快應用落地，加速token消耗量上漲。長江證券此前表示，隨著程式設計和多模態模型和產品的逐步成熟，下游應用場景有望被真正打開，帶來大量的高品質token需求。參照海外AI產業發展規律，從資本開支投入到token需求爆發存在約兩年的滯後期。國內大廠的AI資本開支周期較海外滯後約一年，於2024年下半年開啟。因此，國內雲廠商收入已開始兌現增長，而token數量的真正爆發預計將在2026年到來。 (科創板日報)