#崑崙芯
大模型的盡頭是開源
大模型的戰爭,正悄然換牌。閉源一度是頂尖玩家的主流選擇,視為堅實護城河。然而,2025年9月,阿里、騰訊、百度等大廠幾乎同一時間,將模型開源大舉擺上牌桌,集中且密集的動作令人關注。從能看圖、能對話,到能寫程式碼、能做3D建模,大廠幾乎將壓箱底的招數一股腦甩出來。過去以技術封閉建構壁壘的模式正在被打破,取而代之的是將核心模型技術對外開放,結合開發者的集體智慧進行迭代最佳化,並快速佔領開發者心智。眼下,各類AI需求被拆得越來越細,落地場景也五花八門,而開源也不再是某種技術該不該開放的問題,而是直接成了大廠們硬碰硬的底層功夫。這就像在一場大牌局裡,底牌幾乎都已經翻出來了,大家手裡的牌面差不多,真正決定最後輸贏的,就不再是有沒有牌,而是誰能打得更巧,誰能留在桌上。開源別做選擇題當騰訊、阿里、百度紛紛甩出大招,將重量級模型陸續擺上檯面,重點不僅在於模型本身,更在於大廠們大都選擇了開源路線。表面上看似動作上的巧合,但深入分析,這更像是大廠對市場需求變化所做出的一種共識性反應。開源已不再是可選的附加題,而幾乎是必須正面回答的必答題。誰能答得更漂亮,誰就可能在下一局多佔一份先機。據騰訊混元公眾號及天眼查媒體綜合消息顯示,9月28日,混元圖像3.0正式發佈並開源。騰訊混元公眾號介紹稱,該模型為“首個工業級原生多模態生圖模型,參數規模80B,也是目前測評效果最好、參數量最大的開源生圖模型,效果可對標業界頭部閉源模型。”兩天前的9月26日,混元3D-Omni、混元3D-Part發佈並開源。這一連續出牌,一定程度上可以看作騰訊通過開源來調動外部開發者的力量,讓複雜的3D建模、圖像生成等任務在更大範圍內、更快速地向前推進和完善。然而,各大廠模型越做越龐大,與其一個人握著手裡的牌,不如攤開讓更多玩家一起來出招、共建。這樣一來,原本孤立的牌面,就可能被拼接成更厚實的成果,推動整場牌局不斷升級。據《新京報》9月24日報導,阿里巴巴在雲棲大會上一口氣發佈了7款模型,包括旗艦模型Qwen3-Max、下一代基礎模型架構Qwen3-Next及系列模型等。據通義千問Qwen公眾號消息,其已率先開源視覺理解模型Qwen3-VL系列的旗艦模型Qwen3-VL-235B-A22B,同時包含Instruct與Thinking 兩個版本。▲圖:通義大模型公眾號而面對多元的產業需求,開源也成為推動技術更快進入實際應用的有效路徑。據《上海證券報》9月23日報導,百度智能雲千帆宣佈推出全新視覺理解模型Qianfan-VL,並全面開源。該系列模型包含3B、8B和70B三個尺寸版本,面向企業級多模態應用場景,可以說是進行了深度最佳化的視覺理解大模型。Qianfan-VL具備基礎通用能力,也針對產業落地中的高頻需求,如OCR和教育垂直場景做了專項強化。這裡釋放出的訊號是,模型本身是工具,決定能否落地的,是可得性和成本可控性。百度通過對企業級多模態應用場景的需求深挖,某種程度上凸顯了其自身的技術攻堅能力,也在降低應用門檻上,讓更多企業可以以較低成本接入。從研發端的集體迭代,再到產業應用的快速落地,一系列動向表明,同時作用於研發和產業兩端的開源策略,其戰略價值不言而喻,也正逐漸成為大廠發展的關鍵動力之一。在研發層面,開源將分散的嘗試匯成合力。在產業層面,開源則讓更多企業能夠跨過門檻,將模型真正用起來。驅動未來的引擎當開發者與企業客戶習慣於在某個開源生態中進行開發時,其產生的龐大算力需求、對更高性能的付費版本以及配套的雲服務與行業解決方案的依賴,有望自然匯入大廠的商業河流。開源,就這樣從一張亮出的牌,變成了整個牌局繼續運轉的引擎。技術演進與應用落地的雙輪驅動,牌桌的規則正被改寫,對於旨在建構廣泛生態的大廠而言,開源似乎已無懸念,真正的問題是能開源到什麼程度。大廠選擇將底牌攤得更大、更全,不是炫技,而是試圖讓市場與產業習慣於圍繞自己的生態來運轉。共識既已形成,接下來的賽點是比較誰開放原始碼的尺度更為拉滿,給的是更多乾貨。拉滿,不是單純將參數堆到天花板,而是將模態、場景和應用儘可能覆蓋;乾貨,也不是象徵性地開放幾個版本,而是擺出一整套可落地的模型能力組合。這樣的開源,不是讓開發者挑不出缺口,而是要讓上下游產業明確感受到,這是一種確定性的開源,不僅能用,還好用。天眼查媒體綜合資訊顯示,阿里通過提供大規模、多模態的模型矩陣,滿足不同開發者的需求。其戰略意圖或在於,讓阿里的模型庫成為開發者的優先選擇。據《經濟觀察網》9月29日報導,阿里通義系列已經累計開源超過300個模型,下載量突破6億次,衍生模型超過17萬個。騰訊和百度則有所分化。從騰訊混元公眾號公開的消息內容看,騰訊的開源重點看上去是放在了展現其差異化能力上。進而,無論是複雜的3D生成,還是高語義要求的圖像創作,這一開源舉措,有助於騰訊在專業創作者和相關企業客戶心中建立強關聯。百度則給人一種主打軟硬一體組合拳的陣勢,將模型與自研崑崙芯P800計算卡深度繫結。據《上海證券報》,崑崙芯P800提供了強大的算力支撐,確保模型能夠高效處理海量資料與複雜演算法,同時支援單任務5000卡規模的平行計算。▲圖:百度智能雲千帆官方公眾號報導指出,“在通用能力基準測試中,Qianfan-VL系列模型(3B、8B、70B)展現出顯著核心優勢。從視覺理解到專業領域問答,模型性能隨參數規模增大提升顯著”。儘管大廠們開源策略各有側重,但體現出明確的行業趨勢,開源不再是點到為止的小修小補,而是大廠們拋出全乾貨的開放姿態。看似風格各異,實則目標同一。大廠們力求儘可能將開源尺度拉滿,不只是實力的展示,也是信心的釋放。然而,將乾貨拱手相授,只是上半場的局。真正決定成敗的下半場,在於誰能將這些開放原始碼的能力轉化為產業入口和使用黏性,讓開發者、企業客戶在不知不覺間依賴於大廠的雲基礎設施、API以及深度定製的企業級服務。大廠競技換牌桌隨著頂尖模型能力通過開源逐漸成為公共資源,大廠們的戰爭,悄然更換了牌桌。技術層面的准入差距正在縮小,行業的焦點急劇轉移,接下來的比拚,不再是技術本身的優劣,而是生態的廣度和深度。要在這場新的生態競爭中勝出,阿里打造龐大模型矩陣的長期目標,或可能是將通義模型庫打造為AI開發的基礎性平台。例如,開發者在處理相關任務時,是否會習慣性地前往其模型庫尋找解決方案。不同於阿里,騰訊的做法或是依託於其龐大的內容生態與社交應用積累,在相關領域建立優勢。譬如,其在遊戲、社交等領域擁有深厚的根系,對高複雜度、高表現力的3D內容和圖像有著天然的內生需求。而通過將開源重點放在3D生成和圖像創作上,或是要將其差異化能力擺上桌。▲圖:騰訊混元公眾號這不僅是技術實力的展示,更像是一種生態的順勢而為。當外部開發者,尤其是遊戲開發者、動畫師和設計師,如果將混元模型深度嵌入其創作流程時,騰訊或將在某種意義上實現從工具提供者到數字內容生產規則制定者的躍遷。這種路徑一旦站穩,所帶來的使用者黏性和生態壁壘往往更難被替代。而百度的路徑,看上去是要基於其作為搜尋巨頭和AI先行者對算力與穩定性的長期優勢,將模型開源與自研崑崙芯P800計算卡深度繫結,形成技術路線的自然延伸。進而,打造從晶片、框架到模型應用的完整生態,這對政務、金融、教育等百度早已佈局的重要場景而言,相對更為友好。換言之,百度要做的,或是將經過深度最佳化的模型能力和可靠高效的算力支撐同步開放給目標客戶和開發者,降低試錯和整合成本。通過這種生態建構,百度的競爭力便也不再停留在模型層面,而是在產業服務上紮根更深。這些差異化的佈局,說明大廠們的大模型競爭正轉換風向,它們並非在全新的戰場上從零開始,而是將自身固有的核心優勢,通過開源戰略投射和放大到大模型的疆域之中。過去看誰的團隊更大、投入更多,如今比的是誰能將自身優勢轉化為生態吸引力,讓開發者在特定場景下最先想到“就用它”。開發者一旦習慣了某套開源模型,企業客戶在搭建應用時自然就會跟上,這套系統便有望成為事實上的“王牌”。寫在最後從開源是否做選擇題,到日趨尺度拉滿的乾貨,再到牌桌換新的生態競爭,中國大廠的大模型路徑已經顯現出某種確定感。大廠不再滿足於單一產品的比拚,而是通過一次次開源,將競爭延伸到更廣闊的開發者社群與行業場景中。儘管閉源在特定領域仍有價值,但就建構廣泛產業影響力而言,開源無疑已成為大廠大模型戰略的必然歸宿和主戰場。未來幾年,大模型的競爭會愈演愈烈,開源讓技術門檻降低,但也讓競爭提前白熱化。真正的勝負,不是今天誰先開源了多少,而是誰能在開放之後,將開發者、行業客戶和應用場景都拉進自己的生態之中。惟其如此,才能在新的牌桌上佔據主動。大廠的大模型之戰,終究不是看誰先出完手裡的牌,而是誰能讓更多人心甘情願地跟著出牌。 (零態LT)
阿里PPU、百度崑崙芯,中國AI迎「華為時刻」
國內AI晶片市場正在經歷一場深刻的變革,“去輝達化”成為熱詞。這場變革的核心在於,以阿里巴巴和百度等為代表的中國科技巨頭,正積極推動AI晶片的自主研發,試圖挑戰輝達在國內AI晶片領域的壟斷地位。9月以來,國產AI晶片捷報頻傳:阿里巴巴、百度等網際網路巨頭相繼宣佈,其核心AI模型的訓練將部分採用自研晶片。與此同時,阿里平頭哥和華為昇騰的新一代產品性能曝光,性能追趕甚至部分超越了輝達。資本市場對此反應積極。除了多家投行上調阿里、百度等國內科技巨頭的估值外,華爾街明星基金經理“木頭姐”更是四年來首次買入阿里巴巴。股票表現上,自8月底以來,百度和阿里巴巴的港股股價累計漲幅均在50%左右。圖:阿里巴巴和百度港股表現    資料來源:wind,36氪整理那麼,國內AI晶片從外購到自研背後究竟出於何種原因?國產晶片加速“去輝達化”這場“去輝達化”運動,背後最直接的動力源於日益緊張的地緣政治,以及由此引發的對AI供應鏈穩定性和安全性的深層擔憂。今年4月,美國政府一度禁止輝達向中國銷售H20晶片,儘管7月恢復出口,卻附加了15%的收入上繳條件。面對美國的限制,中國的反制也接連升級:7月底H20被曝“漏洞後門”遭到約談,8月中旬一度傳出停產消息,而近期的反傾銷調查更是將這場風波推向高潮。圖:2025年AI晶片相關動態資料來源:中原證券,36氪整理兩國博弈的升級,加劇了海外AI晶片的供應鏈風險。對需要長期穩定投入的AI玩家來說無疑是致命的。出於對風險的考量,越來越多的中國科技巨頭意識到晶片自主可控的重要性,由此掀起了一場浩大的“去輝達化”浪潮。這場浪潮的演進,給輝達帶來了明顯的負面衝擊。今年第一財季,輝達就因對H20的出口限制計提了約45億的存貨減值。而隨著風暴的愈演愈烈,輝達來自中國大陸的收入持續銳減。財報顯示,2026財年第二季度,其來自中國大陸的收入銳減至27.7億,環比下滑了近50%,佔比下滑至6%,同期美國、新加坡和台灣地區的收入增速則均有提升。圖:輝達中國大陸收入及佔比    資料來源:wind,36氪整理與輝達的困境形成鮮明對比的是,浪潮之下國產定製AI晶片正在快速崛起。8月21日, DeepSeekV3.1發佈,宣佈使用FP8架構增強國產晶片適配性。9月16日《新聞聯播》意外曝光了阿里平頭哥的PPU晶片。其在視訊記憶體容量和片間頻寬上已超越輝達A800,比肩H20。更關鍵的是,根據招銀國際的資料,得益於國產7nm工藝與2.5D封裝,PPU單卡成本較進口H20下降40%。圖:國產AI晶片資訊   資料來源:山西證券,36氪整理在PPU曝光僅兩天后,9月18日,華為罕見地公佈了昇騰晶片未來三年的詳細演進路線。通過支援低精度計算、混合架構、互聯頻寬和算力翻倍增長,華為正從技術上實現全面追趕。不止於單卡性能,更重要的是,基於自研互聯協議“靈衢”和昇騰950系列晶片的Atlas950 SuperPod,可以形成百萬級規模的統一算力底座,各項性能超過輝達下一代NVL144和2027年的NVL576,成為全球最強算力叢集。圖:華為昇騰晶片進展   資料來源:長城證券,36氪整理而產品性能的突破也加速了國內算力基建國產化解決方案的部署。8月底,百度崑崙芯在中國移動集采中拿下三個標包第一,中標規模達到10億級。這更像一面鏡子,清晰地折射出本土AI晶片廠商正在加速蠶食輝達的市場份額。IDC資料顯示,2024年,輝達在中國的市佔率從85%降至70%,而本土 AI 晶片品牌的出貨量超過 82 萬張,市場份額顯著提升至30%。圖:輝達中國市佔率持續下滑  資料來源:IDC,36氪整理而Bernstein預測,2025年輝達在中國AI晶片市場的份額將進一步降低到54%,同期本土廠商份額顯著增長,且呈現百花齊放、多元競爭的新格局。圖:國內AI晶片市場格局演變   資料來源:Bernstein,36氪整理歷史的鏡像:手機晶片的“通用”到“定製”之路當前中國AI晶片的定製化浪潮,與過去十餘年手機晶片的發展歷程極為相似。在智慧型手機發展的早期,晶片的主導者是高通、聯發科等通用晶片廠商。這些晶片方案的優勢是具備高度的相容性和標準化特性,可以大幅降低手機廠商的研發門檻,使其可以快速佈局智慧型手機業務,搶佔市場先機。然而,隨著行業的迭代,通用晶片的弊端也開始顯現。一是,手機晶片長期被高通、聯發科等少數企業壟斷,導致手機廠商在供應穩定性上長期受制於人,並需要承擔高昂的額外費用,對利潤造成擠壓。以“高通稅”為例,蘋果每售出一台iPhone就需要交付高通售價5%的專利費,2016年蘋果支付的專利費用高達28億美元,佔當年利潤的6%。二是,通用晶片的架構設計無法完全匹配手機廠商的產品迭代規劃和定製化需求,導致產品性能提升滯後,且難以形成軟硬體一體的協同效應,弱化了使用者的使用體驗。三是,核心硬體上的趨同使得手機廠商只能針對攝影機、螢幕等外部環節做“堆料”創新,難以形成真正的差異化壁壘和品牌溢價,阻礙了品牌的高端化進展。正是基於這些明顯的缺陷,以蘋果為代表的頭部廠商走上了晶片自研之路,推動智慧型手機晶片從“通用”向“專用”的過渡。2010年,蘋果推出首款自研晶片A4,奠定了此後 iPhone 在智慧型手機領域的王者地位。A系列晶片採用自研架構和先進製程工藝,並與IOS系統調度邏輯緊密配合,實現了軟硬體的全面最佳化。不僅保證了iPhone硬體性能的持續領先,也形成了基於軟硬協同的獨特技術生態,讓iPhone的使用體驗上一騎絕塵,為蘋果構築了難以複製的護城河,成為其長期穩居高端智慧型手機第一梯隊的關鍵。在蘋果取得成功後,華為也緊隨其後開啟了自研晶片之路。2013年,華為通過海思半導體自研麒麟晶片,整合了華為在通訊、AI和影像處理方面的核心技術,不僅最佳化了整體性能也使其在5G時代具備了先發優勢。更重要的是,麒麟晶片與鴻蒙系統的深度融合,為華為手機建構了強大的生態護城河,讓其徹底擺脫了手機“組裝廠”的標籤,憑藉差異化優勢在國內高端市場站穩了腳跟。而更深遠的影響在於,依靠定製化晶片兩家公司減少了對外部供應商的依賴,從根本上最佳化了成本結構。而且以此所形成的“軟硬一體”生態優勢,也使其品牌溢價持續提升,為其帶來了更可觀的利潤空間。2024年,蘋果iPhone業務毛利率接近40%,遠高於行業平均毛利率水平。國產AI晶片的“華為時刻”當前,中國AI晶片的“去輝達化”浪潮,正是對手機晶片發展歷程的一次深度復刻。從本質上看,AI晶片的國產化和定製化,既是出於供應鏈安全性的考量,更是AI從訓練轉向推理後,行業的必然選擇。隨著大模型迭代速度的趨緩,市場需求正從“瘋狂堆算力”轉向更務實的商業化應用落地。這種背景下,AI的重心也從“訓練”轉向“推理”。根據輝達 CEO 在 2026 財年第一財季業績會時的發言,AI 推理 token 的生成量在過去一年激增了 10 倍。與訓練相比,推理任務對算力需求有所降低,但對成本、功耗和延遲的要求更高。輝達的通用GPU雖然性能強大,但其成本高、能效低,且存在高延時問題,因此並不能完美匹配推理任務需求,尤其是國內閹割版較高的成本致使其性價比大打折扣。這種市場需求的變化,直接推動了國內晶片行業的定製化之路。從適配度上看,與通用 GPU 相比,定製晶片去除了大量冗餘功能從而在執行特定任務時,能在功耗、成本和延遲上實現數量級的最佳化。對於需要大規模、高並行、低延遲的AI 推理任務來說,效率遠高於通用 GPU。圖:通用晶片與定製晶片的對比   資料來源:民生證券,36氪整理而本土晶片設計及供應鏈的進一步成熟,也為國產晶片性能加速追趕國際水平提供了底氣,使得AI算力基建轉向國產解決方案成為可能。正如智慧型手機時代的蘋果和華為,中國的AI玩家已經不再滿足於僅僅購買輝達的通用GPU,而是開始嘗試外購+自研兩條腿走路。一方面,在訓練領域,依靠國際先進晶片的高性能實現模型迭代,為進一步的自主化保留時間窗口;另一方面,加速自研定製化晶片並積極適配國內外主流大模型,在能效、特定場景最佳化等方面尋求差異化優勢,並通過軟硬體的深度協同,最佳化效率和成本。這預示著,中國AI產業正從單純的算力消費者,轉變為自主的生態建構者。這不僅是應對外部壓力的防禦性策略,更是中國科技產業邁向更高價值鏈的必然選擇。 (36氪財經)
寒武紀暴跌!來看看寒武紀以及崑崙芯這些⼤客戶近期的真實反饋與需求
今日市場出現比較大幅度的下跌,陳果今天群裡說:四個月慢牛後的一個快速急跌調整,沒有實質利空衝擊牛市邏輯(沒有類似四月的關稅衝擊利空),大機率後面還有新高,但一般來說這種調整之後結構上會有切換。這幾天外資的會議比較多,花旗和JPM科技、媒體和通訊會議正在進行,所有人的目光都聚焦於本周的科技與網際網路巨頭會議,所以最近的科技行業的調研以及報告也會非常多,我持續給大家更新。昨天開了一場關於國內晶片的電話會,邀請一位ASIC專家。下午還開了一場關於國內大廠AI的資本開支問題,我挨個給大家梳理:1、國內大廠開支近況•阿里:上半年怒砸30萬張H20訂單,結果只到貨22萬張,缺口全靠“海外代購”和算力租賃硬撐。自家PPU晶片(推理專用)還在持續推進中,但產能卡在中芯國際12nm工藝上,今年只能勉強產出2萬張。•海外採購:阿里、騰訊、字節囤GB200(輝達最新卡),但海外管道也緊俏,全年能拿到3萬張就算燒高香。•算力租賃:杭鋼、潤建等公司突然成了香餑餑,承包了30%的算力缺口,價格水漲船高。(畢竟租比買不到強啊!)關鍵矛盾:國產卡性能不夠,海外卡買不到,租賃成本高——大廠們集體陷入“算力焦慮”!2、再就是寒武紀和崑崙芯誰能上位?寒武紀:•字節是親爹,包圓了80%訂單(今年11萬張裡8萬張歸字節),阿里想插隊?抱歉,產能優先給“金主爸爸”。•性能短板:跑大模型MFU(利用率)只有70%,被昇騰(90%)吊打,但勝在軟體團隊“貼身服務”,專治客戶各種不服。•國產化版:年底推出中芯國際工藝的690晶片,性能打8折,價格卻不打折…(懂的都懂)崑崙芯(百度親兒子):•P800在字節、騰訊測試表現亮眼,性價比超輝達1.5倍,但主要用來跑小模型推理(比如視訊剪輯)。•訓練能力:目前唯一能訓練文心大模型的國產卡,但其他模型效果拉胯,被吐槽“偏科嚴重”。3. 未來風向:自研、租賃、出海“三件套”•自研加速:阿里放話“明年70%採購國產卡”,但中芯國際產能是最大瓶頸。(畫餅容易,量產難啊!)•算力租賃:潤澤、海南華鐵這些“二道販子”賺翻了,未來可能吃掉一半市場。•出海淘金:阿里、騰訊在墨西哥、中東狂建資料中心,理想、比亞迪的自動駕駛算力需求也在暴漲。4、最近大家關心的大模型DeepSeek V4/R2或合⼆為⼀於近期公佈1.版本迭代:•V3.1為過渡版本,效果被認為不如R1•V4/R2可能於10月發佈,重點改進文字窗口長度、程式設計能力和多模態支援(初級版)•多模態功能將基於早期實驗版本(Sora-like)進行簡單增強2.技術創新:•開發自訂UE8M0 FP8格式(非標準FP8),需下一代國產晶片原生支援•目前海光、摩爾等僅支援輝達標準FP8,崑崙芯、壁仞等需重新設計支援 (Alpha外資風向標)