#GPU晶片
輝達緊急發聲!
輝達官方稱其技術領先行業一代,是唯一能運行所有AI模型並應用於所有計算場景的平台。周二(11月25日),輝達官方表示,其技術依然領先行業一代,是唯一能夠運行所有人工智慧(AI)模型並應用於所有計算場景的平台。分析認為,輝達此舉是為了回應華爾街對該公司在AI基礎設施領域主導地位可能受到Google晶片威脅的擔憂。輝達在社交平台X上發文稱:“我們對Google的成功感到高興——他們在人工智慧方面取得了巨大進展,而我們也將繼續向Google供貨。”“輝達領先行業整整一代——是唯一一個能運行所有AI模型、並在所有計算場景中部署的平台。”輝達補充道:“與專為特定AI框架或功能設計的ASIC(專用積體電路)晶片相比,輝達提供更高的性能、更強的通用性以及更好的可替代性。”此番表態發佈之際,有報導稱輝達重要客戶之一的Meta,可能與Google達成協議,在資料中心使用Google的張量處理單元(TPU)。受此影響,輝達股價日內一度跌超7%。上周,Google發佈了最新的大語言模型Gemini 3,多位業內權威人士認為其已經“超越”了OpenAI的GPT模型。該模型是使用TPU進行訓練的,而不是輝達GPU。分析師指出,輝達在AI晶片市場的份額超過90%,儘管Blackwell價格昂貴,但性能強大。不過,近幾周以來,Google的自研晶片作為Blackwell晶片的一種可行替代方案,受到了越來越多的關注。Google雲內部高管透露,擴大TPU的市場採用率,有望幫助公司搶佔輝達年收入份額的10%。不同於輝達,Google並不向其他公司出售其TPU晶片,但會將其用於內部任務,並允許企業通過Google雲來租用。Google發言人在先前一份聲明中提到:“我們對自研TPU和輝達GPU的需求都在加速增長。我們將一如既往地同時支援這兩種技術。”輝達CEO黃仁勳在本月早些時候的財報電話會上也談到了來自TPU的競爭。他指出,Google本身就是輝達GPU晶片的客戶,Gemini模型也可以在輝達的技術上運行。黃仁勳還提到,他一直與GoogleDeepMind的CEO德米斯·哈薩比斯(Demis Hassabis)保持聯絡。黃仁勳稱,哈薩比斯給他發簡訊表示,科技行業裡認為“使用更多的晶片和資料可以打造更強大的AI模型”的理論——也就是AI開發者常說的“規模化法則(scaling laws)”——依然成立。輝達認為,規模化法則將帶動對其晶片和系統形成更強勁的需求。 (科創板日報)
“中國輝達”,離上市只差臨門一腳
摩爾線程、沐曦站在上交所門口,距離IPO只有一步之遙。另外,多個信源顯示,包括壁仞在內的多家中國國產AI晶片也以保密形式在港交所提交申請表。“緊張,(發文)選在周四、周五,周末都過不好。”一位中國國產GPU公司內部人士的這句話,道出了當下所有衝刺IPO的“中國輝達們”的共同心境:臨近關鍵節點,他們幾乎無法放鬆。除了要應對複雜的上市流程和突發事件,他們還需面對機構、媒體和投資人的輪番追問:“什麼時候才有進展?”站在交易所門前,“中國輝達們”的一舉一動都被置於聚光燈下。相比於外部的熱情高漲,公司內部則更克制謹慎——IPO之路可以獲得源源不斷的“資金彈藥”,但也意味著將踏入更激烈的競技場,就像打怪通關,過完這一關緊接著就是下一關,每一步都必須小心謹慎,以確保順利站在交易所的交易大廳,完成階段性任務。接下來,中國資本市場將迎來“中國輝達們”的集體“會師”。最先登場的是一個個的造富故事;緊隨其後的,將是殘酷的市場競爭與洗牌。這一切都指向同一個終局——催熟中國國產算力。沐曦曦雲C550樣品01 闖關中國國產晶片企業IPO,牽動著企業、資本、政策與市場的多重神經。投資人關注更多的是投資收益和退出離場的機會。“GPU看了一圈,當時沒投,確實錯過機會了,”一位一級市場投資人說,“之前是覺得生態問題不好解決,晶圓生產能力也不足,不過沒料到中國資本市場這麼支援。這兩家上市的GPU公司,投資人應該還是會賺大錢。”對企業而言,IPO是既定安排,也是重要的外部輸血的新管道,這一趨勢也與一級市場調整有關。“美元基金在撤,大家的投資慾望在下降。”此前,一位資深投資人透露。根據清科研究的資料,今年前三季度外幣投資金額達到740億元,同比增長20%,這在一定程度上可以看作美元基金回流的階段性訊號,但是案例數增幅不多,總計276起,同比增長2%,相反人民幣基金更為活躍,大有成為耐心資本的勢頭,涉及投資案例8004起,同比增長23.6%。“中國輝達”等不起一級市場的“家人們”了。摩爾線程產品矩陣招股書顯示,摩爾線程5年間募集了超100億元資金,過去三年累計研發投入38.1億元,截至2024年年底,其帳面貨幣資金餘額為48.96億元。沐曦股份成立以來累計募資同樣超過百億,提交上市前的兩輪融資,規模更是達到了86.16億元。根據招股書的資料,過去三年多,沐曦累計研發投入約24.65億元。截至2025年3月末,其帳面貨幣資金餘額為56.95億元。業績方面,摩爾線程過去三年至今累計營收為13.10億元,而沐曦同期累計營收為11.16億元。成長期的“中國輝達們”,還無法實現“收入-研發-更多收入”的自循環,短期研發投入必須依賴外部持續輸血。一度是登頂A股市值榜的“寒王”,這個問題也沒有徹底解決。9月30日,寒武紀公告稱,向13家機構定向增發333.49萬股,募集資金39.85億元,擬用於面向大模型的晶片及軟體平台項目研發,以及補充流動資金。相比之下,輝達單季度營收400億美元以上,研發投入超過40億美元,相當於營收的10%,而AMD一個季度營收為76.85億美元,研發投入更是相當於營收的20%以上。一級市場在調整,“血量”也總歸是有限的,在未能形成自循環前,資金需求推著“中國輝達們”走向二級市場,尋找持續“燒錢”的機會。“摩爾沐曦上市募到錢,又可以燒錢了,”另一位一級市場半導體投資人強調說。在他看來,也有一些技術很好的企業,因為特殊原因錯過IPO的窗口。“燒錢是必須的,只是那家可以通過燒錢跑出來,對機構來說比較難判斷。”的確,闖關成功就有可能獲得更多的“資金彈藥”,但若失敗也有可能“失血而死”。這也是為什麼我們在一開始就強調,闖關IPO是一件緊張、刺激、充滿著不確定性的事。燧原科技的案例就非常典型,其近日官宣更換輔導機構重走上市流程,相較於其首次簽署IPO輔導協議,時間延後近一個季度。當然,還沒拿到IPO船票,不意味著完全沒有機會。“資料中心項目的中國國產化率指標,能夠幫助這些中國國產晶片短期生存。”一位私募投資人說。以上都是基於業績、業務的邏輯,但如果從打造標竿的角度看,先人一步上市,不確定性就會少很多。“我覺得上市的需求,已經不來自企業自身了。”一位資深科技政策研究員說。在他看來,相關上市安排的目的就是做標竿、做引領、做示範,是在向市場打明牌,明確未來鼓勵發展的主方向就是科技和與之相應的產業落地。不管出於何種目的,沒有人希望在這個過程中出現意外的插曲。“監管非常在意負面輿情,尤其是一些公司相關的不實消息。”一位有過IPO經歷的從業者透露,在上市過程中,很大一部分工作就是處理輿情。闖關IPO是“中國輝達們”的必經之路,但也要注意:IPO只是“中國輝達們”通關打怪過程中的一個關卡,只不過在一級市場調整,算力爭奪戰等背景下,關注度被無限放大。“這麼多GPU,上市不是終點,誰能真正活下來,還要看整體生態的建構。”前述資深投資人在說。02 造富2020年,寒武紀在上交所敲鐘,左一為陳天石敲鐘前,刺激來自於“保上市”過程中的不確定性。敲鐘後,這種刺激則來自於上市後的造富神話。5兆美元市值的輝達,擁有許多版本的造富故事。今年1月份,投資人Ruben D在領英上分享了輝達員工的財富情況,稱輝達78%的員工身價超過百萬美元,其中一半員工的淨資產達到2500萬美元。騰訊科技在2025,黃仁勳“三顧大陸”,與雷軍親密合影中也披露過,輝達每年都會向有突出貢獻的員工發放“CEO特別獎”,近年來名額還在增多,但“獎金”數量相應有所減少。造富的路上,讓財富故事更加充滿戲劇性的是市值不斷攀升的同時,拆股帶來的放大效應。也正因為這种放大效應,在社交媒體上偶爾會曝光出千萬元以上的納稅單。社交媒體上使用者分享的疑似輝達員工個稅申報資訊,僅供參考按照公開資訊,2021年7月和2024年6月,輝達先後進行了“1拆4”和“1拆10”,這意味著在2021年獲得公司100股股票激勵(當時價值超過7.5萬美元),如果一直持有至今,這筆股票激勵將超過80萬美元。相比輝達版本的造富故事,在和多位中國國產晶片公司員工交流之後,得到的口徑出奇的一致——最開心的是老闆,其中既有入職時間的問題,也涉及到中國國產晶片公司激勵制度的問題。根據摩爾線程招股書,64%的員工持有公司股份。沐曦的招股書中則提到,2022年至今累計支付股權激勵費用5.9億元,按照700名員工全員持股的情況估算,人均獲得股票激勵價值近78萬元。更早之前上市的寒武紀,今年二季報中提到過,2025年上半年股權激勵費用為1.12億元。同時,當季還完成了對2023年發放的一筆股權激勵的歸屬工作——650名骨幹員工(近半數)合計近243萬股到帳,按8月26日發行價計算,總價值32億元。從這個角度來看,中國國產晶片公司IPO給普通員工帶來的財富效應需要時間沉澱,股票激勵隨著業績逐步兌現,才會釋放出來。投資人可以退出,公司能夠獲得輸血,員工財富有望增值,產業成熟度將被進一步催化,這些都要求“中國輝達們”,在IPO的路上行穩致遠。摩爾線程申報科創板IPO時,一位內部人士曾透露,他們希望儘量避免被簡單標籤化為“中國輝達”、“中國國產GPU第一股”。一方面,在申報階段更傾向於保持低調;另一方面,作為一家年輕公司,現在仍處於發展早期,有很長的路要走。低調、謹慎在沐曦身上也有反映——其核心團隊來自AMD,但對外的傳播上,也都在極力避免與AMD、輝達關聯。內部冷靜與外部投資人的熱情,形成鮮明對比。考慮到矽谷公司股價的持續上漲,寒武紀一度登頂A股市值榜,估值只有幾百億元的“中國輝達”,想像空間一下就會被打開,二級市場的投資者也會更願意去助推一把。“市場情緒比較高,現在但凡新股上市翻倍機率都比較大,(AI晶片)這種廣受關注的標的就更是了。”前述科技政策研究員說。03 接盤今年黃仁勳三次來華,第四次預計不久之後也將成行。不過,現階段輝達在中國大陸的資料中心市場,已經處於“無貨可賣”的地步,結果就是增量份額幾乎為0。黃仁勳今年第三次來華時身著唐裝出席“鏈博會”並行表演講黃仁勳至少有四次公開表達過類似觀點——“輝達在中國市場份額為0”、“希望向中國客戶銷售輝達晶片”。輝達的難題,恰恰是中國國產AI晶片企業的“接盤”機會。根據行業的消息,寒武紀已經與字節深度繫結,同時也在開拓阿里等更多公司的客戶。背靠百度的崑崙芯,今年也中標了招商銀行、中國移動的大單,尤其是後者訂單達到10億等級。摩爾線程、沐曦,今年開始業績也都有大幅度的兌現。從行業反饋的情況來看,即便是‘閹割版’輝達晶片,做互聯叢集、跑模型相對簡單。一位產業研究員強調,“但是沒有輝達,大家都會舒服很多。”不過,增長並不完全來自於輝達的暫停。很多關鍵領域,即便獲得出口許可,輝達也無法實現突破——由於中國國產化的指標存在,這部分市場只有“中國輝達們”才能接觸得到,這也是一項非常得天獨厚的優勢。很簡單,美國的關鍵基礎設施,一樣很難允許中國供應商的存在。對“中國輝達們”而言,還有一個關鍵的機遇來自於AI推理的爆發式增長。根據OpenAI公佈的資料,其Tokens日呼叫量達到8.6兆,GoogleGemini的Tokens日均呼叫也已經超過10兆等級。巨量的Tokens消耗,依賴算力基礎設施的擴張。矽谷公司基礎設施上的資本開支在急劇擴張,其中僅OpenAI一家,就已經到了“誰有買誰”的地步,這其中既包括微軟的算力,也包括聯合甲骨文等合作的星門算力,還包括AMD的合建算力,以及Google的TPU、亞馬遜的AWS以及博通的定製算力等等。“推理就是堆卡的數量,訓練才要卡的質量。”前述產業研究員說。儘管“泡沫”的呼聲越演越烈,需求無限制的膨脹的步伐並未因此停下腳步。大洋彼岸的矽谷公司在爆買算力的同時,中國AI企業對算力的需求一樣會同步增長。推理時代,“中國輝達們”將會迎來最好的增長機會。04 混戰基於模型的矽谷AI公司,打的是一場算力需求戰爭,而“中國輝達們”打的則是一場算力供給戰爭。如果從單一產品的維度來看,中國國產AI晶片追趕的速度並不慢。根據半導體綜研整理的資料,中國國產晶片絕大部分FP16算力都在300TFLOPS左右,具體為:寒武紀思元590(314.6TFLOPS)、海光BW100(350TFLOPS)、平頭哥含光800(205TFLOPS)、沐曦曦雲C500(240TFLOPS)、壁仞BR104(512TFLOPS)、壁仞BR100(1024TFLOPS)。世界人工智慧大會上展出的昇騰384超節點機櫃上述產品基本還都是各家上一代的解決方案,接下來的產品性能可以追上輝達多少,更值得關注。除了在單晶片上追趕,中國國產算力還在嘗試通過超節點的方式進行擴展。自去年華為率先代表中國廠商提出了基於昇騰910C的CM384超節點以來,包括崑崙芯、阿里平頭哥都相繼展出了超節點方案,試圖通過叢集的性能,來彌補單晶片的差距。通過機架內向上擴展做超節點,好比“力大磚飛”,雖然解決了單晶片算力,但互聯也非常關鍵,只不過目前這塊中國市場處於相對割裂狀態——華為是UnifiedBus、阿里是ALink、崑崙芯則是XPU Link。一位算力分銷商認為,短期內各種協議統一的可能性並不大。“中國8卡伺服器居多,現在超節點量還很少,推動統一投入產出比不高。另一方面, 由於都是直接競品,很難推動一家企業採用另一家企業的私有協議。”在這種背景下,誰的互聯技術更高效,也是贏得市場的關鍵優勢之一。“算力牌桌”席位爭奪除了依賴技術研發,也需要大量的市場推廣,這也是必須“燒錢”的一部分。沐曦的招股書中提到,2024年度銷售費用1.16億元,今年前三季度3500萬元。“軟硬結合的適配性還有問題,每賣一套都要去幫忙“搓算子”做偵錯等,需要工程團隊去現場支援,而叢集的佈置也要“卡廠”的人去搞。”前述產業研究員說。關於具體的適配,既要考慮CUDA相容,也要考慮中國國產硬體適配,就需要進行程式碼調整,前述算力分銷商強調。在頭部競品“轉身”之前,類似市場和銷售費用是確保坐在牌桌上不得不做的部署,這也推高了中國國產晶片上市的緊迫性。前述產業研究員說,“現在ASIC架構產品下游接受度始終不高,小fabless還有競爭機會,如果能把特定的算力需求場景鎖定下來那就做活了,但如果華為的GPGPU上來前,還沒能在牌桌上打出優勢,就很危險了。”對此,一位前大廠戰投部門分析師強調,大家都希望有備選算力,所以收斂不會那麼快,“估計收斂也是3-5年後的事了。”總體來說,看中國國產GPU的邏輯,本質還是看產品:其一,到底做出來單卡性能;其二,看叢集性能以及下游能不能用起來 ;其三,在擁有訂單的基礎上,決定性的因素就是產能。按照中國國產高端型號單卡平均8萬元的價格來計算,100億的營收需要12.5萬張GPU卡,如果GPU die面積為600mm²,而按照50%的良率來計算,單片晶圓可以產出44顆GPU Die,換算一下,也就是要做到12.5萬張GPU至少需要2840片晶圓。也就是說,100億營收需要2840片晶圓,50億營收、20億營收分別需要1500片和600片左右的產能。當然,在“AI泡沫論”的隱憂之下,“中國輝達們”的成長,也要看AI這個故事能不能持續的講下去,或者說上游的戰果,取決於下游的戰爭。從目前的情況來看,OpenAI、Anthropic這些公司都還沒有賺錢,尤其是爆買超過30GW算力的OpenAI,年收入也才130億美元,甚至是連單季度收入500多億美元的Meta,都不得不通過設定金融工具,以發債的形式來獲取算力:大家都想要算力,但太貴了,而且有些人還沒賺錢。“海外邏輯很順,Meta(電商轉化)已經跑通,但中國有量無價,B端落地有限,C端那些收費估計覆蓋不了成本。”一位行業分析師說。本季度,AI推薦系統幫助Facebook使用者時長同比增長5%,Threads增長10%,AI購物助手Rufus活躍使用者2.5億,使用者購買轉化率提升60%。“提升都還挺顯著的。”上述分析師說。所以,只有下游的模型賺錢了,上游的算力和基礎設施服務商這些“賣水人”才能乘勢而上。但最終,誰能從這個過程中跑出來,就看誰的資金彈藥更多了。寒武紀所在地,北京知春路致真大廈過去幾周,我們拜訪了一些中國國產AI晶片企業,各家基本都有提到一個關鍵詞:“擴張”。關於擴張的一個典型的變化就是工區和樓層的增加,有的從一層加到三層,有的從四層加到五層。不論如何,規模的擴展,算得上是一個積極的訊號。“買地造樓”是矽谷巨頭們來時的路,也將是“中國輝達們”未來的路。 (芯師爺)
關稅影響!第二季度全球GPU晶片銷量激增27%!
全球顯示卡市場在2025年第二季度出現異常波動。最新行業資料顯示,當季GPU顯示卡銷售量同比大幅增長27%,創下近年來單季度最大漲幅。市場分析指出,這一反常現象主要源於市場對即將實施的新關稅政策的預期反應。行業報告顯示,顯示卡採購熱潮集中在季度後期,與相關政策消息發佈的時間點高度吻合。管道商和系統整合商擔心未來成本上升,紛紛提前加大採購規模,導致短期內市場需求異常激增。這種提前採購行為在業內被稱為"關稅前搶跑"現象。細分資料顯示,中高端顯示卡產品需求增長最為明顯,漲幅達到35%。這反映出遊戲玩家和專業使用者對產品價格敏感度較高,更傾向於在預期漲價前完成採購。與此同時,整機廠商也加大了顯示卡庫存備貨量,進一步推高了市場需求。市場觀察人士指出,這種短期需求激增可能對後續市場產生透支效應。預計第三季度起,顯示卡銷量可能出現周期性回落。此外,供應鏈方面也面臨壓力,主要晶片廠商正在調整產能分配以應對短期需求波動。長期來看,顯示卡市場仍將保持穩定增長態勢。隨著遊戲畫質要求提升和AI應用普及,GPU需求基本面依然強勁。業內人士建議,供應鏈各環節應建立更靈活的庫存管理機制,以應對可能出現的政策波動和市場變化。目前,主要顯示卡製造商正在評估產能調整方案,同時加強與管道夥伴的協同,以確保市場供應穩定。行業專家認為,此次事件凸顯出全球電子產業鏈對政策變化的高度敏感性,建立更具韌性的供應鏈體系將成為行業重要課題。 (晶片行業)
騰訊硬氣回應!GPU 庫存管夠不買輝達 H20,非西方晶片 + 效率翻倍破算力困局
騰訊硬氣回應!GPU 庫存管夠不買輝達 H20,非西方晶片 + 效率翻倍破算力困局8 月 17 日,一則來自騰訊的重磅回應!直接給全球晶片市場投下驚雷 —— 面對輝達 H20 對華 “開閘” 的所謂 “紅利”。騰訊總裁劉熾平在財報電話會議上斬釘截鐵:庫存充足,暫不採購! 這波不按常理出牌的操作。不僅打了 “卡脖子” 論調的臉,更撕開了中國科技企業破局算力困局的硬核答卷。誰能想到,當外界還在猜測 “美國鬆口後國內企業會不會瘋搶 H20” 時,騰訊早已手握底牌。劉熾平直言,騰訊當前的 AI GPU 晶片庫存,是連續三個季度 “囤貨” 的成果,足夠支撐未來模型訓練的所有需求,根本無需依賴新增進口。這意味著,在中美科技博弈的關鍵節點,騰訊率先跳出了 “被動等待進口” 的陷阱,用實打實的庫存底氣,掌握了算力主動權。更狠的是,騰訊早已備好 “後手”。針對 AI 推理這一核心場景,騰訊直接宣佈 “轉向非西方晶片”—— 境內合法的 ASIC、GPU 等加速器已進入評估落地階段,徹底打破對單一海外晶片的依賴。與此同時,騰訊還在 “向內挖潛”:通過軟體最佳化,目標將 AI 推理效率直接翻倍,這相當於 “不買晶片也能多出一倍算力”,用技術實力把 “算力焦慮” 碾得粉碎。而輝達 H20 的 “尷尬處境”,更讓騰訊的選擇顯得尤為明智。7 月網信辦剛就晶片漏洞風險約談輝達,國內企業採購態度已全面趨嚴,H20 至今未通過中國政府安全認可。在安全紅線面前,騰訊果斷選擇 “不碰風險”,既守住了資料安全底線,更展現了中國科技企業 “不被卡脖子” 的硬氣。從 “庫存管夠” 到 “多元破局”,從 “效率翻倍” 到 “守住安全”!騰訊這波操作,不僅是企業自身的算力佈局,更給中國科技行業打了一劑強心針:面對外部不確定性,只要提前佈局、技術過硬、守住底線,就能把算力主動權牢牢握在自己手裡! (洞察3C前沿)
小米芯反超蘋果芯!OPPO花100多億沒幹成,小米幹成了
5月22日晚,小米玄戒O1晶片正式發佈。原本曝光的資訊已經足夠驚人,沒想到現場展示更加震撼。在小米官方給出Geekbench 6測試中,玄戒O1 CPU單核跑分超過3000,多核跑分超過9500。與之對比,蘋果旗艦晶片A18 Pro單核跑分略有領先,但多核跑分卻不如玄戒O1。GPU跑分方面,在曼哈頓3.1等多個測試中,玄戒O1都大幅領先A18 Pro。要知道,小米從2021年初決定造車時,才重新開始研發手機SoC。四年多時間,截止今年4月底,玄戒累計研發投入超過135億人民幣,目前研發團隊超過2500人。這不禁讓人質疑起了此前「造芯需千億投入」的說法。同時,很多人將小米玄戒與OPPO哲庫做起了對比,同樣是手機廠商,同樣是重金投入,為何一個失敗一個成功。01 造芯不再九死一生 小米聯想都造芯成功我們平時說的手機「造芯」,一般是指最核心的SoC晶片,它就像手機的 「大腦總成」,理論性能啥樣基本全看它。SoC說白了就是把一堆不同功能的小模組,整合在一塊晶片上。比如大家常聽說的CPU(資料處理)、GPU(圖形處理)、ISP(圖像處理)、NPU(負責AI)。華為、高通等老牌通訊大廠,可以將5G基帶也整合在SoC中。蘋果和小米這些手機廠商,缺少這方面的技術,只能外掛高通、英特爾和聯發科的5G基帶。直到iPhone 16e,蘋果才用上自研基帶C1,但還是外掛。現代晶片設計,主要是功能模組的系統整合,並非從零開始的重新發明。普遍採用IP(智慧財產權)復用模式,即將經過驗證的成熟模組作為基礎,如ARM提供的CPU和GPU核心,通過加入專用處理邏輯和介面電路實現差異化功能。這種模式就像用預製構件建造房屋,既能大幅降低研發成本,又能縮短產品上市周期。而同樣是採用ARM的IP,相比十幾年前華為研發麒麟晶片,如今小米研發玄戒O1的難度要大幅降低。彼時,全球晶片設計工具(EDA)和ARM的IP生態,遠不如今日成熟,國產手機晶片市場也幾乎為空白。華為作為先行者需要從零開始搭建設計團隊、最佳化EDA流程,並與代工廠建立深度合作關係。雖然華為購買了ARM的IP,但需要自行進行深度最佳化以適配手機需求。尤其是基帶部分,涉及複雜的通訊協議棧,華為投入巨資自研巴龍基帶。小米則站在「巨人的肩膀上」,依託行業成熟人才和技術資源,利用更先進的EDA工具、豐富的ARM IP資源,以及台積電成熟的3nm製程工藝。玄戒O1採用外掛聯發科5G基帶,避免了自研5G基帶的高難度技術挑戰。簡單點說,當年自研晶片是「九死一生」,幾十億砸下去可能連個水花都看不到,所以會有「造芯需千億投入」的說法。如今,自研晶片難度依然很大,燒錢且試錯成本極高,但不再是遙不可及,小米投入135億能打造出玄戒O1,很多公司也推出自研晶片。5月20日,聯想推出了一款AI大平板,搭載其首顆自研晶片SS1101,也採用十核CPU架構,GeekBench 6跑分單核超2000、多核超6700,基本是天璣8400水平。蔚來、寒武紀、地平線等公司,通過聚焦特定領域(如自動駕駛晶片),同樣拿出了自研晶片。當然,能造芯是一回事,晶片性能超過蘋果A18 Pro則是另外一回事。其中固然有ARM IP的功勞,但小米這個晶片團隊也真的很厲害。02 小米玄戒成功了 OPPO哲庫為何失敗在小米玄戒取得成功後,不少人對OPPO哲庫感到惋惜。2019年,OPPO成立哲庫開啟造芯計畫,曾拿出一款影像NPU晶片,和一款藍牙音訊NPU單元,但在2023年5月,哲庫突然被關停。為什麼小米拿出玄戒O1,哲庫卻失敗了?OPPO官方的解釋是,面對全球經濟、手機市場的不確定性,經過慎重考慮,公司決定終止哲庫業務。哲庫成立後的幾年,正是全球手機市場下行階段,OPPO自身出貨量也不斷下滑,現金流承壓。據IDC統計,2022年全球智慧型手機出貨量同比下滑11.3%,OPPO更是大跌22.7%。有媒體測算,包括團隊薪酬、產品流片測試、晶片代工在內,哲庫開支也超過100億元。與之對比,小米重啟造芯是在2021年初。那會兒華為手機進入至暗時刻,小米手機海內外銷量開始暴增,一躍成為全球出貨前三。小米2024年財報顯示,其營收和利潤都創下新高,分別同比增長35%和41.3%。現金儲備更是來到驚人的1751億元,足以支撐造車和造芯雙線投入。因此,小米制定了長期持續投資的計畫:至少投資十年,至少投資500億,穩打穩紮,步步為營。在財務不如小米寬裕的情況下,OPPO的雄心卻要比小米更大。哲庫成立之初,便佈局好ABCR四大研發中心。A中心研發手機應用處理器AP晶片,也就是一顆SoC去掉外掛基帶的部分。B中心研發BP,也就是基帶晶片。C中心研發無線藍牙晶片,R中心研發射頻晶片。基帶開發是行業難題,連蘋果也依賴高通和英特爾好些年,才在iPhone 16e上拿出自研基帶C1。OPPO上來就要打BOSS,還同時打好幾個,難度太高。小米這邊要穩健多了。因為有當年澎湃S1/S2的經驗教訓,明確「只做高端旗艦SoC」的目標,把精力都放在AP晶片上,基帶方面先與聯發科合作。在哲庫關停後,其首席SoC架構師Nhon Quach,曾在社交媒體發文,表示第二代SoC架構設計工作,在2022年年中就已基本完成。原本有望在2024年第一季度前,搭載台積電第一代3nm工藝下線。但就算這塊SoC成功商用,也很難憑藉大量出貨來攤薄成本。3nm晶片目標客戶為Find系列高端機型,可過去幾年,OPPO高端智慧型手機銷量都在千萬量級以下,難以覆蓋研發、IP、流片等成本。與之對比,小米高端智慧型手機銷量,在2022年後穩步提升,小米SU7熱銷也助力小米15系列取得不錯的成績。同時,小米汽車項目已經啟動,AloT裝置版圖也成型了。玄戒O1不僅可以用在手機和平板上,還有望用在車機等各種裝置上。而時間窗口與地緣政治,亦影響了兩家企業的命運。OPPO哲庫解散的2023年,正值全球半導體供應鏈動盪期,美國對華技術限制加劇,加上手機市場需求疲軟,企業更傾向於保守策略。小米玄戒O1的發佈,恰逢2025年行業復甦周期,且中國大陸半導體製造工藝逐步成熟,降低了供應鏈方面的風險。整體來說,小米的成功得益於長期主義、生態協同與對專利壁壘的靈活應對;而OPPO的失敗則源於冒進擴張、財務壓力與外部環境突變。正如行業分析師所言:「造芯是一場沒有退路的豪賭,唯有將資金、人才與戰略耐心轉化為技術護城河,方能成為最終倖存者。」03 玄戒O1將面臨的幾個難題小米玄戒O1的誕生,是中國手機廠商,在高端晶片領域的重大突破,其技術突破值得肯定。但把時間拉長,這也只是小米造芯萬里長征的第一個勝利,搭載該晶片的產品上市後,仍需面對產能、生態適配、供應等多重挑戰。儘管台積電第二代3nm工藝良率,已接近成熟的5nm水平,但產能仍高度緊張。蘋果、高通、輝達等頭部客戶,已提前鎖定大部分產能,小米作為新進入者能拿到的產能有限。玄戒O1的性能釋放,也依賴軟體生態的深度最佳化。小米澎湃OS 2.0雖已針對該晶片進行專項調校,但Android陣營的碎片化問題,可能導致部分應用無法充分發揮晶片性能。而面對已經捲了十多年的手機處理器市場,小米如何在已有高通和聯發科的情況下,做出有競爭力的產品,才是最大的難點。就看搭載玄戒O1的兩款新品——5499元起的小米15S Pro、5699元起小米平板7 Ultra的銷量了,不知道會不會有驚喜。 (奇偶工作室)
DeepSeek最新模型顛覆數學推理! R2參數或將達1.2兆,徹底擺脫輝達GPU晶片
萬萬沒想到,DeepSeek五一假期間有了新動作。4月30日晚,AI開源社群Hugging Face突然湧入百萬流量。中國AI公司DeepSeek悄悄上線的DeepSeek-Prover-V2模型。這款參數規模達6710億的數學推理大模型,不僅以「核彈級」參數量刷新開源領域紀錄,更在數學定理證明任務中交出驚人成績單:MiniF2F測試通過率88.9%,遠超同類模型,甚至解決Putnam數學競賽中49道高難度題目378。更令開發者興奮的是,DeepSeek此次同步開源了7B和671B兩個版本。其中,671B版本基於DeepSeek-V3-Base架構打造,支援16.38萬tokens超長上下文,可處理複雜數學證明鏈條;而7B版本則擴展至32K tokens上下文長度,兼顧推理效率與性能246。DeepSeek R1帶來了「啊哈時刻」,Prover-V2也有令人意想不到的能力。具體來說,在普特南測試中,參數量較小的DeepSeek-Prover-V2-7B用非CoT生成模式成功解決了13個671B模型未能解決的問題。這一組合拳下來,直接將數學推理大模型的戰場推向新維度。DeepSeek-Prover-V2到底是什麼?一句話總結就是:一款專為「數學AI程式語言」Lean4打造的開源大語言模型,專注於形式化定理證明。Prover-V2透過融合非形式化推理與形式化證明,推動AI從「內容生成」向「邏輯驗證」跨越,被視為通往通用人工智慧(AGI)的重要進展。重點君剛到Hugging Face看完了文章原文,跟大家總結一下:1 、DeepSeek-Prover-V2DeepSeek-Prover-V2 671B版本是前代7B車型的近百倍升級版。該模型專注於形式化數學推理,支援產生符合Lean 4等證明助手的嚴謹邏輯程式碼,旨在解決從初等數學到高等數學的複雜定理證明問題。2 、核心技術亮點混合專家架構(MoE):基於DeepSeek-V3架構,每層包含256個路由專家和1個共享專家,每個輸入token僅啟動8個專家,顯著提升運算效率。支援FP8、BF16、F32等計算精度,最佳化訓練和推理資源消耗。遞迴+強化學習訓練策略:冷啟動資料合成:利用DeepSeek-V3拆解複雜定理為子目標,由7B模型產生子目標的Lean 4證明,再組合為完整證明鏈。強化學習最佳化:透過GRPO演算法從32種候選方案中擇優,結合「正確/錯誤」回饋提升推理泛化能力。超長上下文處理:支援最長163840 tokens的輸入窗口,適配多步驟、長邏輯鏈的數學證明任務。3 、具體性能表現MiniF2F-test :通過率達88.9%,解決PutnamBench中49道高難度題目。形式化證明能力:在Lean、Isabelle、Coq等系統中表現優異,如Lean4基準測試通過率89.2%,遠超通用模型(如GPT-4o的63.4%)。ProverBench資料集:包含325題目,涵蓋AIME競賽題(15題)及初等代數、微積分等教材題(310題),系統性評估模型推理能力。4 、應用場景數學研究與教育:輔助數學家驗證猜想、產生詳細證明步驟,或作為教學工具分解複雜定理。形式化驗證:應用於軟體正確性驗證、密碼學協議安全證明及硬體設計規範驗證。工程與科學計算:支援物理模型數學基礎驗證與演算法正確性證明。如果需要更多技術細節,大家可以點選原文連結,一鍵傳送:DeepSeek-Prover-V2-7B 連結:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-7BDeepSeek-Prover-V2-671B 連結:https://huggingface.co/deepseek-ai/DeepSeek-Prover-V2-671B另外,一直備受關注的DeepSeek R2也傳出最新消息。根據媒體通報,R2大模型將採用更先進的混合專家模型(MoE),總參數量較前代R1提升約1倍,預計達1.2兆(R1總參數量為6710億),單位推理成本較GPT-4大減97.4%。R2規模與ChatGPT的GPT-4 Turbo以及Google的Gemini 2.0 Pro相當,也將結合更智慧的門控網路層(Gating Network ),進而最佳化高負載推理任務的效能。消息指出,R2將徹底擺脫NVIDIA晶片,訓練全程均未使用NVIDIA顯示卡,全部基於升騰910B(Ascend910B)晶片叢集平台,在FP16精度下,計算性能達到512 PetaFLOPS,晶片利用率高達82% ,整體性能約為NVIDIA上一代A100叢集A100 。市場預期,這可望降低中國對海外高階AI晶片的依賴,華為全新的升騰910C晶片也開始進入大規模量產階段。 (劃重點KeyPoints)
輝達、AMD,開始在美國生產晶片
在美生產,台積電為其代工。輝達官方宣佈,第一次在美國本土製造其Blackwell GPU晶片,並第一次打造完全在美國本土製造的AI電腦。輝達計畫在未來四年內在台積電等合作夥伴的幫助下在美國建設價值高達 5000 億美元的人工智慧基礎設施。在聲明中表示,NVIDIA已經與夥伴聯合建設了面積超過100萬平方英呎(約9.3萬平方米)的晶片工廠,其中台積電開始在亞利桑那州製造、測試Blackwell晶片,Amkor、SPIL在亞利桑那州進行Blackwell的封裝、測試。富士康、緯創分別在德克薩斯州的休斯敦、達拉斯,同步製造基於Blackwell晶片的AI超算。黃仁勳在聲明中表示:“增加美國製造業有助於我們更好地滿足對人工智慧晶片和超級電腦驚人且不斷增長的需求,加強我們的供應鏈並提高我們的彈性。”未來12—15個月,美國製造的Blackwell晶片和AI超算都會陸續投入大規模量產。NVIDIA透露,這些工廠會使用NVIDIA先進的AI人工智慧、Isaac GROOT機器人、Omnivere數字孿生等技術。5000億美元這個數字指的是輝達預計將向人工智慧供應鏈銷售的所有產品的總價值。在很大程度上,這個數字反映了各大雲端運算公司致力於建設和升級資料中心,並採用最新裝置的承諾。包括微軟公司、亞馬遜公司和Meta,預計今年將在人工智慧設施和計算資源上花費 3710 億美元,比去年增長 44%。Nvidia 還表示,此舉將標誌著美國首次生產人工智慧超級電腦,美國總統唐納德·川普周一對這一進展大加讚賞。川普在白宮露面時表示,輝達是因為關稅問題而做出這一決定的。“這是你們聽過的最大公告之一——因為眾所周知,輝達幾乎控制著整個行業。”他說道。與美國其他大型科技公司近期在美國做出的投資承諾一樣,輝達的這筆支出也包含了一些已經在進行的計畫。不過,City Index 分析師菲奧娜·辛科塔 (Fiona Cincotta)表示,這仍然代表著總統議程的勝利。“這就是川普的目標,”辛科塔表示。“這正在把製造業遷回美國,這正是川普的承諾。”輝達股價在公告發佈後最初上漲,隨後回吐漲幅。截至上周末,該股今年迄今已下跌17%,市場暴跌對科技股的打擊尤為嚴重。每塊 Nvidia Blackwell 晶片售價數萬美元,包含這些半導體的伺服器更是價值數百萬美元。即便如此高昂的價格,價值 5000 億美元的 AI 硬體也代表著海量的資料——可能包含數十萬台 AI 伺服器。包括晶片製造商在內的全球電子產品製造商正因川普政府不斷變化的關稅政策而感到不安。上周末,川普承諾仍將對手機、電腦和熱門消費電子產品徵收關稅,並淡化周五發佈的豁免政策只是他重塑美國貿易整體努力中的一個程序性步驟。自川普當選以來,從蘋果公司到禮來公司等眾多公司都宣佈計畫斥資數十億美元,增強其在美國的製造業務。其中許多計畫在大選前就已在籌劃,或與之前的支出趨勢密切相關。AMD在美國生產2nm晶片,台積電代工同時,AMD宣佈已獲得其首款 2 奈米級矽片——核心復合晶片 (CCD),用於其第六代 EPYC “Venice” 處理器,預計將於明年推出。Venice CCD 是業界首個採用台積電 N2 製程技術流片的 HPC CPU 設計,凸顯了 AMD 積極的產品路線圖以及台積電生產節點的準備就緒。AMD 的第六代 EPYC“Venice”預計將基於該公司的 Zen 6 微架構,並預計將於 2026 年左右推出。這款 CPU 將採用台積電 N2(2 奈米級)製程生產的 CCD,因此該公司即將在工廠生產首批 Venice CCD。然而,AMD 已經擁有可以公開談論的晶片,這一事實凸顯了 AMD 與台積電之間長期的合作關係,以及雙方在台積電迄今為止最先進的製程技術之一上共同打造晶片的努力成果。目前,AMD 尚未討論其 EPYC“Venice”處理器或 CCD 的細節,但該公司的新聞稿聲稱矽片已經流片並投入使用,這意味著 CCD 已成功啟動並通過了基本的功能測試和驗證。AMD 首席執行官蘇姿丰博士表示:“台積電多年來一直是我們的重要合作夥伴,我們與其研發和製造團隊的深度合作,使 AMD 能夠持續提供突破高性能計算極限的領先產品。成為台積電 N2 製程和台積電亞利桑那 Fab 21 的領先 HPC 客戶,是我們緊密合作、推動創新並提供驅動未來計算的先進技術的典範。”台積電的N2工藝是其首個基於環柵(GAA)奈米片電晶體的製程技術。該公司預計,與上一代N3(3奈米級)相比,該製程技術將使功耗降低24%至35%,或在恆壓下提高15%的性能,同時電晶體密度也將提升1.15倍。這些提升主要得益於新型電晶體和N2 NanoFlex設計技術協同最佳化框架。此前,AMD 的主要競爭對手英特爾已將採用 18A 製造技術(將與台積電的 N2 競爭)生產的下一代 Xeon“Clearwater Forest”處理器的發佈時間推遲到明年上半年。另外,AMD 宣佈已成功驗證了由台積電在其位於亞利桑那州鳳凰城附近的 Fab 21 工廠生產的第五代 EPYC 處理器的矽片。這意味著該公司部分當前一代 EPYC CPU 現在可以在美國生產。台積電的美國客戶們去年11月,美國宣佈向台積電提供66億美元的補貼、50億美元的貸款,支援其在美國投資650億美元,建設三座先進的晶圓廠,初期投產4nm工藝,未來將生產2nm甚至更先進工藝。今年3月初,台積電CEO魏哲家在美國白宮宣佈,將在美國追加投資1000億美元,總額因此高達1650億美元。這筆新的投資將用來建設三座晶圓廠、兩座封裝廠、一座研發中心,有望創造超過2萬個工作崗位,蘋果、AMD、NVIDIA、高通都是其客戶。 (半導體產業縱橫)