瑞幸咖啡背後的晶片,藏不住了。
當你走進瑞幸咖啡店,點一杯生椰拿鐵的所有過程,例如下單、出杯、核銷、取餐……這一切的背後其實都有一雙“眼睛”在盯著。
在看什麼?
它要即時識別訂單、判斷製作節奏、校驗物料狀態、監控裝置運行,還要把資料同步回總部,用於品控、調度和營運決策。
這就是藏在瑞幸咖啡背後無數的邊緣側AI,它們有一個共性,那便是算力必須就近部署,響應必須足夠快,穩定性必須足夠強,成本還要可控。
晶片,成了其中關鍵中的關鍵。
就在今天,瑞幸背後晶片的廬山真面目終於浮出了水面——
來自一家剛剛完成上市不久的中國國產通用GPU公司,天數智芯。
前腳剛剛敲完鐘,時隔僅半個月時間,天數智芯便又一口氣發佈了四款邊端算力產品,彤央系列。
而且不只是發佈的動作,像瑞幸已經在用的邊端算力,正是彤央。
那麼這個系列的產品到底實力幾何,我們繼續往下看。
先來看名字。
彤央之名,源自商周青銅器銘文,但在天數智芯的內部,彤央有著別樣的寓意:
“彤”指向高能效計算能力,“央”則意味著在邊端場景中承擔核心算力樞紐的角色。
換言之,這是一個為真實業務現場而生的算力系列。
彤央系列的首發陣容,共包括四款產品:TY1000、TY1100,以及定位算力終端的TY1100_NX和TY1200。
先看彤央TY1000。
這是一個標準699Pin介面的模組,尺寸只有口袋大小,但在這個方寸之間,天數塞進了近200T的稠密算力。
在實際測試中,無論是典型的CV任務,還是NLP推理,甚至是對參數規模達到32B的DeepSeek-R1模型進行推理,以及具身智能VLA模型及世界模型等場景,TY1000在多項指標上都展現出不弱於主流國際方案的表現。
在天數智芯披露的測試資料中,TY1000在多類負載下的綜合效率,超過了輝達AGX Orin所對應的典型配置。
雖然這並不意味著全面替代,但至少證明了一件事:在邊端通用推理這個維度,中國國產通用GPU已經具備了正面對比的能力。
其次是彤央TY1100。
這款產品在架構上進行了進一步升級,採用了12核ARM v9架構CPU,並在系統級算力供給上更加充沛。
它面向的是對通用計算和AI推理都有較高要求的複雜場景,比如多感測器融合、邊緣資料預處理、即時決策等。
如果說TY1000更偏向算力核心,那麼TY1100則更像是一塊完整的邊緣計算底座。
接下來,是針對對視訊記憶體容量和性價比更加敏感使用者的TY1100_NX。
更大的視訊記憶體配置,使其在多模型平行、長序列推理等場景中具備更高的穩定性,同時維持了即插即用的部署方式,降低了系統整合門檻。
最後,便是彤央TY1200,則被天數智芯定義為算力終端。
它的算力規格提升到了300 TOPS,更重要的是,它是面向終端形態的整體方案。這類產品的目標使用者,並不只是演算法工程師,還包括希望直接把AI能力裝進裝置的行業客戶。
從產品組合上看,彤央系列並沒有走單點極致路線,而是刻意拉開了算力、形態和價格區間,覆蓋從算力模組到終端的不同部署需求。
但天數智芯並沒有把重點只放在晶片的參數上。
在生態層面,彤央系列在介面和形態上實現了與主流產品的Pin-to-Pin相容,大幅降低了客戶從既有方案遷移的成本。
這一點,對於已經有成熟系統的工業和商業客戶來說,幾乎是“是否願意嘗試”的分水嶺。
更重要的是,這些產品並不是為了發佈而發佈。
在機器人領域,彤央與格藍若機器人合作進入企業實際應用場景;在工業側,比依電器等製造企業正在用其進行裝置智能化升級;在商業零售場景中,瑞幸咖啡只是其中一個典型案例;而在交通領域,彤央系列也已經參與到多個車路雲一體化試點中。
當四個完全不同的行業場景,開始使用同一套通用GPU算力底座時,一個更大的問題隨之浮現:
天數智芯真正想做的,究竟是什麼?
如果只看彤央系列,很容易理解為一家中國國產晶片公司想要率先補全雲邊端的業務版圖。
但從其同樣於1月26日公開披露的架構路線圖來看,事情顯然沒有這麼簡單,在其業務大本營的雲端場景,天數有更野心勃勃的目標。
天數智芯並不滿足於中國國產替代這個階段性目標。在多次公開場合中,它都明確提到,自己的長期目標是對標乃至超越輝達這樣的行業標竿。
為此,天數智芯給出了一張明確到年份的架構路線圖。
2025年天數智芯推出的天數天樞架構,超越輝達Hopper。據瞭解,這已經不是規劃,而是現實:該架構支援從高精度科學計算到AI精度計算,AI晶片在執行注意力機制相關計算時,算力的實際有效利用效率達到90%及以上。
而測試資料顯示,天數天樞架構效率較當前行業平均水平提升60%,在DeepSeek V3場景平均比Hopper架構高約20%性能。
到2026年,天數天璇架構,新增ixFP4精度支援,對標Blackwell;天數天璣架構,實現全場景AI與加速計算覆蓋,超越Blackwell。
而在2027年,天數智芯規劃中的天權架構,則直接指向對Rubin架構的全面超越,重點融入更多精度支援與創新設計。
支撐這條路線圖的背後,還有一整套底層技術能力。
包括TPC Broadcast、Instruction Co-Exec、Dynamic Warp Scheduling在內的多項技術,構成了天數智芯在指令級平行、資源調度和算力利用率上的核心優勢。
這些能力,決定了它是否真的具備在通用GPU賽道長期演進的可能性。
那麼,天數智芯是否真的有這樣的實力?
一個直觀的判斷方式,是看通用性。
截至目前,天數智芯的通用GPU已經穩定運行400余種主流模型,並且強調Day 0適配能力;以DeepSeek為例,其在天數智芯平台上的適配和推理,已經成為客戶實際部署的一部分。
第二個維度,是商業化落地。
根據其公開披露的資料,天數智芯累計交付的晶片數量已經超過5.2萬片,服務客戶超過300家。
在實際應用中,網際網路AI客服的算力成本被壓縮了一半,而單機性能翻倍;金融行業的研報生成效率提升了約70%;在高要求的叢集場景中,其千卡規模叢集已經實現了超過1000天的穩定運行。
這些資料足夠耀眼,也足夠具體。
尤其值得注意的是,天數智芯在招股書中,對客戶數量、量產發貨規模、卡級毛利等核心指標進行了相對完整的披露。這種攤開來講的方式,在當前的中國國產晶片行業中並不多見。
也正是在這一點上,天數智芯與不少大廠自研晶片或專用NPU路線拉開了差距。
它選擇了一條更難、也更慢的路——堅持通用GPU路線,從架構、指令集、編譯器到軟體棧進行全端自研。這意味著沒有盲區,也意味著每一步都必須自己趟過去。
最後,回到瑞幸的那杯咖啡。
當中國國產算力開始真正進入千行百業,進入門店、工廠、道路和裝置,晶片不再只是發佈會上的參數,已然是業務鏈條中不可或缺的一環。
從這個角度看,此次發佈的意義,或許並不只在於發佈了四代架構圖,和四款邊端新品,而在於中國國產通用GPU,一邊抬頭,試圖超越行業標竿,並以更大的野心,嘗試面向無人區提出自己的路徑;一邊低頭,以一種更貼近現實的方式,不斷深入產業現場。
而這,可能才是天數智芯真正想證明的事情。 (量子位)