騰訊七年磨一芯

2026/05/30

•

5月26日，騰訊贏了一場和輝達、AMD、英特爾同台的比賽。

作為一項辦了20多年的權威評測，莫斯科國立大學（MSU）的視訊編碼比賽與Google、英特爾、輝達、AMD等晶片大廠保持評測合作或長期往來，是該領域少數被業界公認的"裁判席"，業內把它視作硬體視訊編碼的"奧林匹克"。

今年的硬體視訊編碼比賽有41款硬體編碼器參賽，覆蓋H.264、H.265、AV1、H.266全部主流標準。

騰訊自研編解碼系列晶片"滄海"，在30fps、60fps、120fps、240fps四個速度檔位、所有評測指標（SSIM、PSNR、VMAF）裡全部第一，多項指標領先超30%。

但比這次冠軍本身更值得問的是：騰訊這顆自研晶片，是怎麼出現的？

01. 一筆成本帳，逼出一顆芯

故事的起點，要回到七年前。

2019年的騰訊，視訊業務已經不只是騰訊視訊和直播。微信視訊號正在準備階段，雲遊戲開始浮現，對外提供服務的騰訊雲媒體處理MPS也已經線上營運。

這些業務每天都在生成同一個問題：一幀畫面，從被上傳、轉碼、儲存到分發到使用者手機上，每一步都在花錢。

視訊行業最重的成本，從來不在視訊製作上，而在基建，也就是每一幀畫面抵達使用者之前的那條鏈路里。解碼、分析、增強、編碼、儲存以及分發等，任何一個環節多出來一點點成本，乘以微信視訊號、騰訊視訊、QQ、直播和雲遊戲這套體量，都會變成一張很長的帳單。

這張帳單過去的解法，往往是通過堆量採購更多伺服器、租更多CDN節點來攤平。

但當業務規模大到一定量級，這種攤成本的方法也會開始失效。再多的通用伺服器，也不如一顆為視訊專門設計的晶片省錢。

騰訊做了一個判斷：自己造一顆。

那一年，"滄海"項目正式立項。三年後的2022年3月，滄海V1順利點亮；2023年進入量產。

如果說通用晶片追求的是儘可能適配更多場景，專用晶片追求的就是在一個確定場景裡把效率摳到極致。前者解決"能不能做"，後者解決"值不值得這樣做"。滄海誕生的使命，顯然是後者。

對騰訊來說，視訊就是那個最值得做專用晶片的場景：它確定、高頻，也足夠昂貴。

這套邏輯，騰訊高級執行副總裁、雲與智慧產業事業群CEO湯道生後來在2021年的騰訊數字生態大會上有過更直接的表述：騰訊造芯，"是需求驅動，基於自身存在需要解決的問題"。

五年後，整個行業的同一筆帳，會被一位UP主用另一種方式擺到大眾面前。

2024年10月，UP主"影視颶風"發了一條名為《清晰度不如4年前！視訊變糊是你的錯覺嗎？》的視訊，直指各大視訊平台過度壓縮視訊：名義上的4K不如四年前的1080P清晰。

視訊上線後引起廣泛討論，但留下了一個外界很少正面回應的問題：視訊平台為什麼要偷偷降畫質？

答案不浪漫，還是那個字：錢。

翻開愛奇藝的財報：2020年全年頻寬費用24億元，即便想盡辦法壓縮成本，到2023年Q2，一個季度就要4.5億元。

騰訊沒有選"偷偷壓畫質"這條路，它選了更慢、更重、也更徹底的一條：把帳本反過來寫進硬體，也就是滄海的架構。

騰訊把這套思路概括為"全鏈路軟硬體協同"。更直白地說，就是不只靠晶片本身硬算，而是把位元率控制、內容預分析、候選編碼模式、畫質判斷和硬體架構一起最佳化。

視訊裡那些畫面該多分位元率，那些畫面可以少分，那些場景容易糊，那些運動畫面最吃編碼器，這些問題只有在真實業務里長期跑，才會形成足夠細的經驗。

這不是把一顆晶片塞進資料中心，而是把資料中心的經驗，一刀一刀刻進矽裡。

02. 資料中心裡的"老員工"

2023年滄海V1量產。到2026年的今天，按騰訊雲披露的資料，滄海晶片在騰訊雲及騰訊自有場景中已經部署超過10萬片，覆蓋直播點播、4K轉碼、雲遊戲等業務。

"超過10萬片"是個什麼概念？

公開資料顯示，滄海單顆晶片編完一幀1080p視訊只要4毫秒。10萬片這種密度堆在一起，等於把一座大型轉碼機房，壓進了一組組機櫃裡。

對晶片產業來說，"超過10萬片"比"拿下比賽第一"更有份量。

比賽證明的是峰值能力，部署規模證明的是經濟性。視訊編解碼晶片不是實驗室裡的參數遊戲，它必須在資料中心里長期跑，要能把每一項成本真的壓下去，還要能被雲產品和內部業務調度起來。

否則，壓縮率再漂亮，也只是工程樣機裡的獎盃，不會真的省下一分錢。

騰訊也公開過一項技術指標：在120fps的高影格率檔位上，同等畫質下，滄海比行業領先ASIC還能再節省10%的位元率。這個10%，聽起來不大。但當流量以 Tb 計算，每個百分點就是數以億計的 CDN 流量成本。

MSU比賽上拿下240fps極速檔全指標冠軍的這顆V1，正是每天在騰訊視訊和騰訊雲資料中心裡跑著的"老員工"。

滄海的價值，從來不在於"騰訊也能造芯"。它在於：滄海是先有場景、再有晶片的產物。這樣長出來的晶片，從一開始就跑在能直接服務業務的軌道上。

這條路上，騰訊不是孤例。

03. 大洋兩岸，殊途同歸

早在2015年前後，Google工程師就發現了一個讓人頭大的問題：YouTube使用者上傳的視訊需要被轉成8到15種規格分發，轉碼叢集消耗的伺服器數量大到驚人。

Google給出的答案，叫Argos VCU。

2021年，Google在ASPLOS大會上公開了第二代Argos——一顆專為YouTube轉碼而生的視訊編碼晶片，效率比傳統伺服器高出20到33倍，把原本要花幾天才能跑完的4K視訊轉碼壓到幾小時。

往更大的格局看，亞馬遜從2015年開始的Nitro，到2018年的Graviton，再到2022年的Trainium，一路把雲業務裡每個高頻環節都做成自研晶片。截至2024年中，AWS新增CPU容量裡有一半已經跑在自研Graviton上。

國內的同一道題也不止騰訊一家在解。2023年，字節跳動旗下火山引擎也披露了自研視訊編解碼晶片，主要服務於抖音和西瓜視訊。不同公司、不同業務，但路徑出奇地一致。

視訊之外，這條邏輯同樣在AI算力棧裡上演。

今年4月，DeepSeek-V4發佈後，華為宣佈昇騰超節點系列產品全面支援DeepSeek-V4。一個是開源大模型，一個是國產AI算力平台，看起來和視訊編解碼不是一回事，但工程邏輯是相通的。

當一個模型被大量開發者呼叫、部署、二次開發，它就不再只是一個模型檔案，而會變成一種基礎設施介面。圍繞這個介面，從推理框架、算子庫到晶片本身的指令集和互聯，整套軟硬體棧都要跟著重新打磨。

滄海是騰訊視訊業務倒逼出來的一顆晶片，DeepSeek與昇騰的適配，則是開源模型生態把國產算力棧逼向成熟。

儘管它們不是同一種產品，但都說明了一個現象：當應用場景的規模、負載和迭代周期都到了一定量級，軟體和硬體就不會是兩條分開的線。它們會在業務現場裡相互磨合。

規模到了某個量級，"採購vs自研"的天平就會自然傾斜。

Google走了七年，AWS走了九年，字節走了三年。如今騰訊也走進了這個行列。

這種長周期的技術沉澱，也解釋了滄海這次的成績單。

04. 沒有橫空出世，只有水到渠成

回看這次比賽可以發現，拿下三個檔位全部指標第一的，是滄海V2的FPGA版本。

這款V2晶片目前已經成功點亮，計畫於2026年下半年全面提供服務。它在畫質不變的前提下，H.266壓縮率較上一代提升超過30%，單晶片處理能力翻倍。

更值得注意的是，它把渲染、畫質增強、編碼塞進同一塊矽。原本分散在多個模組裡的工序，被壓成一條流水線。

騰訊最終把這套能力接到了雲媒體處理MPS產品上，以公有雲、私有雲或SDK等方式對外開放。

晶片如果只服務騰訊內部，它只是一個降本工具；通過雲服務對外提供，它才會變成騰訊雲音視訊業務的一部分長期競爭力。

這就是MSU冠軍給滄海的真正刻度——不是"中國也能造視訊晶片"，而是"中國網際網路公司也能跑通自下而上的研發路徑"。

不是所有技術突破，都會以"彎道超車"的姿態出現。更多時候，它藏在請求、推理與延遲瓶頸的縫隙裡。

應用場景，不再是技術的下游，而是技術的上游。

滄海贏下這只獎盃，重要的從來不是它打敗了英特爾、AMD、輝達等一眾頂尖對手，而是它證明了一條技術路徑的可行性。在中國這個市場，只要業務跑得夠多、夠真、夠久，上游的生態就會自然長出來。

無論是視訊生態里長出的滄海，還是AI生態裡正在長成的DeepSeek與昇騰，都在說同一件事：所謂"卡脖子"的焦慮，不需要靠押注一兩次"橫空出世"來回應。 (觀網財經)