5月26日,騰訊贏了一場和輝達、AMD、英特爾同台的比賽。
作為一項辦了20多年的權威評測,莫斯科國立大學(MSU)的視訊編碼比賽與Google、英特爾、輝達、AMD等晶片大廠保持評測合作或長期往來,是該領域少數被業界公認的"裁判席",業內把它視作硬體視訊編碼的"奧林匹克"。
今年的硬體視訊編碼比賽有41款硬體編碼器參賽,覆蓋H.264、H.265、AV1、H.266全部主流標準。
騰訊自研編解碼系列晶片"滄海",在30fps、60fps、120fps、240fps四個速度檔位、所有評測指標(SSIM、PSNR、VMAF)裡全部第一,多項指標領先超30%。
但比這次冠軍本身更值得問的是:騰訊這顆自研晶片,是怎麼出現的?
01. 一筆成本帳,逼出一顆芯
故事的起點,要回到七年前。
2019年的騰訊,視訊業務已經不只是騰訊視訊和直播。微信視訊號正在準備階段,雲遊戲開始浮現,對外提供服務的騰訊雲媒體處理MPS也已經線上營運。
這些業務每天都在生成同一個問題:一幀畫面,從被上傳、轉碼、儲存到分發到使用者手機上,每一步都在花錢。
視訊行業最重的成本,從來不在視訊製作上,而在基建,也就是每一幀畫面抵達使用者之前的那條鏈路里。解碼、分析、增強、編碼、儲存以及分發等,任何一個環節多出來一點點成本,乘以微信視訊號、騰訊視訊、QQ、直播和雲遊戲這套體量,都會變成一張很長的帳單。
這張帳單過去的解法,往往是通過堆量採購更多伺服器、租更多CDN節點來攤平。
但當業務規模大到一定量級,這種攤成本的方法也會開始失效。再多的通用伺服器,也不如一顆為視訊專門設計的晶片省錢。
騰訊做了一個判斷:自己造一顆。
那一年,"滄海"項目正式立項。三年後的2022年3月,滄海V1順利點亮;2023年進入量產。
如果說通用晶片追求的是儘可能適配更多場景,專用晶片追求的就是在一個確定場景裡把效率摳到極致。前者解決"能不能做",後者解決"值不值得這樣做"。滄海誕生的使命,顯然是後者。
對騰訊來說,視訊就是那個最值得做專用晶片的場景:它確定、高頻,也足夠昂貴。
這套邏輯,騰訊高級執行副總裁、雲與智慧產業事業群CEO湯道生後來在2021年的騰訊數字生態大會上有過更直接的表述:騰訊造芯,"是需求驅動,基於自身存在需要解決的問題"。
五年後,整個行業的同一筆帳,會被一位UP主用另一種方式擺到大眾面前。
2024年10月,UP主"影視颶風"發了一條名為《清晰度不如4年前!視訊變糊是你的錯覺嗎?》的視訊,直指各大視訊平台過度壓縮視訊:名義上的4K不如四年前的1080P清晰。
視訊上線後引起廣泛討論,但留下了一個外界很少正面回應的問題:視訊平台為什麼要偷偷降畫質?
答案不浪漫,還是那個字:錢。
翻開愛奇藝的財報:2020年全年頻寬費用24億元,即便想盡辦法壓縮成本,到2023年Q2,一個季度就要4.5億元。
騰訊沒有選"偷偷壓畫質"這條路,它選了更慢、更重、也更徹底的一條:把帳本反過來寫進硬體,也就是滄海的架構。
騰訊把這套思路概括為"全鏈路軟硬體協同"。更直白地說,就是不只靠晶片本身硬算,而是把位元率控制、內容預分析、候選編碼模式、畫質判斷和硬體架構一起最佳化。
視訊裡那些畫面該多分位元率,那些畫面可以少分,那些場景容易糊,那些運動畫面最吃編碼器,這些問題只有在真實業務里長期跑,才會形成足夠細的經驗。
這不是把一顆晶片塞進資料中心,而是把資料中心的經驗,一刀一刀刻進矽裡。
02. 資料中心裡的"老員工"
2023年滄海V1量產。到2026年的今天,按騰訊雲披露的資料,滄海晶片在騰訊雲及騰訊自有場景中已經部署超過10萬片,覆蓋直播點播、4K轉碼、雲遊戲等業務。
"超過10萬片"是個什麼概念?
公開資料顯示,滄海單顆晶片編完一幀1080p視訊只要4毫秒。10萬片這種密度堆在一起,等於把一座大型轉碼機房,壓進了一組組機櫃裡。
對晶片產業來說,"超過10萬片"比"拿下比賽第一"更有份量。
比賽證明的是峰值能力,部署規模證明的是經濟性。視訊編解碼晶片不是實驗室裡的參數遊戲,它必須在資料中心里長期跑,要能把每一項成本真的壓下去,還要能被雲產品和內部業務調度起來。
否則,壓縮率再漂亮,也只是工程樣機裡的獎盃,不會真的省下一分錢。
騰訊也公開過一項技術指標:在120fps的高影格率檔位上,同等畫質下,滄海比行業領先ASIC還能再節省10%的位元率。這個10%,聽起來不大。但當流量以 Tb 計算,每個百分點就是數以億計的 CDN 流量成本。
MSU比賽上拿下240fps極速檔全指標冠軍的這顆V1,正是每天在騰訊視訊和騰訊雲資料中心裡跑著的"老員工"。
滄海的價值,從來不在於"騰訊也能造芯"。它在於:滄海是先有場景、再有晶片的產物。這樣長出來的晶片,從一開始就跑在能直接服務業務的軌道上。
這條路上,騰訊不是孤例。
03. 大洋兩岸,殊途同歸
早在2015年前後,Google工程師就發現了一個讓人頭大的問題:YouTube使用者上傳的視訊需要被轉成8到15種規格分發,轉碼叢集消耗的伺服器數量大到驚人。
Google給出的答案,叫Argos VCU。
2021年,Google在ASPLOS大會上公開了第二代Argos——一顆專為YouTube轉碼而生的視訊編碼晶片,效率比傳統伺服器高出20到33倍,把原本要花幾天才能跑完的4K視訊轉碼壓到幾小時。
往更大的格局看,亞馬遜從2015年開始的Nitro,到2018年的Graviton,再到2022年的Trainium,一路把雲業務裡每個高頻環節都做成自研晶片。截至2024年中,AWS新增CPU容量裡有一半已經跑在自研Graviton上。
國內的同一道題也不止騰訊一家在解。2023年,字節跳動旗下火山引擎也披露了自研視訊編解碼晶片,主要服務於抖音和西瓜視訊。不同公司、不同業務,但路徑出奇地一致。
視訊之外,這條邏輯同樣在AI算力棧裡上演。
今年4月,DeepSeek-V4發佈後,華為宣佈昇騰超節點系列產品全面支援DeepSeek-V4。一個是開源大模型,一個是國產AI算力平台,看起來和視訊編解碼不是一回事,但工程邏輯是相通的。
當一個模型被大量開發者呼叫、部署、二次開發,它就不再只是一個模型檔案,而會變成一種基礎設施介面。圍繞這個介面,從推理框架、算子庫到晶片本身的指令集和互聯,整套軟硬體棧都要跟著重新打磨。
滄海是騰訊視訊業務倒逼出來的一顆晶片,DeepSeek與昇騰的適配,則是開源模型生態把國產算力棧逼向成熟。
儘管它們不是同一種產品,但都說明了一個現象:當應用場景的規模、負載和迭代周期都到了一定量級,軟體和硬體就不會是兩條分開的線。它們會在業務現場裡相互磨合。
規模到了某個量級,"採購vs自研"的天平就會自然傾斜。
Google走了七年,AWS走了九年,字節走了三年。如今騰訊也走進了這個行列。
這種長周期的技術沉澱,也解釋了滄海這次的成績單。
04. 沒有橫空出世,只有水到渠成
回看這次比賽可以發現,拿下三個檔位全部指標第一的,是滄海V2的FPGA版本。
這款V2晶片目前已經成功點亮,計畫於2026年下半年全面提供服務。它在畫質不變的前提下,H.266壓縮率較上一代提升超過30%,單晶片處理能力翻倍。
更值得注意的是,它把渲染、畫質增強、編碼塞進同一塊矽。原本分散在多個模組裡的工序,被壓成一條流水線。
騰訊最終把這套能力接到了雲媒體處理MPS產品上,以公有雲、私有雲或SDK等方式對外開放。
晶片如果只服務騰訊內部,它只是一個降本工具;通過雲服務對外提供,它才會變成騰訊雲音視訊業務的一部分長期競爭力。
這就是MSU冠軍給滄海的真正刻度——不是"中國也能造視訊晶片",而是"中國網際網路公司也能跑通自下而上的研發路徑"。
不是所有技術突破,都會以"彎道超車"的姿態出現。更多時候,它藏在請求、推理與延遲瓶頸的縫隙裡。
應用場景,不再是技術的下游,而是技術的上游。
滄海贏下這只獎盃,重要的從來不是它打敗了英特爾、AMD、輝達等一眾頂尖對手,而是它證明了一條技術路徑的可行性。在中國這個市場,只要業務跑得夠多、夠真、夠久,上游的生態就會自然長出來。
無論是視訊生態里長出的滄海,還是AI生態裡正在長成的DeepSeek與昇騰,都在說同一件事:所謂"卡脖子"的焦慮,不需要靠押注一兩次"橫空出世"來回應。 (觀網財經)
