真正的AI 攻勢,是堅決把自己變成科技企業。
2026 年2 月初,中國的兩大互聯網公司騰訊與阿里巴巴率先打響了新一年的AI 大戰——騰訊的元寶端出10 億元現金激勵,並上線新的AI 社交功能“元寶派”;阿里的千問拿出30 億元的福利,鼓勵用戶在App 裡點外賣。
儘管字節跳動在這之前已經靠火山引擎奪得了這一年央視春晚的總冠名,但在紅包與補貼的喧囂中,它並未成為輿論主角。直到農曆春節前一周,視頻生成模型Seedance 2.0 問世,在創作者圈與行業討論中迅速發酵,把它重新推回了討論中心。 2 月14 日,字節跳動陸續上線了豆包大模型2.0 與圖像創作模型Seedream 5.0 Lite。
除夕當晚,字節跳動又帶著火山引擎、豆包App,以及Seed 系列大模型來到了春晚舞台上。從舞美視效、機器人說話到播出保障,AI 第一次如此全面地滲透進了春晚這場全民狂歡之中。
就連互動玩法也被重新設計:觀眾需要調用豆包裡的大模型生成圖片或文字才能獲得紅包福利。紅包裡不只現金,還有3D 列印機、汽車、無人機、機器人等科技產品。
這是字節的春節戰役。
一位字節跳動人士告訴我們,相較於許多公司把春節當作單純的成長機遇,他們更希望在這個節點,創造關於AI 和科技的集體記憶;也試著告訴外界,做AI 不是只做一兩款應用,而是要服務各個產業。據了解,春晚上送出去的科技產品都是豆包大模型的客戶。
官方數據顯示,除夕當天豆包的AI 總互動19 億。除夕前,備受國內外關注的影片產生模型Seedance 2.0 和最新的豆包大模型2.0Pro 也接連第一時間接入豆包(『專家』模式),讓先進的模型能力第一時間落到產品觸達用戶。
無論是與新春等生活場景的貼合,或是模型能力上限的提升,可以說,豆包都已具備國民級AI 產品的特徵。
在過去幾年的科技業,最有說服力的成長故事從來不是藉補貼堆出來的。 2022 年11 月,ChatGPT 掀起全球AI 熱潮後,靠著模型迭代成為了一個周活躍用戶數達8 億的超級產品;兩年多後走紅的DeepSeek 在沒有任何廣告投放、沒有多模態能力的情況下,穩定維持著超過3000 萬的日活躍用戶數。
字節跳動CEO 梁汝波在年初的員工大會上將公司2026 年的關鍵字設定為了「勇攀高峰」。他提到,AI 時代存在著許多重要的機會,字節要追求其中最重要的,去攀登最高的高峰。
「真正的AI 攻勢,是堅決把自己變成一家科技企業。」上述字節跳動人士說。 2026 年春節,這家公司正試圖點亮自己的ChatGPT 時刻。
作為少有的全民級晚會平台,春晚在過去十年裡一直是各互聯網公司重要的新用戶增長渠道,它與一眾互聯網產品之間的合作也幾乎與“紅包” 綁定。從2015 年開始,微信、支付寶、淘寶、京東、抖音、拼多多、快手等知名網路產品均在春晚上發放過紅包福利。
但在今年春晚,冠名方火山引擎接到的第一個任務卻是與舞台視覺相關的。
一位字節跳動人士告訴我們,今年春晚導演組一直在探索將最新科技和傳統文化藝術結合。因此作為獨家AI 雲夥伴,火山引擎及其背後的字節跳動不僅要以贊助方身份參與冠名,還要把AI 與雲端運算能力嵌入到春晚節目的創作與製作流程中。
在《駕馭風歌》這個節目裡,歌手身後出現了一幅國寶級的駿馬水墨畫。節目籌備時,導演組並不滿足於將其當作靜態背景,而是希望讓這些馬匹在舞台空間裡動起來,並與歌手互動。
為了達成這個效果,他們最初試過一些海外模型,但大多抓不住水墨畫的氣韻;國內模型也同樣受限,水墨風格的高品質訓練語料稀缺,生成出來的畫作風格容易偏離。更棘手的是運動一致性:馬要跑得流暢,卻又必須在每一幀都貼合原畫的筆觸與結構、不變形;馬匹的數量、每匹馬之間的動作都要始終保持一致。
轉折來自字節跳動團隊帶來的Seedance 2.0。這個全新的視頻生成模型不僅能更好地遵循物理規律,讓馬的步態更接近真實,關節銜接自然、動作連貫;還能很好地遵循導演的要求,實現像“跑慢一點”“鬃毛飄動輕一點” 這類帶副詞的細微調度指令。它還有另一個重要的突破——模型不再是只能學單張圖的風格,而是能同時學習大量不同風格的多模態素材。
一位字節春晚計畫組人士告訴我們,他們把導演組畫的草圖、水墨畫作,還有許多關於馬的影像素材一起餵給模型,透過參考生成的方式,實現畫風與動作能穩定地在同一個標準之下生成。他們也繞過了直接寫提示詞的方式,改用Seedance 2.0 與圖像生成模型Seedream 協作:先由Seedream 生成每一幀關鍵幀,再由Seedance 在關鍵幀約束下生成動態視頻,實現了風格的一致性和運動的連貫性。
把理想中的效果表現出來只是第一步。春晚的每個節目迭代頻率都極高,因此字節團隊常遇到的情況是,剛交付一版滿意的畫面,導演組馬上提出:「能不能再往前走一步」。這些節目還需要經歷反覆過審與驗收,這也意味著他們每次都必須拿出更好的版本。 「整體節奏基本上得按'周' 來迭代推進。」上述字節春晚專案組人士說。
很快新的難題又出現了。雖然《大鬧天宮》《小蝌蚪找媽媽》等上美影經典作代表了手繪全動畫的巔峰,但在AI 數位化生成的語境下,如何在高幀率、高分辨率的現代廣播標準中,讓水墨這種'無邊界' 的藝術形式在高速大運動下不閃爍、不崩壞,是行業公認的難題。
考慮到主流視頻生成模型通常輸出720p 或1080p 分辨率、24 幀/秒的視頻,字節團隊將突破點放在後處理鏈路,借助火山引擎視頻點播的畫質增強能力升級畫質:先通過超分技術,在不改變畫面內容的前提下將較小尺寸的畫面放大至6K 或8K;這套處理也非一刀切的通用演算法,而是能根據每個畫面的畫質與內容特點做專屬優化。最後他們順利解決了這個難題。
除了舞美,字節團隊還將AI 能力帶入了春晚的多個環節。舞台上出現的機器人連結了豆包的視覺大模型、文字大模型和語音辨識模型,語音側採用了豆包的合成與復刻模型。模型讓它們不僅有了“大腦”,還裝上了“嘴巴” 和“耳朵”。
他們還提前收集了舞蹈演員的3D 素材,再利用了空間視頻技術,將舞蹈演員製作成3D 數字分身,在舞台上實現真人3D 克隆效果讓觀眾難辨真假。最後又加上了字節自研的4D 高斯演算法、豆包大模型優化光影效果。
豆包App 是今年春晚與觀眾互動的核心載體。與往年常見的在網路產品上搖紅包、搶紅包不同,今年互動流程改為,用戶需先在豆包上用大模型生成頭像或新春祝福,再搶紅包。這樣的變化極大地抬高了成本——以往紅包互動形式的主要開銷集中在網絡、IO 和實時連接,現在則在原有基礎上疊加了龐大的算力請求與算力支出。
調控算力資源的難題也大幅上升。一位字節的春晚專案組人士保守測算,使用者產生一則新春祝福或一張圖片,一次請求就需要完成10 TOPS(每秒10 兆次操作)的計算量。而以往類似互動請求的計算量僅約1/100000 TOPS,兩者在算力需求上相差了整整100 萬倍。同時,他們在除夕當晚還要應付抖音、今日頭條等產品春節活動帶來的大模型召喚。
由於時間緊迫,字節沒辦法靠臨時堆機器頂住算力洪峰。還好火山方舟頂了上來,這是字節統一調度算力的總控台,長期在字節和外部客戶的各類高並發場景中沉澱了資源調度能力。火山方舟的一個特點是將推理、訓練和離線任務放進同一資源池統一統籌,因此在春節算力與流量峰值來臨時,系統能把可延遲的負載錯峰移開,為各類春節活動騰出更多資源。
這不是件容易做到的事。它涉及到海量場景、多個機房、多種機型和多類模型,還要持續動態分配資源。一位火山引擎人士把這個過程形容為「裝箱」:一方面,不同流量的延遲要求不同、對異質硬體的依賴不同,約束極多、解空間巨大;另一方面,大模型推理不像傳統CPU 服務那樣資源類型相對統一,同一個推理服務裡也可能混用多種硬體。更麻煩的是,GPU 的遷移不是單點動作,儲存、網路、上游負載平衡等配套資源也要協同遷移,否則算力挪過去也接不住流量。
「冠名春晚對字節來說,不再是一場簡單的增長活動,它更像一次真正的技術試煉。」一位字節跳動人士說。
字節跳動今年與春晚合作方式的變化,似乎再一次說明:AI 時代的成長邏輯正在改寫。
行動互聯網時代,巨頭崛起不是靠時刻引領創新,而是靠在有人驗證了某個需求後,成系統地做出同款產品,以更高效率大量拉來用戶,再根據用戶反饋快速迭代改進體驗。更好的體驗帶來更多的收入,這些收入又被拿來投放,獲得更多用戶,如此循環。撒錢則是最直接的成長手段。
「核心是極速成長、極速迭代、極速變現的飛輪。」一位網路公司的產品經理說。
對網路產品而言,越快拉新,產品體驗越快提升。 「多數情況下,推薦演算法是發現你和另一個用戶偏好相似,然後把他喜歡的東西展示給你。」一位推薦產品經理說。用戶增加,可供演算法學習、發現關聯的資料隨之增加。這既適用於推薦影片、小說,也適用於推薦商品卡、帶貨直播間。微信支付的崛起是另一個例子,它用紅包把支付變成了社交的一部分,想參與就得綁卡、能轉帳。人越多,越常用,久而久之就成了預設的支付工具。
交易型產品同樣受益於此。一個叫車平台會同時補上兩端:一邊補司機提高供給,一邊補乘客拉動需求。司機密度上來後,乘客等待時間縮短;訂單密了,司機空駛更少,平台的履約成本也會隨之下降,用戶體驗也更好。
網路產品的成本也不會隨著用戶增加而線性上漲;新增開銷主要在頻寬、儲存和機器資源上,它也會隨著用戶規模的提升而被攤薄。
但AI 產品幾乎是網路產品的另一面。
2025 年初,字節跳動CEO 梁汝波曾在集團全員會上提到,豆包沒顯出「越多人用越好用」 的網路產品特性。這部分因為chatbot 產品不是社群網路或平台。
用戶數量增長帶來的新數據也有限。一個短視頻產品,只要用戶還在上下刷,就會產生一組組數據供推薦算法優化;但chatbot 類產品生成一段回复,只有極糟時,用戶才有動力多點下按鈕反饋。能收集來數據,也不保證它們能讓底層模型更聰明。 「多數用戶的問題高度重合,又沒什麼深度,沒辦法提高模型能力。」一位網路公司的AI 產品經理說。 “例如程式碼方向,公司就會在內部找程式設計師寫案例。”
大模型的專業能力早已超過大多數人類,它們不能透過收集普通人的數據來改善自己,就像AlphaGo 不需要和普通人對弈來提昇技能——它後來的變種AlphaGo Zero 甚至連世界冠軍的數據都不用,只是機器訓練機器就能贏過所有人。即便ChatGPT 應用的月活躍用戶量比Claude 高出100 多倍,但這並沒有讓OpenAI 的模型比Claude 好用那怕一倍。
AI 還無法像網路產品一樣,靠用戶量攤薄成本。一位深入研究AI 的二級市場人士曾計算,目前的主流AI 產品如果服務1 億日活用戶,每天的模型推理成本就要幾千萬元。這個計算還沒有考慮新的Agent 產品,如果類似Manus 的產品開始流行,單一使用者每天需要的算力可能還會再翻幾倍。
最關鍵的是商業化難題。在海外,ChatGPT、Gemini、Claude 砸下了巨額投資以滿足複雜計算,用戶也必須付錢,低一檔17-20 美元/月,高一檔可以到數百美元/月。但願意為軟體服務支付這般費用的中國用戶很少,字節和阿里等公司更多是靠雲端服務賺回在AI 上投入的錢——把模型能力做成雲上的API/託管服務與行業解決方案,企業按調用量、並發、存儲與算力時長付費。
根據官方數據,2025 年12 月,火山引擎上的豆包大模型日均Token 處理量超過50 兆,半年成長超200%。成長的動力不僅來自字節旗下豆包、即夢等AI 應用快速發展,還有一群外部客戶在深入使用大模型:累計使用上兆Token 的超過100 家,比全球雲端運算巨頭AWS 還多了一倍。
當下,AI 產品體驗提升幾乎全部來自底層模型能力提升。 AI 程式碼編輯器Cursor 能出圈,前提是它接入了Claude 系列模型程式碼能力大幅提升。 OpenAI 的Deep Research 體驗驚艷,也是靠著底層模型學會了長鏈思考、逐步解題。
如果大模型能持續進步,許多精心調教後的產品能力成為龐大模型的一部分,使用者直接說幾句話就能實現想要的效果,那麼大模型本身就是終極產品。 ChatGPT 與DeepSeek 的成功都在說明,靠投流、補貼去搬運用戶的老辦法越來越吃力,真正能拉開差距的,還是模型與產品體驗的硬實力。
2017 年的一次CEO 面對面上,有字節跳動的員工問演算法技術負責人楊震原:公司在人工智慧上與BAT 的差距在那裡?楊震原回答說,「今日頭條本來就是一家人工智慧公司。」他進一步解釋,做資訊分發就是需要人工智慧,今日頭條想透過機器和人結合的方式提升創作、分發、討論等每個環節的效率。
當時,AI 在字節跳動的產品中已經有一些應用,例如推薦、內容創作、抖音的AR 效果、 內容審核、廣告系統、標題自動產生封面、時光相簿和東方IC 對圖片的篩選功能等等。
2022 年底,ChatGPT 橫空出世帶來了新的AI 熱潮。字節跳動是這一輪投入最大的中國科技巨頭之一。它迅速訂購了大量GPU、組成全新的AI 部門,從infra、數據、模型、產品到人才全方位追趕矽谷公司。兩年後,字節的模型數量、迭代速度和表現明顯提升。
技術的躍升很少一蹴而就,背後需要堅定的長期投入。一位字節跳動人士回憶,Seedance 1.5 推出時,外界對它的評價並不高:人物在運動中容易崩壞,細節也不夠穩定。後來Seedance 2.0 的效果明顯提升,有人猜測這是團隊調整了Benchmark,把更影響用戶體驗的指標排在了更前面。
「其實大家都忽略了基礎工作的重要性。」上述人士說。以運動崩壞為例,團隊需要反覆驗證不同方案,找到更有效的路徑,這類工作很耗時,卻是必須補齊的基礎能力。 “就像一個很聰明的小朋友,未來也許能解大學題,但如果基礎知識沒學完,現在硬讓他做,結果肯定不會好。”
另一個例子是豆包的語音合成模型(Seed TTS)。 2024 年,團隊在做Seed TTS 1.0 時的目標是讓模型能自然流暢地復刻說話者特徵,尤其在跨語種時也能保持相似度與韻律。當1.0 達到可用水準後,新的問題又暴露出來了:模型的語氣表達太平淡。但這個難題在當時無法快速解決,於是他們在研發2.0 版本時,把重點放在了將理解與思考能力融入端到端語音鏈路。直到2025 年中Seed TTS 2.0 發布,模型才具備了更強的情感表達能力。
字節也是少有願意在基礎研究上投入資源的中國科技公司。一位接近字節高層的人士曾告訴我們,字節目前的infra (工程化能力)已經比國內任何一家公司都要強。但和全球比,最大的問題是缺少OpenAI 裡那種能提出方向、能做前沿探索的人,例如GPT 4o、Sora。
「中國過去沒有真正的企業研究院是因為民營企業獲利能力有限,現在終於可以試一試了。」上述人士說。
2025 年1 月下旬,字節正式設立了代號為「Seed Edge」 的研究項目,核心目標是做比預訓練和大模型迭代更長期、更基礎的AGI 前沿研究。該計畫設定了更寬鬆的考核機制:字節本來每半年考核一次績效,而Seed Edge 則在專案取得突破進展後,再做最終評估。
字節在考察AI 專案時,ROI 依然重要,但周期更長了。一位字節AI 產品團隊人士告訴我們,字節現在會以AI 產品一定周期後的單用戶價值作為考核係數,以計算未來收益,不同產品的考核周期不同,長的甚至可以到5 年;但字節也沒對這種考核方式做強制要求。
商業與科技史上無數次驗證過了,想要拿下使用者、市場,或是更大的機會,靠的永遠是技術的躍遷與產品的硬實力。
二十多年前,Google 因擔心微軟殺入搜尋市場,在內部製訂了「芬蘭計畫」。這套計畫的核心不是守城,而是逼自己持續做出更有創意、把體驗打到極致的產品——即使在Windows 這樣的主場上,也要做出比微軟自備工具更好用的瀏覽器。最終,在沒有產品迭代優勢、沒有網路效應的背景之下,Google 硬是靠著出色的工程技術能力做出了Chrome 並贏得了戰爭的勝利。
在與微軟的競爭中,Google 也鍛造出一套強大的商業化系統AdSense,把源源不斷的現金流與生態網路牢牢綁定在自己身上,並在此後多年逐步沉澱為難以撼動的障礙。
2024 年,OpenAI 聯合創始人、前首席科學家伊爾亞·蘇茨克維(Ilya Sutskever) 曾提到,「2010 年代是擴大規模的時代,現在我們再次回到了需要奇蹟和新發現的時代。」對字節跳動來說,它用13 年長成中國最大的互聯網公司上限和新發現的時代。」對字節跳動來說,它用13 年長成中國最大的互聯網公司; (晚點LatePost)