#字節跳動
字節王炸引爆A股,AI大牛股5天狂飆60%
過去一周(2月9日—2月13日)的牛股榜中,掌閱科技(603533.SH)以61.11%的周漲幅奪魁。公開資料顯示,掌閱科技主營業務是網際網路數字閱讀平台服務、衍生業務、版權產品等。公司的主要產品是網際網路數字閱讀平台。二級市場方面,公司股價過去一周強勢走高斬獲5連板。截至2月13日,公司股價報收37.62元/股,創下2023年以來新高,公司總市值突破165億元。公司近期亦獲主力資金持續加倉,Wind顯示,本周主力資金已連續5日“加倉”掌閱科技,累計淨流入超12億元,其中13日單日淨流入超8億元。消息面上,字節跳動旗下視訊生成模型Seedance 2.0正式發佈,在全網快速出圈。據21世紀經濟報導,Seedance 2.0可根據文字或圖像建立電影級視訊,支援根據描述的情節自動規劃分鏡和運鏡,支援音畫同步,支援多鏡頭敘事等複雜需求。Seedance 2.0會自動保持所有場景切換中角色、視覺風格和氛圍的一致性,無需手動編輯。業內也“好評”頻頻。遊戲科學創始人、CEO馮驥甚至在其微博上寫道,“Seedance 2.0是當前地表最強視訊生成模型。”面對連日刷屏的Seedance 2.0生成視訊,馬斯克也在社交平台上點評,“模型發展太快了。”華泰證券指出,Seedance 2.0有望為國內AI漫劇、AI短劇等的規模化落地,及AI電影等的行業發展提供技術支撐。A視訊工業化能力逐步成熟將推動內容產業鏈價值分配結構變化。利多影響下,本周AI應用概念股快速走強,其中AI漫劇備受關注。例如,最牛股掌閱科技曾披露,2025年上半年短劇等衍生業務收入,同比增長149.09%,已成為公司第一大業務(2025年半年報)。公司正持續推進AI大模型在數字閱讀及短劇中的深度融合(2025年9月互動平台)。股價大幅波動下,公司周內兩次發佈異動公告並提示,日常經營情況及外部環境未發生重大變化,2025年度AI短劇業務收入預計不超過2025年度主營業務收入的1%。值得注意的是,公司2025年業績預計轉虧。掌閱科技發佈的2025年度業績預告顯示,預計2025年年度實現歸母淨利潤約為-1.95億元,原因為國內外雙線發展模式帶來短期投入的大幅增加,短期對整體盈利能力形成一定拖累。(21世紀經濟報導)
豆包再扔王炸!2.0發佈:推理成本降一個數量級,正面對標GPT-5和Gemini 3
字節跳動旗下豆包大模型正式進入2.0階段,推出面向Agent時代的系統性升級版本。新版本在保持與GPT-5.2和Gemini 3 Pro相當性能的同時,將推理成本降低約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。2月14日,字節跳動宣佈,豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和專門的Code模型。其中旗艦版豆包2.0 Pro全面對標GPT-5.2與Gemini 3 Pro,在多數視覺理解基準測試中達到業界最高水平,並在數學奧賽IMO、CMO和程式設計競賽ICPC中獲得金牌成績。該系列模型已全面上線。豆包2.0 Pro已接入豆包App、電腦端和網頁版的"專家"模式,Code版本已整合至AI程式設計產品TRAE,火山引擎同步上線面向企業和開發者的API服務。分析認為,在現實世界複雜任務中,由於大規模推理與長鏈路生成將消耗大量token,豆包2.0的成本優勢將成為關鍵競爭力。這標誌著字節跳動在大模型商業化應用上邁出重要一步。多模態能力達到世界頂尖水平豆包2.0全面升級了多模態能力,在視覺推理、感知能力、空間推理與長上下文理解等任務上表現突出。在動態場景理解方面,該模型在TVBench等關鍵測評中處於領先位置,在EgoTempo基準上甚至超過人類分數,顯示其對變化、動作、節奏等資訊的捕捉更為穩定。在長視訊場景中,豆包2.0在大多數評測上超越其他頂尖模型,並在多個流式即時問答視訊基準測試中表現優異。這使其能夠作為AI助手完成即時視訊流分析、環境感知、主動糾錯與情感陪伴,實現從被動問答到主動指導的互動升級,可應用於健身、穿搭等陪伴場景。推理能力對標頂尖模型,成本優勢顯著豆包2.0 Pro通過加強長尾領域知識,在SuperGPQA上分數超過GPT-5.2,並在HealthBench上獲得第一名,在科學領域的整體成績與Gemini 3 Pro和GPT-5.2相當。在推理和Agent能力評測中,該模型在IMO、CMO數學奧賽和ICPC程式設計競賽中獲得金牌成績,也超越了Gemini 3 Pro在Putnam Bench上的表現。在HLE-text(人類的最後考試)上,豆包2.0 Pro取得最高分54.2分,在工具呼叫和指令遵循測試中也有出色表現。更重要的是,字節跳動表示,該模型在保持與業界頂尖大模型相當效果的同時,token定價降低了約一個數量級,這一成本優勢在大規模推理與長鏈路生成場景中將變得更為關鍵。基於OpenClaw框架和豆包2.0 Pro模型,字節跳動在飛書上建構了智能客服Agent。該Agent能通過呼叫不同技能完成客戶對話,遇到難題時會主動拉群求助真人同事,幫客戶預約上門維修人員,並在維修後主動回訪和推薦產品。Code模型提升開發效率豆包2.0 Code基於2.0基座模型針對程式設計場景進行最佳化,強化了程式碼庫解讀能力和應用生成能力,並增強了模型在Agent工作流中的糾錯能力。該模型已上線TRAE中國版作為內建模型,支援圖片理解和推理。在實際應用中,開發者使用TRAE配合豆包2.0 Code,僅需1輪提示詞就能建構出"TRAE春節小鎮·馬年廟會"互動項目的基本架構和場景,經過5輪提示詞即可完成整個作品。該項目包含11位由大語言模型驅動的NPC,能根據人設自然聊天、招呼顧客、現場砍價,AI遊客也會自主決定去那家攤位、買什麼、說什麼。相關提示詞與素材已在GitHub開源供開發者測試。目前,豆包2.0 Pro已面向C端使用者在豆包App、電腦端和網頁版上線“專家”模式;面向企業和開發者,火山引擎已同步上線豆包2.0系列模型API服務。字節跳動表示,未來將繼續面向真實場景迭代模型,探索智能上限。 (華爾街見聞)
字節跳動真能“一己抗天下”嗎?把恆生科技指數拆開看,答案有點意思
2026年立春之後,港股市場並未如期迎來溫暖的“春季躁動”,反而遭遇了一場凜冽的“倒春寒”。自2025年10月以來,恆生科技指數一改升勢掉頭向下,相比高點最大回撤已超過20%。2月3日那天尤其慘烈——上午還在沖高,10點50分突然大跳水,跌幅一度擴大至3.37%,快手跌超7%,嗶哩嗶哩、百度、騰訊跌超6%。投資者一臉懵:說好的AI牛呢?說好的科技重估呢?市場找了一堆理由:聯準會鷹派提名、稅收傳聞“小作文”、節前獲利了結……但有一個更深層的困惑,很少有人點破——就在港股科技股跌跌不休的同時,字節跳動的AI視訊模型Seedance 2.0正在悄然內測,直接把內容生產的成本結構推倒重來。這一幕很戲劇性:中國AI產業在視訊生成、多模態理解上接連突破,恆生科技的投資者反而成了這股技術浪潮的“受害者”。為什麼?有人把恆生科技指數拆開一看,發現了一個有點扎心的事實:前十大成分股裡,有六家公司的核心業務都跟字節跳動直接競爭——騰訊(社交+遊戲)、阿里(電商+雲)、美團(本地生活)、快手(短影片)、京東(電商)、百度(搜尋+AI)。這些公司加起來佔了指數近40%的權重。於是,一個聽著有點中二的說法就傳開了:“字節跳動,正在以一己之力對抗整個港股網際網路。”字節跳動和其多領域競爭態勢圖(心智觀察所製圖)更有意思的是,每當字節發一個新模型、推一個新應用,恆生科技指數往往就要抖三抖。Seedance 2.0的消息一出,市場的第一反應不是為快手可靈寄予厚望,而是重新評估快手AI業務的估值天花板。字節的每一次技術突進,都像在給恆生科技指數的權重股們做一次“壓力測試”。這個說法,既不是空穴來風,也不是鐵板釘釘。字節確實是過去幾年中國網際網路最兇猛的存在,但要說到“一己抗天下”,咱們得先把它到底強在那、又卡在那,一件件拆清楚了再說。字節到底有多強?資料不說謊先說硬實力。2024年上半年,字節營收約730億美元,折合人民幣5200多億,同比增長超35%,已經逼近Meta。同期,阿里營收4651億,騰訊3206億。一個沒上市公司,收入同時超過了阿里和騰訊——五年前誰敢想?全年利潤約330億美元,換算成人民幣2400億,超過中國石油,在中國所有上市公司裡,僅次於四大行。這不是“大廠等級”,這是國民經濟等級的存在。字節能做到這個規模,核心是抓住了移動網際網路時代兩條最肥的變現邏輯:流量廣告和電商交易。抖音先是吃下了短影片和直播這波終極傳播形態,把流量變成廣告,這是網際網路最成熟的變現路徑;然後順滑地切入電商和本地生活,從“讓人看”到“讓人買”,兩條腿走路,走得又快又穩。這在網際網路歷史上其實挺罕見的。大多數內容平台要麼只做到了流量,要麼電商轉型磕磕絆絆,字節幾乎是教科書等級地跑通了全流程。具體到競爭層面,字節對各家大廠的衝擊也是實打實的:廣告市場上,2023年字節營收1200億美元,廣告和行銷收入超4000億,首次超過阿里,成為中國最大的廣告平台。流量變現的頭把交椅,從阿里騰訊手裡,被字節拿走了。電商戰場上,抖音電商從零起步,用內容驅動交易,把貨架式電商打得有點懵。本地生活呢,抖音團購,確實讓美團感受到壓力了。最後還有AI大模型,豆包用激進的價格戰,迅速鋪開使用者規模。再加上字節的組織能力和人才吸引力,薪資體系和績效文化在圈內已經形成標竿,頂尖工程師、產品經理把字節當首選或次選,這種人才磁場效應,又在不斷強化字節的產品迭代能力。但“一己抗天下”這句話,可能說得太滿了。從“字節在多個賽道很強”到“字節一己抗衡所有大廠”,中間有一條挺寬的鴻溝。很多人忽略了這一點。騰訊的護城河,字節是真的跨不過去。這不是執行力的問題,是底層邏輯的問題。騰訊的核心資產,不是某個具體業務,而是微信承載的社交關係網路——每個中國網民幾乎都在其中的那張關係圖譜。它的黏性,來自人與人的連接,不是演算法推送的內容。經過幾年纏鬥,騰訊和字節其實都意識到一件事:誰也幹不掉誰。字節拿不下社交,騰訊也擋不住抖音長大。字節在社交上的嘗試,幾乎是一部失敗案例合集。多閃、飛聊,都沒激起什麼水花。即便有龐大的使用者量,也撬不動微信。因為社交產品有自我強化的網路效應——所有人都在微信上,你要讓我換個地方聊天,除非新平台能提供顛覆性的價值。目前看,沒有。沒有社交根基,就意味著字節缺了騰訊那種橫跨整個網際網路生態的底層連接能力。微信不只是聊天工具,還是遊戲分發管道、支付入口、小程序生態、內容傳播網路——這套“超級基礎設施”,字節很難複製。遊戲,是字節另一塊短板。字節做遊戲的結局,大家也看到了:全面撤退,朝夕光年關停。這其實暴露了字節能力邊界的一個重要特徵:字節本質上是一家擅長流量分發和廣告變現的公司。它的核心能力,是把對的內容推給對的人,用演算法最大化使用者注意力的商業價值。但遊戲不一樣。遊戲需要內容研發積累、使用者社群營運、IP資產沉澱,這些都是騰訊幾十年攢下來的東西,不是流量能直接轉化的。電商方面,說字節抗衡阿里可以,說“碾壓”就過了。抖音電商的銷售額增速,已經從2024年初的60%以上,跌到9月的不到20%。生活服務帶動的廣告收入,還不到大盤的5%。這兩條賽道上,抖音要面對的是淘天、拼多多、京東、美團、快手、小紅書……一堆對手。尤其拼多多,經常被字節的光芒蓋住,但它在低價心智上的深耕,對字節的壓制其實不小。抖音電商的核心是“內容種草到衝動消費”,這個鏈路對某些品類確實好用,但一到計畫性購買、標品比價,優勢就沒那麼明顯了。本地生活,更是一場持久戰。美團在外賣配送上積累了數十萬騎手的營運體系和精細化的城市物流網路,這是抖音流量砸不平的硬基礎設施。2022到2023年,抖音對本地生活發起猛攻,美團也守住了。到店團購,字節確實搶了些份額,但外賣這個高頻剛需品類,美團的護城河依然牢固。AI大模型,投入大,但回報還沒看到。豆包打價格戰,使用者規模上得快,但大模型行業還處在投入期,商業化周期很長。更關鍵的是,DeepSeek在全球範圍內突然引爆技術聲譽,說明國內AI賽道的格局遠未確定。任何一家公司,現在都不敢說已經贏了。字節的真正邊界:流量帝國,但不是全能帝國把字節的業務模組一個個看下來,會發現一個趨勢:“大力出奇蹟”的時代,正在進入新階段。過去的高增長,很大程度上靠短影片紅利和流量市場高速擴張。現在這兩個引擎都明顯減速了。抖音總使用者超8億,日活突破7億,天花板越來越近。流量池接近飽和之後,新增長點在那?目前還沒看到明確答案。或許可以這麼說:字節是當前中國網際網路競爭格局裡最有進攻性的公司,在商業化效率和業務廣度上,已經站上第一梯隊。但它也碰到了幾個根本性的天花板,讓“一己抗衡所有大廠”更像一個敘事上的誇張,而不是可驗證的判斷。騰訊的社交帝國,字節攻不進去;遊戲生意,字節已經放棄;金融支付,字節從來沒真正形成競爭力;雲端運算,阿里雲和騰訊雲的先發優勢,不是字節能輕易顛覆的。這些空白加在一起,其實是中國網際網路經濟相當大的一塊份額。更深一層的問題是:當我們說一家公司“能抗衡所有對手”,到底是什麼意思?如果指營收和利潤規模,字節確實做到了。如果指在每個賽道都佔優勢,字節沒有,也不太可能做到。如果指讓所有對手都感受到生存壓力——這倒是真的,但這和“抗衡”還有距離。有意思的是,這個敘事本身,某種程度上也是對字節商業模式的誤讀。字節的根本能力是流量分發和注意力變現,而中國網際網路生態裡,有大量價值不在這條邏輯鏈上。騰訊的遊戲社區、阿里的供應鏈金融、美團的城市物流、拼多多的低價供應鏈……這些都是依託不同底層資產建立的商業模式,不是流量和演算法能直接替代的。更長的時間軸:字節真正的考驗還沒來如果把時間拉長,字節面臨的真正考驗,不是能不能繼續侵蝕對手市場。TikTok的地緣政治風險,是懸在頭頂的一把劍。一旦國際化路線遭遇重大挫折,字節的整體估值和戰略空間都會受到根本性影響。國內廣告增速放緩,意味著最核心的盈利引擎正在降檔。AI大模型的高額投入,能不能在未來三到五年形成新的收入曲線,還是未知數。與此同時,對手們也沒閒著。騰訊視訊號在補內容生態的課,阿里電商在重新聚焦核心能力,美團在外賣和到店兩條腿上越走越穩,拼多多用極致低價和Temu持續擴張。這些公司都有字節無法輕易複製的壁壘,而且都在自我進化。真正意義上的“一己抗衡所有大廠”,在中國網際網路生態裡,可能從來就是一個偽命題。網際網路經濟的特點是強者恆強,但各強者之間往往佔據不同的生態位,彼此競爭,但也彼此難以替代。騰訊的社交不會被字節取代,阿里的供應鏈不會被字節取代,美團的騎手網路不會被字節取代——字節能做的,是在每條賽道上讓對手感受到壓力,迫使對手更快進化,讓整個行業的競爭烈度維持在高位。這已經是一種相當了不起的力量了。把時間軸拉長,字節面臨的真正考驗,或許不是它能不能繼續侵蝕對手的市場,而是它能不能接受一個更弔詭的角色——一個永遠缺席牌桌、卻不斷重新洗牌的“隱形莊家”。這個角色的詭異之處在於:字節越強大,恆生科技指數的估值邏輯就越被動搖。前十大成分股裡,六家與它直接競爭的公司佔了近40%的權重,而字節本身卻不在指數之內。這意味著,每當字節發一個新模型、推一個新應用,投資者能做的不是買入字節,而是下調對騰訊、阿里、快手們的預期。字節的每一次技術突進,都在給這些上市巨頭做一次“壓力測試”,而測試的結果,最終以股價下跌的形式寫在K線圖上。有人開玩笑說,字節跳動正在成為恆生科技股最大的“空頭”。但這個“空頭”的運作方式,和傳統做空完全不一樣——它不是在市場上賣出股票,而是在產品端不斷推高競爭門檻。廣告收入第一、電商衝到行業前三、本地生活切走美團份額、AI視訊讓快手的“可靈”估值邏輯被動搖……每一刀砍下去,都在壓縮友商的生存空間。更致命的是,當騰訊在發紅包、阿里在送奶茶、百度在搞補貼的時候,字節的Seedance 2.0幾乎沒有激勵、沒有誘導分享,內容卻在社交網路中自發擴散。這種“內容即廣告、使用即傳播”的裂變方式,讓巨頭們傳統的“燒錢換規模”打法顯得格外笨重。於是,一個結構性的困境浮現出來:中國AI產業在視訊生成、多模態理解上接連突破,恆生科技的投資者反而成了這股技術浪潮的“受害者”。因為那些突破帶來的價值,無法通過買入字節來兌現,只能通過避險其他公司的持倉來表達。這種“缺席的繁榮”,比在場內的空頭更可怕——你沒辦法做多它來對衝風險,只能被動承受它帶來的估值重估。從這個意義上說,字節對中國網際網路格局最大的貢獻,或許不是它打敗了誰,而是它的存在讓整個行業再也不敢懈怠。但與此同時,它也製造了一個懸而未決的懸念:如果字節始終不上市,它對港股科技類股的估值壓制會持續多久?那些在指數里的公司,能不能從“燒錢”轉向“燒技術”,從“拼規模”轉向“拼價值”,跑贏這場由字節設定的淘汰賽?答案無人知曉。但有一點是確定的:字節的進化速度,從來不會等人。而恆生科技指數的“倒春寒”,也許只是這場漫長重估的序章。當缺席的莊家一次次洗牌,牌桌上的玩家要麼找到新的籌碼,要麼接受被重新定價的命運。這既是字節的考驗,也是整個中國網際網路的考驗。 (心智觀察所)
字節豆包2.0發佈:推理成本降一個數量級,正面對標GPT-5和Gemini 3
字節發佈豆包2.0,旗艦版Pro全面對標GPT-5.2與Gemini 3 Pro。新模型在多模態、數學及程式設計等領域達到業界頂尖,同時將推理成本降低約一個數量級,顯著提升Agent應用性價比。目前已接入豆包App、TRAE及火山引擎API。字節跳動旗下豆包大模型正式進入2.0階段,推出面向Agent時代的系統性升級版本。新版本在保持與GPT-5.2和Gemini 3 Pro相當性能的同時,將推理成本降低約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。2月14日,字節跳動宣佈,豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和專門的Code模型。其中旗艦版豆包2.0 Pro全面對標GPT-5.2與Gemini 3 Pro,在多數視覺理解基準測試中達到業界最高水平,並在數學奧賽IMO、CMO和程式設計競賽ICPC中獲得金牌成績。該系列模型已全面上線。豆包2.0 Pro已接入豆包App、電腦端和網頁版的"專家"模式,Code版本已整合至AI程式設計產品TRAE,火山引擎同步上線面向企業和開發者的API服務。分析認為,在現實世界複雜任務中,由於大規模推理與長鏈路生成將消耗大量token,豆包2.0的成本優勢將成為關鍵競爭力。這標誌著字節跳動在大模型商業化應用上邁出重要一步。01多模態能力達到世界頂尖水平豆包2.0全面升級了多模態能力,在視覺推理、感知能力、空間推理與長上下文理解等任務上表現突出。在動態場景理解方面,該模型在TVBench等關鍵測評中處於領先位置,在EgoTempo基準上甚至超過人類分數,顯示其對變化、動作、節奏等資訊的捕捉更為穩定。在長視訊場景中,豆包2.0在大多數評測上超越其他頂尖模型,並在多個流式即時問答視訊基準測試中表現優異。這使其能夠作為AI助手完成即時視訊流分析、環境感知、主動糾錯與情感陪伴,實現從被動問答到主動指導的互動升級,可應用於健身、穿搭等陪伴場景。02推理能力對標頂尖模型,成本優勢顯著豆包2.0 Pro通過加強長尾領域知識,在SuperGPQA上分數超過GPT-5.2,並在HealthBench上獲得第一名,在科學領域的整體成績與Gemini 3 Pro和GPT-5.2相當。在推理和Agent能力評測中,該模型在IMO、CMO數學奧賽和ICPC程式設計競賽中獲得金牌成績,也超越了Gemini 3 Pro在Putnam Bench上的表現。在HLE-text(人類的最後考試)上,豆包2.0 Pro取得最高分54.2分,在工具呼叫和指令遵循測試中也有出色表現。更重要的是,字節跳動表示,該模型在保持與業界頂尖大模型相當效果的同時,token定價降低了約一個數量級,這一成本優勢在大規模推理與長鏈路生成場景中將變得更為關鍵。基於OpenClaw框架和豆包2.0 Pro模型,字節跳動在飛書上建構了智能客服Agent。該Agent能通過呼叫不同技能完成客戶對話,遇到難題時會主動拉群求助真人同事,幫客戶預約上門維修人員,並在維修後主動回訪和推薦產品。03Code模型提升開發效率豆包2.0 Code基於2.0基座模型針對程式設計場景進行最佳化,強化了程式碼庫解讀能力和應用生成能力,並增強了模型在Agent工作流中的糾錯能力。該模型已上線TRAE中國版作為內建模型,支援圖片理解和推理。在實際應用中,開發者使用TRAE配合豆包2.0 Code,僅需1輪提示詞就能建構出"TRAE春節小鎮·馬年廟會"互動項目的基本架構和場景,經過5輪提示詞即可完成整個作品。該項目包含11位由大語言模型驅動的NPC,能根據人設自然聊天、招呼顧客、現場砍價,AI遊客也會自主決定去那家攤位、買什麼、說什麼。相關提示詞與素材已在GitHub開源供開發者測試。目前,豆包2.0 Pro已面向C端使用者在豆包App、電腦端和網頁版上線“專家”模式;面向企業和開發者,火山引擎已同步上線豆包2.0系列模型API服務。字節跳動表示,未來將繼續面向真實場景迭代模型,探索智能上限。 (硬AI)
Seedance2.0亂殺後,豆包2.0終於來了!字節在接近自己的Gemini 3時刻
價格只有Gemini 3 pro的1/4、多模態理解和推理能力頂級、從底層支撐了現象級Seedance2.0大殺四方的大一統基座模型豆包2.0,終於來了。這是最近最被期待的模型之一。即便這個春節的AI圈如此熱鬧,你也不得不承認,目前字節跳動成功搶走了絕大部分注意力。先是Seedance2.0的驚豔亮相——各個社交網路上都是它製作的驚人的視訊,被形容為“殺死比賽”和結束AIGC童年期,並且被很多人用來與去年DeepSeek效應對比;再是媲美Nano Banana,在理解和推理上有很大進步的Seedream模型;然後就是剛剛,為前兩個模型提供了底層智能基礎的基座模型豆包2.0最終亮相。這次豆包大模型2.0系列(Doubao-Seed-2.0)提供了多個模型選擇:包含 Pro、Lite、Mini 三款多模態通用模型,以及面向開發者的 Code 模型(Doubao-Seed-2.0-Code),以滿足不同場景下企業和使用者對延遲和成本的不同需求。至此,字節整個豆包大模型家族到齊。三連擊,注意力拉滿。其實圍繞模型的刷屏,以前在DeepSeek,Kimi 和千問身上都看到過,但這一次發生在豆包系列“三連擊”身上的“刷屏”還是有挺大的的不同:它自己沒怎麼強調、外界也還沒怎麼討論它的“榜單”排名,但人們第一時間就這麼用起來甚至是瘋狂地玩了起來。在即夢裡,在剪映裡,在豆包裡,在火山引擎的api裡,在各種社交網路裡。模型被廣泛討論,而且是以一種真正被大家用起來的方式流行起來,讓人不再太關注什麼模型指標,參數,網狀評分圖,甚至Seedance 2.0都快讓你不需在意什麼專業提示詞這些東西了——這才是這次“殺瘋了”的豆包模型系列最不一樣也最值得關注的地方。一心要解決真實世界問題的豆包模型仔細看看這次發佈的幾款模型以及研究字節在模型上一貫的策略和思路,能更好理解這種不同。最為驚豔的Seedance2.0,此次最核心的幾個特點包括對物理規律理解,對複雜指令的跟隨,更真實的音效與視訊的配合,以及對複雜運鏡和特效的把握,這些都是專業以及普通人們的影視和視訊創作裡最真實的需求。在諸多的使用裡,你會發現大家在表達一個感受:Seedance2.0吸引人的不只是模型能力,還有它的互動和使用的順滑。讓人感覺已經把產品互動的需求“訓”到了模型層面。除了討論模型,使用者會覺得它是一個完善的為真實需求服務的agent,一個使用者需求滿足的很好的產品。而豆包這個基座模型,解決的也全是真實世界的難題。從最初幾款模型瞄準的更廣泛而基本的問題,到今天的複雜系統問題。字節通過用火山引擎,豆包App等與豆包的徹底連通,來讓真實的使用者和使用者的需求直接一桿子捅到底,影響基礎模型訓練的方向和標準。這都體現在了豆包2.0的更新裡。它的VLM提升了視覺與多模態理解能力,特意為那些最容易產生幻覺的場景做最佳化,同時它提升了複雜指令執行能力,對“記憶”的理解開始更加真實,讓模型在複雜真實任務裡更依賴即時判斷的推理邏輯而非死記硬背。此外,它增強了搜尋能力、讓知識更強,此次也同時發佈了專為coding場景服務的分支模型。而且,在豆包2.0背後,字節再次強調了它自己的一整套基於真實世界任務建構的內部評估,它是完成端到端任務的關鍵。據矽星人瞭解,字節還為這些看起來很“普通”的工作分配了充足的算力資源。這種“務實”並不意味著模型不再湧現新能力。在我們看到的一份預覽報告裡,豆包2.0在處理一個真實的複雜程式碼生成任務時,它的解決方案策略不同於評測基準的官方參考實現。這雖然沒有被字節形容為DeepSeek論文裡那種“aha moment”,但也有了這個意味。因為這背後模型不再僅僅是針對已知解決方案做模式匹配,而是表現出在複雜計算領域進行嚴格問題求解的能力。這才是推理能力投射到真實世界任務後該有的作用。豆包作為字節唯一的基座模型,選擇了大一統的多模態原生框架,也就是所有模態都從一開始就訓在一起,推理能力agent能力也都是原生支援多模態的。這樣的基礎能力正是Seedance這些“垂直”模型給人驚豔體驗的根本。在基於視覺的推理能力上,豆包2.0展示了對GUI操作介面的很強的理解和推理,甚至是進一步增強了的即時反思能力,這些都是做一個好的agent的基礎。一個例子是freeCAD任務。CAD軟體其實是個非常高噪音的圖形操作環境,在其中進行語義 GUI 理解,需要通過視覺理解環境,然後通過反思、退出甚至循環的方式分析反饋,自我診斷,從錯誤裡學習,最終自己學會一種“在環境裡學習”的能力。此前同樣讓人眼前一亮的豆包手機背後,也是這樣的模型能力提供支撐。而這些能力會進一步提供給Seedance和Seedream這樣的模型。在Seedance2.0這次亮眼的能力中,就有一個很有代表性的細節。我用它花了不到10分鐘做了一個風格遷移的動畫片,你可以看到它的“參考”能力,已經進入了風格的層面,這是單純的視訊模態的模型無法具備的,它來自於豆包2.0這個基座模型,來自於一個把所有能力和所有模態進行大一統訓練的強大底層模型。字節自己的Gemini3時刻豆包2.0這次的整體更新非常值得仔細品味。根據字節內部透露,它非常重視在一些基礎科學裡的任務表現,比如一些數學猜想、廣義相對論和量子編譯器偵錯以及計算化學的各種任務。這樣的偏好說明字節嘗試讓它繼續打好通用能力的基礎,考察和訓練的一大重點,都是理解抽象科學概念、主動發現並修復真實漏洞的能力。所以,如果用人們習慣的“屠榜”視角去看,豆包系列有個很大不同,它其實沒有去捲最驚豔的那些塔尖上的任務,它花了大量精力去尋找多模態橫向增加智能維度,與更靠譜的處理最廣泛基礎需求的能力之間的微妙平衡。而這無疑是挺考驗耐心和節奏的把握的。這背後也有“只有字節能這麼做”的理由,那就是豆包app。豆包已經是個國民級產品,所以當它背後的模型更新時,意味著大量天天用豆包的活躍使用者的一個離不開的產品的更新,那麼它當然要提高最廣泛最基礎的任務的完成度和能力。這是其他模型可能不需要考慮,也無法“利用”的局面。換句話說,豆包系列模型是少有的真的在面對大量真實鮮活具體使用者做訓練和最佳化迭代的模型。而負責把這種思路落實下來的一個關鍵環節,是火山引擎。在此前我們和字節模型團隊的交流裡,他們選擇了一條很接近字節做產品的思路的方式在做模型:模型的設計其實最終是和真實使用者一起完成的,火山引擎作為模型對外統一的出口,和字節的模型部門Seed緊密合作,火山的模型策略團隊會把市場上的需求反饋收集和抽象出來,直接影響到模型的重要功能和研發方向,一切都要用真實業務價值來衡量模型能力。在最近的三連擊過程裡,火山引擎也開始面對甜蜜的煩惱,Seedance2.0等模型的需求暴增,給火山帶來巨大需求,對它算力基礎設施的要求越來越高。不過,正是這個增長過程裡積累的真實經驗,在反過來幫助模型在訓練中得到更高的token利用率和更好的算力效率。這一切都不得不讓人想到Google。在我們此前的文章《火山有了自己的token經濟學》裡,我們就提到,字節和Google是同一個路線:關鍵技術全部自研,模型閉源,產品到研發直接全面打通。以及,豆包就對應著Gemini,一個大一統的多模態agent模型。Seedance 緊跟Veo,甚至超過了對方。這一切的技術基礎也和Google類似,都長在自己的以AI為核心的機器學習平台和雲服務上,然後這些“Gemini同款”和“豆包同款”細化成產品再提供給外界。而Google是在Gemini 3 的發佈之後,真正證明了自己這一整套路線的正確,從此真正進入自己的節奏裡。此次豆包系列所創造出的氛圍也異曲同工。Google在發佈Gemini3時的一個變化是,新模型和自己國民級應用以及自有基礎設施平台第一次在第一時間緊密結合,Gemini 3第一時間上線Google各種應用,同時,Nano Banana Pro緊隨其後進一步確立它模型在使用者中的地位。而字節這一次的節奏也很有意思,Seedance並非單獨上線,而是和一系列產品緊密結合,從即夢到小雲雀到剪映再到豆包,最終和豆包大模型一起在火山上提供給更多使用者,你都可以想像春晚期間多少人在這些平台上創造自己的“短劇”,火山的token會繼續井噴。堅定地選擇把全模態和通用能力都全部訓到一起,堅持要把產品和模型打通,把對外服務的基礎設施看到的產業需求和模型功能設計打通,這是兩家公司的相同決定。而Google的選擇在很長一段時間並非公認的正確方向,甚至質疑不斷,直到Gemini 3的到來;而字節在以開源為主戰場的模型競爭氛圍裡繼續堅持了閉源和與真實規模化的應用結合的路線,同樣曾經是,也許現在依然是一個“非共識”的方向。現在都到了turning point。在我們去年底的預測裡我們曾預測了字節的豆包系列模型的轉折點,我們當時這樣寫道:“2025年,DeepSeek的成功改變了中國模型廠商們的技術策略,開源成了最優選擇,字節成了僅有的幾個依然閉源的廠商,這樣的決策在2026年將迎來“證明時刻”,字節在模型研發上的各種積累其實已經有跡可循,Seed是時候交出一份閉源答捲了。”看起來,今天這個預言似乎正在應驗。在模型和落地上按自己的想法走出一條路,並且用一代模型直接證明了這條路的正確,字節在這個二月,算是接近它自己的Gemini 3時刻了。 (矽星人Pro)
字節狂飆、阿里亮劍…大模型混戰春節檔
除夕的煙花尚未綻放,AI戰場早已硝煙瀰漫。2026年馬年春節,表面上是百度5億、騰訊元寶10億紅包、阿里30億免單的混戰,實則是國產大模型陣營一次史無前例的“集體亮劍”。從臘月二十開始,字節、智譜、MiniMax、Kimi扔出王炸,DeepSeek悄無聲息地完成了關鍵迭代,阿里Qwen3.5箭在弦上,百度O計畫秘而不宣,騰訊則請來姚順雨這位“關鍵先生”在技術部落格裡埋下伏筆。這不是一場擠牙膏式的常規更新,而是一場關於“大模型下半場往那走”的路線對壘。每一家都在賭:未來兩年,使用者和開發者真正離不開的那個模型,究竟長什麼樣?大廠篇:字節暫領風騷阿里磨刀,百度織網,騰訊“深潛”字節跳動:Seedance 2.0 是截至目前這春節檔唯一的“破圈者”。如果只選一個模型定義2026年春節,那一定是字節的Seedance 2.0。2月7日,沒有發佈會,沒有媒體通稿,字節只是在飛書文件裡輕描淡寫扔下一句“Kill the game”。隨後發生的事情超出了所有人的預期:《黑神話》製作人馮驥稱其為“地表最強視訊生成模型,沒有之一”;影視颶風Tim連說六次“恐怖”;二級市場影視傳媒類股掀漲停潮;海外X平台上,外國網友四處求中國手機號體驗Seedance 2.0。憑什麼?因為Seedance 2.0完成了視訊生成從“玩具”到“工具”的關鍵一躍。它不僅支援圖文音視四模態輸入、多鏡頭連貫生成,更可怕的是它對物理世界的“理解”,你上傳一張建築正面照,它能自動生成繞到建築背面的運鏡,且與現實幾乎一致。字節這一仗打出了兩個結論:第一,視訊生成不是Sora的專利,中國大廠不僅能跟,還能超;第二,DeepSeek之後,字節是第二個讓矽谷感受到“技術代差焦慮”的中國玩家。當然,狂歡背後也有隱憂。上線僅兩天,即夢就緊急限制真人圖生視訊——當造假成本趨近於零,監管的達摩克利斯之劍隨時可能落下。2月12日,網信中國公眾號發文稱網信部門督促網站平台深入排查整治,依法依約處置帳號13421個,清理違法違規資訊54.3萬餘條。下一步網信部門將對無AI標識的虛假不實資訊保持高壓嚴管態勢,發現即處置,嚴厲打擊違規行為。阿里:Qwen3.5發佈在即,這一次要做“看得懂世界”的基座。相比於字節的高調,阿里的春節顯得“蓄勢待發”。2月9日,Hugging Face頁面上悄然出現Qwen3.5提交程式碼合併的PR,開發者從中扒出關鍵資訊:全新混合注意力機制,極有可能是原生視覺語言模型(VLM),且計畫開源2B密集版和35B-A3B的MoE版 。這是阿里一次明確的戰略轉向。此前千問系列雖然強大,但始終是“純文字學霸”。而Qwen3.5一旦以原生VLM(視覺語言模型)形態登場,意味著阿里決心把視覺理解直接塞進基座,而不是像多數廠商那樣靠“視覺編碼器+大語言模型”拼湊。如果落地順利,這將是國產開源模型在多模態原生能力上的一次重要卡位。百度:O計畫“深潛”,入口才是護城河百度是今年春節最早砸紅包的玩家,5億、北京台春晚首席AI合作夥伴,攻勢不可謂不猛。但在模型層面,百度顯得異常安靜。近期,百度“O計畫”的代號在圈內流傳,內部人士僅透露“與百度APP有關” 。這其實透露出百度現階段的核心邏輯,也就是不急於發一個新模型秀肌肉,而是守住2億月活的文心助手,把百度APP做成AI時代的超級入口。這未必是錯。當字節、阿里、騰訊都在為“入口”瘋狂撒錢時,百度手裡本就攥著一個國民級入口。O計畫究竟是在訓練新模型、重構搜尋體驗,還是醞釀Agent應用?懸念可能要留到節後了。騰訊:沒有新模型,卻可能是最深遠的佈局。盤點春節檔時最容易漏掉騰訊,畢竟元寶的紅包大戰看起來只是“跟牌”,並沒有像字節、智譜那樣扔出重磅模型。但懂行的人盯著另一件事:AI大拿姚順雨加入騰訊後首次帶隊發佈研究成果。2月3日,騰訊混元技術部落格上線,開篇就是姚順雨團隊的CL-bench基準研究。結論非常“狠”:全球前十的語言模型在“從上下文中學習新知識”這項能力上,平均解決率只有17.2%——這些頂級的做題家,其實根本不會利用上下文 。這意味著什麼?姚順雨給出了一個極具野心的願景:未來競爭的焦點不是誰能把模型訓練得更好,而是誰能為任務提供最豐富、最相關的上下文。使用者將從“資料提供者”轉變為“上下文提供者”。這或許解釋了為什麼騰訊春節沒有搶發基座模型——他們在押注一條更長的賽道:定義大模型下一階段的核心能力標準。一旦CL-bench成為行業共識的評估基準,騰訊就握住了下一代模型迭代的方向盤。創業公司篇四小龍分化,各有各的“護城河”如果說大廠的春節檔是“入口+模型”雙線作戰,那麼創業公司的牌桌上只剩下純粹的模型硬仗。智譜:Agentic Engineering的開路先鋒。2月12日,智譜GLM-5上線即開源。744B參數、SWE-bench 77.8分、全球開源第一、國產晶片全適配 。但參數不是重點,重點是智譜為這代模型重新定義了角色:不是對話助手,是“系統架構師”。GLM-5能自主拆解需求、呼叫工具、偵錯程式碼、交付可部署產品。一位開發者用它做出了橫版解謎遊戲,另一個做出了論文版“抖音”,已提交商店稽核 。智譜賭的是,2026年,大模型必須從“寫程式碼”進化到“寫工程”。從GLM-5開始,他們不再和同行比誰更會聊天,而是比誰能真正替代初級工程師。MiniMax:把Agent做成白菜價。MiniMax M2.5在同一天發佈,走了另一條路。10B啟動參數,SWE-bench 80.2%,超越Claude Opus 4.6。但真正讓行業側目的是它的成本:1萬美元理論上可支援4個Agent連續工作一年 。這是MiniMax一貫的風格,不做最聰明的模型,做最便宜的生產級模型。當別人還在卷榜單分數時,MiniMax已經在算“Agent小時單價”。創始人閆俊傑的邏輯很清晰,Agent規模化部署的最大瓶頸從來不是能力,是成本。M2.5把推理速度做到主流模型2倍,把價格打到幾分之一,這是在為Agent經濟鋪路。Kimi:Agent叢集,把多模態玩出花。Kimi K2.5趕在2月初發佈,是春節檔的“早鳥”。它的亮點是原生多模態架構和Agent叢集——模型可以自主建立多個分身智能體,按需組成團隊平行工作 。大規模搜尋場景下,效率碾壓單Agent。同時上線的Kimi Code已整合VSCode、Cursor,開發者可以直接丟進一張UI設計圖,讓AI照著寫程式碼 。這是目前國內把“視覺理解→程式設計執行”鏈路跑得最順的產品。DeepSeek:V4還在憋,但長上下文已封頂。整個春節檔,DeepSeek沒有任何官方發佈,卻在使用者端“被更新”了。網友們發現,DeepSeek的回覆風格變了:上下文窗口從128K飆升至1M,知識庫更新至2025年5月 。這依然是那家倔強的公司——不做多模態,不追風口,把文字推理和長程式碼理解死磕到極致。1M上下文意味著什麼?你可以把《三體》全集、或者一個中大型公司的完整程式碼倉庫一次性喂給它。這不僅是技術領先,更是對Agent場景的戰略預判:真正的複雜任務,從來不是靠幾輪對話完成的。據爆料,DeepSeek V4的程式設計能力內部測試已超越Claude 。它遲遲不發,要麼是在攻克更難的關卡,要麼是在等一個“壓軸登場”的時機。2026年,沒人再提“通用”回顧這二十多天的密集出牌,一個清晰的圖景浮現出來:大模型行業已經告別“大一統”的幻想。字節押注視訊生成,賭的是AIGC工業化;智譜All in Agent工程,賭的是程式設計師生產力重構;MiniMax死磕推理成本,賭的是Agent規模化落地;Kimi走通多模態原生+端側,賭的是開發者的手邊工具;DeepSeek固守長文字高地,賭的是複雜推理的不可替代性;阿里即將亮劍原生VLM,賭的是多模態基座的開源生態;百度織網入口,賭的是場景和資料;騰訊深潛上下文學習,賭的是下一階段的定義權。沒有那一家是“全面領先”,但每一家都在自己的賽道上跑到了極致。這其實是健康的訊號。當一個行業從“所有人都想造出同一個神”轉向“各造各的神”,說明它正在走向成熟。最後,如果你問我,我的答案是:我pick字節Seedance 2.0。不是因為它的技術參數最漂亮,也不是因為它引發的股票漲停潮最猛烈。而是因為它讓圈外人又一次真正感知到了AI的衝擊。一位從業者看完AI生成的15秒短片後說“《流浪地球3》的預算可能要砍了”,這正是技術跨越鴻溝的時刻。當然,這只是春節檔的開幕戰。Qwen3.5還未正式亮相,DeepSeek V4這頭“房間裡的大象”還在踱步,百度的O計畫仍是黑盒,騰訊的上下文學習革命才剛剛寫在紙上。但有一點已經確定:2026年,單純靠“會聊天”已經拿不到牌桌入場券了。煙花散去,留在場上的只能是那些能真正捲入工作流、嵌入生產線、重構成本結構的狠角色。這一票,我投給那些讓對手感到脊背發涼的玩家。 (TechWeb)
Seedance2.0海外爆火!美國導演:可能會搞垮好萊塢……
貓咪暴揍哥斯拉、葉問拳打鋼鐵人、孫悟空棒打奧特曼、小學生隔扣詹姆斯……最近,Seedance 2.0全球爆火,相關視訊也在不少短影片平台刷屏了!近日,字節跳動最新視訊生成模型Seedance 2.0在即夢、豆包、小雲雀等產品開啟內測。它支援圖像、視訊、音訊、文字四種模態輸入,只需輸入提示詞或上傳參考圖,就能在60秒內產出帶完整原生音軌的多鏡頭視訊,大幅降低專業創作的門檻與成本。憑藉多模態輸入、超強參考能力等亮點,Seedance 2.0很快引爆網路。不僅國內,Seedance 2.0更在海外社交平台上持續刷屏、頻頻登上熱搜。海外使用者積極嘗試用它生成諸如“悟空對決漫威英雄、寵物貓狗隔扣NBA球星”等天馬行空的視訊內容,多條演示影片播放量破百萬。美國導演:這會搞垮好萊塢據參考消息報導,多位美國導演或影視從業者在使用Seedance 2.0之後,公開表達了諸如“好萊塢要完蛋了”或“這東西說不定真能搞垮好萊塢”的感慨。導演Charles Curran在社交平台連續發文,他為從未面世的真人電影製作了一版預告片,僅用20分鐘,花費60美元,借助Seedance 2.0完成,“這玩意兒說不定真能搞砸好萊塢呢。”在他發佈的1分24秒的視訊裡,做到了電影級畫面特效、音畫同步、多機位“拍攝”等。據瞭解,Charles Curran是美國紐約資深紀錄片導演、製片人、剪輯師,長期深耕紀實影像與實驗電影創作,同時為國際頂級品牌提供商業影像服務。不少科技工作者和AI研究者也表達了類似的觀點:另據南都報導,對於網友提出的可能混淆現實的擔憂,2月9日,即夢創作者社群中,平台營運人員發佈消息稱:“Seedance 2.0在內測期間收穫了遠超預期的關注,感謝大家的使用反饋。為了保障創作環境的健康可持續,我們正在針對反饋進行緊急最佳化,目前暫不支援輸入真人圖片或視訊作為主體參考”,並表示平台深知創意的邊界是尊重,產品調整後會以更完善的面貌與大家正式見面。 (財文社)