#字節
阿里、騰訊、字節,又開戰了!
筆記君說:最近,整個商業圈和AI圈,都被同一個詞徹底刷屏了。這個詞,黃仁勳在萬眾矚目的GTC大會上,全程掛在嘴邊,把它抬到了未來經濟核心支柱的高度。阿里為它成立了和淘天電商、阿里雲平級的一級事業群,由集團CEO吳泳銘親自掛帥;釘釘創始人無招,直接把做了11年的釘釘徹底打碎重寫,All in這個賽道。除了阿里,字節跳動和騰訊都已深度押注Token經濟。字節從“賣算力”轉向“賣智能”,將Token視為新一代增長引擎,邏輯是“大模型不被大規模使用就是廢紙”。騰訊3月將原MaaS平台升級為 TokenHub ,開放微信、小程序、企業微信、元寶、QQ等國民級應用生態,推出“龍蝦管家”等工具。阿里、字節、騰訊都從“模型競賽”走向 “Token效率競賽” 的新範式。甚至連國家資料局,都專門在國家級論壇上,給它敲定了官方中文名。這個詞,就是Token,官方定名:詞元。與此同時,一組震撼的資料也同步公佈:2024年初,中國日均詞元呼叫量僅為1000億;到2025年底,這個數字躍升至100兆;2026年3月,已經突破140兆,兩年時間增長超千倍。很多人可能早就聽過這個詞,覺得它只是一個AI圈的技術黑話,和自己的企業和生意沒什麼關係。但我想告訴你的是:科技大佬們下重注的詞元經濟學,從來都不只是一個技術術語,而是一套正在重構整個商業世界、甚至重塑全球競爭力的完整經濟邏輯。它不僅決定了未來十年你的企業能不能活下去,甚至藏著中國智能時代的國運級機會。今天,我們就用大白話,把黃仁勳、吳泳銘、無招都在談論的詞元經濟學,一次性講透。一、詞元到底是什麼?想要看懂詞元經濟學,首先要搞懂:詞元到底是什麼?1.詞元,是AI能讀懂的“最小識字積木”我們人類說話、寫字,最小的資訊單位是字;但AI不一樣,它沒辦法直接讀懂人類的文字,它有自己的“語言體系”,而詞元,就是AI能聽懂、能處理、能輸出的最小資訊單位。舉個最簡單的例子:1個漢字是1個字元,但1個詞元,可能是一個詞、半個詞,甚至一個標點符號。比如“吃飯”這2個漢字,在AI眼裡可能就是1個詞元;“人工智慧”4個漢字,可能會被拆成2個詞元;英文裡的“unbelievable”,會被拆成否定前綴“un”、動詞詞根“believe”、形容詞後綴“able”3個詞元。你可以把它理解成AI的“識字積木”:人類用漢字組詞造句,表達想法;AI用詞元拼接組合,理解世界、完成任務。沒有詞元,AI就是一堆不會思考的程式碼;有了詞元,AI才有了認知和執行的基礎。2.詞元,是智能時代真金白銀的“硬通貨”上面是技術層面的解釋,在黃仁勳這些商業大佬眼裡,詞元的真正身份,是智能時代的硬通貨,是和黃金、電力一樣的基礎生產資料。它同時具備三重核心屬性,每一個都在重構商業的底層邏輯:第一,它是AI世界的成本單位;黃仁勳在GTC大會上,給詞元做了一套完整的分層定價體系,從免費到超高速,一共分了五個檔次:免費層:高吞吐、低響應速度,靠廣告變現;中級層:每百萬詞元約3美元,適配基礎推理場景;高級層:每百萬詞元約6美元,適配通用高品質推理;高速層:每百萬詞元約45美元,適配低時延核心業務;超高速層:每百萬詞元150美元,適配科研、即時關鍵任務。你可能會問:都是一樣的詞元,價格怎麼差了50倍?道理很簡單,就像你寄快遞,同樣一個包裹,普通快遞3天到,同城閃送2小時到,速度和確定性不一樣,價格當然天差地別。對企業來說,核心業務的即時決策,晚一秒都可能造成巨大損失,自然願意為更快的詞元響應速度付更高的溢價。第二,它是AI世界的效率單位;黃仁勳在演講裡說了一句石破天驚的話:未來的資料中心,不再是檔案儲存倉庫,而是生產詞元的“工廠”。工業時代,衡量一個鋼鐵廠牛不牛,核心指標只有一個:年產多少噸鋼;網際網路時代,衡量一個資料中心強不強,看的是算力峰值、儲存容量;但到了智能時代,衡量一個資料中心的核心指標,只有一個:每秒能生產多少詞元。固定功率下,每瓦電力能產出多少詞元,直接決定了你的生產成本,決定了你在商業競爭裡有沒有活路。第三,它是AI世界的新生產資料,甚至是新貨幣。黃仁勳預判,未來企業招聘,薪資裡會自帶“詞元配額”,就像現在公司給你配電腦、配辦公手機一樣,詞元會成為你幹活的必備生產資料。現在的矽谷,已經有很多科技公司在這麼做了。你想一下,未來的職場,沒有詞元,你就沒法呼叫AI智能體,沒法完成方案、程式碼、資料分析,就像現在沒有電腦,你沒法辦公一樣。詞元,正在成為智能時代,每個企業、每個人都離不開的基礎生產資料,成為AI世界裡流通的“通用貨幣”。二、從爆火的“龍蝦”,看懂詞元經濟為什麼突然爆發講完了詞元是什麼,你可能還有一個問題:詞元這個概念早就有了,為什麼偏偏在現在,突然就成了全行業的風口?答案,藏在那隻紅遍全網的“龍蝦”——OpenClaw裡。這只被網友戲稱為“龍蝦”的開源AI智能體框架,在2026年初徹底破圈,GitHub上的星標數量登頂歷史榜首,全網掀起了一場“全民養蝦運動”。很多人跟風養蝦,但沒看懂它背後真正的顛覆性意義:這只龍蝦,讓無數人第一次真切感受到,AI真的能當一個7×24小時不休息的打工人,而養活這個數字員工的唯一口糧,就是詞元。先給大家看一組資料,你就知道它對詞元消耗的拉動有多恐怖:傳統對話式AI,一問一答,一次互動也就消耗幾百到幾千詞元,一個普通使用者,一個月也用不了100萬詞元;但OpenClaw不一樣,它採用“主動喚醒→檢查→推理→休眠→循環”的永動模式,7×24小時不間斷運行,重度企業級使用者,單日詞元消耗就能突破1億,甚至有人6小時就燒掉了上千塊的詞元。為什麼它能讓詞元消耗呈指數級爆發?因為它讓AI完成了一次本質躍遷:從“工具”,變成了“員工”。黃仁勳在GTC上直接宣告:SaaS時代正在終結,AaaS(Agent as a Service,代理即服務)時代已經到來。那SaaS和AaaS,到底有什麼本質區別?過去你買SaaS軟體,買的是“工具”。軟體是死的,你得自己招人,自己教員工怎麼操作,自己填資料,自己走流程,自己點滑鼠。你買的是一個“更快的馬車”,最終能不能跑到終點,還是要靠人來駕馭。但現在你買AI Agent(智能體),買的是“員工”。你不用管它怎麼操作,不用教它流程,不用盯著它打卡上班,你只需要說清楚你的目標:“幫我生成上周的銷售周報,拉取全管道資料,分析異常波動,給出最佳化方案,同步給所有區域負責人”。剩下的事,它會自己拆解任務,自己呼叫工具,自己拉取資料,自己完成報告,自己同步資訊,全程不用你碰一下滑鼠。這個數字員工,不拿工資,不摸魚,不請假,不鬧情緒,7×24小時連軸轉,它唯一要的“口糧”,就是詞元。這就是詞元經濟突然爆發的核心密碼。三、詞元經濟學的底層邏輯到底是什麼?詞元正在從四個維度,徹底重構我們熟悉的商業邏輯,甚至改寫整個經濟的增長範式。1.詞元經濟學,是一整條完整的產業鏈,重構了AI產業的商業閉環黃仁勳的“Token工廠經濟學”,從頭到尾都圍繞詞元展開,分成清晰的五層架構:最底層,是能源與算力,這是詞元生產的“原材料基地”,沒有電力和算力,詞元就是無源之水;往上,是晶片與系統,這是詞元生產的“生產線”,決定了詞元的生產效率和生產成本;再往上,是大模型,這是詞元的“精煉廠”,把基礎詞元,變成具備推理、執行能力的智能能力;再往上,是Agent開發平台,這是詞元的“流通管道”,把智能能力封裝成企業能用的數字員工;最上層,是企業應用場景,這是詞元的“消費終端”,詞元在這裡轉化成實實在在的商業價值。你看,整條產業鏈,從生產、加工、流通到消費,形成了一個完整的商業閉環。上游賺的是詞元生產的錢,中游賺的是詞元精煉的錢,下游賺的是詞元消費的錢。所有環節的價值,都可以用詞元來統一計量、統一結算。2.詞元經濟學,讓智能有了統一的度量衡商業史上,每一次通用度量衡的出現,都會帶來一次商業範式的徹底革命。工業時代,我們用“千瓦時”來度量電力,從此,所有的工業生產,都有了統一的成本和效率標尺,人類正式進入工業文明。網際網路時代,我們用“GB”來度量流量,從此,所有的數字業務,都有了統一的計量標準,人類正式進入資訊時代。到了智能時代,我們將用“詞元”來度量智能,從此,所有的AI能力,都有了統一的價值標尺,人類正式進入智能時代。這就是詞元經濟學最核心的本質:萬物皆詞元。不管是文字、圖片、視訊、音訊,還是3D內容、機器人控制指令,最終都能被轉化成詞元來處理、來定價、來交易。以前,你沒法衡量寫一份方案的智能,和做一張設計圖的智能,那個更值錢;你沒法核算AI做一次客戶溝通,和做一次資料分析,分別應該給企業帶來多少價值。但現在,詞元給了所有智能能力一個統一的標尺,你可以精準計算每一個詞元的投入,能帶來多少產出。智能第一次從一個模糊的概念,變成了可計量、可定價、可交易的標準化商品。這是整個商業世界重構的起點。3.詞元經濟的主戰場在To B端無招在悟空平台的發佈會上,說了一句話:AI時代的革命性變革是生產力,不是消費。To C的詞元消耗,大量是無效的、娛樂化的,增長是線性的;但To B的數字生產力一旦爆發,詞元的消耗就是指數級的。這句話,不僅點透了詞元經濟的核心,更點透了中國經濟未來的增長密碼。過去二十年,中國網際網路行業的增長,一直被兩大天花板死死卡住,而詞元經濟,直接把這兩塊天花板,徹底打碎了。第一塊天花板:勞動人口的限制。AI時代,憑空多出了海量的“數字勞動力”。這些數字員工,不需要戶口,不需要社保,不受人口老齡化的限制,不受人口周期的約束,你的企業需要多少,就能“招聘”多少。以前一個企業,最多管理幾萬、幾十萬名員工;現在一個企業,理論上可以管理幾百萬、幾千萬個數字員工。這是什麼概念?這相當於,中國經濟,憑空多了一個沒有上限的“勞動力增量池”,直接破解了人口老齡化、低生育率帶來的勞動力短缺難題,為經濟增長打開了全新的空間。第二塊天花板:商業成本中的勞動力成本。過去,網際網路公司賺的是什麼錢?大多是行銷的錢,廣告、電商佣金、遊戲充值,這些錢,加起來只佔中國GDP的1%-2%。盤子就這麼大,大家捲來捲去,都是存量博弈,你多賺一塊錢,別人就少賺一塊錢。但詞元經濟時代,AI公司能賺的,是人力資源的錢。根據國家統計局的資料,中國GDP裡,勞動者報酬的佔比,常年保持在40%以上,這是一個幾十兆級的增量藍海。未來企業的人力成本,很大一部分,會從給員工發的工資,變成詞元的採購成本。這是整個商業成本結構的重構,也是經濟增長的全新引擎。為什麼阿里要成立ATH事業群,由吳泳銘親自掛帥?為什麼無招要把做了11年的釘釘徹底打碎,重寫底層程式碼,做全面的CLI化改造,推出悟空平台?因為他們看懂了,釘釘過去的核心,是“人與人的連接”,是基於軟體功能的協同;而未來的核心,是“人與數字員工的協同”,是基於詞元消耗的生產力釋放。詞元經濟學的價值,不在於用機器取代人,在於把這部分龐大的人力資源成本,轉化為可放大10倍、100倍的數字生產力。4.詞元經濟,中國有那些優勢?用輝達的H100 GPU(圖形處理器)做推理,1度電理論上可以產出大約923萬個詞元,扣除資料中心的散熱、傳輸損耗,實際商用場景下,1度電也能產出約550萬個詞元。而這恰恰是中國在智能時代,最大的國運級優勢。中國西部的綠電(筆記俠註:風能、太陽能、水能、地熱能等可再生能源轉化而來的電力),成本大約只有0.2-0.3元一度;而美國的工業電價是1.1到1.2元一度,他們的詞元生產成本,天生就是中國的5-6倍。以前,我們的電力要出口,只能靠物理電網,線損高、壁壘多,還要看別的國家的臉色,很難把能源優勢,轉化成全球競爭力。但現在,我們的電力,通過算力轉化成詞元,通過一根網線,就能瞬時交付給全球的使用者,真正實現“電力不出境,價值通全球”。0.2元一度的綠電,轉化成詞元之後,能賣到11元左右,價值翻了幾十倍,增值幅度遠超傳統的製造業出口。這意味著,我們的能源優勢,通過詞元經濟,可以直接轉化成全球AI服務的成本優勢、競爭優勢。中國有全球最完善的算力基礎設施,有全球成本最低的綠電資源,有全球最大的企業服務市場,有全球最多的市場主體。這些優勢,通過詞元經濟,會被無限放大,變成我們在智能時代,參與全球競爭的核心底牌。四、詞元經濟來了,企業和個人的生存法則與核心機會講完底層邏輯,我們回到最現實的問題:詞元經濟來了,我們到底該怎麼辦?怎麼才能抓住這次時代的紅利?對企業來說,就是抓住3件事。1.徹底轉變認知:從“買軟體”,到“買數字生產力”很多企業老闆,現在對AI的認知,還停留在“買個AI工具,給員工用,提高工作效率”。這就像汽車剛發明的時候,你把它當成“更快的馬車”,你永遠沒法參與汽車帶來的交通革命。你必須徹底轉變認知:AI不是給員工提效的工具,而是你的企業全新的生產力主體。未來,你的企業,不再是“一群人+一堆工具”,而是“一個管理者+一群數字員工”。未來衡量一個企業的內部實力,是它能調動多大的數字生產力,能管理多少個能持續創造價值的數字員工。因此,你的組織架構、管理模式、成本核算體系,都要圍繞“數字生產力”,都要徹底重構。2.建立“有效詞元消耗”的評估與最佳化體系不是所有的詞元消耗,都有價值。員工用AI摸魚聊天、刷段子,消耗的詞元,就是無效的;用AI做方案、跑資料、談客戶,帶來了實實在在的業績增長,這才是有效的詞元消耗。未來,企業的核心管理能力,就是詞元效率管理。同樣消耗1000萬詞元,有的企業用它賺了10萬,有的企業只打了水漂,這背後的差距,就是企業未來的生死差距。你要盡快建立一套完整的體系,去評估每一次詞元消耗的投入產出比,去最佳化你的提示詞,最佳化你的Agent(智能體)執行流程,砍掉無效的詞元消耗,讓花出去的每一個詞元,都能給你帶來實實在在的商業價值。就像無招的“悟空”平台,把“有效詞元消耗”當成核心考核指標,本質上,就是把詞元當成了企業生產力的核心度量衡,從根源上倒逼企業提升詞元效率。3.沉澱過程資料,打造企業專屬的“數字小腦”AI Agent(智能體)消耗詞元的每一個過程,都會產生資料。這些資料,就是你打造專屬“數字小腦”的核心原材料。你用得越多,資料沉澱得越多,你的數字小腦就越懂你的業務,你的詞元效率就越高,你的數字生產力就越強。未來,企業之間的競爭,本質上就是“數字小腦”的競爭。你沉澱的專屬業務資料,就是你最深的護城河,是別人花再多錢,也買不走的核心競爭力。結語未來十年,我們會像今天談論水電氣一樣,自然地談論“詞元”。我們每個人,都正在親歷這場商業史、經濟史上,前所未有的變革。農業時代,土地是生產資料;工業時代,機器和能源是生產資料;網際網路時代,資料是生產資料。AI時代,詞元就是新的生產資料。我們要麼生產詞元,要麼消費詞元,沒有任何中間態。 (筆記俠)
抖音出事了,內部多人被抓
有些路,走上去就回不了頭。沒有規矩,不成方圓。過去幾年,網際網路行業從野蠻生長走向精細化營運,企業對內部紀律的整肅力度也在同步升級。從流程管控到人員追責,從制度完善到文化重塑,合規已成為懸在網際網路大廠頭頂的一把利劍,這把劍既指向外部監管的紅線,也指向企業內部治理的底線。作為網際網路巨頭之一,字節跳動自然也身處其中。從近年密集的通報與追責動作來看,這把利劍同樣懸在了它的頭頂,而一次次真刀真槍的追責,也在一步步把字節內部治理的深層次問題挖出來、解決掉。日前,字節跳動企業紀律與職業道德委員會發佈了中國大陸地區2026年1號通報,披露2025年四季度內部違規案例的處理情況。圖源:澎湃新聞通報顯示,共有65人被辭退,10人被實名通報,7人因涉嫌刑事犯罪被移交司法機關處理,同時被納入行業聯盟名單、扣罰期權。這並非字節跳動第一次發佈此類通報。近兩年來,字節跳動一直以較高頻率對外公佈內部違規處理情況。官方資料顯示,2024年全年,字節跳動共辭退員工353人,其中39人被移送司法機關。2025年三季度通報顯示,120名員工因觸犯公司紅線被辭退,其中28人被實名通報,這28人中有14人因涉嫌刑事犯罪被移交司法機關處理,公司同步將其資訊通報行業聯盟,並取消其期權;另有4人因違規情節惡劣,也被同步通報行業聯盟或取消期權。圖源:視訊號此外,2025年全年,針對員工向外部人員出借飛書工作帳號、參加外部付費訪談等洩露保密資訊的行為,字節跳動共發起12起民事訴訟。截至目前,其中9起已提交立案並進入審理程序;2起在涉事人員道歉、賠償後,公司予以和解;另有1起已獲一審勝訴判決。而本次通報的一個顯著特點,是將資訊安全類違規放在突出位置。通報中提到,有9人因出借飛書工作帳號、辦公裝置被辭退。此外,違規獲取、儲存、洩露、訪問保密資訊,以及非工作場景獲取內部涉密資訊等行為,均在打擊範圍之內。對於一家以資訊分發為核心業務的公司而言,資訊安全無疑是命門所在。出借帳號看似小事,背後卻可能引發核心營運資料、業務資訊與組織架構的洩露風險。通報中特別指出,對於主觀惡意明顯、嚴重損害公司利益的員工,將依法追究法律責任。這意味著,內部違規處理已從紀律處分延伸至法律追責層面。通報還披露了兩起與社交媒體相關的案例。一名前員工在脈脈上發佈組織調整的不實資訊並洩露內部保密內容,引發外部傳播;另一名前員工多次通過小紅書洩露內部保密資訊,並營運個人帳號開展付費面試輔導,兩人均被辭退。圖源:澎湃新聞這類“離職後利用公司資訊變現”的行為,在網際網路行業時有發生。字節對此一貫態度堅決,發現即公開通報追責,毫不手軟。據瞭解,前不久,字節跳動已發佈“員工社交媒體帳號申報和內容規範指引”,要求員工申報社媒帳號,規範社媒行為。圖源:小紅書種種動作表明,字節正從制度層面加強對資訊安全和員工行為的約束,試圖在效率與安全之間尋求新的平衡。誠然,這種制度上的收緊,也在公司內外引發了一些討論。有觀點認為,網際網路公司的核心競爭力在於速度與效率,過於嚴苛的內部管控可能影響員工積極性。但從另一個角度來看,平台規模越大、業務越複雜,內部合規能力的重要性就越突出。一個公司的治理水平,最終會體現在其產品、服務和品牌上。一旦內部管理存在漏洞,資訊隨意洩露、帳號隨意出借,長期而言,對平台信譽也是一種損耗。如果將視線擴展至整個網際網路行業,類似動作並不鮮見。以騰訊為例,2025年全年,騰訊反舞弊調查部共發現並查處觸犯“騰訊高壓線”案件七十余起,九十餘人因觸犯“騰訊高壓線”被解聘,其中二十餘人因涉嫌犯罪被移送公安機關處理,另有三十餘名外部涉案人員被一併抓獲。圖源:陽光騰訊阿里巴巴也不例外,2023至2025財年,阿里累計將111名涉腐員工移送司法機關,其中2023財年45人、2024財年33人、2025財年33人,目前已有9起案件審結。此前,餓了麼原首席執行長因涉嫌職務犯罪被帶走調查,據悉該案也源於阿里內部調查並主動報案。圖源:小央視訊抖音從這些案例來看,近年來網際網路大廠在內部治理上的投入與力度確實在不斷加大,野蠻生長時期遺留的灰色地帶正被逐步清理。尤其字節跳動,在行動節奏與制度化建設上表現得更為突出。用制度管人、用法律追責、用行業聯盟機制形成聯合懲戒,這套組合拳顯著提高了違規成本。在李響看來,字節跳動已形成季度性通報的慣例,這種常態化機制本身比一次性的重拳會更加有用。就拿此次通報來說,7人被移交司法機關,65人被辭退。這些數字背後,是字節跳動在內部治理上一套具體的操作邏輯。就通報內容而言,字節重點打擊的是資訊安全類違規和社交媒體洩密行為,這與其作為網際網路平台的資料敏感性密切相關。同時,將違規人員納入行業聯盟名單,意味著跨企業的聯合懲戒機制正在形成,違規者將面臨更高的職業風險。字節跳動的特別之處在於,它將內部治理的節奏相對高頻,制度上也較為細緻。它並非偶爾發佈一次通報,而是形成了季度性披露的慣例;不只是內部處理,而是敢於公開通報、發起民事訴訟、納入行業聯盟。這種透明度與執行力,折射出字節對內部治理的高度重視,也表明網際網路大廠的反腐正在走向常態化、體系化。整體來看,網際網路大廠們似乎在一夜之間達成了某種共識,即粗放式增長的時代過去後,內部治理水平正在成為衡量企業健康度的重要指標。經過多年發展,網際網路行業的競爭邏輯正在發生變化,過去拼的是擴張速度,如今則越來越看重精細化營運與合規能力。從這個意義上說,大廠加強內部治理,某種程度上是行業走向成熟的必然過程。這不是某一家公司的選擇,而是整個行業進入新階段後的集體轉向。根據公開資訊,阿里、騰訊、美團、京東、字節等大廠均設立了反舞弊部門,發佈年度通報,建立永不合作機制。每一份通報,每一次處理,都是這個轉變過程中的具體表現。京東集團廉潔合作指南  圖源:京麥商家中心抖音此前發佈的永不合作主體清單內部治理沒有終點。只要公司還在運轉,就會不斷出現新的問題。利益驅動下,總有人試圖尋找規則的縫隙。從網際網路大廠的角度看,每一次內部通報,表面上是堵漏洞,其實也是在給自家員工和外面的人傳遞一個明確訊號:大廠的規矩不是擺設,誰碰了紅線,就得付出真代價。現在網際網路行業早就過了搶地盤、拼增長的階段,競爭越來越看內功。大家拼到最後,比的不是誰跑得快,而是誰內部管理更紮實、更能守得住底線。說到底,對一家大廠而言,內部治理水平怎麼樣,越來越直接地決定著它能跑多遠。這不是可以慢慢來的選擇題,而是必須面對的生存題。如今市場競爭這麼激烈,監管、使用者、輿論都在盯著,那家要是敢在這個問題上視若無睹,覺得“差不多就行”,遲早會栽跟頭。所以,大廠們必須也不得不把內部治理真正擺在核心位置。換句話說,在這個拼耐力、拼底線的存量時代,誰能把內部治理做實了,誰就多了一張底牌;誰還在敷衍了事,終就會被甩在身後。 (電商派)
字節進攻,成為恆生科技最大利空
沒有一家公司能像字節跳動這樣,讓“增長”本身成為一種既定的市場預期。自2016年營收60億起,其規模便以近乎殘忍的加速度膨脹:2017年160億,2018年500億,2019年超1400億,2025年全球營收達到1860億美元(約12819億元人民幣),同比增長20%。當市場習慣於它揮舞資本、擴張疆域的敘事時,2026年的字節,已然將AI戰爭提升到全新的維度。其進攻姿態,由三個增長齒輪驅動:億級流量池、不計代價的資本開支(指為此可以“犧牲”現金牛業務的沐瞳),以及一場旨在穿透“App孤島”的生態破壁運動。資本市場的神經早已繃緊,字節系已經成為港股科技股最大利空,這並非只是情緒擔憂,這場戰役,已經從簡單的技術的交鋒、流量的爭奪,變成了新舊估值體系的殘酷重構。當字節以全新的速度和模式發起突襲,流量紅利和社交網路築成的舊半壁江山,還能否守住?騰訊的社交鐵壁和阿里的生態縱深,又將如何迎擊這場來自“新大陸”的衝擊?字節進攻的三板斧對字節跳動來說,“AI 是一件能影響整個世界的機會。” 一位接近字節跳動高層人士說。從 TopBuzz、TikTok 到 TikTok Shop,成立以後這家公司一直在尋找這樣的機會,“越接近世界中心的事情探索價值才越大。”2025 年初,使用者花式“語音調教”豆包的視訊突然在抖音上火爆出圈。幾個月後,圍繞豆包P圖、合照、換背景等的玩法在小紅書上走紅。半年時間裡,豆包把使用者對AI的想像從“深刻對話”拉回到更日常的使用。簡單來說就是當年抖音爆火的營運方式又來了一遍,不過這些方法也並非豆包獨創,其基礎功能主流玩家都有,但也只有豆包抖音形成了正循環。高盛研報指出,字節憑藉這一獨特優勢,日均消耗30兆Token,使其模型在中文語境下的理解和生成能力獲得海量真實反饋的快速迭代。這種“以戰養戰”的模式,讓技術迭代、使用者體驗最佳化和使用者增長之間形成了強大的正向循環。如果說流量是“巧勁”,那字節在2026年展現的資本“實力”則近乎瘋狂。根據公開資訊及行業推測,字節跳動2025年的資本開支預算超過1600億元人民幣,其中約900億——一個接近百度全年營收的數字——被明確投向AI算力基礎設施。這一數字,是同期騰訊預計資本開支的2.5倍,也遠超阿里在2025年計畫中的千億級投入。這筆錢砸向何方?一方面,是建構龐大的自研算力叢集。從輝達、AMD的高端GPU,到寒武紀等國產晶片,再到自研的雲端AI晶片,字節正在搭建一個足以支撐其長期野心的底層算力王國。另一方面,則是人才與技術併購的“軍備採購”。春節期間的“全員作戰”狀態,以及從全球頂尖實驗室不計成本地挖角,都是用資本直接兌換時間窗口的典型打法。春節前夕的另一場風波,揭示了字節跳動進攻策略中最具顛覆性的嘗試。字節與中興旗下努比亞聯合推出的“豆包手機”,內建的Agent(智能體)技術試圖直接代替使用者操作微信、淘寶等應用。這立刻觸發了巨頭們的防禦機制,微信提示“環境異常”,淘寶強制退出。雖然最後協調在符合技術要求後可以使用,但也設定了諸多門檻。這場看似不大的技術摩擦,實則是新舊時代入口邏輯的正面衝撞。長期以來,微信、淘寶各自建立了封閉但繁榮的生態環境。使用者想要服務,必須親自進入這些App孤島,完成點選、搜尋、下單等一系列動作。字節的豆包手機與Agent技術,則試圖扮演一個“超級中間層”或“調度者”——使用者只需向AI下達指令,AI自動呼叫各類服務,最終交付結果。豆包手機驗證了AI Agent確實能操作手機。但也證實了在跨App生態未能打通、操作延遲無法解決、安全隱私標準未定之前,AI手機很難真正普及。字節的進攻三板斧——流量池、天量資本開支、打破生態壁壘,砍向了網際網路世界最堅固的城牆。這也迫使城內的兩位巨無霸騰訊與阿里,必須拿出與之匹配的防守智慧與反擊力度。戰局已經從單方面的突襲,轉向了更為複雜的攻防拉鋸。騰訊在保守中激進AI Agent風靡網際網路的這兩年,微信一直“作壁上觀”,始終保持著自己的節奏。這次主動推出 ClawBot,更像為AI入口混戰布下的一場“陽謀”。有不少媒體認為AI Agent火熱的這兩年,騰訊系一直沒什麼動作,彷彿跟騰訊關係不大。市場曾擔憂,獨立AI應用會蠶食微信的入口優勢,替代微信成為使用者新的高頻使用場景。畢竟,當使用者有創作、搜尋、辦公需求時,若能在獨立AI應用一站式完成,自然無需再打開微信。但最近微信主動推ClawBot外掛,正式向風靡全網的 OpenClaw 敞開懷抱。此後QClaw、WorkBuddy、騰訊雲 Lighthouse 率先打通,階躍星辰、網易有道、月之暗面、智譜、MiniMax 等廠商的“龍蝦”產品緊跟著適配,連字節跳動旗下扣子程式設計也發佈了官方接入方案。截至目前,已有至少 10 款主流“龍蝦”產品完成接入或明確支援微信通道,整個行業一路小跑會師微信,讓其一躍成為國內使用者基數最大、生態適配速度最快的“龍蝦池”。3 月 18 日的騰訊業績溝通會上,馬化騰談及“養蝦”心得,認為“龍蝦”與即時通訊的融合,解決了傳統 ChatBot 需即時等待的痛點,使用者提交任務後可非同步接收結果,更具“活人感”、持續記憶與個性化適配能力。值得一提的是,當下微信 ClawBot 外掛僅作為消息通道,不會自動化操作微信,也不涉及對消息、朋友圈資料的獲取。試想,當14.18 億使用者最常用的聊天窗口,變成可直接指揮AI執行任務的操作面板,那龍蝦從科技圈層走向全民普及,只是時間問題。但“養蝦”能夠讓騰訊實現反超嗎?恐怕也有些困難,因為還需要克服以下問題微信生態能否實現高度統一,而非內部競爭產生不必要的內耗;其二微信作為社會基礎社交工具,其穩定性指標更為靠前,很難像豆包那樣大膽試錯快速迭代。此外,騰訊的AI應用過去主要由面向企業服務的CSIG事業群負責營運,該團隊擅長To B項目制。但在需要精細化營運、追求使用者增長和粘性的C端產品上,存在組織能力與產品使命的錯配。騰訊在電話會議中披露了更精準的AI投入資料:2025年在混元大模型及元寶 AI 應用等全新AI產品上投入180億元,並預計2026 年在混元大模型、元寶以及新 AI產品(例如各種智能體“蝦”)的研發投入將翻倍超360億元。從騰訊的2025年年度財報來看,還是相對漂亮的增收增利,總營收達到7517.7億元人民幣,同比增長14%。年度歸母淨利潤為2248.4億元人民幣,同比增長16%。但與其同時,第四季度營收1944億,環比微增0.8%,主要是本土遊戲收入的季度性下滑。行銷服務收入(環比上漲13%)和金融科技服務收入(環比上漲5%)仍在穩定增長。經營利潤603億,環比下降5%,主要是因為四季度投入大幅增加。應密切關注2026年第一季度情況。騰訊依然還是那個謹慎務實的騰訊,但現在騰訊在戰略層面已經清晰顯現了,它用克制而精準的生態內嵌策略將AI轉化為提升存量的工具,同時通過資本開支的果斷提升和模型策略的靈活組合加固技術底座。阿里的反擊之道如果說騰訊的防守基於其牢不可破的社交關係網,阿里於2025年以來所展現的戰略,則是一場兼具實用主義與資本重注的“閃電戰”。面對字節來自內容流量側的衝擊,阿里已調整航向,將全部戰略重心壓向C端。阿里目標明確必須打造出AI時代的“超級入口”,重新掌握流量分發的主動權和商品、服務交易的最短路徑。根據高盛研報的分析,阿里的資本開支在2025年同比暴增80%,這一增幅在巨頭中頗為激進,龐大資金湧向算力基礎設施、晶片採購及自研。這種不惜重金構築全端壁壘的邏輯,類似當年Google通過GCP、TPU和Android作業系統建立的護城河。阿里的焦慮源於其核心電商與本地生活業務正面臨的“流量飢渴症”,在抖音等內容平台將流量高效轉化為交易的趨勢下,它必須用重資產確保自身在算力、模型、應用全鏈路的控制力,以重求穩,以重求快,試圖用技術基建的厚度避險流量分發層面的競爭壓力。阿里的具體打法,被概括為“1+N”產品模式。其中的“1”,是作為旗艦店的“通義千問”APP,其定位遠不止於一個聊天機器人。它要求自己“會聊天更要能辦事”,核心是深度接入了阿里的服務生態。使用者可以在其中直接生成PPT、解析上百頁的長文件,甚至呼叫淘寶介面進行即時比價與購物。阿里希望它成為一個能解決實際問題的“萬能工具箱”。而“N”,則是將大模型能力“原子化”後,像毛細血管一樣嵌入淘寶、天貓、釘釘、夸克、高德等各個國民級應用,讓AI在使用者最需要的地方自然出現。通過這種模式,阿里旨在形成一個由核心旗艦應用引領,全生態能力協同復用的立體作戰陣型。日前阿里新成立的Alibaba Token Hub(ATH)事業群,將通義實驗室、MaaS業務線、千問事業部、悟空事業部整合在一起,這標誌著阿里AI to B戰略的全面升級,“悟空”正是這一戰略的重要出口。阿里的戰略和執行是堅定和決絕的,但投資者顯然沒有那麼大的信心。最新財報顯示,阿里巴巴 2026 財年第三財季,營收同比增長 2% 至 2848.4 億元,經調整淨利潤同比下降 67% 至 167.1 億元。本季度阿里可支配的現金,即自由現金流為 113 億,同比下降71%,時間再拉長一點,去年 3 月到 12 月,這9個月阿里的累計自由現金流已經轉負,為 -293.09 億元,去年同期為正701億元,現金壓力不小。資本市場對這份“以利潤換增長”的財報反應非常消極,財報公佈後,阿里美股盤前大跌近10%,創去年4月7日以來最大跌幅。投資人們想問,阿里的即時零售還需要燒多久?AI戰略燒錢不應該影響主業投入,用利潤換市場增長的故事在當下變得敏感而脆弱。2025年7月以來阿里啟動約500億元平台消費券計畫,疊加騎手、商家等綜合補貼,累計投入規模已接近1050億元等級。2026財年第三季度(指自然年2025年第四季度),即時零售業務單季度補貼成本約18億元,全年總投入(含行銷與補貼)同比繼續增加。而且阿里管理層明確在電話會指出,2026年(此處指自然年)全年投入力度將超過2025年,內部明確三年不考核虧損。這多少有些讓投資人難以接受,至少三年內即時零售這部分仍然需要重投入,還遠看不到盈利的曙光。當然,阿里也不是聽不懂市場在說什麼,所以今年以來收縮低價內卷,轉向精準補貼與高客單營運。2026年重點建倉醫藥、酒飲、生鮮等品類,新建500+前置倉,強化30分鐘達履約能力。總的來說,當前阿里巴巴的市盈率約為22.7倍左右。這一水平反映了市場對其短期利潤承壓的擔憂,同時也包含了一部分對其AI戰略轉型的期待。但距離阿里想要的“雲+AI業務”的估值倍數還有不小的差距。寫在最後字節進攻的勢頭足夠強,但也不代表這種AI戰事字節已經完全贏下了,豆包生態閉環尚未實現,巨額算力投入下,如何通過廣告、佣金實現盈利,是其持續擴張的前提。反之,可能被阿里、騰訊的生態閉環反超。為了打贏這場戰爭,字節主動出售現金牛業務旗下遊戲公司沐瞳科技,這可以說是不容易的戰略取捨,沐瞳是能夠穩定盈利且價值百億美元的業務部門,這說明字節也是在背著巨大壓力AII In AI。 (首席商業評論)
字節的“羅福莉”,撐起了Seedance的半邊天
隨著小米新模型的推出,“天才少女”羅福莉再度成為焦點。其實在AI科學家圈子裡,女性數量雖然相對較少,但也絕非羅福莉一顆獨苗。在字節跳動,就有一位羅福莉式的人物。她就是Seedance 2.0視訊生成模型的預訓練負責人,曾妍。一般聊起Seedance 2.0,大家普遍想到的人是掌舵人吳永輝、研發負責人周暢、視訊生成技術核心負責人蔣璐。很少有人知道,曾妍的存在,同樣無可或缺。因為預訓練是整個模型的“基石”,它決定了模型的能力上限。大多數人把預訓練當成“喂資料”,但真正的高手知道,預訓練是在“塑造模型的世界觀”。資料怎麼配比、架構怎麼設計、訓練策略怎麼調整,每一個決策都在決定模型能看到什麼、理解什麼、生成什麼。無論你後面怎麼努力最佳化,預訓練只要沒做好,這個模型就一輩子達不到Seedance 2.0現如今的高度。不僅是貢獻大,曾妍的晉陞速度在字節也是相當快的。從她畢業進入字節開始算起,到現在的4-2職級,曾妍僅僅花了5年時間。4-2職級對應高級總監/權威架構師層級,屬於公司核心戰略級技術骨幹,年包(含基本工資、年終獎、股票)普遍在500萬以上。她到底做了什麼,才有如此成就?讓我們從她的求學之路說起。01 從西交到字節說實話,當我第一次看到曾妍的履歷時,並沒有覺得特別驚豔。1997年出生,西安交通大學本科,加拿大蒙特利爾大學電腦碩士。這條路徑放到現在的AI圈裡太常見了。但接下來發生的事,就不那麼“標準”了。2021年9月,曾妍以校招生身份加入字節跳動 AI Lab,起點職級是演算法工程師。入職僅兩個月,曾妍就以第一作者身份在arXiv上發表了論文《Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts》,也就是後來大家熟知的X-VLM模型。這篇論文解決的問題,用大白話說就是:怎麼讓 AI 既能看懂“大場面”,又能注意到“小細節”。傳統的視覺語言模型有兩個極端。一種是“粗線條”派,只看圖像整體和文字的對應關係,就像你給AI看一張照片,它只能說“這是海灘”,但說不出更多了。另一種是“顯微鏡”派,依賴昂貴的目標檢測器去摳每個物體,雖然能看到細節,但計算成本高得嚇人,還得依賴大量人工標註資料。曾妍提出的X-VLM,就是取兩者之所長。它能同時學習從整體到局部、從場景到物體、從粗到細的多層次視覺概念,並與文字中的不同粒度資訊精準對齊。或者我用一個我最近剛學會的話來形容:既見森林,又見樹木。這個“多粒度對齊”的思想,在當時看起來只是個學術創新,但它為曾妍後來擔任Seedance 2.0預訓練負責人埋下了伏筆。因為視訊生成的預訓練,本質上也是個多粒度建模的問題。你要想生成一個好看的視訊,那就既要把握整體敘事節奏,讓一段視訊有連貫的故事線;又要控制每一幀的細節質量,確保人物面容不變形、物體運動符合物理規律;還要建立時序維度上的關聯關係,讓前後幀之間的過渡自然流暢。這剛和X-VLM的底層邏輯是一致的。接下來的兩年,曾妍就像開了掛一樣。她以第一作者身份在TPAMI、ICML、CVPR、ACL、NAACL等國際頂會發表了八篇論文,還擔任了TPAMI、ICML、NeurIPS、ICLR、ACL、EMNLP等頂會的審稿人。2023年,一個關鍵轉折點到來了。字節跳動成立大模型研究部門Seed,曾妍和所在團隊一同轉入。這個時間節點你得放在大背景下看,2022年底ChatGPT橫空出世,2023年初各大公司紛紛All in大模型,字節也在這波浪潮中調整了技術戰略。曾妍擅長的多模態預訓練,在視訊生成這個新戰場上,能發揮她的全部實力。在Seed部門,曾妍作為第一作者主導了兩個重要項目,分別是CCLM和Lynx。先說CCLM(Cross-View Language Modeling)。這個項目讓AI模型同時學會“跨語言”和“跨模態”的理解能力。CCLM通過統一的預訓練框架,讓在英文圖像-文字資料上訓練的模型,可以零樣本遷移到中文、日文等其他語言的多模態任務上。說白了,就是讓 AI 學會“舉一反三”——在英文視訊上學到的理解能力,能直接用到中文、日文、西班牙文的視訊上。再說Lynx。這是一個系統性研究如何訓練GPT-4風格多模態大語言模型的項目。2023年正是GPT-4剛發佈的時候,大家都在摸索怎麼做出“能看圖說話”的大模型。曾妍團隊通過一系列對比實驗,找出了模型架構設計、訓練資料配比、指令微調策略等關鍵因素,最終做出了 Lynx 模型,在多模態理解和指令跟隨能力上都表現出色。用人話說,就是研究“怎麼造出一個既能看懂圖片又能流暢對話的AI”,並且搞清楚了那些因素真正重要。真正讓曾妍“出圈”的,是2023年年底的PixelDance。這個項目的論文題目很有意思,叫《如何讓像素跳舞》(Make Pixels Dance: High-Dynamic Video Generation)。它解決的是視訊生成領域一個長期存在的矛盾,如何平衡動態性和穩定性。你想想,如果一個AI生成的視訊動作幅度很大、畫面變化劇烈,看起來確實生動有趣,但很容易出現畫面崩壞、角色變形、物體突然消失這些“靈異事件”。反過來,如果你追求穩定性,讓角色和場景保持一致,人物面容不突變,那生成的視訊就容易僵硬,像幻燈片切換而不是流暢的動態影像。曾妍團隊的突破在於,他們在預訓練階段就建立了嚴格的時序約束。傳統的視訊生成模型都是先生成視訊,然後再一幀一幀去修補。PixelDance則是讓模型學會了在保持一致性的前提下生成動態內容。核心創新點是在擴散模型框架中,引入首幀+末幀的雙圖像指令,配合文字指令聯合約束視訊生成,同時在網路結構中新增時序摺積與時序注意力層,從生成的源頭就錨定了視訊的起止狀態,從而保證大動態動作下的主體與場景一致性。就像訓練一個舞者,從一開始就教她在保持平衡的前提下做大幅度動作。PixelDance的成功,讓曾妍在字節內部的地位迅速提升。2024年,她從演算法工程師晉陞為演算法研究員,成為Seed團隊中最年輕的研究員之一。這個晉陞不只是對她學術能力的認可,更重要的是,她證明了自己能把研究成果轉化為實際產品。在大廠裡,這兩種能力的差別,就像會做菜和會開餐廳的差別。02 從 PixelDance 到 Seedance 2.0有意思的是,PixelDance就是Seedance的前身。Seed代表字節的大模型部門,dance則保留了“讓像素起舞”的核心理念。這個改名不只是品牌策略,更標誌著模型從研究原型向商業產品的轉變。2025年6月11日,字節正式發佈了Seedance 1.0,曾妍是該模型的核心研發負責人。雖然直至2026年2月,曾妍才被字節官方確認為Seedance 2.0 視訊模型預訓練負責人,但知情人士爆料,早2025年下半年時,曾妍就已經正式牽頭Seedance 2.0的預訓練全流程工作,成為該項目的核心一號位。她的+2 leader是周暢,+3 leader是Seed團隊負責人吳永輝。Seedance 2.0核心技術突破之一是雙分支擴散變換器架構,這是曾妍團隊在預訓練階段就確立的基礎架構。傳統視訊生成模型採用“先畫後配”的模式。即先生成視訊畫面,再單獨生成或匹配音訊。這種方式的問題在於,音畫分離導致同步性差,人物說話時嘴型對不上,背景音樂的節奏與畫面情緒脫節,音效出現的時機與畫面動作不匹配。Seedance 2.0通過視訊與音訊平行生成的方式,共享同一個理解編碼器,從根源上實現了音畫原生協同。這個架構設計的關鍵在於,讓模型在生成每一幀畫面的同時,就考慮對應的音訊應該是什麼樣的,而不是等畫面全部生成完再去“配”音訊。文章開頭我就講了,預訓練是整個模型能力的基石。曾妍在這個階段需要處理海量的視訊資料,建立視覺、文字、音訊等多模態之間的對齊關係。她通過引入“跨分支校準模組”,即時校準視訊與音訊的節奏、情緒與場景匹配度,確保嘴型與台詞同步、音效與畫面契合、背景音樂與情緒氛圍一致。預訓練階段把所有的多模態對齊關係、物理規律、運動模式都塞進模型裡,成為“默認項”。後續模型只要呼叫到相關內容,就會立刻給出預訓練時的結果。它不是簡單地讓模型記住訓練資料,而是讓模型從海量資料中提煉出普遍規律,形成對世界的基礎理解。Seedance 2.0生成時長1分鐘的2K視訊僅需60秒,比上一代Seedance 1.5 Pro快了30%。速度提升的背後,是曾妍團隊在預訓練階段對模型架構、訓練策略、資料配比的精細調優。她的團隊迭代速度極快,在預訓練階段就完成了擴散模型的多輪最佳化。最佳化注意力機制減少冗餘計算,改進噪聲調度策略加快收斂速度,精選高品質訓練資料提升樣本效率。每一個最佳化點單獨看都不起眼,但累積起來就是質的飛躍。模型規模越大,訓練成本越高,每一個百分點的效率提升都意味著數百萬元的成本節約和數周的時間縮短。Seedance 2.0還實現了多鏡頭敘事能力。這意味著模型不僅能生成長視訊,還能理解“全景-中景-特寫”的專業分鏡邏輯,自動規劃鏡頭切換,生成帶有蒙太奇效果的完整敘事序列。這個能力很大程度上依賴於曾妍在預訓練階段投喂的字節跳動海量短影片資料。抖音每天產生數以億計的短影片,這些視訊雖然大多是普通使用者拍攝,但其中不乏優秀的鏡頭語言和敘事技巧。曾妍團隊從這些資料中篩選出高品質樣本,讓模型學習到了人類導演的鏡頭語言和敘事節奏。這種從資料中提煉出的“導演直覺”。03 曾妍與羅福莉同為女性AI科學家,曾妍和羅福莉在模型研發中,都擅長尋找“平衡點”。在DeepSeek時期,羅福莉參與的DeepSeek-V2,通過MoE架構的稀疏啟動,把推理成本降到了GPT-4 Turbo的七十分之一,但是性能卻與頂尖的閉源模型十分相近。這就像設計一個大型圖書館,雖然藏書百萬冊,但每次查詢只需要翻開其中幾本,而不是把所有書都搬出來。這種“按需啟動”的機制,讓大模型的成本驟然下降,卻不怎麼損失性能。羅福莉在性能與成本之間,找到了這樣一個平衡點。到了號稱“性價比之王”的小米,羅福莉把DeepSeek的精神貫徹到底。她主導團隊與北京大學聯合研發資源管理系統ARL-Tangram,讓模型的算力成本直降71.2%。然而成本下降並不意味著性能下降。使用了該技術的兆參數的旗艦模型MiMo-V2-Pro,在Artificial Analysis全球大模型綜合智能排行榜上位列第八、國內第二。羅福莉證明了一件事:性價比不是某個項目的偶然,而是一種可以跨平台複製的方法論。曾妍的平衡點則是前文提到的動態性和穩定性,讓視訊生成模型又能講好故事,又有畫面張力和視覺衝擊力。兩人不同的是職業規劃。羅福莉從阿里跳到幻方,再到DeepSeek,這條路徑是“從大廠到創業公司,從工程應用到模型研究”。曾妍則是在字節內部一路深耕,5年時間完成了從校招畢業生,坐到了4-2的位置。兩條路徑沒有高下之分。在AI大模型這個燒錢、拼資源、看長期積累的領域,年輕的技術人才依然可以通過對問題的深刻理解,在短時間內做出關鍵貢獻。有可能他們研究的方向,你聽都沒聽過,但就是有效。她們的故事才剛剛開始。 (字母AI)
監管批准字節跳動、阿里巴巴、騰訊等公司哦買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻/比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始/小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%監管剛批了40萬塊H200,黃仁勳轉頭宣佈:我已經開始重新生產了!今年1月,監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片,總價值約100億美元。這是中美晶片博弈裡罕見的"開綠燈"時刻——美國出口管制繞了一大圈,監管蓋了章,DeepSeek也在其中拿到了有條件購買許可。(來源:Reuters、《華爾街日報》)與此同時,中國官方發言人回應說"不瞭解具體情況"——100億美元的訂單,官方說不知道,這已經是一種態度了。更快的是輝達這邊。2026年3月17日,CEO黃仁勳在GTC大會上直接宣佈:已收到來自"眾多客戶"的訂單,H200中國版正在重啟生產。幾周前訂單來了,幾周內工廠開動。禁令、解禁、重啟,這條鏈條走完只用了不到兩個月。100億美元擺在那裡,到底是管制有效,還是管制本身就是一筆生意?(來源:Axios、CNBC)不是降級版!輝達Groq晶片5月入華,這次連"特供"都省了輝達去年底以約200億美元收購了推理晶片公司Groq,現在這顆晶片要直接賣給中國了。據Reuters消息,輝達正在為中國市場準備一款Groq晶片,預計5月上市,面向AI推理業務——也就是模型跑起來之後回答問題、執行任務那個環節。更關鍵的是,知情人士明確透露:這款晶片不是降級版,也不是專為中國特供的閹割版本。(來源:Reuters)之前H20是專門為中國"定製"的縮水版,這次連縮水都免了。這個時間點很微妙。H200剛剛重啟生產,Groq非降級版緊跟著入場,輝達在中國市場一口氣佈局兩條產品線。可美國出口管制的框架還掛在那裡,Groq晶片究竟走的是那個口子,目前沒有官方解釋。監管還沒表態,晶片已經在路上——黃仁勳每次在華盛頓和監管之間走鋼絲,都比上次走得更穩一點。(來源:Reuters)五角大樓要讓AI公司進軍事機密庫訓練模型,這件事比你想像的更炸這件事3月17日才被MIT Technology Review報導出來,五角大樓正在討論一個計畫:為AI公司建立安全隔離環境,讓它們用機密軍事資料訓練專屬的軍用版模型。不是部署,是訓練。意味著OpenAI、Anthropic或者Google的工程師,理論上可以接觸到美軍的機密資料集來"喂"模型。這是一個史無前例的方向,之前從來沒有商業AI公司被允許碰這類東西。(來源:MIT Technology Review)背景是:OpenAI已經與五角大樓簽了在機密網路中部署AI系統的協議,國防部也在今年1月發佈了AI戰略備忘錄。問題是,訓練和部署是兩件性質完全不同的事。部署是讓AI用軍事資訊,訓練是讓軍事資訊變成AI的一部分——這兩者之間的資料安全邊界,目前沒有任何明確的技術標準或法律框架來界定。Hegseth已經警告Anthropic必須配合軍方,OpenAI也大方接單。但誰來決定這些模型最終學到了什麼、記住了什麼,答案目前是:沒人知道。(來源:MIT Technology Review、PBS)GPT-5.4 mini和nano來了——OpenAI說這是"最強小模型",速度快了2倍多OpenAI正式發佈GPT-5.4 mini和GPT-5.4 nano,主打Agent、程式碼生成、多模態工作流,定位是"以極低成本提供接近GPT-5.4水準的性能"。GPT-5.4 mini相比上一代GPT-5 mini,在程式設計、推理、多模態理解、工具呼叫上全面提升,速度快了2倍以上;兩款模型都支援40萬token的超長上下文窗口(大約30萬個漢字),專門針對需要大量子任務串聯的Agent場景做了最佳化。(來源:OpenAI、ZDNET)這對開發者來說是實打實的降本消息——頂級性能的七成,花頂級價格的一個零頭。但OpenAI這一步的棋感,很微妙。GPT-5.4 mini是給API用量大、成本敏感的企業用的,nano是面向更高頻的輕量場景。兩款小模型同時推,等於在Agent賽道上把價格門檻砸穿——競爭對手做的那套"小模型夠用論",OpenAI直接親自驗證了。Anthropic、Google同樣有自己的"小強模型",但現在面對的問題是:你的小模型,是不是真的比OpenAI的小模型更小、更便宜、還更好用?(來源:OpenAI、ZDNET)阿里、騰訊都搶了,百度終於把"小龍蝦"塞進了小度音箱中國AI圈這陣子有個新詞叫"養龍蝦"——OpenClaw是一個開源AI Agent框架,因為logo像龍蝦,被叫爆了。騰訊最先動,做了QClaw接入微信和QQ;阿里隨後跟上。3月17日,百度宣佈將OpenClaw整合進旗下小度(Xiaodu)智能音箱,讓小度變成一個語音控制的Agent遙控器,用一句話就能觸發跨應用的複雜任務。(來源:Bloomberg)三大廠同台,百度靠的是硬體入口:小度的螢幕和麥克風,是其他兩家沒有的物理觸點。但有趣的是,在這場搶跑裡,百度的AI雲收入剛剛同比增長38%,OpenClaw的整合宣佈同一天發佈,時機選得極準——用一個熱詞捆綁一個財報數字,這是一種很熟練的敘事操作。問題是,把Agent塞進音箱和塞進聊天框,那個更容易讓使用者真的用起來?目前沒有任何資料,三家都在同一起跑線上等答案。(來源:Bloomberg)阿里巴巴發佈"悟空"平台,讓AI幫企業打工——現在還在內測阿里巴巴正式推出企業級AI平台"悟空(Wukong)",目前處於封閉測試階段。悟空的核心邏輯是協調多個AI Agent配合工作,處理文件編輯、表格操作、商業研究等複雜企業任務——不是一個聊天機器人,而是一套能"自己分工幹活"的Agent調度系統。(來源:Reuters)時間節點同樣刻意:剛好在中國agent熱潮爆發的那個當口,騰訊在聊,百度在跟,阿里這次選擇先做企業端。悟空和同期宣佈的"Token Hub"是阿里AI戰略的兩面。Token Hub是整合阿里所有AI研究、消費者產品、AI應用的新業務集團,由CEO吳泳銘(Eddie Wu)親自掛帥,核心命題是AI變現。(來源:Bloomberg)悟空是變現的產品抓手,Token Hub是整合內部資源的組織容器——從架構上看,這是阿里把AI從"成本中心"推向"利潤中心"的一次整體操刀。但封閉內測的悟空究竟什麼時候能開放,阿里沒說。(來源:Reuters)Manus突然下載到我電腦裡了!"My Computer"讓AI Agent徹底告別雲端2026年3月16日,Manus正式發佈桌面應用,核心功能叫"My Computer"——可在Windows和macOS上運行,讓AI Agent直接訪問你的本地檔案、瀏覽器、應用程式,以及在你電腦空閒時自動幹活。這是Manus從雲端走向本地的關鍵一步。之前Manus能做的事,都發生在遠端沙盒裡;現在它可以直接讀你的項目資料夾、開你本地的IDE、在你不看螢幕的時候繼續工作。(來源:Manus官網、9to5Mac)這不是"助手",更像一個在你電腦裡常駐的無聲員工。這件事最讓人不安的地方,恰恰是它最吸引人的地方——AI終於能碰你真實的本地資料了。雲端Agent和本地Agent的最大區別,就是這道"能不能接觸到你實際工作環境"的門檻。Manus選擇在這個時間點把門踢開,意味著Agent賽道的戰場從"在雲上幫你查資料",正式移到了"在你的電腦裡幫你幹活"。Cursor在程式碼領域已經打通了這一層,現在Manus要在更寬泛的通用任務上複製這條路——誰先讓使用者真的放心把電腦交出去,誰就贏了。(來源:Manus官網)比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始輝達在GTC 2026大會上宣佈:比亞迪、吉利、五十鈴、日產四大車企將採用其DRIVE Hyperion自動駕駛平台,支援Level 4等級無人駕駛車輛。同時,Uber與輝達擴大合作,計畫2027年上半年率先在洛杉磯和舊金山推出全端Robotaxi服務,並於2028年擴展至覆蓋四大洲的28個城市。(來源:Nvidia官方、The Verge)一次發佈會,輝達同時繫結了整車製造端和出行營運端——中美日的車企,全進了這張網。這個陣容有點意思。比亞迪和吉利是中國新能源頭部,五十鈴是日本商用車代表,日產是傳統燃油巨頭——四種不同背景的車企,同時選了輝達的同一套平台,這本身就是一種背書。Waymo已經在舊金山和鳳凰城跑了好幾年,Cruise折戟,特斯拉Full Self-Driving還在講故事;輝達這次的策略不是自己造車,而是把自己做成Robotaxi時代的"底盤供應商"。2027年不到兩年,洛杉磯的街上會不會真的有Uber+輝達的無人車跑起來,值得盯著看。(來源:Reuters、The Verge)騰訊QClaw內測,14億微信使用者的手機裡快要住進一隻"AI龍蝦"了騰訊正在內測一款名為QClaw的產品——這是OpenClaw的微信/QQ雙端一鍵啟動包,讓使用者直接在微信聊天框裡調起AI Agent,完成本來需要跨多個App切換才能做完的任務。(來源:新浪科技、知乎)微信12億活躍使用者,QQ幾億年輕使用者,QClaw一旦全面上線,等於給OpenClaw這套開源框架接上了一個全球最大的流量入口。騰訊之前在AI產品上一直給人"慢半拍"的感覺,這次的動作算是把入口優勢打出來了。但QClaw目前只是內測,預計"近期上線"——沒有正式發佈日期。在這條賽道上,阿里的悟空也在等開放,百度小度已經宣佈整合,OpenClaw在中國的生態正在被三大廠同時圈地。微信入口的流量是真實的,但Agent能不能在14億人的聊天框裡真正活下來,取決於它能不能在一個"對話"介面裡把任務做得比人工快。這一步,騰訊比阿里和百度都更有條件驗證——問題只是它動不動得快。(來源:36氪、財富號)小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%2026年3月16日,小米MiMo大模型負責人羅福莉與監管大學研究團隊聯合發佈ARL-Tangram系統,這是一套針對Agent強化學習的統一資源管理框架,核心數字是:將強化學習訓練步驟持續時長縮短至多1.5倍,節省高達71.2%的外部算力資源,同時在真實世界Agent任務上平均ACT提升4.3分。(來源:IT之家、新浪財經)簡單說,同樣的訓練效果,花的錢不到原來的三成。這在當下算力極度緊缺、訓練成本居高不下的背景下,是非常實際的突破。但這篇論文更值得注意的,是它的位置。羅福莉是小米內部MiMo模型的負責人,ARL-Tangram發的不是產品,是學術論文——小米在用學術成果的方式宣示自己在大模型基礎研究上有真正的積累。三月的AI圈到處是"發佈會",小米選擇發一篇論文。在大廠裡,這種動作通常意味著:接下來會有更大的東西落地。算力成本降了70%,下一步的問題是,這個效率用在那裡?(來源:搜狐、IT之家)Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻2026年3月16日,月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇與數十名研究員聯署,發佈了一篇純架構層面的技術報告。他們重新設計了大模型的核心結構——殘差連接(Residual Connection),這個元件自2015年引入Transformer以來,超過10年幾乎沒有人動過。Kimi的方案讓每一層能夠選擇性地關注此前各層的輸出,而不是統一求和,實驗結果是48B參數規模的模型訓練效率提升1.25倍。(來源:新浪財經、澎湃新聞)論文發出後,馬斯克本人評價"令人印象深刻",前OpenAI研究科學家Andrej Karpathy同樣給予好評。這篇報告的戲劇性,不在於那1.25倍的效率提升,而在於它選擇攻擊的目標——一個10年沒人敢改的基礎元件。大多數模型創新發生在訓練方法、資料配比、規模擴展上;動架構本身,是風險最高也最難被外界驗證的路。三位聯合創始人都署名,不像是一篇普通論文,更像是一份聲明:Kimi在做自己的事,而不是跟在別人後面堆參數。馬斯克和Karpathy的背書,給了這篇論文在國際AI圈的能見度——但它能不能真正改變下一代模型的架構選擇,還需要時間驗證。 (AI Daily Insights)
字節跳動暫停 Seedance 2.0 全球發佈,版權糾紛凸顯AI訓練資料爭議
據The Information周六報導,字節跳動已暫停其最新視訊生成模型 Seedance 2.0 的全球發佈計畫。該決定是在公司與多家好萊塢製片廠和串流媒體平台爆發一系列版權糾紛後作出的。這一事件再次凸顯生成式人工智慧行業正在面臨的核心問題——訓練資料的版權合法性。隨著AI模型能力快速提升,圍繞資料來源和內容授權的法律風險正在迅速上升。Seedance 2.0發佈計畫突然暫停Seedance 2.0 是字節跳動近期重點研發的視訊生成模型,被視為其在生成式視訊領域的重要佈局。據報導,該模型原計畫面向全球開發者和企業客戶發佈,能夠根據文字提示自動生成高品質視訊內容,並被定位為與當前主流AI視訊工具競爭的重要產品。然而在發佈準備階段,好萊塢多家大型製片公司和串流媒體平台提出版權質疑,認為AI模型的訓練資料可能包含未經授權的影視內容,生成的視訊內容可能模仿或復刻現有影視作品風格,模型可能對影視產業造成潛在版權和商業衝擊。在相關爭議尚未解決之前,字節跳動決定暫緩 Seedance 2.0 的全球上線。好萊塢與AI公司的版權衝突升級近年來生成式AI技術的快速發展,使科技公司與傳統內容產業之間的矛盾不斷加劇。影視公司普遍擔憂,AI模型在訓練過程中可能使用了大量影視素材,包括電影和電視劇畫面、劇本與對白文字、視覺風格和鏡頭語言。如果這些內容未經授權被用於模型訓練,可能構成版權侵權。目前多家媒體公司已經對科技企業提起訴訟或提出正式投訴。在美國圍繞AI訓練資料的法律爭議已涉及多家大型科技企業,包括OpenAI、Google、Meta。出版商、新聞機構和影視製作公司均聲稱,其內容在未經授權的情況下被用於訓練AI模型。訓練資料成為生成式AI最大監管焦點隨著AI能力越來越接近真實內容生產,監管機構和版權持有方正將注意力集中在模型訓練資料來源上。當前爭議主要集中在三個問題:1、是否可以使用公開網際網路內容訓練模型科技公司普遍認為公開網頁內容屬於可抓取資料,但內容生產者認為公開可訪問並不等於可用於商業AI訓練。2、AI生成內容是否構成版權侵權如果AI輸出的視訊 圖像或文字高度模仿原作品風格 是否構成侵權仍存在法律爭議3、是否需要建立授權和分成機制部分媒體公司正在推動建立類似AI版權授權體系,要求科技公司為訓練資料付費AI視訊成為新的版權爭議焦點相比文字和圖像生成,視訊生成技術的版權爭議更加複雜。原因在於視訊涉及多種版權元素,包括畫面、音樂、劇本以及演員形象。影視產業商業價值巨大AI生成視訊可能直接衝擊影視製作市場。Seedance 2.0 的暫停發佈,被業內視為生成式視訊行業的重要訊號。AI視訊技術的商業化正在進入法律博弈階段。監管壓力正在快速增加分析人士指出,隨著生成式AI商業價值持續增長,全球監管機構可能進一步加強審查。在美國和歐洲多項政策正在討論中,包括強制披露AI訓練資料來源、建立版權許可制度、對生成內容進行水印標識。對於科技公司而言,未來AI模型開發不僅是技術競爭,也將成為法律與版權體系之間的競爭。 (美股財經社)