#創作
摩根士丹利:泡泡瑪特美國復購率高達74%,超越迪士尼位居第一
核心結論:全球IP 收藏品市場規模已突破 1000 億美元,2019-2024 年複合增長率達 8%,預計 2024-2027 年仍將保持 6% 的穩健增速。“kidult(成人孩童化)” 趨勢成為核心驅動力,中國與亞太地區是主要增長引擎,泡泡瑪特、三麗鷗、孩之寶、大麥等龍頭企業值得重點關注。一、行業全景:千億規模+ 穩健增長,從 niche 走向主流全球IP 收藏品市場已成長為規模超 1000 億美元的主流消費賽道,涵蓋玩具、集換式卡牌、服飾、生活方式產品等多個品類,增長速度遠超多數可選消費領域。2019-2024 年,頭部企業零售銷售額複合增長率達 8%,2025 年預計增長 7%,2026-2027 年增速溫和回落至 5%-6%,仍將跑贏多數中低個位數增長的可選消費行業。從區域分佈看,北美是全球最大的角色IP 授權市場,佔比近 50%,是亞洲企業的核心拓展目標;北美、西歐、北亞是前三大市場,2023 年零售銷售額分別達 690 億、360 億、220 億美元。驅動市場增長的核心邏輯是 “慾望驅動 + 價格親民” 的獨特定位 —— 既滿足消費者的情感訴求與身份表達,又以低於奢侈品的價格降低消費門檻,在經濟波動期依託 “口紅效應” 保持韌性。二、核心增長引擎:七大結構性放大器1. 消費群體擴容:從兒童到 “kidult” 的全民參與“kidult” 群體(擁抱玩樂與懷舊的成年人)的崛起大幅拓寬了市場邊界,目前成年人貢獻了全球玩具銷售額的 25% 以上,較 2010 年的 15% 顯著提升。這一趨勢背後是多重社會心理因素:18-29 歲 “新興成年期” 群體對自我表達的需求、經濟不確定期 “小確幸” 消費的流行、女性消費力提升(全球 70%-80% 的消費決策由女性主導)、懷舊情緒帶來的心理慰藉,以及 IP 收藏品作為 “審美身份標籤” 的裝飾功能。2. IP 創作升級:從 “故事驅動” 到 “設計驅動”傳統IP 以迪士尼、星球大戰為代表的 “故事驅動型” 為主,依賴序列化內容積累使用者;而近年 “設計驅動型” IP 崛起,憑藉獨特造型、人格化特質或舒適質感直接打動消費者,無需長期敘事鋪墊,產品迭代周期更快、投入更輕量化。例如三麗鷗的角色矩陣、泡泡瑪特的藝術玩具,均以設計為核心競爭力,後續可延伸至動畫、遊戲等領域,形成 “ commerce-to-content” 的反向飛輪。3. 銷售模式革新:遊戲化消費提升復購與傳播盲盒、集換式卡牌等“遊戲化銷售” 模式,將購買行為轉化為 “期待 - 開箱 - 社交分享 - 重複購買” 的完整體驗,激發使用者復購欲與傳播力。這種模式通過 “可變比率強化” 機制提升消費興奮感,同時推動客單價上升(消費者為獲得心儀款式增加購買次數),還能通過開箱視訊在短影片平台形成自發傳播。4. 社交媒體迭代:短影片 + 直播放大傳播效應短影片與直播平台的普及徹底改變了IP 收藏品的傳播邏輯:動態展示能更直觀呈現產品細節、質感與開箱樂趣,演算法推薦則精準觸達潛在消費者,尤其推動女性使用者增長(小紅書使用者 70%-75% 為女性,抖音電商早期以美妝、配飾等女性偏好品類為主)。對設計驅動型 IP 而言,短影片平台成為關鍵曝光管道,彌補了其缺乏傳統媒體敘事的短板。5. 產品升級:供給側最佳化拉動需求2010 年代中期後,面對數字內容對兒童注意力的爭奪,IP 收藏品行業啟動供給側升級,通過技術面料、豐富色彩、高端設計與更快的迭代周期提升產品吸引力。同時,成人消費群體的崛起推動產品向 “高端化 + 裝飾化” 轉型,例如樂高推出 “成人友好” 系列,單價可達 400-800 美元,泡泡瑪特的藝術玩具成為家居裝飾單品。6. 管道變革:DTC 模式強化使用者連結直接面向消費者(DTC)的模式成為行業趨勢,品牌通過官方門店、線上商城等管道,實現庫存管理、產品展示、會員營運的全鏈路掌控,同時快速獲取使用者反饋,最佳化產品與行銷策略。泡泡瑪特 95% 的銷售額來自 DTC 管道,樂高全球擁有 1069 家品牌門店,三麗鷗通過 “Gift Gate” 直營門店深化使用者互動,這些 DTC 觸點不僅是銷售管道,更是品牌文化與粉絲社區的載體。7. IP 跨界:品類擴張打開增長空間成功的IP 突破單一品類限制,向服飾、美妝、家居、餐飲等多個領域延伸,形成 “IP 生態”。2023 年,玩具是 IP 授權最大品類(343 億美元),軟體 / 遊戲(288 億美元)、服飾(176 億美元)緊隨其後;未來 18-24 個月,時尚配飾、餐飲、文旅等品類被預測為增長最快的授權領域。例如 Chiikawa 與喜茶、Skullpanda 與杜卡迪、哈爾的移動城堡與羅意威的跨界合作,均實現了 IP 價值與消費場景的雙向賦能。三、中美市場深度調研:消費行為與偏好差異1. 市場滲透與消費特徵中國IP 收藏品市場滲透率達 60% 以上,高於美國的 40%,核心消費群體為年輕、財務穩定、有子女的女性,集中在一二線城市;美國市場更成熟穩定,消費者品牌忠誠度更高,復購率普遍超 60%。消費頻率上,中國消費者年均購買 6-7 次,超三分之二為季度或更高頻消費,已形成常態化消費習慣;美國消費者購買頻率較低,但客單價與品牌粘性更強。2. 購買動機差異中國消費者更注重“內在驅動”:39% 因 “產品設計吸引力” 購買,36% 源於 “喜歡相關媒體內容”,情感共鳴與收藏樂趣是核心訴求;美國消費者則以 “送禮” 為首要動機(佔比 52%),其次是懷舊情感(28%)與收藏放鬆(25%)。制約消費的主要因素均為宏觀經濟擔憂與價格敏感度,美國有 58% 的消費者認為 “價格過高”,中國有 27% 的消費者因 “擔憂宏觀環境” 減少購買。3. 品牌表現:本土龍頭崛起,國際品牌穩固中國市場中,泡泡瑪特、三麗鷗、迪士尼位列購買意向前三,泡泡瑪特的潛在消費群體規模預計翻倍;美國市場迪士尼、美泰、孩之寶佔據主導,泡泡瑪特作為中國品牌躋身前列,顯示出較強的國際化潛力。復購率方面,美國市場各品牌差距較小(普遍60% 以上),泡泡瑪特以74%位居第一。中國市場分化明顯,迪士尼(71%)、三麗鷗(61%)、泡泡瑪特(53%)領跑。四、重點企業分析與投資建議1. 泡泡瑪特(Overweight)作為中國IP 收藏品龍頭,泡泡瑪特受益於 “kidult” 需求擴張,核心 IP Labubu 持續引流,非核心 IP 也實現強勁增長。中國與亞太地區依託深厚市場積澱與高品牌認知度保持高增長,美國市場通過線下門店擴張與本土化合作積累復購使用者,目標 2025 年底門店數量超 60 家。公司淨利率有望維持 30% 以上的高水平,當前 2026 年預期市盈率 16 倍,處於歷史低位,具備較高投資價值。2. 三麗鷗(Overweight)以Hello Kitty 為核心的 IP 矩陣兼具增長潛力與穩定性,中國市場是主要增長引擎,亞太地區未來 5 年複合增長率預計達 26%;北美市場增長穩健但面臨關稅等風險。公司消費者以女性為主(中國市場佔比 64%,美國市場佔比 70%),有子女的家庭是核心客群,內在情感驅動屬性強,抗周期能力突出。當前股價接近年內低點,長期增長邏輯未變,是逢低佈局的優質標的。3. 孩之寶(Overweight)戰略轉向高增長、高毛利的IP 特許經營業務,數字與授權業務持續擴張,Magic: The Gathering 等核心 IP 勢頭強勁。美國市場品牌忠誠度高,復購率達 67%,中國市場滲透率雖低於泡泡瑪特,但潛在消費群體規模有望翻倍,增長潛力未被充分挖掘。2026 年預期市盈率 16 倍,低於疫情前 19 倍的平均水平,估值存在修復空間。4. 大麥(Overweight)作為中國領先的IP sublicense(二次授權)企業,受益於 IP 產品品類滲透加速,合作 IP 包括三麗鷗、寶可夢、漫威等頭部矩陣,2026 上半財年 IP 業務收入翻倍。中國 IP 授權市場仍有巨大增長空間,2023 年中國授權零售收入佔消費支出比例僅 0.1%,遠低於全球平均 0.5%,預計 2030 年市場規模將達 2800 億元,大麥作為 “IP gatekeeper” 將充分受益。五、風險提示與市場情景1. 主要風險宏觀經濟下行:嚴重經濟衰退期(如2008 年金融危機、2022 年中國疫情封控),IP 收藏品作為可選消費易被削減預算;創意依賴風險:消費口味快速變化,若企業無法持續推出吸引力產品,IP 生命周期可能縮短;熱度周期波動:單一IP 難以持續增長,若核心 IP 降溫且無替代者,將影響整體業績;政策與競爭風險:國際市場面臨關稅壁壘,行業競爭加劇可能引發價格戰。2. 情景預測樂觀情景:頭部企業持續推出優質IP,行業 2026-2027 年增速達 7%-10%,IP 生態整合與跨界合作推動估值提升;悲觀情景:宏觀風險加劇,行業2026-2027 年增速僅 2%-3%,需求疲軟導致定價權削弱,利潤率承壓。 (資訊量有點大)
一人幹翻一個劇組!北大哲學博士造出AI神器,20萬人在排隊用
【新智元導讀】當北大哲學博士用「美學」馴化了AI,程式設計師的戰場也變成了「藝術家」的樂園。在AI時代,人類獨特的審美力或許才是無法被程式碼取代的終極護城河。青年編劇古二魚死網破式開撕曾經的偶像王家衛鬧了一個多月,即便是科技圈,也被娛樂圈的瓜震驚到了。但科技圈一邊感慨「貴圈水真深」,一邊祭出瞭解決方案:一個叫Elser.AI的AI Agent橫空出世,讓新人創作者能夠不受過去行業階級的束縛,自由發揮自己的創作才華,實現「創作平權」的理想。首先,Elser.AI是個上手門檻很低,而且很好玩兒的創作神器。它的介面非常簡單明了,你可以給它一個完整的劇本,或者一段小說故事,甚至是一個腦洞式一句話創意,讓它幫你創作一段視訊。我們以從小耳熟能詳的《彼得·潘》的故事為例,首先輸入小說,它會很快生成指令碼,讓你選擇視訊畫風,再解析出故事裡的人物角色,並自動生成角色形象。中間的每一步,都可以由創作者控制調整。比如,如果形象不符合想像,你還可以通過輸入prompt的方式,來調節人物形象,比如髮色、臉型、身高、服飾搭配等。當然,你也可以上傳中意的角色形象圖片。確定好角色形象,下一步,Elser.AI會自動生成分鏡故事板。這裡是各位導演們大顯身手的地方了:從構圖、景深、機位、運鏡,到角色的動作、表情、台詞、聲音,全部可以通過調整prompt和內建選項來調整。即使到了後期剪輯的環節,也可以回到之前的步驟,隨時對前面的細節進行修改調整。如果你想要創作出質感更好的、劇情更吸引人的作品,你需要的完全不是學習《如何使用AI》《如何正確寫出AI提示詞》,而是文學課和藝術課。之前很多朋友哀嘆:當AI在寫詩作畫時,我還在工位上擰螺絲。Elser.AI終於讓人類扳回了這一局!難怪,ELSER.AI能在完全沒有任何宣傳的情況下,悄咪咪積累了20萬全球活躍使用者,都是短劇和動漫行業的專業創作團隊,當然更多的使用者則是個人創作者和小型工作室,早期據說經常被使用者刷爆伺服器。看來一人公司的時代的確要到來了!拿到內測號後,我們給在動畫公司做原畫的小夥伴展示了Elser.AI,這位朋友第一反應是:「啊?我不是要失業了吧!」緊接著第二反應:「趕緊讓老闆充個錢,能少加很多班!」第三反應:「還打什麼工啊,找幾個朋友自己就可以開工作室了!」即便你不是專業創作者,通過上述的流程,相信你也能輕鬆玩耍起來。(說起來,周圍用過Elser.AI的小夥伴都處在一種「玩兒得停不下來」的狀態……)那些我們心心唸唸的的名著、番劇、小說電影裡,影視化沒有拍出來的精彩情節,或者意難平CP的平行世界,都可以通過Elser來實現,並分享給全世界。ELSER.AI的創始團隊這樣形容自己做的事:AI帶來的生產力革命,進一步可以讓短劇這種形態的創作全民化,讓普通人跳過漫長/低效的IP衍生鏈條,直接把自己的故事變成短劇。這樣短劇就有可能跳出批次生成的同質化陷阱,成為更有創意,更有社交屬性和互動玩法的內容形態。一個人就是一個短劇工廠、人人可以打造自己的IP。他們認為,在AI時代,AI可以生成,但創造依然屬於人。AI可以推理,但審美依然屬於人。人之為人,在這個時代,在任何時代,都有自己不可磨滅的價值。在Elser看來,AI不是取代人,而是輔助人讓創意快速變成鮮活的影像。更多人終於有機會去展現心中的故事,通過創作去改變命運……更重要的是,ELSER.AI把短劇生成關鍵環節的「挑剔權」給了創作者。AI追求的是效率,但成果是需要挑剔的審美的。而審美是需要人的參與的。「我們的目標就是讓創造儘可能地簡單,讓創作者真正玩兒起來,快樂才能釋放創意。」ELSER.AI的創始人兼CEO劉耕這樣說。Elser作品展示全球短劇和漫劇正處於爆發期,美國短劇2025行業增速為50%;日本短劇當前市場規模是美國的1/9,是第二大市場,增速較快,增速超85%。6月27日,亞洲短劇協會秘書長寺田耕也指出 :當前日本短劇市場正處於高速增長階段。根據最新報告預測,2025年日本短劇市場規模將達到4.8億美元,同比增長高達85%,佔全球市場份額約15%。這表明日本已經成為全球範圍內備受矚目的增量市場。至於漫劇,2025年更以火箭般的速度增長。24年四季度全抖音漫劇充值收入將將2000萬,當下,抖音漫劇單日廣告消耗已突破1000萬。又是一個一年超100倍的增長神話。行業預測,2026年海外漫劇將迎來自己的爆發機會,而Elser.AI已提前完成海外漫劇平台的搭建,適逢其會,為每一個普通人提供了抓住機遇的利器和平台。ELSER.AI的創始團隊也可以用清(非)新(典)脫(型)俗來形容了。別人家AI創始人都是技術出身,ELSER.AI的CEO劉耕則是北大哲學系的本碩博。難怪把AI的靈魂三問「AI是誰,AI從那裡來,到那裡去」捋得明明白白。他的第一份工作是在武漢大學哲學學院,教書育人同時做美學研究。劉耕告訴我們:美學學術訓練,其實對發ELSER.AI這個產品起了很重要的作用。首先,它讓我攝入了大量文學、視覺藝術、音樂、電影等不同藝術形式的作品,培養了藝術鑑賞功力。更重要的是,這個學科是用系統的方法去分析、拆解作品和作者,這是跟創作者視角下渾然天成的靈感完全不同的邏輯系統。這個功底讓我能非常高效地教給AI如何判斷和生成一部好的作品:找到使用者喜歡的優質內容背後的秘密,如風格、敘事、意境等等。我把這些專業知識給到Agent,讓它可以做更好的故事、更精準的風格,更好的視覺呈現……直到進一步提升創作者的平均產出質量。難怪了,CEO自己作為AI先攝入了海(藝)量(術)數(作)據(品),還是經過演算法最佳化的,那教出來的AI可不聰明嘛。據團隊小夥伴說,CEO從小就是網文和遊戲的重度使用者,還是最早一批同人文寫手。原來學霸考北大這麼容易啊?Elser.AI團隊但學霸學習考試厲害,不代表能把握市場,管好公司。於是為了心中生根多年的「AI內容創造平台」理想,劉耕在2020年辭去了武漢大學的教職,加入了字節跳動,先後擔任了瓜瓜龍語文教研負責人和抖音集團CSR培訓總監,把產品設計、市場調研、創作者孵化全鏈路走了一遍。然後,在大廠人普遍焦慮的35歲,他,裸辭了,還是放棄百萬期權那種裸辭,出來創業做ELSER.AI。字節的經歷給了劉耕對於市場的敏銳嗅覺和設計產品的能力,他說:大家都在尋找下一個Tiktok級的平台機會,但我認為:· 第一步是幫助創作者低成本/高效產出有更高「審美價值」的內容;· 第二步是借助這些內容形成有差異化審美體驗的社區,吸引更多消費者進入,這樣才能形成一個飛輪。我們更聚焦漫劇,也是因為動漫短劇是Z世代高度喜歡的一種內容形態,它才剛剛起步,表達的可能性遠遠未被窮盡。幾乎任何題材(從科幻到歷史)、任何視覺風格(從達文西到宮崎駿),都可以在漫劇中實現新的審美表達。我21年在字節做短劇平台產品策劃時,正是因為看到了短劇這種形態的「審美」衝擊。美學,給予了我對於內容本質的判斷能力。相比CEO哲學美學式高屋建瓴的非典型,ELSER.AI的CTO張國棟則是一種落地生根式的非典型。他沒有打遊戲、寫網文的中學時代,而是從山東臨沂的農村考進了北京科技大學電腦系,父母至今仍在務農。上大學前他沒有自己的電腦,也沒寫過一行程式碼。然後他就,一邊當著學生會主席,一邊考上了北大的研究生,拿了阿里的offer,又放棄高薪和期權出來搞Elser了。這兩個相差9歲的師兄弟,就一起埋頭搗鼓,搞出了逆天的Elser,並獲得了正軒、奇績、後浪、雲沐等機構的投資。右:CEO劉耕,左:CTO張國棟他們下一步,還打算進一步降低ELSER.AI的使用門檻,提高視訊效果,並根據和終端使用者的互動資料,利用演算法的優勢,敏銳捕捉到新的故事範式、審美趨勢,將其拆解分析,給到前端創作者比如創意層面的推薦。傳統的劇作工業鏈條是很長的,並且成本高昂。一個故事能否最終呈現在觀眾面前,除了故事本身的質量,更多是靠運氣。Elser團隊表示,他們的願望就是在AI時代,利用技術,讓每一個有創作熱情的人都能不受外部制約地表達。為了能讓Agent更好用,Elser團隊還親自下場,同時製作了12部AI動漫短劇。從劇本到成片,都用自研工具完成。對內容質量的挑剔要求,驅動著產品快速迭代。下面這個短劇味兒很正的狼人故事就是Elser自己製作的。PS:這個口型對得很可以啊!當被問到「這麼好用的Agent你們為何一直藏著不公開宣傳」時,他們說:錢和時間要花在刀刃上,用有限的預算,繼續all in研發,把內部的AI短劇工作流,打造成真正可以供C端大規模使用的Agent。不做則已,要做,就要把這個場景吃透。現在,是他們覺得合適的一個時間節點了,Elser短劇Agent的海外版,當下已開啟Waitlist;將於12月1日上線,全線接入了Nano Banana Pro,並邀請Waitlist使用者體驗。國內版也將在完成大模型備案後上線。不會有飢餓行銷的邀請碼。所有在當下按要求登記Waitlist的使用者,都將在12月1日後收到他們的首波邀請。而全量開放,也將在快速拉滿並行和體驗後,向所有使用者展現。 (新智元)
阿里攻勢不減,這一仗是AI to C
將千問定義為“AI時代的未來之戰”,阿里並非一時興起,而是戰略的必然。阿里AI通往未來的野心越來越清晰了。11月13日,阿里巴巴傳聞將秘密啟動“千問”項目,當日股價最高上漲6%。11月17日,“傳言”落地成了現實:阿里巴巴正式官宣“千問”,全力進軍AI to C市場——千問App公測版正式上線,並同步提供網頁和PC版。面向全球市場的千問App國際版也將在近期上線,基於全球性能第一的開源模型Qwen3,以及與各類生活場景生態的結合,與ChatGPT直接對戰。上線首日,有消息稱千問公測便因使用者湧入過載,遭遇流量洪峰,部分服務出現擁堵和中斷。隨後,“阿里巴巴千問崩了”相關話題沖上微博熱搜。對此,阿里千問通過其官方微博回應稱:“我好著呢,狀態良好,歡迎來問。”11月18日,千問App在公測上線次日便迅速衝入蘋果App Store免費應用總榜第四位。市場對千問的熱情,首先源於技術期待。千問底座基於阿里開源模型Qwen3。自2023年全面開源以來,阿里Qwen在技術上全球領先。截至目前,Qwen共計開源模型超300款,覆蓋文字、程式設計、圖像等全模態,下載量突破6億次,衍生模型超17萬個。將千問定義為“AI時代的未來之戰”,阿里並非一時興起,而是戰略的必然。來源:受訪者今年9月的雲棲大會上,吳泳銘宣佈了阿里雲的新定位,要做全球領先的“全端人工智慧服務商”。通義千問希望成為下一代作業系統,阿里雲要成為“超級AI雲”,把Token做成未來的電。吳泳銘還拋出了一個關鍵論斷:“通用人工智慧AGI並非AI發展的終點,而是全新的起點。AI不會止步於AGI,它將邁向超越人類智能、能夠自我迭代進化的超級人工智慧(ASI)。”而通往ASI的第二階段便是“自主行動”,AI不再侷限於語言交流,AI掌握工具使用和程式設計能力以“輔助人”,且具備了在真實世界中行動的能力。這裡面有兩個隱含的重要資訊,一個是“全端”。AI發展至今,已經不是單純技術上的迭代和比拚了,而是一場體系性的革命。這意味著大廠之間的競賽已經不侷限於軟體/硬體、B端/C端的單點突破,而是全鏈條的競爭,任何一個環節的短板都有可能成為制約整體的瓶頸。阿里在模型層上很強,但在與海外ChatGPT、Gemini的全端比拚中,要追求系統上的最優,在C端的佈局不能過於謹慎。另一個重要資訊便是ASI的“自主行動”。不久的未來,AI將重構整個基礎設施、軟體和應用體系,顛覆人機互動的入口。從這個角度來看,千問比拚的也並非單純的C端應用能力,更是下一代的流量入口。AI to C,阿里必須要做,而且必須要贏。而千問,正是目前承載著阿里野心的最佳載體。01 阿里的AI野望目前的千問App幾乎整合了通義系模型的能力,在千問的對話欄中,支援深度思考、AI修圖、翻譯、即時記錄、拍照講題、AI生視訊、PPT創作、AI生圖等多種功能。阿里方面表示,這次發佈的千問App還只是一個初級版本,它不僅“會聊天”,未來還將成為“能辦事”的AI助手。雖然剛剛上線,千問已經展現出了一定的辦事能力。比如,一句指令就能在幾秒鐘完成一份研究報告,並製作成幾十頁的精美PPT。這種產品形態,與全球已擁有8億使用者的ChatGPT有著明顯的相似性。二者均以全場景AI入口為核心定位,通過統一的互動介面,滿足使用者從日常閒聊、知識查詢到複雜任務處理的全維度需求。在當下的全球競爭中,使用者對AI工具的期待已從單點功能轉向全端賦能:一個基礎模型如果只支援文字或者圖像某一個能力,未來空間必然受到制約。但在“模型即產品”的時代邏輯下,C端產品強大與否,更要看底層能力。在這一層面,阿里雲有充足底氣。Qwen下載量超過Llama。來源:受訪者自全面開源以來,阿里Qwen已經超越Llama等模型,成為全球性能最強、應用最廣泛的開源大模型。在AI雲端運算層,阿里巴巴營運著中國第一、全球領先的AI基礎設施和雲端運算網路。三方機構Omdia資料顯示,中國AI雲市場阿里雲佔比35.8%,超過2到4名總和;在已採用生成式AI的財富中國500強中,超53%的企業選擇阿里雲,滲透率位列第一。黃仁勳在2025年GTC大會上的演示,Qwen在全球開源模型中市佔率最高且還在增長。來源:受訪者Qwen還在迅速搶佔矽谷市場。Airbnb CEO布萊恩·切斯基公開表示,公司正“大量依賴Qwen”。輝達CEO黃仁勳也表示過,Qwen已佔據全球開源模型的大部分市場,並在持續擴大份額。近期,阿里發佈的旗艦模型Qwen3-Max,性能超過GPT5、Claude Opus 4等國際競爭者,躋身全球前三。不久前,千問更在與ChatGPT、Gemini、Grok等全球頂級模型PK的實盤投資大賽中斬獲冠軍。對阿里而言,並非此時才開始重視AI C端,而是阿里這一場AI敘事的線索彙集到今天,放大C端戰果的時機剛好成熟。吳泳銘在雲棲大會上的發言佐證了這一點。當各家科技公司還在“通用人工智慧”(AGI)道路上苦苦求索、爭論不休時,吳泳銘已對下一程“超級人工智慧”(ASI)打開暢想,其意在展露阿里對AI長期投入的決心。面向未來,吳泳銘將通往ASI的路徑分為三個階段:第一階段是“智能湧現”,AI通過學習人類知識具備泛化智能,目前通義千問已進入這一階段;第二階段是“自主行動”,AI掌握工具使用和程式設計能力以“輔助人”;第三階段是“自我迭代”,AI通過連接物理世界的全量原始資料實現自學習,最終達成“超越人”。阿里管理層認為,目前大模型的能力已經進入到“輔助人”的Agentic AI時代。C端應用湧現並接入現實場景的時機已到。阿里千問項目的產品經理在接受《晚點LatePost》採訪時提到:當下做C端的時機剛剛好,一方面是模型成熟度,Qwen3-Max整體性能、效果都已經達到全球領先。另外不管是三方生態,還是阿里集團內部,Agent生態都到了更能被模型普遍呼叫、能解決更多問題的階段。儘管現在國內已經有多款大模型產品提供給C端使用者選擇,但在阿里千問項目的產品經理看來,“客觀來說,還處於初級階段,還沒有真正演進到能解決很多實際問題的程度。”02 打造未來的AI生活入口那麼,AI to C為何在今天對阿里變得如此重要?在阿里的生態中,現有最大體量的to C產品無疑是淘寶、支付寶、高德。而下一個時代,流量入口或許將被AI重構。從這個角度思考,就不難理解阿里全力投入AI to C的必要性——這並非單純的C端產品競爭,而是一場事關未來入口的爭奪戰。強大的模型和完整的生活消費生態,構成阿里AI to C的競爭力。阿里方面也表示,千問App的戰略目標是打造未來的AI生活入口,成為阿里全端生態系統的“中樞神經”。比如,在傳統手機OS裡,淘寶找商品、支付寶付錢、飛豬訂酒店,每個步驟都要切換App。未來,千問或將讓使用者無需關心“服務來自那個App”,只需說“規劃周末親子游,訂門票、酒店,用餘額寶支付”,系統便可以在淘寶上比價下單,或自動完成跨平台協同,打破應用壁壘。雲棲大會阿里AI七連發,通義佔據HF全球模型榜單前十中的七席。來源:受訪者阿里的“合力”與“聚焦”的趨勢越來越明顯。今年以來,阿里打破業務類股壁壘,電商、支付、本地生活、雲端運算、健康、文娛等多條業務線,都在圍繞AI進行資源整合與重構。這些線索最終都指向一個“大腦”,那就是千問——或許在未來不久,千問會成為阿里生態內的服務連接器,以及新的高頻流量入口;讓阿里的各個生態協同性更強,將分散的場景需求與業務能力匹配,實現流量的二次啟動。當然,“打通生態”絕非易事,打破部門牆也將是對阿里組織能力的巨大考驗。但今年淘寶閃購和餓了麼、高德等業務的協同作戰、流量互導,實現了單業務線難以達成的增長突破,也激發了阿里內部的戰鬥力和士氣,證明了打破壁壘的可能性。毫無疑問,阿里必須打贏AI to C這場戰役,這不僅關乎搶佔全球AI競爭主導權的當下,更決定了阿里未來在數字生態領域的生死成敗。03 三場硬仗,阿里持續進擊回過頭看,阿里從2月宣佈未來三年投入3800億重注AI,到5月強勢入局即時零售、9月上線高德掃街榜,再到11月上線千問App、全力進軍AI to C,今年阿里多條業務線接連爆發,逐漸匯聚為一股強勁的增長勢頭。在幾場關鍵戰役中,阿里在持續增長的AI需求驅動下,阿里雲收入加速增長至26%,AI相關產品收入連續8個季度實現同比三位數增長。在競爭激烈的即時零售市場,淘寶閃購快速拿下市場份額,日訂單峰值達1.2億單,協同效應更帶動電商MAC(月度活躍消費者數)增長25%。9月高德發佈“掃街榜”,上線僅23天使用者數便突破4億。單一產品的成功或許有偶然,但業務生態的繁榮必然依賴佈局。阿里正在推進的這盤大棋,關鍵在於發揮協同效應——各業務類股深度聯動,帶動公司整體勢能持續回升。更重要的是,在這場關乎未來的AI時代競爭中,人們看到那個敢於破局、持續進擊的阿里又回來了。這也構成阿里未來最堅實的發展底氣。 (中國企業家雜誌)
Sam Altman深夜爆料:ChatGPT的成功,一半靠運氣!
OpenAI這一個月有多瘋狂?CEO Sam Altman剛接受完採訪,資訊量大到炸裂——從兆美元基建投資到Sora爆火,從版權風波到AI創作革命,每一個話題都足以刷屏。💡兆投資不是泡沫,是"必須花的錢"當被問到OpenAI宣佈的一系列基建合作(從Nvidia到AMD再到三星)是否是"AI泡沫"時,Altman的回答很直白:"我們會花很多錢在基礎設施上,這是公司層面的豪賭。對還是錯?我們會知道答案,但這就是我們的決定。"他坦言,自己大部分時間都在處理基礎設施問題:"要同時搞定晶片產能、資料中心、電力裝置、消費者需求……這些事必須同時發生,不能一件一件來。" 🤖有意思的是,Altman說自己其實不適合當大公司CEO:"如果讓我選天賦所在,我更適合當投資人。"但正是投資人的思維訓練,讓他懂得如何在指數級增長的世界裡分配資本,如何押注那些看起來瘋狂但潛力無限的項目。ChatGPT的成功,一半靠實力一半靠運氣Altman承認了兩個"意外":一是ChatGPT比預期火得多,二是某些大科技公司在ChatGPT發佈後的反應太慢,給了OpenAI建立優勢的時間窗口。他沒點名,但暗示Google在早期掉鏈子了。不過他也強調,過去兩年半的發展基本按計畫進行:"我們很早就在思考基礎設施建設、應用生態、API和消費者業務的統一。"換句話說,最初的窗口期是運氣,但之後的執行是實力。🔥Sora創作者佔比30%:AI讓更多人成為創作者Sora上線後,資料讓團隊都驚了:前幾天,30%多的活躍使用者都在創作內容!這打破了網際網路的"90/9/1法則"(90%的人只看不創作)。Altman說:"我們一直低估了人類的創作慾望。如果能大幅降低創作門檻,遠比1%的人會去創作。"他還提到,很多人用Sora生成搞笑視訊發給三五好友,這種小圈子社交需求遠超預期,但也意味著現有的廣告模式可能撐不住成本,使用者可能得為生成視訊付費。💬版權風波的意外發現:視訊比圖片更敏感Sora剛發佈時,網上出現了各種動漫角色的AI生成視訊(比如皮卡丘、海綿寶寶),版權方反應激烈。Altman說,他們低估了視訊和靜態圖片的差異:"視訊給人的感覺更真實、更有情感衝擊力,版權方的態度和圖片完全不同。"但他預測,一年後情況會反轉:"到時候版權方可能會抱怨'為什麼我的內容沒被用在更多視訊裡?'因為他們會發現,這能加深粉絲連接。" 🚀AI會搶走工作嗎?Altman說不會關於AI對就業的影響,Altman給出了一個溫暖的答案:"人類喜歡為別人做事,喜歡被認可和欣賞。所以我們會找到新的方式去幫助別人、為別人創造價值。"他認為,AI創作工具的爆火恰恰證明了這一點——人們渴望表達、渴望被看見。未來幾個月還有大動作當被問到三星、AMD等一系列合作如何整合時,Altman賣了個關子:"再給我們幾個月,一切都會說得通。我們沒有看起來那麼瘋狂,是有計畫的。"看來,OpenAI的基建拼圖還沒拼完,接下來可能還有重磅合作要宣佈。💥你覺得OpenAI這種"全押"策略能成功嗎?AI創作真的會讓人人都成為創作者嗎?歡迎評論區聊聊你的看法! 👀✨ (澤問科技)
「一頁紙」講透美股公司之:Unity
今天繼續給大家帶來「一頁紙」講透美股公司系列。對國內投資者而言,美股研究資料相對匱乏。這是一個非常「有錢景」的方向,我會借助 AlphaEngine 的幫助,幫你跨越美股研究的資訊鴻溝,每天挖掘一個潛在的美股財富密碼。本期的主角是Unity,能否成為下一個AppLovin?(1)Unity的發展歷程Unity是全球領先移動遊戲創作與廣告營運平台。Unity於2004年創立,早期專注於Mac OS X的遊戲開發。公司發展的關鍵轉折點是2008年,在蘋果iPhone發佈後迅速推出對iOS的支援,隨後在2010年前將相容性擴展至Windows和Android系統,奠定了其作為領先跨平台引擎的堅實基礎,並迅速在移動遊戲市場佔據主導地位。從2014年起,Unity開始戰略性地拓展業務並探索貨幣化。公司推出了Unity Ads廣告平台,標誌著其向服務化轉型。通過收購遊戲伺服器提供商Multiplay和即時語音技術公司Vivox,Unity建構了更全面的開發者服務生態。同時,公司業務開始滲透至VR、影視及汽車等非遊戲領域,商業模式從單一引擎許可向平台化服務演進。2020年9月,Unity在紐交所成功上市,融資13億美元,開啟了新的發展篇章。為強化廣告業務,公司於2022年以44億美元收購了ironSource。然而,2023年推出的“Runtime費用”新政引發了開發者社區的強烈抵制和信任危機,對公司聲譽和股價造成了顯著負面影響。面對困境,Unity在2024年迎來重大戰略調整。新任CEO馬修·布羅姆伯格於5月上任後,果斷廢除了爭議性的Runtime費用,著手修復開發者信任。公司通過剝離非核心業務、裁撤約30%的低毛利業務員工等方式,顯著最佳化了成本結構。另一方面,公司於2025年5月13日正式上線Vector AI廣告演算法,推動廣告業務效率邊際改善。這些改革已初見成效,公司2025年第二季度實現總營收4.41億美元,調整後EBITDA達0.9億美元,雙雙超出市場預期與公司指引,展現出強勁的財務表現,標誌著公司已進入困境反轉階段。(2)Unity的商業模式:Create & Grow建構資料飛輪Unity的業務分為Create和Grow兩部分,前者是以訂閱製為核心的遊戲內容創作引擎,後者是以AI廣告為核心的增長業務,我們分別來看。Unity的Create業務以核心引擎產品為基礎,通過訂閱模式實現收入,是公司的基本盤。作為最新的長期穩定版本,Unity 6在多人遊戲開發、光照渲染及AI能力上實現了重大增強。其訂閱模式是主要收入來源,2025年Pro版和Enterprise版分別提價8%和25%,在穩固的開發者生態基礎上直接提升了業務的盈利能力。Unity 6.2版本推出的AI功能套件是其商業化的新增長點,包含程式碼助手(Assistant)、資產生成工具(Generators)和推理引擎(Inference Engine)。該套件採用積分消耗的商業模式,旨在開闢新的收入增長點,並向基於使用量的定價模式(usage-based pricing)長期轉型,是公司未來重要的增長引擎。Unity的Grow業務是公司的增長與變現業務類股,為開發者提供使用者獲取、廣告變現及營運分析工具,其收入模式主要為廣告展示分成和效果計費。該業務的核心是Unity Ads廣告網路,並通過2022年對ironSource的戰略收購得到顯著增強,奠定了其在移動廣告領域“龍二”的市場地位,旗下Mediation聚合平台與DSP均為行業頂級水平。2025年5月13日,公司正式上線了基於機器學習的Vector AI演算法,作為廣告技術堆疊的核心升級,旨在提升廣告投放的精準度和效率。Vector AI上線後效果立竿見影,推動2025年第二季度廣告網路收入環比增長15%,並預計未來將釋放25%的環比提升潛力,成為驅動Grow業務增長的關鍵引擎。Unity通過Create(創作)和Grow(增長)兩大業務建構了獨特的“創作-營運”協同飛輪,形成了強大的資料壁壘和網路效應。該模式的核心在於整合併利用兩類核心資料資產:一是由Unity引擎在移動端超70%市佔率帶來的海量、一手“引擎使用資料”,二是通過Unity Ads及ironSource平台積累的“廣告行為資料”。這兩類資料共同構成了訓練Vector AI演算法的獨家資料集,實現了“賦能創作 → 促進增長 → 資料回傳最佳化”的閉環。引擎資料對廣告演算法的賦能效果預計將在2026年開始顯現,形成區別於競爭對手的差異化優勢。(3)Unity的核心競爭力及護城河首先,Unity的核心護城河基石在於其卓越的跨平台相容性。引擎支援約30個不同平台,覆蓋PC、主機、移動裝置及VR/AR頭顯,使開發者能夠實現“一次開發,多平台部署”,極大地降低了開發成本與時間周期。這一能力幫助Unity在移動遊戲領域建立了絕對的統治地位,市場佔有率超過70%,並在Steam等PC平台長期維持約50%的份額。這種廣泛的平台覆蓋和市場滲透率構成了難以踰越的規模壁壘,是其商業模式的根基。在此基礎上,Unity建構了一個龐大且高粘性的開發者生態系統,形成了強大的網路效應。其Asset Store資源商店擁有超過7萬個軟體包,為開發者提供了豐富的工具、外掛和美術資源,顯著提高了開發效率。龐大的使用者基數和成熟的社區支援創造了極高的轉換成本。許多開發團隊(如米哈游)的技術堆疊、工作流和人才儲備均深度繫結Unity,形成了路徑依賴。這種自我強化的生態系統壁壘,使得競爭對手難以在短期內撼動其開發者基礎。第三,Unity獨特的“引擎+廣告”業務模式構築了一個強大的資料飛輪。引擎業務為廣告業務提供了海量、高品質的資料來源,目前已有70-80%的客戶回傳資料。這些資料,特別是來自重度遊戲的資料,為廣告演算法的迭代最佳化提供了堅實基礎。2025年5月上線的Vector AI演算法正是基於此資料優勢,顯著提升了廣告投放效率和變現效果。引擎與廣告業務的協同效應,不僅增強了客戶粘性,更形成了一個資料驅動的、持續自我最佳化的閉環,構成了獨特的競爭優勢。*註:由FinGPT Agent作表,原表請登錄AlphaEngine與此同時,Unity通過AI深度整合與非遊戲領域的成功拓展,開闢了第二增長曲線。公司在Unity 6.2版本中推出AI功能套件(Assistant、Generators、Inference Engine),旨在提升開發效率並探索新的商業化模式。同時,Unity已成功將其技術應用於汽車、工業模擬等非遊戲領域,該部分業務收入佔比已達23%。這種多元化戰略降低了公司對單一遊戲市場的依賴,增強了業務的抗風險能力,並為其長期增長打開了更廣闊的空間。(4)Unity財務資料分析Unity在2024年經歷重大戰略調整後,其財務表現自2025年起呈現顯著的困境反轉態勢。公司聚焦引擎訂閱與廣告核心業務,並實施嚴格的成本控制措施,成效在2025年上半年得到驗證。連續兩個季度(Q1、Q2)的營收和調整後EBITDA均超出市場預期,標誌著公司已步入財務修復和重回增長的軌道。*註:Unity財務資料,BTIG,AlphaEngine營收結構最佳化,核心業務重拾增長。2024年的戰略調整剝離了低毛利的非核心業務,導致2025年初營收同比下滑。然而公司核心業務增長動能強勁。2025年Q2,Create業務(引擎)在剔除非戰略性收入後同比增長16%,Grow業務(廣告)受益於5月上線的Vector AI演算法,Q2收入環比略增。盈利能力顯著修復,利潤率持續改善。盈利能力是改善最為顯著的環節。儘管GAAP淨利潤仍為負,但虧損幅度已在縮小。更關鍵的是,調整後EBITDA利潤率從2025年Q1的17%提升至Q2的21%,反映出裁員近30%和業務重組帶來的成本結構最佳化效果顯著,公司正穩步邁向持續盈利。現金生成能力強勁,財務狀況穩健。公司的現金生成能力大幅改善,2025年Q2實現自由現金流1.27億美元,較2024年同期的0.8億美元同比增長58%。強勁的現金流不僅驗證了營運效率的提升,也為公司未來的技術投入和業務拓展提供了堅實基礎,降低了對外部融資的依賴。(5)遊戲引擎行業競爭格局分析Unity橫跨遊戲引擎及移動遊戲廣告這兩大類股,因此其競爭格局呈現雙重性。在遊戲引擎領域,Unity、Unreal Engine和Godot三大遊戲引擎在市場定位、商業模式和技術特性上存在顯著差異,形成了差異化的競爭格局。Unity憑藉其廣泛的跨平台支援和龐大的生態系統,在移動和中小型項目市場佔據絕對主導地位。Unreal Engine則以其頂級的圖形渲染能力,在高端3A遊戲市場形成技術壁壘。Godot作為開源免費的後起之秀,憑藉其輕量化和零成本優勢,在獨立開發者和2D遊戲市場快速滲透。*註:由FinGPT Agent作表,原表請登錄AlphaEngineUnity在遊戲引擎市場中佔據著核心且獨特的“中間地帶”領導者地位。憑藉其無與倫比的跨平台能力(支援約30個平台)和成熟龐大的開發者生態系統(Asset Store擁有超7萬個資源包),Unity在移動遊戲(市佔率超70%)和中小型項目市場建立了深厚的護城河。這使其成為絕大多數商業遊戲和獨立開發者的首選,保證了其穩固的基本盤和高市場粘性。然而,Unity也面臨來自高端和低端市場的雙重擠壓:在高端市場中Unity面臨技術壓制。來自Epic Games的Unreal Engine,憑藉其在3A大作中展現的次世代圖形技術(如UE5的Lumen和Nanite),在追求極致視覺效果的高端PC和主機遊戲市場形成了強大的技術壓制,吸引了頂級開發團隊。在低端市場中,Unity則面臨成本挑戰。Godot等開源引擎以其完全免費、輕量高效的特性,在獨立開發者和預算有限的小型團隊中迅速崛起,尤其在2D遊戲領域構成了直接的成本優勢挑戰,分流了部分初級和獨立開發者使用者。Unity的戰略定位是在保持其跨平台和生態優勢的同時,向上通過技術迭代(如Unity 6性能提升)追趕Unreal,縮小高端渲染差距;向下通過最佳化免費版和社區營運,應對Godot等開源引擎的成本衝擊,從而鞏固其市場領導地位。(6)移動遊戲廣告市場競爭格局分析在移動遊戲廣告技術領域,Unity(Grow業務)與行業龍頭AppLovin形成“雙雄”格局。*註:由FinGPT Agent作表,原表請登錄AlphaEngine作為行業第二,Unity正通過其獨特的生態優勢和技術迭代,積極追趕AppLovin。Unity最大的差異化優勢在於遊戲引擎。通過整合引擎端資料(如Game Analysis功能)與廣告業務資料,Unity能夠獲取AppLovin等純廣告平台無法觸及的一手、高品質使用者行為資料。目前已有70-80%的客戶回傳資料,為演算法模型提供了獨特的訓練養料,這是其彌補技術和規模差距的核心武器。2025年5月上線的Vector AI演算法是Unity追趕策略的關鍵一步。該演算法上線僅一個半月,就推動Q2廣告收入環比增長15%,效果已初步顯現。公司預計,隨著更多重度遊戲資料的融入和演算法的持續最佳化,未來幾個季度廣告效果有望再提升25%,這將直接增強其對廣告主的吸引力。當前Unity的Take Rate(30-35%)遠低於AppLovin(50-60%),這既是差距也代表著巨大的增長潛力。隨著Vector演算法的成熟度和廣告投放ROI的提升,Unity的議價能力將逐步增強。未來,通過提升廣告變現效率,Unity有望在不損害開發者利益的前提下,逐步提高其Take Rate,從而實現收入和利潤率的雙重增長,縮小與AppLovin的盈利差距。(7)Unity的潛在風險Unity面臨的主要風險是市場競爭風險。針對Create業務而言,公司處於Unreal Engine在高端市場的技術壓制和Godot等開源引擎在低端市場的成本侵蝕的雙重夾擊之下。針對Grow業務而言,行業龍頭AppLovin憑藉其規模效應和技術優勢,始終是Unity難以踰越的強大對手。此外,增長不及預期的風險是當前最大的不確定性。公司的困境反轉故事高度依賴於AI商業化和廣告演算法最佳化的成功兌現。如果這些新舉措帶來的收入增長無法覆蓋成本或彌補非核心業務剝離帶來的缺口,公司的盈利修復處理程序將受到嚴重挑戰。投資者需密切關注新管理層對戰略的執行力,以及IronSource併購案的長期協同效應是否能真正釋放。 (Alpha Engineer)
剛剛,1500名作家向 AI 宣戰!
作家們集體宣戰了!1500位作者聯名向美國各大出版商發出公開信,要求徹底拒絕AI生成的書籍內容,這份名單裡不乏勞倫·格羅夫、列夫·格羅斯曼、匡靈秀等暢銷書作家。這不是個簡單的抗議,而是一場關於創作本質的戰爭。公開信直指要害:「我們正站在懸崖邊上。」作家們的訴求清晰而堅決——拒絕任何AI工具創作的手稿、封面藝術或有聲書。不要秘密的AI代筆,不要用虛構筆名掩蓋機器輸出,不要裁員或讓員工轉崗去監督AI,堅決只僱傭人類敘述者。未來的出版合同將嵌入這些要求。信中寫道:「作為藝術家,我們的工作最簡單來說就是回應人類體驗。但我們創作的藝術是商品,而這個世界想要快速、廉價、按需的東西。」「我們正奔向這樣一個未來——我們的小說、傳記、詩歌和回憶錄,這些人類體驗的記錄,將被AI模型『創作』,而這些模型從定義上就不可能知道什麼是人。」——“流血、飢餓或愛情。”作家們控訴道,每次有人向AI輸入提示詞,機器使用的語言都部分來自於他們職業生涯中精心創作的藝術作品。「未經我們同意,沒有付款,甚至連致謝的禮貌都沒有。」在寫作中,他們傾注了自己的生活:父母的離世、孩子的誕生、每一段經歷或想像的愛情。人類英雄主義和人性墮落的故事。「這些故事被從我們這裡偷走,用來訓練機器。如果短視的資本主義貪婪獲勝,這些機器很快就能生成填滿我們書店的書籍。」此事事件,或許起因於不久前——Sauers (@Sauers_) 爆料稱:Anthropic購買了數百萬本實體印刷書籍,用於數字掃描來訓練Claude而也就在幾天前,聯邦法院剛剛裁定,只要通過合法手段獲得,受版權保護的作品可以合法用於訓練AI:用受版權保護的書籍訓練大語言模型構成合理使用。這對作家們來說無疑是個打擊。法官Alsup寫道,作者們的訴訟「與他們抱怨訓練學童寫作會導致競爭作品激增沒有什麼不同」。對此,吳恩達(Andrew Ng)也發文評論道:正如我們允許人們閱讀書籍並從中學習成為更好的作家,但不允許逐字複製受版權保護的文字一樣,法官得出結論,AI模型這樣做也是合理使用。他還指出,雖然訓練合法獲得的資料是可以的,但使用盜版材料(如從盜版網站下載的文字)不屬於合理使用。但,作家們聲稱:「難道這就是最終目標嗎?」把作家們從等式中完全移除,讓資本結構頂端的人從我們的勞動中獲得比現在更多的利潤?信中特別提到,有聲書敘述者已經被更便宜、更簡單的AI模仿者取代。而使用AI還會帶來毀滅性的環境影響,消耗大量能源和飲用水。公開信要求出版商承諾:不會公開或秘密出版使用AI工具創作的書籍不會發明「作者」來推廣AI生成的書籍不會使用建立在被盜藝術家作品基礎上的AI來設計書籍不會用AI工具完全或部分取代員工不會建立監督AI生產的新職位只會僱傭人類有聲書敘述者「我們希望出版商與我們站在一起。」公開信發佈後24小時內,已有1100個簽名加入:Rohan Paul (@rohanpaul_ai) 評論道:這些事情在革命性變革之前很常見。St33l Mouse (@St33lMouse) 回應:唯一能拯救他們的是AI現在還是個糟糕的小說作家。一旦它能寫出好小說或劇本,一切都結束了,沒有法律、承諾或拍桌子能阻止它。Will (@nerfherder92177) 則指出:進化或滅亡。當機器學會講故事,人類的故事還有價值嗎?這場戰爭才剛剛開始。作家們說得沒錯——只有人類才能真正理解另一個人類。機器可以模仿文字的排列,卻無法體會午夜的孤獨、初戀的心跳、失去的痛苦。但技術的車輪從不倒轉。當印刷術發明時,抄寫員失業了。當照相機出現時,肖像畫家慌了。現在,輪到了作家。不同的是,這次被「偷走」的不是技藝,而是靈魂。每一個被用來訓練AI的故事,都曾是某個作家的心血。每一段被機器學習的文字,都曾讓某個讀者在深夜流淚。這不僅是關於版權,更是關於創作的意義。如果有一天,暢銷書榜上全是AI 的名字,書店裡擺滿機器的「作品」,我們失去的不只是作家這個職業。我們失去的,是人與人之間最後的連接——通過故事理解彼此的能力。但在AI 的機率和另一維度的智能裡,這卻並沒有任何實際的意義。或許,這場戰鬥,關乎的不只是1500個作家的飯碗——更關乎的是,在AI 時代,人類故事的命運。 (AGI Hunt)
通義萬相VACE開源!一款模型搞定多種視訊編輯任務
此次開放原始碼的 Wan2.1-VACE-1.3B 支援 480P 解析度,Wan2.1-VACE-14B 支援 480P 和 720P 解析度。通過 VACE,使用者可一站式完成文生視訊、圖像參考生成、局部編輯與視訊擴展等多種任務,無需頻繁切換模型或工具,真正實現高效、靈活的視訊創作體驗。傳統視訊生成流程,一旦生成完成,想要調整人物姿態、動作軌跡或場景佈局非常困難。VACE 提供了強大的可控重繪能力,支援基於人體姿態、運動光流、結構保持、空間運動、著色等控制生成,同時也支援基於主體和背景參考的視訊生成。背後的核心技術是 VACE 的多模態輸入機制,不同於僅依賴文字提示的傳統模型,VACE 建構了一個集文字、圖像、視訊、Mask 和控制訊號於一體的統一輸入系統。對於圖像輸入,VACE 可支援物體參考圖或視訊幀;對於視訊輸入,使用者可以通過抹除、局部擴展等操作,使用 VACE 重新生成;對於局部區域,使用者可以通過0/1二值訊號來指定編輯區域;對於控制訊號,VACE支援深度圖、光流、佈局、灰度、線稿和姿態等。VACE 支援對視訊中指定區域進行內容替換、增加或刪除等操作。在時間維度上,VACE 可根據任意片段或首尾幀補全整個視訊時長;在空間維度上,支援對畫面邊緣或背景區域進行擴展生成,如背景替換 ——在保留主體不變的前提下,依據 Prompt 更換背景環境。得益於強大的多模態輸入模組和 Wan2.1 的生成能力,傳統專家模型能實現的功能 VACE 可以輕鬆駕馭,包括:圖像參考能力,給定參考主體和背景,可以完成元素一致性生成視訊重繪能力,包括姿態遷移、運動控制、結構控制、重新著色等局部編輯能力,包括主體重塑、主體移除、背景延展、時長延展等VACE 還支援多種單任務能力的自由組合,打破了傳統專家模型各自為戰的協作瓶頸。作為統一模型,它能夠自然融合文生視訊、姿態控制、背景替換、局部編輯等原子能力,無需為單一功能單獨訓練新模型。這種靈活的組合機制,不僅大幅簡化創作流程,也極大拓展了 AI 視訊生成的創意邊界,例如:組合圖片參考 + 主體重塑功能 → 視訊中物體替換組合運動控制 + 首幀參考功能 → 靜態圖片的姿態控制組合圖片參考 + 首幀參考 + 背景擴展 + 時長延展 → 將豎版圖拓展為橫式影片,並且在其中加入參考圖片中的元素。我們通過對四類常見任務(文生視訊、圖生視訊、視訊生視訊、局部視訊生視訊)的輸入形態進行分析和總結,提出了一個靈活統一的輸入範式:視訊條件單元 VCU。它將多模態的各類上下文輸入,總結成了文字、幀序列、mask 序列三大形態,在輸入形式上統一了 4 類視訊生成與編輯任務的統一。VCU 的幀序列和 Mask 序列在數學上可以相互疊加,為多工的自由組合創造條件。如何將多模態輸入統一編碼為擴散 Transformer 可處理的 token 序列?這是 VACE 需要解決的一大難題。首先,VACE 對 VCU 輸入中的 Frame 序列進行概念解耦,將其分為兩類:一類是需要原封不動保留的 RGB 像素(不變幀序列),另一類是需要根據提示重新生成的內容(可變幀序列)。接下來,分別對這三類輸入(可變幀、不變幀、Mask)進行隱空間編碼,其中,可變幀和不變幀通過 VAE 被編碼到與 DiT 模型噪聲維度一致的空間,通道數為 16;而 mask 序列則通過變形和採樣操作,被對應到時空維度一致、通道數為 64 的隱空間特徵。最後,將 Frame 序列和 mask 序列的隱空間特徵合一,並通過可訓練參數對應為 DiT 的 token 序列。通過本次發佈的 VACE 系列模型定量評測可以看出,相比 1.3B preview 版本,模型在多個關鍵指標上均有明顯提升。在訓練策略上,我們對比了全域微調與上下文介面卡微調兩種方案。全域微調通過訓練全部 DiT 參數,能取得更快的推理速度;而上下文適配微調方案是固定原始的基模型參數,僅選擇性地複製並訓練一些原始 Transformer 層作為額外的介面卡。實驗表明,兩者在驗證損失上差異不大,但上下文介面卡微調具有更快的收斂速度,且避免了基礎能力丟失的風險。因此,本次開源版本採用該方法進行訓練。如果想要基於 VACE 進行二次開發,可以遵循以下步驟進行使用,首先從 GitHub 下載 Wan2.1 的官方repo,再進入HuggingFace或  ModelScope下載對應的 VACE 模型,在 Wan 的主站也即將支援 VACE 的部分功能。 (通義大模型)