#視訊
《快公司》丨為什麼“變成中國人”正在席捲美國社交媒體
Why ‘becoming Chinese’ is taking over social media如果你最近刷TikTok時,“為你推薦”頁面突然充斥著人們煮蘋果、穿著居家拖鞋慢悠悠走動的視訊,那麼原因就在這裡。“我看到好多美國人開始喝加了檸檬和蜂蜜的熱水、吃粥、吃火鍋、喝更多湯、吃中式蔬菜,”一位名叫艾瑪·彭(Emma Peng)的中國創作者最近在一條已獲得超300萬次觀看的TikTok視訊中說道,“我想說,我的文化也可以成為你的文化。你們真的很棒,懂得好好補水,我為你們感到驕傲。”眼下,“變成中國人”(becoming Chinese)這一潮流正風靡TikTok。儘管這個說法乍聽之下可能令人遲疑,但實際上它主要指的是採納源自傳統中醫理念的生活習慣。在過去一個月左右,許多中國創作者因推廣常見的中國文化習俗而走紅,比如喝熱水、穿室內拖鞋,以及在寒冷季節裡用熱粥和煮蘋果代替冷沙拉與酸奶。與此同時,評論區則擠滿了認真做筆記的美國使用者。引領這股潮流的另一位創作者是華裔美國TikToker雪莉·西瑞(Sherry Xiiruii)。她在一條獲得140萬次觀看的熱門視訊中宣佈:“從明天起,你就要變成中國人了。我知道聽起來有點嚇人,但現在反抗已經沒用了——你就是這個天選之子。”通常,當一種潮流涉及借用甚至“變成”另一種文化時,往往會引發關於文化挪用的批評。一些使用者也確實表達了複雜情緒:他們過去因這些文化習慣而被嘲笑,如今卻被重新包裝成網紅趨勢大肆流行。然而這一次,中國創作者們的反應卻出奇地積極。考慮到新年伊始正是人們熱衷自我提升的時節,這種植根於養生理念的趨勢走紅或許並不意外——畢竟,許多如今在社交平台上爆火的健康小貼士,早在數千年前就已存在於古老的東方醫學之中。正如一位TikTok創作者所說:“我只想問一句:你們怎麼現在才跟上?”不過,人們對中華文化的興趣並不僅限於TikTok的養生演算法。“你遇見我的時候,正好是我人生中最‘中式’的階段。”2025年4月,一條模仿《搏擊俱樂部》經典台詞的X平台熱帖寫道。與此同時,2025年全年網路上還陸續出現了關於“中式極致”(chinesemaxxing)的內容——包括蹲在地上抽菸、穿著中式盤扣夾克等行為。正如製作人明·陳(Minh Tran)在一篇題為《我的休養與中式極致之年》的Substack文章中所寫:“這些視訊之所以不像是赤裸裸的嘲弄,是因為其中包含了一絲真實的認同與嚮往。雖然‘中國製造’早已無處不在,但如今我們正越來越多地按照中國人的形象重塑自己。”他提到了2025年風靡全球的Labubu熱潮。這款由中國潮玩公司泡泡瑪特(Pop Mart)推出的毛絨收藏玩具,成為當年最突出的文化現象之一,不僅使公司利潤翻了三倍,更在全球掀起搶購狂潮。他還回憶起那個短暫的時刻——由於美國對TikTok潛在禁令的擔憂(最終並未實施),大量使用者紛紛轉向中國社交平台“小紅書”(Rednote),並戲稱要告別自己的“私人中國間諜”。在科技及其他多個領域,中國已成為美國最接近的競爭對手,甚至在許多方面構成了最大挑戰。在當下美國社會前所未有地分裂、國內政治令許多人感到尷尬之際,人們開始將目光投向國境之外,尋找新的生活方式。因此,在當前的地緣政治背景下,“變成中國人”這一潮流或許遠不止於喝熱茶和穿拖鞋那麼簡單。正如明·陳所言:“‘中國世紀’的可能正籠罩著我們所有人。”” (invest wallstreet)
它,正在成為國運之戰
政經哲思維筆記君說:這段時間,你是不是也被各種AI新聞刷屏了?它已經從能和你聊得有來有回的智能助手,到一鍵生成電影級畫面的視訊工具,再到寫程式碼、做設計樣樣精通的“全能選手”。更要命的是,這種力量不只用來寫文章、做圖、寫程式碼。它正在以我們看不懂的速度,攪動著國際局勢、地區安全、軍事對抗這些相當危險的領域。世界好像突然被拉上了一個陌生而高速的賽道,規則還沒定,但比賽已經開始了。就在這個節骨眼上,一本叫做《科技共和國》的書,讀起來格外扎心。它的作者之一,亞歷山大·卡普是“矽谷教父”彼得·蒂爾的密友,也是矽谷核心圈走出來的“叛徒”。他在書裡對所有矽谷科技精英階層發出警告:你們已經迷路了!這本書的核心觀點是:一個國家、一個文明的強大,從來不是只靠技術先進(硬實力)就行,它還必須想清楚“為什麼而強大”(軟信仰)。美國之所以曾經偉大,是因為它能把造原子彈、送人登月這樣的技術壯舉,和一個關於國家使命、人類進步的宏大夢想擰成一股繩。但現在,我們面對AI這個遠超我們人類智能的新物種時,尷尬地發現:我們的“硬實力”(技術)跑得飛快,但“軟信仰”(我們到底要用它來建設一個什麼樣的世界)卻嚴重掉隊,甚至一片空白。《科技共和國》就像一本在岔路口被重新發現的地圖。它提醒我們,在焦慮“飯碗”會不會被AI搶走之前,或許更該問一個根本問題:我們人類,究竟想借由這股力量,把自己帶到那裡?接下來我們就一起翻開這張地圖,看看歷史如何指引我們駕馭未來。一、硬實力和軟信仰這對引擎,是如何驅動黃金時代的?美國的科技黃金時代,就是造出原子彈、把人類送上月球的歲月,絕不是一群天才在實驗室裡靈光一閃的結果。那是一場“能幹的雙手”和“敢想的大腦”之間,一場持續了幾十年的、目標明確的“雙向奔赴”。1.硬實力:不只是“造出來”,更是“為了一個偉大的目標前進”讓我們先看看“硬實力”這雙手。很多人以為,當年的成功只是因為聚集了一堆頂尖的科學家。這只說對了一半。更關鍵的是,他們被組織起來去幹一件具體、宏大、且大家公認至關重要的事。比如,“曼哈頓計畫”。它的目標既簡單又殘酷:趕在納粹之前造出原子彈,終結戰爭。於是,政府、軍方、大學、企業擰在一起。物理學家、化學家、工程師、甚至冶金工人,從四面八方匯聚到荒漠中的秘密基地。《科技共和國》的作者卡普認為,這種模式不像自由散漫的“集市”,而像建造一座宏偉的“大教堂”。每個工匠都知道自己在建造“大教堂”的那一部分,並且深信這座“大教堂”是值得奉獻的。他們的協作,不是靠一份詳盡的中央指令,而是被一個至高無上的共同目標所牽引。科學家們各自埋頭苦幹,卻又通過共享的目標和緊迫感,神奇地協調一致,爆發出驚人的集體力量。再看“阿波羅計畫”。甘迺迪總統那句“我們選擇在這十年間登上月球,並非因為它簡單,而恰恰因為它艱難”,就是給整個國家“硬實力”引擎注入的最強燃料。它不再僅僅是一個科技工程,而是一個凝聚全國信念的文化符號。為了實現這個看似不可能的目標,催生出了數千項技術突破,從積體電路到耐熱材料,很多副產品至今仍在影響我們的生活。那時的“硬”,硬在組織能力、攻堅決心和使命感。2.軟信仰:給冰冷的機器,注入滾燙的靈魂光有能幹的“雙手”還不夠。如果方向錯了,或者內心充滿矛盾,力量越大反而越危險。這就是“軟信仰”這個“大腦”出場的時候了。美國在那個時代的“軟信仰”,可以概括為一種獨特的“工程思維”和“實用主義哲學”的混合體。什麼是“工程思維”?它很親民:盯著問題,別盯著論文:目標不是發表一篇完美的理論,而是解決一個實際難題。牆倒了?那就研究怎麼造一堵更堅固的。火箭飛不穩?那就一遍遍測試、修改,直到它能飛。別光聽權威的,用事實說話:在工程現場,一個年輕技術員基於測試資料提出的反對意見,可能比資深教授的理論推演更有份量。這種“建設性不服從”是創新的源泉。而“實用主義哲學”,則是這種思維在思想層面的昇華。它的核心很簡單:甭管你概念多漂亮,理論多高深,最後都得看實際效果。能解決問題、創造美好生活的,才是好東西。這種哲學讓美國社會對新技術有一種天然的開放和樂觀,因為它不問“這符合規定嗎?”,而是問“這能讓我們的生活更好嗎?”更關鍵的是,這種“軟信仰”不僅僅是口號,它實實在在地塑造了“硬實力”發展的軌跡和邊界。科學家們知道,自己辛苦研製的終極武器,是為了“以戰止戰”,保衛他們珍視的自由價值。這種道德上的自洽,是他們能全力以赴的心理基礎。儘管有冷戰對抗,但美蘇之間依然能達成一些核軍控協議,背後就有對“相互確保毀滅”這一恐怖現實的共同認知,這是一種基於後果評估的、粗糙但實用的倫理界限。登陸月球、探索深海……這些需要耗費巨資且沒有直接經濟回報的壯舉,之所以能獲得公眾支援,是因為它們契合了那個時代“開拓邊疆、挑戰未知”的美國精神敘事。所以,黃金時代的秘密,就在於“硬實力”與“軟信仰”這對引擎,轉速匹配、方向一致。那時的人們,手裡握著改變世界的力量,眼裡看著星辰大海的遠方,心裡相信自己在從事一項光榮的事業。這種身、眼、心的統一,造就了一個至今讓人懷念的科技英雄時代。然而,當冷戰結束後,技術發展的浪潮轉到了新的方向,這對黃金搭檔之間,開始出現了越來越大的裂痕。所以,我們有了今天在AI時代感到的諸多迷茫和焦慮。二、AI時代,最可怕的是閉著眼狂奔站在AI爆發臨界點的今天,我們卻更像是一場華麗而失控的“閉眼狂奔”。科技硬實力這雙“能幹的手”在演算法的加持下變得前所未有的靈巧和強大,但軟信仰這個“敢想的大腦”卻好像留在了上一個時代,甚至主動閉上了眼睛。這種失衡,非常危險。1.硬實力的“歧路”現在我們擁有的計算能力,已經超越了“曼哈頓計畫”時期全人類算力總和的億萬倍。但回頭看看,這些算力大部分去了那裡?答案可能就在你的手機裡。世界上最複雜的人工神經網路,可能正在為你計算“下一個應該刷到什麼視訊,才能讓你多停留8秒鐘”;最先進的自然語言處理模型,可能在幫行銷號生成一千條“震驚體”標題;背後支撐這一切的伺服器叢集,可能消耗了一個小城鎮的電力。矽谷掌握了堪比登月的技術力量(AI、巨量資料、全球網路),但其中大部分精英的雄心,卻收縮到了“如何更好地賣貨、送外賣”這個狹窄的賽道上。我們正在把最聰明的大腦和最強大的技術,鎖在“讓人上癮”的消費主義循環裡,這意味著它們一定會從那些真正艱難但重要的領域撤出。這可不是危言聳聽,而是正在發生的事實:模擬氣候變化、發現新材料、攻克核聚變控制……這些關乎人類長遠命運的“大問題”,需要長期、耐心且未必有直接回報的AI投入,它們在與“下季度營收增長”的PK中,常常敗下陣來。如何用AI最佳化城市交通、提升電網效率、預測公共安全風險?這些項目牽涉複雜的公共部門協作和資料開放,其“商業魅力”遠不如開發一款新的社交軟體。這種“歧路”的本質,是科技硬實力的發展,與國家及人類社會的脫鉤。它不再是建造“大教堂”的合力,而是變成了無數個自娛自樂、爭奪流量的“精緻小攤”。2.軟信仰的“真空”更深的危機還不止硬科技跑錯了方向,更因為我們的哲學與價值觀不僅沒有糾正它,反而在給它加油鼓勁,就像拆掉了一輛車上的方向盤。在今天的矽谷及全球科技圈,一種被稱為“有效加速主義”的思想,擁有大批信徒。它的口號聽起來很極客、很帶感:“加速!不顧一切地加速技術發展!”他們認為,技術尤其是AI的進步是一種如同自然規律般的必然趨勢,任何試圖規範、約束它的行為都是徒勞甚至反動的。最好的做法就是全力踩下油門,加速衝過當前的社會結構,抵達技術“奇點”後的新世界。為什麼說這很危險?它把技術本身當作了目的和新的“上帝”,但拒絕回答下面這些根本問題:我們加速,是為了奔向那裡?這個過程中,誰會被甩下車?抵達的“新世界”,是我們想要的嗎?這就好比說,“只要引擎夠猛,車開向懸崖也沒關係,說不定我們能飛起來呢!”這非常危險。在“有效加速主義”的影響下,科技行業形成了一種“技術中立”的傲慢和“為多元而多元”的虛無主義。工程師們常說“我的程式碼只是一把錘子,別人用它砸窗戶還是造房子,不關我事”。但設計演算法時嵌入的價值觀偏見(比如那些內容更優先),早就決定了“錘子”會揮向何方。而且為了避免爭議,一些科技公司往往在表面議題上追求“政治正確”,但在核心的“公司權力是否過大”、“演算法是否在操縱社會”這些實質性問題上卻避而不談。於是,我們進入了一個荒誕的境地:一邊,我們在以百米衝刺的速度,製造著智力上可能很快超越全人類的AI;另一邊,我們卻在用“加速主義”這塊布矇住眼睛,拒絕為它設計引導繩和監管紅線。這種手腦分離的失衡,讓AI的崛起不僅是一次技術變革,更可能變成一場社會風險極高的“裸奔”。三、AI時代,人類還有價值嗎?前面我們說,現在的狀況是“手腦分離”:硬實力瞎跑,軟信仰睡覺。但當AI這股力量真正站起來時,它帶來的衝擊,遠不止是“跑偏了”那麼簡單。它直接轉過身,對著我們人類“創造性”和“掌控力”這兩塊基石發起了直接挑戰。早晚有一天,AI會問我們:“你憑什麼當主人?”1.創造性危機長久以來,人類面對機器的優越感,建立在這樣一個信念上:機器負責重複,人類負責創造。但AI正在把這個信念砸得粉碎。一個苦練了十年繪畫的畫師,一個熬夜改了七八稿文案的策劃,一個花了半年譜出一段旋律的音樂人,他們都曾經相信,自己傾注心血、帶有個性和靈感的作品,是機器無法複製的“靈魂”。但現在,一個普通人,輸入幾行描述,點點滑鼠,就能在幾秒鐘內生成數十張畫作、幾十個文案、好幾段風格各異的音樂。雖然頂尖人類大師的作品目前仍有溫度和不可替代性,但對於行業中下游的廣大從業者來說,他們曾經安身立命的“手藝”,正在快速貶值。這個過程,可以分三步來看:① 從“輔助工具”到“創作夥伴”早期的PS幫我們修圖,Word幫我們寫文件,它們是聽話的工具。但今天的AI,能幫你做選題、給你做市場報告、甚至給你輸出思維模型。它從一個“執行者”,變成了一個能提供想法的“合作夥伴”。② 再到“潛在競爭者”當AI產出的設計稿、法律檔案草稿、行銷方案達到了“能用”甚至“好用”水平時,它就不再僅僅是夥伴。老闆和客戶會想:我是否還需要為一個良好的人類作品,支付遠高於良好AI作品的成本?這直接動搖了大量知識型、創意型職業的經濟基礎。③ 最終是“存在性挑戰”這引出了一個更哲學也更致命的問題:如果創作不再困難,那創造本身的價值是什麼?當人人都能“創作”時,“創作者”這個身份還意味著什麼?人類曾用“創造性”來定義自己區別於動物的高貴,現在,我們可能需要尋找一個新的、不會被機器輕易複製的“人性核心”。這種自我認知的動搖,是比失業更深的焦慮。2.秩序顛覆者上面說的創造性危機是在衝擊個人的價值和行業。但更讓人憂慮的是AI對全球秩序的挑戰,這是在動搖國家之間博弈的棋盤,而且把棋盤從明面挪到了暗處,規則全改了。過去,大國競爭的硬指標很直觀:你有多少航母,多少核彈頭,GDP多少。這些是“明牌的實力”。但AI帶來的,是一手“暗牌的破壞力”,它讓攻擊變得極其廉價、隱蔽且不可預知。① 全民皆可“搞破壞”的降維打擊以前,發動一場癱瘓城市電網的網路攻擊,可能需要一個國家級的專業駭客團隊。現在,一個技術團夥甚至個人,利用公開的AI工具輔助,就可能找到並利用系統的漏洞。AI極大地降低了進行複雜網路攻擊的技術門檻。它就像把導彈按鈕,分發給了無數看不見的手。② 讓社會“自我懷疑”的資訊瘟疫Deepfake(深度偽造)技術,在AI的幫助下已經真假難辨。它可以憑空製造一場政治人物的演講,一段能夠引發市場恐慌的CEO言論,或是一段發生在別國的“暴行”視訊。當我們沒辦法相信任何看到的東西,社會共同的“事實基礎”就會崩塌。這種攻擊不直接摧毀建築,卻能在更短時間內,摧毀一個社會賴以運行的信任紐帶,對手甚至不用派一兵一卒。③ 無法預測的“自主幽靈”想像一下,一個搭載AI的無人機群,被傳達“摧毀所有雷達站”的命令後,自行規劃路線、識別目標、發動攻擊,並在過程中自主應對突發情況。而且一旦部署,人類操作員可能無法即時干預。如果多個國家的自主系統發生意外對抗,它們可能會以人類無法理解的速度和邏輯,將世界拖入衝突。這不再是武器,而是被賦予了殺戮權力的自主幽靈。總結來說,這些威脅之所以“顛覆”,是因為它們讓傳統的防禦和威懾體系(如軍隊、邊界、核威懾)部分失效。一個普通人在自己的家裡,可能就對國家安全構成潛在威脅;一段假視訊的破壞力,可能超過一次真實的武裝衝突。AI的崛起,讓人類個體的“創造性”失效了,又讓國家間“硬實力”對抗的擂台,變成了一個規則模糊、暗器橫行的黑暗森林。我們面臨的,不再是如何使用一個好工具的問題,而是如何與一個能力上可能超越我們,而且行動邏輯不完全受控的“新物種”共處的問題。於是,我們被逼到了牆角,必須開始思考重建秩序的道路。四、軟硬結合,重建“科技共和國”面對AI,恐慌和抱怨沒有用,簡單地喊“停下”更不現實。這就像我們不可能因為汽車可能出車禍,就回到馬車時代一樣。問題的關鍵,不是丟掉引擎,而是我們必須以最快的速度,為它裝上我們丟掉的倫理與規則,還有目標與使命。重建“科技共和國”,就是要讓狂奔的硬實力,重新聽命於一個更新、更智慧的“大腦”。1.硬實力的轉向我們不能指望追逐利潤的市場,自發地把資源投向那些最重要但不賺錢的領域。這時,就需要找回一些“黃金時代”的組織智慧:由國家和社會凝聚共識,發起“使命導向”的超級項目。比如,集中頂尖AI算力與生物學家,目標是在10年內,建立能模擬所有已知病毒變異、並即時設計對應疫苗和藥物的預測系統。又比如,利用AI超強模擬能力,整合全球大氣、海洋、地質資料,目標不僅是預測氣候,更是精密模擬各類干預方案的全球連鎖效應,為全球氣候治理提供前所未有的決策依據。這些計畫的核心,是重新定義“科技硬實力”的賽場。攻克它們帶來的意義,遠勝於在“讓人上癮”的消費應用裡內卷。政府的作用,是成為最初的“出題人”和“天使投資人”,引導社會與市場的巨量資源轉向。2.軟信仰的重塑光有項目不夠,我們必須同時回答:這些強大的力量,應該在什麼樣的規則下運行?我們需要一場給AI時代訂立一份粗糙但必須有的初始社會契約。這份契約至少要回答三個問題:① AI是什麼?我們必須超越“工具論”和“物種論”的爭吵,達成一個務實的共識:AI是“具有自主性的新型行動者”。這意味著,我們必須像規範駕駛員、醫生或公司法人一樣,給它的行為建立可追溯、可問責的責任框架。比如,一個AI醫療診斷系統出錯,責任是開發者、營運商、稽核醫生,還是演算法本身?法律必須清晰。② 什麼是絕對禁止的?有些底線需要全球性的“技術禁忌”,就像禁止生化武器一樣。例如,“自動化致命武器系統”是否應被全面禁止?能否把深度偽造技術用於政治、司法領域?這些紅線需要公開辯論,並儘可能形成國際條約。它可能不完美,但劃了紅線,才有博弈的規則。③ AI發展的終點是“超人”,還是“超人化的人類”?這是最根本的哲學問題。科技加速主義的終點是模糊的“奇點”,但我們需要知道:AI發展的終極目的,應該是增強而不是取代人類。它應該讓人類醫生在AI輔助下成為“超級診斷專家”,而不是用AI淘汰醫生;讓每個孩子擁有AI導師因材施教,而不是用標準化教學AI製造教育流水線。這個目標聽起來不酷,但它確保技術發展的盡頭,依然是人。這份“契約”的制定過程本身,就是重建“軟信仰”的過程。它需要工程師、哲學家、律師、政策制定者和普通公民的共同參與,是一場全球社會的技術理性大啟蒙。3.新人類的培養最終的改變,要落在“人”身上。未來的勞動者,尤其是決策者,必須具備一種全新的素養。第一,要成為“提問者”和“批判者”,而不是“答題者”AI最擅長回答清晰定義的問題。因此,人類的優勢將在於發現和定義真問題。未來的教育,應大幅減少死記硬背和標準答案,轉而訓練學生如何從複雜現象中抽象出關鍵問題,並判斷那些問題值得交給AI去解決。同時,必須培養對AI輸出的健康質疑能力:這個結果背後的資料有沒有偏見?邏輯有沒有漏洞?第二,要成為“指揮官”和“翻譯官”。未來最稀缺的人才,是那些能站在人類需求與AI能力交界處的人。他們既懂醫療、法律、教育等領域的真實痛點,又懂AI的能力與侷限,能精準地將人類模糊的需求“翻譯”成AI可以執行的任務。他們不親手寫程式碼,但他們是AI團隊的指揮官。第三,要堅守“價值判斷”的終極權力AI能告訴你那條路最快、最省錢,但它無法告訴你“我們應該去那”。當AI給你10個最優的商業方案時,你最終選擇那一個,應該依據“它是否促進社會公平”、“是否環境友好”、“是否符合公司長期價值觀”等人類的價值準則。讓人類保持最終的價值判斷權,是我們防止被技術反噬的最後一道防火牆。重建之路總結起來,是一個“三位一體”的系統工程:用國家級“大項目”重塑硬實力的方向;用全球性“大辯論”和“新契約”重塑軟信仰的共識;再用面向未來的“新教育”重塑人類的自身能力。這條路並不容易走,充滿了利益博弈和觀念衝突,但這是唯一的路。這是為了開創一個全人類都能參與定義、並在AI賦能下共同繁榮的“新科技文明”。我們現在要做的,就是為這個充滿不確定的未來,儘可能多地埋下確定性的、向善的種子。結語:一萬年太久,只爭朝夕!站在AI時代的岔路口,我們面臨的是人類歷史上“一萬年未有之大變局”。我們必須想清楚:是讓技術成為放大分歧、製造失控的利刃,還是把它鍛造成拓展文明邊界的基石?在這場挑戰裡,主角不是只有美國,中國的作用也至關重要,且無可替代。中國不僅擁有全球最龐大的應用場景、最完整的產業鏈和強大的技術攻關能力,更擁有“以人民為中心”、“建構人類命運共同體”等深厚的治理哲學與文化理念。這為中國在AI時代探索一條發展與治理並重、效率與公平兼顧、技術向善與安全可控相結合的新路,提供了獨特可能。中國的責任與實踐,將不僅是發展自己的AI,更是與世界各國一起,為這個尚未定型的新世界,共同注入包容、負責、以人為本的價值觀。這或許正是在未來重建一個真正屬於全人類的、可持續的“科技共和國”最需要的關鍵拼圖。未來決定現在。看清未來將發生什麼,才能真正明白當下應該做什麼。我們認為,未來由四個關鍵領域塑造:哲學、AI科技、經濟與政治。為什麼是這四個?哲學是元起點,是意義與方向的錨點,為一切行動提供終極燃料;科技(尤其是AI)是文明進步的底座,是驅動世界向前的“發動機”;經濟是轉化器,它把科技力量轉化為真實的財富與市場機會;政治是適配性結構,它給哲學、科技與經濟提供運行框架與秩序。哲學為根,科技為器,經濟為用,政治為治。這四者環環相扣,層層支撐,相互交織,在動態的演進中共同推動現實走向未來。正是在這樣的時代背景下,筆記俠創立了中國首個面向企業家的PPE(政治、經濟、哲學)書院。我們致力於幫助大家回到決策的源頭,重構底層認知邏輯,掌握未來五年的核心判斷與決策能力。如今,眾多深耕於AI、全球化等前沿領域的優秀創業者,都已加入筆記俠PPE書院。未來已來,讓我們一起成為清醒而篤定的決策者。 (筆記俠)
梁文鋒署名!DeepSeek再發炸裂論文:提出“條件記憶”新範式,徹底打破GPU推理視訊記憶體牆
當業界紛紛湧入MoE(Mixture-of-Experts)架構以實現高效擴容時,一個根本性的低效問題卻始終存在:強大的Transformer模型,本質上缺乏一種原生的“知識尋找”機制。它們被迫通過複雜的“動態計算”來模擬簡單的“靜態檢索”過程。例如,為了識別“戴安娜王妃”這樣的實體,模型需要消耗多層注意力與前饋網路資源,逐步建構其內部表徵。這無異於用高射炮打蚊子,浪費了寶貴的計算深度來自DeepSeek 的最新論文,為解決這一難題提出了一個全新的稀疏性維度:條件記憶(Conditional Memory)他們推出名為Engram的新模組,它以O(1)的恆定時間複雜度實現了可擴展的知識尋找,作為對MoE“條件計算”的有力補充。通過系統性研究,團隊揭示了一條指導兩種稀疏性權衡的U形縮放定律。依據該定律,他們建構了一個270億參數的Engram模型,在總參數量與計算量(FLOPs)完全相同的情況下,其性能全面超越了純MoE基線。令人矚目的是,這種提升不僅體現在知識密集型任務上(MMLU +3.4),更在通用推理(BBH +5.0)、程式碼(HumanEval +3.0)和數學(MATH +2.4)等領域取得了更大的收益。機理分析表明,Engram通過接管早期層的靜態模式重構任務,有效“加深”了網路,為複雜推理釋放了更多計算資源。同時,它將局部依賴關係的處理委託給尋找操作,從而解放了注意力機制,使其能更專注於全域上下文,極大地提升了模型的長文字處理能力(如Multi-Query NIAH任務得分從84.2提升至97.0)。更重要的是,Engram的設計充分考慮了系統效率。其確定性的尋找機制支援在執行階段從低速的主機記憶體預取資料,幾乎不產生額外開銷,從而打破了GPU視訊記憶體的瓶頸。論文地址:https://github.com/deepseek-ai/Engram語言模型的雙重任務:計算與檢索語言建模包含兩種性質截然不同的子任務:一是需要深度動態計算的組合推理,二是對本地、靜態、高度模式化的文字片段(如命名實體、慣用語)的知識檢索。經典的N-gram模型證明了,後一種任務通過廉價的尋找操作就能高效完成。然而,當前的LLM架構缺少這種原生尋找功能,導致它們必須通過計算來模擬檢索,造成了資源浪費。為了讓模型架構與語言訊號的這種二元性對齊,DeepSeek提出了“條件記憶”這一新的稀疏軸,與MoE的“條件計算”形成互補。• 條件計算 (MoE):稀疏啟動參數,處理動態邏輯。• 條件記憶 (Engram):稀疏尋找操作,檢索靜態知識。研究團隊提出的Engram模組,正是這一理念的具體實現。它以經典的N-gram結構為基礎,並融入了分詞器壓縮、多頭雜湊、上下文門控和多分支整合等現代化改造。Engram架構:兩階段實現高效尋找與融合Engram作為一個條件記憶模組,旨在將靜態模式儲存與動態計算在結構上分離。其工作流程分為兩個核心階段:檢索與融合1. 稀疏檢索:通過雜湊N-grams定位記憶首先,模組需要將局部上下文對應到靜態記憶條目。這包括兩個步驟:分詞器壓縮 (Tokenizer Compression):標準的分詞器常為語義等價的詞分配不同ID(如Apple vs. apple)。為提升語義密度,Engram首先通過一個預計算的對應函數,將原始Token ID壓縮為規範化的ID。多頭雜湊 (Multi-Head Hashing):直接參數化所有N-gram組合是不現實的。Engram採用基於雜湊的方法,為每個N-gram階數(如2-gram, 3-gram)配備K個獨立的雜湊頭,將上下文雜湊到不同嵌入表中的索引,以降低衝突。最終,所有檢索到的嵌入向量被拼接成一個記憶向量et。2. 上下文感知門控與融合檢索到的記憶向量et是靜態的、上下文無關的先驗知識,可能存在雜湊衝突或歧義。為瞭解決這個問題,Engram引入了受注意力機制啟發的上下文感知門控它將當前層的隱藏狀態ht(已聚合了全域資訊)作為Query,將記憶向量et投影為Key和Value。通過計算Query與Key的相似度,生成一個門控標量αt。這個標量決定了檢索到的資訊與當前上下文的匹配程度:如果匹配度低,門控值趨近於0,有效抑制噪聲。最後,通過門控的Value向量會經過一個輕量級的深度因果摺積,以擴大感受野並增強非線性。最終的輸出通過殘差連接融入到Transformer主幹網路中核心發現:稀疏性分配的U形定律為了量化MoE(計算)與Engram(記憶)之間的協同作用,研究人員提出了稀疏性分配問題:在固定的總參數和計算預算下,應如何在這兩者之間分配“稀疏容量”?他們定義了一個分配比例ρ,其中ρ=1代表純MoE模型,ρ<1則代表將一部分原用於MoE專家的參數轉而分配給Engram的嵌入表。實驗在兩個不同的計算規模(2e20和6e20 FLOPs)下進行,結果揭示了一條清晰的U形縮放定律:MoE主導 (ρ → 100%):模型缺乏專門的記憶模組,被迫低效地通過計算重構靜態模式Engram主導 (ρ → 0%):模型喪失了條件計算能力,無法處理需要動態、上下文相關推理的任務最佳平衡點:將大約20%-25%的稀疏參數預算分配給Engram時,模型性能達到最優。這一穩定的U形關係證明了條件計算和條件記憶在結構上的互補性。此外,在“無限記憶體”設定下,單獨增加Engram的記憶槽數量,模型性能也呈現出可預測的對數線性提升,證明了Engram是一個有效的、可獨立擴展的性能提升手段。大規模預訓練:性能全面超越,推理提升更顯著基於上述定律,研究團隊訓練了一系列模型,並與嚴格對等的基線進行比較。所有模型均在262B Tokens上訓練,並保持啟動參數量(3.8B)一致。Engram-27B:總參數26.7B,與MoE-27B基線相同。它將MoE專家的數量從72個減少到55個,並將節約的參數(5.7B)用於建構Engram記憶模組。Engram-40B:在Engram-27B基礎上,進一步將Engram記憶擴展至18.5B參數,總參數達到39.5B。實驗結果(Table 1)表明:1.稀疏模型優於密集模型:所有稀疏變體(MoE與Engram)均顯著優於同等計算量的Dense-4B模型2.Engram全面超越MoE:在參數和計算量完全匹配的情況下,Engram-27B在所有評估維度上都優於MoE-27B3.推理與程式碼數學領域增益尤為突出:雖然Engram在知識任務(如MMLU +3.4, CMMLU +4.0)上表現出色,但其在通用推理(BBH +5.0, ARC-Challenge +3.7)和程式碼數學(HumanEval +3.0, MATH +2.4)上的優勢更為顯著這證明了引入專用的知識尋找原語,能夠極大地提升模型的表徵效率,其益處遠不止於知識檢索本身。Engram如何工作?機理分析揭示“有效深度”增加為了探究Engram的內部工作機制,研究團隊使用了LogitLens和CKA(中心核對齊)兩種可解釋性工具。加速預測收斂:LogitLens分析顯示,與MoE基線相比,Engram模型的淺層網路就能生成更接近最終預測結果的表徵(KL散度更低)。這表明,通過直接尋找知識,Engram減少了模型逐步建構特徵所需的計算步驟提升有效深度:CKA分析則揭示了Engram模型與MoE模型之間的層間表徵相似性。結果顯示,Engram模型的淺層(如第5層)在功能上等價於MoE模型的深層(如第12層)結論很明確:Engram通過顯式尋找繞過了早期的特徵組合階段,在功能上等價於增加了模型的有效深度系統效率:解耦計算與儲存,打破GPU視訊記憶體牆Engram的一個關鍵優勢在於其系統設計。與依賴執行階段隱藏狀態進行動態路由的MoE不同,Engram的尋找索引完全由輸入Token序列決定,具有嚴格的確定性這一特性使得在推理時可以實現高效的 預取-重疊(prefetch-and-overlap) 策略:系統可以在GPU計算前序Transformer塊的同時,非同步地從大容量、低成本的主機記憶體(DRAM)甚至NVMe SSD中預取後續Engram層所需的嵌入。實驗在一個1000億參數的Engram層上進行了驗證。結果顯示,將整個嵌入表解除安裝到主機記憶體,所帶來的吞吐量懲罰峰值僅為2.8%,幾乎可以忽略不計。這證明了Engram能夠有效繞過GPU視訊記憶體限制,以極小的開銷實現參數規模的激進擴展。這意味著可以用較少/較低配的GPU(視訊記憶體有限)來運行一個總參數量極大的模型。這大大降低了模型的部署和使用成本寫在最後DeepSeek AI的Engram工作,為大模型稀疏化設計開闢了一個全新的、與MoE互補的軸線——條件記憶。通過將靜態知識檢索從動態計算中剝離,Engram不僅在知識任務上取得優勢,更在推理、程式碼、數學等複雜任務上實現了超預期的性能提升。這項研究的核心貢獻包括:1. 提出Engram模組:一個可擴展、系統高效的條件記憶實現。2. 發現稀疏分配的U形定律:為平衡計算與記憶提供了理論指導。3. 驗證了架構優勢:在同等參數和計算成本下,混合模型全面超越純MoE模型。4. 揭示了工作機理:Engram通過提升模型的“有效深度”來最佳化表徵效率。研究人員認為,條件記憶應成為下一代稀疏大模型不可或缺的建模原語,為建構更強大、更高效的智能系統鋪平了道路。我彷彿已經看到了v4的影子 (AI寒武紀)
DeepSeek 元旦扔出王炸!CEO 梁文鋒親自署名,要動 AI 用了 10 年的“承重牆”?
DeepSeek 又扔了個王炸。本來準備躺平過節(嗯,是真的躺著了),結果睜眼發現一篇新論文 mHC(流形約束超連接)突然刷屏。我看了一眼作者列表,直接“垂死病中驚坐起”——最後一位赫然寫著:Wenfeng Liang(梁文鋒)。圖:DeepSeek CEO 梁文鋒署名熟悉 DeepSeek 的都知道,這位 CEO 極少在技術論文上親自署名。老闆親自掛帥,還選在新年第一天發,說明這事兒絕對不簡單。讀完我才發現,他們這次竟然要革深度學習祖師爺 ResNet 的命。聽起來很狂?但我研究了一下原理,發現這幫人是真有東西。01|從何愷明的“神來之筆”說起要看懂 DeepSeek 的操作,我們得先回看一眼歷史。2016年,大神何愷明(Kaiming He) 團隊提出了 ResNet,徹底解決了深層網路訓練不動的難題。其中的核心設計叫“恆等對應”。圖:何愷明,深度殘差網路(ResNet)的主要發明者打個比方,這就像在迷宮裡修了一條“直通車道”。訊號可以無腦地從這一層傳到下一層,不被中間商賺差價。正是因為有了這條路,今天的 ChatGPT、DeepSeek 這些結構極深的龐然大物才跑得起來。但問題是,對於現在胃口越來越大的模型來說,這一條“單車道”漸漸不夠用了。於是,學術界搞出了一個叫 HC(Hyper-Connections,超連接) 的東西。(主要來自字節跳動 2024 年發表的論文)HC 的想法很美好:既然單車道不夠,那我就擴建成多車道唄!它把殘差流變寬(n倍),讓資訊在不同車道間亂竄、混合,以此來提升模型的能力。圖:三代架構進化史:(a) 是經典的“單車道” ResNet; (b) 是路修寬了但沒紅綠燈的 HC(容易撞車); (c) 是 DeepSeek 加了“交通管制”的 mHC。但問題來了,這一擴建,出事了。原來的 ResNet 是“直通車”,很穩。現在的 HC 變成了“無紅綠燈的超級路口”。論文裡的資料特別嚇人:在 HC 的架構下,訊號在網路裡傳著傳著,就會因為缺乏管束而瘋狂膨脹。看原論文裡的資料,HC 的訊號增益幅度峰值直接幹到了 3000!(下圖右側)圖:HC 的訊號增益幅度峰值直接幹到了 3000這意味著啥?意味著訊號被放大了 3000 倍。這就像早高峰的十字路口沒有紅綠燈,車全撞在一塊了,這就是典型的“訊號爆炸”。結果就是:模型訓練極其不穩定,錯誤率(Loss) 說炸就炸,根本沒法在大規模模型上用。02|DeepSeek 的解法:數學暴力美學面對這種“車禍現場”,一般人的思路可能是:“那我就少修兩條路吧。”但 DeepSeek 的思路是:路我要修,但我要請一個懂數學的交警。這就是 mHC(流形約束超連接)的核心邏輯。他們發現,只要把那些負責指揮交通的矩陣,強行按在一個叫“雙隨機矩陣”的數學規則裡,問題就解決了。別被這個數學名詞嚇跑,它的原理其實也挺簡單,就像“能量守恆定律”:不管你在路口怎麼變道、怎麼混合,進來的流量總和,必須嚴格等於出去的流量總和。既不允許車子憑空消失(訊號衰減),也不允許憑空變出車來(訊號爆炸)。為了做到這一點,DeepSeek 用了一個叫 Sinkhorn-Knopp 的演算法,像是給矩陣戴上了“緊箍咒”。不管這矩陣原來長啥樣,經過這個演算法一處理,它就必須變得老老實實,行和列的加和都得等於1。這就很漂亮了。它保留了多車道互聯帶來的資訊豐富度(性能提升),又把訊號嚴格限制在了一個安全的範圍內(穩定性),完美致敬了何愷明當年追求的“恆等對應”精神。03. 效果怎麼樣?直接看療效理論吹得再好,還得看實驗。還記得剛才說 HC 的訊號增益飆到了 3000 嗎?用了 mHC 之後,這個數字被死死按在了 1.6 左右。從 3000 到 1.6,這是直接降低了三個數量級!這也直接體現在了訓練曲線上:穩如老狗: mHC 的訓練 Loss 曲線(藍線)極其平滑,跟基線模型幾乎一樣穩。圖:mHC 的訓練 Loss 曲線極其平滑性能更強: 在 27B 參數的模型上,mHC 不僅穩,效果還比標準版更好。特別是在比較難的 BBH(邏輯推理)和 DROP 任務上,提升非常明顯。圖:在 27B 參數的模型上,mHC 不僅穩,效果還比標準版更好。04. 不止是數學,更是工程上的“摳門”讀 DeepSeek 的論文,你永遠能感覺到他們那種“把算力榨乾到最後一滴”的執著。因為把路修寬,本來是一件非常費視訊記憶體、費時間的事。如果不做最佳化,記憶體訪問成本(I/O)會增加好幾倍,這誰受得了?所以 mHC 不僅僅是一個數學創新,還是一套工程最佳化方案。算子融合(Kernel Fusion): 他們手寫了底層的 Kernel,把好幾步計算合併成一步,減少 GPU 讀寫記憶體的次數。重計算(Recomputing): 為了省視訊記憶體,他們選擇在反向傳播時重新計算中間結果,而不是一直存著。通訊重疊: 利用 DualPipe 策略,把額外的通訊時間“藏”在計算時間裡。結果就是:在擴展率為 4 的情況下,mHC 帶來的額外訓練時間開銷,僅僅只有 6.7%。用極小的代價,換來了模型性能和穩定性的雙重提升。這種“又好又省”的風格,確實很 DeepSeek。寫在最後說實話,每次讀 DeepSeek 的論文都讓人挺佩服的,不是那些牛逼的技術,而是他們“死磕底層”的態度。特別是在現在,大家都忙著卷應用、卷 Agents 的時候,他們願意回過頭去修補 AI 的“地基”。ResNet 已經統治了深度學習這麼多年,大家都覺得它是完美的。但 mHC 告訴我們:只要你不迷信權威,那怕是地基,也有重修的可能。mHC 這種架構,或許不會馬上改變你的生活,但它可能會讓下一代的 DeepSeek、GPT 跑得更穩、更快。 (AI范兒)
因DRAM上漲,日本秋葉原開啟對16GB及以上視訊記憶體顯示卡限購措施
挺合理的日媒 ITmedia報導,隨著 2025 年最後一個周末到來,東京秋葉原的各家店舖紛紛進入大促模式,不過記憶體和儲存相關產品的供應緊張局面依舊沒有緩解。其中,Dospara 秋葉原本店的店主表示:“記憶體價格依然在持續上漲。不過我們還是儘量留了一些庫存,因此從目前來看,應該不會出現‘特意跑來卻無法把整台電腦配齊’的情況”。另一方面,一些店舖的顯示卡貨架已經開始出現空位,與記憶體和固態硬碟相比,雖然顯示卡的價格上漲趨勢不算明顯,但有商家冷靜地指出:“這更多是庫存周轉速度的差異,漲價恐怕只是時間問題”。這種背景下,TSUKUMO eX.等部分店家開始對輝達 RTX 5060 Ti 16GB、AMD Radeon RX 9000 系列顯示卡採取限購措施,每名顧客限購 1 張。該店舖還表示:“大容量視訊記憶體的顯示卡現在非常難進貨。雖然我們目前還有庫存,但下一批貨什麼時候到、甚至還會不會到,都很難說”。而且,類似的不安情緒開始在多家店舖中蔓延,某家電腦店舖的店主坦言:“這波短缺潮不僅波及高端顯示卡,像 RTX 5060 Ti 和 RX 9060 XT 這種同時有 8GB 和 16GB 視訊記憶體的中端產品也受影響,16GB 版本以後恐怕很難再補貨了”。由於 DRAM 產能持續吃緊,華碩、惠普、戴爾等頭部廠商在記憶體配額上頻頻受阻。為緩解壓力,廠商開始繞過中間管道,直接與三星、SK 海力士、美光等談判,希望通過長期供貨協議鎖定 DRAM 資源。 (AMP實驗室)
【十五五】重塑“視”界:AI視訊產業的戰略崛起與“十五五”發展藍圖
前   言如果說過去十年是移動網際網路重塑資訊傳播方式的十年,那麼站在“十五五”規劃開局之年的我們,正清晰地見證一場由人工智慧驅動的、更為深刻的視聽產業革命。AI視訊生成已從一個前沿概念,急速演進為驅動文化新質生產力、重構數字經濟版圖的核心引擎。從OpenAI的Sora引發全球驚嘆,到國內快手可靈、美圖等產品的快速商業化落地,再到《北京市促進“人工智慧+視聽”產業高品質發展行動方案(2025-2029年)》的率先出台,一個技術、政策與市場共振的產業發展“奇點”已然來臨。本文將深入剖析AI視訊產業的技術核心、市場動態、競爭格局與政策環境,勾勒其如何與國家“十五五”戰略同頻共振,賦能千行百業。一、頂層戰略與政策領航:為產業注入“確定性”任何顛覆性技術的規模化發展,都離不開清晰的國家戰略與穩健的政策框架護航。AI視訊產業正深度融入國家現代化宏偉藍圖,其發展軌跡獲得了強有力的頂層設計支援。國家層面的戰略定位極為明確。2025年9月發佈的《國務院關於深入實施“人工智慧+”行動的意見》(國發〔2025〕11號)是統領全域的綱領性檔案,不再將人工智慧視為孤立技術,而是定位為與經濟社會各領域深度融合、催生新質生產力的核心驅動力。檔案設定了清晰目標:到2027年,人工智慧將在六大重點領域深度應用,新一代智能終端、智能體等應用普及率超過70%;到2030年,人工智慧將全面賦能高品質發展,智能經濟成為重要增長極。這為AI視訊在各行各業的應用普及提供了明確的時間表和廣闊的想像空間。在“人工智慧+”的宏大敘事中,視聽產業因其巨大的文化影響力、經濟價值和民生關聯度,成為率先落地的關鍵領域。地方政府反應迅速,以北京市2025年11月發佈的“人工智慧+視聽PILOT領航計畫”為代表,堪稱一份前瞻性、系統性的產業發展路線圖。該計畫核心是“五位一體”的系統性推進:Platform(技術平台)攻堅垂類大模型;Innovation(內容創新)推動AI在影視、動畫等內容全鏈條應用;Landscape(場景賦能)覆蓋智慧影棚、文商旅體融合等領域;Optimization(服務最佳化)搭建智能體開發等平台;Trust(安全信任)探索“監管沙盒”,建構安全體系。這一方案標誌著發展思路已從單點技術突破,升級為建構技術、資料、平台、應用、安全協同進化的完整產業生態。圖表:國家及地方AI視訊產業核心政策時間軸資料來源:中投產業研究院整理圖表:北京市“人工智慧+視聽PILOT領航計畫”五維協同體系資料來源:政府機構官網、中投產業研究院二、技術突破與範式革命:從“工具”到“世界模型”的躍遷產業爆發的根源在於技術的代際飛躍。AI視訊生成技術在過去兩年完成了從“可用”到“好用”的關鍵跨越,其演進路徑清晰地指向對物理世界理解和模擬的更高維度。技術架構的演進是這場革命的基石。行業早期依賴生成對抗網路(GAN),隨後擴散模型(Diffusion Model)與Transformer架構的結合成為主流。當前,以OpenAI的Sora為代表的擴散型Transformer(DiT)架構成為前沿,它將Transformer的強大序列建模能力應用於擴散過程的潛在空間,從而能夠處理更複雜的時空關係。例如,Sora模型已能生成長達分鐘級、物理邏輯更一致的高品質視訊,這不僅是時長的延長,更是對場景動態合理性理解的質變。可以說,AI正在從“剪輯師”向“導演”進化。技術進步直接體現在產品性能的躍升和成本的陡降上。目前,頂級模型已能支援生成長達數分鐘的4K解析度視訊。更關鍵的是,成本優勢已成為顛覆傳統行業的“殺手鐧”。根據行業權威分析,目前國內外主流AI視訊生成API的單秒成本已降至0.2至1元人民幣區間。相比之下,傳統視訊製作成本呈幾何級數差異:本土電視廣告(TVC)視訊製作成本約在千元級/秒,而頂級動畫電影的製作成本甚至高達十萬元級/秒。這種千百倍的成本差異,為視訊內容的大規模、個性化生產掃清了經濟障礙。圖表:AI視訊生成技術演進路線圖資料來源:中投產業研究院圖表:AI視訊生成與傳統視訊製作成本對比柱狀圖資料來源:中投產業研究院三、市場爆發與競爭重塑:全球格局下的中國力量在技術與政策的雙輪驅動下,全球AI視訊市場正以驚人速度擴張,中國不僅成為最重要增長極之一,更在技術和商業化層面湧現出具有全球競爭力的參與者。全球市場規模與增長前景廣闊。根據Fortune Business Insights的預測,全球AI視訊生成器市場規模預計將從2025年的7.168億美元增長至2032年的25.629億美元,年複合增長率高達20%。亞太地區是增長最快市場,年複合增長率預計達23.8%,中國是主要驅動力。市場增長的底層動力是視訊在全球數字內容消費中佔據主導地位(據Cisco VNI預測,視訊已佔全球移動網際網路流量的70%以上)以及AI帶來的生產效率革命。競爭格局呈現多元化態勢,中國力量表現亮眼。海外廠商如Runway、OpenAI (Sora)在技術和創意社區影響力方面領先。據報導,Runway在2024年12月的年度經常性收入已達8400萬美元,顯示出強勁的商業化勢頭。與此同時,中國廠商如快手可靈(Kling)、美圖、字節跳動的剪映即夢等產品已躋身全球第一梯隊。在商業化上,中國廠商展現出更快速度和更靈活策略。例如,快手可靈(Kling)在2025年初實現了顯著的商業突破,年化收入運行率迅速攀升,凸顯出國內市場的巨大潛力和強大的商業化能力。此外,國內產品通常具有更優的性價比,降低了使用門檻,加速了技術在中小企業和個人創作者中的普及。圖表:全球AI視訊生成器市場規模預測折線圖(2025-2032)資料來源:Fortune Business Insights、中投產業研究院圖表:全球主要AI視訊模型性能與商業化對比氣泡圖資料來源:麥肯錫、BCG、中投產業研究院四、應用賦能與產業融合:催生“智能原生”新業態AI視訊技術的真正價值在於其作為“基礎能力”與千行百業融合後催生的“化學反應”,正在重塑從內容創作到產業營運的完整價值鏈。首先是內容產業自身的工業化升級。 AI已能深度參與劇本構思、分鏡生成、視訊生成與剪輯的全流程。這催生了如“AI漫劇”等新形態——以漫畫或小說IP為基礎,通過AI快速生成統一風格的動態短影片,極大縮短了IP視覺化周期。對於影視動漫行業,這意味著能夠以更低成本、更高效率進行“大規模個性化內容生產”。其次是賦能實體經濟,創造沉浸式體驗與增長新動能。在電商與零售領域,AI生成的個性化商品展示視訊能顯著提升轉化率。據Adobe Digital Insights報告,採用高品質視訊素材的電商頁面點選率可比圖文高出30%以上。在文旅與教育領域,通過AIGC技術對文物古蹟進行活化宣傳,可以打造沉浸式歷史文化體驗。在工業與科研領域,AI生成的高擬真視訊可用於自動駕駛演算法訓練和科學可視化,加速創新處理程序。最終,所有應用將匯聚於“智能終端”的革新。未來的AI電視、AI手機、AI眼鏡乃至智能汽車,將不再是簡單的播放裝置,而是具備本地化即時生成、理解和互動視訊內容能力的“智能體”。圖表:AI視訊在重點行業應用效果對比圖資料來源:中投產業研究院圖表:AI視訊賦能產業生態全景圖資料來源:中投產業研究院五、未來挑戰與核心關切:在創新與治理中尋求平衡前景雖廣闊,但邁向成熟的產業必須清醒應對挑戰。這些是“十五五”期間政策與產業界需共同攻克的核心議題。技術瓶頸與工程化鴻溝依然存在。當前AI生成視訊在複雜敘事邏輯、長程時序一致性上仍存不足,從生成單段視訊到支撐完整工業化工作流,仍需大量工程化創新。資料、算力與成本約束是產業可持續發展的關鍵。高品質、合規的視聽資料集建設挑戰巨大,同時大模型對智能算力的需求持續攀升。版權、倫理與安全風險是監管與產業發展的核心交匯點。 AI生成內容的智慧財產權歸屬、深度偽造技術濫用等風險亟待規範。北京方案中提出的“監管沙盒”機制正是前瞻性佈局。此外,既懂AI演算法又精通視聽藝術的複合型“智匠”人才短缺,也制約著產業發展。總而言之,AI視訊產業已告別野蠻生長期,步入與國家級戰略深度融合、在規範中加速創新的新階段。中國的獨特優勢在於統一的頂層戰略、豐富的應用場景、快速迭代的工程化能力以及積極審慎的治理框架。抓住這一機遇,不僅能培育兆級智能經濟新增長極,更將在建構數字時代文化軟實力和國際競爭新優勢中,佔據戰略制高點。這場由AI掀起的視覺革命,畫卷剛剛展開,其波瀾壯闊的未來,正待我們共同書寫。 (中投未來產業研究中心)
迪士尼10億美金聯姻OpenAI,一個IP+AI的資本遊戲
迪士尼剛宣佈給OpenAI砸下10億美金搞‘世紀聯姻’,反手就逼著Google把AI生成的米老鼠、死侍全部下架!一邊當最大的金主,一邊舉最狠的屠刀。本期視訊給大家從資本、版權、行業生態幾個角度詳細拆解這位全球娛樂巨頭到底在下什麼大棋?近日,迪士尼宣佈把自家200多個角色IP開放給Sora做視訊生成,同時宣佈對OpenAI投資10億美元,雙方正式達成深度戰略合作夥伴關係及內容授權協議。幾乎在同一時間,迪士尼法務部向Google發出了版權警告,要求其旗下YouTube及相關平台立即下架利用AI生成的,包含米老鼠、死侍、鋼鐵人等經典IP形象的視訊內容。Google迅速響應,數小時內下架了相關違規內容並封禁了部分帳號。迪士尼對OpenAI和Google的一系列動作,這兩天在AI圈可是太過戲劇性了。回顧過去兩年,迪士尼對AI的態度經歷了過山車般的轉變。曾經我們的視訊也提過迪士尼、環球、華納三巨頭起訴MiniMax,對Midjourney、Mata、Character.AI同樣是重拳出擊,毫不留情。如今迪士尼對OpenAI的投資,看起來就像是迪士尼終於成熟長大了,打不過就加入,買下它並制定規則。傳統內容巨頭不再將AI視為“掠奪者”,而是將其定義為一種需要被資本馴化的生產力工具。為什麼迪士尼和OpenAI的合作是10億美元股權投資,而不是簡單的付費授權呢?其實背後隱藏著雙方對未來的深度算計。這場交易其實是各取所需的雙贏。通過持有OpenAI的股權,迪士尼獲得了一張進入AI核心圈的門票。作為OpenAI的股東之一,迪士尼自然獲得了技術優先權,將廣泛使用ChatGPT和其他AI工具在內容和產品開發等場景中。這項合作讓迪士尼能夠進入社交平台快速增長的使用者生成短影片領域。迪士尼CEO艾格在交易公佈後對媒體稱,與OpenAI達成的授權合作旨在“為迪士尼打開新的數字娛樂空間並吸引更多年輕使用者”。市場對這一交易的回應是積極的,迪士尼股價迎來了一波持續上漲。對於OpenAI而言,10億美元讓它獲得了迪士尼的估值背書,並且成為了版權“正規軍”。不僅獲得了迪士尼高品質、無版權爭議的資料,而且迪士尼龐大的產業鏈為OpenAI的技術提供了最頂級的落地場景。這次合作給AI版權之爭這個老生常談的話題,帶來了新的解法。此前,AI公司用網際網路資料訓練模型屬於資料合規的模糊地帶。迪士尼通過這筆交易打開了一個新的樣式:高品質的訓練資料是資產,必須付費。迪士尼要求Google下架AI生成內容,也釋放了一個明確的訊號:只有經過授權的AI生成內容才是合規的。一位是全球IP巨頭,一位是AI頭號玩家,10億美元合作,為全球確立了“IP+AI”的新型模式,對國內AI公司和內容公司來說,是壓力還是機會呢?未來,AI公司獲取高品質IP資料的成本被抬升,優質IP內容公司也必須主動尋求商業化的授權合作,同時將使用者二創納入商業版圖。AI時代的內容擴展,將在版權規則下進行。好萊塢AI時代的正式到來,同時新問題也來了,未來IP+AI的收入分成如何劃分?AI生成不當內容的責任如何判定?粉絲作品的版權歸誰? (競爭秩序場)