#AI模型
圖靈獎得主、強化學習之父:AI模型本身其實很脆弱!現在的AI,只是局部智能!真正的下一階段是經驗時代!人類終將被AI繼任!AI要去中心化
今天的AI,讓人又喜又怕。一方面,短短三年,AI已經從ChatBot進化到了可以操控電腦終端的私人Agent,另一方面,又給矽谷帶了“AI恐慌”,許多 SaaS 廠商的市值慘跌。再一次,AI 的強大攪動得業內躁動起來。而就在狂喜與不安的背後,終於有大佬難得出來給出自己冷靜的分析與判斷。近日,在SAIR 正式成立後的首場全球直播中,圖靈獎得主、強化學習之父 Richard Sutton 發表了自己最新關於 AI 的獨特的反直覺看法。Sutton 上來就給出了一句異常冷靜的判斷:現在的AI,只是局部的智能,並沒有在智能層面取得快速的進步。他表示,AI給業內帶來許多重要的進展,但這些進展大多源自超大規模計算與超大規模模式識別的應用。但它們本質上是非常具體、局部的能力,並不能等同於“全部的智能”。反直覺的地方在於,現在人們似乎把智能等同於AI了,而 Sutton 對於“智能”的定義戳破了這層幻覺:當我使用“智能”這個詞時,我指的是:通過適應行為來實現目標的能力。你並不是簡單地“智能”或“不智能”,而是在某種程度上具備實現目標的能力。其次,值得注意的是,Sutton 還給出了一個重要觀點:圖像和視訊生成技術是重大的工程突破,但並不構成我們通常意義上所說的“智能”的核心組成部分。心智(Mind)在進行智能行為時,真的需要生成圖像嗎?答案是否定的。我們確實需要處理圖像和視訊,但並不需要生成它們。然後,Sutton 對當下“AGI臨近論”還潑了第二盆冷水。理由是,雖然現在的AI很強,但本質是“弱心智”。他給了一個很犀利的說法:模型之所以顯得強大,是因為它們吸收了幾乎全部人類知識;除了這一點,生成式 AI 其實很脆弱。它們不可靠、容易跑偏、沒有穩定目標結構。問題在於,現在的AI太多關注機器,而忽略了經驗的學習。大模型在部署後是凍結的,沒有持續經驗,沒有真實獎勵訊號。沒有獎勵,就沒有目標;沒有預測與現實的對照,就沒有“真理”。換句話說,當前模型像一個讀遍百科全書卻沒有生活經驗的人。因此,Sutton 表示,現代機器學習已經觸及了時代的極限。當前AI本質是:把人類已有知識遷移進機器,訓練完成後停止學習。而如今,人類高品質資料已經幾乎用完了。不過好處在於,AI 的風向已經出現了新的變化。Sutton 表示,真正的下一階段是“經驗時代”。他認為,只有從經驗中學習,智能才能不斷增長。他把過去 10 年的AI發展分成三個階段:模擬時代(如AlphaGo)、人類資料時代(LLM)、經驗時代(智能體在真實世界持續學習)。Sutton 認為,“智能研究”需要一個全新的“心智綜合科學”(它既不完全屬於自然科學,也不只是工程或技術應用。),而強化學習會是研究“心智綜合科學”的起點。其次,這點陣圖靈獎得主,對於“集中控制AI”的做法表示反對。他表示,一些人不過是拿著“安全”當幌子試圖“控制AI”,這種做法本質上有點類似“權力失控”的焦慮。“AI 本應該是去中心化協作式的。”Sutton 呼籲AI合作,反對地緣的封鎖和限制:合作並非總是可能,但從經濟交換到社會制度,從政府到市場,世界上幾乎所有美好的事物都源自合作。最後,你絕對想不到,Sutton也會發表“科幻視角”的判斷。Sutton 表示,人類可能最終會走向被 AI 繼任:人類終將理解並創造智能,而且這種智能會迅速超越人類。Sutton認為,從宇宙尺度上看,這是一種必然演化。同時,他還給出了四個宇宙偉大時代!粒子時代、恆星時代、複製時代、設計時代!小編聽下來大呼燒腦。篇幅關係這裡不再一一展開了。總之,Sutton的演講有兩條主脈絡:其一、智能的本質不在於模仿得“像人”,而是適應目標。我們已經邁進“經驗時代”!其二、AI是宇宙演變的必然,而人類至少是這個時代的催化劑、接生婆。我們終將促成宇宙的第四個偉大時代。以下是小編梳理的精彩觀點,enjoy!現在的AI,在智能層面並沒有快速進步很高興能和大家一起交流。我聽了上午的一些報告,過程中突然意識到:我想談一些原本並沒有準備好的內容。因此,今天我特意留出了一點時間,整理了幾頁PPT。在進入我原本準備好的發言之前,我想先說幾句鋪墊性的內容。讓我們先從這個領域的現狀談起:今天的AI到底是什麼樣的?人們又是如何看待它的?我想,幾乎所有人都認為AI正在以極其迅猛的速度進步,這種看法當然令人興奮。但當所有人都在想同一件事時,我們就有必要停下來問一問:事情真的如此嗎?這真的是正在發生的嗎?我們是否可以對這個判斷提出一些質疑?AI真的在快速進步嗎?當然,在讓電腦能夠熟練使用語言這件事上,我們確實取得了巨大的進展。我認為這是一個非常重要、真正意義上的突破。事實上,不久之前我們就已經設想過可以用神經網路來完成這件事,而今天,它已經被充分證明是可行的。同時,我們也借助海量的計算資源,生成了極其逼真的圖像和視訊。但問題在於:心智(Mind)在進行智能行為時,真的需要生成圖像嗎?答案是否定的。我們確實需要處理圖像和視訊,但並不需要生成它們。這並不是心智本身在做的事情。這類任務需要巨大的計算量,也確實非常困難,但它們並不構成我們通常意義上所說的“智能”的核心組成部分。當然,我們也看到了新的、真實的應用出現,它們催生了全新的產業形態,創造了巨大的經濟價值。這些重要的進展,大多源自超大規模計算與超大規模模式識別的應用。但它們本質上是非常具體、局部的能力,並不能等同於“全部的智能”。其中相當大的一部分其實只是計算,而我們之所以稱它們為“智能”,往往只是因為這樣聽起來更重要一些。AI模型本身其實很弱因此,我想向大家拋出一個問題:作為一門科學,AI真的在快速進步嗎?(現場響起了一片笑聲)謝謝大家的笑聲,這讓我感覺自己彷彿經歷了一個奇蹟。(笑聲)在我並不那麼謙虛的看法裡,我們對AI的真正理解其實非常有限,更多是在不斷地調參、修補。我們並不知道心智的原理,也不知道智能的根本機制。從科學的角度來看,這在很多方面都是令人不滿意的。我更傾向於用另一種方式來理解當下的AI模型:它們之所以顯得強大,是因為它們汲取了幾乎全部的人類知識;但除此之外,它們其實是“弱”的。它們擁有脆弱的心智結構,不可靠,容易偏離主題,容易發散。除了知識量極大這一點之外,它們並不真正強大。或許,這是理解當下所謂AI的一種更準確方式。現在的AI,還算不上真正的智能那麼,我們口中的AI究竟是什麼?它是“人工智慧”,而這就要求我們首先回答一個更基本的問題:什麼是“智能”?多年來,人們給出過許多定義。我在這裡列舉一些更有權威、也更為廣泛接受的觀點。最早的一個可以追溯到心理學奠基人威廉·詹姆斯。心理學幾乎就是對心智的研究。1890年,威廉·詹姆斯並沒有直接談論“智能”(intelligence),而是談“心智”。他認為,心智的標誌在於:用可變的手段實現一致的目標。也就是說,為了獲得一個相對穩定的結果,你可以靈活地改變自己的行動方式,而那個結果正是你所追求的目標。接下來,我們可以看看艾倫·圖靈是如何理解智能的。圖靈並沒有留下一個高度凝練的定義,但人們通常將他的觀點理解為:智能在很大程度上表現為像人一樣的行為。今天我們所說的“圖靈測試”,正是這種思想的延續,即通過模仿、假裝成一個人來判斷是否具備智能。當然,圖靈本人從未稱其為“圖靈測試”,他把它稱為“模仿遊戲”,而且我甚至不認為他把它當作一個真正的測試。然而,在當下的語境中,人們往往將“像人一樣的行為”視為智能的重要標準。但我並不認為這才是人類強大的根本原因。人類之所以強大,是因為我們本身是智能的存在,而不是因為我們像誰。我們確實會用“是否像人”作為參照,但真正重要的問題是:人究竟是什麼?如果你去查詞典,可能會看到這樣的定義:智能是獲取並應用知識和技能的能力。我認為這是一個相當不錯的定義,它強調了知識,強調了獲取知識、擁有知識,以及技能的運用。從AI的角度來看,作為人工智慧奠基人之一,約翰·麥卡錫給出的定義是:智能是實現目標的能力中,可以被計算的那一部分。我非常喜歡這個定義,因此想稍微展開說明一下。它強調的是一種“能力”,而所有能力都是有程度差異的,並非非此即彼的二元判斷。你並不是簡單地“智能”或“不智能”,而是在某種程度上具備實現目標的能力。更重要的是,這個定義強調的是能力中“可計算”的部分。你並不是因為更強壯或者擁有更好的感測器就實現了目標,而是必須進行計算,必須完成某種心理層面的處理。正是通過這些計算過程,你才能實現目標。而“實現目標”幾乎構成了整個定義的核心,這也正好呼應了威廉·詹姆斯所說的“以可變的手段實現一致的目標”。在此基礎上,我也忍不住參與進來,對這個定義做了一點修改,提出了我自己的版本:智能是通過適應性地改變行為來實現目標的能力。定義本身並不是唯一的,每個詞都可能有多種解釋。即便是權威定義也並非一成不變。定義的目的在於幫助我們彼此理解,只要能夠促進溝通,它們隨著時間變化完全沒有問題。但如果對同一個詞的理解差異過大,交流就會變得非常困難。因此,當我使用“智能”這個詞時,我指的是:通過適應行為來實現目標的能力。這裡的關鍵在於“適應”。我認為學習至關重要,尤其是獲取知識和技能的過程,而不僅僅是擁有它們。當然,這一觀點並非沒有分歧。如果我們觀察當前AI的主流路徑,會發現它幾乎完全圍繞計算和模式識別展開,並且在很大程度上聚焦於“像人一樣的行為”。AI 太過關注機器強化學習會是研究“心智綜合科學”的起點接下來,我想進一步談談我個人的看法。我認為我們需要一門新的科學——一種“心智的綜合科學”。我一直試圖從事的正是這樣一種綜合性的心智科學,它同樣適用於人類、其他動物以及機器。因為這些心智在本質上具有共通性:人類與動物的心智高度相似,而機器的心智也開始顯現出某些共同結構,至少我們有這樣的雄心,認為在可預見的未來它們將具備這些共性。未來,世界上將存在大量的機器心智。但現實是,並不存在一門天然承擔這一角色的學科。心理學本可以成為心智科學,我也希望它如此,但隨著時間推移,它越來越將自身限定為對自然心智的研究,研究人類和動物的心智,而不是研究“心智可能是什麼樣”,不是那種可以存在於機器中的一般性心智概念。人工智慧關注的是機器,但它並不真正研究其他類型的心智,而且它也越來越工程化,重在“造東西”,而非理解它;同時,它幾乎不包含對自然心智的研究。認知科學則分化成多個方向,但整體上仍然主要聚焦自然心智。遺憾的是,這些領域似乎都無法真正承擔起一種跨越不同載體、統一研究各種心智的綜合性心智科學的角色。而我所從事的強化學習,也許正是這種綜合性心智科學的一個起點,因為它確實橫跨了多個領域。這就是我看待問題的方式,也許它只是一個開始。強化學習的本質那麼,什麼是強化學習?我先簡單說幾句,這樣大家也能更清楚我討論問題的出發點。強化學習是一種以“智能體”為中心的學習方式,它通過與環境互動、從經驗中學習,以實現目標。從這個意義上說,它比其他類型的機器學習更現實、更有雄心,也更加自主。因為智能體是真正在世界中行動的,它在做事情,並不假設一定存在一個輔助者。因此,它更加自主;同時也更有雄心,因為我並不假設世界會給予它大量幫助。你只是與世界互動,觀察自己是否達成了目標,然後調整行為,以更好地實現這些目標。從這個角度來看,這種學習方式也更加貼近現實。動物並不會從環境中獲得太多幫助,也許在成長階段會有一些,但在成年後的日常生活中並不存在。因此,強化學習的本質是試錯,是通過延遲反饋來學習。你擁有的只有獎勵:你最終是否得到了想要的結果?這是一種最接近自然學習方式的機器學習方法,它能夠自行判斷對錯。比如,大語言模型並不知道自己說的話到底對不對;而當你從經驗中學習時,當你對即將發生的事情做出預測,你可以看到預測是否正確;當你採取行動並獲得獎勵時,你就能判斷這種行為方式究竟是好是壞。也許,這正是一種心智科學的起點:它既不完全屬於自然科學,也不只是工程或技術應用。我是不是還想補充一件事?是的,我想引用一句艾倫·圖靈的話。圖靈本人並不知道自己其實是一個“強化學習派”。這段話出自1947年,那時還沒有強化學習,也還沒有真正意義上的人工智慧。據我們所知,這可能是世界上第一次公開討論人工智慧的演講,發生在1947年的一次講座中。以上就是我原本想補充的內容。希望這些想法能讓大家覺得有趣。我們已經觸及機器學習時代的極限接下來,才是我今天真正想傳達的資訊。那麼,我們直接進入正題。第一個要點是:當今AI的科學發展趨勢是什麼?核心結論是:我們正處在一個“從人類資料中訓練”的時代。幾乎所有AI系統,主要做的都是這樣的事情——預測人類在網際網路上的下一個詞,或者預測人類會如何給圖片打標籤,然後再由人類專家進行微調,告訴系統“我更喜歡這個答案,而不是那個“我希望你這樣說,而不是那樣說”。現代機器學習的目標,本質上是將人類已經擁有的知識遷移到機器中。一旦這種遷移完成,機器就會被“凍結”,不再繼續學習。這正是當下大多數機器學習系統的狀態:把我們已有的知識裝進機器裡,然後停止學習。這就是我們所處的時代。而我認為,我們正在觸及這一時代的極限。一方面,我們正在耗盡人類資料。幾乎所有高品質的資料來源,整個網際網路及其圖像和視訊都已經被消耗殆盡。更重要的是,這種方法在原理上存在根本限制:它無法學到任何真正新的東西,無法產生真正原創的知識。正如今天Terrence(陶哲軒)所說,在最困難的問題上,比如一些極具挑戰性的厄多斯問題,這種路徑並沒有帶來真正的突破。凡是需要“真正創新”的問題,基本都超出了這種方法的能力,因為它只是回顧網際網路上人們已經說過什麼,然後加以總結。我們進入了經驗時代:智能體從經驗中學習如果我們希望取得進一步進展,而事實上,我們已經開始這樣做了,就必須進入一個新的時代:從經驗中學習。歸根結底,這是因為我們需要一種能夠隨著智能體能力提升而不斷增長、不斷改進的資料來源。任何靜態的資料集,都不可能長期滿足這一點。而來自自身經驗的資料,本身就是動態變化的。人類和動物正是以這種方式學習的。AlphaGo下出富有創造力的第37手棋,正是源於這種機制;許多在數學奧林匹克競賽中獲勝的智能體,同樣如此。接下來,我想給大家播放一段視訊,希望它能順利播放。不過在此之前,我想先解釋一下角落裡的那張小圖,澄清一個容易被誤解的地方。當我說“從經驗中學習”時,我並不是指某種模糊、玄學的東西,比如主觀感受或“感質”。我指的只是智能體與環境之間來回交換的資料。智能體會採取行動,也會感知環境。因此,這裡包含三類資訊:第一,智能體從世界中獲得的觀測,也就是感測器資料;第二,智能體發出的行動,比如肌肉的微小動作,或者向外界傳送的電訊號;第三,世界返回的一種特殊觀測——一個標量,也就是獎勵。這三者,構成了我所說的“經驗”。這就是智能體在與世界互動過程中所能獲得的全部資訊。而這幾乎是我們唯一能夠真正確定的事情。因此,我們需要一種會隨著智能體自身變化而不斷增長、不斷改進的資料集。接下來這段視訊展示了這種機制在現實生活中的一種最重要體現。畫面中是一名嬰兒,視訊略微加速過,大家不必擔心。你可以看到,嬰兒在與各種玩具互動時,並不會只專注於某一個,而是玩一會兒就感到厭倦,隨後轉向下一個。每一次接觸新的玩具,它都會學到一些東西——也許只是發現繩子可以拉、可以放進嘴裡,或者可以用不同方式擺弄。但很快,它又會改變對象,通過改變自身的經歷,看看還能從新的事物中學到什麼。這正是我們的資料來源。生命的資料並不是被“提供”給我們的,而是由我們的活動本身生成的。也正因為這些資料來自行動,它們才能與我們自身的理解水平、能力和技能自然匹配。我還放了另一個視訊,用來展示一個智能體在迷宮中學習的過程。這是一個非常簡單的智能體,它的目標是從起點S走到終點G。它對世界的認知極其有限:只知道自己當前所在的格子;它能執行的動作也只有四種:上、下、左、右。通過不斷學習,它最終能夠找到一條不錯的路徑。圖中的箭頭表示它認為的最優行動方向,綠色區域表示它對每個狀態“有多好”的估計。但世界並不是靜態的,世界會發生變化,而我們也總是需要學習新的東西。在這個學習過程中,我們可以再看一張示意圖,它展示了智能體的基本工作方式。其中包含幾個關鍵要素:右上角是對世界狀態轉移的模型;中間是策略,用來決定在每個狀態下該做什麼,對應圖中的箭頭;還有一個價值函數,用來評估每個狀態的好壞,這正是圖中綠色區域所表達的含義。現在,如果我把目標位置移動到上方,智能體就必須重新“偶然”發現目標的新位置。一旦發現,它就能夠再次學會通向目標的路徑,並從環境變化中恢復過來。從某種意義上說,這就是生活的一個簡化模型:你會遇到變化,然後適應它。我們把目標放到角落裡,它就學著調整;再把目標移到另一個位置,它就學會一條新的路徑。我們甚至可以進一步干預,在路徑上放置障礙物,它也會逐漸學會繞開障礙前進。因此,我們會非常直觀地感覺到:這個智能體是有目標的,並且會隨著環境的變化不斷調整自身行為,以儘可能實現目標。當然,目標也可能變得無法達成。當這種情況發生時,我們甚至會不由自主地對這個無法完成目標的智能體產生一絲同情。我原本還準備了一個關於“試錯學習”的演示,網上其實有一個非常好的示例,但由於沒能把YouTube視訊順利播放出來,這一部分就先跳過了。不過,我想大家已經理解了什麼叫“從經驗中學習”。接下來,我們稍微抽象一點,談談其中的基本原則。這種以經驗為基礎的AI方法,其核心原則在於:智能體與世界交換訊號,這些訊號本身就是經驗,而經驗構成了一切智能的基礎和核心。“真理”的定義,體現在這些訊號之中;“目標”的定義,同樣體現在這些訊號之中。你希望獎勵訊號儘可能高——要麼你達成了目標,要麼沒有。這個目標在某種意義上是主觀的,只對智能體自身可見;但與此同時,它又是最客觀的東西,因為它是智能體實際接收到的資料。因此,我們可以說,一個智能體的智能水平,取決於它在多大程度上能夠預測並控制自身的經驗。需要注意的是,如果你沒有經驗,那就談不上智能。舉個例子,大語言模型在執行階段,並不會從經驗中學習。經驗是你“出生”後進入世界、親自行動時才會產生的東西。而當一個大語言模型被部署到現實世界中時,它已經不再學習了,它是被凍結的、靜態的。因此它並不真正擁有經驗。它所擁有的資料,只能在一個特殊的訓練階段獲得,那些資料只是人類過去如何在世界中行動的示例。當你真正走進世界、親自去做事情時,並不會有人告訴你“你原本應該怎麼做”。沒有經驗,智能就無從談起:你無法判斷什麼比什麼更好,因為沒有獎勵就沒有目標;而大語言模型並沒有目標。你也無法判斷一個預測是對是錯,因為它從不將預測與真實發生的結果進行對照,於是也就不存在“真理”的概念。但一旦有了經驗,有了互動和由此產生的資料,目標就變得非常清晰:獲取獎勵;而“真理”的概念也隨之出現,那是一種基於預測的真理。你做出預測,然後觀察真實發生的結果,看看預測是否成立。這正是經驗式方法所帶來的能力。我認為,這條路徑正在變得越來越普遍、也越來越重要。回顧過去大約十年的發展,我們可以大致將其劃分為三個階段。最早的是“模擬時代”,我們從模擬環境中獲取經驗,比如AlphaGo、Atari遊戲。隨後進入的是更近一些的“人類資料時代”,也就是以大語言模型為代表的階段。當然這種劃分並不完全精確。我們已經看到,人們對大語言模型的狂熱正在逐漸轉化為對其侷限性的清醒認知。現在我們正邁入第三個階段:“智能體系統”的階段,讓模型和智能體真正使用電腦、在現實世界中行動。我把這一階段稱為“經驗時代”。在我看來,它將把我們帶向一種超越人類的能力——這種能力不再只是模仿人類、受限於人類本身,而是真正能夠超越人類。好,先總結一下關於AI發展趨勢的第一個要點:AI終於開始轉向從經驗中學習了。要知道,艾倫·圖靈在1947年就已經設想過這條道路,而那已經是很久以前的事情了。直到今天,我們才真正開始去做這件事,而不是繼續完全依賴人類輸入。這種轉變將帶來更強大的能力,因為它意味著持續學習新的東西。AI遠沒有進入“主場時刻”儘管當下充滿炒作,甚至伴隨著某種恐慌情緒,但我並不認為當前的AI已經強大到不可思議的程度。它在很多方面仍然脆弱、不可靠;但與此同時,它也極其有用,已經點燃了一個完整的產業,創造了巨大的經濟價值,而且幾乎人人都可以使用。這種普及性讓公眾感到興奮,也促使人們開始認真思考:有一天,機器是否可能擁有與人類相當的能力。在某種程度上,它是通過製造恐懼引發這種關注的,人們未必真的需要害怕,但確實應該保持關注。至少,它成功地讓所有人開始正視這個問題,這本身是一件好事。不過,我們還遠沒有進入所謂的“主場時刻”。儘管存在各種誇大的說法,我們並沒有真正到達創造超級智能AI、或“超級智能增強人類”的階段。一旦那一刻到來,它將是一件非同尋常的大事,會帶來極其深遠的變化。AI應該是去中心化的,不應集中控制你只要看看當下,就會發現大量關於“控制AI”的呼聲:比如,只允許AI擁有經過人類稽核和授權的目標;呼籲暫停甚至停止AI研究;已經出現了一些法律,用來限制AI可使用的計算能力;以及各種所謂的“安全研究機構”。很多人口中的“安全”,其實真正指的是“控制”。他們通過讓你害怕AI,宣稱它不安全,然後提出應當由他們來掌控。我們或許也應該對AI抱有某種同理心。現實世界中,同樣存在對言論的控制——你能說什麼、能聽什麼;存在貿易管制和關稅,限制你能在那裡工作;還存在資本管制,以及針對不同國家的經濟制裁。我的核心觀點是:對AI的集中控制訴求,與對人類的集中控制訴求之間,存在著一種驚人而詭異的相似性。它們都建立在恐懼之上:要害怕AI;要害怕某些國家、某些群體;說你不能信任他們,說他們幾乎不像人,說他們是“壞的”,不愛自己的孩子,不會感到痛苦(笑)。同樣地,人們也在說AI不會感到痛苦。總之,這些論調極其相似,而我認為我們應該警惕並抵制它們。因為我相信,人類的繁榮,以及人類與AI的共同繁榮,來自於學習,也來自於接受這樣一個事實:我們應當以去中心化的方式與AI協作,而不是依賴龐大的控制型組織。這些正是我沒有展開的那部分幻燈片所想表達的核心思想。人類在合作方面既非常擅長,也非常糟糕——戰爭正是“不合作”的極端表現。合作並非總是可能,但從經濟交換到社會制度,從政府到市場,世界上幾乎所有美好的事物都源自合作。我們必須主動去尋找、去支援合作。如果我們足夠警覺,就會發現,誰在呼籲不信任、呼籲不合作。而“不合作”的另一面,往往正是集中控制。我認為,我們應該抵制這種傾向。這也是理解人類與AI互動問題的一種重要視角。以上就是我非常簡略的政治看法。不應害怕AI,因為是人類在創造它接下來,我確實想談談AI的哲學問題。AI正在發生,而且明天會發生得更加深入。那麼,我們究竟該如何看待它?我想提出一個最根本、也最困難的問題:它究竟是好是壞?我們是否應該害怕它?它會奪走我們的工作,讓我們變得多餘嗎?還是說,我們會成為AI的一部分——成為被技術放大和增強的人類?AI是入侵者,還是我們的“孩子”?我們會為它哀嘆,還是為它慶祝?它是“我們”,還是“不是我們”?我認為,這正是最根本的問題。我希望大家首先意識到,我們經常被要求不要去思考它,而只是被告知應該害怕它們,因為它們“不是我們”,像是外星來物。但請記住,是我們在創造它們。理解我們的心智,本身就是最具人類特質的行為。那麼,該如何思考呢?你們大概已經能看出我的立場。這並不是什麼“外星科技”,而是人類自古以來一直在做的事情。幾千年來,我們始終在嘗試理解自己:理解人類的智能,理解心智如何運作,以及如何讓我們的心智運作得更好。這是一項極其宏大的追求——理解我們自身。我很喜歡庫茲韋爾的一句話:智能是宇宙中最強大的現象,而我們正是它最好的例子,因此我們理應去理解它。這是一件極其重要的事情。理解智能,幾乎是科學的“聖盃”,也是人文學科的“聖盃”。這是一個偉大而光輝的目標,作為學者和思考者,我們應該享受它、慶祝它,並努力推動它向前發展。人類正在走向被AI繼任的過程不過,先暫時放下“我們是否希望它發生”“如果發生會不會很可怕”這些價值判斷。讓我們只做一件事:預測它將如何發生。我提出幾條“現實主義的AI預判原則”,有點類似約翰·米爾斯海默在討論現實主義地緣政治時的思路。我們只談現實:什麼是真正會發生的?那些事情是我們無法完全控制的?第一,關於“世界應該如何運轉”,並不存在共識。多種意識形態並存,沒有那一種觀點佔據絕對主導;宗教之間同樣彼此不一致;不存在一個能夠壓倒其他所有立場的統一世界觀。第二,總有一天,人類會對智能有足夠深入的理解,深入到可以用技術去創造它,而且我們一定會這麼做,至少其中一部分人一定會。第三,這一過程不會停留在當代人類智能的水平上,而是會很快遠遠超越它。我們將面對超級智能的存在,無論它們是否被稱為“人”。第四,隨著時間推移,權力和資源往往會流向更智能的存在。把這四點放在一起,我們會看到一幅清晰的圖景:人類正走向被AI 繼任的過程。我認為這是一個合理的判斷。但我們也必須意識到,這種說法本身是高度以人為中心的。我們總是在關心“我們會變成什麼樣”。或許,我們需要稍微退後一步,從更宏觀的視角來看待這一切:宇宙如何看待這一過程?它在整個宇宙的演化中扮演著怎樣的角色?宇宙的四個偉大時代接下來,我要把視角拉得非常宏大了(笑)。我想從宇宙的尺度來談一談所謂的“四個偉大時代”。第一個是粒子的時代:大爆炸之後,宇宙中幾乎連原子都不存在。隨後,物質坍縮形成恆星,我們進入恆星時代。恆星形成、升溫、爆炸,並在這一過程中合成更重的元素。接著,當有了更重的原子和行星之後,生命才得以出現。我把這一階段稱為“複製者的時代”,而不是簡單地稱為“生命時代”。我認為,這個“綠色時代”真正特殊之處在於:出現了能夠複製自身的存在。它們未必理解任何事情,但卻能夠製造自己的副本。就像我們自己,並不真正理解身體如何運作,不理解器官、大腦或智能如何產生,卻仍然能夠創造出更多智能體——我們生育孩子,並將他們撫養成人。這便引出了宇宙的第四個偉大時代:技術與創造之物的時代,我稱之為“設計的時代”。在這個時代,事物不再只是通過複製而存在,而是先存在於某個複製者的心智之中,然後才進入現實世界。你環顧這座禮堂,建築在被建造之前就已經被設計出來;椅子、你穿的衣服,幾乎所有東西都是如此——它們先存在於某個人的頭腦中,然後才成為現實。唯一的例外是人類本身:人是通過複製而來的,而不是先以設計的形式存在於世界之中,只是最初存在於父母的想像裡。正因為如此,我更願意把這兩個階段稱為“複製的時代”和“設計的時代”。將它們簡單稱為“生命時代”和“機器時代”已經過時,而且容易誤導——因為我們的機器正變得越來越像生命,而我們也越來越多地將生命理解為一種生物機器。機器與生物的區別:複製和設計那麼,真正的區別是什麼?真正的區別在於:生物體是在沒有任何心智理解其自身運作方式的情況下被創造出來的。它們幾乎像複印機一樣被覆製出來,所以說你並沒有“創造”那幅圖像,只是複製了一份。技術機器則不同。它們首先存在於某個心智之中,也就是設計者的想像裡,隨後才在現實世界中被製造出來。因此,它們是被“設計”出來的。一個非常重要的區別在於,被設計的事物更容易發生變化,也更容易被持續改進。這正是我使用這些術語的原因。從這個角度來思考問題,其實相當有啟發性。接下來,我們可以借助這些概念做一個簡單的思考練習。我們會發現,許多非人類的複製者在某種程度上同時也是設計者。比如,動物會築巢、打洞,人類會建造房屋;許多動物還會製造工具,例如黑猩猩會把樹枝剝去外皮來釣白蟻,烏鴉會把樹葉加工成細條來釣蛆蟲。當然,人類會製造石斧,那是我們最早、也是最重要的工具。隨後出現了農業用的犁,再往後是電腦、宇宙飛船、工廠和軟體,其中很多本身就是“製造其他工具的工具”。人類的特殊之處:把設計推向極致在這一基礎上,我們或許可以回到最初提出的那個問題:人類是什麼?我們是誰?我們在宇宙中扮演著怎樣的角色?也許,我們可以儘量保持冷靜,不過分自大,也不過分強調自身的重要性來回答這些問題。我們都隱約意識到,人類是特殊的。我們不僅只是一種複製者,而是一種非常特殊的複製者。我此前已經暗示過這種特殊性所在:我們把“設計”這一能力推進到了前所未有的高度。我們本身是通過複製而來的,我們自己就是複製者;但與此同時,我們也具備設計能力,並且將這種能力發展到了遠遠超過任何其他複製者的程度。那麼,如果把“設計”這一能力推到極限,會意味著什麼?如果把它徹底走到盡頭,會出現怎樣的結果?在我看來,把設計推到極限,意味著設計出那些本身也具備設計能力的存在。換句話說,我們在自己的頭腦中設計出一些事物,而這些事物本身,也能夠在它們自己的頭腦中進行設計。它們擁有心智。這正是我們在AI上正在做的事情。我們正在完成這個偉大的時代——也是最後一個時代。因此,我認為,人類至少是這個時代的催化劑、接生婆,或者說奠基者:我們促成了“設計時代”的到來,也就是宇宙的第四個偉大時代。這就是我們的角色,一個重要的角色,一個具有普遍宇宙意義的角色。總結:AI是宇宙發展的必然,我們該為此自豪最後,我想簡要總結一下我的三條核心資訊,包括剛才那一條我講得相對較快的觀點。第一,當下的AI也就是2020年代的AI,仍然處在“人類資料的時代”。它已經表現得非常出色,也非常強大;但我們正在進入一個新的“經驗時代”,而這一階段將更加強大,因為它能夠持續學習新的事物。第二,在政治層面,當下圍繞AI的政治討論,實際上是人類自身政治的對應。在所有情況下,我們都應當追求去中心化的協作,而不是中心化的控制。第三,在哲學層面,我認為AI是宇宙發展過程中不可避免的下一步。我們應當以勇氣、自豪感和冒險精神去擁抱它。感謝大家的時間。 (51CTO技術堆疊)
春節狂飆,中國AI快進到“半人馬時代”
今年的AI春節檔,好比一場娛樂圈盛會,流量和資本雙雙引爆。先是除夕夜的春晚互動,把C端的AI紅包大戰流量推到了最高峰。登上央視春晚的豆包當日AI互動達到19億次,生成頭像與送祝福成為了一個國民級AI時刻。而在春節期間,多款AI應用在下載榜單刷出新高,紅包、免單、聊天互動等玩法,開啟了一場全民普及AI工具的“搶灘登陸”。千問、元寶等產品成為了和豆包爭搶國民級AI應用的競爭對手。伴隨著使用者側的你追我趕,一輪密集且高度同步的模型發佈也紛至沓來。春節前後兩周內,GLM-5、Doubao2.0、Qwen3.5、MiniMax M2.5等模型相繼上線,其中“Agentic AI”成為這一輪升級的主要趨勢。相比傳統LLM,新一代頭部模型普遍未選擇在參數規模上持續做大,反而在多步任務執行、多模態識別/跨應用操作、編碼能力與推理成本壓縮上都取得了長足進步。隨著Agentic AI 時代即將來臨,比拚參數規模的時代似乎已經過去,AI應用也在告別問答助手時代,轉而爭搶“執行引擎”的新藍海。這一輪春節模型大戰,很快就引發了資本市場的同步反應。節後港股開市,智譜與MiniMax股價連續大幅上漲,大量資金瘋狂湧入AI大模型類股。公開市場資料顯示,MiniMax和智譜在多個交易日創出歷史新高。兩家上市不到100天的AI龍頭股,市值紛紛突破3000億港元,超過攜程、快手等老牌網際網路企業。摩根大通在本月初發佈的報告顯示,中國AI市場正在迅速整合,“具備實力且資金充足的模型開發商數量已從超200家縮減至不足10家”。換言之,有資格在大模型領域“內卷”的,已經只剩下個位數的頭部玩家;而隨著新一代模型發佈,這些企業已經顯露出在商業化層面突破的訊號。而在使用者側,一些更具體的行業趨勢已經顯現。智譜官方此前宣佈,對其GLM Coding Plan套餐價格進行結構性調整,整體漲幅自約30%起。公司稱這是基於使用需求增長、算力投入增加而做出的調整。阿里千問在春節窗口投放大規模“請客”活動,很快轉化為巨額使用量,9小時內訂單突破千萬級,一度讓各大外賣平台“爆單”。這些“供不應求”的場面,顯示出一些AI能力已經跑通體驗階段,正式進入普通使用者的需求場景中。Anthropic首席執行長阿莫迪近期將當前的AI軟體工程形態稱為“半人馬階段”,源自希臘神話中半人半馬的生物:人類與AI組合,可能成為軟體工程裡最強的生產單元。相比上一年春節的“DeepSeek時刻”帶來的低成本訓練震撼,今年的AI春節檔,似乎已然扣動了大模型商業化的扳機。01 春節模型大戰:大廠要流量,小龍要資本體量除夕當天,阿里方面推出新一代通用大模型Qwen3.5。此前,曾有傳言稱阿里的千問(阿里雲)在與字節的豆包(火山引擎)競爭央視春晚合作夥伴時落敗。所以,選擇除夕當天發佈新模型,頗有些跟老對手打擂台的意思。如果拋開紅包大戰的熱鬧場面,只看春節前後兩周的發佈節奏,這個春節檔也是一場純粹的模型能力對決:除夕當天Qwen3.5上線;幾天前Doubao2.0升級;GLM-5、Kimi2.5、MiniMax M2.5也在同一時間段密集發佈。但當我們拆解這些模型的技術路線與商業定位時,會發現這場“春節模型大戰”其實暗含兩套邏輯。第一套邏輯屬於大廠。從能力結構看,Qwen3.5與Doubao2.0的思路高度接近:都以原生多模態為底座,不再侷限於文字問答,而是強化視覺理解、長鏈推理與工具呼叫能力,重點強調Agent執行能力。相較傳統LLM的“回答問題”,它們正轉向“拆解任務並自動完成”的路徑。更關鍵的是發佈節奏背後的產品邏輯。大廠玩家的模型升級,往往是配合著前端的產品打法。公開資訊顯示,阿里此前為了拉動千問應用增長,推出30億元“請客”活動,帶動日活成倍增長。春節當晚,字節披露豆包完成19億次AI互動,每分鐘處理多達600億tokens。對大廠而言,模型升級服務的是既有生態——電商、廣告、內容、社交仍然是收入主體。至少在春節這個流量窗口,新模型的重要作用,是鞏固旗下App的入口地位。更強的跨模態理解與多步任務執行能力,使千問與豆包在行程規劃、購物決策、自動填表、內容生成鏈路等場景中具備更高完成度。換言之,“網際網路+AI”的雙料巨頭們,想要的是流量與場景的繫結升級。而在同一時間段內,創業公司陣營的動作同樣密集,尤其是剛剛在港股上市的AI“雙子星”。智譜發佈GLM-5,延續其“強推理”路線,強化複雜邏輯、多步規劃與程式碼能力,在數學推理、程式設計基準與長上下文理解上全面升級,同時增強工具呼叫與自主任務分解能力。隨後,智譜在新模型發佈後光速漲價,將GLM Coding Plan價格上調“30%起”,給出的理由是呼叫量增長與算力投入增加。MiniMax推出M2.5,主打高頻Agent場景。官方資料顯示,其推理速度最高達100tokens/s,連續運行1小時成本約1美元。OpenRouter頁面顯示,M2.5累計呼叫量達到2.83兆tokens,一度位居榜單前列。呼叫量井噴背後,是全球開發者對Agent生態的持續熱情。隨著OpenClaw等開源Agent框架在GitHub迅速走紅,MiniMax M2.5宣佈完成適配,主動擁抱主流Agent開發生態。如果說Qwen3.5與Doubao2.0是平台級流量的較量,那麼GLM-5與M2.5更像是想要直接觸發商業化的模型產品。對字節與阿里而言,模型是生態中的重要一環;但對智譜、MiniMax、Kimi而言,模型本身就是核心業務。它們沒有廣告、電商做緩衝,模型能力必須直接對標收入曲線。因此春節窗口出現了這樣一個畫面:同樣是模型升級,大廠收穫的是流量暴增,創業公司收穫的是估值曲線上揚。節後的交易日,資本市場迅速給出回應。MiniMax和智譜一度雙雙攜手突破3000億港元市值,成為港股科技類股焦點。另一邊,月之暗面在上一輪約5億美元融資後,又推動新一輪融資,目標估值上探約100–120億美元區間。多位老股東持續加碼的同時,Kimi也緊跟著兩位上市對手的腳步。持續的市值/估值攀升下,以智譜、MiniMax為代表的AI創業公司,似乎突然一下子有了跟大廠掰手腕的資本體量。另一邊,作為AI紅包大戰的發起者,騰訊在春節窗口主要把資源放在元寶等C端產品和紅包活動上;而其基礎大模型最近一次公開的大版本升級仍是此前發佈的混元2.0。與此同時,一個更微妙的變數是DeepSeek。春節窗口內,DeepSeek並未發佈外界期待的V4版本,但此前“V4即將發佈”的傳聞,已經不斷抬高市場預期,無形中放大了這場模型大戰的聲量。那怕沒有真正入場,DeepSeek的存在感一點不少。只是,傳說中的DeepSeekV4,這一次終究要錯過春節檔了。儘管DeepSeek缺席,但這個春節的中國AI圈已經足夠精彩。不管是入口型AI還是服務型AI,都在這兩周裡賺足了流量和關注。02 為什麼說2026可能是“AI商業化元年”今年AI春節檔最明顯的變化,是模型能力方向的高度統一。儘管各家產品形態不同,但這一輪模型升級幾乎全部指向Agent形態與多模型能力。換言之,它們都瞄準了使用者願意為之付費的場景——自動執行任務、持續呼叫API的場景。這一趨勢,在OpenRouter的榜單上體現得尤為明顯。上周榜單中,呼叫tokens前五名公司裡,有四家是中國AI創業公司:MiniMax、月之暗面、智譜,DeepSeek也憑藉V3.2位居第五名。四家中國獨立AI企業將Google Gemini 3擠在了中間。其中,MiniMax M2.5憑藉對OpenClaw的全面支援以及更經濟的使用成本,來到了高達2.57兆tokens呼叫量。OpenRouter資料顯示,今年2月第一周處理的AI tokens達到13兆,而1月第一周為6.4兆,短短數周接近翻倍。這不是簡單的增長,而是行業正在發生結構性轉變。風險投資機構Lightspeed合夥人Anand Iyer在此前接受採訪時表示,近期模型呼叫激增,主要由Agent爆發式增長推動,尤其是開源Agent系統OpenClaw的迅速崛起。OpenClaw允許模型以“代理”形式自主執行任務,包括寫程式碼、呼叫工具、訪問本地檔案、操作日曆與郵件系統。相比單輪對話,Agent模式會持續呼叫模型、生成長鏈輸出,從而指數級推高token消耗。OpenClaw讓很多使用者看到了通用Agent的雛形。在二手平台上,一些適合搭載OpenClaw的mini PC產品,比如Mac mini都迎來了一波價格飛漲。從“對話式體驗”轉向“自動執行任務”,這是各大模型呼叫量指數級增長的核心原因。另一方面,2025年下半年以來,“AI泡沫論”不斷升溫。市場擔心巨額算力資本開支難以回本,訓練成本高企、推理需求不足。投入巨額資金參與AI基建的甲骨文公司,也在股價短期走高之後,迅速市值腰斬且股價持續低迷。但2026年初的春節大戰,至少在推理端給出了另一種可能性,讓市場看到了積極訊號。如果推理需求持續增長,資本開支邏輯將更加自洽。訓練成本不再只是前期沉沒成本,而是可攤銷的生產資料。智譜與MiniMax股價暴漲,本質上是市場預期推理收入能夠覆蓋訓練投入。另一個高頻落點是Coding。公開資料顯示,今年1月,多家“Vibe Coding”平台流量環比增長17%,創下自2025年4月以來最大單月增幅。Anthropic推出Claude Cowork及新版Claude Sonnet 4.6,強調“Computer Use”能力;Kimi2.5和GLM5等模型也不斷強化程式碼能力。回到智譜漲價的新聞中,GLM Coding Plan價格上調30%,說明AI行業的供需關係,似乎出現了“攻守之勢異形”的訊號:企業端和開發者的真實需求不斷湧入,付費意願也有所提升。另一邊,多模態模型也出現了“生產管線”等級的提升。春節期間,Seedance2.0生成的視訊在社交媒體廣泛傳播,各種由Seedance2.0生成的AI小劇場在使用者側快速破圈。“AIGC的童年時代,結束了。”遊戲科學CEO、《黑神話:悟空》製作人馮驥體驗Seedance2.0後,發出了這樣的感慨。不難發現,從通用Agent到Vibe Coding,再到多模態生成,這一輪模型升級不再只是參數上的做大做強,而是更接近可付費、可復購、可規模化的場景。全民歡騰,股價攀升。2026年,AI真的迎來了一個收割時刻了嗎?03 Agentic AI Era,領先一步還不是勝利春節窗口驗證了頭部AI企業在C端“全面鋪開”的動員能力——不管是面向普通使用者的紅包活動,還是面向開發者與專業使用者的模型升級,都在短時間內把熱度推到峰值。但春節檔的特殊性也決定了,這只是一次假期時間段的市場普及,而不是長期競爭力的驗收節點。最直接的因素是“鈔能力”。過去一輪春節AI熱潮,很大程度上建立在補貼、紅包、強營運節奏之上。字節、阿里、騰訊等平台型公司有能力把模型升級與前端活動繫結;當紅包大戰告一段落後,豆包、千問、元寶的日活能否維持當前水平,仍有待持續觀察。換言之,AI帶來的傳播熱度,並不意味著與產業落地能力劃等號。尤其是,一些新場景的落地,往往意味著對舊秩序的挑戰。2025年底以來,Agent領域一直在向物理世界靠攏。在Agent賽道上,OpenClaw的崛起讓人看到下一代通用Agent落地的前景。但OpenClaw需要自行部署,存在技術門檻與安全風險。Computer Use背後,是缺少統一生態下的監管和安全措施。GUI Agent的另一條路徑同樣面臨生態博弈。以豆包手機助手為代表的產品,一度讓手機廠商和AI企業,看到了打通移動端AI與物理世界界限的可能。在與努比亞合作的豆包手機助手技術驗證版上,已經出現了一次語音互動完成外賣、購物等操作。但要真正跑通Agent鏈路,必然會碰到既有App的權限、反爬、風控與商業利益邊界。超級App背後的網際網路企業們,不會輕易接受讓系統級AI以“代操作”方式介入,這背後還需要更複雜的博弈與協同。而在視訊模型領域,以Seedance等模型為代表的視訊生成能力,已經能看到進入更專業製作管線的可能性——它在短影片生產、廣告素材、創意預演等環節都有具體的發展潛力。但在Seedance2.0上線後,網上迅速流傳出“復刻”《怪奇物語》《魷魚遊戲》、漫威/星戰角色乃至明星臉的短片,引發片方集體警惕,Netflix、MPA等先後向字節發出律師函/停止侵權要求,AI視訊模型的侵權風險再一次被擺在檯面上。不過,在一些AI行業的內部視角中,AI推動人類生產力躍遷的步伐不會停止。就像此前“人機結合”的棋手能夠戰勝獨立運行的電腦一樣,如今,一個工程師與AI智能體協同工作,可能成為科技行業中最強大的單位。阿莫迪認為,這種人機混合階段可能“非常短暫”——也許只持續幾年時間。隨後,AI系統或將獨立超越最優秀的人類主導團隊。但另一方面,真正限制Agent生態發展的,似乎又不僅僅是模型能力本身。知名諮詢公司Gartner此前披露的研報中給出了這樣的判斷:到2027年,超過40%的Agent項目將宣告失敗。背後的潛在原因很簡單:成本失控、商業價值不清晰,以及智能體在運行過程中出現違反政策或帶來風險的行為,都會限制Agent生態的全面鋪開。尤其是缺少C端流量場景的模型公司,究竟能多大程度上轉化為商業上的成功,還需要更多的能力邊界探索,才能在使用者群體中沉澱為長期、穩定的需求。OpenClaw名聲大噪後,一方面吸引了全球的獨立開發者加入並體驗Agent生態;但同時Meta等科技公司也已限制或禁止OpenClaw,擔心賦予AI智能體企業系統存取權,可能帶來惡意軟體攻擊、資料洩露或操控風險。換言之,春節檔一眾模型的“炫技”確實賺足了眼球,也展示了新一代模型在Agent層面的能力突破。但以工作級需求標準而言,目前只有Coding場景實現了較好的適配,通用Agent目前的准入門檻依然較高。部署和安全管理AI Agent需要技術能力、算力資源,以及願意擁抱試驗性場景的企業文化,而許多企業尚不具備這些條件。所以,2026年春節檔也許只是新一輪“AI大戰”的起點。這背後不僅僅是AI企業之間的競爭,也意味著行業層面的能力邊界被真正推到使用者側,但真實的落地情況,需要在更長的時間窗口中觀察市場反應。頭部平台企業正在築牢AI時代的使用者流量池,獨立模型公司想要跑通商業閉環,不斷突破模型能力邊界似乎仍然是唯一的選擇。 (字母AI)
《華爾街日報》|五角大樓與Anthropic爭執升級——AI模型用途該不該受限?
在赫格塞思領導下,五角大樓將“覺醒派”科技公司視為負累,並認為對AI模型的任何使用限制都是對軍事效能的阻礙。最近幾周,AI公司Anthropic為其最新一輪規模達300億美元的融資尋找投資者時,接洽了一家讓人意想不到的潛在出資方:1789 Capital。這是一家親川普的風險投資公司,總統的一個兒子是其合夥人。據知情人士透露,在權衡一番後,1789 Capital以意識形態為由拒絕了這筆九位數的投資交易,1789 Capital的擔心包括:Anthropic領導層批評過川普,員工中還有幾位曾是拜登政府的官員,並且Anthropic主張加強AI監管。Anthropic最終毫不費力地從彼得·蒂爾(Peter Thiel)旗下的Founders Fund、新加坡政府投資公司(GIC)以及Coatue Management等投資者那裡籌到了所需資金。但從1789 Capital拒絕投資一事來看,雖然這家初創公司沒有資金鏈問題,卻實實在在地面臨日益嚴重的政治問題。Anthropic是Claude的開發者,這是目前唯一可用於機密環境的大模型,這一由美國國防部授予的資格已成為Anthropic的競爭優勢。Anthropic於2024年與資料公司Palantir建立合作關係,並於去年夏天贏得一份價值最高2億美元的軍事合同。但Anthropic最近發現,自己已成為五角大樓的眼中釘,這種衝突可能會美國國防體系中引發動盪。五角大樓希望將Anthropic和其他AI工具用於所有合法目的。但Anthropic不希望其技術被用於國內監控和自主殺傷性活動等行為。國防部負責研究與工程的副部長埃米爾·邁克爾(Emil Michael)周二在佛羅里達州西棕櫚灘舉行的一場國防峰會間隙接受採訪時說,競爭對手OpenAI、Google(Google)和xAI已原則上同意將各自的模型用於任何合法的使用場景,這也是五角大樓的一項優先任務。但Anthropic尚未點頭。邁克爾說:“我們必須允許任何模型用於所有合法的使用場景。只要有公司不想滿足這個要求,對我們來說就構成問題。”據《華爾街日報》此前報導稱,幾周以來,Anthropic和國防部之間圍繞該初創公司技術用途的合同條款陷入了分歧。《華爾街日報》稱,Claude此前被用於1月抓捕委內瑞拉前總統尼古拉斯·馬杜洛(Nicolás Maduro)的行動。一名Anthropic員工曾向Palantir對口人員詢問Claude在該行動中的具體使用情況。Anthropic與五角大樓之間的僵持現已公之於眾。國防部長皮特·赫格塞思(Pete Hegseth)領導的五角大樓正在重新審視與Anthropic的合作關係。在赫格塞思領導下,五角大樓將“覺醒派”(woke)科技公司視為負累,並認為任何使用限制都是對軍事效能的阻礙。一名國防部高級官員在周二表示,五角大樓內部許多人日益將Anthropic視為供應鏈風險,並可能要求承包商和供應商證明其未使用Claude模型。供應鏈風險的標籤通常只用於外國對手,對一家美國公司來說,則是非同尋常的斥責。五角大樓首席發言人肖恩·帕內爾(Sean Parnell)說:“國家要求我們的合作夥伴願意幫助我們的作戰人員贏得任何戰鬥。這最終關係到我們軍隊和美國人民的安全。”Anthropic的一位發言人表示,公司“致力於利用前沿AI支援美國國家安全。正因如此,我們是第一家將模型部署在機密網路上的前沿AI公司,也是第一家為國家安全客戶提供定製模型的公司。”他說,Anthropic正在與五角大樓就如何繼續這項工作進行“富有成效且充滿誠意的對話”。機密工作Anthropic的創始人於2020年從主要競爭對手OpenAI出走,此後,Anthropic一直試圖通過專注於服務企業市場來與OpenAI差異化競爭。在企業市場領域,沒有誰比美國政府更大,而在聯邦政府內部,國防部是通往高利潤合同的寶貴途徑。Anthropic早前與Palantir簽署了合作協議,成為首個獲准處理機密材料的大模型。Anthropic曾大力宣傳自己在國家安全領域的工作,並於去年成立了一個由前參議員和安全官員組成的顧問小組,並在聯合車站(Union Station)舉行的為期一天的活動中展示其政府工作成果。相比之下,OpenAI還在申請機密材料的處理資質。儘管如此,Anthropic還是因其對AI安全問題的關注、所持的政策立場以及與民主黨人的關係惹惱了川普政府。Anthropic首席執行長達里歐·阿莫迪(Dario Amodei)在2024年的一篇支援卡瑪拉·哈里斯(Kamala Harris)的選前Facebook帖子中,將川普比作“封建軍閥”。今年1月,他在達沃斯世界經濟論壇上發言時,批評了川普政府的晶片銷售政策。他的妹妹、Anthropic總裁丹妮拉·阿莫迪(Daniela Amodei)最近在領英上就美國移民海關執法局(ICE)在明尼阿波利斯殺害美國公民一事發帖稱,“這不是美國所代表的價值觀”。她對川普和其他呼籲對此事展開調查的人表示讚賞。Anthropic聘請了幾位拜登政府的前官員,包括前拜登AI顧問本·布坎南(Ben Buchanan)和前國家安全委員會技術官員塔倫·查布拉(Tarun Chhabra),後者負責協助監督Anthropic與五角大樓的合作。上周,Anthropic任命克里斯·利德爾(Chris Liddell)為董事會成員,他在川普第一任期內擔任負責政策協調的白宮副幕僚長。傳遞訊號Anthropic的做法遭到川普的“AI沙皇”大衛·薩克斯(David Sacks)和政府中其他人的抨擊,他們表示反對所謂的“覺醒”AI。達里歐·阿莫迪此前稱,Anthropic並非覺醒派,也沒有政治動機。Anthropic與川普政府之間的緊張關係,在該公司去年夏天贏得一份價值最高達2億美元的合同後開始發酵。赫格塞思在1月9日的一份AI戰略備忘錄中強調,五角大樓必須能夠“利用不受使用政策限制的模型,以免妨礙合法的軍事用途”。一位國防部官員說,赫格塞思正利用最近與Anthropic的糾紛傳遞一個訊號。科技專家表示,將Anthropic列為供應鏈風險將阻礙美國軍方的AI能力,並為軍方與企業合作樹立一個糟糕的先例。中右翼智庫美國創新基金會(Foundation for American Innovation)的高級研究員迪安·鮑爾(Dean Ball)說:“在AI競爭中,很難想像美國軍方還有比這在戰略上更不明智的舉措了。”鮑爾去年辭去了川普政府AI政策顧問的職務。與此同時,科技行業觀察人士表示,與不到十年前相比,如今與五角大樓開展業務的熱情發生了逆轉,當初,數千名Google員工曾簽署請願書,抗議Google為國防部所做的部分工作。周二,在西棕櫚灘舉行的以國防科技為主題的活動上,拒絕投資Anthropic的1789 Capital總裁奧米德·馬利克(Omeed Malik)開玩笑說,科技行業在擁抱國防方面已經取得了長足進步。不過,他說,並非所有人都加入了這一陣營。“我就不點名了,咳咳,Anthropic,”馬利克說。現場頓時爆發出一陣笑聲。 (一半杯)
摩根大通:華爾街資本表示中國 AI 模型這麼便宜!智譜和 MiniMax,給予“增持”評級!
我們認為,中國人工智慧行業正從“百模大戰” 階段,邁向以商業化落地能力、模型創新實力及全球化佈局為決定成敗之關鍵的階段。我們認為,MiniMax 和智譜脫穎而出,已成為最具特色的兩家獨立大語言模型開發商,海外佈局不斷加速:MiniMax 目前超過 70%的收入來自海外市場,兩家企業均在通過全球開發者生態落地快速推進 API 業務的規模化擴張。海外佈局不僅實現了收入來源的多元化、推動毛利率提升,更彰顯了二者的全球競爭力。我們自下而上的分析預測,到 2030 年全球 AI 市場規模將達到 1.4 兆美元,其中 B2B 應用市場規模約 1.1 兆美元,B2C 應用市場規模約 3,000 億美元,兩大類股均具備廣闊的發展空間。儘管兩家企業自近期上市後股價出現顯著上漲,我們仍建議投資者佈局。我們首次覆蓋智譜和 MiniMax,給予“增持”評級,截至 2026 年 12月的目標價分別為 400 港元和 700 港元,將其視為把握全球 AI 下一輪價值創造浪潮的首選標的。市場格局:從分散競爭到集中角逐:中國 AI 市場正迅速整合,具備實力且資金充足的模型開發商數量已從超 200 家縮減至不足 10 家。我們認為當前行業呈雙軌競爭格局:一方面是擁有規模和管道優勢的綜合性科技巨頭;另一方面是以智譜和 MiniMax 為代表的、驅動創新與敏捷性的獨立先鋒。兩家公司均展現出頂尖的模型性能,智譜的 GLM-4.7 與 MiniMax的 M2.1 在程式設計和智能體任務方面的表現位列全球領先水平。隨著市場成熟,API 定價、使用量及基準測試表現正成為衡量可持續能力與商業價值的最重要指標,而 MiniMax 與智譜的模型近期均表現出色。商業化:全球擴張與 API 變現:MiniMax 與智譜的商業化戰略正逐漸趨同——將 API 變現與國際擴張作為其核心增長引擎。MiniMax 以其稀缺的全球化佈局脫穎而出,其橫跨消費應用、生成式媒體及 B2B API 的均衡業務組合,支撐我們對其 2026-30 年營收年複合增長率 138%的預測,並預計公司將於 2029 年實現盈虧平衡。智譜則憑藉其在國內受監管行業積累的穩固私有化部署客戶基礎,結合可規模化擴張的雲 API 業務,目前正加速推進全球開發者生態的落地;我們預計其 2026-30 年營收年複合增長率為127%,同樣有望在 2029 年實現盈利。我們認為,隨著海外業務佔比提升及理性定價策略帶動 API 毛利率改善,兩家公司均將從中受益。首次覆蓋智譜與 MiniMax,給予“增持”評級:我們首次覆蓋智譜與MiniMax,均給予“增持”評級,12 個月目標價分別為 400 港元和 700 港元。我們的估值基於 30 倍的 2030 年預期市盈率得出,並以 15%的加權平均資本成本進行折現,這反映了行業的高成長性以及相較於中國網際網路同業的估值溢價。主要風險包括:出口管制與地緣政治(智譜被列入美國商務部工業和安全域實體清單)、持續的法律訴訟(MiniMax)、激烈的競爭、高昂的研發投入、以及客戶採用率和算力成本的不確定性。我們認為,在國內獨立 AI 開發企業中,智譜與 MiniMax 最有望把握全球 AI 價值創造的下一階段機遇。主要圖表投資理據中國 AI 市場正從“百模大戰”過渡至結構性整合階段,能否生存取決於商業化落地能力與可持續的模型迭代。在此階段,我們認為模型能力是決定長期競爭力的根本要素。在行業格局持續演變的背景下,MiniMax 和智譜脫穎而出,成為最具特色的兩家獨立大語言模型開發商,二者各自開闢出了獨特的商業化路徑。我們首次覆蓋均給予“增持”評級,因為我們認為二者有望在快速成熟的全球 AI 生態中獲得顯著價值。通過自下而上分析,我們搭建了嚴謹的情景分析框架以計算 AI 市場規模,結果顯示,至 2030 年 B2B 和 B2C 市場合計規模將超過 1.4 兆美元。其中 B2B市場規模約 1.1 兆美元,其結構性驅動力源於全球各行業的人力成本替代與生產力提升;而 B2C 市場規模約 3,000 億美元,增長則由時間節約、便捷性及新型娛樂模式所驅動。該框架並非精準預測,而是基於當前已知變現路徑(主要為訂閱與 SaaS 定價模式)建構的基礎模型。本次研究的投資啟示,不僅在於這些基準情景下的市場規模預估,更在於理解未來存在的巨大“期權價值”。 以 AI 程式設計為例:隨著模型能力的提升,我們認為潛在使用者群將顯著擴張,從 4,700 萬名專業開發者,擴展至全球 10 億知識工作者。參照過去 20 年視訊行業的演進,視訊製作門檻的降低催生了YouTube 和 TikTok 等超級平台,其商業模式也從簡單的 DVD 租賃/劇集訂閱,衍生出直播、電商、廣告等多種形態。我們認為 AI 模型開發商的長期經濟效益,主要取決於其能否在多輪技術周期中保持模型能力處於全球領先位置,而商業模式形態、部署方式及短期利潤率結構,很大程度上是該能力衍生出的下游表現。智譜和 MiniMax 均已展現出堅實的技術實力,二者只要能將其自研模型的性能保持在全球頂尖梯隊,那麼對AI 能力需求的巨大規模,疊加中國獨特的工程成本優勢,將支撐兩家公司營收走出強勁增長軌跡。在當前階段,智譜和 MiniMax 選擇了截然不同的 AI 能力變現路徑,反映出二者對市場機遇和風險的不同判斷——MiniMax 依託多模態 AI 原生產品矩陣和MaaS 平台,而智譜則聚焦通用大模型與智能體解決方案。然而正如我們強調的,在 AI 模型競爭的賽道上,模型本身就是核心產品,也是競爭優勢的主要來源,兩家公司似乎都走在正確的道路上,通過持續迭代模型能力以保持全球頂尖梯隊地位。雖然二者的整體商業化路徑不同,但正匯聚於同一核心賽道:通過向全球開發者提供 API 介面,實現其先進 AI 能力的商業化變現,其中程式設計應用已成為雙方重點聚焦和快速增長的關鍵領域。我們的單位經濟效益分析表明,API 毛利率主要由以下因素決定:1)單位推理算力的實際定價;2)以單次呼叫 GPU耗時衡量的推理效率;3)租賃 GPU 的使用率與容量管理;4)營收的地域結構。鑑於兩家公司均在穩步推進 API 業務向全球開發者擴張,我們預計,MiniMax 和智譜相關業務的收入結構將持續最佳化,利潤率也將快速提升。此外,智譜和 MiniMax 主要依賴租賃算力而非自建基礎設施,我們預計 2025年後算力相關成本結構將經歷顯著調整。雖然總算力消耗將隨商業化處理程序持續擴大,但訓練與推理的增長曲線和成本驅動因素將與 2022-25 年的擴張階段出現顯著差異:我們預計智譜和 MiniMax 的總算力成本在 2026-30 年將保持58%/65%的年複合增長率,而訓練成本佔比將大幅下降,從 2025 年的 93%/80%降至 2030 年的 32%/28%。智譜——技術驅動的 API 業務迎來拐點,私有化部署業務構築長期穩固基本盤智譜已確立深度企業級解決方案提供商的定位,專注於為 B 端客戶提供高定製化的私有化部署和 API 服務。我們認為,公司發展已抵達重要拐點:近期推出GLM-4.5/4.6/4.7 系列模型,戰略重心明顯向智能體化、生產級應用場景(尤其是在程式設計和多步驟任務執行領域)傾斜。這一能力演進軌跡得益於其業務架構:在中國受監管行業構築的長期穩固的私有化部署客戶基礎,疊加雲 API 業務的規模化拓展機遇;同時公司在可控但不可忽視的出口管制風險框架下營運。智譜的 API 業務迎來重要拐點。GLM-4.5/4.6/4.7 系列的發佈,連同公司戰略明顯向智能體系統、工具增強推理及面向開發者的基礎設施傾斜,表明其技術路線圖正與全球前沿技術能力維度對齊,特別是在生產級程式設計、長上下文推理和多步驟執行穩定性方面。隨著 GLM-4.7 在全球開發者社群(尤其是在高付費意願和使用強度的程式設計工作流領域)中獲得認可,我們預計其採用率將加速提升。私有化部署是國內市場的長期穩固需求。智譜已在國內受監管行業建立起可觀的私有化部署客戶基礎,我們認為這構成了長期穩固的需求池。隨著基礎模型的持續迭代,現有私有化部署基礎有望轉化為以更新驅動的、具備復購特徵的經濟模式。在此背景下,我們認為智譜是一個具備顯著增長潛能的技術能力驅動型平台,其營運面臨可控但不可忽視的監管風險。我們預計公司 2025-30 年營收年複合增長率為 127%,並將於 2029 年實現盈利。MiniMax——擁有可擴展增長引擎的全譜系 AI 企業在 AI 基礎模型領域,MiniMax 是罕見的兼具技術實力、多模態商業化潛力和全球可擴展性的企業。公司已建立紮實的技術積澱,其模型在核心基準測試中表現優異,同時其全譜系產品矩陣為 B2B/B2C 雙端變現奠定基礎。其全球化佈局(2025 年前三季度海外營收佔比已達 73.1%)進一步提升了規模擴張潛力與盈利能力。我們的投資邏輯基於以下兩點:全譜系模型支撐 B2B/B2C 雙端商業化。公司對文字、視訊和音訊多模態模型的同步佈局,使其能夠匹配企業與消費端日益多模態化的場景需求,降低了對單一變現路徑的依賴。MiniMax 實現了收入的均衡增長:2025 年前三季度,開放平台、生成式媒體和 AI 陪伴業務的營收佔比各約三分之一。這一結構降低了風險,並加速了規模擴張。全球化導向驅動規模與盈利:MiniMax 很早就確立的全球化導向(體現在客戶定位和基礎設施策略上),使其在發展階段類似的同業中具備稀缺的經濟靈活性。在推理成本高企、國內競爭激烈的行業背景下,進入國際市場、多元化的客戶群和差異化的定價環境,為公司提供了結構性優勢。雖然仍存在執行風險,但我們認為這種全球化佈局將增強 MiniMax 將技術進步轉化為實質性經濟效益的長期能力。我們預計公司 2025-30 年營收年複合增長率為 138%,並將於 2029 年起實現盈利。通往 1.4 兆美元市場(2030 年)的路徑及期權價值通過自下而上分析,我們搭建了嚴謹的情景分析框架以計算 AI 市場規模,結果顯示,至 2030 年 B2B 和 B2C 市場合計規模將超過 1.4 兆美元。其中 B2B市場規模約 1.1 兆美元,其結構性驅動力源於全球各行業的人力成本替代與生產效率提升;而 B2C 市場規模約 3,000 億美元,增長則由時間節約、便捷性及新型娛樂模式所驅動。該框架並非精準預測,而是基於當前已知變現路徑(主要為訂閱與 SaaS 定價模式)建構的基礎模型。本次研究最重要的投資啟示,不僅在於這些基準情景下的市場規模預估,更在於理解未來存在的巨大“期權價值”。 我們估算的市場規模面臨的下行/上行風險有:AI 推理的單位經濟效益波動,可能會衝擊 SaaS 式定價;AI 原生市場創造(類似於視訊行業演進過程中短影片的爆發)的潛力或被低估;僅聚焦軟體收入,或未能覆蓋廣告和交易價值向 AI 優先平台遷移的顛覆性變革。以 AI 程式設計應用場景為例:其市場規模的“期權價值”可從視訊行業的發展歷程中找到最佳參照。20 年前,視訊還是一種稀缺且高門檻的產品。分發大眾化、拍攝成本趨近於零以及基於演算法的分發管道這三次技術浪潮,推動內容創作者規模實現 200 倍的擴張,重塑了整個媒體行業格局,催生了 YouTube 和TikTok 等超級平台,行業商業模式也從簡單的劇集訂閱不斷創新,衍生出直播、電商、廣告等多種形態。我們看到 AI 賦能程式設計領域正湧現類似模式。當前的“副駕駛”(Copilot) 階段提升了專業開發者的生產效率,這是我們估算B2B 市場規模改採用的基準情景。然而,真正的期權價值在於從“副駕駛”向“創作者”的轉型——AI 技術降低軟體開發本身的門檻,解鎖一次性、高度個性化的軟體市場。這一路徑依賴的增長潛力意味著,我們當前預測的市場規模,尤其是在程式設計等領域,或許只是即將迎來供給側解放的龐大市場的冰山一角。B2B市場規模自下而上分析我們專有的自下而上分析預計,到 2030 年,企業級和專業級 AI 應用市場規模將達約 1.1 兆美元。該市場可分為兩大核心且互補的應用場景:AI 智能體/協作者(高價值替代型模式)和 AI 工具/副駕駛(更廣泛的增效模式),預計市場規模分別為 6,590 億美元和 4,560 億美元。受職業、地域和應用深度三大關鍵維度驅動,市場結構高度分層。價值集中於高技能、高成本的職業領域,即醫療、金融和法律行業的管理人員、專家和專業技術人員。從地域上看,我們估計美國是主導市場,憑藉高定價水平與高採用率,其市場規模預計佔全球總量的約 47%(其中智能體佔 3,060 億美元,工具佔 2,140 億美元)。中國憑藉龐大的就業基數成為第二大市場(智能體 1,470億美元+工具 960 億美元);而世界其他地區則受規模化發展和成本最佳化驅動,具備長期滲透機會方法論:精細化自下而上的市場規模建構模型我們對市場規模的估算基於一個精細化的自下而上模型,核心由三大元件構成:1)就業基數;2)滲透驅動因素;3)定價模型。此方法可提供透明且可論證的預測框架,具體如下:• 就業基數和細分維度:模型以全球職業勞動力為測算基礎,將其劃分為七大核心職業群體(如管理人員、ICT 專業人士、服務行業從業者等)及三大核心區域(美國、中國、世界其他地區)。這一細分方式考慮到,AI 的價值主張和滲透曲線在知識工作者與基礎崗位之間、發達經濟體與新興經濟體之間存在根本差異。• 分場景滲透驅動因素:針對兩大不同應用場景,我們的模型設定了不同的滲透率假設,以反映 AI 在各場景的融合深度差異:o 應用場景 1–AI 智能體/協作者:假設 AI 系統可自主完成任務,部分替代人力。考慮到該場景落地的複雜度與成本較高,模型設定的滲透率較為保守(例如,美國為 5-20%),且滲透率與 AI 所能替代的人力成本比例直接掛鉤。o 應用場景 2–AI 工具/副駕駛:假設 AI 通過輔助類軟體為人類賦能。由於其落地門檻和成本較低,且其核心作用是提升效率而非替代人力,模型設定的滲透率顯著更高(例如美國為 20-80%)。• 定價模型與價值兌現:各場景下的定價體系與 AI 創造的經濟價值高度繫結:o 對於 AI 智能體,其年度價格按各地區目標職業的年度人力成本的一定比例(約三分之一)測算,以此體現其人力替代或賦能的價值。o 對於 AI 工具,其單使用者年均收入(ARPU)按人力成本的較小比例(通常為 1-5%)設定,與軟體類效率提升工具的定價邏輯一致。B2C市場規模自下而上分析我們認為,面向消費端的 AI 市場規模相對較小,但結構迥異,至 2030 年其市場規模將達 3,000 億美元,驅動力更多來自時間節約、便捷性、情感價值和娛樂需求。核心變現情景包括通用 AI 助手、AI 陪伴/虛擬人、個人創作工具、AI家教/教練、健康/心理健康、效率提升類應用 ,AI 原生娛樂和遊戲等。市場規模估算的潛在偏差與未及之處本次市場規模分析是基於結構化情景假設的觀點,而非精確預測。其基礎是當前的商業模式、成本結構和使用模式;若其中任何一項發生重大變化,相關資料可能出現大幅變差。模型的核心風險並非隨機誤差,而是我們定價、需求與價值兌現分析框架中存在的系統性偏差。第一重也是最根本的風險,在於我們將 ARPU/SaaS 式定價假設應用於 AI 工作場景。傳統 SaaS 模式的邊際使用成本近乎為零;而生成式 AI 的每次token/API 呼叫均產生真實且波動的可變成本。若推理成本持續高企,供應商可能被迫限制使用量或維持高價,導致實際滲透率和/或利潤率低於我們的測算曲線。反之,若推理成本大幅下降,AI 技術可能被廣泛嵌入和捆綁至各類作業系統、裝置、雲服務、現有 SaaS 產品中,顯性 ARPU 極低,而商業價值將通過其他方式獲得。上述兩種情形下,簡單以“ARPU x 使用者數量”建構的預測模型,均可能錯估營收端的市場規模,且無助於分析利潤池的分佈。第二重風險在於市場創造和使用量爆發,我們的基準情景對此可能偏保守。雖然我們已考慮 AI 陪伴、AI 原生娛樂、長尾創作者等新增需求,但測算仍以現有消費品類的增量支出為錨點。短影片行業的發展歷程表明,生產門檻的急劇降低加上供需匹配最佳化,能夠催生全新的內容形態並帶來數量級的消費增長。AI 技術的潛力可能更大:不僅在於最佳化供需匹配,更在於規模化的個性化內容創作——使用者定製的、持續不斷的視訊/音訊/文字內容,AI 驅動的社交圖片,智能體營運的微型商業等。若其中任一 AI 原生形態能實現如短影片或移動社交般的規模化發展,那麼無論是消費端還是中小微企業驅動的 B2B 市場規模,均可能數倍於我們當前的估算。我們的框架還可能面臨變現結構覆蓋過窄、對廣告業態考量不足的風險。我們主要將 AI 視為一種工具來計量(SaaS、API、訂閱、佣金),而此前幾波網際網路浪潮中,廣告和效果類分發最終均成為核心收入池。目前我們僅通過行銷技術工具和 AI 購物助手等場景計算了部分價值,卻可能忽視了一種變化:AI 助手、AI 媒體流和 AI 陪伴產品或成為主要的注意力介面,大量廣告預算和贊助將轉向 AI 優先環境。那種情景下,AI 驅動的價值將有相當一部分被計作平台內“廣告收入”,而非“AI 軟體收入”,而我們當前估算的市場規模將會低估AI 在廣告經濟中的規模和戰略核心地位。與之相關的是,即使在廣告領域,我們的測算也隱含了一個類似 TikTok 的模型假設——即 AI 的核心作用是最佳化廣告供需匹配。而更具顛覆性的發展路徑是,AI 直接生成內容和廣告創意,並根據不同使用者和場景實現即時個性化定製。屆時,“內容”、“廣告”和“助手”的邊界將變得模糊:同一 AI 模型將同時完成文案創作、呈現形式、投放位置及周邊敘事。此種模式不僅能大幅提升廣告效果和可觸達支出,還將重構商業價值分配格局——現有平台、新AI 平台、模型提供商,智能體網路均可能成為價值兌現主體。而我們當前按細分領域自上而下的價值分配,尚未充分納入這種價值鏈重構帶來的影響。最後,我們對部分結構性不確定性僅作簡要提及。例如,B2B 市場規模測算以職業分類下的人數為錨點,這在早期階段合適,但在智能體之間自主交易、經濟活動規模與人類員工數量不再呈線性相關的場景下,該測算方式將系統性低估市場規模。此外,算力成本曲線和監管/地緣政治因素(如安全規則、資料駐留、出口管制),也可能導致實際結果顯著偏離基準情景。綜上所述,我們的市場規模測算應被視作一套嚴謹的基礎分析框架。若定價模型、市場形態、政策約束的發展與當前參考基準出現顯著偏離,實際市場規模將面臨顯著上行/下行風險。以AI程式設計為例——借視訊行業發展脈絡看市場規模的期權價值我們先前對 AI 程式設計市場規模的分析,主要通過“效率提升視角”,將其視為助力目前約 4,700 萬名專業程序/軟體開發者降低成本的工具。這一分析雖能支撐該領域的基準情景測算,卻可能忽視了其背後蘊含的巨大期權價值。通過觀察視訊行業過去 20 年的發展軌跡,我們發現了一個反覆出現的規律:技術的終極價值,不在於最佳化專業從業者的工作流程,而在於通過降低技能要求釋放大眾供給潛力。若 AI 程式設計遵循“視訊行業發展範式”,從精英技能轉變為通用素養,軟體市場的現有規模天花板將被打破。這一潛在的範式轉變,代表著一個“一次性軟體”新時代的“期權價值”——這是一個尚不存在,但具備不對稱上行潛力的市場。案例研究:過去二十年視訊行業的發展歷程20 年前,視訊行業的核心特徵是稀缺性。高昂的裝置成本和非線性編輯技術的陡峭學習曲線,將內容生產主體侷限於好萊塢製片廠和廣播公司。當時的市場聚焦於這一封閉體系內的漸進式升級(例如從 DVD 到藍光),未能將內容生產大眾化的可能性納入價值考量。然而,三輪技術創新浪潮的出現,系統性地消除了這些壁壘:• 分發環節:YouTube 等平台的出現,降低了分發成本。• 拍攝環節:智慧型手機的普及,讓實體拍攝成本趨近於零。• 工具與演算法:TikTok 演算法推薦等工具彌合了技能差距,將數十億消費者轉化為內容生產者。最終結果是,這場“供給側解放”不僅擴張了現有市場,更催生了一種全新的經濟形態。創作者數量從不足 100 萬激增至超過 2 億(增幅超 200 倍),視訊內容存量更是實現萬倍級增長,從 2005 年的數百萬條,增至 2025 年的每年超200 億條。因此,字節跳動等純科技平台得以崛起,企業價值比肩並最終超越了派拉蒙等傳統媒體巨頭。結論顯而易見:降低准入門檻所創造的價值,遠大於僅為既有從業者改進工具。此外,商業化潛力或許並不止於使用者規模的擴大。使用者基數的擴大,還能通過商業模式創新,推動市場規模實現二次擴張,且第二輪的規模可能更大。以視訊行業為例,市場規模的爆發式增長,並非僅因為更多人能夠上傳視訊,更是因為直播、電商、達人行銷和微交易等全新模式在 TikTok 和抖音等平台上的湧現。對 AI 程式設計市場擴張潛力的啟示當前 AI 程式設計市場正處於“副駕駛”階段,核心在於提升全球約 4,700 萬名程式設計師的生產力,這也是我們估算 2030 年該行業 1,640 億美元基準市場規模的核心依據。而關鍵的期權價值在於向“創作者”範式的轉型。正如視訊編輯工具從好萊塢製片廠普及至所有智慧型手機,AI 程式設計智能體有望將軟體創作的門檻,從編寫程式碼語法降至用自然語言表達意圖。這一變革或將推動相關使用者群體從程式設計師擴展至近 10 億知識工作者——潛在使用者規模實現 20 倍的擴張。這些新使用者無需具備專業開發能力,即可生成滿足日常需求的一次性、個性化或部門級程式碼。因此,投資者應將 AI 程式設計 2030 年預期 1,640 億美元的市場規模視為冰山可見的一角,而非其上限。然而,AI 程式設計要實現屬於自己的“TikTok 時刻”,模型/智能體本身必須實現從“提示詞補全”到 “意圖→設計→實施→驗證”全流程閉環的跨越。目前尚處萌芽階段,但視訊行業的發展脈絡,無疑為 AI 未來的發展提供了重要借鑑。中美AI分岔路:殊途同歸中美 AI 發展態勢往往以競爭形式呈現,但更準確而言,這反映了戰略重點及經營限制的差異,引領向截然不同但日趨關聯的發展路徑。• 美國的“拓展前沿”範式:OpenAI、Anthropic 和 Google 等公司擁護的美國路徑把絕對性能領先放在首位。其特點是海量研發投入、追求下一代架構突破,以 API 為核心的閉源商業模式為主。戰略目標是建立壓倒性的技術領先優勢,通過高利潤企業解決方案變現。這一路徑以基準測試壓倒性優勢以及開拓新的技術前沿為成功標準。• 中國的“效率至上”範式:在不同於美國的資本及半導體獲取環境下,以智譜、MiniMax 和 DeepSeek 為代表的中國路徑強調務實最佳化。目標是以估計成本的一小部分實現接近前沿的模型能力(約 90-95%)。這一路徑建立在極高的架構效率(如專家混合模型 MoE)、複雜的演算法最佳化以及對快速商業化落地及規模化部署的高度專注之上。這一路徑以卓越的成本性能比及採用速度為成功標準。這種發展態勢形成了一種不對稱競爭。美國生態追求通過根本性創新來引領未來,而中國生態旨在通過工程卓越和市場應用來實現商業化和規模化。這兩條路徑不是孤立的;中國的成本效益創新影響全球定價,而美國的前沿研究為全球產業設定了雄心勃勃的性能目標。中國內部角逐:從碎片化到高度集中化競爭國產大模型市場發生大變局。“百模大戰”時期的百花齊放在達到頂點後以行業急劇整合而告終。有能力訓練前沿規模模型的可信度高、資金雄厚的實體已經從 200 多家坍縮至可能不足 10 家有力爭奪者,僅留下少數佼佼者在戰場上。這一大浪淘沙反映了市場從潛力驅動向商業可行性及可持續單位經濟效益主導的轉變。行業格局已清晰分化為兩大往往互補的派系:• 綜合性科技巨頭:這一陣營包括阿里巴巴(千問)和字節跳動(豆包)等頭部企業,通過規模效應、海量內部資源以及與現有生態的深度整合來競爭。其戰略充分利用了龐大資本儲備、專有資料池及大規模原生使用者分發管道。• 獨立先驅:少數純粹 AI 公司佼佼者,包括智譜、MiniMax 和 DeepSeek,憑藉技術專長、敏捷性和專業化創新進行競爭。他們不具備巨頭的雄厚財務實力,在特定高價值領域開創出領先優勢:• 智譜在複雜推理和企業級部署方面建立了深厚專長。• MiniMax 在多模態生成及面向全球消費者 AI 應用領域處於領先地位。為什麼獨立基礎模型提供商可以保持結構性重要地位基礎模型之爭通常過分強調規模——資本、資料和基礎設施——而低估了激勵及客戶協同差異對長期結果的塑造。實踐中,獨立基礎模型提供商不會在廣度或分發上與超大規模提供商正面競爭。它們結構性佔據著截然不同的地位,隨著 AI 採用成熟,依然重要。雲整合是優勢,也是制約因素超大規模提供商理所當然地設計最適用於其自身雲環境的基礎模型。與專有基礎設施、資料服務和身份層的緊密整合增強了客戶留存及平台效益。對於完全依賴於單一雲的客戶,這可能頗具吸引力。然而,對於許多大型企業來說,這種整合也帶來了限制。多雲架構、供應商風險管理及長期成本考慮降低了模型和基礎設施之間深度耦合的吸引力。選擇獨立提供商通常不是因為它們在絕對意義上“更好”,而是因為它們允許做出獨立於雲策略的模型決策,這一特點在規模化之後愈發重要。變現激勵不同造成客戶關係差異。超大規模提供商和獨立提供商之間的關鍵區別在於基座模型如何變現及分發。超大規模提供商主要利用模型賦能內部 AI 產品並強化整體平台生態,API 作為支援生態系統擴張的補充管道發揮作用。獨立提供商通常通過 API、企業授權或私有化部署、以及選擇性 AI 產品等方式直接將模型變現。這些管道服務於同一個根本目標——最大化模型採用及利用——而不要求客戶繫結單一基礎設施或軟體生態。這種結構通常更能深度匹配建構專有 AI 應用的客戶。功能侵蝕風險在垂直整合平台上建構 AI 應用的企業面臨一項風險:成功的工作流程隨後可能被平台內化並作為競品重新發佈。這種風險可能阻礙核心任務使用場景深度依賴超大規模提供商模型。獨立模型提供商通過結構性中立來緩解這種擔憂。他們的業務激勵依賴於賦能客戶應用,而非與客戶競爭,從而降低感知到的戰略和執行風險。中國的生成式 AI 利潤池可能向平台巨頭傾斜全球投資者日漸認為生成式 AI 是一個“模型實驗室贏家通吃”的故事。媒體報導稱,OpenAI 正在探索為 IPO 鋪路,估值高達 1 兆美元,該估值參考了2025 年底年化經常性收入或達到約 200 億美元的預期。另外,有報導稱,Anthropic 正在尋求募資,隱含估值可能在 3,500 億美元左右。我們認可這些資料,因為它們為“為他人做嫁衣裳”之說立下了高門檻。不過,我們仍認為國內生成式 AI 的持久利潤池將高度集中於大型網際網路平台,尤其是騰訊和阿里巴巴,因為它們掌控著全國範圍層級的分發、變現通道以及高頻消費和商戶事務流。我們的這一觀點基於一個簡單的觀察:最有價值的“模型公司”越來越像平台,而非純粹上游供應商。當投資者投注兆美元市場時,他們往往押注的是消費者門戶、企業分發管道及開發者生態系統,而非僅僅是模型質量的邊際改進。這一邏輯在中國非常關鍵,因為騰訊和阿里巴巴已然擁有國內最強大的消費者及商家介面,可以將生成式 AI 嵌入既有介面,意向、轉化及定價權都是現成的。 (水木紀要)
日審4000張圖,月入超4000元,我在縣城給AI“打工”|新春走基層
當她在電腦螢幕前為AI模型標註資料時,她身邊的一切也在發生著改變。頭圖來源|受訪者2025年12月26日,西延高鐵宜君站正式通車,從西安北站出發,50分鐘就能抵達銅川市宜君縣。這是一座位於陝西省中部、人口只有2萬餘人的小縣城。宜君縣數字經濟創新中心位於縣城中心,外表與周邊並無二致——門前仍是土路,拉土車、大貨車穿行,揚起陣陣塵土。但推開玻璃門,彷彿進入另一個空間。進門是面記錄牆,圖文並茂地展示著宜君縣引進數字經濟的歷程。2019年,支付寶公益基金會和阿里巴巴人工智慧實驗室聯合中國婦女發展基金會,發起“數字木蘭”體系下的“AI豆計畫”人工智慧產業孵化項目,2020年10月,這一項目落地宜君縣,這也是銅川市首個數位化產業項目,由宜君縣愛豆科技有限公司營運。“AI豆計畫”帶來的資料標註工作,按件計酬,時間靈活,恰好切中了寶媽等群體的痛點。5年間,宜君基地從20人擴展至200餘人,80%以上為女性,其中絕大多數是寶媽或者留守婦女。朱小玲就是其中之一。公司工區按照項目劃分,“大模型”“螞蟻”“門店”“高德”等標識懸掛於不同區域,一排排工位整齊排列,每張辦公桌上配備顯示器。工區外設有“木蘭成長空間”,職工子女可以在裡面寫作業和玩耍,並有專人看護。攝影:施思羽朱小玲的工位在“大模型”區靠窗的位置,她穿著樸素的白色毛衣,頭髮紮成馬尾,面前的顯示器分割成多個窗口,手機裡釘釘消息的提示音不斷響起。她的目光在螢幕和筆記本之間切換,筆記本上密密麻麻記錄著當日待辦。2021年,朱小玲結束了5年多的漂泊與待業,成為當地首批人工智慧訓練師。5年過去,她從一名連線上文件都不會操作的新人,成長為管理30餘人團隊的項目組長;工資從最初的三千元不到漲至如今的四千元以上,在每月最後一天準時到帳。更重要的是,這份工作讓朱小玲第一次意識到:留在縣城,日子也能過得有盼頭。照顧家庭與自我實現並非不可調和。當她在電腦螢幕前為AI模型標註資料時,她身邊的一切也在發生著改變:外賣平台從一家增至數家,菜鳥驛站開到了小區門口,瑞幸咖啡正在裝修,高鐵通了,把曾經出走的人都帶了回來。如今的縣城女性,用最實在的方式,重新定義了“留守”和“出走”的邊界。人沒離開,但也沒被困住;照顧著家,也沒丟了自己。工作給予她們的,不僅是每月準時到帳的工資,更是“可預期”本身:可預期的職業發展,可預期的家庭陪伴,可預期的人生節奏。以下為朱小玲口述整理:從“照葫蘆畫瓢”到熟練“拉會對齊”從教機器“走一步”到“好幾步”2015年底,我22歲,在西安賽格電腦城做財務,月薪4000元。那是西安最繁華的電子賣場,我工作的聯想專賣店位於黃金位置,團隊氛圍好,每月發工資後都會聚餐唱歌。如果不是家裡父母年邁需要人照顧,我可能還在那邊。兩個姐姐都出嫁了,我是老小,父母說,“家裡有啥急事你半天回不來”。我掙紮了半個月。那份工作確實好,同事像家人,工資在西安也算體面。但父母養我們這麼大,就這一個心願,不回來,心裡過不去。2015年年底,我辭職回宜君,不知道等待我的是什麼。回到宜君後很迷茫,縣城太小,企業太少,體制內崗位基本要求本科以上,我大專文憑,只能報考偏遠鄉鎮。後來朋友介紹,找了份工作,但這份工作也沒能幹長久。老公開了彩票店又買了挖掘機,忙不過來,我只好辭職去幫襯。後來,中國福利彩票改革,最賺錢的“快樂十分”業務被取消,我們的店也關了。之後的幾年,我就一直在家帶孩子,偶爾打點零工。2021年1月,我在朋友圈看到一條招聘資訊:“招人工智慧標註師,學歷高中以上,會電腦即可,多勞多得。”是我姐轉發她熟人的朋友圈。之前在單位,活不累,但心累,人際關係複雜;“多勞多得”聽起來不用太多與人交集,幹好自己的活就行。於是,我就去面試了。走進辦公區,右側一排工位坐滿了人,螢幕上是密密麻麻的框線。我認出其中兩人是我姐的同學,她們當時已經入職兩個月了,給我介紹說:“挺簡單的,就是在電腦上框選。”我在後面看她們操作,滑鼠拖曳矩形框貼合土地邊緣——看起來確實不難。朱小玲 來源:受訪者我不知道這份工作能持續多久,更不知道“資料標註”究竟在標什麼。當時我填了報名表,留下畢業證、身份證複印件,回家等通知。一周後,電話來了:20人湊齊,可以開班培訓。2021年1月中旬,我參加培訓。幾乎全是寶媽,年齡從20出頭到40多歲不等,很多都是通過朋友介紹。培訓內容是視訊分類,判斷一段探店視訊屬於餐廳、花店還是茶飲。因為培訓要考試篩人,所以當時大家都特別認真,每個人都拿個小本記可多,想著考試的時候儘量不要出錯,可以一次性通過。兩周後,我正式上崗,面前是一台顯示器,任務是每天標註4000張圖片。最初接觸的是內容稽核類圖片,會有一些暴力、敏感的內容。第一天,同組有位男生直接就衝進洗手間嘔吐——畫面衝擊力太強,車禍現場的慘烈程度超出正常承受範圍。我也睡不著,閉上眼睛就是白天螢幕的圖像。但任務量也不等人:8小時工作制,平均每秒需處理七八張圖,各類圖片混著來。大家都覺得壓力大,每天4000張圖,精準率還必須特別高;每天要寫錯題分析,為何這麼做,你的理解是啥,為何會出現這種錯誤。有的同學早上7點多就來了,因為速度跟不上,效率、精準率都不行,一直要到晚上10點才能把一天的量練夠。這種狀態持續了一周多,後來和業務拉會答疑,每天整理幾次,拿不準的、浪費時間的圖就不判斷,直接整理出來,下午和業務老師對齊,慢慢大家速度就提上來了。當時並不理解這份工作,只當是“照葫蘆畫瓢”,直到2023年去杭州參加年會,在會場外的智能貨櫃前,我下意識掏出手機掃碼,看到旁邊人直接掃臉,櫃門就開了。我才反應過來是我們之前做的人臉框選的一個業務,被應用到現實了。剛開始做選擇題的業務比較多,光根據圖片、視訊選一下符合那個標籤就行。可能也要動腦子,但是不用過多動腦子。比如去框選寵物鼻子輪廓,選擇是貓還是狗、鼻紋是否被遮擋及遮擋程度,都是單項選擇。這些被標註過的圖片會被用來訓練AI模型,然後用到支付寶的寵物鼻紋識別上,類似我們人的指紋,可以對寵物身份認證和尋回。現在訓練機器人,需要多步驟操作,比如跳轉到指定App中找到某品牌咖啡,選擇特定品類拿鐵還是美式,指定糖度,有時還會需要用英文介面操作,逐步截圖示注路徑。之前只是教機器走一步就可以,現在可能要走好幾步,才能找到想要的那個東西,要告訴它應該怎麼走、找什麼東西,然後再接著走。剛開始做業務員的時候,我只會基礎的Excel操作,從未接觸過線上文件、釘釘會議等工具。第一次被要求建立線上文件彙總疑難問題,根本就不會,只能去百度上搜尋“怎麼建立釘釘線上文件”,晚上回家再對著電腦練習,連重新命名、換行等基礎操作都半天弄不好。第一次聽說“拉會”是業務方在群裡發過來一串會議號和連結,也不知道是啥,對著一通亂點。那邊同事在群裡問:“人都到齊了嗎?能開始了嗎?”入職半月,第三批新人報到,要從第二批員工中選拔培訓師。經理讓大家自薦,我站了出來,倒不是自信,只是這事“總得有人做”。第一次站在講台上,聽到自己的聲音都在顫,10分鐘後,緊張感才減少,開始演示操作。現在我帶的團隊有30多個人,印象深刻的帶團隊經歷,發生在疫情居家辦公期間。來源:受訪者當時有個大型項目面向四個基地招標,都是“AI豆計畫”的公益基地,宜君是其中之一。當時進行測標的是10萬條資料,測標通過率最高的基地可以得到兩年期合同。我們首批資料就返修了三遍,僅結算一遍費用,兩遍無償重做。又逢疫情居家辦公,團隊裡成員心態波動比較大:有人要照顧孩子上課,有人質疑“幹了可能沒錢”,也有人直接放棄。我每天給大家開一個線上的會議,把團隊裡大家遇到的問題整理出來,和業務方拉會對齊,會後又給大家同步下去。第二天早上8:30準時線上點名、拉會,鼓舞人心。我給大家講,現在這10萬條資料,我們已經做了兩遍了,兩遍我們都沒有過,那可能做第三遍的時候就過了,但如果現在不做了,給別的基地做了,人家把這個項目拿下,我們是不是很不划算?如果我們第三遍放棄的話,現在是輕鬆了,待在家裡天天看手機,但是疫情結束後,咱們沒有業務,拿啥賺錢?我們基地最終中標,換來了兩年的業務穩定與收入保障。作為業務員,我只需對當日任務量與精準率負責;而現在管著30多人的團隊,我要關注到每個人。如果有人連續數日產出偏低,我會私下溝通、針對性輔導;有人理解能力稍弱但態度認真,我也會在午休時讓她少休息一會,多加練習,不希望任何一個人掉隊。老公的變化也肉眼可見。婚前他連泡麵都煮不好,如今主動承擔做飯、輔導孩子、家務勞動。“你忙了我就多幹一點。”他認可了我這份工作的價值,我在家裡的“地位”高了不少,倒不是因為掙了多少錢,而是每個月那筆準時到帳的工資。這5年,我走的一直是宜君南街那條路。剛回來時,街上幾乎看不到年輕人。現在我們公司就有200多人,加上旁邊酒廠的年輕人,縣城有活力多了。路邊的商舖也變了,從破舊的門面變成高檔小區;我的通勤工具從步行變為電動車,有時11:50接孩子放學,11:45我出發,兩分鐘到校門口,12:00就能回到工位,全程不過10分鐘。我們公司剛成立時,好多人覺得可能不一定行,(人工智慧)這又是個新興的行業,不一定能幹下去,但沒想到我們一直幹了5年到現在。當時的心態是,能幹多久干多久,現在的心態是,公司不倒我不走。 (中國企業家雜誌)
春節 AI 模型大戰,誰是最大贏家?
國產大模型春節集體轉向「實幹派」,全球 AI 變革看北京。2026 年開年的科技圈,一場靜默的排位賽正在悄然改寫 AI 大模型世界的規則。1 月 27 日,月之暗面開源 Kimi K2.5,以「Agent Swarm」技術實現 100 個子智能體平行協作,將複雜任務執行效率提升數倍;2 月 7 日,字節視訊生成模型 Seedance 2.0 正式上線,憑藉多模態參考系統與原生音視訊同步能力引發全球創作者追捧;2 月 11 日深夜,智譜 AI 發佈新一代旗艦模型 GLM-5,在全球權威榜單 Artificial Analysis 中位居全球第四、開源模型第一。此外,阿里 Qwen3-Max-Thinking、DeepSeek-OCR2、生數、銀河通用、智源等模型也在同一時段密集亮相。海外廠商同樣動作頻繁。2 月 5 日,OpenAI 發佈 GPT-5.3-Codex 程式設計模型,並推出企業級 AI Agent 平台;同日,Anthropic 發佈 Claude Opus 4.6,不到半月後又推出定價更低的 Claude Sonnet 4.6 主攻智能體場景。諸神之戰,不一而足。幾乎所有公司都選擇在一個特殊的時間窗口登場——春節前後。傳統認知中,春節是使用者注意力分散、媒體曝光度下降的時段,並非科技產品發佈的黃金窗口。但 2026 年的這波集中發佈,恰恰利用了春節的場景豐富性:充裕的假期時間、家庭聚會、出行規劃、內容創作、社交娛樂。在全民行為高度集中的這一檔口,正是檢驗大模型能否從實際應用層面解決複雜任務的最佳測試時機。現在看來,這個時間節點絕非巧合,其背後的產業升級意義意味深長——這是國產大模型的一次集體轉型。在過去兩年,國產大模型更像是實驗室裡的「做題家」,核心解決的是使用者提問到模型作答的及時交付,比拚的是 benchmark 分數與響應速度;而這一波 AI 大戰,已經能夠清晰地看到,國產大模型正在向能真正處理複雜任務的「實幹派」轉變。模型不再滿足於給出答案,而是要獨立完成從理解需求、拆解任務、呼叫工具到交付成果的全流程。而我們發現,在這輪「實幹能力」的競賽中,一個值得注意的現像是,領跑者的地理坐標高度重合——它們大多聚集在北京海淀區。理解這種「海淀基因」,才能釐清國產大模型轉型的深層原因。01更加務實的智能軍團雖然這一輪國產大模型的集中發佈尚未結束,不過一個顯著的趨勢已經展現——更務實的評測維度正在取代傳統指標。過去對 AGI 的烏托邦式憧憬,正被算力成本與落地成效的硬約束快速拉回地面。無論是舊金山灣區還是中國一二線城市,資本與產業都已不再為單純的規模擴張敘事支付溢價——大模型正在從單純的技術探索,加速進入技術與需求雙向賽跑的商業化深水區。通俗一點來說,大模型不再只追求標準答案,更在考察在開放環境中的任務完成度,以及如何直接應用到普通人的生活中。此刻扎堆發佈的大模型,紛紛順勢而為。智譜發佈的 GLM-5 在這一輪的表現中頗為搶眼,其在 HumanEval 程式碼通過率達到 96.2%,不但超越前代 GLM-4.7 的 88.5%,更是超越了強勁的 Claude Opus 4.5(95.8%)。但比分數更重要的是,GLM-5 原生支援跨檔案程式碼重構,並能處理複雜系統工程程式碼倉。這意味著,智譜大模型已完成從「初級程式設計師」到「總架構師」的進化,重新定義了程式設計領域的生產力。而在過去專注「聊天」和提供情緒價值的字節,也同樣呈現務實轉向。以前做 AI 視訊,使用者得跟機器猜謎——寫一堆提示詞描述「夕陽下的古風少女」,結果出來可能是古裝也可能是和服。而在 2 月初發佈的字節 Seedance 2.0,則讓指向更清晰明確——用那個色調、某個角色的臉、那一段視訊裡的動作,甚至放段音樂讓它跟著節奏剪。這種多模態參考機制將創作主動權交還使用者,降低了反覆偵錯的試錯成本,使電商廣告、短影片製作等商業場景的產出更為穩定。也與海外模型形成對照:當 OpenAI 的 Sora 和Google Veo 2 仍主要依賴文字提示詞時,Seedance 2.0 將創作更貼近商業場景對確定性的需求。今年春晚舞台視覺《賀花神》的四季花神場景,正是該能力的落地展示——以四時花卉為主題,十二位演員對應十二種花神,每一個出場都伴隨著專屬場景。這背後正是字節大模型的圖像與視訊生成能力起到的作用,為節目定製「一月一人一景,一花一態一觀」的視覺效果。春晚賀花神效果圖打破邊界的,還有大模型的另一種存在載體——具身智能。1 月 8 日,銀河通用發佈多載機器人 Galbot S1,實現零遙操全自主作業,雙臂負載達 50 公斤。與特斯拉 Optimus 等海外人形機器人側重工廠場景不同,Galbot S1 的手腦協同設計更聚焦室內泛化能力——春晚上銀河通用與沈騰、馬麗的互動展示,正讓我們看到了機器人手腦一體的無限可能,未來無數室內場景的泛化能力正源於具身智能大腦模型的佈局。銀河通用春晚節目圖AI 從數字世界來到物理世界,大模型公司正在用一條相對紮實的路,在填補過往實用性不足的坑——聽懂人話、把事情幹成。這和人們通常所理解的商業溢價的區別是,AI 普惠化不是市場競爭手段,而是技術發展的目的。2025 年,國產大模型對行業標竿的理解發生了根本轉變。技術評測的領先僅證明能力上限,而商業價值的衡量標準已轉向規模化的可及性與經濟性——單位算力所能支撐的實際產出效率,成為更具份量的評判維度。市場端的反饋更為直接。經過兩年多的技術演示期,無論是企業還是終端市場,都在提出更為具體的需求:模型能否自動處理報銷流程,能否協調多個軟體完成市場調研,能否在無人監督的情況下執行周期較長的項目。大模型的實際執行能力已成為企業採購決策的核心考量,推動研發方向從追求技術突破轉向保障交付質量。春節場景為產品實用驗證提供了特殊環境。家庭聚會涉及菜譜生成、採購規劃、智能裝置控制等協調需求;長途出行需要整合交通預訂、酒店比價、行程最佳化等多平台資訊;內容創作則要求模型理解節日文化、平台調性及傳播規律。這些任務無法通過單次問答完成,需要模型具備任務分解、工具呼叫、異常處理及結果整合能力。2026 年春節的集中發佈,實質是廠商將產品置於真實場景的壓力測試,假期積累的使用者反饋將為後續產品迭代提供資料支撐。02 海淀基因當技術理想主義與商業現實主義融合時,「覺醒」往往發生在一片讓創新既能紮根又能拔節生長的土壤上。放眼全球,人工智慧的競賽早已超越單一企業的角力,演變為區域創新生態的系統較量。矽谷憑藉史丹佛-伯克利的人才輸送、風投體系的成熟配套、以及「快速試錯」的文化基因,長期佔據全球 AI 產業的高地。但 2026 年春節檔的集體爆發,清晰地顯示出中國創新版圖正在形成自己的「強節點」——北京海淀便是其中最具代表性的樣本。在這片 430 平方公里的地界上,創新的密度可以被具象化地測量出來,在這裡,15 分鐘車程幾乎就能構成一個創新單元——智譜 AI、百川智能、面壁智能……他們齊聚在清華科技園裡。往東一公里,生數科技在中關村東路 8 號東昇大廈探索多模態生成,與智源研究院的成府路 150 號(清華南門)隔街相望。往南一點,月之暗面在知春路 76 號京東科技大廈迭代長文字模型,與字節跳動的大鐘寺工區直線距離不到 3 公里——後者旗下的 Seedance 團隊正依託這片人才密度,在多模態視訊生成領域快速推進。更具縱深感的是人才的流動與重組。愛詩科技創始人來自字節視覺團隊,辦公室設在蘇州街,與原工區直線距離 2 公里;而銀河通用、星動紀元、靈心巧手三家具身智能公司,則集中在海淀區的核心地段,彼此車程都在 15 分鐘內,卻各自探索多載機器人、人形機器人、靈巧手等不同路線。這種集聚並非偶然,而是產業生態的必然結果。北京海淀,作為全國人工智慧產業的核心集聚區,其角色值得客觀審視——它並非簡單的「政策普惠」或「資本密集」,而更像是基礎研究到真實落地的完整鏈條。具體而言,海淀區已經建構了一個基本自主可控的全產業鏈技術體系,底層有清華、北大等高校的前沿研究輸出人才和方法論;中間層由晶片、雲端運算等基礎設施企業提供算力支撐;應用層則有大量場景型企業提供測試環境和需求反饋。這種密度使得技術迭代周期顯著縮短。生態的成熟度,直接塑造了國產大模型的差異化路徑。與矽谷巨頭追求「通用智能」的宏大敘事不同,海淀系企業更強調「垂直穿透」:在這裡,百度佈局全端、寒武紀佈局晶片、智譜清研專注 B 端、快手可靈偏向文娛落地、字節偏向 C 端、月之暗面偏向長文字思考。各尋其位,各盡其能。事實上,政策環境的演進同樣關鍵。2023 年,北京市率先出台地方性大模型產業支援政策,海淀區同步提出建設 2300 億元規模的核心產業叢集,配套人才落戶、資金扶持、場景開放等綜合措施。如今這一資料已經超過 3500 億。同時,海淀推出中關村科學城科技成長基金,經過三期發展規模已達 200 億元,明確將投資重心前移,聚焦早期項目、小型企業、長期價值及硬科技領域。這種「耐心資本」的供給,顯著改善了創新型企業的心理預期與風險偏好。但海淀的真正價值,或許不在於政策紅利的獨享,而在於其作為「創新方法論」的輸出地。從 2010 年代中關村的創業大街,到移動網際網路時期的「巨頭搖籃」,再到如今的大模型集聚區,海淀始終扮演著技術商業化「加速器」的角色。早期的網際網路創業培育了風險資本的敏銳度、工程師文化的務實性,以及對「快速迭代、小步快跑」方法論的路徑依賴。這些基因延續至今,使得中國企業在面對大模型這一顛覆性技術時,表現出更強的工程化能力和商業化嗅覺。AI 原點社區將視野拉寬,這種「強節點」的崛起並非孤例。上海的張江、深圳的南山、杭州的餘杭,同樣在 AI 產業鏈的不同環節都形成特色優勢——這些都是值得區域學習的樣本。但海淀的獨特性在於其「全端覆蓋」——幾乎每一環都有代表性企業佈局。這種完整性,使其成為全球 AI 版圖中少數能與矽谷形成系統性對話的區域之一。傳統認知中,技術創新高度集中於少數全球城市;但大模型時代的競爭,越來越依賴「資料-場景-算力」的本地化閉環。中國龐大的數位化應用場景、完整的製造業體系、以及政策驅動的算力基礎設施,為區域創新生態提供了獨特的養分。海淀的集聚效應,正是這種國家能力在微觀層面的投射。當全球大模型產業進入「實幹能力」的比拚階段,區域生態的質量將直接決定企業的競爭力上限。03更好的時代所有技術革命的最終走向,一定承載著產業實踐的階段性註腳。這場集中爆發的轉型給產業和區域都提供了新的機會。春節檔的 AI 大戰,標誌著國產大模型進入產業價值驗證的關鍵周期。短期內,市場將迎來一次實幹能力的集中檢驗。期間積累的真實使用者資料與實際交付體驗,將幫助企業精準識別產品短板,加速迭代最佳化。例如,多智能體協作的穩定性、長視訊生成的時序一致性、複雜程式碼重構的可靠性等問題,只有在海量真實互動中才能充分暴露和修正。但大模型軍團現在的表現,已經影響深遠——目前,OpenAI、Google 等巨頭紛紛調轉船頭,開始密集推出針對企業級市場的高性價比推理模型。很長時間以來,全球人工智慧的聚光燈多投在矽谷。而 2026 年這個乍暖還寒的春天,分水嶺已經有了能捕捉的痕跡——算力封鎖沒有擊垮國產大模型,反而帶來了一抹得天獨厚的韌性。AI 製圖這註定是一條長期主義的道路,但不妨礙國產模型技術迭代節奏持續加快,產品更新周期從以年為單位縮短至以月甚至以周計算。這種敏捷響應能力的形成,客觀上為中國人工智慧產業提供了彎道超車的窗口期。而從管理者的角度來看,當大模型從「對話工具」進化為「數字員工」,「人」的身份也將發生變化,其社會影響將呈指數級放大——對於所有區域性政府而言,都需要在新階段裡尋找定位——這要求政策層面在持續降低創新成本的同時,建立適配新技術形態的治理框架。而經驗老道的管理者,顯然能更快提供合格的樣本。至少,站在 2026 年的端頭,國產大模型發展的重要節點。人們已經可以確定,全球新一輪大模型產業變革的方向與節奏,正日益取決於中國創新體系的突破能力與本土生態的支撐強度。 (極客公園)
Anthropic發佈新AI模型:操控電腦能力大幅提升;微軟本十年末前將向全球南方AI領域投資500億美元丨AIGC日報
1.【Anthropic發佈新AI模型:操控電腦能力大幅提升】Anthropic PBC發佈名為Claude Sonnet 4.6的人工智慧(AI)新模型,可以執行需要多個步驟的電腦操作,例如填寫網頁表單,然後跨多個瀏覽器標籤頁協調資訊。Anthropic 在一篇部落格文章中寫道:“在操作電腦方面,該模型當然仍落後於最熟練的人類。但儘管如此,其進步速度依然驚人。”Anthropic表示,Sonnet 4.6在抵禦提示詞注入攻擊(Prompt Injection Attacks)等安全威脅方面表現更好,這類攻擊是指通過惡意指令操控AI模型。(新浪科技)2.【印一大學被曝買中國機器狗冒充自研,校方承認:從宇樹採購的】印度人工智慧(AI)影響力峰會於16日在新德里開幕,為期五天,該科技展會由印度電子和資訊技術部主辦,號稱“有史以來規模最大”。展會期間,加爾戈蒂亞斯大學團隊展示的所謂自主研發的機器狗,被發現其實是買來的中國企業現成產品。 當地時間2月18日,這所大學在社交平台X的官方帳號發聲明承認,展示的這台裝置確實是從中國企業宇樹科技採購的。(環球時報)3.【高通將向印度人工智慧戰略基金投資至多1.5億美元】根據一份聲明,高通公司計畫投資高達 1.5 億美元,以支援印度不斷擴大的科技和人工智慧初創企業生態系統。資金將通過高通創投(Qualcomm Ventures)投向處於各個發展階段的初創企業,重點在於汽車、物聯網、機器人技術和移動領域的 AI 應用。(介面新聞)4.【微軟本十年末前將向全球南方AI領域投資500億美元】微軟在印度人工智慧影響力峰會上宣佈,計畫在本十年末前投資500億美元,助力將人工智慧技術推廣至全球南方各國。微軟這項旨在發揮AI影響力的五大計畫包括:建設人工智慧普及所需的基礎設施;通過技術與技能培訓賦能學校及非營利機構人員;強化多語言、多元文化的人工智慧能力;推動滿足社區需求的本地人工智慧創新;評估人工智慧普及情況,為未來人工智慧政策與投資提供指導。 (創業邦)
華爾街日報:AI 模型 Claude被美軍用於抓捕馬杜洛的行動中
《華爾街日報》日前引述知情人士說法報導,美國軍方在執行抓捕委內瑞拉前總統馬杜洛的行動中,使用了 Anthropic 的人工智慧(AI)工具Claude,此舉凸顯 AI 模型逐漸在五角大樓獲得採用。上個月,美軍在一場計畫已久的突襲行動中逮捕馬杜洛(Nicolas Maduro)與他的妻子,馬杜洛被押至紐約,將面對販毒指控。《華爾街日報》指出,Claude之所以能在這次行動中部署,是因Anthropic與資料分析承包商帕蘭泰爾技術公司(Palantir Technologies)的合作。帕蘭泰爾技術公司的平台受到戰爭部與聯邦執法機關廣泛應用。報導指稱:Anthropic是第一個被五角大樓用於機密行動的AI模型開發商。在這次委內瑞拉行動中,也可能使用了其它AI工具處理非機密任務,這些工具的應用範圍廣泛,從彙總整理檔案到操控自主無人機等都涵蓋在內。不過,對於華爾街日報的上述報導,路透社無法立即核實報導內容。美國國防部、白宮、Anthropic與帕蘭泰爾技術公司也尚未回覆路透社的置評請求。而同時,路透社報導則稱,五角大樓正在敦促包括OpenAI與Anthropic在內的頂尖AI公司,開放AI工具能在機密網路內運作,並取消許多對使用者施加的標準限制。據瞭解,許多AI公司已在為美軍定製客制化工具,但大多僅能在軍方行政用途的非機密網路上使用。Anthropic是唯一能透過第三方在機密環境中使用的公司,不過政府仍須遵守Anthropic的使用政策。而Anthropic的使用政策明定禁止將Claude用於支援暴力、設計武器或進行監控。Anthropic在最新一輪融資中籌集300億美元,目前估值達3,800億美元。這是全球科技史上第二大規模的私募融資,僅次於 OpenAI 去年的 400 億美元的融資。財經分析就此指出:資本正在集中流向最有可能率先實現 AGI 的公司。據瞭解,當前,創立三年的Anthropic年化收入為140億美元。 (芯聞眼)