#生成式AI
李飛飛最新訪談:這,才是下一個10年
筆記君說:在AI浪潮席捲各行各業的今天,每一位企業家和創業者都面臨同一個問題:未來的機會究竟在那裡?被譽為“AI教母”的李飛飛,在前兩天的一次深度對話中,給出了她的答案。以下是李飛飛這次訪談中的自述部分,希望她的這些話,對你有所啟發。一、“空間智能”是AGI的一把關鍵鑰匙1.世界遠不止語言那麼簡單我先說一下我的信念:在技術上,確實有一些相通的概念,所以我也能理解有些人說“語言即世界”。宏觀地來說,我堅信這個世界遠不止語言那麼簡單。如果我們說的語言概念,指的是那種離散的、本質上更偏向“一維”的資訊——即便它能表達多維的內容,語言本身的呈現形式還是比較一維的。但這個世界其實要豐滿得多。我一直強調,空間智能包含諸多特性,比如物理屬性這些,都是超越語言範疇的。而且不管是人類的行為,還是大自然的運轉,很多東西既沒法用語言完全表述清楚,也不可能單靠語言就實現所有想做的事。我們每天睜開眼,從生存、工作、創造,到感受、感知,再到人與人之間豐滿的情感,這些日常裡的種種,從來都不是只靠語言就能完成的。當然“語言即世界”這樣的話確實挺好聽,聽起來也沒錯,因為它是非常籠統的一句話。當你一句話很籠統的時候,它可能錯不了。但從技術層面看,現在數位化是必然趨勢:視覺模型、空間智能、機器人模型,本質上都會走向數位化。可要是把數字和語言完全畫等號、當成一回事,那這個概念就變味了。如果連數字都能被叫做“語言”,那相當於啥都能往“語言”裡套,這就沒什麼好爭論的了。在我看來,資訊遠不止語言這一種,還有空間資訊,它和語言一樣美妙、一樣重要。2.“空間智能”到了爆發前夜現在AI大環境裡,大家對AI的期待確實有點太激進了。但我可以告訴你,我選擇創業的核心原因,就是覺得時間點到了。畢竟創業和搞科研不一樣,創業得緊密結合市場、尊重市場規律。但就像很多比我優秀的企業家說的,創業最關鍵的是踩準時間點——不能太早,市場和技術都沒成熟;也不能太晚,否則就沒了機會。空間智能技術在World Labs(中文名:空間智能)剛成立時,確實還早了點,但也沒早到需要等五六年、十年的程度。我判斷未來一兩年,它會迎來爆發式增長。你看現在視訊生成技術的飛速發展,再到我們做的World Models,我堅信這類技術在一兩年內還會有質的飛躍,市場應用的可能性也越來越清晰。我沒法簡單定義現在發展的速度是快還是慢,但能肯定的是,現在正是做空間智能的好時機。我們現在做的“世界生成”(world generation)模型,真的特別令人激動。它的應用場景太廣泛了——從數字創意、遊戲開發、影視製作、設計領域、建築行業,到VR、XR、AR技術,再到機器人模擬,每一個大領域裡又能細分出無數小場景。而這些場景,其實都藏著對三維空間的強烈訴求。生成式AI有個很特別的價值:它能降低原本高難度事情的門檻,進而打開很多你意想不到的新市場。生成三維空間就是件超難的事——這個世界上沒多少人能做到,而且用到的Blender、Unity這類工具,操作起來特別繁瑣。我自己試過,頭都大了。其實很多創作者腦子裡裝滿了好想法,只是被工具卡住了,而非缺乏創意。而AI既能給現有創作者賦能,還能讓很多原本覺得“這事跟自己沒關係”的人,發現新可能。就像我,以前根本不會碰Blender、Unity這類軟體,覺得又麻煩又費時間,但現在AI能賦予我這種能力,我肯定願意用——它能帶來太多新靈感、新機會了。所以我覺得三維世界模型特別讓人興奮:它原本是件對普通人來說難度極高的事,而AI能降低這項能力的使用門檻,這本身就是打開市場的絕佳機會。在我看來,沒有空間智能,沒有三維世界的生成式模型,就談不上AGI(通用人工智慧)。AGI就像一扇門,上面掛著好多把鎖,需要不同的鑰匙去開啟。我始終認為空間智能是其中一把關鍵鑰匙——不過這扇門並非非開即關,而是被一點點推開的。其實我一直不太糾結AI和AGI的區別。因為兩者的夢想是相近的,都是源於一種“科學”的好奇心:機器能不能思考?能不能自主完成事情?這是AI最初的夢想,AGI的目標似乎也沒偏離太多。不管叫什麼,這個夢想都得一步步實現,我們每往前走一步,就離它更近一點。而空間智能,必然是通往這個夢想的重要一環。不管是賦能人類的創造力(從遊戲、設計到工業應用),還是給機器人賦能,亦或是元宇宙、AR/VR的內容生成與落地,都離不開空間智能。3.演算法與資料,都是AI的核心工程、數學的發展路徑和進化的路徑是不一樣的,這就像蘋果和橘子的比較,它們的進化都是很慢的。進化的迭代速度遠慢於演算法迭代,而且碳基與矽基的運算邏輯也大不相同,所以從時間維度來看,兩者沒法放在一起比。但即便如此,進化依然給了我們很多啟發和靈感。這就說到資料的重要性了。當初我們實驗室提出“資料”相關概念,其實也借鑑了不少進化的思路:漫長的進化歲月,本質上就是一段巨量資料訓練的過程;但到了數字時代,我們不用再等幾十億年去收集資料,而是可以大規模、快速地積累資料。和大自然通過進化完成的“資料積累”比起來,我們現在一次能處理、看到的資料,可能相當於進化幾千萬年才沉澱下來的量。相信自己深思熟慮後的假設,也不是什麼怪事吧?走在科學路上,對於那些經過深度思考的假設,你總得有所堅信。但作為科研人,也得清楚有些假設註定是錯的——我當然也有過很多失敗的假設。而我現在堅信的這個假設,是琢磨了很久才得出的:它在數學上是歸納推理的邏輯。我整個博士階段都在做模型、搞演算法,積累了不少領悟,才慢慢意識到這一點。說白了,AI到今天在數學層面的核心,就是“泛化”(generalization)——本質上就這一件事。而泛化怎麼實現?核心就兩點:演算法和資料,而且兩者息息相關。演算法太複雜但資料不足,會過擬合(模型在訓練資料上表現優異,但在面對新資料時性能顯著下降,無法有效泛化的情況);資料太多但演算法不夠好,同樣會過擬合——這裡面藏著明確的數學邏輯。我算是電腦視覺領域早期做機器學習的那批博士生,很幸運的是,我的博士研究剛好趕上電腦視覺的轉折點——我們大量運用機器學習的理念,這讓我對“泛化”的理解更深刻(當然,不一定只有我理解得深)。但我那時候就明確看到了資料的重要性,所以一直堅持了下來。這又回到了好奇心的話題——那個求證假設的過程其實挺有意思的,全程充滿激情,就像一路打怪升級。只要沒被“妖怪”打敗,就接著往下打唄。模型和資料的關係,本質是螺旋式上升的。當年,ImageNet搭建起電腦視覺領域最大的資料庫,直接推動了電腦視覺的蓬勃發展;後來網際網路催生了海量自然語言資料,大語言模型也跟著迎來爆發;再看現在的視訊模型發展得這麼快,核心也是有足量視訊資料支撐;自動駕駛能飛速進步,也離不開頭部公司積累的海量路況、行駛資料。現在看似“又回到了資料和演算法”,其實根本算不上“回歸”——它們從來就沒離開過AI的核心。我有時候覺得挺有意思:就算AI發展到今天,大家還是更看重演算法。但真正做AI的人,不管是創業者還是大公司從業者,心裡都清楚:資料不是說比演算法更重要,至少是同等重要。演算法聽著更“酷炫”,資料的價值反而容易被忽視。但實際上,資料本身就是一門科學。4.空間智能,賦能於“機器人”的發展① 自動駕駛,是簡化版的世界模型自動駕駛汽車其實就是機器人——它是人類最早量產的機器人,但其實挺侷限的。你想啊,它就是個方盒子,基本只在二維路面上活動,只要別碰到別的東西,不管是車、行人還是路邊設施。但我們未來要做的三維機器人不一樣:它得在三維世界裡主動“碰”各種東西,幫我們洗碗、做飯、疊衣服。這麼一對比,就知道自動駕駛汽車其實還是挺簡單的機器人。所以對應的,它的世界模型也更簡單——畢竟要做的事兒就那麼點。當然我不是說自動駕駛不厲害,特斯拉、Waymo(全球自動駕駛標竿,前身為 2009 年Google自動駕駛項目)這些公司都很了不起。但從科學和宏觀的角度看世界模型與機器人技術,這頂多隻是個開始,接下來要做的事情複雜多了。我無法斷言特斯拉有沒有(世界模型)相關佈局。但至少不會是一個強生成性的模型,畢竟業務場景本身不需要這件事。但機器人不一樣,機器人訓練離不開生成式模型——你不可能收集到足夠多的真實場景資料。而且我們做的事情都和創意、設計相關,這些本身就需要生成能力,“生成”本身就是核心應用場景之一。② 機器人的三維能力,還在早期階段現在矽谷的機器人領域大火,我也特別喜歡這個領域,也一直很看好機器人的前景。但同時,我也覺得要保持冷靜:機器人研究其實還處在早期階段。首先,最核心的問題是缺資料。汽車行業發展了幾十年,還有無數人在開車過程中持續蒐集資料;可機器人目前基本沒有商業化應用場景,尤其是日常消費級場景,資料自然難收集。而生成式AI的出現,給機器人領域帶來了一條有意思又有前景的出路。像視訊生成這類技術,不僅提供了豐富的訓練想像空間,還能用於擬態——比如我們正在做的機器人模擬,就特別有前景;甚至在推理階段,還能用視訊模型輔助線上做規劃。可以說,正是機器人周邊領域(比如生成式AI)的快速發展,在反過來帶動機器人技術進步,這一點確實讓人激動。但機器人要真正實現商業化,還有一段路要走,尤其是日常消費級機器人。不過工業機器人早就落地了,畢竟它的應用場景相對單一,容易約束環境,而且也積累了不少資料。自動化駕駛和機器人兩者之間,既有可比性,也有不可比之處。自動駕駛從概唸到商業化,走了近20年:Google2006年就成立了小型自動駕駛研發團隊,直到2024年Waymo才正式上路。汽車行業的供應鏈、OEM體系、客戶場景都非常成熟,這一點讓自動駕駛的商業化比機器人快得多;但當年AI技術不成熟,自動駕駛在AI這條路上走了很久,而現在AI的發展速度肯定會更快。可除了工業機器人(或者說場景單一、易約束的工業機器人),目前並沒有像汽車那樣成熟的機器人應用場景。所以機器人商業化之路會比20年快,還是更慢,真的很難說。但我相信,AI層面的進展會比當年自動駕駛時期快一些;可反過來,機器人面臨的問題也更複雜——它要應對的是完整的三維世界。AI已經能做到非常出色,可要說今天的空間智能,能達到人類睜開眼就有的那種對三維世界的深層理解,還差得遠。比如物體間的物理關係、材料屬性、物理特性,這些我們人類能直觀感知的豐富資訊,AI還沒法完全掌握;更別說對社交資訊、人與人之間情感的理解,這些都屬於視覺理解的範疇,而我還沒提語言層面的複雜認知。人類本身就是極其複雜的存在。所以從進化和能力來看,AI在某些方面已經追上甚至超越人類,但在很多核心維度上,還遠遠不及。而且我作為深耕AI和科技領域多年的人,對空間智能的信仰,絕不是盲目崇拜。它源於對技術的深刻理解,源於這麼多年在這個領域的深耕,也源於我和同事們看到的技術機會與發展方向。創業確實需要情懷,但對科技趨勢的判斷,更需要紮實的邏輯和科學的判斷。二、AI的未來:人類有責任讓其“向善”1.機會,並非贏家通吃綜合來看,資料、算力、人才的整合能力很關鍵——現在能做好這些資源整合的公司,存活機率和勝率會更高。但我覺得,不能只盯著這些顯性因素。畢竟顯性因素一眼就能看到,也容易被大家熱議追捧,但光靠這些遠遠不夠。舉個簡單的例子,在AI coding領域,微軟應該是第一個下場的,推出了Copilot(微軟推出的跨平台生成式 AI 助手)。它可謂佔盡了天時地利人和:手握所有資源、坐擁現成場景,連GitHub(微軟旗下的開發者平台)都是自己的。可微軟最終沒能成為行業標竿,反倒是矽谷現在火起來的Cursor、Claude Code這些小公司,在巨頭圍剿下實現了突圍。這就說明,光有顯性因素根本不夠。如果大家都只盯著這些表面資源下判斷,很容易出現偏差。人類歷史上,從來沒有那個時代是大公司獨霸天下的——即便每個時代的大公司都手握超強的資源整合能力。所以這裡邊還藏著更關鍵的東西:創造力、機遇、執行力,還有對時間點的把握,這些都是決定成敗的核心變數。再加上,AI本身就是一門橫向技術,能催生出無數應用級機會,大公司根本做不完。這些機會,恰恰給了小公司足夠的空間:把某個應用做到極致,慢慢撕開市場缺口,完全有可能實現彎道超車。2.AI只是工具“AI是工具”,這其實是常識。工具本就是雙刃劍:人類史上所有工具,小到最初的火、石斧,大到核彈、生物技術,再到如今的AI,無一例外。我當然也認為,工具的使用必須向善,但同時也要防範它被誤用,不管是有意還是無意。所以我覺得,兩種極端都不理性:只追求發展而無視安全與向善,必然是災難;但天天空談倫理向善而停滯發展,也會錯失技術帶來的諸多福祉。就像做父母,你會教孩子用火做飯吧?既要告訴他們火能做飯的好處,也得讓他們知道用火的危險,這是再簡單不過的道理。AI既是權力的工具,也是向善的工具,但它永遠只是工具。在我看來,這工具會越來越強大,但在它真正不可控之前,它始終屬於人類——人類有責任讓它保持可控。但就像所有工具一樣,我們從來不會指望工具自己明白該做什麼:向善與否,本質是人類的責任。所以對AI的控制與引導,是法律、制度、教育和整個社會的共同責任。不同社會、不同個體或許有差異,但這份責任終究在人類身上。3.教育體系,到了徹底變革的時刻AI時代迫切需要我們更新教育理念和方式——既要讓孩子們學會用這個工具,借助它賦能創造力、助力學習;也要讓他們清楚工具可能存在的問題與風險。而且這絕不僅僅是教育孩子的事。我們總覺得該教育孩子,殊不知最需要被教育的其實是成年人自己。所以,自我教育、面向公眾的科普、給政策與法律制定者提供充足資訊和學習機會,這些都至關重要。說到底,對AI的發展與治理,本質上就是我們人類自身的學習、發展與治理——核心還是人的問題。在這個AI成為具備智力能力的工具的時代,它帶給我們的最大啟發,或許是讓我們更好地瞭解自己、治理自己——這裡的“自己”,既包括每個個體,也包括人類群體。現在關於AI的討論沸沸揚揚,大家都熱衷於談論這項技術。但說到底,不管是個體人性還是群體人性,欠缺的或許還是那份自省吧。對個體來說,時代正在劇變,再做“鴕鳥”逃避現實絕非明智之舉。這種變化必然帶來工作形態的重塑。任何重大科技革命都會引發職業變遷,有時是短暫陣痛、軟著陸,有時可能伴隨社會動盪。作為個體,還是要保持好奇心——對生命、對世界的好奇。那怕這份好奇心,在成年人的世界裡源於對未知的恐慌也沒關係,至少它能成為驅動你主動學習的動力。這一點,值得每個個體自省。而從群體層面來看,AI時代最急需革新的,是我們的教育體系。不管是國內的K-12教育,還是美國這邊雖不唯應試但仍包含應試、仍側重“知識填充”的教學模式,都亟待更新。AI正在不斷證明,很多事情機器能做得更好。如果還讓人類花十幾年、幾十年時間,去重複大半機器可替代的工作,無疑是對人類潛能的浪費。所以我特別想呼籲:所有關注教育、能影響教育政策以及踐行教育的人,都要牢牢抓住這個時代機遇。我們的教育方法論,已經100多年沒有本質變化了。我最大的期待是,100年後歷史學家回望21世紀上半葉時,會看到人類完成了一次真正的教育革命。借助AI賦能教育者與學生,把節約下來的大量時間和精力,讓學生們在老師的引導以及自我探索中,去積累那些AI永遠做不到的認知與核心能力。人類的潛力其實無比巨大,每個個體都是如此。我們的大腦遠未被充分開發,不管是作為個體還是群體,都還沒發揮出全部潛能。你只要看看人與人之間的能力差異,就能感受到這份潛力有多驚人:有些人展現出的能力,簡直像“超人”一樣。這說明,這種極致的潛能本就藏在人性之中,只是大多數人都沒能把它激發出來。而AI這個工具的出現,甚至它對人類工作帶來的衝擊,恰恰給了我們一個契機——重新審視並重構整個教育體系。我覺得真正的教育變革,應該打破工科與文科的固有界限:畢竟AI能讓所有人都學會程式設計,那這些人還能簡單歸為工科生嗎?AI也能幫更多人更好地感知美、讀書、作詩,文科的邊界也被打破了。所以,以前的分科邏輯完全可以改變——AI給了我們打破這種侷限的機會。但說到底,關鍵還是人怎麼使用這個工具。我最擔心的,是人類會放棄自我:覺得“AI這麼聰明,有沒有我都一樣”,這種想法太可怕了。“躺平”這個詞很形象,但背後的心態真的危險。人類有太多未被發掘的潛力,有太多創造世界的可能,有太多讓這個世界變得更美好的機會。而AI,終究只是一個工具而已。如果我們放棄了自身的能動性(agency),就等於放棄了改變自己、改變世界的好奇心與動力。說實話,我真的不懂什麼叫“AI就是世界”。就像有人說“一花一世界”,我能理解那份意境,但“AI就是世界”的說法,我實在摸不透它的核心含義。其實“AI只是工具”這句話的背後,本質是我們如何看待AI與人的關係——把AI當工具,意味著人類始終把自身放在更重要的位置,意味著我們更該關注自我的成長與價值。說到底,“AI是工具”這句話裡,藏著我對人的信仰——我信仰人性的潛力,信仰人類社會的韌性,我信仰的是人,而不是AI。尾聲李飛飛,是對技術趨勢的清醒判斷者。AI,是我們這一代人此生最大的機會。她說,AI時代,人類迎來一次教育的革命,從知識性教育到技能型教育,到認知結構,到人本身的教育,都可以改變。正是在這個時代背景下,筆記俠推出了中國首個面向企業家的AI時代PPE(政治、經濟、哲學)底層認知課程。以AI時代為背景,通過人工智慧科學、AI文明、經濟學、政治學、哲學、智能商業等視角,從底層把握AI時代,激發創業者們在AI時代的潛力,培養能駕馭AI範式轉移的決策者。如何擁抱AI時代,需要理解那些?要理解技術。人工智慧必然重構人類社會的底層邏輯。成為新人類,是決策者的宿命。要理解商業。當AI成為核心生產要素,企業的價值創作邏輯和增長範式會發生根本性變化。要理解世界。在波譎雲詭的世界中生存發展,決策者需要深刻理解AI時代下國際政治經濟體系運行的規律和趨勢。要理解中國。中國走向現代化的道路,必然建築在中國的文化基因上,理解中國才能穿越宏觀周期,活在中國,贏在中國。要理解自己。活出內心的自由和篤定,不被AI時代外界的震盪所撼動,決策者才有心力成為企業的定海神針。這,就需要回到決策的源頭:AI技術與文明、哲學、政治、經濟,重構我們的底層認知邏輯。我們一起做AI時代保持清醒和篤定的決策者。 (筆記俠)
中美領跑全球AI,瑞銀:海灣地區的力量亦不可忽視
中美主導全球生成式AI早已成為不爭的事實,但其他國家也並非都是陪跑角色。瑞銀近期發佈一份研究報告,稱海灣地區憑藉低成本高韌性電力接入的適宜土地,以及支援推理設施建設的強力政策,正成為全球資料中心開發的核心優選區域。據瑞銀測算,在完全折舊的前提下,電力成本佔資料中心整體物料成本的5%-10%。海灣地區充裕的電力容量使其成為建設AI推理設施的低成本區域。此外,海灣地區發展動能正逐步積聚:與超大規模雲服務商、晶片製造商的數吉瓦級合作已逐步落地,貿易限制持續放寬,電網升級計畫與國家級戰略穩步推進,同時終端與企業側對AI推理的旺盛需求,共同構築了良好的產業發展環境。不過,鑑於地緣政治重要性與敏感性,瑞銀判斷用於預訓練的超大型資料中心園區仍大機率保留在美國。Part.01 AI縮放定律近年來,AI資本開支規模與投入強度的大幅增長,源於模型智能度與算力/資料規模的強相關性,這一規律被稱為AI縮放定律。在過去的深度學習時代,該定律發生了範式轉變:更大規模的資料集、高性能硬體及演算法最佳化共同推動算力需求激增。據EpochAI資料,2010-2024年,AI訓練所用算力呈指數級增長,每6個月便實現翻倍,遠高於20世紀50年代機器學習系統誕生初期超20個月的翻倍周期。與此同時,每一輪算力擴容都伴隨能耗的顯著攀升。新一代晶片的單GPU功耗持續走高:輝達晶片的最大功率需求已從安培架構的400瓦,提升至霍珀架構的700瓦、布萊克韋爾架構的1200瓦,預計魯賓架構將達到約1800瓦。除單晶片功耗外,算力叢集規模的擴大進一步推高整體能耗;儘管硬體能效提升可部分抵消算力增長帶來的電力需求,但綜合來看,EpochAI測算2010-2024年,前沿AI模型訓練的總電力需求年均增幅仍超100%。上述趨勢凸顯了電力成本對資料中心營運的關鍵意義——電力已成為資料中心最大的營運成本項。Part.02 合作驅動海灣地區AI基礎設施增長全球頭部生成式AI基礎設施建設方已與海灣地區達成多項合作,其中阿聯的合作項目最為典型:阿聯星門項目2025年5月,輝達、甲骨文與OpenAI宣佈在阿布扎比落地星門項目,複製其在美國的星門基礎設施建設模式。根據規劃,該項目將依託輝達最先進的GB300晶片打造1吉瓦算力容量,且是總投資規模預計達5000億美元的全球星門計畫的組成部分。同時,這也是“面向國家的OpenAI”全球倡議下的首份協議,該倡議隸屬於美國星門計畫,旨在幫助美國以外地區建構自主AI能力。1吉瓦算力叢集將由當地科技企業G42承建,甲骨文與OpenAI負責營運,輝達、思科及軟銀提供技術支援,叢集將落戶阿布扎比新建的美阿AI園區,該園區是整體AI基礎設施基地的一部分,未來總算力規劃達5吉瓦。微軟在阿聯的佈局微軟已承諾2023-2029年在阿聯投資152億美元,其中包括向G42注資15億美元,並近期宣佈在該區域建設200兆瓦資料中心園區。此外,微軟聯合貝萊德、MGX及全球基礎設施夥伴成立AI基礎設施合作聯盟,承諾總投資規模達1000億美元,輝達與xAI已於今年早些時候加入該聯盟。沙烏地阿拉伯的合作項目Google與沙烏地阿拉伯公共投資基金達成100億美元合作,將在沙烏地阿拉伯建設並營運全新的雲與AI樞紐,聚焦區域本土化AI應用。亞馬遜與沙烏地阿拉伯PIF旗下AI企業HUMAIN達成超50億美元投資協議,將打造開創性的“AI專區”,該區域基礎設施將配備約15萬顆晶片(含亞馬遜Trainium晶片及輝達GPU),此投資為亞馬遜此前宣佈的53億美元沙烏地阿拉伯基礎設施投資(2026年投用)的增量項目。高通與HUMAIN達成合作,計畫2026年採用高通加速器建設200兆瓦資料中心,但因細節尚未披露,該項目的確定性低於上述合作。Part.03 海灣地區AI應用落地進展如何?海灣地區是技術前瞻性極強的區域,擁有成熟的消費市場、創新技術資本及強力政策支援。例如,阿聯早在2017年便將AI列為國家戰略優先事項,目標2031年成為全球AI領導者,推動AI在醫療、能源、水務、教育等領域的跨行業融合,並以此提升政府治理效能。因此,海灣地區的終端與企業AI滲透率整體處於全球領先或持平水平:德勤資料顯示,阿聯及沙烏地阿拉伯58%的消費者會每日或每周使用AI工具,顯著高於英國的約20%。微軟AI滲透報告指出,阿聯的人均AI使用量位居全球第一,遠超全球均值。企業端方面,德勤調研顯示海灣合作委員會國家在AI應用意願、工具落地普及率及智能體部署進度上與全球企業基本持平,考慮到AI智能體整合的成本與時間投入,瑞銀預計海灣地區國家AI工具的普及將與全球趨勢同步。瑞銀認為,AI擴散規則的調整及AI縮放定律驅動的算力需求快速增長,為GCC國家成為領先AI基礎設施區域奠定了堅實基礎;疊加充裕電力、深厚資本市場及高技術接受度的消費群體,該區域AI相關基礎設施具備強勁增長潛力。 (智通財經APP)
矽谷最著名的分析師發了一份90頁的AI報告,我們為你提煉了這5個洞見
最近有一個PPT在矽谷被廣泛傳閱,作者就是全球科技圈最頂尖、最具影響力的獨立分析師之一:Benedict EvansBen最顯赫的履歷是曾在 Andreessen Horowitz (a16z) 擔任合夥人,a16z 是矽谷最傳奇的風投機構(投過 Facebook, Airbnb, GitHub, Coinbase 等)。當然,在 a16z 期間,他不是負責敲程式碼的,而是負責“思考”的。他的工作是為投資人和創業者提供宏觀戰略視野,判斷未來 10 年的風向。目前他是一名獨立分析師,核心思考“產品”包括超過 17 萬人訂閱的的“周報”,以及我們今天要解讀的“重磅PPT”——《2025 Autumn AI》本文中,我們將對該報告進行全景式拆解,深度探討算力基建的貨幣化難題、無限算力下的勞動力重構(傑文斯悖論),以及“意圖經濟”對傳統網際網路商業模式的終極顛覆。01. 第五次摺疊未知的物理極限與軍備競賽回顧過去五十年的科技史,我們實際上只經歷了四次真正的“平台遷移”:大型機、個人電腦(PC)、網際網路、智慧型手機。每一次遷移,都不是舊事物的改良,而是底層互動邏輯、分發管道和價值捕獲方式的徹底重設。2025 年,我們確認無疑地站在了第五次遷移的震中:生成式 AI。然而,Benedict Evans 在報告開篇就拋出了一個令人不安的差異點——“不可知性”(The Unknown)。回望PC和智慧型手機時代,技術演進的路線圖是清晰的:比如在2007年iPhone發佈時,我們就知道螢幕會變大、網路會變快、電池會耐用。哦,對了,當時摩爾定律也沒有失效,它提供了一個相對精準的時間刻度,讓我們能夠預測未來 5 年甚至 10 年的硬體極限。但在大語言模型(LLM)時代,我們發現沒有“指南針”了。是,我們有Scaling Laws(擴展定律),Scaling Laws告訴我們,只要堆疊更多的資料、更大的算力,模型就會變強。但這種變強是線性的還是指數的?是否存在一個物理上的“天花板”?GPT-5、GPT-6 乃至 AGI(通用人工智慧)的臨界點在那裡?沒有人知道。正是這種“物理極限的未知”,製造了科技史上規模最大、也最瘋狂的“囚徒困境”。對於微軟、Google、Meta 和亞馬遜這四大巨頭(Hyperscalers)而言,擺在面前的只有兩個選擇:選擇1,過度投資的風險:可能會浪費數千億美元建設了過剩的資料中心,導致股價回呼。選擇2,投資不足的風險:可能會直接錯過下一個時代,像當年錯失移動網際網路的微軟一樣,從牌桌上消失。如果你是科技大廠的掌舵人,你會怎麼選?相信你會跟Google的CEO Sundar Pichai 和Meta的創始人Mark Zuckerberg 做出同樣的選擇:選2.他們認為:投資不足的風險遠大於過度投資,注意,是遠大於。在這種邏輯驅使下,2025 年全球科技巨頭的 AI 資本開支(Capex)預計將達到 4000 億至 7500 億美元。為了讓這個數字具象化,Ben的報告是這樣說的:這相當於我們在一年之內,要將全球電信行業的基礎設施重新建設一遍。 或者說,這相當於重新建構整個美國的電力網路。OpenAI 更是激進地規劃了每年 1GW(吉瓦)的電力擴容需求,其目標是建設價值數兆美元的算力叢集。如果是這樣龐大的規模,就造已超越了軟體行業的範疇,進入了重工業、能源甚至地緣政治的領域。不過,這種狂熱的基建投入背後,隱藏著一個巨大的隱憂:商業回報的滯後性。目前的 AI 收入呈現出一種“循環收入”(Circular Revenue)的怪圈——微軟投資 OpenAI,OpenAI 用這筆錢買輝達的晶片,輝達的收入增長又支撐了股市的繁榮,反過來讓巨頭有錢繼續投資。但這筆錢,最終有沒有從真正的“終端使用者”口袋裡賺出來?我們之前的文章中也反覆在探究這一點。很遺憾,Ben目前的答案依然是模糊的。02. 應用的“死亡谷”為什麼8億使用者依然不夠?前面我們說到,AI供給端的基建可以說是“狂飆突進”,不過,在需求端,落地現狀則顯得“冷熱不均”了。報告披露了一組關鍵資料:ChatGPT 的周活躍使用者(WAU)已經達到了驚人的 8 億——這是一個足以與 Instagram 或 TikTok 早期相媲美的數字。但與使用者量形成重大反差的是,使用者行為的深度,或者說“粘性”,遠遠不夠。這體現在2個方面:1,“遊客”多於“居民”大多數使用者對生成式 AI 的使用,依然停留在“偶爾為之”的階段。人們會用它寫一首打油詩、查詢一個複雜的程式碼問題,或者生成一張圖片。但它遠未像微信、WhatsApp那樣,每天要被高頻地使用。資料表明,絕大多數使用者是“輕度使用者”,甚至很多人在嘗試了幾次後就流失了。2,企業的“2026 時間表”B端市場的情況則更為複雜。雖然媒體天天喊著“AI 顛覆企業”,但,根據 Morgan Stanley 和高盛的 CIO 調查,接近 40% 的大型企業表示,真正的大規模 AI 部署計畫要等到 2026 年甚至更晚才會啟動。為什麼?因為企業軟體的更替周期本身就是漫長的,比如,這中間容錯率的問題吧,傳統軟體(如資料庫)是確定性的,1+1 必須等於 2,但 LLM 是機率性的,它會有“幻覺”。這對於銀行核算,簡直就是災難。再比如,你用上AI了,公司的流程也得重構吧,而企業重新設計業務流程需要時間,更需要組織變革的勇氣。在Ben看來,我們目前正處於技術成熟度曲線(Hype Cycle)的“低谷期”:基礎設施已經鋪設完畢,但殺手級應用尚未誕生。這就像是2000年的寬頻網路:光纖鋪到了家門口,但 YouTube 和 Netflix還沒有出現。03. 勞動力重構傑文斯悖論與無限實習生一個被很多人探討的問題是:AI到底會替代人類?還是會增強人類?Benedict Evans 引入了一個極其深刻的經濟學視角:傑文斯悖論(Jevons Paradox)。19 世紀的經濟學家傑文斯發現,當蒸汽機提高了煤炭的利用效率(即做同樣的事需要更少的煤)時,煤炭的總消耗量並沒有下降,反而因為成本降低、應用場景擴大而呈指數級上升。AI 就是智力領域的“蒸汽機”。所以,Ben在報告裡提出了一個核心隱喻:AI 賦予了你“無限的實習生”(Infinite Interns)。在過去,受限於人力成本,我們只能做那些“高價值、低頻次”的工作。例如,一個行銷團隊一周只能打磨 2 篇深度稿件;一個程式設計師一周只能寫 1000 行核心程式碼。那我們推演一下,如果 AI 能瞬間以極低的成本生成內容和程式碼,會發生什麼?企業會因此裁掉行銷經理嗎?可能不會。但這個行銷經理的KPI可能會改變,從一周2篇變成使用AI達到一周分發 2000 篇針對不同受眾的個性化內容。碼農會因此失業嗎?也不會。在推演中,因為編寫軟體的成本大幅下降,我們可以為那些以前“不值得寫程式碼”的長尾需求開發軟體。例如,為一家只有 5 個人的小公司開發一套專屬的 ERP 系統,以前需要幾十萬,未來可能只需要幾句話。所以,在生產力的極大豐富,選擇接近無限的AI未來,帶來的不是需求的萎縮,而是需求的爆發。同時,未來的組織形態將發生劇變。我們可能會看到大量“超級個體”和“袖珍跨國公司”的誕生:一個 10 人的初創團隊,利用 AI 這一槓桿,將擁有過去 500 人企業的研發、行銷和客服能力。對於城市管理者和產業規劃者而言,這不僅不是就業危機,反而是人才紅利二次釋放的巨大機遇。04. 商業模式的終局“意圖經濟”Ben在討論完技術和組織後,就開始觸及最核心的利益分配了:網際網路商業模式的終極顛覆。過去二十年,Google、Amazon、淘寶等巨頭的商業大廈建立在“推薦演算法”之上,其底層邏輯是“相關性”(Correlation):這個好理解,舉個例子:系統監測到你買了一卷透明膠帶,推測具有相關性的產品,於是給你推更多膠帶,或者剪刀。但講真,這種邏輯很愚蠢。因為你買膠帶不是為了收藏,而是為瞭解決某個問題,但愚蠢且無聊的系統不知道那個問題是什麼。生成式 AI 的出現,將把商業競爭的維度從“流量”提升到“意圖”(Intent)。Ben說,在 AI 時代,機器不再是簡單地匹配關鍵詞,而是擁有了推理能力。咱們重複前面的例子:當你購買膠帶、紙箱、記號筆時,AI 會通過推理得出結論:“這個使用者的意圖是搬家。”於是,AI就不會給你展示膠帶或者剪刀的廣告,而是向你推薦:“我幫你對比了三家搬家公司,價格如下;另外,你需要為新家購買保險嗎?宜家最近有新房裝修的優惠券,需要領取嗎?”這就是“意圖經濟”(Intent Economy)。誰能最精準地理解並解決使用者的“意圖”,誰就掌握了價值鏈的最高入口。這對現有的網際網路巨頭是毀滅性的打擊。如果 AI 能直接給我答案並執行操作(Agent),我為什麼還要去 Google 搜尋一堆藍色連結?這意味著,未來的商業競爭將不再是比拚誰的 App 日活高,而是比拚誰的 AI Agent(智能體) 更懂使用者。所有的垂直行業(SaaS、電商、服務業)都面臨被 AI Agent 這一新中間層“截胡”的風險,但也面臨著通過接入 Agent 獲得精準客戶的機遇。05. 才技術“消失”革命才真正完成在報告的最後,Benedict Evans 用一張 1950 年代的照片結束了這場宏大的論述:一個有操作台的電梯。一百年前,每一部電梯裡都必須有一位專業的操作員,負責拉閘、停靠、開門。當時的人們也許爭論過“自動電梯是否安全”、“操作員失業了怎麼辦”。隨著繼電器和自動控制技術的成熟,電梯實現了自動化。操作員消失了……但今天,我們不會指著電梯驚呼:“看!這是一家自動化公司!”或者“這是高科技!”。因為電梯已經融入了建築,成為了背景,成為了像水和空氣一樣理所當然的存在。AI 的終極命運,也是“消失”。目前的喧囂、焦慮、模型跑分大戰、甚至那 7500 億美金的基建投入,都只是大變革前夜的噪音。未來,不會有專門的“AI 公司”,就像現在沒有專門的“電力公司”(指使用電力的公司)一樣。所有的公司都將是 AI 公司。當 AI 真正成功的那一天,它將從我們的視野中隱退,下沉為底層的作業系統。它將不再是一個需要我們專門去學習的“工具”,而變成一種無處不在的基礎設施能力。站在 2025 年的這個深秋,面對這份厚重的報告,我們應當從中提煉出那些行動指南?首先,保持戰略定力,看穿泡沫:7500 億美金的基建投入可能會在短期內引發泡沫破裂的恐慌,但從長周期看,這是通往下一個時代的必經之路(過橋費)。不要因為短期的股價波動而動搖對數位化轉型的投入。其二,關注“應用層”的爆發點:基礎設施已基本就緒,接下來的 3-5 年是應用層(Application Layer)的黃金窗口期。關注那些能解決實際問題、而不僅僅是炫技的 AI 產品。此外,重構組織而非單純採購:不要指望買一套 AI 軟體就能解決效率問題。真正的紅利在於利用“無限實習生”的特性,重新設計組織架構,打造更敏捷、更高產的“超級團隊”。值得提醒的是,儘早佈局“意圖經濟”生態,特別是盯住垂直行業佈局。AI 正在吞噬世界,但它消化的結果,是一個更高效、更智能、充滿無限可能的新世界。 (TOP創新區研究院)
生成式AI,阿里雲憑什麼是亞太唯一領導者?
阿里雲拿下Gartner四項第一,亞太唯一生成式AI的技術周期正在進入一個前所未有的高速區間。面對日新月異的生成式AI技術,企業正陷入選擇難題:如何挑選一個平台,才能跟上快速迭代的創新步伐?最近,Gartner發佈了最新《生成式AI技術創新指南》系列報告,從雲基礎設施、模型工程、模型提供商、AI應用四大維度掃描全球廠商。結論顯示:阿里雲是唯一在全部四個維度均被列入領導者象限的亞太公司,並與Google、OpenAI並列於全球前列。Gartner這次把競爭的底層邏輯攤開了:在技術快速更迭的時代,全端能力才是制勝關鍵。這恰好與阿里雲提出的“全端AI服務商”定位完全契合。01全端能力沉到底層阿里雲是真能打的那家Gartner將GenAI能力分為四層,對應阿里雲從基礎設施到應用的全端體系。在底層基礎設施維度,重點是訓練、推理、大規模服務的資源與網路調度。阿里雲與Google、微軟、AWS同列,是唯一入選的亞太雲廠商。今年其AI資料中心全面升級,HPN8.0已實現十萬卡級高穩定互聯。在模型工程維度,評分集中在資料處理、訓練調度、精調與可觀測性。阿里雲在縱軸特徵和橫軸潛力上均領先三大國際雲廠商。PAI平台與通義協同後,訓練端到端加速比提升三倍,推理效率同步提升。模型本體維度考察模態覆蓋、開放性、安全與生態。阿里雲位於領導者象限,指標領先AWS與微軟,僅次於Google和OpenAI。通義模型覆蓋輕量到全尺寸,並保持多模態迭代。在最上層的知識管理與生產力應用維度,阿里雲依舊處於領導者象限,是唯一來自中國的廠商。面向企業檢索、對話與內容協作的工具體系已成熟,百煉平台過去一年模型呼叫量提升十五倍,使大模型在企業內部可視化落地。多家國際機構的結論與Gartner一致。沙利文顯示通義是中國企業採用最多的大模型;Omdia指出財富中國500強中七成已部署GenAI,阿里雲滲透率過半。在更聚焦的AI雲市場,阿里雲2025上半年份額超過三分之一,高於第二到第四名總和。從模型、平台到基礎設施與應用,阿里雲已形成清晰的全端閉環,“全端最強”具備逐層可驗證的技術能力。圖說:按照縱軸產品特徵(feature)、橫軸未來潛力(futurepotential),新興市場共分為四個像限。阿里雲在“面向GenAI的基礎設施”維度位列新興領導者象限。(報告截圖)02誰都可以宣佈第一全端領先者只有一個今年“AI雲第一”的說法層出不窮,各家機構都在按不同口徑給出第一:模型能力第一、企業採用率第一、市場滲透率第一……多重口徑疊加,讓“第一”本身變得嘈雜。Gartner的意義在於,它把大模型時代的“漢堡包”拆開,讓行業看到真正影響競爭力的底層結構。全端之所以成為終極門檻,原因只有兩個。第一,協同最佳化的複利效應。AI算力的昂貴眾所周知,而通過“雲+AI”的全端協同,可以將硬體性能壓榨到極限,從而大幅降低推理成本。Qwen3-Next推出後推理成本下降90%,正是因為模型、平台和基礎設施在同一技術體系內協同最佳化。對於客戶而言,這直接轉化為更具競爭力的API價格和更低的試錯成本。第二,緊耦合帶來的落地確定性。雲和AI本質上是伴生關係。Qwen3-Next推出後推理成本下降90%,正是因為模型、平台和基礎設施在同一技術體系內協同最佳化。企業已經用選擇給出了答案。Omdia資料顯示,2025年上半年阿里雲在中國AI雲市場的份額高達35.8%,超過了第2到第4名的總和,更有53%的中國500強企業選擇了阿里雲部署GenAI。企業用腳投票證明了:他們需要的不只是一個模型,而是一套穩定、便宜且能快速落地的全端服務。Gartner將GenAI切成基礎設施、模型工程、模型本體、知識管理四層,給出的正是更貼近市場真實需求的結構:底層越重,護城河越深。在這四個維度中同時位於領導者象限的,亞太範圍內只有阿里雲一家。這意味著,在全端技術競爭裡,它已經建立起跨層互相強化的能力結構。模型的迭代速度依賴基礎設施最佳化,模型工程的工具鏈效率反過來提升模型的使用門檻,而上層應用又能及時把企業需求反哺到模型層。它不是某一環領先,而是整個技術堆疊沒有明顯短板。圖說:阿里雲在“GenAI模型提供者”維度位列新興領導者象限。(報告截圖)03AI+雲的全球競爭裡能對標的只有Google與阿里如果站到全球維度觀察,GenAI的競爭正在形成兩種路線。第一種是以模型為核心,由模型向外延展生態,例如OpenAI。第二種是以雲為核心,由雲能力向下延展到模型與晶片。而在Gartner的結構下,能夠真正做到“雲+模型+晶片”垂直整合的廠商,全球只剩兩家:Google與阿里。Google依託自研TPU,搭配Gemini模型家族,形成從裝置端到企業端的完整體系。2025年11月18日發佈的Gemini3在多項基準測試中領先:Humanity'sLastExam得分45.8%創該測試最高紀錄,該模型100萬token輸入窗口和原生多模態支援,使其成為當前最強大的通用AI模型之一。配合Gemini3發佈的還有圖像生成模型NanoBananaPro。該模型在圖像編輯排行榜上位居全球第一,能同時處理14張不同圖像或5個角色並保持一致性。短短4天內,NanoBanana為GeminiApp新增1300萬使用者。Google的垂直整合深度體現在晶片演進速度。從TPUv6(Trillium)到v7(Ironwood)僅7個月,Trillium在密集LLM訓練中比v5e快4倍,擴展效率在6144顆晶片規模下仍保持94%。阿里在架構邏輯上與其類似。一方面,以通義模型覆蓋從輕量化、場景化到旗艦大模型的全尺寸結構。另一方面,依託自研晶片與大規模智能算力網路,建構訓練、推理與應用的統一體系。第三層,是以百煉平台與企業級生產力工具,對外部需求進行快速整合。這種“三段式結構”正好貫穿Gartner的四個技術維度。因此在最新一期的報告裡,Google與阿里雲穩坐四大維度領導者象限。更有趣的是,兩者在C端的戰略也驚人一致。就在Google用Gemini迅速搶奪OpenAI使用者的時候,阿里的千問App全面爆發,整合了搜尋、文件、創作等功能,下載量一周內迅速突破1000萬大關,成為新的超級流量入口。這不是偶然,是技術路徑本身決定的。AWS和微軟有雲和晶片(AWS的Trainium、微軟的Maia),但缺少頂級自研模型,依賴於Anthropic、OpenAI的合作關係。OpenAI只有模型,在成本控制和性能最佳化上受制於雲服務商。未來的GenAI競爭,會越來越像移動網際網路時代的“端雲一體”。只有底層算力、模型架構與中介軟體平台同時具備,才能讓企業用得穩,也能讓應用快速生長。04結語Gartner的報告把GenAI的競爭全貌拆成可驗證的四個層次。也讓“全端領先”這件事變得清晰可見。在這套框架裡,阿里雲是唯一在四個像限都處於領導者位置的亞太廠商,也是能與Google並列的全球雙核心玩家之一。技術風暴會繼續加速,企業的窗口期會繼續縮小。而在全端競爭裡,能夠把基礎設施、模型、工程體系與應用能力持續整合的廠商,會成為未來幾年最穩定的AI基座。阿里雲顯然正在將自己推向這個位置。 (硬AI)
騰訊研究院AI速遞 20251117
生成式AI一、openEuler發佈全球首個超節點作業系統,專為AI打造1. 開源歐拉社區正式開啟新的5年發展之路,將於2025年底正式上線面向超節點的作業系統(openEuler 24.03 LTS SP3),成員單位超2100家,全球貢獻者突破2.3萬人;2. 該作業系統具備全域資源抽象、異構資源融合和全域資源檢視三大關鍵特徵,旨在充分釋放超節點算力潛能,加速基於超節點的應用創新;3. 靈衢互聯協議2.0由開放,並將向社區貢獻支援超節點的作業系統外掛程式碼,提供記憶體統一編址、異構算力低時延通訊和全域資源池化等關鍵能力。二、CEO劈柴兩個神秘表情,或暗示Gemini 3.0等下周登場1. GoogleCEO劈柴用兩個"若有所思"表情回應Gemini 3.0下周登場傳聞,69%網友押注下一代AI模型即將發佈,該模型有望成為Google的重大轉折點;2. 提前流出的內測顯示Gemini 3.0可一句話直出作業系統、動態建構Windows系統、5秒搭建網站,前端設計能力驚豔,被稱"前端工程師末日";3. 巴菲特已投入43億美元重倉Google股票,Gemini 3.0寄予了所有人美好期望,其表現將決定Google能否向AI王座發起衝擊。三、Google發佈遊戲SIMA 2,不用開外掛,「像人一樣」練級1. GoogleDeepMind推出SIMA 2智能體,能像人類一樣觀看螢幕使用虛擬鍵鼠打遊戲,突破了單純指令跟隨的侷限,具備推理和學習能力;2. SIMA 2可在未經預訓練的情況下攻克全新遊戲,能理解多模態提示(路線草圖、符號表情),並通過自我學習和基於Gemini的反饋引導實現自我提升;3. 系統採用符號回歸方法,整合Gemini作為核心引擎,目標是成為未來機器人應用的基礎模組,但目前在長期複雜任務和精細操作方面仍有侷限。四、EverMemOS發佈,一款面向AI的長期記憶作業系統1. 陳天橋盛大團隊推出EverMemOS長期記憶作業系統,在LoCoMo和LongMemEval-S評測集上分別取得92.3%和82%高分,顯著超越SOTA水平;2. 系統受人腦記憶機制啟發,創新設計四層架構(代理層、記憶層、索引層、介面層),採用"分層記憶提取"與動態組織解決純文字相似度檢索難題;3. 目前已在Github開放開源版本,預計今年晚些時候發佈雲服務版本,為企業使用者提供資料持久化與可擴展體驗。五、2000 元的 AI 戒指,心率睡眠都測不了,只能聽你碎碎念1. 前Meta員工創立的Sandbar發佈Stream智能戒指,售價249-299美元,砍掉所有健康監測功能,專注於"語音滑鼠"式AI語音互動;2. 戒指採用"握拳私語"互動方式,按住觸控板啟動錄音,動態切換多個大模型處理任務,但續航僅16-20小時遠不如傳統智能戒指;3. 配套iOS App使用ElevenLabs生成語音模型可模仿使用者聲音,所有資料端到端加密不保存原始音訊,但隱私和價值主張仍存疑。六、NotebookLM放大招,更新Deep Research重量級功能1. GoogleNotebookLM推出Deep Research功能,可自動收集N個相關網頁源並整理到上下文列表,幾分鐘內圍繞主題搭建專屬資料庫;2. 系統支援2500萬token上下文處理,所有回答必須基於使用者提供的來源且帶引用標註,可驗證性強,避免AI幻覺問題;3. 其視訊概覽功能,可將文件、網頁、視訊轉化成互動式視訊並生成相應畫面,Google明確承諾不會使用使用者個人資料訓練模型。前沿科技七、北大團隊新突破 AI「牛頓」,看一眼資料,推出物理定律1. 北京大學團隊推出AI-Newton系統,採用符號回歸方法,在無監督、無物理先驗知識前提下,成功重新發現牛頓第二定律、能量守恆定律和萬有引力定律等基礎規律;2. 系統由符號化概念、特定定律與普適定律構成的知識庫支援,通過物理領域專用語言表示知識,各測試用例中平均識別出約90個物理概念和50條一般定律;3. AI-Newton展現出漸進性和多樣性兩大特性,雖目前仍在研究階段,但為AI驅動自主科學發現提供了新範式,有望擴展到具身智能領域。報告觀點八、可解釋性新研究:OpenAI又Open成果,來自對齊團隊1. OpenAI發佈可解釋性新研究,提出訓練神經元連接少但神經元數量多的稀疏模型,通過強制大部分權重為0使模型內部機制更易被理解;2. 研究團隊找出模型完成特定任務的"最小回路",通過邊數幾何平均值量化可解釋性,發現訓練更大更稀疏的模型可生成功能更強但回路更簡單的模型;3. 論文通訊作者為Leo Gao,曾是Ilya超級對齊團隊成員,但研究仍處早期階段,稀疏模型比前沿模型小得多且訓練效率較低。九、馬斯克以Grok為核心,X與特斯拉雙平台的AI未來展望1. 馬斯克在X與特斯拉雙平台推進xAI,Colossus超算資料中心122天部署20萬塊H100 GPU,用於訓練Grok-4和即將推出的Grok-5;2. xAI採用"求真、不設禁忌"路線,讓AI生成合成資料重構知識體系打造"Grok百科",特斯拉下一代AI5晶片性能將提升40倍;3. Grok很快將進入特斯拉汽車,馬斯克預計2030年AI總體能力可能超越全人類,xAI開源Grok-2.5模型並計畫半年後開放Grok-3。 (騰訊研究院)
花旗:AI將顛覆資產管理行業
一、行業轉型:AI 從 “效率工具” 升級為 “阿爾法夥伴”,CEO 認知與人才結構已先行AI 在投資管理領域的定位已發生根本性轉變,從 2024 年聚焦營運效率,轉向 2025 年直接賦能投資決策,行業頂層認知與人才儲備同步跟進:CEO 層面:AI 成生存必修課,74% 擔心 2 年不落地將失業據Dataiku 發佈的 Harris Poll 調研(覆蓋全球 500 位 CEO),74% 的 CEO 認為若無法證明 AI 帶來的可量化業務成果,未來 2 年可能失去職位;金融行業 AI 滲透率已從 2023 年 40% 升至 2025 年 52%(輝達調研),投資管理領域增速更快,超 60% 頭部機構已將 AI 納入核心戰略。人才層面:AI 相關崗位佔比激增,北美成核心聚集地2024 年全球 AI 相關崗位佔比達 2.2%(2010 年僅 0.3%),其中北美佔比最高(3.2%),遠超亞太(1.7%)、歐洲(1.5%)、拉美(1.2%);投資管理領域 AI 分析師、AI 策略師等新崗位招聘量 2024 年同比增長 80%,避險基金和主權基金成為主要僱主。應用層面:從“中後台效率” 到 “前台投資決策”2024 年花旗調研顯示,80% 機構僅將 AI 用於文件總結、資料錄入等中後台任務;2025 年隨訪發現,65% 機構已在投資端測試 AI 應用,其中 30% 實現 “AI + 人類” 協同決策,史丹佛大學開發的 AI “基金經理” 甚至在 30 年回測中跑贏 93% 人類基金經理,平均超額收益達 600%(僅用公開資訊調整組合)。二、技術合力:生成式AI + 智能體 AI(Agentic AI),解鎖 “自主決策” 新能力AI 對投資管理的顛覆,核心來自生成式 AI(GenAI)與智能體 AI 的協同,前者擅長資訊合成,後者實現任務自主執行,二者結合突破傳統 AI 的能力邊界:生成式AI:處理 “人類不可能完成” 的資訊規模基礎能力覆蓋多類型資料處理—— 可同時分析 30 + 份賣方研報、10K 財報、 earnings call 紀要等非結構化資料,將傳統需數周的分析(如關稅對組合的影響)壓縮至數小時;量化領域可快速挖掘另類資料(如衛星圖像、信用卡交易資料),訊號識別效率較人類分析師提升 5-10 倍。智能體AI:自主規劃 + 執行 + 適配,從 “輔助” 到 “代理”區別於傳統AI 的單一任務執行,智能體 AI 可自主完成多步驟流程:例如監測特定行業新聞→識別宏觀指標影響→自動呼叫生成式 AI 分析相關公司 filings→生成初步報告→按預設風險參數建議組合調整,全程僅需人類稽核異常點;當前 35% 頭部避險基金已在測試 “智能體 AI + 投研” 系統,任務自動化率達 40%。應用場景擴容:投資、分銷、營運全鏈條滲透投資端新增“AI 投研助手”“交易執行協同” 等場景,分銷端實現 “客戶微群體分類”“生成式引擎最佳化(GEO)”(替代傳統 SEO),營運端可完成 “歸因分析自動化”“合規文件解讀”;未來待落地場景包括 “AI 投資副駕駛”“即時風險避險建議”,覆蓋從前端獲客到後端風控的全流程。三、核心應用:基本面與量化投資雙軌突破,四大維度重塑投研流程AI 在基本面與量化投資中的應用各有側重,但均實現從 “工具輔助” 到 “價值創造” 的跨越,具體體現在資訊合成、工具普惠、分析深度、自主決策四大維度:(1)維度 1:資訊合成革命 —— 處理量提升 100 倍,隱藏關聯自動浮現基本面投資:傳統分析師日均處理2-3 份研報,AI 可同時分析 30 + 份研報 + 10 年財報 + 即時新聞,例如研究某藥企時,AI 能自動交叉驗證管理層言論與臨床試驗資料、同行進展,發現人類易忽視的 “研發進度滯後 - 供應鏈成本上升” 關聯;2025 年測試顯示,AI 資訊合成後提出的投資假設精準率較人類單獨分析提升 35%。量化投資:AI 可快速處理另類資料(如高頻交易資料、社交媒體情緒),訊號挖掘範圍從傳統結構化資料擴展至衛星圖像、感測器資料等,2025 年量化基金用 AI 發現的 “物流資料 - 消費企業營收” 領先訊號,平均提前 3 個月預警業績拐點。(2)維度 2:工具普惠 —— 分析師人人可享 “超級算力”,效率提升 50%自動化預處理:AI 可自動完成研報標籤分類、資料清洗(如從 10K 檔案中提取毛利率、研發費用等關鍵指標),將投研準備階段時間縮短 60%;某大型資管機構測試顯示,用 AI 自動化因子研究後,量化團隊新因子挖掘效率提升 2 倍。跨層級能力平等:初級分析師可通過AI 工具發起 “行業比較”“估值建模” 等複雜分析,無需依賴資深團隊支援;2025 年調研顯示,採用 AI 工具後,不同層級分析師的投研產出差異縮小 40%,工具普惠性顯著。(3)維度 3:分析深度 —— 行為分析 + 即時反饋,阿爾法來源新增基本面:管理層行為語言學分析AI 結合法醫語言學,可識別 earnings call 中 “過度自信”(如高頻使用 “絕對”“必然”)、“迴避”(如繞開核心問題)等訊號,2025 年案例顯示,AI 識別出的 “管理層溝通異常” 訊號,後續 6 個月內對應公司股價平均下跌 8%;同時可即時篩查財務報表異常項,某基金用 AI 發現某零售企業 “應收帳款周轉率異常”,提前規避 15% 的股價下跌。量化:歷史記憶+ 場景分析AI 可儲存 20 + 年 earnings call 等歷史資料,精準還原長期趨勢(人類記憶通常僅覆蓋 3-5 年);在場景分析中,AI 可模擬 “利率加息 + 地緣衝突” 等多因子組合影響,某避險基金用 AI 完成 1000 + 種場景測試,耗時僅為傳統模型的 1/20。(4)維度 4:自主決策 —— 智能體 AI 全程操盤,即時風險響應基本面:行業/ 公司深度追蹤自動化智能體AI 可自主監測某行業宏觀指標(如新能源的裝機量、政策補貼),若出現 “補貼退坡” 訊號,自動呼叫生成式 AI 分析相關企業盈利影響,生成 “減持高成本廠商” 建議;2025 年測試中,該流程從訊號出現到建議生成僅需 4 小時,較人類團隊快 12 倍。量化:因子/ 組合即時監控智能體AI 可全程管理因子研究流程(資料獲取→回測→最佳化),同時即時監控組合風險因子(如波動率、行業敞口),若突破預設閾值,自動觸發避險操作;某量化基金用 AI 後,組合風險因子偏離度從 5% 降至 2%,避險響應時間從 1 天縮短至 1 小時。四、實施建議:從“觀望” 到 “落地”,破解 “買 vs 建” 困境 + 資料基礎搭建機構落地AI 需解決 “技術路徑選擇”“資料基礎”“人才適配” 三大核心問題,花旗給出具體實操框架:路徑選擇:模組化思維破解“買 vs 建”,聚焦差異化能力建議機構優先“外購非核心能力 + 自建核心能力”:例如分銷端的客戶聊天機器人、營運端的文件處理可採購第三方(如 Digipal、Kasisto),投資端的阿爾法訊號挖掘、組合最佳化需自建;2025 年調研顯示,採用 “模組化” 策略的機構,AI 落地成本降低 30%,見效速度提升 50%。資料基礎:資料網格(Data Mesh)替代傳統集中式,解決 “資料孤島”傳統集中式資料湖易形成瓶頸,資料網格讓各業務團隊(如投研、分銷)自主管理資料,AI 可直接呼叫各模組資料,減少 IT 依賴;某資管機構採用資料網格後,AI 模型訓練資料獲取時間從 7 天縮短至 1 天,資料質量提升 25%, hallucination(幻覺)率降低 15%。人才適配:“人類在環(Human-in-the-Loop)”+ 全員 AI 培訓必須保留人類稽核環節(如AI 生成的投資建議需分析師確認),同時設定 “緊急關閉開關” 應對異常;人才培訓需覆蓋 “AI 工具使用”“結果質疑能力”,2025 年案例顯示,完成全員 AI 培訓的機構,AI 投研產出錯誤率降低 40%,分析師接受度提升 60%。五、未來方向:六大新興應用蓄勢待發,時間序列預測+ 圖神經網路成突破口AI 在投資管理的應用將向 “長期策略”“複雜關係分析” 延伸,六大新興方向已進入測試階段:1. 戰術 vs 戰略訊號:從 “短期動量” 到 “長期趨勢”當前AI 擅長短期訊號(如 1 個月內的情緒動量),未來將探索長期訊號(如 3-5 年的行業格局變化),某主權基金用 AI 分析人口結構、政策趨勢,提前 2 年佈局 “老齡化 - 醫療裝置” 賽道,收益較基準高 18%。2. 時間序列預測:智能體 AI 自主選模型,動態最佳化智能體AI 可根據資料特徵(如股價、宏觀經濟資料)自主選擇最優 LLM 模型,若模型預測準確率下降(如從 85% 降至 70%),自動切換模型;2025 年測試中,該方式預測誤差較固定模型降低 20%。3. 圖神經網路(GNN):挖掘公司間隱藏關聯GNN 可建構 “公司 - 供應鏈 - 宏觀指標” 知識圖譜,例如發現 “某晶片廠商產能下降 - 某手機品牌毛利率承壓” 的間接關聯,2025 年量化基金用 GNN 發現的 “跨行業訊號”,年化收益較傳統因子高 12%。其他方向:生成式AI 合成無偏資料(解決歷史資料偏見)、智能體 AI 管理檢索增強生成(RAG)減少幻覺、多 LLM 協同分析(如一個 LLM 做因子研究,一個做風險評估)、生成式 AI 可解釋性(XAI)提升透明度。六、風險挑戰:過度依賴、監管差異、人才缺口成三大攔路虎AI 落地雖快,但行業仍面臨認知、合規、人才三重挑戰,需針對性應對:挑戰1:過度依賴導致 “認知債務”,MIT 研究證實神經連接變化MIT 腦科學研究發現,長期依賴 LLM 的使用者,大腦神經連接模式與 “獨立思考組” 差異顯著,出現 “接受 AI 輸出而不質疑” 的認知惰性;2025 年調研顯示,40% 分析師承認 “未驗證 AI 結論直接引用”,導致投資建議錯誤率上升 15%。挑戰2:全球監管框架碎片化,歐盟罰款最高達年營收 7%歐盟《AI 法案》(2025 年 2 月生效)對 AI 分類監管,投資決策類 AI 屬 “高風險”,違規最高罰 3500 萬歐元或全球年營收 7%;美國採用 “州 + 聯邦” 分散監管(如加州 AI 法案、SEC 指引);中國要求 AI 生成內容必須標註,三大標準規範 GenAI 安全;機構需投入 20%-30% AI 預算用於合規適配。挑戰3:人才缺口達 40%,“AI 系統管理者” 需求激增投資管理領域AI 人才缺口 2025 年達 40%,其中 “懂 AI + 懂投資” 的複合型人才最稀缺;崗位需求從 “AI 使用者” 轉向 “AI 系統管理者”(如最佳化智能體 AI 任務流程),2025 年這類崗位薪資較傳統分析師高 80%。七、總結:AI 是投資管理的 “seismic shift”(地震式變革)花旗認為,AI 已不是 “可選項” 而是 “必選項”,機構需從 “被動適應” 轉向 “主動佈局”,具體建議如下:場景優先:優先落地“資訊合成”“行為分析” 等已驗證場景(ROI 明確),再探索 “長期訊號生成” 等前沿方向;技術組合:採用“生成式 AI + 智能體 AI + 資料網格” 組合,平衡效率與安全,避免單一技術依賴;人才儲備:短期內引入外部AI 專家,長期建立 “全員 AI 培訓體系”,培養 “人類 - AI 協同” 能力。 (資訊量有點大)