#勞動力
木頭姐2026 AI展望:龍蝦機器人讓智能體進化為數字勞動力,個人賺錢邏輯徹底變了
1月30日,美國知名投資人、ARK Invest創始人木頭姐(Cathie Wood)接受播客訪談,她詳細解讀了ARK最新發佈的《Big Ideas 2026》報告,內容涵蓋AI Agent、自動駕駛、宏觀經濟等多方領域的發展趨勢。資料顯示,目前AI Agent在長周期任務上的成功率已達到80%。雖然這一數字對於人類員工來說尚不及格,但如果部署100個Agent平行工作,其解決問題的機率將呈指數級上升。最近開源智能體MoltBot(龍蝦機器人,因商標問題從Clawdbot改名而來)刷屏全球網際網路,Moltbot能夠連接使用者的社交媒體、信箱和本地檔案,像私人助理一樣自主完成任務。木頭姐認為Moltbot的爆火代表了個人Agent力量的崛起,個人可以利用開源工具擁有強大的生產力,無需完全依賴大公司的封閉生態。隨著AI Agent任務成功率的提升,智能體將從單純的聊天機器人進化為能夠自主執行複雜工作的數字助手,這是未來GDP和生產力爆發式增長的關鍵驅動力之一。關於大模型公司之間的競爭,木頭姐認為,OpenAI雖然擁有9億使用者的先發優勢,但巨大的算力成本迫使其不得不開始追求商業化。OpenAI正在計畫推出高達60美元的CPM廣告報價,這一價格是目前Facebook的三倍,堪比超級碗廣告的定價水平。相比之下,Google則顯得更遊刃有餘。Google擁有龐大的搜尋業務現金流作為後盾,具備極強的戰略耐力。它不需要急於通過高價搾取使用者價值,相反,可以利用價格優勢來搶佔OpenAI的市場份額。在自動駕駛領域,木頭姐對Robotaxi的未來絕對樂觀,並預測這一市場將徹底顛覆傳統汽車製造業。ARK研究預測,特斯拉將是Robotaxi領域的最大贏家,Waymo緊隨其後。Waymo雖然技術領先,但缺乏製造能力,它必須依賴汽車製造商提供車輛平台。這種組裝式的供應鏈模式,註定了其成本難以極致壓縮。而特斯拉擁有完全垂直整合的生態。從電池製造、晶片設計、資料中心到整車製造,特斯拉憑藉垂直整合的供應鏈,其每英里營運成本預計僅為20美分,比Waymo低50%。木頭姐表示,傳統汽車製造商在這一波浪潮中將難以生存或勝出。Robotaxi是機器人、AI和儲能技術三大領域的融合。傳統車企專注於內燃機,缺乏這三大關鍵技術的積累和融合能力。內燃機技術已經成熟,不再符合萊特定律帶來的成本下降曲線,而電動車和AI技術正處於成本快速下降的通道中,這使得傳統車企在未來的價格戰中毫無還手之力。另一方面,傳統車企嚴重依賴供應商,無法像特斯拉那樣通過內部完全自動化的供應鏈來快速響應指數級增長的需求。關於AI時代的宏觀經濟,木頭姐預測:全球GDP增長率將從歷史平均的3%躍升至7%。現在是機器人、儲能、AI、區塊鏈和多組學測序這五大技術平台的融合期,7%的預測甚至可能是保守的。雖然技術具有降低成本的通縮性質,但由此帶來的單位需求將呈爆炸式增長,從而極大地推動經濟總量的擴張。針對推理成本急速下跌的問題,木頭姐認為這不會導致市場萎縮。相反,人類對智能的需求在本質上是無限的,即便推理成本趨近於零,為了獲得更長思維鏈的智能代理服務,企業和個人仍將投入巨大成本。木頭姐訪談內容劃重點:1.智能的無限需求推理成本向零逼近,但人類對智能的渴望是無限的。人們會耗盡所有預算去獲取更多的智能,即使單次推理變得便宜,總需求量的爆發也會讓市場規模巨大。目前的AI Agent在長期任務上的成功率約為80%。2.個人AI Agent的生產力飛躍開放原始碼的Moltbot能夠運行在個人電腦上,幫助整理工作、連接社交媒體和郵件,甚至在睡眠時自動完成任務。這不僅是技術突破,更成為一種文化現象。這種工具能讓工作效率產生質的飛躍,但它同時也具有破壞性,如果出錯,它可能在兩秒鐘內搞亂甚至損毀電腦系統。3. 特斯拉Robotax的壓倒性優勢在自動駕駛領域,特斯拉將是最大贏家,Waymo位居其次。特斯拉的優勢在於其垂直整合的成本結構和製造能力,能夠將每英里成本降至20美分,而目前Uber等服務的成本在2美元以上。傳統汽車製造商由於依賴外部供應鏈、受限於工會以及缺乏機器人與AI的企業基因,很難在這場轉型中生存,因為未來的汽車本質上是移動的推理引擎和儲能裝置。4.汽車將演變成移動推理引擎和儲能未來的汽車不僅僅是交通工具,而是數以百萬計的移動推理引擎和能源儲存裝置。自動駕駛汽車將成為分佈式能源生態系統的一部分,利用閒置時間平衡電網(例如在夜間利用率低時充電,白天反向供電)。這種深度融合是傳統車企難以理解和複製的。5. 軌道資料中心與垂直整合SpaceX正在建構軌道資料中心,可重複使用火箭的發射成本急劇下降。在太空中,太陽能效率是地面的六倍,且不受土地限制。馬斯克意圖通過高度垂直整合,繞過傳統供應鏈的層層加價,這將徹底改變算力基礎設施的成本結構。以下是木頭姐訪談實錄:1.AI與GDP增長的加速Peter:歡迎大家來到《Moonshots》節目。我們邀請到了ARK Invest的創始人、CEO兼CIO凱茜·伍德(Cathie Wood)。凱茜,你預測全球GDP將實現7%的增長,這簡直是一個奇點事件,畢竟人工智慧的發展速度遠超我們要預期。今天我們還有幸請到了我的“登月”夥伴Dave Blundin和Salim Ismail。這可是全球排名第一的科技播客,旨在讓大家為即將到來的未來巨變做好準備。早上好,凱茜。Cathie Wood:早上好,Peter。Peter:你們發佈了一份令人驚嘆的《2026 Big Ideas》報告。我們從中挑選了大約20張幻燈片,想和團隊一起探討一下。這真的很重要,你能想像世界變化得有多快嗎?這對你來說仍然令人震驚嗎?Cathie Wood:即使我們一直預期世界變化的步伐會比人們想像的更快,但AI的發展速度依然超出了我們的預期。要知道,我們在這方面本來就已經走在很前面了,但這依然說明了某種趨勢。Peter:好的,我們來談談這場巨大的加速。凱茜,我在螢幕上放了第一張幻燈片,是關於2030年GDP預期變化的。這些數字相當驚人,你預測全球GDP增長7%,這就像是一個奇點事件,是國際貨幣基金組織(IMF)預測值的兩倍。我們剛和埃隆·馬斯克聊過,他也認為未來兩年內GDP可能增長5倍,並在下一個十年出現三位數增長。凱茜,你怎麼看?Cathie Wood:這張圖表做得很漂亮。你可以看到,歷史上每一次技術革命都伴隨著GDP增長的階躍式上升。回顧1500年到1900年那幾百年,除了末期的鐵路,並沒有太多新技術,根據Brett Winton與學術界合作的研究,那時的全球實際GDP增長率僅從0.6%提升到了6%左右。隨後,當我們經歷鐵路、電話、電力、內燃機這場技術革命時,在接下來的125年裡,增長率提升了五倍,穩定在3%左右。現在,我們要面對的是五個核心平台:機器人、能量儲存、人工智慧(這是最大的催化劑)、區塊鏈技術和多組學測序。這五大技術的融合,讓我們認為增長率會再提升兩倍半,達到7%左右。實際上,我認為這還是保守估計。幾年前我們剛提出這個數字時,人們都覺得我們瘋了,而在聽了埃隆的觀點後,你會發現我們對全球實際GDP爆發式增長的看法是一致的。這確實是當今在世的人從未見過的景象。Dave Blundin:我來充當一下反方觀點,儘管我自己並不相信這個反方觀點,但為了討論通過必須得有人提出來。Alex和我剛從達沃斯論壇回來,如果你隨機調查那裡的銀行家和政客,大概只有20%的人相信這種增長,80%的人都不信。那80%的人會說:“看,當電腦革命起飛時,GDP 增長率依然穩定在每年3%。不管有什麼突破,無論是聚變還是計算,最終都會被那3%的增長率所包含,我們擺脫不了這個困局。”這種心態源於過去125年的歷史經驗。凱茜,你會怎麼回應這些不信者?Cathie Wood:有趣的是,今天活著的人確實沒有經歷過除此以外的情況。在80年代和90年代,生產率增長確實有所上升,那是投資的黃金時代,但全球GDP增長大體保持在3%。但我認為那些金融界人士不相信這一點的根本原因在於他們的研究架構。Cathie Wood:傳統金融機構是按部門、行業或子行業來孤立地設定研究的。然而,現在的技術正在滲透到每一個領域並模糊這些界限。你必須像我們一樣建立研究體系,也就是圍繞這15項核心技術(歸納為5大平台)來開展。我們的每一位分析師都在研究這些技術何時以及如何在各個行業中擴展。我們在內部打破了孤島,分析師們協同工作,只有這樣才能真正理解當今正在發生的重大技術融合。Peter:這確實是完美的融合。正如你在幻燈片中所見,我們正在見證可重複使用的低成本太空發射技術與太空資料中心的結合。六個月前,我和埃隆·馬斯克以及戴夫交流時,還沒有人談論在太空建立資料中心,但現在每個人都在討論這個話題。Cathie Wood:我們與Mach 33合作推出了一個開放原始碼的SpaceX模型。早在去年年中我們就發佈了這個模型,當時還沒把“軌道資料中心”納入考量。現在,我們和Mach 33重新設計了方案,早期的結果顯示成本正在顯著下降,這將進一步推動單位增長。這正是賴特定律(Wright's Law)的核心:隨著累計產量的每一次翻倍,在這個案例中是可重複使用的火箭技術,成本會以穩定的百分比下降。對於火箭來說,成本下降的幅度相當可觀。信不信由你,在工業機器人領域,累計產量每翻一番,成本就會下降約50%。火箭領域的降幅可能沒那麼高,但我相信也會在百分之二十幾的區間。Dave Blundin:我其實想問關於左邊這張圖表的問題。既然發射成本正在大幅下降,我驚訝的是那條曲線沒有下降得更多。我和埃隆開會時的一個重要收穫是,老實說,我進去時對“太空資料中心”持半信半疑的態度,出來時卻完全被說服了,他正在積極且秘密地推進一件事:繞過現有的供應鏈。目前製造GPU晶片,台積電(TSMC)大約有50%的利潤率,NVIDIA有80%的利潤率,價值鏈中充滿了層層加價。埃隆打算繞過這一切,建立自己的晶圓廠。他總是問:根本性的約束是什麼?真正的物理障礙是什麼?其實很簡單:沙子(矽)的獲取非常便宜;至於電力,太空中太陽能板的效率是地面的六倍,成本極低。所以我認為,如果我們今天只看發射成本的下降,而不考慮GPU成本、電力成本和太陽能板生產成本的趨同性顛覆,那我們就低估了趨勢。如果埃隆是對的,這些都會在短短幾年內平行發生,成本曲線會急劇下降。Cathie Wood:確實如此。我們再看賴特定律在半導體行業的應用。現在的問題是,什麼會阻礙這種增長?我不認為監管會成為障礙,因為我們正處於一場太空競賽中。既然埃隆的公司高度垂直整合,我們假設他能搞定晶片供應。Dr. Alexander:凱茜,如果我們天真地通過過去的資料向外推演,我們會達到“戴森群”等級的規模嗎?在未來的某個時刻,為了建造軌道資料中心,我們是否需要從月球、其他行星或小行星帶獲取足夠的原材料?我知道你通常做五年預測,但如果讓你展望50年後,我們會看到戴森群(Dyson swarm)嗎?還是會有多個相互競爭的戴森群?Cathie Wood:雖然我不夠專業去回答關於戴森群的具體問題,但我們的模型確實已經把SpaceX的規劃推演到了五年以後,並且納入了Optimus機器人、特斯拉和The Boring Company甚至火星殖民的因素。我們認為這在技術上是可行的。不過,軌道碎片確實是近期最大的絆腳石,一旦發生連鎖反應,後果不堪設想。Peter:讓我們把話題轉回AI基礎設施。正如幻燈片所示,推理成本正以驚人的速度下降,其影響巨大,我認為人們尚未完全意識到這一點。Salim Ismail:這裡有個悖論:當技術像我們所見的那樣具有極強的通縮性,例如火箭發射成本從航天飛機的6億美元降至SpaceX的6000萬美元,甚至還將再降10倍,這對GDP來說是巨大的縮減。當技術如此徹底地降低一切成本時,我們如何預測GDP的增長?這是我最大的擔憂之一。Cathie Wood:成本下降的另一面是單位數量的爆炸式增長,這就是傑文斯悖論(Jevons Paradox)。很多人嘲笑我預測價格將開始下跌,他們認為通膨會卡在2%到3%的區間。但如果你看真實通膨資料,它已經降到了1.2%到2%。聯準會還在對抗通膨幽靈,但我認為明年通膨率會降至2%以下,甚至轉為負值。這裡的關鍵是生產率增長和單位勞動成本的下降。Dave Blundin:確實,油價在跌,租金也在跌。或許我們需要一個“凱茜·伍德定律”來解釋這一切。埃隆曾講過一個笑話:兩個經濟學家在樹林裡散步,互相付錢吃對方的排泄物,結果GDP增加了200美元,卻沒創造任何價值。反過來看,如果AI治癒了癌症,數百萬人不再需要放療和化療,這在GDP上會表現為負增長,但對人類價值卻是巨大的。所以在AI時代,GDP指標本身就有根本性缺陷。Cathie Wood:你說到了點子上,但這事還有另一面。看看機器人技術,特別是那些我們要花時間做卻沒有任何報酬的事情,比如接送孩子、做飯、打掃衛生。這些從未計入GDP。但未來我們將購買機器人來做這些事,這將轉化為付費服務,從而進入GDP統計。這就像從農業經濟向工業經濟轉型時,家務勞動逐漸社會化一樣。被“看不見”的勞動將轉化為可衡量的經濟活動,這將帶來GDP的大幅回流。Cathie Wood:舉個具體的例子,當年很多風險投資人錯過了Uber。有人告訴我,他們當時算了一筆帳:舊金山的計程車市場每年約為5億美元,如果Uber拿走20%,這生意就不值得投。但他們沒算到的是,由於價格和便利性的變化,拼車市場擴大了四倍,而且Uber從計程車手中搶走了80%的份額。如今,Uber僅佔所有城市出行里程的1%。根據我們在《Big Ideas》裡的分析,要滿足這1%的里程只需要14萬輛車;而要滿足全美所有的城市里程,需要2400萬輛車。考慮到美國現有的4億輛汽車保有量,Robotaxi(機器人計程車)的增長將徹底摧毀我們熟知的汽車市場結構。Peter:同意。我們正在見證“認知的商品化”。人類經濟的基石,智能,正以每年99%的速度降價。這是一場逐底競爭。我的問題是,隨著價格暴跌,大語言模型(LLM)公司能否維持建構AI基礎設施所需的收入?凱茜,你對這些前沿模型的商業閉環有擔憂嗎?Cathie Wood:觀察OpenAI最近的動向非常有趣。他們開始商業化了,規劃了廣告、電商和機器人業務。但我們聽說他們的廣告報價是每千次展示(CPM)60美元,這相當於超級碗廣告的價格,而Facebook目前只有20美元。OpenAI可能會因為控制了供應端而暫時得逞,但我們的分析師認為這不可持續。Google的Gemini不會這麼做,他們有Google龐大的現金流支援,可以打價格戰來搶佔市場份額。這對OpenAI來說不是好消息。雖然OpenAI有9億使用者的先發優勢,但他們必須加快收入增長來支撐基礎設施擴張。這可能意味著他們需要在某些方面收縮戰線,更加專注。Dave Blundin:我想插一句。幻燈片上提到AI Agent在長期任務上的成功率是80%。彼得,你說任何員工如果只有80%的成功率都會被解僱,但這還沒算完。如果把上一張關於推理成本降至零的幻燈片結合來看,你會發現:無論推理變得多便宜,離真正的“零成本”還很遠。因為人類對“思考循環”的渴望是無限的。正因為彼得提到的80%成功率,如果你啟動100個AI Agent去解決同一個問題,只要其中一個成功了,整體成功率就會極高。這是一種“暴力破解”法。因此,對智能的需求基本上是無限的,人們會花光所有預算去獲取更多的智能。Cathie Wood:另外,最近那個開放原始碼的Claude機器人(Claude-bot)真是令人驚嘆。它在一個周末內就火遍了網際網路。你可以把它看作個人版的Jarvis,它能運行在你的電腦上,幫你組織工作、連接社交媒體和郵件,甚至在你睡覺時自動完成任務。我們的首席AI分析師只用了一個周末,工作效率和條理性就有了質的飛躍。Dave Blundin:沒錯。它之所以還沒被大型AI實驗室直接推出,是因為它非常強大但也具有破壞性,如果出了差錯,它可能在兩秒鐘內搞亂甚至損毀你的電腦系統。所以使用時要小心,但這也正是它強大的原因。這不僅僅是技術,更是一種文化現象。Dr. Alexander:凱西,我想回到你剛才提到的一個非常有趣的觀點。據我所知,還沒有人像你這樣表述過。很多人,包括本節目的嘉賓,都在擔心GDP增長與實際財富增長之間存在固有的不一致,甚至擔心超級通膨。但你提出了一個相反的獨特視角:隨著人類將越來越多的服務委派給AI代理,從GDP的角度來看,這種“委派”構成了商業活動。本質上,我們將人類個體的角色與生產性服務剝離,而這些細分領域之間的互動許多將由代理完成,這反而會增加對GDP的貢獻並促進商業發展。所以,你描繪的是一個GDP資料可能爆發式增長,但實際人類財富或許保持不變的圖景。那麼我想問你,如果你能揮動魔法棒,給出一個並不是單純指GDP增長,而是定義“人類真實財富增長”的完美指標,你會如何定義?Cathie Wood:財富增長在很大程度上與生產率增長密切相關。我所說的實際財富增長,不是指由價格驅動的房地產泡沫,而是由技術推動的生產力提升。我們在80年代和90年代初曾稍微嘗到過一點甜頭。那時是PC時代和網際網路時代的開端。對金融市場而言,那是一個輝煌的時期,因為軟體的潛力首次被真正釋放。雖然我們在80年代經歷過一段“索洛悖論”時期,當時人們覺得科技發展似乎反而削弱了生產力,但隨後微軟崛起,緊接著迎來了網際網路熱潮。這只是我們即將經歷的變革的前奏。如果你回顧歷史,從糟糕的70年代到80年代初,生產率增長幾乎為零甚至為負。隨後生產率開始回升,金融市場隨之繁榮,通貨膨脹開始下降。我之所以對此深有感觸,是因為在我職業生涯早期,我們就判斷通膨會下降,而當時大多數人認為除非發生經濟大蕭條,否則這不可能發生。但事實恰恰相反,通膨下降是由於技術帶來的生產率增長以及合理的貨幣政策。這裡有一個與哈佛學派相關的凱恩斯主義經濟學的不同觀點:凱恩斯主義認為增長會導致通膨;但實際上,增長不會導致通膨,反而會導致通縮。我們即將進入的世界是通縮性的,這是“好的通縮”,即當商品價格下降時,需求會激增。2.在AI時代重新定義財富Dave Blundin:凱西,我也許可以順著這一點深入問一下。這似乎是問題的核心,不僅關乎視覺展示,也關乎你更廣泛的投資論點,即GDP可能不是衡量進步的最佳宏觀指標。聽起來你認為“人均生產力”才是關鍵。但最終,作為通過ETF進行的投資,你必須用美元或其他單位來量化它。我好奇的是,我們應該設定什麼樣的基準?你顯然在投資未來的行業。而標普500指數(S&P 500)作為傳統的基準,可能無法正確衡量通向未來的進步。如果讓你設定一個單一的度量標準來最佳化進步本身,那會是什麼?Cathie Wood:首先,關於指數化投資,這是我的一個痛點。目前的金融市場結構確實如此,埃隆·馬斯克(Elon Musk)對此也有非常強烈的看法,我們在一次X Space的對話中花了很多時間討論這個話題。標普500、納斯達克這些榜單前列的公司,代表的是過去的成功。如果我們的判斷是正確的,即我們正進入有史以來最具顛覆性的創新時期,那麼傳統的舊世界秩序將被打破。長期來看,標普500的名義回報率一直維持在個位數的高位。但我們認為這將會改變。因為標普在納入新股票時往往滯後,他們需要先看到收入增長和盈利能力。在我們的《Big Ideas》報告中,我們預測顛覆性創新在未來五年內將以年化35%的速度複利增長。Peter:你們那只基金專注於這個方向?Cathie Wood:我們所有的基金都專注於此。我們的旗艦基金ARKK整合了所有這些平台。這是一項艱巨的任務。我們經歷了一段非常艱難的時期,特別是在遭遇供應衝擊和與新冠相關的貨幣政策時,創新股在包括風險投資在內的各個領域都遭受了重創。當時很少有人相信創新,但我們認為現在正在走出困境。橡皮筋已經被拉得很長,事實上,企業已經加速了世界各個角落的數位化處理程序。Peter:僅僅看ARKK,過去兩年的年化回報率大約在31%到33%之間,這相當了不起。Cathie Wood:是的,我們的三年資料正開始向我們預期的數字攀升,但為了達到平均值,我們還得超過35%。如果你要我嘗試用一個經濟指標來衡量進步,當大多數人關注GDP時,我會關注國民總收入(GNI)。理論上,GNI和GDP的增長率應該相等,但實際上並非如此,兩者總是存在統計差異。這種差異正在擴大,因為從產出角度(GDP)我們無法精準測量剛才討論的許多技術影響,但這些影響會在收入端(GNI)顯現出來。Peter:所以答案是GNI,而不是某種人均生產力?Cathie Wood:對,我認為應該是GNI。生產率也很難測量,這就是為什麼我們認為目前的生產率被低估了,年化增長率大約被低估了2%。這意味著什麼?按照GDP的構成方式,如果我們低估了生產率,那麼我們就低估了實際GDP增長,同時高估了通貨膨脹。這像個拼圖,如果政策制定者不具備我們這種思維方式,盲目信任公佈的資料,就會在政策上犯錯。3.10兆美元公司的預測Peter:凱西,我想問你。到2030年,我們會看到市值達到十兆美元的公司嗎?比如SpaceX是會上市,還是可能與特斯拉合併?你認為埃隆會通過那種方式為SpaceX獲得流動性或穩定性?Cathie Wood:這很有趣。我不確定埃隆是不是在你的播客裡提到過,但我聽說過他說預見到旗下公司的融合,這是我之前沒預料到的。不過我們確實已經討論這種情況一段時間了,因為在人工智慧的世界裡,要取勝就必須擁有專有資料。想想他擁有的所有專有資料:特斯拉擁有路面的語言資料;Neuralink擁有多組學資料;SpaceX擁有太空資料;X擁有獨特的社交資料;Boring Company也有別人沒有的資料。所以,我確實認為由於這種融合驅動,到2030年那些兆美元等級的公司將會開始上線。Peter:我認為主要的候選者就是特斯拉,正如你剛才所說的原因。而且可能會有一些組合作為其中一部分發生。Cathie Wood:是的,這也很有趣。我知道有傳聞說SpaceX正在接觸投行人士,但我以前從未想過SpaceX會上市,也不覺得有必要。畢竟埃隆在特斯拉的公開市場經歷並不愉快。但如果SpaceX真的上市,那可能是為了抓住軌道資料中心(Orbital Data Center)的機會。Peter:其實在這個播客上我們也問過埃隆。那是關於他最不可思議的事情之一。我們問他:“看看你的商業帝國,Starlink、全球太空資料中心、雷射鏈路,這一切難道不是你畢生心血的匯聚點嗎?通向這個驚人的十兆美元的成功,當時的遠見一定非同凡響。”但他卻笑著說:“不不不,這完全是運氣,這些事情彼此毫無關聯。”我覺得這太不可思議了,他本可以藉機吹噓自己的遠見或宣稱自己是天才,但他沒有。Cathie Wood:其實這是因為人工智慧正在導致一切融合。這就是為什麼我們在組建公司和組織研究時,讓機器人工程、能源儲存和AI分析師共同協作來研究它。在傳統的金融機構裡,汽車分析師通常只懂內燃機,不懂技術,他們經常為此爭論地盤,導致技術分析師的話語權旁落。這就是為什麼華爾街到現在仍然看不懂特斯拉。Peter:沒錯,凱西。我對“專家”的定義就是那些能確切告訴你為什麼某件事做不成的人。那麼,讓我們進入最內層的循環,談談能源。再次引用《Big Ideas Report 2026》的圖表,我們看到越來越高效的能源正在驅動全球經濟,每美元GDP對應的千瓦時能耗正在下降。此外,太陽能和電池成本也在大幅下降。我認為人們並沒有真正意識到能源在根本上有多麼關鍵。它不僅與GDP相關,還與每個國家的生活水平、健康和教育息息相關,尤其是在現在的資料中心爭奪戰中,它已成為國家主導地位的根本。凱西,你對此有什麼看法?Cathie Wood:經濟活動本質上就是能量的轉化。那些盲目說能源是壞事的人,並不清楚自己在說什麼,他們基本上是想把我們逼回黑暗的中世紀。如果我們要進步,就必須使用更多能源。關於核能,特別值得注意的是,美國和日本在70年代開始的過度監管扼殺了這個行業。如果按照賴特定律,隨著技術進步建設成本本應下降。如果我們在核能上繼續沿賴特定律發展,今天的電力成本會比現在低40%。所以我認為我們對核能重新燃起的熱情很重要,這將把我們帶回成本下降的軌道。當然,還有太陽能。埃隆關於軌道資料中心的願景,也會為資料中心的太陽能採購注入強大動力。Dr. Alexander:我很好奇,凱西。你認為是因為核能過度監管,還是其他原因,導致1971年後美國經濟走上了一條不同的道路?Cathie Wood:我認為,當年放棄金本位制、關閉黃金窗口,導致貨幣政策除了受人性的脆弱影響外,不再與任何實質事物掛鉤,這實際上開啟了一段艱難的時期。隨之而來的是工資和價格管制、各種市場扭曲,以及整體監管力度的增加。核能產業就是這種情況的一個縮影。我記得那是1974年或1975年左右,在脫離金本位制後,我們失去了約束,油價幾乎瞬間翻了四倍,這讓我們走上了一條非常糟糕的道路,我們也因此停止了載人登月計畫。隨後出現了里根經濟學(Reaganomics),即沃爾克(Volcker)的貨幣政策與里根的經濟政策相結合,包括放鬆管制和減稅,這一策略今天仍在被沿用。目前美國的企業實際稅率在發達國家中屬於極低水平。雖然川普在第一任期內開始降低稅率,但在新稅法之前的折舊時間表其實並不利於創新。現在的新政策允許製造業結構在投入使用的第一年就完全折舊,而不是分30到40年逐步折舊。這意味著,任何在美國建設製造設施的公司,只要在2028年底前開工,就能獲得巨額退稅,並可以將這些資金重新投入研發,從而降低價格,推動再工業化。我們正在見證這一切,未來幾年我們將迎來一場經濟繁榮,這甚至會讓埃隆·馬斯克所說的5倍GDP增長都顯得保守。這聽起來是非常合理的預測。4.AI與未來投資方向Peter:Dave,我很好奇,我們之前在簡訊裡聊過關於下一波投資方向的問題。當然這不是投資建議,但你提到了能源基礎設施。小型模組化反應堆(SMRs)、核裂變能源,以及雖然目前還有點遙遠的核聚變,都是關注重點。同時還有資料中心的建設。這些領域的數字看起來非常驚人,這將是我們看到上市公司中投資最多、增長最快的領域。Dave Blundin:我們與凱西(Cathie Wood)以及Peter你的科技路線不同之處在於,我們並不試圖一次性部署上百億美元,所以我們可以更靈活地深入觀察資料中心的技術堆疊。你會發現,供應鏈中的某些元件突然之間面臨無限的需求。我們在Boom Supersonic(Boom超音速公司)身上也看到過類似的情況。這是一家製造超音速飛機的公司,其引擎元件的價值突然上漲了10倍甚至100倍,因為同樣的元件可以用於製造發電機,而這些發電機多年來一直處於積壓狀態。Peter:我認識Boom的創始人,當時我就覺得處理聯邦航空管理局(FAA)的監管簡直是瘋狂的挑戰。但後來他們找到了市場,完成了一次出色的轉型。Dave Blundin:沒錯,這是一個絕佳的轉型案例。這其實是兩個不同層面的案例研究:一個是與這次人工智慧(AI)建設相關的任何事物,如果你能搶先發現,可能會帶來千倍的回報;另一個是關於優秀的團隊如何轉型。有些項目乍看之下像是一潭死水,但如果你意識到這是一個了不起的團隊,你會發現他們轉型的速度比以往任何時候都快。所以,無論如何都要選擇並堅持支援優秀的團隊。Peter和我討論時,我們一直在尋找那些尚未被發現的機會。比如Alex對光子學(Photonics)有很多見解,在大型資料中心的網際網路互連、讓資料高速傳輸方面,存在著巨大的機會。但我認為這一切都指向同一個主題:如果你看未來幾年,軌道資料中心、對晶片的無限需求,以及將這一切連接起來的管道、布線和粘合劑,到處都是潛在的機會。Cathie Wood:我想回應Dave剛才提到的很重要的一點,那就是必須從“出色的團隊”開始。我們看到那些轉型之所以非常成功,是因為不同技術之間的融合創造了全新的產業。因此,轉型的機會比以前多得多。如果你因為擔心監管阻礙而錯過交易,那將是一個風險。因為就像Boom那樣,有時一次轉型正好能契合監管的需求,甚至監管機構也希望這種改變發生。關於這張幻燈片,我想指出,到2030年,全球電力累計投資需要增加到10兆美元。這說明我們將在電力方面進行巨額投資,毫無疑問,數兆美元將投入到與AI相關的一切基礎設施中。Dr. Alexander:我想問凱西,也想問問在座的各位關於能源的話題。也許你們看過Apple TV的劇集《為全人類》(For All Mankind),它提出了一個替代歷史的場景:如果蘇聯先於我們登上月球,太空競賽從未結束,核能技術因此被快速推進,歷史會怎樣發展?我很想從“學習曲線”的角度探討這個替代歷史。如果20世紀70年代中期我們的發展沒有脫軌,我們現在在能源領域應該達到什麼水平?是落後了十年,還是五十年?Cathie Wood:在能源方面,特別是核能,我不能說我們整體落後了,但我認為我們在新建項目上確實落後了。美國需要大、中、小型反應堆的全面投資。毫無疑問,我們在核能上確實浪費了很多時間。由於美元是儲備貨幣,我們在70年代將通貨膨脹帶給了全世界。雖然瑞士等少數國家能夠抵抗,但這總體上是一個全球現象。但我認為我們現在的心態是正確的,矽谷一直保持著正確的心態。我們正試圖在這裡打造一個新的創新中心,加州的稅法可能也在推動這一點。雖然AI人才聚集在矽谷至關重要,但我們現在看到創新力量正在分佈到全美各地。隨著創新成本的急劇下降,個人的能動性變得越來越強,你可以在任何地方成為企業家。5.自動駕駛車輛的未來Peter:我們現在進入最後一個話題,自動駕駛汽車。關於這個話題有太多可以討論的,比如人形機器人,也許我們在討論特斯拉時會順帶聊到。目前的消息是,自動駕駛計程車終於來了。我們已經看到了Waymo的進展,CyberCab也即將上線。Uber、Lucid都在部署自己的車隊。資料顯示,Waymo的份額正在上升,而Lyft和Uber在下降。我們在聖塔莫尼卡出差時,往返機場或送孩子上學的路上,平均每天能在街上看到10到12輛Waymo。我認為大約在四五年後,80%的車輛將是自動駕駛汽車。你們怎麼看?Cathie Wood:我們同意這個觀點。正如我們的研究報告所示,我們預計從平台角度看,特斯拉將是最大的贏家,Waymo將位列第二。原因在於Waymo的成本結構依賴於外部供應鏈,這與特斯拉的垂直整合模式完全不同。這正是埃隆的運作方式。Waymo曾一度難以吸引汽車零部件供應商,所以他們現在正與極氪(Zeekr)、現代(Hyundai)等公司合作。目前他們在全美的車輛少於3000輛,如果你一次行程能看到10輛,說明它們高度集中在你所在的區域。我們認為從成本角度看,特斯拉的方案將比Waymo低50%,因此能夠收取更低的費用。目前Uber的平均價格隨著高峰定價上漲了40%,達到每英里2美元到2.8美元。而我們的研究證實了埃隆的說法:當達到規模效應時,特斯拉能夠將價格定在每英里20美分。在達到那個低價之前,巨大的價格保護傘將導致特斯拉的現金流暴增。Dave Blundin:你完全說對了,凱西。在去參觀特斯拉超級工廠之前,我完全沒意識到這一點。我曾以為埃隆不喜歡供應商只是因為他是個控制狂,但這並不是真的。他不依賴供應商是因為他看到了製造業的指數級機會。需求會在一夜之間飆升,而滿足這種需求的唯一方法是將原材料(如原鋁)在工廠的一端輸入,在另一端直接產出汽車或晶片。你必須內部製造所有東西並提前規劃。如果你像Waymo那樣,在供應鏈中缺少那怕一個受限元件,整個生產鏈都不得不停下來等待。Cathie Wood:絕對是這樣。對Waymo和特斯拉的需求都會是無限的,但特斯拉能更快地生產更多汽車,因為埃隆將所有環節都納入了那個完全指數級自動化的內部供應鏈中。Salim Ismail:我認為如果特斯拉允許人們擁有自己的汽車並將其轉變為計程車,那將是一個巨大的優勢,這更符合指數級增長組織的特點。那樣的話,你甚至不需要擁有自己的資產,這正是Uber增長如此迅速的原因。Peter:凱西,在技術融合的討論中,你有沒有關注這樣一個概念:數以百萬計的自主聯網計程車,實際上就是移動在城市中的推理引擎(Inference Engines)和能源儲存裝置?Cathie Wood:哦,當然。這與埃隆關於我們電網目前效率低下的觀點不謀而合。電網在晚上的利用率很低,而白天有時又被過度使用。這是一個典型的分佈式能源生態系統機會。Dave Blundin:令人驚訝的是人們多麼低估這一點。如果你看特斯拉的超級工廠,街對面就是Optimus(柯博文機器人)的工廠,旁邊還有資料中心。這裡的核心在於,所有元件都是通用的。當你對比福特或通用汽車時,你會問:“你們到底在做什麼?”他們從別處訂購底盤和動力總成。如果他們明天想轉型成一家機器人公司,他們做不到,因為他們只是在組裝第三方的元件集合。他們只能是一家汽車公司。而埃隆建構帝國的方式是,整條製造鏈的每一個環節都可以在短時間內轉向,例如變成衛星製造業務。整條長鏈本質上是可重構的機器人。我認為這可能是他獨有的優勢。也許Google在做類似的事情,我不確定,但這就是未來。所有這些都可以通過AI和機器人進行重新配置。Cathie Wood:在這個方面,美國汽車行業正在減少對電動汽車的投入,開始收縮,但他們又試圖搞清楚如何切入Robotaxi(機器人計程車)領域。這一切最終會融為一體,而特斯拉早就看明白了這一點。埃隆在他的宏圖計畫裡早就寫明了。如果傳統車企認真對待過他,那答案早就擺在他們面前了。Peter:我看不出傳統汽車行業能挺過這一劫。未來是與AI深度整合的:AI知道你的日程,當你走向前門拉動門把手時,自動駕駛汽車已經在那裡等你,你甚至不需要叫車。Salim Ismail:關鍵在於,我們只需要幾千萬輛汽車就能覆蓋所有人的出行需求。現在全球每年銷售9000萬輛新車,這是瘋狂的供應過剩。Dr. Alexander:但我認為,對不同形狀和尺寸的機器人的需求實際上是無限的。所以我認為汽車行業會以某種形式存活下來,就像自行車演變成馬車、再演變成飛機和汽車一樣。這個行業會演變成機器人行業,並且規模比以往任何時候都大。Dave Blundin:但在行業內部,有些公司根本沒有做好轉型的準備,而其他公司則準備充分。在這方面,美國人有一種特質,那就是熱愛重塑,我們願意把舊的東西扔掉,去建立一個全新的創業公司。Salim Ismail:我想強調一個非常關鍵的點。有人類駕駛員的網約車服務與完全自動駕駛之間的成本差異,實際上超過了10倍,這是一種驚人的成本下降。Cathie Wood:問題的核心在於,傳統車企是在內燃機和人工駕駛的環境下成長起來的,這導致它們的企業基因與當前的技術變革不匹配。雖然人們常說它們可以重新配置、整合或重組,但在顛覆性創新領域,這種轉型往往難以成功。我認為它們無法在這個新領域獲勝,因為這涉及三項技術的深度融合:機器人技術(像埃隆·馬斯克那樣將汽車視為機器人)、人工智慧(這是方程中永恆的一部分)以及能源儲存。隨著電池技術的發展,電動汽車的成本持續下降。相比之下,內燃機是一個完全成熟的行業,根據賴特定律,由於其累計產量基數巨大,成本翻倍從而帶來成本下降可能需要上百年的時間。因此,傳統車企無法像堅持做電動汽車那樣享受到成本下降曲線帶來的紅利。Dr. Alexander:我認為我們可能遺漏了一個非常重要的組成部分,也就是埃隆所說的“製造那些生產機器的機器”。我們在討論內燃機與電動汽車的對比時,往往忽略了它們的製造方式。目前的傳統汽車公司在很大程度上依賴受工會保護的人工勞動,而在未來,大部分製造工作將由機器人自動完成。所以我想問Cathie,你是否認為對於傳統汽車公司,至少是美國汽車公司,來說,真正的競爭障礙在於它們無法像特斯拉那樣,實現高度機器人化的製造自動化?Cathie Wood:毫無疑問。大概三四年前,埃隆曾說過:“我發現自己其實是一個工廠的製造者。”這對我們來說也是一個重要的頓悟時刻。他在設計未來的工廠,並引入了正確的技術。Dave Blundin:回到Alex的觀點,當初位於加州的初代超級工廠(Gigafactory)在疫情期間被迫停工時,埃隆決定搬離加州,前往德克薩斯州,在一個監管環境更友好的地方從頭開始建設。如果你看看傳統汽車公司,它們受到工會、養老金計畫以及與當地選區緊密繫結的制約。因此,在一個新的司法管轄區從頭開始建廠,實際上比改造傳統車企的現有生產線要便宜得多。Salim Ismail:是的,歐洲的情況更糟。例如在德國,他們有工人委員會來決定寶馬或梅賽德斯作為公司被允許做什麼。這在達沃斯論壇上也成為了一個重要話題。歐洲的資本如果沒有好的去處,比如你想藏錢可以去列支敦斯登或摩納哥,但如果你想在一個監管相對理性、或者說較少受限的環境中建立一家低成本汽車公司,你會去那裡?Cathie Wood:我知道大多數人認為歐洲在技術和監管層面已經完全沒希望了,因為創新的崩塌和個人能動性的減弱。從宏觀層面上我同意這一點。但我想問,歐洲有什麼是其他地方沒有的?為什麼我們都去那裡度假?Dave Blundin:建築,還有生活方式。Cathie Wood:對,生活方式、悠閒的節奏、美食。所以我不會完全否定歐洲,他們會像以往那樣為世界其他地區提供服務,生活方式、旅遊服務、漂亮的廣場和濃縮咖啡。Dave Blundin:我來做個預測。歐洲擁有令人難以置信的潛在人才儲備,才華橫溢。歷史上,像印度這樣的人才流出國,人們去美國賺錢後往往會回國退休。但歐洲人以前不這麼做,因為離開歐洲太難了,那裡的生活太美好了。但我認為現在差距已經變得如此之大,真正的創業群體將開始湧向美國,工作十年,保留在歐洲的居所,然後來回往返。Salim Ismail:我可以提出反方觀點嗎?我認為過去對於歐洲企業家來說,來美國是一個可行的選擇,但現在這已經不再是唯一的路徑了。接下來會發生的是,歐洲將被迫改變監管制度。目前的結構無法維持,必須通過設立特別經濟區或進行結構性變革來突破,否則就會陷入“死亡螺旋”。我們在今年的達沃斯看到了這種跡象,他們試圖建立一種“歐盟公司”(EU Inc.)的概念,即在一個國家註冊就等於在所有國家註冊,並統一創新體系的規則。Peter:這是我們的最後一張幻燈片。全自動配送已經到來了。雖然我們長期以來一直關注機器人計程車(Robotaxi),但我們看到目前每年已經有400萬次無人配送。Cathie Wood:是的,最美妙的是他是從盧安達開始的,利用無人機運送醫療用品。據統計,他將孕產婦因產後大出血導致的死亡率降低了50%以上。Peter:所以,我們在空中看到了Zipline和Wing實現了無人配送,還有Matternet。在地面上,我們有Starship、Meituan和Coco Robotics等幾十家公司。當然,我們也看到了卡車運輸自動化的起步。有趣的是,地面交通已經很擁擠了,目前空中航線雖然是開放的,但最終也會變得擁擠。如果配送量激增,主要是來自Zipline和Wing,我很好奇人們是否會開始抱怨噪音問題,因為它們雖然在高空飛行,但需要通過纜繩放下貨物來完成投遞。Dave Blundin:航道是三維的,物理上不會那麼快擁擠,但你說得對,噪音將成為一個非常大的問題。如果有人能發明出靜音無人機,那將徹底改變遊戲規則。 (劃重點KeyPoints)
【達沃斯論壇】黃仁勳:管道工、電氣工、建築工人,收入將達“六位數
1月21日,在達沃斯的聚光燈下,輝達掌門人黃仁勳與貝萊德(BlackRock)掌門人賴瑞·芬克(Larry Fink)展開了一場長達半小時的巔峰對話。深科技(deeptek)整理黃仁勳十大核心觀點:黃仁勳稱已投數千億美元僅開胃菜,AI基建需後續數兆美元投入。他否定AI泡沫論,認為這是人類歷史上規模最大的基建熱潮。提出AI“五層蛋糕”理論,涵蓋能源、晶片等從基礎到應用的全層級。AI未致失業,反而催生大量年薪六位數的藍領崗位,如電工、管道工。以醫療為例,AI承接重複工作,助力醫護專注核心診療與護理。強調AI主權,建議各國自建AI能力,築牢新時代基礎設施主權。AI實現三大突破,從聊天到辦事,開源興起且覺醒物理智能。輝達GPU一芯難求,新舊型號租金、價格攀升,成AI熱度風向標。全球科技公司加碼AI基建,超5000億美元投向資料中心建設租賃。AI是實幹型基建,待基礎設施完善,其時代價值將全面釋放。以下是黃仁勳對話實錄(AI翻譯,黃仁勳與賴瑞·芬克達沃斯對話精簡版)賴瑞·芬克:大家早上好。很高興重返會場,也榮幸介紹黃仁勳——我欽佩已久的技術導師。輝達與貝萊德均於1999年上市,輝達為股東帶來37%的年化復合回報率,貝萊德為21%,這充分印證了黃仁勳的領導力與輝達的市場地位。祝賀你,黃仁勳。黃仁勳:謝謝。我唯一的遺憾是IPO後為給父母買奔馳S級轎車,賣掉了部分輝達股票,當時公司估值僅3億美元。他們至今還留著那輛車,只是很後悔。賴瑞·芬克:很好。今天我們聚焦AI如何賦能全球經濟、成為基礎技術,重塑行業生產力與包容性。在AI基礎設施領域,沒人比你更有發言權。感謝你首次出席達沃斯論壇。請問,為何AI能成為關鍵增長引擎?與以往技術周期有何不同?黃仁勳:這是一次全新的計算平台轉移,如同從PC、網際網路到移動雲端的變革,整個計算堆疊將被重構,新應用會不斷湧現。不同於傳統“預錄製”軟體僅能處理結構化資訊,AI可理解圖像、文字、聲音等非結構化內容,即時捕捉上下文、推理意圖,通過提示詞完成任務。AI本質是五層架構:底層為能源,第二層是晶片及計算基礎設施,往上依次是雲服務、AI模型,最頂層是應用層,也是產生經濟效益的核心。這一體系已啟動人類史上最大規模基礎設施建設,目前全球投入數千億美元,未來還有數兆美元空間。台積電、富士康等正新建晶片廠、電腦廠,美光、三星等記憶體企業也在大幅擴張。2025年風險投資規模創紀錄,大量資金流入醫療、製造等領域的AI原生企業,印證模型已能支撐實際應用。賴瑞·芬克:請深入談談AI在物理世界的普及機會,比如交通、科學領域有那些變革性可能?黃仁勳:去年AI技術有三大突破:一是語言模型進化為代理系統,能推理未知場景、制定執行計畫;二是開放模型崛起,為各行業定製化應用奠定基礎;三是物理AI取得進展,可理解蛋白質、流體動力學等自然規律。以禮來合作為例,AI能像對話ChatGPT一樣解析蛋白質結構,推動藥物研發突破。賴瑞·芬克:很多人擔心AI取代工作,你卻認為會面臨勞動力短缺。如何看待AI對工作性質的改變而非消除?黃仁勳:首先,大規模基礎設施建設將創造大量藍領崗位,美國相關行業工資近乎翻倍,由於對運行和訓練的人工智慧資料中心建設的需求,水管工、電工和建築工人將能夠獲得“六位數年薪”。其次,實際案例證明AI會最佳化工作而非替代。放射科AI普及十年後,醫生借助AI高效分析掃描圖,有更多時間診療患者,醫院接診量提升,放射科醫生數量反而增加。護士行業也是如此,AI替代圖表記錄工作後,護士能專注病患護理,醫院營運效率提升,進而僱傭更多護士。核心是區分工作的“目的”與“任務”,AI自動化任務,最終強化工作目的。賴瑞·芬克:AI目前多由受過教育群體主導,如何讓它惠及新興市場,縮小全球鴻溝?黃仁勳:AI是必備基礎設施,各國都應依託開放模型和本土語言文化,搭建專屬AI生態。AI是史上最易用的軟體,兩年內覆蓋近10億人,普通人無需電腦學位就能借助它程式設計、建站。掌握AI提示、管理、評估技能,就如同掌握領導力,它能縮小技術鴻溝,為開發中國家創造巨大機遇。賴瑞·芬克:歐洲在AI領域的機遇何在?輝達將扮演什麼角色?黃仁勳:輝達為全球所有AI場景提供底層算力支援。歐洲工業基礎和深層科學實力雄厚,AI無需複雜程式設計、可通過“教學”實現應用,這是歐洲將工業能力與AI融合、佈局物理AI和機器人領域的絕佳機會。歐洲需強化能源供應,築牢基礎設施層,啟動AI生態潛力。賴瑞·芬克:這是否意味著AI並非泡沫,而是投資不足?黃仁勳:GPU租賃供不應求、現貨價格上漲,證明AI需求真實。企業研發預算正加速向AI轉移,基礎設施建設是支撐各層級AI的前提,投資規模大是必然。這對養老基金是重大機遇,應讓普通儲戶分享增長紅利。歐洲擁有強大技能勞動力,務必抓住這一機會。賴瑞·芬克:這是人類史上最大規模的基礎設施建設,值得積極參與。感謝黃仁勳的深刻分享,他不僅是技術領袖,更兼具感性與共情力。謝謝大家。黃仁勳:謝謝大家。 (深科技)
思想史|經濟學家的優勢地位來源於什麼?
原標題:The Superiority of Economists作者:Marion Fourcade, Etienne Ollion, and Yann Algan來源:Journal of Economic Perspectives—Volume 29, Number 1—Winter 2015—Pages 89-114譯者:Wittt社會科學領域存在著一種隱性的等級秩序,而經濟學似乎佔據著主導地位。首先,經濟學家們自視處於學科層級的頂端或近頂端位置。21世紀初的一項調查顯示(科蘭德,2005),頂尖項目中77%的經濟學研究生認同 “經濟學是社會科學中最具科學性的學科” 這一說法。大約15年前,理查德·佛里曼(1999,第141頁)在本刊中推測了這種信念的起源。他的評價直言不諱:“社會學家和政治科學家的分析工具不夠強大,知識儲備也不如我們——至少我們是這麼認為的。從研究生入學考試(GRE)成績和其他標準來看,我們領域吸引的學生比他們更優秀,而且我們的課程對數學能力的要求也更高。”乍看之下,學術勞動力市場似乎印證了經濟學家對自身更高地位的判斷。得益於瑞典銀行向諾貝爾基金會提供的捐贈,他們是唯一擁有“諾貝爾” 獎項的社會科學家群體。根據美國勞工統計局的資料,經濟學家在美國文理學部的薪酬水平名列前茅。事實上,正如佛里曼所寫的那樣,他們 “收入更高,職業前景也更好”,甚至超過了物理學家和數學家;只有電腦科學家和工程師的薪資水平更勝一籌。與理論科學和人文學科的許多學者不同,許多知名經濟學家有機會通過諮詢費、私人投資與合作以及擔任企業董事會成員等方式獲取額外收入。例如,韋爾(即將出版)提供的相關證據表明,金融和產業組織領域的經濟學學者,其40%的收入來自諮詢活動——要麼是為企業(金融領域)提供諮詢,要麼是為政府(產業組織領域)提供服務。2010年,紀錄片《監守自盜》揭露了該領域一些最傑出學者與華爾街金融圈之間利潤豐厚且可能存在縱容關係的內幕。經濟學家(尤其是頂尖大學的經濟學家)優越的經濟地位,再加上該學科對量化推理能力的重視(這種能力被廣泛視為更高智力水平的標誌),無疑是他們常常對其他形式不夠規範的社會科學抱有輕視態度的原因所在。但社會科學各學科之間關係疏遠還有其他原因。首先,各學科的社會構成存在差異。個體對不同學科的選擇在很大程度上受到社會屬性的影響。例如,與物理學、哲學類似,但與社會學形成鮮明對比的是,經濟學是一個男性佔絕對主導地位的領域(見圖1)。因此,跨學科關係不可避免地受到更廣泛的性別差異、階層分化和不平等模式的影響。儘管我們缺乏關於美國社會科學家社會出身的可靠比較資料(但可參見布林迪厄1984年和勒巴倫2000年關於法國的研究),但我們可以推測,不同學科當前物質條件的差異,也導致了學者們在生活方式、世界觀方面的顯著不同,以及學科間關係的緊張。其次,二戰以來,社會科學領域經歷了快速的人員增長,這導致了學科內部的分化和高度專業化(阿博特,2001;弗蘭克、加布勒,2006)。這一過程掩蓋了它們共同的起源——19世紀,歷史學和道德哲學催生了政治經濟學(關於美國的相關討論,參見哈斯克爾,1977;羅斯,1991),而20世紀初,美國社會學在一定程度上脫胎於經濟學(揚,2009)。在本文中,我們將從四個具體維度探討經濟學與其他社會科學之間不斷變化的關係。首先,我們將闡述經濟學在美國社會科學網路中的相對封閉性及其主導地位。儘管所有學科在某種程度上都存在封閉性——這是學術分工日益細化的典型結果(雅各布斯,2013)——但這一特徵在經濟學中表現得尤為突出。其次,我們將分析經濟學學科內部顯著的等級制度,尤其是與其他社會科學相比而言。該領域最具影響力的學者所擁有的權威,既促進了學術上的凝聚力,也推動了對學科內部事務的積極管理,這在其他學科中鮮有匹敵。第三,我們將考察二戰後經濟學領域附屬機構網路的變化,重點分析高等教育領域的變革(最顯著的是商學院的興起)和經濟領域的變革如何推動經濟學向商業主題(尤其是金融領域)轉向。最後,我們將對經濟學家的物質狀況、世界觀和社會影響力進行一些探討,這些方面也使他們區別於其他學術同行。綜合來看,這些特徵有助於解釋經濟學家的學術自信,進而解釋他們在公共政策事務中直言不諱的主張。當我們提及“經濟學家的優勢地位” 時,這一雙關語既具有描述性目的,也具有解釋性目的。經濟學在學術學科中佔據著獨特的位置。其特點包括:與形式化方法的使用相關聯的深遠科學主張;自上而下對學科的嚴格管理;市場(尤其是有權有勢的富裕群體)對其服務的高度需求;以及豐厚的薪酬回報。這種社會優勢地位也滋生了經濟學家的自信,使該學科能夠長期保持相對的認識論封閉性,並催生了一種自然的特權感。儘管經濟學向傳統上不屬於其研究範疇的社會科學領域進行的 “帝國主義式” 擴張,引發了一些與非經濟學學術成果的互動,但這種交流模式仍然存在嚴重的不對稱性,進而招致了不滿和敵意。同時,經濟學家的獨特地位賦予了他們改變世界的非凡力量,但當事情出錯時,他們也更容易面臨利益衝突、批評和嘲諷。封閉性二戰後,社會科學各學科的學術發展軌跡出現了顯著分歧。經濟學早已脫離其歐洲大陸的起源階段,不再注重歷史研究,轉而效仿自然科學中的典範學科(如物理學)(米羅夫斯基,1989)。與更具文學性的前輩不同,現代經濟學家將其學術地位和自主性歸功於對精確設定且簡潔的模型和測量方法的依賴。他們認為,該領域較高的學術入門技術門檻,以及學者們通過方程或明確的因果關係來捕捉複雜社會過程的努力,都是該學科秉持卓越科學理念的證據,這也證明了它與那些更注重論述的社會科學保持距離、缺乏互動是合理的。一個典型的例子是,拉澤爾(2000,第99-100頁)寫道:“經濟學的崛起源於這樣一個事實:我們的學科擁有一種嚴謹的語言,能夠將複雜的概念用相對簡單、抽象的術語表達出來。這種語言使經濟學家能夠剝離複雜性。複雜性可能會增加描述的豐富性,但也會阻礙分析者看到本質。” 一位著名教授在批判性地描述其學科狹隘的認識論要求時,也表達了類似的觀點(富卡德,2009,第91頁訪談):“你只能遵循特定的規則。如果你不遵守這些規則,你就不是一名經濟學家。這意味著你應該從嚴格的最大化理論中推導人們的行為方式……與公理化方法相反的是通過舉例論證。你不被允許這樣做……人們會說這是‘軼事證據’。一旦被貼上‘軼事證據’的標籤,你就完了……現在人們會說:‘這沒有被識別出來。’天啊,要是你的因果關係沒有被識別出來,那就全完了。”在二戰後的大部分時間裡,展現數學和統計能力,並將論點簡化為一套正式且簡潔的方程,確實是經濟學領域確立科學純粹性的主要途徑。隨著20世紀90年代和21世紀初的實證革命,這一功能轉向了一種注重因果關係的務實方法,側重於研究設計和推斷,並且常常推崇隨機對照試驗的優勢(例如,安格里斯特、皮施克,2010)。儘管這一轉變也受到了一些批評(例如,參見本刊中勒默2010年和西姆斯2010年的文章),但它與20世紀70年代和80年代如今已遭貶低的過度理論化傾向相比,是一個顯著的轉變。然而,嚮應用微觀經濟學的轉向雖然真實存在,卻並未顯著拓寬跨學科聯絡網路。誠然,經濟學家開始關注一些傳統上與社會學、政治學和心理學相關的主題——從政治制度到家庭結構、社區效應、同伴效應,或者(最近)社會流動性。但跨學科引用模式仍然證明了該領域的相對封閉性。當然,美國社會科學(歐洲大陸的社會科學往往更具包容性)最顯著的特徵之一是,其所有組成學科在很大程度上都是相互孤立地開展研究的:經濟學、社會學、政治學和心理學的學科內引用比例都很高。即便如此,經濟學仍然表現得尤為突出——1997年,其學科內引用比例高達81%,而社會學為52%,人類學為53%,政治學為59%(雅各布斯,2013,第82頁,資料來源於美國國家科學基金會《2000 年科學與工程指標》線上附錄6-54,基於每個領域被引用最多的期刊樣本)。經濟學的封閉性有幾個原因,其中最重要的是各社會科學學科不同的認識論文化以及它們之間的權力不平等。首先,經濟學家分析風格所附帶的行動理論,與許多人文科學的基本前提幾乎不相容——人文科學認為社會過程塑造個人偏好(而非相反)。相比之下,在經濟學中,“偏好無可爭議”(斯蒂格勒、貝克爾,1977):偏好 “通常被假定為固定不變的”(巴倫、漢南,1994,第1116頁)。其次,許多解釋性社會科學家所依賴的定性方法,往往與經濟學家的形式化追求、他們對因果關係的看法,以及他們優先考慮方法和理論精確性而非現實精準性的傾向不一致。第三,即使在研究領域存在重疊的情況下,學科之間顯性或隱性的等級秩序也常常阻礙著理想的學術互動形式。詳細考察跨學科引用結構會發現不同學科之間存在顯著差異。彼得斯和鮑姆加特納(2002)對1995-1997年的學術期刊進行調查後發現,經濟學與其他社會科學之間的引用流動存在明顯的不對稱性。我們對2000-2009年經濟學、社會學和政治學頂尖期刊的引用情況進行的分析也證實了這一模式。如表1所示,《美國政治科學評論》對排名前25位的經濟學期刊的引用次數,是《美國經濟評論》對排名前25位的政治學期刊引用次數的五倍多。而《美國社會學評論》的情況則更為懸殊:社會學家的引文中只有2.3%指向經濟學同行(可以說,其中許多是批判性的),而經濟學家的引文中只有0.3%指向社會學家(同樣僅考慮每個學科排名前25位的期刊)。當然,由於社會學和政治學的引用網路總體上更為廣泛,而且書籍(我們未納入統計)在這些領域發揮著重要作用,因此引用資料可能存在低估。即便如此,這些不對稱模式仍然值得深思,尤其是因為差異如此巨大,而且其他證據來源也都指向同一方向。對那些有意與其他學科互動的社會學和經濟學重要學者的引用情況進行針對性比較,就很好地說明了這一點。法國社會學家皮埃爾·布林迪厄是當今美國社會學領域被引用次數最多的學者,但在21世紀00年代,他僅在《美國經濟評論》中被提及過一次(而在《美國社會學評論》中被提及60次),而加里·貝克爾在《美國社會學評論》中獲得了41次引用(在《美國經濟評論》中為106次)。同一時期,馬克斯·韋伯和馬克·格蘭諾維特各自在《美國經濟評論》中被提及4次,但社會學家在《美國社會學評論》中引用詹姆斯·赫克曼25次,引用奧利弗·威廉姆森13次。在社會學家、地理學家、歷史學家、政治科學家甚至心理學家看來,經濟學家常常就像在他們的領域定居的殖民者——一些經濟學家自豪地宣稱 “經濟學帝國主義”(拉澤爾,2000),進一步強化了這一印象。受潛在豐碩成果的吸引,經濟學家迅速開拓新的研究領域。他們抵達後可能會尋求指導,甚至與 “當地人” 合作(如今他們常常共享相同的資料)。但他們不太可能從 “當地人” 那裡學到太多東西,因為他們往往更傾向於運用自己的研究方法。在某些情況下,他們的目的僅僅是為了糾正其他學科的錯誤(尼克-哈、范霍恩,2012)。特別是在芝加哥價格理論的影響下,主流經濟範式以理性選擇理論為旗幟,成功征服了政治學、法學、會計學的一部分領域,以及(曾一度征服了)社會學的部分領域——這在一定程度上解釋了上述引用模式的方向性。民意調查進一步證實了這一分析。表2顯示,與其他社會科學家乃至商學院的同行相比,經濟學家總體上對跨學科研究的重視程度更低。在被調查群體中,只有經濟學家中的大多數(相當大比例)不同意或強烈不同意 “總體而言,跨學科知識比單一學科獲得的知識更有價值” 這一觀點。這一結果與以下觀點一致:由於經濟學家對自己學科的優越性有著獨特的自信,他們不太可能覺得有必要依賴其他學科,甚至不太可能承認其他學科的存在。正如社會學家所深知的那樣,這種動態是不平等關係的典型特徵:在一個領域中處於核心地位的人往往不會注意到邊緣群體,也在很大程度上沒有意識到支撐其自身主導地位的原則(布林迪厄,1984)。相反,他們傾向於將權力和不平等合理化,認為這是 “應得的” 功績,是努力或天賦的正當回報。一個很好的例子是,他們會引用經濟學研究生更高的平均GRE成績,或者經濟學期刊更高的影響因子。然而,社會學家可能會指出,不同學科之間的這些差異在很大程度上是由階級、性別和種族等社會因素造成的。與此同時,邊緣群體則會不由自主地關注主導群體,無論是積極的還是消極的關注。學科內部的等級制度經濟學學科內部的學術結構常常被用來解釋這些不對稱關係:由於經濟學家成功地維持了比其他社會科學領域更統一的學科核心,其他領域更容易引用經濟學的成果(即使只是為了提出反駁論點),而經濟學引用其他領域成果的情況則較少。換句話說,一個統一學科的論點從外部更容易識別,而一個存在分歧的學科的論點則更不確定。表1顯示,與政治學和社會學頂尖期刊相比,《美國經濟評論》的引用不僅跨學科性更低,而且更集中。這表明,與其他領域相比,經濟學更傾向於向內看,更傾向於關注其內部等級制度的頂端。這種模式可以從兩個方面來解釋:一是經濟學領域的共識比社會學或政治學領域更多;二是經濟學領域的控制力更強。當然,這兩種解釋並非相互排斥:可能因為控制力更強,所以共識更多(例如,如果控制頂尖期刊的人推廣了關於優質研究構成的一致觀點);相反,也可能因為共識更多,所以控制力更有效、更易執行。大量證據表明,儘管經濟學家內部存在深刻的政治分歧,但與其他社會科學家相比,他們更有可能在一個高度整合且統一的框架內思考問題。例如,經濟學家在構成博士階段訓練核心的原則和工具方面達成了廣泛共識。他們對教科書的依賴也遠高於其他社會科學,包括研究生階段——而且研究生教科書往往由頂尖院系的教師編寫。1990年的一項調查發現,不同經濟學博士項目的研究生教育 “驚人地相似”(漢森,1991,第1085頁)。在拉蒙特(2009)研究的跨學科獎學金評審小組中,與其他學科的評審員相比,經濟學家內部的評價標準更統一,對自己在其他領域研究卓越性的判斷更有信心,而且更有可能作為一個群體團結在一起。只有歷史學家在對優秀歷史研究方法的判斷上,其一致性和凝聚力與經濟學家相似,但即便如此,歷史學家在政治立場上的內部分歧更大,在評判其他學科時也更願意考慮多種標準。在人文學科和其他社會科學領域,對研究提案學術價值的判斷分歧更大,共識更少,這使得在學科內部和外部識別重要成果變得更加困難。在控制力方面,經濟學家對其領域的管理非常嚴格。長期以來,學者們一直注意到,頂尖經濟學系對該學科的內部勞動力市場有著顯著的影響力(科爾,1983;惠特利,1984)。韓申甲(2003)對七個學科(即他們所說的 “學術部落制度”)的招聘過程進行了比較,提供了最有說服力的實證研究:其中兩個來自人文學科(歷史學和英語語言文學);四個來自社會科學(經濟學、政治學、心理學和社會學);還有一個是數學。利用《學術界》雜誌年度彙編的《就業動態:誰在何處獲得職位》(1993-2000),韓申甲不出所料地發現,所有學科都遵循 “聲望原則”:招聘在很大程度上取決於美國國家研究委員會和《美國新聞與世界報導》等來源所評估的院系聲望。院系之間的學生流動提供了明確的證據:大學只從排名相當或更高的機構招聘人才。因此,學術界類似於克勞德·列維-斯特勞斯([1949] 1969)曾經描述的親屬製度,在這種制度中,某些聯盟(學生與院系之間)是受青睞的,而另一些則因屬於禁忌而根本不可能存在。然而,這種聲望與職位安置之間的相關性在經濟學領域最為強烈。在經濟學領域,不同群體之間的界限比其他任何學科都更為明確。處於等級頂端的經濟學系之間的學生交流比例高於其他領域,包括數學。由此可以得出三個結論:首先,經濟學領域的等級制度定義得更為清晰;其次,經濟學領域的橫向整合程度更高,在招聘過程中有著強烈的互惠和凝聚力規範;第三,這些規範維持了院系間聲望等級的長期穩定性。相比之下,心理學和社會學是最分散、凝聚力最弱的領域,其聲望排名也最不穩定。求職過程每年的初級學術就業市場不僅結果不同,其運作方式也證實了社會科學各學科之間的這些差異。在經濟學領域,求職過程組織得非常有序,大多數院系會集體決定申請職位的本校學生的排名順序。這種在許多學術領域並不常見的程序,只有在經濟學家對質量標準達成強烈內部共識的情況下才有可能實現,而且該領域認為,這樣的招聘和安置過程可以更高效,同時不會改變結果。一旦院系確定了本校學生的排名,就會委託市場中介(“就業安置官員”)負責促成匹配,積極地向另一端的潛在僱主 “推銷”(可以說)這些候選人。最後,一個程式化的評估過程會逐步篩選出經過審查的候選人,首先是在1月初舉行的美國社會科學聯合會年會上進行面試。對於渴望獲得博士學位的畢業生來說,美國社會科學聯合會會議的真正重頭戲發生在酒店套房裡——招聘方(包括其他學術院系、政府機構、國際組織和私營企業)會在那裡連續幾天對求職者進行面試。與此同時,在公共會議室裡,資歷更深的學者會向同行展示他們的研究論文。社會學的初級就業市場與這種精心策劃的學生流動過程形成了鮮明對比。對於社會學的求職者和教師來說,集體管理學生與職位匹配過程的想法在實踐中既不可行,在原則上也令人反感。誠然,社會網路在其中發揮著作用,非正式接觸有時會先於實地“飛訪”(即邀請候選人到學校進行試講和面談),但它們很少像經濟學領域那樣採取全體委員會正式面試的形式。社會學系之間的等級制度也更加不確定。雖然確實存在垂直結構——社會學家也有 “市場明星”,並密切關注普遍引用的院系排名——但很難明確社會學等級秩序的支撐原則。由於缺乏生成公認等級制度的共識標準,或許也因為對同事的判斷缺乏信任,社會學家必須保持招聘過程的開放性,以便從底層逐步建立包容性的共識。而在經濟學領域,從一開始就存在更強的共識;關於候選人的 “資訊” 被認為是一致的,因此本質上是可靠的。結果就是,可能的選擇範圍被定義得更狹窄,而且確定得更早。發表過程經濟學的出版市場也比其他社會科學領域更為集中,這意味著在經濟學領域,頂尖期刊上發表的論文更多來自頂尖院系,這一比例高於社會學領域。無論是從作者所在的院系還是從作者獲得博士學位的院系來看,情況都是如此。例如,根據我們的計算,排名前五的社會學系佔《美國社會學雜誌》所有作者的22.3%,而排名前五的經濟學系佔《政治經濟學雜誌》所有作者的28.7%,佔《經濟學季刊》所有作者的37.5%。當我們關注作者獲得博士學位的機構時,這種差異更為顯著:排名前五的社會學系在《美國社會學雜誌》中佔比35.4%,而在《政治經濟學雜誌》中佔比45.4%,在《經濟學季刊》中更是高達57.6%。經濟學家可能傾向於將這種集中化視為證據,認為經濟學領域的學術實力在頂尖院系的集中程度高於社會學領域。其他人可能會強調其他用於評估的指標(書籍在某些學科中可能更重要),以及存在多種價值標準,這些標準在學術期刊的等級制度中只能得到不完善的反映。相比之下,經濟學家往往將制度化的等級制度視為某種潛在價值的新興真實指標,因此對其極為痴迷。例如,沒有任何其他社會科學領域能像經濟學那樣,產生如此大量關於排名(期刊、院系和個人排名)的資料和研究——更不用說經濟學研究在研究論文庫(一個國際研究檔案庫)中的集中化,以及一個關注經濟史的、雖處於邊緣但仍然重要的分支領域的持續存在。經濟學領域對等級制度的高度關注催生了對個人地位的激烈競爭,這可能解釋了該領域一些最令人不安的運作方式。一個值得注意的事實是,由特定大學編輯的幾本主要經濟學期刊,顯然更傾向於發表本校作者的論文,而《美國經濟評論》在版面分配上則更為均衡。庫佩(2004,第27頁)對20世紀50年代以來的 “本土偏好” 資料進行研究後發現,本校作者的過度代表性是一個長期存在的一致模式。例如,在1990-2000年間,總部位於哈佛大學的《經濟學季刊》“將13.4%的版面分配給了本校人員”,10.7%分配給了鄰近的麻省理工學院(而排名緊隨其後的芝加哥大學僅獲得8.8%)。相反,總部位於芝加哥大學的《政治經濟學雜誌》將9.4%的版面分配給了與芝加哥大學有附屬關係的學者,這一比例相當於哈佛大學和麻省理工學院的總和(分別為4.5%和5.1%)。吳(2007)發現,這種偏好在2000-2003年間實際上有所加劇。我們(2003-2012年)的資料證實了馬薩諸塞州劍橋市(哈佛大學和麻省理工學院所在地)對《經濟學季刊》的主導地位,以及(在較小程度上)芝加哥大學對《政治經濟學雜誌》的主導地位。當我們關注作者獲得博士學位的院校時,劍橋市的優勢更為顯著。2003-2012年間,哈佛大學畢業生在《經濟學季刊》上發表論文的比例為20.5%,略高於麻省理工學院畢業生(16.4%),兩者都遠遠領先於排名第三的普林斯頓大學(7.4%)。在《政治經濟學雜誌》中,哈佛大學、麻省理工學院和芝加哥大學畢業生的佔比均在 10%-11%左右。誠然,經濟學期刊存在本土偏好的原因有很多,例如:如果期刊由本校編輯,那麼本校教師和研究生(或往屆研究生)的投稿量會更高;編輯更有可能鼓勵本校學者投稿,因為編輯的部分工作就是通過人際關係網路獲取優質論文(拉邦德、皮耶特,1994;梅多夫,2003);或者期刊的哲學風格導致投稿中的自我選擇偏好。但類似的過程在其他領域也存在,卻沒有產生如此顯著的效果。因此,即使該領域的社會結構可以解釋部分差異,但並不能完全解釋這些差異:這種結構本身就是我們所關注現象的核心——即芝加哥大學、哈佛大學和麻省理工學院這三所院系通過控制兩本基於大學的期刊,長期穩定地主導著該領域的其他院系。相比之下,在由大學院系編輯的主要社會學期刊——芝加哥大學主辦的《美國社會學雜誌》中,這種本土偏好幾乎不存在。這表明,頂尖經濟學期刊的本土偏好模式,以及頂尖院系排名的穩定性,不僅僅是地理和作者分佈的巧合,而是源於一種特定的社會組織和控制形式。學術協會最後,考察社會科學領域的專業協會可以發現,經濟學的組織更具凝聚力和等級性,而其姊妹學科則更具分歧性。對美國經濟協會(AEA)、美國社會學協會(ASA)和美國政治科學協會(APSA)章程的快速比較顯示,各學科之間的政治權力分配存在巨大差異。儘管美國經濟協會擁有18000名會員,但它是一個極簡主義的組織,總部位於田納西州納什維爾市。截至2014年,會費較低,為每年20-40美元。其章程篇幅較短,僅1770字,程序高度集中。該協會僅有六名當選官員,而且通常只有一名候選人競選會長候選人。如圖2所示,美國經濟協會的領導層絕大多數來自該學科的頂尖院系:即72%的美國經濟協會非任命理事來自排名前五的院系,而美國政治科學協會和美國社會學協會的這一比例分別僅為12%和20%。會長候選人和項目委員會負責組織年會項目,包括提前選定要舉辦的分會場,並從部分分會場中挑選論文納入《美國經濟評論》的 “論文與會議記錄” 專輯(年會後的五月刊)。這一程序確保了該組織領導層認為最重要的主題和作者能夠得到關注。這種方式與美國社會學協會和美國政治科學協會內部更分裂、更草根的性質形成了鮮明對比。儘管這些專業協會的會員人數少於美國經濟協會(美國政治科學協會約15000人,美國社會學協會約13000人),但它們的工作人員規模更大。其程序更為複雜,這從其章程的長度就可以看出:美國社會學協會的章程為4657字,美國政治科學協會的章程為5529字。美國經濟協會是一個統一的組織,而社會學家和政治科學家的社群生活則圍繞著 “分會” 或有組織的子領域展開,每個分會都有自己的程序、會費、獎項和年會項目。美國社會學協會通過在中央和分會層面舉行競爭性選舉來解決內部分歧的政治問題,而美國政治科學協會長期以來一直依靠主導群體之間的制度化討價還價來應對這一問題。在這兩種情況下,如圖2所示,這些協會的領導層主要來自非頂尖機構。由於學科核心不太明確且爭議較大,美國社會學協會和美國政治科學協會的會員對學科核心的認同感也較弱:普通會員與精英群體的聯絡不那麼緊密,而且這兩個協會的主要作用是實現全面的民主整合,這種開放性也體現在其會議項目的結構中。然而,美國社會學協會和美國政治科學協會的大多數領導層成員被排除在該學科的高聲望核心之外,也缺乏政治權力,這也解釋了這兩個組織為何迫切地尋求影響力,例如將總部設在華盛頓特區。為了支援這種更複雜的基礎設施和昂貴的辦公場所,這兩個組織的會費在社會科學領域中處於較高水平:美國社會學協會每年50-350美元;美國政治科學協會每年40-320美元——還不包括分會會費。金融學的興起儘管經濟學具有相對的封閉性和自主性,但經濟學家仍然會與其他學科互動。我們對五本頂尖經濟學期刊的分析顯示,19%-25%的引用指向學科外部,自二戰結束以來,這一模式相當穩定。但當經濟學進行跨學科互動時,它會轉向那些領域?經濟學的學科聯絡是否隨著時間的推移發生了變化?如果是這樣,這對該領域的發展意味著什麼?這一研究框架為我們提供了一個不同於以往許多文獻的經濟學近期歷史研究視角——以往的文獻往往側重於經濟學領域內部的趨勢,例如經濟學期刊發表模式的轉變(卡德、德拉維尼亞,2013)、經濟學內部各領域在數量上的興衰(凱利、布魯斯特爾,2011)和相對聲望的變化(埃利森,2010),或者數學使用和理論論文發表的下降趨勢(哈默梅什,2013)。相反,我們首先分析了經濟學與其他學科之間關係網路的演變。換句話說,我們假設一個學科引用誰的成果,在某種程度上反映了該學科的特質。我們發現,外部引用模式的變化確實能讓我們瞭解到該學科的內部狀況以及不同群體相對權力的變化。圖3展示了經濟學的跨學科引用情況,這是基於我們對五本二戰前創辦的頂尖經濟學期刊的廣泛研究得出的:《經濟學季刊》(Quarterly Journal of Economics,創辦於1899年)、《政治經濟學雜誌》(Journal of Political Economy,1899年)、《美國經濟評論》(American Economic Review,1911年)、《計量經濟學》(Econometrica,1933年)和《經濟研究評論》(Review of Economic Studies,1933年)。該圖所呈現的情況既有我們熟悉的部分,也有不太為人所知的部分。圖中的資料點顯示了經濟學期刊對金融學(F)、統計學(S)、商學(B)、政治學(P)、數學(M)、社會學(s)和法學(L)領域期刊的跨學科引用比例。由於每年的資料波動較大,我們將資料模式以平滑曲線的形式呈現。該圖顯示,二戰後經濟學與數學和統計學的互動急劇增加。這種互動在20世紀70年代中期達到頂峰,與此同時,經濟學與其他社會科學(如政治學和社會學)以及法學、商學(稍晚一些)等實踐領域的互動則降至最低點。儘管20世紀50年代基金會和政府努力以 “行為科學” 的名義推動跨學科項目,但在20世紀60-70年代,社會科學各學科之間的隔閡明顯加深。這一過程並非僅由經濟學推動:哈佛大學(社會關係系)和卡內基梅隆大學的跨學科實驗均以失敗告終,所有相關領域都退回到了各自獨特的抽象化和高深理論研究模式(斯坦梅茨,2005;艾薩克,2010)。圖3所示時期末期的跨學科生態則大不相同。頂尖經濟學期刊對數學的引用實際上已經消失,對統計學的引用也有所減少。其他社會科學領域有了適度的復甦,尤其是政治學(它在一定程度上轉向了理性選擇理論)。但圖3中近幾十年來最顯著的趨勢是,金融學作為經濟學 “跨學科” 引用的來源,其地位持續上升。在判斷向金融學轉向的程度時,需要注意的是,我們在圖3中對金融學在經濟學中作用上升的估計是非常保守的。我們列出的五本頂尖經濟學期刊中不包括任何金融學期刊。圖4分析了我們列出的五本頂尖經濟學期刊以及另外兩本期刊的引用情況:《金融學雜誌》(Journal of Finance,創辦於1946年),以及總部位於英國的《經濟雜誌》(Economic Journal,創辦於1891年)——這本期刊在20世紀的大部分時間裡都是經濟學家的核心綜合性期刊,在初期與《政治經濟學雜誌》和《經濟學季刊》地位相當。交叉引用總數中不包括自引。從圖表中可以看出,2010-2011年,在剔除自引後,《美國經濟評論》獲得了該組期刊交叉引用的33%。圖表顯示,頂尖期刊之間的競爭非常激烈——《經濟學季刊》迅速重回巔峰,《計量經濟學》和《政治經濟學雜誌》相對衰落——但從長期來看,還有兩個顯著的變化:英國期刊(《經濟研究評論》和《經濟雜誌》,尤其是《經濟雜誌》)的持續衰落(幾乎被人遺忘),以及《金融學雜誌》的崛起。我們的文獻計量網路資料(未顯示)表明,到21世紀00年代,《金融學雜誌》與美國核心期刊的整合程度最高,在《美國經濟評論》《經濟學季刊》和《政治經濟學雜誌》的所有交叉引用(剔除自引)中,有7%-11%指向《金融學雜誌》。換句話說,《金融學雜誌》在創辦之初可能不被視為經濟學期刊,但如今已成為經濟學學科矩陣中不可或缺的一部分。隨著金融經濟學成為該領域的主導方法(約萬諾維奇,2008),其他金融學期刊也紛紛效仿。金融學作為經濟學領域智力重鎮的制度性崛起,源於20世紀下半葉商學院教學基地的建立。在此期間,商學院(通過工商管理碩士學位培養合格的管理者)從以從業者為主、難以獲得學術合法性的項目,發展成為訓練有素的社會科學家的最大僱主,如今其教員規模和聲望已可與傳統學術院系相媲美。2004年的一項調查發現,美國排名前20的商學院中有549名經濟學博士任教,而美國排名前20的經濟學系中有637名經濟學博士(布勞,2006)。商學院吸收了越來越多的經濟學博士,這使其成為經濟科學領域中強大的參與者——1990年以來,多位基於商學院的學者獲得了諾貝爾經濟學獎(富卡德、庫拉納,2013),包括尤金·法瑪、奧利弗·威廉姆森、羅伯特·恩格爾、邁克爾·斯彭斯、羅伯特·默頓、邁倫·斯科爾斯、默頓·米勒、約翰·海薩尼和羅伯特·福格爾,這一事實證明了這種轉變。我們對20世紀50年代以來《美國經濟評論》發表論文的分析顯示,作者中擁有商學院附屬機構的比例迅速上升,而來自政府機構的作者比例則急劇下降。以商學院為主要附屬機構的作者比例從20世紀50年代的3.2%穩步上升到21世紀00年代的17.9%。相反,來自政府機構的學者貢獻已變得微不足道。隨著經濟學學術領域向商學院轉向(遠離政府),經濟學家面臨著一系列新的實踐、智力和政治糾葛:更高的薪酬、新的人脈和諮詢機會,以及往往不同的政治立場(傑爾韋、科格特、奈杜,2014)。20世紀80年代,該領域對政府行動的懷疑顯著增加,經濟學家可以說為公共政策中的放鬆管制運動,以及在教育、交通、醫療保健、環境等領域擴大價格和市場機制的使用提供了部分智力依據(布萊斯,2002)。金融經濟學家有力地論證了企業的目標是實現股東價值最大化,並為新一代企業掠奪者青睞的管理實踐——槓桿收購、併購以及通過股票期權向企業高管提供薪酬——提供了科學依據。津加萊斯(2013)在最近對 “經濟學家被商業利益俘獲的普遍性” 的控訴中發現,當論文作者中無人在商學院工作時,經濟學論文 “不太可能對高管薪酬水平持正面態度,而更有可能持負面態度”(第139頁)。獨特的生活方式與其他領域的學者和更廣泛的美國公眾相比,經濟學家有著獨特的觀點、信念和品味。關於這一主題的證據較為分散,需要從各種來源拼湊而來。很大一部分證據來自經濟學家自身:關於這一主題的本土文獻非常豐富。該領域充滿了焦慮的內省,這源於經濟學家們覺得自己擁有權力但不受歡迎,同時也源於大量實證證據表明他們與眾不同。在一些經典案例中,馬威爾和埃姆斯(1981)發現,威斯康星大學的經濟學一年級研究生在結構化的實驗室遊戲中,為公共產品做貢獻的可能性更低。在本刊中,弗蘭克、吉洛維奇和里根(1993)引用了一系列證據,表明學習經濟學會抑制合作精神。這種差異在不同的實驗室研究環境中是否持續存在,以及任何持續存在的差異的根本原因,仍然存在爭議。是學習經濟學使人們更能接受自己和他人的自利行為?還是該學科本身就吸引了更多利己主義者?弗雷和邁爾(2005)研究了蘇黎世大學學生對社會基金的自願捐款情況,發現那些後來選擇經濟學作為研究領域的學生,即使在開始學習經濟學之前,捐款的可能性也更低。無論根本原因是什麼,有越來越多的證據表明,經濟學家要麼更坦率地追求自身利益,要麼就是更自私(無論是天性使然還是訓練所致)。經濟學家在一些他們最珍視的觀點上可能處於少數派地位。薩皮恩扎和津加萊斯(2013)認為,美國經濟學家之間的共識越多,他們與普通美國人的距離就越遠。當然,總體而言,經濟學家傾向於使用基於市場的解決方案來解決社會問題(沃普爾斯,2009)。他們支援允許向器官捐贈者支付報酬,但公眾對此想法深惡痛絕。絕大多數經濟學家認為貿易保護主義對經濟有害,但當被問及 “購買美國貨” 是否對經濟有利時,普通美國人表示認同(薩皮恩扎、津加萊斯,2013,第638頁)。經濟學家認為,諸如碳稅或污染許可交易制度之類的市場機制,比汽車排放標準等監管措施更具成本效益,可以有效遏制氣候變化,但大多數公民對此持不同意見。經濟學家可能會為政府提供建議,但他們往往無法說服民眾。與大多數大學同行一樣,學術經濟學家的投票立場比美國公民更傾向於左翼。自從在這一背景下進行政治民意調查以來,情況一直如此:拉德和利普塞特(1976)進行了一項經典的早期調查。儘管總體而言,經濟學家中的自由意志主義者比例遠高於美國選民,但作為一個群體,經濟學家仍然聲稱更信任政府——不過存在一些重要的制度差異。根據格羅斯和西蒙斯對美國教授的調查(見格羅斯,2013),在大多數政治觀點上,經濟學家介於左翼的人文學科學者和其他社會科學家與右翼的商學院教授之間。例如,三分之二的社會學家認為企業利潤過高,但只有三分之一的經濟學家和幾乎沒有金融教授持此觀點。絕大多數社會學家(90%)支援 “政府應該做更多事情來幫助貧困美國人,即使這意味著背負更多債務” 這一主張,但只有不到一半的經濟學家和三分之一的金融學者同意這一觀點。與所有人一樣,經濟學家的世界觀在一定程度上是其特定社會糾葛的產物——即他們群體以及群體中每個個體的物質和象徵地位與軌跡。與其他學者相比,經濟學家的收入狀況更好。根據美國勞工統計局的資料,2012年,大學和專業學院的11000名經濟學教師的平均年薪為103000美元,收入最高的10% 群年薪為160000美元。相比之下,社會學家的平均年薪為76000美元,收入最高的10%人群年薪為118000美元。這些數字還不包括來自諮詢工作或其他活動的額外收入,而這些額外收入可能相當可觀(韋爾,即將出版)。此外,在過去二十年中,經濟學家的物質狀況有了顯著改善,尤其是該行業收入最高的成員,他們現在的收入略高於收入最高的工程師;相比之下,許多學術職業(主要是人文學科)和美國整體的實際工資中位數在同一時期幾乎沒有增長,如圖5所示(該圖還包括了社區學院的教師,以及大學和專業學院的教師)。群體社會流動性的提升和學科內部不平等的加劇,如何影響經濟學家對其他處境較差的學者和公民相對經濟狀況惡化的看法,這仍是一個懸而未決的問題。如果經濟學家的使命不是最大化普通人的福利,那麼他們與公眾之間日益擴大的社會距離可能無關緊要。但經濟學作為一個職業,與公共行政部門、企業和國際組織有著密切的聯絡;這些機構不僅為經濟學家提供資源和收集資料,還培養了一種“解決問題” 的文化——或者用社會學家的話說,一種干預世界的特定 “慣習”(布林迪厄、瓦康,1992)。經濟學家,尤其是現代經濟學家,想要解決問題,這既是他們理論自信的產物,也是其學科在社會中地位的產物(米切爾,1998)。例如,經濟模型經常援引神話般的 “仁慈社會規劃者” 形象,設想這個實體將如何使世界變得更富裕、更健康、更不易受衝擊。經濟學家已經開發出精確的理論框架,用於評估市場何時能產生效率、何時會出現市場失靈,並且他們擁有龐大的計量經濟學工具庫,可以分析實際政策提案的效果。在20世紀最後25年,他們還開始進行範圍狹窄的實地實驗,越來越多地將社會政策或發展援助的實施用於研究目的(例如,班納吉、杜弗洛,2013)。(順便提一下,經濟學家的實驗與社會學家的實驗大相逕庭,社會學家進行實驗往往是為了瞭解人們的生活方式。)最後,經濟學家對自己的最終判斷標準相當確定——他們更傾向於效率而非公平,從行為中推斷偏好,並圍繞有限的選擇範圍設計實驗。這些標準既認可了政策裁決和諮詢的導向,也體現了一種獨特的意願,甚至是渴望提供服務和進行干預。如果事情沒有按預期發展,那麼可能需要進行明智的調整,甚至是 “助推”(塞勒、桑斯坦,2008)。再次與社會學家進行比較很有啟發意義:社會學家可能也渴望成為“王子的謀士”,但他們在獲取影響力方面遠不如經濟學家成功。首先,經濟學和社會學對時間的取向不同。經濟學家通常不太關注歷史,“活在當下”,並 “從現在展望未來軌跡”,而社會學家則持相反的學術態度,將現在視為一系列過去過程的結果(阿博特,2005)。因此,社會學家往往發現自己既被有效地邊緣化,又迴避直接參與政策制定。他們的學術習慣以社會批判為核心,這正是因為他們已經處於外部:用社會學家皮埃爾·布林迪厄的話說,他們“將必要化為美德”。自我認知很好地反映了這些差異。在格羅斯和西蒙斯(2007)對美國教授的調查中,經濟學家主要將自己描述為 “知識分子” 和 “科學家”。社會學家最認同 “社會批評家” 和 “科學家” 這兩個稱謂,無意識地接受了自己的邊緣地位,但並未放棄科學的外衣。社會學家既渴望具有相關性,又對權力深感矛盾,這種結合產生了一套截然不同的傾向:社會學家進行批判性分析,有時會煽動和鼓動,但他們很少冒險提出解決方案和補救措施(他們沒有能力這樣做,即使有機會,也可能不願意這樣做)。有趣的是,政治科學家主要將自己視為 “知識分子”,但或許反映了他們更接近政治博弈,與社會學家或經濟學家相比,他們更有可能與 “科學家” 這一稱謂保持距離。經濟學家對自己干預世界的能力充滿信心,其結果是,與社會學或政治學不同,經濟學已成為一股強大的變革力量。經濟學家不僅僅是描繪外部現實,他們還通過傳播自己的建議和工具來塑造現實。用社會學的術語來說,他們“踐行” 現實(卡隆,1998)。經濟理論和技術的各個方面已融入現實經濟過程,並成為經濟行為者和普通公民在日常經濟互動中使用的工具的一部分。在某些情況下,經濟技術的實際應用可能實際上使人們的行為與經濟模型的描述保持一致。通過從內部改變經濟過程的性質,經濟學擁有了使經濟理論更接近真理的力量。例如,麥肯齊(2006)探討了學術金融理論如何催生了巨大的期貨、期權和其他金融衍生工具市場:市場參與者對布萊克-斯科爾斯-默頓公式的使用改變了經濟過程,從而提高了該模型與期權價格現實的契合度。在經濟學家的影響下,世界發生了重大變化。經濟推理、專業知識和技術滲透到資本主義活動、文化(包括媒體和暢銷書排行榜)和機構中,從醫院到法院再到大學(赫希曼、波普·伯曼,2014)。經濟學家幾乎在所有公共政策事務上提供專業知識,並在商業和政府領域穩步取得進展,常常擔任高層政治職位(蒙特西諾斯、馬爾科夫,2009)。財政部、中央銀行、政府機構、國際組織和主要諮詢公司集中了大量受過專業訓練的經濟學家,他們聲稱對 “經濟” 擁有指導權,同時將社會視為參與一個永無止境但最終有益的經濟重建過程。最後,經濟學職業的理性形式主義語言支撐著其普世主義的抱負。經濟潮流跨越國界傳播,吸引著人們和技術追隨其後。與社會學或政治學相比,經濟學在象徵意義和物質層面上都是一門全球化的學科(富卡德,2006)。因此,大多數經濟學家對自己的價值貢獻感到相當有信心。支撐這種信心的是其背後相當統一的學科框架、許多人認為反映了某種真正基本價值的更高薪酬,以及從報紙到國會委員會再到國際政策圈的整個制度結構——這些機構都在向他們尋求答案,尤其是在困難時期。事實上,最近的經濟和金融危機可以說使經濟學作為一個整體變得更加引人注目,其專業知識也更受追捧:20世紀80年代初的嚴重衰退和20世紀30年代的大蕭條也產生了同樣的效果。但由於經濟學是一股變革力量,而且其從業者往往掌權,經濟學家也更容易受到抨擊。2008年的金融和經濟風暴(經濟學界很少有人預料到,但部分可以追溯到他們中的一些人遊說推動的行動),導致許多經濟學家進行深刻的自我反省,反思自己的無知、學術上的盲目樂觀以及其專業主張的可靠性。2010年紀錄片《監守自盜》中的訪談令人不安,該領域的知名成員在訪談中堅決否認經濟學家存在利益衝突的可能性,隨後美國經濟協會推出了一套道德準則。諾貝爾獎得主保羅·克魯格曼(2009)在《紐約時報》的重要專欄中,以激烈且公開的方式揭露了宏觀經濟學的醜聞——這些醜聞通常隱藏在深奧的模型中。經濟學家也開始談論分配問題——這是另一門社會科學(社會學)的核心議題——這在二三十年前是難以想像的。誠然,不平等狀況的變化值得這種新的關注(皮凱蒂,2014)。但經濟學的學術風向可能也在發生轉變。結論:謙遜而稱職的人?凱恩斯([1931] 1962,第373頁)有一句名言:“如果經濟學家能讓人們認為他們是謙遜而稱職的人,與牙醫處於同一水平,那就太好了!” 大多數現代經濟學家都有強烈的務實傾向。他們信奉專家諮詢型民主的理想,認為自己的能力應該在政府和其他機構的高層非選舉職位中得到利用和展示。但民主社會對(非民主的)專業知識深表懷疑;而且與牙醫不同,經濟諮詢永遠不可能是謙遜的。事實是,在某些方面,經濟學畢竟是一門非常道德的科學,這與其哲學起源是一致的。與原子和分子不同,經濟學家試圖作用於其上的 “對象” 也有自己的世界觀。人類生活是複雜的,永遠無法被完全理解,也無法按計畫塑造:人們的行為往往出人意料;政治有其自身的要求;文化(經濟學家對此並不十分瞭解)會產生抵抗。因此,經濟學家在確立其專業主導地位方面的真正成功,也不可避免地將他們捲入了民主政治的紛爭之中,並使他們與經濟、政治和行政權力產生了危險的密切聯絡。在這種情況下,提出決定性的專業主張需要極大的自信。這種自信或許是經濟學職業最大的成就——但也是其最脆弱的特質,其致命弱點。 (ECONOMICS RULES)
英國《金融時報》丨歐洲的二等公民
Europe’s second-class citizens那些曾鄙視海灣國家“卡法拉”(kafala)制度的國家,正悄然走向建立自己的版本。本周恰逢我離開卡達三周年。當時我剛報導完世界盃足球賽。黎明時分,我和一位同事搭優步前往機場。我們的巴基斯坦司機剛結束16小時的輪班,盼著能睡個好覺。他解釋說,在多哈開車壓力很大,因為當地“公民”——即卡達人,通常開著四驅越野車,認為自己有權隨意插隊到非公民前面。如果優步司機不順從,他們會大發雷霆。而這位巴基斯坦司機卻毫無申訴管道。在卡達,移民被當作權利極少的二等人對待。那時,許多歐洲人對卡達對待移民的方式感到憤怒。海灣地區普遍實行的“卡法拉”制度——賦予僱主對移民工人極大控制權——被視為毫無人道。然而如今,我們正目睹一種新的歐洲體系初現端倪,其面貌驚人地類似卡達模式:不斷引進更多移民勞工,卻將他們永久視為二等階層。不妨稱之為“歐版卡法拉”(Eurokafala)。背景是老齡化嚴重的歐洲:從清潔到照護等行業都急需移民勞動力,但社會又並不真正歡迎他們。隨著移民來源從以白人歐洲人為主,轉變為以非白人、非歐洲人為主(英國主要是亞洲人,法國主要是非洲人),移民問題變得更具爭議性。這一趨勢還將持續:非洲人口預計將從目前的15億增至2050年的25億,而歐洲勞動年齡人口則急劇萎縮。維也納經濟與商業大學的研究顯示,即便是受過高等教育的歐洲人,對移民的支援度也在下降。我們的社會已是多元文化,卻幾乎沒有政黨願意承認這一現實。歐洲極右翼政黨在經濟或性別議題上的立場各異,但在反移民上卻高度一致。這使得移民議題的公共討論幾乎完全圍繞身份認同與犯罪展開,而非人口結構或經濟需求。政客們如何調和“需要移民”卻又“不願接納”的矛盾?辦法是:高調反對最顯眼的移民形式(如穿越英吉利海峽或地中海的小船偷渡者、尋求庇護者),同時悄悄引入更多勞工。英國脫歐公投很大程度上由反移民情緒驅動,但此後英國移民人數卻大幅飆升。義大利右翼領導人喬治亞·梅洛尼一方面高調推動在阿爾巴尼亞處理庇護申請——反映出歐洲普遍希望將庇護程序“外包”;另一方面卻發放了近百萬份非歐盟工作簽證。法國議會在2023年通過了嚴格的移民法,但2024年移民人數反而激增。過去,歐洲政客常高談“融合”——要求移民接受我們所謂的價值觀。如今這類話語正在消失。新趨勢(以英國為例)是:向特定行業發放有時限的工作簽證,限制移民攜帶家屬的權利,並讓他們等待更長時間——某些情況下長達數十年——才能獲得永久居留權。在法國,極有可能成為下一屆執政黨的極右翼政黨“國民聯盟”甚至主張廢除出生地公民權,這意味著一些人即便一生都在法國生活,也永遠只是二等外人。這讓我想起在阿布扎比遇到的一位巴勒斯坦人:他出生在當地,卻要承擔公司幾乎所有工作,而他的本地同事則悠然自得。一個由單身、權利受限、基本游離於社會之外的人組成的次等階層,必然遭受各種侵害。他們難以就虐待行為提出申訴。於是,我們將看到歐洲版的、曾被我們猛烈抨擊的卡達現象:移民多年無休地工作;建築工人在不安全條件下喪生。更嚴厲的歐洲法規無法終結非法移民。人們會逾期滯留。歐洲各國政府可採取的一種應對方式,是效仿美國的移民與海關執法局(ICE)——組建一支准軍事力量,大張旗鼓地搜捕任何看起來像“典型非法移民”的人,即非白人且貧困者。這些搜捕行動同時也成為政府展示“陽剛威權”的宣傳視訊,使所有非白人——那怕家族幾代都是公民——始終處於“非法”的懷疑之下。“歐版卡法拉”很可能贏得選民支援。許多本土居民認為,“英國人”“法國人”“德國人”等身份是某種“高端國籍”。建立一個永久性的移民服務階層,正是對這種優越感的制度性認可。 (邸報)
MIT研究預測:AI對勞動力市場的潛在替代高達1.2兆美元薪酬規模
寫在前面在當前全球經濟格局中,人工智慧對勞動力市場的重塑已成為不可逆轉的趨勢。然而,政策制定者和市場觀察者長期以來普遍面臨一個核心矛盾:我們所能觀測到的失業和顛覆,僅是這場結構性變革的冰山一角麻省理工學院(MIT)近期發佈的《冰山指數》研究,正是旨在解決這一認知偏差的戰略工具。該研究將AI視為一種可被精確測繪的經濟地理風險,將決策視角從"事後危機管理"提升到"事前數位化模擬"。一、核心事件:建構數字孿生勞動力大軍MIT研究人員的激進行動是為1.51億美國勞工建構軟體對等物,相當於為美國勞動力建立了一個"數字孿生"。這一舉措將AI顛覆風險的評估從基於傳聞,轉變為基於大規模模擬和微觀技能對應的科學模型。重要發現:目前在科技中心可見的工資中斷僅佔總風險的2%,而隱藏的風險層比可見風險大5倍。二、戰略動機:政策工具的"先發制人"政策制定者(包括田納西州、猶他州和北卡羅來納州等報告的共同作者)使用《冰山指數》進行前瞻性規劃:1. 風險前瞻與預算最佳化該指數是一個"早期預警地圖",使政策制定者能夠在衝擊發生之前,轉移資金和調整培訓。避免盲目投入數十億美元的再培訓投資。2. 精準干預與地域定製化傳統模型往往關注沿海城市,但《冰山指數》提供了細化到郵政編碼的深度地圖,使政策干預措施可以精準匹配當地職業風險。3. 政策沙盒與立法測試該指數提供一個互動式模擬環境,允許州政府對各種政策槓桿進行實驗,探索技術採用的變化如何影響噹地就業和GDP。三、從海岸到腹地的風險遷移在《冰山指數》出現之前,關於AI對就業影響的敘事主要集中在科技行業。此前MIT另一項研究指出,95%的企業AI採用並未成功,這可能助長了對AI變革速度的低估。舊範式:可見風險• 集中於科技中心/沿海城市• 僅關注可見的工資中斷(2%)• 聚焦高科技/軟體開發行業• 如何應對即時裁員衝擊新範式:《冰山指數》揭示的隱藏風險• 覆蓋3,000個縣,包括非沿海地區• 揭示五倍於可見風險的隱藏層• 廣泛涉及醫療保健、金融和專業服務• 如何提前部署大規模技能重塑四、現實挑戰:不確定的"倒計時""研究人員強調,這不是裁員的倒計時時鐘。它更像是一個早期預警地圖,以便政策制定者能夠在衝擊來臨之前,圍繞資金和培訓進行轉移。"風險是潛伏的(隱藏層是可見層的五倍),但其轉化為實際裁員的速度和時間表是不確定的。這導致兩個主要挑戰:政策惰性風險由於沒有立即爆發的大規模失業,立法機構可能缺乏動力去迅速撥付數十億美元的再培訓資金。資料與現實的校準模型依賴於將32,000種技能對應到923種職業。如果實際AI採用速度與預測有偏差,可能導致資源被錯誤分配。五、深層護城河:互動式生態系統《冰山指數》真正的壁壘並非僅僅是一份報告,而是其提供的互動式模擬環境。田納西州案例•已成為這一處理程序中的先行者•參與了報告的共同撰寫•根據《冰山指數》建構了自己的AI與工作儀表板•跟蹤該州範圍內的職業風險暴露和工資影響•正在指導該州的政策和支出決策這種地方政府對AI模型的內化和應用,形成了難以被傳統方法取代的軟實力壁壘。六、未來推演:勞動力市場的地域分化未來3-5年,美國勞動力市場的格局將根據州政府對《冰山指數》等前瞻性工具的採納程度而產生顯著分化。先行者(如田納西州)通過AI儀表板和"技能優先"招聘規則,能夠提前避險AI對醫療、金融和專業服務等行業的衝擊,保持勞動力市場的穩定性和競爭力。滯後者缺乏精確的風險地圖,繼續依賴舊有的低效培訓投資,導致政策滯後於實際的失業衝擊,加劇地域經濟不平等。核心受影響職業醫療保健(行政和診斷支援)金融(後台操作)專業服務(基礎法律文書、諮詢資料整理)七、三大核心結論結論一資訊不對稱是最大的政策成本AI變革時代最大的壁壘不是技術的缺乏,而是風險的錯誤量化和地理資訊的不對稱。結論二再培訓投入的數位化勢在必行面對1.2兆美元工資的潛在風險,對政策有效性進行事先模擬和驗證的趨勢不可逆轉。結論三政策執行力的AI化AI對勞動力市場的最終影響,將體現在政府治理和政策執行效率的提升上。"這種方法就像一個預警系統,不是告訴你災難何時發生,而是告訴你那裡需要提前修建堤壩,並允許你在模擬環境中測試堤壩的高度和材料。"風險提示1.政治與財政惰性風險:立法者可能因缺乏即時政治壓力而延遲再培訓資金。2.模型精準性與校準風險:AI技術實際應用速度可能與模型預測出現偏差。3.技術突變與加速風險:AI技術進步速度可能超過指數更新速度。4.資料隱私與跨州協調風險:聯邦層面協調使用資料可能面臨挑戰。 (FinHub)
MIT最新研究: AI有能力替代美國 11.7%的勞動力,波及全美!1.5 億員工被智能體建模
越來越多的人說,AI 可能會取代一些工作,但它到底會影響那些崗位?影響有多大?最近,一項來自 MIT 的新研究給出了一個驚人的答案:一組隱藏資料表明,AI 當前已經有能力替代 11.7% 的美國勞動力,對應工資價值約1.2兆美元。如果只看目前 AI 的實際應用,主要集中在科技和計算崗位,那麼AI的影響僅佔約2.2%的勞動力,對應工資價值約 2,110 億美元。但當研究者把行政、金融和專業服務等崗位納入考慮後,AI 潛在影響範圍飆升至 11.7% 的勞動力,約 1.2 兆美元工資。這份研究成果來自一個名為 Iceberg Index(冰山指數) 的項目,由 MIT 聯合 橡樹嶺國家實驗室(ORNL) 開發。研究團隊把 AI 與人類勞動力的關係做了一個大膽模擬:他們將美國 1.51 億名員工都“數位化”,讓每個人按照技能、任務、職業和地理位置分類,然後觀察 AI 工具可以覆蓋那些工作任務,甚至能精確到郵政編碼區域。ORNL 負責人 Prasanna Balaprakash 將這個模型形象地比喻為“美國勞動力市場的數字孿生”。通過這個工具,研究者不僅可以看到 AI 已經進入那些崗位,還能預測潛在的技術曝光區域。01. 將1.51億職工建模為智能體論文中,Iceberg Index 的建構過程分為三步:1、人類勞動力對應模型覆蓋 1.51 億員工、923 個職業、3,000 多個縣,總共包含 32,000+ 技能。每個職工被建模為一個“智能體”,擁有技能、任務、地理位置等屬性。模型可以分析技能遷移潛力和職業相似度,為未來崗位轉型提供規劃路徑。2、AI 勞動力對應研究團隊收集了 13,000+ AI 工具,包括程式碼生成、流程自動化和認知輔助工具。使用與人類相同的技能分類體系,直接對比 AI 與人類能力。評估 AI 在增強人類工作(如醫院文書自動化)和完全轉變任務(如程式碼自動生成)的潛力。3、人類–AI 聯合模擬使用 MIT 的 Large Population Models (LPMs) 模擬數十億次互動。模擬考慮技術成熟度、採納行為和區域差異,輸出職業技能變化、地理分佈以及跨行業的連鎖影響。政策制定者可用模擬結果測試培訓方案、資源分配和激勵策略。整個模擬在橡樹嶺 Frontier 超級電腦 上運行,保證了大規模、高精度的預測能力。在這一基礎上,研究團隊建構了冰山指數(Iceberg Index)。這是一項以技能為中心的衡量指標,用於評估勞動力在 AI 經濟中的暴露度。它量化了 AI 系統在技術上可以執行的職業任務的“工資價值”,從而揭示人類勞動與 AI 能力重疊的部分。該指數從三個維度評估每一個職業:該職業需要的技能;這些技能的可自動化程度;工作本身的價值(工資與就業規模)。這些因素結合後,為每個職業給出一個一致的“技術暴露度”:它指的是 AI 能力與人類技能的重疊,而不是預測崗位是否會消失。例如,金融分析師不會消失,但 AI 可能能夠處理大量文件處理與常規分析工作。這會改變角色結構與技能需求,而不一定減少崗位數量。02. AI 有能力替代11.7%的勞動力研究團隊首先對當前 AI 最集中採用的職業內的技術暴露度進行了量化,並給出了一組資料:截至 2025 年,超過 10 萬 工作崗位的裁撤與 AI 重組直接相關;AI 系統每天生成超過 10 億行程式碼,已超過人類開發者的產出。因此,他們測量了電腦與技術類職業中的技能重疊度——表層指數(Surface Index)。結果發現,全國範圍內的表層指數為 2.2%,對應約 2110 億美元的工資價值、約 190 萬名技術職業從業者。包括軟體工程師、資料科學家、資料分析師、項目經理以及其他技術密集型崗位,這些都是目前 AI 採用最集中的職業群體。但這還僅僅只是冰山一角!除了科技類職業,AI 的能力還擴展到認知性和行政工作。原本為程式設計開發的工具,已經展現出在文件處理、財務分析、日常行政任務 等方面的技術能力,說明技術能力可以從科技領域遷移到其他行業。部分公司已經開始削減非技術性崗位:IBM 通過 AI 自動化減少了人力資源崗位Salesforce 暫停了非技術崗位招聘McKinsey 預測到 2030 年,約 30% 的財務任務可實現自動化研究團隊發現,當考慮 AI 在行政、金融和專業服務等崗位的潛在自動化能力時,這一數字上升至 11.7% 的勞動力,是表層指數的5倍,約 1.2 兆美元工資(稱為 Iceberg Index 冰山指數)。此外,研究作者也強調,這些結果僅代表 AI 能力與人類技能的重疊,並非實際的未來崗位消失情況,真正影響取決於企業、工人和地方政府的應對策略。03. 影響不限於沿海科技中心人們常以為 AI 取代最多的崗位會集中在沿海科技公司聚集的地區,但冰山指數顯示,AI 接管工作任務的能力 在全美範圍內更廣泛分佈。研究表明,許多州如果僅看當前計算和技術崗位的 AI 採納,影響不大;但當加入其他變數後,潛在影響大幅上升。例如,鐵鏽地帶的俄亥俄州、密歇根州和田納西州,表面指數不高,但冰山指數顯示認知工作(金融分析、行政協調、支援製造業的專業服務)有 十倍於表面指數的潛在技術曝光。例如這幅圖,左邊的冰山指數圖顯示,AI 的認知自動化能力已經擴展到沿海科技中心之外。一些意想不到的州,比如 特拉華州 和 南達科他州,因為行政和財務崗位集中,其指數甚至高於加州。右邊的自動化差距圖則揭示了各州當前實際 AI 採用情況與未來潛在變革之間的差距。像 俄亥俄州 和 密歇根州 這樣的製造業州,在物理自動化尚未大規模普及之前,就已經有大量隱藏的白領崗位可能被 AI 替代。這意味著這些州需要提前為行政、協調等崗位的變化做好準備。研究團隊表示:就算是密西西比、懷俄明這類“低科技州”,在行政、財務、專業服務 等崗位上的技術暴露度仍然很高。換句話說:它們看似與科技無關,但AI 的能力結構與其勞動力技能高度重疊,未來衝擊將遠比表層指數顯示的更大這表明:僅以當前可見的AI 採用情況來判斷風險,會嚴重低估真實暴露度。此外,MIT 和 ORNL也表明,他們建立冰山指數的目的是希望地方政府能夠提前應對 AI 可能帶來的衝擊。可以通過數字孿生模型,分析每個城市街區、每個崗位技能的自動化風險。模擬政策干預(培訓、資金投入、激勵機制)對就業和 GDP 的影響。提前規劃技能培訓、基礎設施和人才投資,實現 “先準備、後應對”。據CNBC報導,田納西州已在官方 AI 勞動力行動計畫 中引用冰山指數,北卡羅來納和猶他州也正在使用該工具制定政策方案。04. 網友熱議:事情沒那麼簡單這項研究在Reddit上也掀起了軒然大波,許多網友紛紛在評論區提出不同看法。一位網友調侃道:“研究由山姆·奧特曼資助。”有網友認為,說 AI 會替代多少工作,其實是反映了“無意義工作”的現狀,而不完全說明 AI 的能力或實用性。還有網友指出,如果用AI替代人類的工作,公司會面臨責任歸屬不清的問題,不如一紙合同來得可靠。當然,也有不少網友依然不信任AI投入實際生產的能力,認為“炒作遠遠超出了實際應用”。(51CTO技術堆疊)
重磅!Ilya現身,最新2萬字採訪來了:藏了一手,但其他全部都分享出來了「超級 AI 將吞噬文明級能源」
Ilya 大神現身最新採訪,整個採訪持續1個半小時,全文2萬字原汁原味呈現,這是最好的傳達大神思想的方式,不用任何總結,強烈建議收藏逐字反覆閱讀當然為了最快感受大神的思想,我隨便挑了一些重點:Ilya認為當前的方法會“走一段路,然後就走下坡路”,它們會不斷改進,但無法實現通用人工智慧那種行之有效的系統是“我們目前還不知道如何建構的”預計未來幾年將對勞動力市場產生重大影響主要瓶頸:泛化能力。模型在這方面遠遜於人類你可以訓練模型解決所有競技程式設計問題,但模型仍然無法培養出真正的“品味”,而一個青少年大約 10 個小時就能學會開車評估分數看起來很棒,但實際性能卻很差,因為強化學習訓練最終會針對評估本身進行最佳化真正的獎勵駭客是那些設計這些基準和訓練循環的研究人員他說他知道還缺少什麼,但不會公開分享他預測,這種擁有“大陸級算力”的超級智能將在 5 到 20 年內誕生“你知道最瘋狂的是什麼嗎?這一切都是真的,我們生活在科幻中”這句話讓我感同身受在這1個半小時中Ilya 和主持人討論了 SSI(Ilya的超級智能公司) 的戰略、預訓練存在的問題、如何提高 AI 模型的泛化能力,以及如何確保AGI的順利發展正文Ilya Sutskever你知道最瘋狂的是什麼嗎?這這一切都是真實的。Dwarkesh Patel是指什麼?Ilya Sutskever你不覺得嗎?所有這些關於 AI 的事情,整個灣區的現狀……它正在發生。這難道不像是科幻小說裡的情節嗎?Dwarkesh Patel另一件瘋狂的事是,“慢速起飛”(slow takeoff)的感覺是如此平常。以前覺得如果我們把 GDP 的 1% 投入到 AI 中,那感覺會是一件驚天動地的大事,但現在感覺就像是……Ilya Sutskever事實證明,我們適應得很快。而且這也有點抽象。這到底意味著什麼?意味著你在新聞裡看到某某公司宣佈了某某金額的投資。你只能看到這些。到目前為止,還沒有在其他方面真正感受到它。Dwarkesh Patel我們要從這裡開始聊嗎?我覺得這是個有趣的討論。Ilya Sutskever當然。Dwarkesh Patel我認為你的觀點——即從普通人的角度來看,沒什麼太大的不同——甚至在奇點到來時也會繼續成立。Ilya Sutskever不,我不這麼認為。Dwarkesh Patel好吧,這很有趣。Ilya Sutskever我剛才指的“感覺沒什麼不同”,是因為比如某家公司宣佈了一個難以理解的巨額投資數字。我覺得沒人知道這意味這什麼。但我認為 AI 的影響將會被切實感受到。AI 將滲透到整個經濟中。會有非常強大的經濟力量推動這一點,我認為這種影響會被非常強烈地感受到。Dwarkesh Patel你預計這種影響什麼時候會出現?我覺得現在的模型看起來比它們實際產生的經濟影響要聰明得多。Ilya Sutskever是的。這是目前關於模型最令人困惑的事情之一。如何調和“它們在評估測試(evals)中表現如此出色”這一事實?你看那些測試,你會想,“這些題目挺難的。”它們做得很好。但經濟影響似乎大大滯後。很難理解,為什麼模型一方面能做這些驚人的事情,另一方面卻會在某些情況下重複犯錯?舉個例子,假設你用“感覺程式設計”(vibe coding)做點什麼。你做到某一步,然後遇到了一個 bug。你告訴模型:“能不能幫我修一下這個 bug?”模型說:“天那,你太對了。確實有個 bug。讓我來修好它。”然後它引入了第二個 bug。你告訴它:“你有這個新的第二個 bug,”它又告訴你:“天那,我怎麼會這樣?你又說對了,”然後它又把第一個 bug 帶回來了,你就在這兩個 bug 之間來回折騰。這怎麼可能?我不確定,但這確實表明有一些奇怪的事情正在發生。我有兩個可能的解釋。比較異想天開的解釋是,也許強化學習(RL)訓練讓模型變得有點過於一根筋和狹隘,有點過於缺乏意識,即使它在其他方面讓它們變得更有意識。正因為如此,它們無法完成一些基本的事情。但還有另一種解釋。以前人們做預訓練(pre-training)時,“用什麼資料訓練”這個問題是有答案的,因為答案是“所有資料”。當你做預訓練時,你需要所有的資料。所以你不用糾結是用這個資料還是那個資料。但是當人們做 RL 訓練時,他們確實需要思考。他們會說,“好吧,我們要為這個東西做這種 RL 訓練,為那個東西做那種 RL 訓練。”據我所知,所有公司都有團隊專門製作新的 RL 環境,並將其加入到訓練組合中。問題是,那些環境是什麼?自由度太高了。你可以製作的 RL 環境種類繁多。有一件事是可以做的,而且我認為這是無意中發生的,就是人們從評估測試中汲取靈感。你會說,“嘿,我希望我們的模型在發佈時表現得非常好。我想讓評估分數看起來很棒。什麼樣的 RL 訓練能在這個任務上有所幫助?”我認為這種事情確實發生了,這可以解釋很多正在發生的事情。如果你把這一點與“模型的泛化能力實際上並不夠好”結合起來,這就有可能解釋我們看到的許多現象,即評估表現與實際現實世界表現之間的脫節,這是我們今天甚至還沒完全理解其含義的事情。Dwarkesh Patel我喜歡這個觀點,真正的“獎勵駭客”(reward hacking)其實是那些過於關注評估分數的人類研究員。我認為有兩種方式來理解,或者試圖思考你剛才指出的問題。一種是,如果僅僅通過在程式設計競賽中變得超人般強大,模型並不會自動變得更有品味、在改進程式碼庫時表現出更好的判斷力,那麼你就應該擴展環境套件,這樣你就不只是測試它在程式設計競賽中的表現。它還應該能夠為 X、Y 或 Z 製作最好的應用程式。另一種,也許這正是你暗示的,就是問:“為什麼在程式設計競賽中變得超人般強大,卻不能讓你在更廣泛的意義上成為一個更有品味的程式設計師?”也許我們要做的不應該是不斷堆疊環境的數量和多樣性,而是要找到一種方法,讓你能從一個環境中學習,並在其他事情上提高表現。Ilya Sutskever我有一個人類的類比可能會有幫助。讓我們以程式設計競賽為例,既然你提到了。假設有兩個學生。其中一個決定要成為最好的競賽程式設計師,所以他們會在這個領域練習 10,000 小時。他們會解決所有問題,記住所有證明技巧,並且非常熟練地快速正確實現所有演算法。通過這樣做,他們成為了最好的之一。第二個學生想,“哦,程式設計競賽很酷。”也許他們練習了 100 小時,少得多,但他們也做得很好。你認為那一個在以後的職業生涯中會做得更好?Dwarkesh Patel第二個。Ilya Sutskever對。我認為這就是正在發生的事情。現在的模型更像第一個學生,甚至程度更甚。因為我們會說,模型應該擅長程式設計競賽,所以讓我們把有史以來的每一個程式設計競賽問題都拿來。然後我們做一些資料增強,這樣我們就有了更多的程式設計競賽問題,然後我們在這些資料上訓練。現在你得到了這個偉大的競賽程式設計師。用這個類比,我覺得更直觀。是的,好吧,如果它訓練得這麼好,所有不同的演算法和證明技巧都觸手可及。但直覺告訴我們,這種程度的準備並不一定能泛化到其他事情上。Dwarkesh Patel但是,第二個學生在進行那 100 小時的微調之前,他在做什麼?這裡的類比是什麼?Ilya Sutskever我覺得他們有“它”。那種“天賦”因素。我在讀本科的時候,記得有個同學就是這樣,所以我知道這種人是存在的。Dwarkesh Patel我覺得把這種“天賦”與預訓練的作用區分開來很有趣。理解你剛才說的“不需要在預訓練中選擇資料”的一種方式是,這實際上與那 10,000 小時的練習並無二致。只是你免費得到了那 10,000 小時的練習,因為它已經在預訓練分佈中的某個地方了。但也許你是在暗示,實際上預訓練並沒有帶來那麼多的泛化。預訓練中只有海量的資料,但它不一定比 RL 泛化得更好。Ilya Sutskever預訓練的主要優勢在於:A,資料量巨大;B,你不需要費盡心思去想把什麼資料放入預訓練中。它是非常自然的資料,確實包含了很多人們做的事情:人們的思想和很多特徵。它就像是整個世界被人們投射到了文字上,而預訓練試圖利用海量資料來捕捉這一點。預訓練很難推理,因為很難理解模型依賴預訓練資料的方式。每當模型犯錯時,是不是因為某些東西碰巧沒有得到預訓練資料的充分支援?“預訓練支援”也許是個寬泛的術語。我不知道我還能不能補充更多有用的東西。我不認為預訓練有人類層面的類比。Dwarkesh Patel有些人提出過預訓練的人類類比。我很想聽聽你認為它們為什麼可能是錯的。一種是把這看作人生的前 18 年、15 年或 13 年,那時他們不一定有經濟產出,但他們在做一些讓他們更好地理解世界的事情。另一種是把進化看作是進行了 30 億年的搜尋,然後產生了一個人類生命實例。我很好奇你是否認為這些可以類比預訓練。如果不是預訓練,你會如何看待人類的終身學習?Ilya Sutskever我認為這兩者與預訓練之間都有一些相似之處,預訓練試圖扮演這兩者的角色。但我認為也有一些巨大的差異。預訓練的資料量非常非常驚人。Dwarkesh Patel是的。Ilya Sutskever不知何故,一個人即使過了 15 年,接觸到的資料只是預訓練資料的一小部分,他們知道的東西少得多。但無論他們知道什麼,不知何故他們理解得更深。在這個年紀,你就不會犯我們 AI 犯的那種錯誤了。還有一件事。你會說,這可能是像進化一樣的東西嗎?答案是也許。但在這種情況下,我認為進化實際上可能更有優勢。我記得讀過這個案例。神經科學家瞭解大腦的一種方式是研究大腦不同部位受損的人。有些人的症狀奇怪到你無法想像。這真的非常有趣。我想到了一個相關的案例。我讀到過一個人,他的大腦受到某種損傷,中風或事故,導致他的情感處理能力喪失。所以他不再感覺到任何情緒。他仍然非常善於表達,能解決小謎題,在測試中看起來一切正常。但他感覺不到情緒。他不感到悲傷,不感到憤怒,也不感到興奮。不知何故,他變得極不擅長做任何決定。決定穿那雙襪子都要花好幾個小時。他會做出非常糟糕的財務決定。這說明了我們內建的情緒在使我們成為一個可行的智能體方面扮演了什麼角色?聯絡到你關於預訓練的問題,也許如果你足夠擅長從預訓練中獲取一切,你也能得到那個。但這似乎是那種……嗯,從預訓練中獲得那個東西可能是可能的,也可能不可能。Dwarkesh Patel“那個”是什麼?顯然不僅僅是直接的情緒。它看起來像是某種類似價值函數(value function)的東西,它告訴你任何決定的最終回報應該是什麼。你認為這不會從預訓練中隱式地產生嗎?Ilya Sutskever我認為它是可以的。我只是說這不是 100% 顯而易見的。Dwarkesh Patel但這到底是什麼?你怎麼看待情緒?情緒在機器學習(ML)中的類比是什麼?Ilya Sutskever它應該是某種價值函數的東西。但我不認為有一個很好的 ML 類比,因為目前,價值函數在人們做的事情中並沒有發揮非常突出的作用。Dwarkesh Patel如果方便的話,也許值得為觀眾定義一下什麼是價值函數。Ilya Sutskever當然,我很樂意。當人們做強化學習(RL)時,目前的做法是如何訓練這些智能體的?你有一個神經網路,給它一個問題,然後告訴模型,“去解決它。”模型會採取數千甚至數十萬個動作或思考步驟,然後產生一個解決方案。這個解決方案會被打分。然後,這個分數被用來為你軌跡中的每一個動作提供訓練訊號。這意味著,如果你在做一件持續時間很長的事情——如果你在訓練一個需要很長時間才能解決的任務——在你想出提議的解決方案之前,它完全不會進行任何學習。這就是目前天真的 RL 做法。這就是 o1、R1 表面上的做法。價值函數的意思是,“也許有時(不總是)我可以告訴你,你做得是好是壞。”價值函數的概念在某些領域比其他領域更有用。例如,當你下國際象棋丟了一個棋子,我搞砸了。你不需要下完整局棋就知道我剛才做的是壞事,因此導致這一切的前序動作也是壞的。價值函數讓你不必等到最後。假設你在做某種數學或程式設計的事情,你試圖探索一個特定的解決方案或方向。在思考了比如一千步之後,你得出結論這個方向沒有希望。一旦你得出這個結論,你就可以在一千個時間步之前,當你決定走這條路時,就已經得到一個獎勵訊號。你會說,“下次在類似情況下我不應該走這條路”,這早在你真正拿出提議的解決方案之前。Dwarkesh Patel這在 DeepSeek R1 的論文裡提到過——軌跡的空間太廣了,也許很難學習從中間軌跡到價值的對應。而且考慮到,例如在程式設計中,你會有一個錯誤的想法,然後你會回過頭去,改變一些東西。Ilya Sutskever這聽起來像是對深度學習缺乏信心。當然這可能很難,但沒有什麼深度學習做不到的。我的預期是價值函數應該是有用的,我完全預計它們將在未來被使用,如果不是已經在用的話。我提到的那個情感中樞受損的人的例子,更多是暗示也許人類的價值函數在某種重要方面受到情緒的調節,這是進化硬編碼的。也許這對人類在世界上有效行事很重要。Dwarkesh Patel這正是我打算問你的。關於價值函數的情緒有一些非常有趣的地方,那就是它們在如此有用的同時,理解起來卻相當簡單,這令人印象深刻。Ilya Sutskever我有兩個回應。我確實同意,與我們學習的東西以及我們正在討論的 AI 相比,情緒相對簡單。它們甚至簡單到也許你可以用人類可理解的方式將它們繪製出來。我覺得這樣做會很酷。但在實用性方面,我認為存在一種複雜性與魯棒性的權衡,複雜的東西可能非常有用,但簡單的東西在非常廣泛的情況下都非常有用。解釋我們所見現象的一種方式是,我們的情緒大多是從我們的哺乳動物祖先演化而來的,然後在我們成為原始人類時進行了一點微調,只是一點點。不過我們確實有相當數量的社會性情緒,這是哺乳動物可能缺乏的。但它們並不是非常複雜。正是因為它們不複雜,所以在這個與我們一直生活的世界截然不同的世界裡,它們依然能很好地為我們服務。實際上,它們也會犯錯。例如,我們的情緒……其實,我不知道。飢餓算是一種情緒嗎?這有爭議。但我認為,例如,我們直覺上的飢餓感在這個食物充足的世界裡並沒有成功地正確引導我們。Dwarkesh Patel人們一直在談論擴展資料、擴展參數、擴展算力。有沒有更通用的方式來思考擴展(scaling)?還有那些其他的擴展維度?Ilya Sutskever這裡有一個我認為可能是正確的視角。過去機器學習的工作方式是,人們只是修修補補,試圖得到有趣的結果。過去一直都是這樣。然後擴展的洞見出現了。Scaling Laws(擴展定律)、GPT-3,突然之間大家都意識到我們應該進行擴展。這是語言影響思維的一個例子。“Scaling”只是一個詞,但它是一個非常有力的詞,因為它告訴人們該做什麼。他們說,“讓我們試著擴展東西。”所以你會問,我們在擴展什麼?預訓練是要擴展的東西。它是一個特定的擴展配方。預訓練的巨大突破在於意識到這個配方是好的。你會說,“嘿,如果你把一些算力和一些資料混合到一個特定大小的神經網路中,你會得到結果。你知道只要按比例放大這個配方,你就會變得更好。”這也太棒了。公司喜歡這個,因為它提供了一種風險極低的方式來投資資源。投資研究要難得多。比較一下。如果你做研究,你需要說,“去吧研究員們,去研究並想出點什麼來”,對比“獲取更多資料,獲取更多算力”。你知道你會從預訓練中得到東西。確實,根據一些人在推特上的說法,看起來 Gemini 可能已經找到了一種從預訓練中獲得更多收益的方法。但在某個時刻,預訓練的資料會用完。資料顯然是有限的。接下來你做什麼?要麼你做某種增強版的預訓練,一種與以前不同的配方,要麼你做 RL,或者可能是其他東西。但現在算力很大,算力現在非常大,從某種意義上說,我們又回到了研究時代。也許換一種說法。直到 2020 年,從 2012 年到 2020 年,是研究時代。然後,從 2020 年到 2025 年,是擴展時代——也許加減一些誤差範圍——因為人們說,“這太驚人了。你必須擴展更多。繼續擴展。”這一個詞:擴展。但現在規模已經這麼大了。信念真的是“哦,它這麼大,但如果你有 100 倍以上,一切都會變得如此不同”嗎?肯定會有不同。但信念是只要把規模擴大 100 倍,一切都會發生質變嗎?我不認為這是真的。所以這又回到了研究時代,只是有了大電腦。Dwarkesh Patel這是一種非常有趣的說法。但讓我問你剛才提出的問題。我們在擴展什麼,擁有一個配方意味著什麼?我想我還不知道預訓練中存在的那種非常幹淨的、幾乎看起來像物理定律的關係。在資料、算力或參數與損失之間存在冪律關係。我們應該尋求什麼樣的關係,我們應該如何思考這個新配方可能是什麼樣子的?Ilya Sutskever我們已經見證了從一種類型的擴展向另一種類型的擴展的轉變,從預訓練到 RL。現在人們正在擴展 RL。根據人們在推特上的說法,他們在 RL 上花費的算力此時比預訓練還多,因為 RL 實際上可以消耗相當多的算力。你做很長的推演(rollouts),所以產生這些推演需要很多算力。然後你從每個推演中獲得相對較少的學習量,所以你真的可以花費很多算力。我甚至不會稱之為擴展。我會說,“嘿,你在做什麼?你做的事情是你最能產出的事情嗎?你能找到一種更有效利用算力的方法嗎?”我們之前討論過價值函數的事情。也許一旦人們擅長價值函數,他們將更有效地利用資源。如果你發現了一種完全不同的訓練模型的方法,你會說,“這是擴展還是僅僅是利用你的資源?”我認為這變得有點模棱兩可。某種意義上,當人們回到那時的研究時代,就是“讓我們試試這個、這個和這個。讓我們試試那個、那個和那個。哦,看,有趣的事情發生了。”我認為將會回歸到這種狀態。Dwarkesh Patel如果我們回到了研究時代,退一步說,我們需要最深入思考的配方部分是什麼?當你提到價值函數時,人們已經在嘗試當前的配方,比如用 LLM-as-a-Judge(大模型作為裁判)等等。你可以說那是一個價值函數,但聽起來你有更本質的想法。我們是否應該徹底重新思考預訓練,而不僅僅是在那個過程的末尾加入更多步驟?Ilya Sutskever關於價值函數的討論,我認為很有趣。我想強調,我認為價值函數會讓 RL 更有效率,我認為這很重要。但我認為任何你可以用價值函數做的事,你不用它也能做,只是更慢。我認為最根本的事情是,這些模型不知何故泛化能力比人類差得多。這非常明顯。這似乎是一個非常根本的事情。Dwarkesh Patel這就是關鍵:泛化。這有兩個子問題。一個是關於樣本效率:為什麼這些模型學習需要比人類多得多的資料?還有第二個問題。即使不談所需的資料量,為什麼教模型我們要的東西比教人類要難得多?對於人類,我們不一定需要一個可驗證的獎勵來……你現在可能正在指導一群研究人員,你和他們交談,向他們展示你的程式碼,向他們展示你是如何思考的。從中,他們學到了你的思維方式以及他們應該如何做研究。你不需要為他們設定一個可驗證的獎勵,比如“好,這是課程的下一部分,現在這是你課程的下一部分。哦,這次訓練不穩定。”沒有這種繁瑣的、定製的過程。也許這兩個問題實際上以某種方式相關,但我很想探討這第二件事,這更像是終身學習(continual learning),而第一件事感覺就像是樣本效率。Ilya Sutskever其實你可以思考,對人類樣本效率的一種可能的解釋是進化。進化給了我們少量最有用資訊的先驗。對於視覺、聽覺和運動這些東西,我認為有很強的理由證明進化給了我們很多。例如,人類的靈巧度遠遠超過……我是說,如果你在模擬中對機器人進行大量訓練,它們也能變得靈巧。但在現實世界中訓練機器人像人一樣快速掌握一項新技能似乎遙不可及。在這裡你可以說,“哦是的,運動能力。我們所有的祖先都需要極好的運動能力,比如松鼠。所以對於運動能力,也許我們有一些不可思議的先驗。”你可以為視覺提出同樣的理由。我相信 Yann LeCun 提出過一個觀點,孩子在 10 小時的練習後學會開車,這是真的。但我們的視覺太好了。至少對我來說,我記得我五歲的時候。那時候我對汽車非常興奮。我敢肯定,我五歲時的汽車識別能力已經足以用來開車了。作為一個五歲的孩子,你看不到那麼多資料。你大部分時間都待在父母家裡,所以資料多樣性很低。但你可以說也許那也是進化。但在語言、數學和程式設計方面,可能不是。Dwarkesh Patel它看起來仍然比模型好。顯然,模型在語言、數學和程式設計方面比普通人好。但它們在學習方面比普通人好嗎?Ilya Sutskever哦是的。哦是的,絕對的。我想說的是,語言、數學和程式設計——尤其是數學和程式設計——表明,無論是什麼讓人類擅長學習,可能不僅僅是一個複雜的先驗,而是更多的東西,某種根本性的東西。Dwarkesh Patel我不確定我理解了。為什麼會這樣?Ilya Sutskever考慮一項人們表現出某種巨大可靠性的技能。如果這項技能對我們的祖先在數百萬年、數億年裡都非常有用,你可以爭辯說,也許人類擅長它是因為進化,因為我們有一個先驗,一個以某種非常不明顯的方式編碼的進化先驗,不知何故使我們如此擅長它。但是,如果人們在一個直到最近才存在的領域表現出巨大的能力、可靠性、魯棒性和學習能力,那麼這更多地表明人們可能只是擁有更好的機器學習機制,句號。Dwarkesh Patel我們應該如何思考那是什麼?什麼是 ML 類比?這裡有幾件有趣的事情。它需要更少的樣本。它更像是無監督的。一個孩子學開車……孩子不學開車。一個青少年學開車並不是真的得到了某種預先建立的、可驗證的獎勵。它來自他們與機器和環境的互動。它需要的樣本少得多。它看起來更無監督。它看起來更魯棒?Ilya Sutskever魯棒得多。人類的魯棒性真的令人震驚。Dwarkesh Patel你有沒有一個統一的方式來思考為什麼所有這些事情同時發生?能夠實現類似這種東西的 ML 類比是什麼?Ilya Sutskever你一直在問的一件事是,青少年司機如何在沒有外部老師的情況下自我糾正並從經驗中學習?答案是他們有自己的價值函數。他們有一種普遍的感覺,順便說一下,這種感覺在人身上也非常魯棒。無論人類的價值函數是什麼,除了成癮等少數例外,它實際上非常非常魯棒。所以對於像學開車的青少年來說,他們開始開車,馬上就能感覺到自己開得怎麼樣,有多糟糕,多不自信。然後他們看到,“好的。”然後,當然,任何青少年的學習速度都太快了。10 個小時後,你就可以上路了。Dwarkesh Patel看起來人類有某種解決方案,但我很好奇他們是如何做到的,以及為什麼這這麼難?我們需要如何重新構想訓練模型的方式來實現這種可能?Ilya Sutskever這是一個很好的問題,這也是我有很多觀點的問題。但不幸的是,我們生活在一個並非所有機器學習想法都可以自由討論的世界裡,這就是其中之一。可能有一種方法可以做到。我認為這是可以做到的。人們就是這樣,我認為這證明了它是可以做到的。不過可能還有另一個阻礙,就是人類神經元進行的計算量可能比我們要多。如果是真的,如果那起到了重要作用,那麼事情可能會更困難。但無論如何,我確實認為這指向了某種機器學習原則的存在,對此我有自己的看法。但不幸的是,環境使得很難詳細討論。Dwarkesh Patel我很好奇。如果你說我們回到了研究時代,你在 2012 年到 2020 年就在那裡。如果我們要回到研究時代,現在的氛圍會是什麼樣的?例如,即使在 AlexNet 之後,用於運行實驗的算力也在不斷增加,前沿系統的規模也在不斷增加。你認為現在的研究時代是否仍然需要大量的算力?你認為這需要回到檔案館去閱讀舊論文嗎?當你在 Google、OpenAI 和史丹佛這些地方時,那時有更多的研究氛圍?我們在社區中應該期待什麼樣的事情?Ilya Sutskever擴展時代的一個後果是,擴展吸走了房間裡所有的空氣。因為擴展吸走了所有的空氣,每個人都開始做同樣的事情。我們到了這樣一個地步,世界上的公司比想法多得多。實際上關於這一點,矽谷有句俗話說,想法是廉價的,執行就是一切。人們常這麼說,這也確實有道理。但我看到有人在 Twitter 上說,“如果想法這麼廉價,怎麼沒人有想法呢?”我覺得這也是真的。如果你從瓶頸的角度思考研究進展,有幾個瓶頸。其中一個是想法,另一個是你實現它們的能力,這可能是算力也可能是工程。如果你回到 90 年代,假設有人有很好的想法,如果他們有更大的電腦,也許他們可以證明他們的想法是可行的。但他們做不到,所以他們只能做一個非常非常小的演示,無法說服任何人。所以瓶頸是算力。然後在擴展時代,算力增加了很多。當然,有個問題是需要多少算力,但算力是巨大的。算力大到你並不明顯需要更多的算力來證明某個想法。我給你一個類比。AlexNet 是在兩個 GPU 上建構的。那是它使用的總算力。Transformer 是在 8 到 64 個 GPU 上建構的。2017 年沒有任何單一的 Transformer 論文實驗使用的 GPU 超過 64 個,這大概相當於今天的兩個 GPU?ResNet 也是,對吧?你可以爭辯說 o1 推理並不是世界上最耗算力的東西。所以對於研究,你肯定需要一定量的算力,但這遠不意味著你需要有史以來絕對最大的算力來進行研究。你可能會爭辯,而且我認為這是真的,如果你想建構絕對最好的系統,那麼擁有更多的算力會有幫助。特別是如果每個人都在同一個範式內,那麼算力就成了巨大的差異化因素。Dwarkesh Patel我問你歷史是因為你當時真的在場。我不確定實際發生了什麼。聽起來使用最少的算力來開發這些想法是可能的。但 Transformer 並沒有立即變得出名。它成為了每個人開始做的事情,然後開始在其基礎上進行實驗和建構,因為它在更高層級的算力上得到了驗證。Ilya Sutskever沒錯。Dwarkesh Patel如果你在 SSI 有 50 個不同的想法,如果不擁有其他前沿實驗室那種算力,你怎麼知道那一個是下一個 Transformer,那一個是脆弱的?Ilya Sutskever我可以評論一下。簡短的評論是,你提到了 SSI。具體對我們來說,SSI 用於研究的算力真的不小。我想解釋一下為什麼。簡單的數學可以解釋為什麼我們擁有的研究算力比人們想像的要多。我會解釋。SSI 籌集了 30 億美元,這在絕對意義上是一筆巨款。但你會說,“看看其他籌集更多資金的公司。”但他們的大部分算力都用於推理(inference)。這些大數字,這些大額貸款,是專門用於推理的。這是第一點。第二,如果你想擁有一個進行推理的產品,你需要有龐大的工程師、銷售人員團隊。大量的研究需要致力於生產各種與產品相關的功能。所以當你看看實際上留給研究的是什麼時,差距就變得小得多了。另一件事是,如果你在做不同的事情,你真的需要絕對最大的規模來證明它嗎?我不認為這是真的。我認為在我們的案例中,我們有足夠的算力來證明,來說服我們自己和其他任何人,我們在做的事情是正確的。Dwarkesh Patel有公開估計稱,像 OpenAI 這樣的公司僅在實驗上每年就花費 50-60 億美元。這與他們在推理等方面的支出是分開的。所以看起來他們每年運行研究實驗的支出比你們的總資金還多。Ilya Sutskever我認為這是一個你用它做什麼的問題。這是一個你用它做什麼的問題。在他們的情況下,在其他人的情況下,對訓練算力有更多的需求。有更多不同的工作流,有不同的模態,只是有更多的東西。所以它變得碎片化了。Dwarkesh PatelSSI 將如何賺錢?Ilya Sutskever我對這個問題的回答是這樣的。現在,我們只專注於研究,然後這個問題的答案會自己顯現出來。我認為會有很多可能的答案。Dwarkesh PatelSSI 的計畫仍然是直通超級智能嗎?Ilya Sutskever也許。我認為這樣做有其優點。我認為這有很多優點,因為不受日常市場競爭的影響是非常好的。但我認為有兩個原因可能會導致我們改變計畫。一個是務實的,如果時間線變得很長,這是可能的。其次,我認為最強大、最好的 AI 在外面影響世界是有很大價值的。我認為這是一件有意義且有價值的事情。Dwarkesh Patel那為什麼你的默認計畫是直通超級智能?因為聽起來 OpenAI、Anthropic 以及所有其他公司,他們的明確想法是,“看,我們有越來越弱的智能,公眾可以適應並為此做好準備。”為什麼直接建構超級智能可能更好?Ilya Sutskever我會分別陳述支援和反對的理由。支援的理由是,人們在市場中面臨的挑戰之一是他們必須參與激烈的競爭(rat race)。這種競爭非常困難,因為它讓你面臨需要做出的艱難權衡。說“我們將把自己與這一切隔離開來,只專注於研究,只在準備好時才出來,而不是之前”是很好的。但反駁也是有效的,那是相反的力量。反駁是,“嘿,讓世界看到強大的 AI 是有用的。讓世界看到強大的 AI 是有用的,因為那是你能夠傳達它的唯一方式。”Dwarkesh Patel我想甚至不僅僅是你能夠傳達這個想法——Ilya Sutskever傳達 AI,不是想法。傳達 AI。Dwarkesh Patel你說的“傳達 AI”是什麼意思?Ilya Sutskever假設你寫了一篇關於 AI 的文章,文章說,“AI 將會是這樣,AI 將會是那樣,它會是這個。”你讀了之後說,“好的,這是一篇有趣的文章。”現在假設你看到一個 AI 做這個,一個 AI 做那個。這是無法比擬的。基本上我認為 AI 公開化有很大的好處,這將是我們不完全直通的一個理由。Dwarkesh Patel我想甚至不僅僅是那個,雖然我確實認為那是其中的重要部分。另一件大事是,我想不出人類工程和研究中有那一門學科,其最終產品主要是通過僅僅思考如何使其安全而變得更安全的,相比之下——為什麼今天的飛機每英里墜毀率比幾十年前低得多。為什麼現在在 Linux 中找 bug 比幾十年前難得多?我認為這主要是因為這些系統被部署到了世界上。你注意到了故障,這些故障被糾正了,系統變得更加健壯。我不確定為什麼 AGI 和超人類智能會有什麼不同,尤其是考慮到——我希望我們會談到這點——看起來超級智能的危害不僅僅是關於有一個惡意的回形針製造者。這是一個真正強大的東西,我們甚至不知道如何概念化人們如何與之互動,人們會用它做什麼。逐步接觸它似乎是分散其影響並幫助人們為此做好準備的更好方式。Ilya Sutskever嗯,我認為關於這一點,即使在直通方案中,你仍然會逐步發佈它,我是這樣想像的。漸進主義將是任何計畫的固有組成部分。只是問題在於你推出的第一件東西是什麼。這是第一點。第二,我相信你比其他人更提倡終身學習(continual learning),而且我實際上認為這是一件重要且正確的事情。原因如下。我給你另一個語言如何影響思維的例子。在這種情況下,我認為有兩個詞塑造了每個人的思維。第一個詞:AGI。第二個詞:預訓練。讓我解釋一下。AGI 這個術語,為什麼這個術語存在?這是一個非常特別的術語。它為什麼存在?有原因的。在我看來,AGI 這個術語之所以存在,與其說是因為它是某種智能終極狀態的非常重要、本質的描述,不如說它是因為它是對另一個存在的術語的反應,那個術語是“狹義 AI”(narrow AI)。如果你回到遊戲和 AI、跳棋 AI、國際象棋 AI、電腦遊戲 AI 的遠古歷史,每個人都會說,看這個狹義的智能。當然,國際象棋 AI 可以擊敗卡斯帕羅夫,但它不能做任何其他事情。它是如此狹隘,人工狹義智能。所以作為回應,作為對此的反應,有些人說,這不好。它太狹隘了。我們需要的是通用 AI,一個可以做所有事情的 AI。那個術語獲得了很多關注。第二個獲得很多關注的是預訓練,特別是預訓練的配方。我認為人們現在做 RL 的方式可能正在消除預訓練的概念印記。但預訓練有這種屬性。你做更多的預訓練,模型在所有方面都會變得更好,或多或少是一致的。通用 AI。預訓練產生 AGI。但是 AGI 和預訓練發生的事情是,在某種意義上它們超出了目標。如果你在預訓練的背景下思考“AGI”這個術語,你會意識到人類並不是一個 AGI。是的,肯定有技能的基礎,但人類缺乏大量的知識。相反,我們依賴終身學習。所以當你思考,“好吧,假設我們取得了成功,我們產生某種安全的超級智能。”問題是,你如何定義它?它會在終身學習曲線的那裡?我生產了一個超級聰明的 15 歲少年,非常渴望出發。他們知道的不多,是一個很好的學生,非常渴望。你去當程式設計師,你去當醫生,去學習。所以你可以想像部署本身將涉及某種學習試錯期。這是一個過程,而不是你扔出一個成品。Dwarkesh Patel我明白了。你是在暗示你指出的超級智能不是某種已經知道如何做經濟中每一項工作的成品思維。因為,比如說,最初的 OpenAI 章程或其他檔案定義 AGI 的方式是,它可以做每一項工作,人類能做的每一件事。你提議的是一種可以 學會 做每一項工作的思維,那就是超級智能。Ilya Sutskever是的。Dwarkesh Patel但是一旦你有了學習演算法,它就會像人類勞動力加入組織一樣被部署到世界上。Ilya Sutskever完全正確。Dwarkesh Patel看起來這兩種情況之一可能會發生,也許這兩種情況都不會發生。第一,這種超級高效的學習演算法變得超人,變得和你一樣好,甚至可能比你更好,在 ML 研究任務上。結果演算法本身變得越來越超人。另一個是,即使那沒有發生,如果你有一個單一的模型——這顯然是你的願景——模型的實例被部署到整個經濟中做不同的工作,學習如何做那些工作,在工作中不斷學習,學會任何人能學會的所有技能,但同時也學會所有技能,然後合併它們的學習成果,你基本上就有了一個功能上變得超級智能的模型,即使軟體沒有任何遞迴的自我改進。因為你現在有了一個可以做經濟中每一項工作的模型,而人類無法以同樣的方式合併我們的思想。所以你預計廣泛部署會帶來某種智能爆炸嗎?Ilya Sutskever我認為我們很可能會有快速的經濟增長。我認為隨著廣泛部署,你可以提出兩個相互衝突的論點。一個是,一旦你確實到了擁有一個可以快速學習做事的 AI 並且你有很多這樣的 AI 的地步,那麼將會有一股強大的力量將它們部署到經濟中,除非會有某種監管阻止它,順便說一句,可能會有。但是關於非常快速的經濟增長的想法,我認為從廣泛部署來看是非常可能的。問題是它會有多快。我認為這很難知道,因為一方面你有這個非常高效的工人。另一方面,世界真的很大,有很多東西,而那些東西以不同的速度移動。但另一方面,現在 AI 可以……所以我認為非常快速的經濟增長是可能的。我們將看到各種各樣的事情,比如不同的國家有不同的規則,那些規則更友好的國家,經濟增長會更快。很難預測。Dwarkesh Patel在我看來,這是一個非常不穩定的處境。在極限情況下,我們知道這應該是可能的。如果你有某種在學習方面和人類一樣好,但可以合併其大腦——以人類無法合併的方式合並不同實例——的東西,這似乎是一件物理上應該可能的事情。人類是可能的,數字電腦是可能的。你只需要把這兩者結合起來就能產生這個東西。看起來這種東西也非常強大。經濟增長是描述它的一種方式。戴森球也是很多經濟增長。但另一種說法是,你將在可能非常短的時間內擁有……你在 SSI 僱傭人,六個月後,他們可能就是淨產出的。人類學得很快,而這個東西正變得越來越聰明。你如何考慮讓這一切順利進行?為什麼 SSI 定位於能做好這件事?SSI 在那裡的計畫是什麼,這基本上就是我想問的。Ilya Sutskever我的想法發生變化的一種方式是,我現在更加重視 AI 的增量部署和提前部署。關於 AI 的一件非常困難的事情是,我們正在談論尚不存在的系統,很難想像它們。我認為正在發生的一件事是,實際上很難 感覺到 AGI。很難感覺到 AGI。我們可以談論它,但這就像談論當你年老體弱時是什麼感覺。你可以談論,你可以試圖想像,但這很難,你會回到那不是事實的現實中。我認為許多圍繞 AGI 及其未來力量的問題源於這樣一個事實:很難想像。未來的 AI 會有所不同。它將會很強大。確實,AI 和 AGI 的問題是什麼?整個問題就是力量。整個問題就是力量。當力量真的很大時,會發生什麼?我在過去一年中改變主意的一種方式——這種改變,我會稍微避險一下,可能會反向傳播到我們公司的計畫中——是,如果很難想像,你做什麼?你必須展示這個東西。你必須展示這個東西。我堅持認為,大多數從事 AI 工作的人也無法想像它,因為它與人們日常看到的東西太不同了。我確實堅持,這是我的一個預測。我堅持認為隨著 AI 變得更強大,人們會改變他們的行為。我們將看到各種前所未有的事情,這些事情現在還沒有發生。我會舉一些例子。我認為不管是好是壞,前沿公司將在發生的事情中扮演非常重要的角色,政府也是如此。我認為你會看到的事情,你已經看到了開端,那就是作為激烈競爭對手的公司開始在 AI 安全方面進行合作。你可能已經看到 OpenAI 和 Anthropic 邁出了一小步,但這以前是不存在的。這是我在大約三年前的一次演講中預測的事情,這種事情會發生。我還堅持認為,隨著 AI 繼續變得更強大,更明顯地強大,政府和公眾也會渴望做點什麼。我認為這是一股非常重要的力量,即展示 AI。這是第一點。第二點,好的,AI 正在被建構。需要做什麼?我堅持認為會發生的一件事是,目前,從事 AI 工作的人,我堅持認為 AI 並不讓人感到強大,是因為它的錯誤。我確實認為在某個時刻,AI 會開始讓人感到真正強大。我認為當這種情況發生時,我們將看到所有 AI 公司對待安全的方式發生巨大變化。他們會變得更加偏執。我這是作為一個預測說出來的,我們會看到這種事發生。我們要看看我是不是對的。但我認為這是會發生的,因為他們會看到 AI 變得更強大。目前發生的一切,我堅持認為是因為人們看著今天的 AI,很難想像未來的 AI。還有第三件事需要發生。我是從更廣泛的角度說的,不僅僅是從 SSI 的角度,因為你問到了我們公司。問題是,公司應該渴望建立什麼?他們應該渴望建立什麼?有一個每個人都被鎖定的大主意,那就是自我改進的 AI。為什麼會這樣?因為想法比公司少。但我堅持認為有更好的東西可以建立,我認為每個人都會想要那個。那就是穩健地對齊以關愛感知生命(sentient life)的 AI。我想特別指出,有理由認為建立一個關心感知生命的 AI 比建立一個只關心人類生命的 AI 更容易,因為 AI 本身將是有感知的。如果你想想鏡像神經元和人類對動物的同理心,你可能會說這不夠大,但它確實存在。我認為這是一種湧現屬性,源於我們用模擬自己的同一回路來模擬他人,因為那是最高效的做法。Dwarkesh Patel即使你讓 AI 關心感知生物——如果真的解決了對齊問題,我不清楚這是否就是你應該嘗試做的——情況仍然是,大多數感知生物將是 AI。最終會有數兆、數千兆的 AI。人類將是感知生物中非常小的一部分。所以如果不清楚目標是對這個未來文明進行某種人類控制,那麼我不清楚這是不是最好的標準。Ilya Sutskever這是真的。它可能不是最好的標準。我會說兩點。第一,關心感知生命,我認為有其優點。應該被考慮。我認為如果有一些公司在處於這種情況下時可以使用的簡短想法清單,那會有所幫助。這是第二點。第三,我認為如果最強大的超級智能的力量以某種方式被設定上限,那將真的有實質性的幫助,因為這將解決很多這些擔憂。關於如何做到這一點的問題,我不確定,但我認為當你談論真正、真正強大的系統時,那將有實質性的幫助。Dwarkesh Patel在我們繼續對齊討論之前,我想深入探討一下這一點。頂部有多少空間?你是如何看待超級智能的?利用這個學習效率的想法,你認為它可能只是在學習新技能或新知識方面極快嗎?它是否只是擁有更大的策略池?中心是否有一個單一的、有凝聚力的“它”更強大或更大?如果是這樣,你是否想像這與其餘人類文明相比會像神一樣,還是它只是感覺像另一個智能體,或另一組智能體?Ilya Sutskever這是不同人有不同直覺的領域。我認為它肯定會非常強大。我認為最有可能發生的是,大約在同一時間會有多個這樣的 AI 被創造出來。我認為如果叢集足夠大——比如如果叢集真的是大陸級的——那個東西可能會非常強大,確實如此。如果你真的擁有一個大陸級的叢集,那些 AI 可能會非常強大。我能告訴你的是,如果你在談論極其強大的 AI,真正極其強大的,如果它們能以某種方式受到限制,或者有某種協議之類的東西,那就太好了。超級智能的擔憂是什麼?解釋這種擔憂的一種方式是什麼?如果你想像一個足夠強大的系統,真的足夠強大——你可以說你需要做一些理智的事情,比如以一種非常專一的方式關心感知生命——我們可能不喜歡結果。這就是它的本質。順便說一句,也許答案是你不用通常意義上的 RL 智能體。我會指出幾件事。我認為人類是半 RL 智能體。我們追求獎勵,然後情緒或其他東西讓我們對獎勵感到厭倦,我們追求不同的獎勵。市場是一種非常短視的智能體。進化也是一樣。進化在某些方面非常聰明,但在其他方面非常愚蠢。政府被設計成三個部分之間永無止境的鬥爭,這也是一種效果。所以我想像這樣的事情。另一件讓這個討論變得困難的事情是,我們談論的是不存在的系統,我們不知道如何建構。那是另一件事,實際上這也是我的信念。我認為人們現在正在做的事情會走一段距離,然後逐漸平息。它會繼續改進,但它也不會是“那個東西”。我們不知道如何建構“那個東西”,很多都取決於理解可靠的泛化。我還要說另一件事。你可以說導致對齊困難的原因之一是,你學習人類價值觀的能力是脆弱的。然後你最佳化它們的能力是脆弱的。你實際上學會了去最佳化它們。你難道不能說,“這些不都是不可靠泛化的例子嗎?”為什麼人類似乎泛化得這麼好?如果泛化能力好得多呢?在這種情況下會發生什麼?會有什麼效果?但這些問題目前仍然無法回答。Dwarkesh Patel人們該如何思考 AI 進展順利是什麼樣子的?你已經勾勒了 AI 可能如何演變。我們將擁有這類終身學習智能體。AI 將非常強大。也許會有許多不同的 AI。你怎麼看待許多大陸級算力的智能體四處遊蕩?那有多危險?我們如何讓它變得不那麼危險?我們如何以一種保護平衡的方式做到這一點,即使外面可能有未對齊的 AI 和壞人?Ilya Sutskever這也是我喜歡“關心感知生命的 AI”的一個原因。我們可以爭論它是好是壞。但如果前 N 個這樣的劇變性系統真的關心、愛護人類或者什麼的,關心感知生命,顯然這也就必須實現。這需要被實現。所以如果前 N 個系統實現了這一點,那麼我可以看到它進展順利,至少在相當長的一段時間內。然後就是長期會發生什麼的問題。你如何實現長期均衡?我認為那裡也有一個答案。我不喜歡這個答案,但它需要被考慮。長期來看,你可能會說,“好吧,如果你有一個強大的 AI 存在的世界,短期內,你可以說你有普遍高收入。你有普遍高收入,我們都過得很好。”但佛教徒怎麼說?“變化是唯一的常數。”事情會變。有某種政府、政治結構的東西,它會變,因為這些東西有保質期。一些新的政府形式出現了,它運作,然後過了一段時間它停止運作。這是我們一直看到發生的事情。所以我認為對於長期均衡,一種方法是你可以說也許每個人都會有一個 AI 聽命於他們,這很好。如果這能無限期維持下去,那是真的。但這的缺點是,然後 AI 去為這個人賺錢並在政治領域倡導他們的需求,也許然後寫一份小報告說,“好吧,這是我所做的,這是情況,”然後人說,“太棒了,繼續保持。”但人不再是參與者了。然後你可以說這是一個不穩定的處境。我要先說我不喜歡這個解決方案,但它是一個解決方案。解決方案是如果人們通過某種 Neuralink++ 變成半 AI。因為結果將會是,現在 AI 理解了一些東西,我們也理解了它,因為現在理解是全盤傳遞的。所以現在如果 AI 處於某種情況,你自己也完全參與了那種情況。我認為這是均衡的答案。Dwarkesh Patel我想知道,數百萬年——或者在很多情況下是數十億年——前在一個完全不同的環境中演化出來的情緒,至今仍如此強烈地指導著我們的行動,這是否是對齊成功的一個例子。為了說明我的意思——我不知道稱之為價值函數還是獎勵函數更準確——腦幹有一個指令說,“與更成功的人交配。”皮層是理解現代背景下成功意味著什麼的部分。但腦幹能夠對齊皮層並說,“無論你認為成功是什麼——我不夠聰明去理解那是什麼——你仍然要追求這個指令。”Ilya Sutskever我認為有一個更普遍的觀點。實際上進化如何編碼高層級的慾望真的很神秘。很容易理解進化如何賦予我們對聞起來好的食物的慾望,因為氣味是一種化學物質,所以只要追求那種化學物質就行了。很容易想像進化做那件事。但進化也賦予了我們所有這些社會慾望。我們真的很在乎被社會積極看待。我們在乎擁有良好的地位。所有這些我們擁有的社會直覺,我強烈感覺它們是內建的。我不知道進化是怎麼做到的,因為那是在大腦中表徵的一個高層級概念。比方說你在乎某種社會事物,這不像氣味那樣是低層級訊號。這不是某種有感測器對應的東西。大腦需要做大量的處理,拼湊大量的資訊碎片來理解社會上正在發生什麼。不知何故進化說,“這就是你應該關心的。”它是怎麼做到的?而且它做得很快。所有這些我們在乎的複雜的社會事物,我認為它們演化得相當近。進化很容易就硬編碼了這種高層級的慾望。我不知道有什麼好的假設能解釋它是如何完成的。我有過一些反覆思考的想法,但沒有一個是令人滿意的。Dwarkesh Patel特別令人印象深刻的是,如果是你在有生之年學會的慾望,那是有道理的,因為你的大腦是智能的。你有能力學會智能的慾望是有道理的。也許這不是你的觀點,但理解它的一種方式是,慾望內建於基因組中,而基因組並不智能。但你卻能描述這個特徵。甚至都不清楚你是如何定義這個特徵的,而你卻能把它建構進基因裡。Ilya Sutskever基本上是這樣,或者我也許換個說法。如果你思考基因組可用的工具,它說,“好吧,這是建構大腦的配方。”你可以說,“這是把多巴胺神經元連接到氣味感測器的配方。”如果氣味是某種好的氣味,你就想吃它。我可以想像基因組做那件事。我聲稱這(社會慾望)更難想像。更難想像基因組說你應該關心你的整個大腦、或者大腦的一大塊所做的某種複雜計算。這只是我的主張。我可以告訴你一個猜測,它是如何做到的,我也會解釋為什麼這個猜測可能是錯的。大腦有腦區。我們有皮層。它有所有那些腦區。皮層是均勻的,但腦區和皮層中的神經元大多隻與其鄰居對話。這解釋了為什麼會有腦區。因為如果你想做某種語音處理,所有做語音的神經元需要互相交流。因為神經元大多隻能與附近的鄰居交流,所以它必須是一個區域。所有的區域在人與人之間大多位於同一個地方。所以也許進化硬編碼了大腦上的一個物理位置。所以它說,“哦,當大腦的 GPS 坐標某某某,當那裡點火時,那就是你應該關心的。”也許那是進化所做的,因為那在進化的工具箱之內。Dwarkesh Patel是的,儘管有些例子,例如生來失明的人,他們皮層的那個區域被另一種感官接管了。我不知道,但如果那些需要視覺訊號的慾望或獎勵函數對於那些皮層區域被徵用的人不再起作用,我會感到驚訝。例如,如果你不再有視覺,你是否仍然能感覺到我希望周圍的人喜歡我這種感覺,通常這也有視覺線索。Ilya Sutskever我完全同意這一點。我認為對這個理論有一個更強的反駁。有些人童年時期被切除了一半大腦(大腦半球切除術),他們仍然擁有所有的腦區。但它們不知何故都移動到了一個半球,這表明腦區的位置不是固定的,所以那個理論是不正確的。如果是真的那就太酷了,但它不是。所以我認為這是一個謎。但這是一個有趣的謎。事實是,不知何故進化能夠賦予我們非常非常可靠地關心社會事物的能力。即使是有各種奇怪的精神狀況、缺陷和情緒問題的人也傾向於關心這個。Dwarkesh PatelSSI 計畫做什麼不同的事情?大概你們的計畫是當那個時刻到來時成為前沿公司之一。大概你創立 SSI 是因為你想,“我覺得我有一種方法可以安全地做這件事,而其他公司沒有。”那個區別是什麼?Ilya Sutskever我會這樣描述,有一些我認為有前途的想法,我想調查它們,看看它們是否真的有前途。真的就這麼簡單。這是一種嘗試。如果這些想法被證明是正確的——我們討論的這些圍繞理解泛化的想法——那麼我認為我們將擁有有價值的東西。它們會被證明是正確的嗎?我們在做研究。我們要實事求是地作為一家“研究時代”的公司。我們在取得進展。實際上我們在過去一年取得了相當不錯的進展,但我們需要繼續取得更多進展,更多研究。這就是我的看法。我看作是一種嘗試,試圖成為一個聲音和一個參與者。Dwarkesh Patel你的聯合創始人和前 CEO 最近離開去了 Meta,人們問,“好吧,如果有大量的突破正在發生,這看起來似乎是不太可能發生的事情。”我想知道你如何回應。Ilya Sutskever對此,我只想提醒幾個可能被遺忘的事實。我認為這些提供背景的事實解釋了情況。背景是我們當時正以 320 億美元的估值融資,然後 Meta 進來提議收購我們,我拒絕了。但在某種意義上,我的前聯合創始人同意了。結果,他也能夠享受到大量的近期流動性,他是 SSI 唯一加入 Meta 的人。Dwarkesh Patel聽起來 SSI 的計畫是當你到達人類歷史這一非常重要的時期,即擁有超人智能時,成為一家前沿公司。你有關於如何讓超人智能順利發展的想法。但其他公司也會嘗試他們自己的想法。是什麼讓 SSI 使超級智能順利發展的方法與眾不同?Ilya Sutskever主要讓 SSI 與眾不同的是其技術方法。我們有不同的技術方法,我認為它是值得的,我們正在追求它。我堅持認為最終會有戰略的趨同。我認為會有戰略的趨同,在某個時刻,隨著 AI 變得更強大,對每個人來說或多或少都會變得清晰,戰略應該是什麼。它應該是這樣的:你需要找到某種方式互相交談,你希望你的第一個真正的超級智能 AI 是對齊的,並以某種方式關心感知生命、關心人類、民主,諸如此類,某種組合。我認為這是每個人都應該爭取的條件。這就是 SSI 正在爭取的。我認為這一次,如果還沒發生的話,所有其他公司都會意識到他們正在朝著同一個目標努力。我們拭目以待。我認為隨著 AI 變得更強大,世界將真正改變。我認為事情會真的很不同,人們的行為也會真的很不同。Dwarkesh Patel說到預測,你對你描述的這個系統——它可以像人類一樣學習並因此隨後變成超人——的預測是什麼?Ilya Sutskever我認為大概 5 到 20 年。Dwarkesh Patel5 到 20 年?Ilya Sutskever嗯。Dwarkesh Patel我想展開看看你可能如何看待未來的到來。就像,我們還有幾年時間,其他公司繼續當前的方法並停滯不前。“停滯不前”在這裡是指他們的收入不超過幾千億?你如何思考停滯不前意味著什麼?Ilya Sutskever我認為停滯不前看起來會……在所有不同的公司看來都非常相似。可能是這樣的。我不確定,因為即使停滯不前,我認為這些公司也能創造驚人的收入。也許不是利潤,因為他們需要努力使自己與彼此區分開來,但收入肯定是有的。Dwarkesh Patel但在你的模型中有些東西暗示,當正確的解決方案真的出現時,所有公司之間會有趨同。我很好奇你為什麼認為會這樣。Ilya Sutskever我更多是在談論對齊策略的趨同。我認為最終技術方法的趨同可能也會發生,但我指的是對齊策略的趨同。到底應該做什麼?Dwarkesh Patel我只是想更好地理解你如何看待未來的展開。目前,我們有這些不同的公司,你預計他們的方法會繼續產生收入但達不到這種類人學習者。所以現在我們有這些不同的公司分支。有你們,有 Thinking Machines,還有一堆其他實驗室。也許其中一個找到了正確的方法。但是他們產品的發佈會讓其他人清楚如何做這件事。Ilya Sutskever我認為怎麼做並不清楚,但有些不同的東西是可能的這一點會變得清楚,這就是資訊。人們隨後會試圖弄清楚那是如何工作的。不過我確實認為,這裡沒有提到、沒有討論的一件事是,隨著 AI 能力的每一次提升,我認為做事的方式會有某種變化,但我不知道具體是那些變化。我認為這會很重要,但我無法確切拼出那是什麼。Dwarkesh Patel默認情況下,你會預期擁有那個模型的公司會獲得所有這些收益,因為他們擁有在世界上積累技能和知識的模型。有什麼理由認為這種好處會被廣泛分配,而不僅僅是最終落在最先讓這個終身學習循環運轉起來的模型公司手中?Ilya Sutskever我認為會發生以下情況。第一,讓我們看看過去的 AI 是如何發展的。一家公司取得了一項進展,另一家公司爭先恐後,在一段時間後也搞出了一些類似的東西,他們開始在市場上競爭並將價格壓低。所以我認為從市場角度來看,類似的事情也會發生。順便說一句,我們談論的是美好的世界。什麼是美好的世界?就是我們擁有這些強大的人類般的學習者,它們也是……順便說一下,也許還有一件事我們沒有討論,關於超級智能 AI 的規格,我認為值得考慮。那就是你把它做成狹義的,它可以同時是有用的和狹義的。你可以有很多狹義的超級智能 AI。但假設你有很多這樣的 AI,你有一家公司從中賺取大量利潤。然後你有另一家公司進來開始競爭。競爭的方式將通過專業化進行。競爭喜歡專業化。你在市場上看到這一點,你在進化中也看到這一點。你會有很多不同的利基市場,你會有很多佔據不同利基市場的不同公司。在這個世界上,我們可能會說一家 AI 公司在某些真正複雜的經濟活動領域要好得多,而另一家公司在另一個領域更好。第三家公司非常擅長訴訟。Dwarkesh Patel這難道不與類人學習所暗示的相矛盾嗎?即它可以學習……Ilya Sutskever它可以,但你有積累的學習。你有巨大的投資。你花費了大量的算力才變得非常非常優秀,在這個事情上真正非凡。別人花費了大量的算力和大量的經驗才在其他事情上變得非常優秀。你應用了大量的人類學習才到達那裡,但現在你處於這個高點,別人會說,“看,我不想從頭開始學你已經學過的東西。”Dwarkesh Patel我想這需要許多不同的公司同時開始擁有類人終身學習智能體,以便他們可以在不同的分支開始不同的樹搜尋。但是,如果一家公司首先獲得了那個智能體,或者首先獲得了那個學習者,確實看起來……嗯,如果你只考慮經濟中的每一份工作,讓一個實例學習每一份工作對於一家公司來說似乎是可行的。Ilya Sutskever這是一個有效的論點。我的強烈直覺是,事情不會這樣發展。論點說它會這樣發展,但我的強烈直覺是它不會這樣發展。理論上,理論和實踐沒有區別。在實踐中,是有區別的。我認為這將是其中之一。Dwarkesh Patel許多人的遞迴自我改進模型字面上、明確地指出,我們將在伺服器中有 100 萬個 Ilya,他們會想出不同的想法,這將導致超級智能非常快地湧現。你對你正在做的事情的可平行化有某種直覺嗎?複製 Ilya 的收益是什麼?Ilya Sutskever我不知道。我認為肯定會有收益遞減,因為你想要思維不同的人,而不是相同的人。如果有我的字面副本,我不確定你會得到多少增量價值。思維不同的人,那才是你想要的。Dwarkesh Patel為什麼如果你看不同的模型,即使是由完全不同的公司發佈的,可能在不重疊的資料集上訓練的,LLM 彼此之間的相似程度實際上是瘋狂的?Ilya Sutskever也許資料集並不像看起來那樣不重疊。Dwarkesh Patel但在某種意義上,即使個人可能不如未來的 AI 那麼多產,也許有些道理是人類團隊比 AI 團隊擁有更多的多樣性。我們如何引發 AI 之間有意義的多樣性?我認為僅僅提高溫度(temperature)只會導致胡言亂語。你想要更像是不同的科學家有不同的偏見或不同的想法。你如何在 AI 智能體之間獲得那種多樣性?Ilya Sutskever我相信,沒有多樣性的原因是預訓練。所有預訓練模型幾乎都是一樣的,因為它們在相同的資料上進行預訓練。現在的 RL 和後訓練(post-training)是一些差異化開始出現的地方,因為不同的人提出了不同的 RL 訓練。Dwarkesh Patel我過去聽你暗示過自我博弈(self-play)是一種獲取資料或將智能體與同等智能的其他智能體匹配以啟動學習的方式。我們應該如何思考為什麼沒有關於這種東西在 LLM 上起作用的公開提議?Ilya Sutskever我會說有兩點。我認為自我博弈有趣的原因是因為它提供了一種僅使用算力而不使用資料來建立模型的方法。如果你認為資料是最終瓶頸,那麼僅使用算力就非常有趣。這就是讓它有趣的原因。問題是自我博弈,至少在過去的做法中——當你有以某種方式相互競爭的智能體時——它只對發展一套特定的技能有好處。它太狹窄了。它只對談判、衝突、某些社交技能、戰略制定那類東西有好處。如果你關心這些技能,那麼自我博弈將是有用的。實際上,我認為自我博弈確實找到了歸宿,只是形式不同。所以像辯論、證明者-驗證者(prover-verifier),你有某種 LLM-as-a-Judge(大模型作為裁判),它也被激勵去發現你工作中的錯誤。你可以說這不完全是自我博弈,但我相信這是人們正在做的一種相關的對抗性設定。真正的自我博弈是智能體之間更普遍競爭的一個特例。對競爭的自然反應是試圖與眾不同。所以如果你把多個智能體放在一起,你告訴他們,“你們都需要處理某個問題,你是一個智能體,你在檢查其他人正在做什麼,”他們會說,“好吧,如果他們已經採取了這種方法,我不清楚我也應該追求它。我應該追求一些差異化的東西。”所以我認為像這樣的東西也可以為方法的多樣性創造激勵。Dwarkesh Patel最後一個問題:什麼是研究品味(research taste)?你顯然被認為是世界上 AI 研究品味最好的人。你是深度學習歷史上發生的那些最重大事件的合著者,從 AlexNet 到 GPT-3 等等。它是什麼,你如何描述你是如何想出這些主意的?Ilya Sutskever關於這一點我可以評論我自己。我認為不同的人做法不同。有一件事指引著我個人,那就是通過思考人類是怎樣的,但要正確地思考,來形成 AI 應該是怎樣的審美。很容易不正確地思考人類是怎樣的,但正確地思考人類意味著什麼?我給你舉幾個例子。人工神經元的想法直接受到大腦的啟發,這是一個偉大的想法。為什麼?因為你會說大腦有所有這些不同的器官,它有褶皺,但褶皺可能並不重要。為什麼我們認為神經元重要?因為有很多神經元。這感覺是對的,所以你想要神經元。你想要某種局部的學習規則來改變神經元之間的連接。大腦這樣做感覺是合理的。分佈式表徵的想法。大腦對經驗做出反應,因此我們的神經網路應該從經驗中學習的想法。大腦從經驗中學習,神經網路應該從經驗中學習。你會問自己,有些東西是根本的還是非根本的?事物應該是怎樣的。我認為這對我指引頗多,從多個角度思考,幾乎是在尋找美,美和簡單。醜陋,沒有醜陋的容身之地。它是美、簡單、優雅、來自大腦的正確靈感。所有這些東西都需要同時存在。它們越是同時存在,你就越能對一種自頂向下的信念充滿信心。自頂向下的信念是當實驗與你相悖時支撐你的東西。因為如果你總是相信資料,嗯,有時候你可能在做正確的事情,但有個 bug。但你不知道有個 bug。你怎麼分辨有沒有 bug?你怎麼知道你是應該繼續偵錯還是斷定這是錯誤的方向?靠的是自頂向下。你會說事情必須是這樣的。像這樣的東西必須行得通,因此我們要繼續前進。那就是自頂向下,它是基於這種多層面的美和受大腦啟發而來的。Dwarkesh Patel好,我們就聊到這裡 (AI寒武紀)
直線拉升!川普改口了
川普又出來“畫K線”了。一起看看發生了什麼事情。川普改口11月5日晚間,美股三大指數上漲。道指接近平盤,以科技股為主的納指盤中拉升,漲約0.7%,標普指數漲約0.4%。消息面上,川普在與共和黨參議員共進早餐時發表了講話,指出政府停擺正在對股市產生負面影響。他說,“我們必須盡快重新開放政府,立即行動。我們經濟正處於歷史最熱的時期,這(政府停擺)也對股市產生了一些影響。但截至上周五,股市在過去九個月中已創下多次新高,而且還會再創新高。這只是個開始,一旦美國目前正在建設的各類工廠開始投產,情況將更加不同。我們從未見過這樣的繁榮,這是一個大好機遇。”此外,民主黨輕鬆擊敗了弗吉尼亞和紐澤西的共和黨州長候選人,而民主社會主義者佐赫蘭·曼達尼則擊敗了獲得川普背書的安德魯·科莫,成為紐約市下一任市長。此結果顯示選民對川普治下經濟的不安,這可能為民主黨在2026年中期選舉中重新奪回國會控制權鋪路。川普將民主黨在選舉中的全面勝利歸咎於政府停擺,並向共和黨施壓,要求廢除參議院的“冗長辯論”(阻撓議事)規則,以便重開聯邦機構並通過對郵寄投票的新一輪限制措施。川普稱:“我認為如果你看民調專家的分析,政府關門是一個重要因素,對共和黨不利。”川普補充說,政府關門開始“對股市也產生了一點影響”,共和黨人“必須盡快、實際上是立刻讓政府重新開放”。到周三為止,這次美國聯邦政府停擺已打破紀錄,成為史上最長的一次,持續了36天。近幾日關門造成的壓力迅速加劇:對低收入家庭的食品援助被延遲,空中交通管制員在無薪情況下請事假增多,導致航空旅行延誤更頻繁。儘管各界普遍將選舉結果視為對川普的不信任投票,但川普試圖為自己開脫,稱他“並不在選票上”是“最大的因素”。弗吉尼亞和紐澤西的選民民調顯示,約60%的受訪者表示對國家現狀“憤怒”或“不滿”。只有三分之一表示“熱情”或“滿意”。另一項民調顯示,超過一半的選民表示他們投票是為了向川普傳遞資訊。美國最新就業資料出爐美國企業10月就業人數增加,繼連續兩個月下滑後,就業市場出現一定程度的走穩跡象。5日晚間,ADP研究機構公佈的資料顯示,私營部門就業在9月經修正後減少2.9萬之後,10月增加了4.2萬。經濟學家預估為增加3萬。由於美國史上最長的一次政府關門推遲了官方經濟資料的發佈,ADP報告成為為數不多的勞動力市場月度快照之一。儘管上月就業小幅增加有助於緩解對就業市場快速惡化的擔憂,但這一增幅與勞動力需求整體走弱的大趨勢相一致。“與今年早些時候相比,招聘增速溫和。”ADP首席經濟學家內拉·理查德森在一份聲明中表示。“與此同時,薪資增速在一年多時間裡基本停滯,表明供需變化總體保持平衡”。在聯準會上周連續第二次會議降息後,主席鮑爾表示,他看到勞動力市場“非常漸進的降溫”,但“僅此而已”。他明確指出,12月會議是否再度降息並不確定。儘管如此,幾位經濟學家仍將再次降息視為基準情形,疲弱的招聘趨勢提高了再度降息的可能性。分析師稱:“可以歸咎於貿易戰,或一系列其他因素——人工智慧、此前更為緊縮的貨幣政策,以及政府關門——但很明顯,勞動力市場依舊偏弱。這可能成為聯準會在12月再次降息的關鍵。” (中國新聞週刊)