#發展階段
美國金融體系的崩潰和重建:從摩根大通到貝萊德
《The Fall and Rise of American Finance》by:Scott M. Aquanno和Stephen Maher1:美國資本主義發展的最新階段2008年的金融危機標誌著美國資本主義的根本性變化。隨著聯準會和財政部的危機管理努力將國家權力更深入地帶入金融體系的核心,連續幾輪的量化寬鬆政策促進了企業所有權前所未有的集中和集中在一小群大型資產管理公司中。在危機之後,這些公司——貝萊德、先鋒和道富——取代了銀行,成為當代金融領域最強大的機構,積累了資本主義歷史上從未見過的規模和範圍的所有權。這些資產管理公司成為了一個龐大網路的中心節點,該網路幾乎囊括了每個經濟部門的所有主要公司。這相當於企業權力的歷史性轉變。自新政以來,所有權和控制權的分離一直是公司組織形式的一個核心特徵:擁有公司的人(股東)在形式上不同於控制公司的人。在危機前的幾十年裡,市場調節了股東和管理者之間的關係:股東可以通過出售表現不佳的公司的股票來“退出”。但隨著金融危機後三大巨頭的崛起,所有權和控制權之間的界限被打破了。作為“被動投資者”,資產管理公司只能進行交易,以反映他們在標準普爾500指數或納斯達克等股指上所持公司不斷變化的頭寸。由於無法隨意拋售股票,他們轉向了更直接的控制工業公司的手段。自鍍金時代以來,這種對工業企業的金融影響從未見過,當時摩根大通等巨頭主導了美國資本主義。一個多世紀以來,所有權的集中受到一個基本權衡的限制:投資者可以擁有大量公司中相對較小的一部分,也可以擁有少數公司中的很大一部分。換句話說,隨著多樣化程度的提高,許多公司的股票持有量被稀釋,限制了投資者對任何特定公司的控制權。因此,投資者可以積累足夠的股份,對相對較少的公司施加實質性的權力。自2008年以來,大型資產管理公司的崛起扭轉了這一局面:三巨頭幾乎成為了所有最大、最重要公司的最大股東。如今,三巨頭共同成為美國經濟中佔總市值近90%的公司的最大或第二大股東。這包括標普500指數中98%的公司,該指數追蹤美國最大的公司,三巨頭平均每家公司擁有20%以上的股份。同樣引人注目的是,2008年危機後這種集中發生的速度。從2004年到2009年,道富銀行的管理資產(AUM)增長了41%,而先鋒集團的資產增長了78%。然而,貝萊德在這種權力結構中的獨特意義反映在其資產管理規模在這些年裡爆炸式增長了幾乎不可信的879%,到2009年成為迄今為止最大的全球資產管理公司。這一轉變的速度和規模預示著美國資本主義的一個新階段,其特徵是前所未有的所有權集中,以及圍繞少數金融公司的公司控制權集中。大型資產管理公司現在在企業管理中發揮著高度活躍、直接和強大的作用,它們對美國經濟中幾乎每一家上市公司都是如此。他們已經成為“普遍所有者”,管理著美國的全部社會資本。美國金融的興衰2008年後建立的金融機構與非金融公司之間的緊密聯絡構成了一種新的金融和工業資本融合形式,馬克思主義政治經濟學家魯道夫·希夫丁於1910年將其稱為“金融資本”。儘管該術語被廣氾濫用,但金融資本並不僅僅是指金融資本,更不用說銀行資本了。相反,金融資本是通過金融資本和工業資本的結合而出現的,是通過它們的結合而建立起來的一種新的資本形式——一種揚棄了原始工業和金融形式的綜合(黑格爾的術語)。通過這一過程,金融機構在工業企業的管理中發揮了積極和直接的作用。通過塑造其控制的公司的戰略方向和組織結構,金融家旨在以股票價格、股息和其他利息支付的形式最大限度地提高其貨幣資本的回報。金融資本是金融化資本主義的一種特殊形式。一般來說,金融化是指貨幣資本——或貨幣預付然後帶息返還的循環——在社會生活和經濟中取得更大主導地位的過程。正如人們經常觀察到的那樣,貨幣資本的擴張是新自由主義時期的一個主要特徵。這反映在“股東價值”原則中,即公司通過股息和股票回購給予投資者更大的回報。目前形式的金融資本代表了一種更加集中的金融化形式,金融資本和工業資本之間的聯絡更加緊密。這本書的一個核心論點是,無論是更廣泛的金融化趨勢還是金融資本的出現,都沒有像人們經常聲稱的那樣表明資本主義的衰落或工業的空心化。相反,金融化是為了提高競爭力、實現利潤最大化、提高生產率和剝削勞動力。此外,與許多將金融化描述為與前新自由主義、非金融化的資本主義突然決裂的說法相反,我們認為金融化的根源在於戰後時期,當時它是一系列國家努力在金融和工業之間實現“水密”分離的結果。追溯20世紀後三分之二到21世紀前二十年金融權力的崛起,從摩根大通帝國的崩潰到貝萊德的崛起,我們呈現了一部挑戰大眾帳戶的美國金融史。在我們勾勒的弧線中,金融化的歷史有四個不同的階段:古典金融資本、管理主義、新自由主義和新金融資本。這些階段形成了一個循環,包括金融權力的衰落,然後是漸進、不平衡和矛盾的重建。每個階段都以國家、企業和階級權力的特定組織形式為特徵,過渡不是以尖銳的“斷裂”為標誌,而是以連續性和變化為標誌。希夫丁的金融資本理論源於他對19世紀末德國資本主義發展的研究;然而,他的分析在美國也得到了廣泛的應用。在這個經典的金融資本時期(1880-1929),投資銀行通過合併小企業組建了大公司。這些銀行的權力取決於它們對公司股票的所有權和發放信貸的能力。隨著投資銀行向工業企業發放大量貸款,兩者的利益變得緊密交織:工業企業依賴信貸,而投資銀行則尋求確保貸款得到償還,因此他們監控企業營運以保護其投資。銀行作為最大股東的地位確保了他們對公司的權力,使他們能夠在董事會中獲得席位,並為他們控制的公司建立“連鎖董事會”。隨著二十世紀上半葉股權日益分散,這些金融資本網路變得更加鬆散。一個新的職業經理人階層對工業公司行使著越來越自主的控制權,銀行淪為一個純粹的支援部分。1929年股市崩盤後頒布的法規使管理時期(1930-1979年)神聖化,該法規正式將銀行與工業公司的治理分開,並使“內部”公司經理成為經濟中的主導力量。在此期間,由於沒有大集團的持股,這些經理可以控制工業企業,而不會面臨投資者的一致挑戰。然而,與此同時,將銀行與工業公司分離導致後者將一系列“金融”職能內部化,發展了獨立籌集和發放資金的廣泛能力。因此,非金融公司的金融化起源於戰後“黃金時代”的核心。這一時期工業企業的霸權得到了新政國家的支援,新政國家有三個關鍵屬性。首先是它對合法性的關注。新政改革,如工會權利和社會保障,旨在消除20世紀30年代激烈的階級鬥爭。這些措施增強了資本主義的合法性,並將工人納入了管理霸權的結構。其次,這些改革導致了國家財政支出的巨大擴張,而國家財政支出在很大程度上是由稅收提供資金的。因此,新政州是一個稅收州,其再分配計畫導致收入不平等水平降低。這也是由於基本上不關心政治的工會在集體談判中取得了成功。最後,產業霸權得到了家族工業複合體的支援,家族工業複合體將最具活力的公司與國家權力相結合,導致所謂的跨國公司(MNCs)的巨大增長和多樣化,並促進了多部門企業集團形式的公司組織的發展。隨著戰後繁榮在20世紀60年代末放緩,工會工資鬥爭日益擠壓企業利潤,導致合法性和積累之間的矛盾日益嚴重:工會權利和新政計畫現在對積累構成了障礙。這一問題通過新自由主義威權國家的形成得到瞭解決,該國家通過前所未有的利率飆升和新一輪全球化來約束勞工。隨著國家權力集中在不受民主壓力影響的機構,特別是聯準會,選舉和政黨變得更加不重要。這種威權主義結構因新自由主義國家是一個有缺陷的國家而得到加強。隨著減稅以恢復企業利潤,國家項目越來越多地通過債務融資,加強了財政對國家預算的約束。這也加劇了不平等。富人現在不再為再分配計畫納稅,而是將國家資金借給他們償還利息。在新自由主義時期(1980-2008),工業霸權被一種新的金融力量所取代。在某種程度上,這是由於全球金融市場的一體化,為企業在國際化生產網路中流通價值提供了必要的基礎設施。金融霸權也得到了20世紀60年代和70年代開始由專業基金經理管理的工人養老基金激增的支援。在這些新的“機構投資者”中發生了公司股票的集中和集中浪潮,這些投資者對工業公司擁有重大權力。然而,這種形式的金融權力與經典金融資本截然不同。與其說是單個銀行直接控制企業網路,不如說是競爭性金融機構的叢集施加了廣泛的結構紀律。然而,金融霸權並不是由外部投資者壓力強加的,而是最初在工業企業內部出現的,這是戰後幾十年對多元化和國際化的適應性反應。事實上,這是多部門企業集團組織形式的一個內在方面。大公司不再圍繞一個業務組織,而是由許多不同的業務組成,這些業務往往彼此之間幾乎沒有直接關係。此外,這些行動的範圍越來越國際化。這帶來的挑戰導致企業集團將業務部門的營運管理分散化,即使投資權集中在高層管理人員手中。這些所謂的“總經理”並不管理具體的生產過程,而是管理貨幣資本本身;到了新自由主義時期,他們已經成為金融資本家,坐在金融和工業的紐帶上。隨著工業企業內部資本市場的發展,其財務部門和職能日益佔據主導地位。這在公司財務主管轉變為首席財務官的過程中表現得最為明顯,首席財務官作為首席執行官的得力助手,負責建立“投資者期望”並進行必要的內部重組以滿足這些期望。工業企業的財務能力也在擴大,因為它們試圖通過從事衍生品交易來管理全球化的風險。所有這些最終導致了多層子公司形式的公司組織的出現,跨國公司通過將其內部部門與外部分包商的第二層整合來組織生產,形成高度靈活和有競爭力的全球網路。蘋果對富士康的依賴只是其中一個突出的例子。新金融資本是在2008年危機後形成的,因為新自由主義股東資本主義的分散金融權力集中在大型資產管理公司。在金融危機中,監管機構試圖通過精心策劃銀行合併來增強系統穩定性。塵埃落定後,只有四家大型銀行——摩根大通、美國銀行、富國銀行和花旗集團——主導了該行業。然而,具有諷刺意味的是,國家干預導致人們從銀行轉向一群資產管理公司,即貝萊德、道富和先鋒。隨著風險狀態的形成大大降低了股票的風險,資產管理公司為大量資金湧入這些資產提供了便利。將儲蓄引入股票進一步降低了風險,導致股價持續上漲,資產管理公司的所有權也同樣持續集中。資產管理公司集中所有權的一個重要基礎是養老基金和其他機構投資者,他們越來越多地將其投資組合的管理委託給這些公司。通過彙集這些基金中已經積累的大量資本,資產管理公司進一步集中了金融權力,獲得了自摩根大通時代以來從未見過的經濟主導地位。這得益於向被動管理的歷史性轉變。與主動管理不同,在主動管理中,高薪基金經理通過“擊敗市場”尋求回報最大化,被動基金無限期持有股票,交易只是為了跟蹤特定指數的走勢,這使他們能夠提供大幅降低的管理費,特別是在股價上漲的情況下,獲得高回報。但這些被動投資者是非常積極的所有者。由於他們不能通過簡單的股票交易來約束工業企業,他們追求了金融資本特有的更直接的影響方法。如果資產管理公司的崛起是美國資本主義組織歷史性轉變的一部分,那麼這尤其圍繞著貝萊德的卓越地位。到2022年,貝萊德管理的資產已達到10兆美元。如果將其通過Aladdin軟體平台間接管理的資產包括在內,這個數字接近25兆美元。貝萊德現在是幾乎所有美國大型上市公司的主要所有者之一。資本的集中程度從未達到如此驚人的程度。它的權力不僅體現在其管理的資產規模上,還體現在其與國家的特殊聯絡上。喬治·W·布什在任期內選擇高盛的漢克·保爾森擔任財政部長,而希拉里·克林頓和喬·拜登都考慮過貝萊德首席執行官拉里·芬克擔任該職位。拜登的首席經濟顧問布萊恩·迪斯也是貝萊德的高管。所有這些都表明,一部分新的金融資本家的力量正在增長。金融化的新圖景本書對金融在當代資本主義發展中的作用的分析與進步政策平台和批判性學術中的分析明顯不同。事實上,今天幾乎所有人都同意,特別是在2008年危機以來的幾年裡,金融是“實體”工業經濟的腐蝕性和寄生性力量。新自由主義的許多弊端也是如此,從經濟危機到社會不平等,通常被歸因於“金融化”。雖然進步派擔心,如果沒有監管來控制金融權力,美國的繁榮和競爭力將會減弱,但馬克思主義者則通常將金融化視為“晚期資本主義”的症狀和美國帝國衰落的預兆。這些想法激發了社會主義者和進步人士之間的政治辯論,以及從希拉里·克林頓到傑裡米·科賓等政治人物的政綱。許多觀察家追隨Giovanni Arrighi的觀點,認為金融化是資本主義世界體系增長和衰退周期中不可避免的階段。在這種觀點中,霸權國家的衰落與金融的增長密切相關。然而,Arrighi淡化了金融在資本主義早期增長和活力中的核心作用。投資銀行是19世紀現代公司組織的關鍵參與者,正如在目前,金融仍然是當前多層子公司形式的公司組織不可或缺的一部分。金融是當代全球資本主義的神經中樞,構成了通過國際化生產體系實現價值流通的基礎設施。金融的日益突出並不是指美國帝國的衰落,而是強調了美國在全球經濟中的中心地位。威廉·拉佐尼克(William Lazonick)和格雷塔·克里普納(Greta Krippner)等進步人士認為,金融的興起導致了生產的“空洞化”,這與衰退的故事相呼應。他們認為,金融業關心的不是投資於長期增長和繁榮,而是“快速賺錢”。因此,金融業的崛起給工業企業帶來了“短期主義”,導致他們放棄了對戰後支撐“中產階級”生活水平的“好工作”的投資,以及美國企業保持全球領導地位所必需的研發。相反,企業將資金轉移到“非生產性”金融服務上,並中飽私囊。高管們獲得股票期權的補償只會增強他們參與這種功能失調的策略的動機,導致他們通過股票回購來抬高股價,以獲得意外之財。然而,戰後不平等程度較低的原因不是公司經理的仁慈或遠見,而是階級力量的平衡,特別是工會贏得工資增長的能力。正如我們將要論證的那樣,這些分配交易得到了戰後繁榮的獨特環境以及自由資本流動出現之前的世界貿易結構的支援。導致不平等加劇和與新自由主義相關的社會計畫倒退的原因不是金融的興起,而是資本主義無法支援這些妥協。隨著戰後繁榮的結束,工會的工資鬥爭擠壓了利潤,造成了長達十年的危機,這場危機只有在勞動力失敗和大量低薪勞動力通過全球化被剝削的情況下才能得到解決。因此,金融化是恢復盈利能力和解決20世紀70年代危機的關鍵,這導致了資本主義的第二個黃金時代,儘管這個黃金時代不如第一個“黃金時代”。此外,將金融從根本上視為短期主義者忽略了這樣一個事實,即當代資本主義的一些大明星儘管在短期內沒有盈利,但卻吸引了大量投資。例如,優步一直處於虧損狀態,但投資者一直在展望自動駕駛汽車技術的發展,預計這將使該公司在某個時候盈利。特斯拉也一直專注於全新電動汽車基礎設施的長期發展,即使它在汽車銷售上虧損。儘管利潤很低或根本沒有利潤,但投資者在十多年的時間裡向亞馬遜投入了大量資金,《經濟學人》將其描述為“歷史上對公司長期前景的最大賭注”。同樣,許多行業的工業公司願意承擔新自由主義幾十年來全球重組的巨大短期成本,以確保其長期競爭力和盈利能力。這一切都不足為奇。畢竟,為什麼金融家或公司高管會有意破壞自己資產的長期價值?此外,認為支付股息或進行股票回購必須以犧牲新投資為代價的假設是沒有根據的。在低利率的背景下,投資於生產和研發與進行回購和支付股息之間沒有必然的矛盾,因為公司幾乎可以免費借款。事實上,在過去四十年裡,企業投資和研發支出佔GDP的比例都有所增加,股息支付也是如此,利潤也急劇上升。儘管通過回購將大量剩餘現金返還給投資者,但蘋果、微軟和Google等科技巨頭對研發的持續投資顯然足以保持其作為全球領導者的地位。除了對華爾街的短期主義特權表示遺憾外,許多馬克思主義者還認為,“金融化”植根於資本主義生產方式更深層次的——甚至是根本的——危機。對於Robert Brenner、Cédric Durand和David Harvey來說,從20世紀60年代末開始,工業部門的利潤率下降導致企業投資從製造業轉移到相對盈利和快速增長的金融服務業。他們認為,這通過產生一系列投機泡沫創造了經濟增長的幻覺,而這些泡沫只是掩蓋了工業盈利能力的潛在不足。法國經濟學家François Chesnais將金融的政治和經濟中心地位與其在國際經濟一體化中的作用聯絡起來,但他也認為,金融化是以生產過剩和利潤率下降為特徵的長期經濟危機的一個方面。對切斯奈來說,這場長達四十年的“全球衰退”表明了資本主義世界體系的衰落。這些觀點基於對馬克思“虛擬資本”理論的某種解釋,根據該理論,許多形式的金融資本是“虛擬的”,與“真實的”工業資本是分開的。在這種觀點中,金融在很大程度上被視為工業通過支付各種形式的利息(包括貸款利息以及股息和服務費)產生的部分剩餘價值的被動接受者。將從公司股票到衍生品的一切都視為虛擬資本,充其量只能淡化這些金融工具在工業資本完整性中的作用;在最壞的情況下,它將金融視為“實體”經濟的癌症,因此如果沒有它,實體經濟會更好。這為解釋“空心化”的社會民主理論打開了大門-儘管這些理論家通常旨在證明資本主義是註定的,而不是通過抑制金融來拯救資本主義。金融與工業並不對立。正如我們將在接下來的章節中展示的那樣,它在歷史上與資本主義生產有著深刻的聯絡。金融——無論是在非金融公司內部還是外部——都規範了剩餘價值的提取,促進了競爭力,並促進了資本的國際流通和價值化。金融與工業並不對立。正如我們將在接下來的章節中展示的那樣,它在歷史上與資本主義生產有著深刻的聯絡。金融——無論是在非金融公司內部還是外部——都規範了剩餘價值的提取,促進了競爭力,並促進了資本的國際流通和價值化。跨國公司能夠在眨眼間在世界各地自由轉移投資,這是它們建構和重組靈活、動態和全球化生產網路的關鍵條件。衍生品遠非僅僅是一個投機的“賭場”,尤其是對於企業管理全球化生產的風險至關重要。金融對於企業併購以及在近幾十年工資停滯不前的情況下維持消費也至關重要。激進經濟學家Costas Lapavitsas避免將金融定義為獨立於或反對工業,強調其在資本主義中的結構性作用。然而,在認為金融“剝削我們所有人”時,他傾向於最小化金融在價值生產中的重要和非常積極的作用。金融不僅是經濟中的食利者和搾取性力量,而且對於提高生產性資本的競爭力和活力至關重要。此外,他主要從改變資產組合的角度來理解非金融公司的金融化,即工業公司在金融服務上投資更多。公司更深層次的轉型,即貨幣資本在其組織結構中變得更加突出,尚未得到探索。拉帕維察也沒有充分質疑公司和金融機構之間不斷變化的關係,錯過了新自由主義股東資本主義的決定性特徵:股票集中在強大的機構投資者手中,投資者對非金融公司的紀律加強,公司治理的重組反映了金融的賦權。也許最關鍵的是,拉帕維察和許多馬克思主義和非馬克思主義經濟學家一樣,在很大程度上忽視了美國帝國主義國家在組織經濟結構和金融政治霸權方面的核心作用。這一遺漏為羅伯特·布倫納、迪倫·萊利以及塞德里克·杜蘭德等解釋鋪平了道路,他們認為國家如今已被腐蝕性金融部門工具化或“俘虜”。本書提出的一個關鍵論點是,相反,國家在管理和建構金融體系中的作用反映了尼科斯·普朗克薩斯所說的在監督資本主義的總體、長期系統利益方面,國家相對於特定資本主義公司和小部分的“相對自治”。正如我們強調的那樣,資本主義不僅是一種經濟制度,也是一種政治制度,要求國家管理權力集團內不同資本部分之間的權衡和權力衝突——儘管總是在更深層次的經濟矛盾和壓力的背景下。正如Leo Panitch和Sam Gindin長期以來所認為的那樣,金融既不是對生產的挑戰,也不是對美國霸權的挑戰。相反,它是美國帝國秩序的一個基本組成部分,使全球化成為可能。對他們來說,全球金融一體化代表了美國政府自二戰以來“打造全球資本主義”項目的高潮。美國國家監管世界體系的獨特帝國責任,首先是致力於確保資本跨境自由流動,無論其國籍如何,從而創造一個真正的全球資本主義,而不是獨特的區域或國家資本主義。正如他們所示,這一點的關鍵基礎是全球金融的一體化。儘管這意味著金融將在全球經濟中變得更加強大,但工業企業之所以能夠接受這一點,正是因為他們也從中受益。帕尼奇和金丁指出了美國國家獨特的帝國角色、國家制度發展和金融興起之間的相互聯絡。通過這樣做,他們表明全球化不是經濟“法律”的自動結果,而是需要發展特定的國家能力。這導致了聯準會和財政部的國家權力集中,並使其免受民主壓力的影響。這種獨立性使這些機構能夠靈活地干預管理全球化資本主義的矛盾,不受民主問責制的任意性或資本家的直接“俘虜”。因此,相對自治的國家能夠代表資本行事,如果不是按照資本的要求行事的話。金融化、全球化和更專制國家的發展都是“製造全球資本主義”的一部分。財政一直與國家密切相關,形成了大衛·哈維所說的“國家財政關係”,即財政與國家機構的一部分“直接整合”。如果不考慮國家權力在支援和保護財政方面的核心作用,就無法理解財政;如果不考慮國家權力與經濟的融合,就無法理解國家權力的結構。然而,迄今為止,很少有人認真嘗試追蹤美國國家經濟機構的歷史發展。正如我們將要展示的那樣,二十世紀金融體系的演變取決於國家經濟職能的不斷擴大,導致民主資本主義國家出現了威權主義權力結構,這是當今新金融資本的基本基礎。社會學家和政治學家還列舉了20世紀公司資本主義的一些重大轉變,包括金融化。然而,他們往往未能將制度變革與資本主義作為一個系統聯絡起來,因此無法理解這種轉變是如何實現積累的競爭性重組的,也無法理解這種重組是如何產生的——甚至認為經濟集中會導致競爭力的抑制,而不是加劇。此外,這些帳戶中對制度的關注,而不是對價值的生產和流通的關注,支援了這樣一種觀點,即金融化是隨著新自由主義股東資本主義的興起而突然出現的,從而忽視了在本質上是貨幣經濟的情況下,金融和生產之間始終存在的更深層次、更複雜的相互聯絡。階級鬥爭的動態也是如此,這對理解歷史至關重要,但在很大程度上也從人們的視野中消失了。社會學家約翰·斯科特展示了自20世紀70年代以來,機構投資者的集中如何產生了從主要由內部人士控制的管理公司到新自由主義公司的歷史性轉變,後者以“多元金融霸權”的形式受到更大的投資者紀律的約束。與傳統金融資本中的個人投資銀行直接控制公司網路不同,相互競爭的金融機構在公司董事會上建立了短暫的聯盟,以對公司“內部人士”施加廣泛的影響和紀律。傑拉爾德·戴維斯更進一步,聲稱共同基金(尤其是富達)的資產集中已經構成了一種“新金融資本”。然而,他認為,由於監管限制、利益衝突、積極互助的短期性質,這種集中的所有權並沒有轉化為控制。資金,以及簡單的股票交易比直接活動更容易的事實。因此,戴維斯將新的金融資本定義為“歷史上獨特的集中度和流動性的結合”,相當於“沒有控制權的所有權”。然而,戴維斯沒有預料到,被動投資基金(如貝萊德、先鋒集團和道富街管理的基金)中真正驚人的股權集中將如何改變這些動態。戴維斯認為,1兆美元的富達基金“在投資方面難以保持靈活性”,導致其轉向其他業務領域。然而,僅貝萊德目前就管理著10兆美元的資產。此外,正如戴維斯所觀察到的那樣,富達是一個相對短期的投資者,而這些被動基金是極其長期的。因此,他們不是通過交易而是通過直接控制來行使權力。新的金融資本和舊的一樣,建立在集中和長期主義的基礎上,因此首先由所有權和控制權的融合來定義。 (MicroMirror)
給中國政治局講人工智慧的西安交大鄭南寧報告
一、引言報告標題為“機器行為與具身智能”,該報告由西安交通大學教授鄭南寧在中央政治局第二十次集體學習上進行講解,主要圍繞機器行為與具身智能的相關內容進行深入探討。二、機器行為模仿與解釋1. 人工智慧技術的發展階段‌第一階段‌:專家學習系統,將領域知識和規則交給機器去搜尋。‌第二階段‌:特徵工程,將事先定義的特徵和答案交給機器去學習。‌第三階段‌:利用深度神經網路讓機器自動學習特徵,機器在語音和圖像識別與分類能力方面超過人類。‌第四階段‌:探索具有人類意識的人工智慧系統,實現通用人工智慧,具備自我意識、自主思考、學習計畫、解決問題以及理解複雜概念的能力。2. 解釋行為的困難性解釋行為比產生行為更為困難,因為幾乎人類所有的行為都是從環境中學來的。通用人工智慧在模仿人類行為時,必須清晰地給出潛在概括,並與普遍原理聯絡,這是認知過程的理解。三、機器行為面臨的挑戰1. 技術挑戰‌條件問題‌:不可能列舉出一個行為的所有先決條件。‌分枝問題‌:不可能列舉出一個行為有可能產生的所有隱性結果。2. 道德倫理、社會和法律挑戰傳統的人工智慧理論框架無法為所有對象或行為建立模型,且如何讓人工智慧系統具有合作性行為是一大挑戰。例如,理解兒童幫助他人開門的行為,並讓機器人具備這樣的智能性、靈活性與合作性行為。四、機器行為的研究範圍1. 研究內容機器行為生成的人工設計。智能體如何憑藉經驗產生行為。機器行為的可解釋性。2. 機器行為研究的重要性機器行為一旦失去監督,可能帶來潛在危害,與智能體和人工智慧行為的信任密切相關。3. 行為研究的四個工具(Tinbergen的演化思維)‌行為生成的機制‌:利用可解釋性技術理解特定行為模式背後的機制。‌行為的發展‌:研究機器如何獲得特定個體或機體行為。‌行為的功能‌:瞭解特定行為如何影響智能體全生命周期功能。‌行為的進化‌:關注智能體的進化,機器行為可在發展中與所處環境和人不斷互動,朝著特定方向進化。4. 機器行為發展的三個途徑‌人類通過演算法直接賦予‌。‌利用特定的互動訓練,刺激、塑造‌。‌機器通過自身的經驗獲得‌。五、人與智慧型手機器的行為關聯‌機器塑造了人類行為‌:智慧型手機器具有改變社會結構的潛力。‌人類塑造了機器行為‌:人類通過訓練來塑造機器行為。‌人機混合協同行為‌:人工智慧演算法在複雜系統中與人類共存,分析人機互動的屬性(合作、競爭、協調)至關重要。六、具身智能和行為生成1. 具身智能的定義具身智能是機器自主感知環境、學習和理解行動的能力,強調智能生物的智能化程度和它的身體結構存在強相關性。2. 非具身學習與具身學習的對比‌非具身學習‌:演算法的學習獨立於硬體與環境,性能取決於模型的泛化能力。‌具身學習‌:在虛擬環境中訓練大模型得到常識表徵,在具體場景中通過強化學習完成模型進化,模型可在特定環境中自主適配。3. 具身智能行為生成的兩大部分‌人機互動‌:人與自然語言或圖文資訊的形式將任務需求輸入多模態大模型中,模型完成任務理解和概念推演,生成知識和決策,最後由機器人生成相應行為。‌系統與環境互動‌:機器人利用感測器完成情境感知,根據大模型學習結果產生行為,完成輸出。七、基於表徵學習與因果推理的具身智能計算框架為使機器具有類人認知能力,需建立事件模型,將知識有效表徵,建構持續學習系統。在解決任務時,機器根據感知資料、意識先驗、表徵學習、知識庫進行推理,尋找最優策略。八、動態開放環境中的人機協同的具身智能在動態開放環境中強化人機協同,使具身智能更像人類智能。引入人在回路的決策學習,實現行為決策的類人化。1. 自動駕駛面臨的挑戰‌周密感知‌:在所有條件下檢測道路特徵。‌預行為理解‌:理解人類駕駛員的行駛意圖。‌應對意外遭遇‌:簡單的基於規則的自動駕駛無法提前為每個場景編碼。‌網路安全‌:如軟體漏洞或駭客惡意行為。2. 自動駕駛行為生成系統結合經驗與常識、場景理解、交通態勢評估,進行預訓練,生成導航路徑。基於具身智能完成運動規劃,生成合理的、可執行的駕駛行為。3. 自動駕駛行為決策將複雜未知的現實世界變換成有限空間環境的語義理解,尋找可行駛區域。4. 建構自動駕駛環境的“認知地圖”包括車輛、交通標識、障礙物、行人等基本屬性,以及高級認知屬性,形成實踐上的認知地圖訓練,使自動駕駛系統理解交通場景的動態隨機變化。5. 自動駕駛模擬技術提供高效率、低成本的自動駕駛測試,關注異常交通場景的感知與處理,生成多樣性交通場景來評價自動駕駛系統在不同場景下的駕駛性能。九、總結報告深入探討了機器行為與具身智能的多個方面,包括人工智慧技術的發展階段、機器行為面臨的挑戰、研究範圍、人與智慧型手機器的行為關聯、具身智能和行為生成、基於表徵學習與因果推理的計算框架,以及動態開放環境中的人機協同具身智能。最後,以自動駕駛為例,展示了具身智能在實際應用中的挑戰與前景。以下為報告全文:大家好,今天我報告的題目是“機器行為與具身智能”。首先,我們來看一個相對簡單的十字路口場景,場景中有行人、有非機動車和機動車,我們看一看它的動態場景是如何構成的?十字路口的交通場景是不可預測的,但場景中的每個對象或稱之為Object直覺的判斷和他們對相互之間的行為關係的理解,形成了這樣一個相互關聯的穩定系統。人在這些場景中能夠迅速的理解和判斷各個對像在空間及其行為的關聯性。而自動駕駛也必須要能夠抽象和表述這種關聯性,才能做出精準地判斷,而事實上我們要讓機器機基於規律對交通場景的動態變化進行事先編碼是做不到的,我們需要研究在這種互動場景中,多個自主體的自適應行為。舉例來看,在F1比賽中,工作人員利用團隊協作可以迅速地完成車輛輪胎的替換工作,如何利用機器人叢集協作完成某項任務並給出科學的解釋,是一個值得探討的問題。討論1:機器行為模仿與解釋解釋行為是一個比產生行為更為困難的任務,因為幾乎人類所有的行為都是從環境中學來的,即刺激反應的結果。並不都像思維和情感這樣的內部事件,一台圖靈機能以一種無法與人類區別的方式活動,但產生出這樣的行為模仿並不足以模擬人的智能,因為兩者是一個完全不同的問題。解釋必須儘可能清晰地給出潛在的概括,並將它們與某些普遍的原理聯絡起來,這就是認知過程的理解。如果我們從人工智慧技術的發展來看,我們可以把人工智慧技術的發展分為如下階段:第一階段,統稱之為“專家學習系統”,專家系統是將領域知識和規則交給機器去搜尋。第二階段,簡稱為“特徵工程”,所謂特徵工程是講事先定義的特徵和答案交給機器去學習。第三階段,是將原始資料和標籤交給機器,利用深度神經網路讓機器自動學習特徵。在這一階段人工智慧取得了驚人的發展,特別是機器在語音和圖像識別與分類能力方面超過了人類。當前人工智慧發展朝著第四階段的方向發展,人類只需要將任務和目標交給機器,機器就可以像人類一樣感知和理解世界,人與人之間或社會會與物理世界自然互動,也就是說在這一階段探索具有人類意識的人工智慧系統,像人類一樣在廣泛的任務和環境中進行學習和適應,實現通用人工智慧。通用人工智慧理論上是具有自我意識、自主思考、學習計畫、解決問題以及理解複雜概念的能力,它可以在新的未曾遇到的情景下適應並執行任務,這需要廣泛的背景知識和常識,還有抽象思維和判斷等人類智能所有的關鍵特徵,這是一個充滿著不確定性的未來目標。討論2:機器行為面臨的挑戰人工通用智能現在不僅僅在技術上面臨著重大挑戰,而且還面臨著道德倫理、社會和法律等一系列重大問題。研究複雜動態不確定環境中的機器行為,存在著兩個基本問題:一、條件問題,是我們不可能列舉出一個行為的所有先決條件;二、分枝問題,是我們不可能列舉出一個行為有可能產生的所有隱性結果。傳統的人工智慧基本理論框架是建立在演繹邏輯和語義描述與形式化方法的基礎上,形式化的方法不可能為所有的對象或行為建立模型。機器行為研究面臨的挑戰,就是如何使人工智慧系統具有合作性的行為。德國心理學家設計了一個兒童心理學實驗,實驗中一位一歲半的兒童和媽媽坐在同一個房間的角落裡,一位成年人走進房間想打開櫃門,他一遍遍的撞擊著櫃門,這時神奇的場景發生了,並沒有人直接向這位孩子求助,也沒有人向他發出指令,但一歲半的孩子搖搖晃晃走過來,幫助這個成年人打開了櫃門。該實驗試圖想證明孩子可以自發的幫助別人,但這個實驗卻對人工智慧提出了一個重大挑戰,我們能否通過理解這個一歲半孩子的腦內所想,讓機器人也能具有這樣的智能性、靈活性與合作性行為?這個實驗告訴我們,智慧型手機器不能從工程機器的角度去理解它們,而且要將其視為一系列有自己行為模式及生態反應的個體或機器群體。另外一個實例,給出一段西安絕句“海棠不惜胭脂色、獨立濛濛細雨中”。讓電腦語言理解的程序和人,分別從一個圖像資料庫中找出最貼切這段詩的圖像。電腦找出了這樣一幅圖,海棠上掛滿著雨滴,正真是“海棠不惜胭脂色、獨立濛濛細雨中”。而人卻給出右邊這幅圖,一位亭亭玉立的少女在濛濛的細雨中沒有打傘,行走在幽靜的小道上。被測試的人在內心把這位少女比作海棠,在這樣的雨天這位少女全然不顧風雨的存在。人類理解詩歌往往是在內心深處將想像力帶入現實,通過自身的認知去欣賞。這首西安絕句是宋代詩人陳與義所寫的《春寒》,當時金兵入侵,南宋小朝廷處於山河破碎風飄絮,詩人南渡避難,借助在巴陵友人的後院,自號“園公”。2月的巴陵幾乎天天下雨,料峭的春寒還未結束,此時詩人流離失所,漂泊無依,不由地聯想起自身的境遇進行感懷,寫下了這首詩。在這裡,我們看到一幅圖像到了人類觀察者的腦中,在他的內心深處將想像力帶入了現實,圖像變成了生動的場景故事。這裡簡單的語言與圖像的聯想,說明許多重要的AI應用,例如機器視覺和自然語言理解需要大量對世界的認識資訊。為此,電腦需要掌握知識,這是幾乎所有AI研究者都同意的觀點。想像是人的一種虛構的能力,也就是人可以想像不存在事物的能力,但如何更加有效地把知識傳授給機器人,依然是我們今天面臨的一大挑戰。討論3:機器行為的研究範圍諾貝爾獎獲得者西蒙教授,在《人工科學》這本書中指出:自然科學是關於自然體和自然現象的科學知識,也有人工科學關於人工物體和人工現象的知識。如今,大量的智慧型手機器應用於人類社會的各個角落,幾乎所有層面。機器行為研究關注的是智慧型手機器,而非傳統的機械。它的研究範圍有:機器行為生成的人工設計,智能體如何憑藉經驗產生行為。還有機器行為的可解釋性,智能體如何根據場景響應機器行為。機器行為一旦失去監督所帶來的潛在危害是什麼?這些問題與智能體和人工智慧行為的信任是密切關聯的。諾貝爾獎得主、荷蘭動物學家Tinbergen提出:想要全面地理解一個演化出來的特性,我們需要回答四個問題:1、行為生成的機制,智能體生成行為的機制基於其演算法和執行環境的特點,我們利用可解釋性技術可以來理解特定行為模式背後的特定機制;2、行為的發展,智能體的行為是隨著時間的推移而發展,這就需要研究機器是如何獲得特定個體或機體行為。行為發展可以是工程選擇的結果,也可能是來自智能體的經驗;3、行為的功能,行為分析需要瞭解特定行為是如何影響智能體全生命周期功能,研究行為對智能體特定功能的影響;4、行為的進化,智能體容易受到進化歷史和與其他智能體互動的影響,從這個角度來看,研究機器行為需要關注智能體的進化。以上這四個問題就構成了演化思維的四個工具,需要強調的是發展並不僅僅意味著一種行為的出現,而是發展過程中行為機制的變化。討論智能個體如何獲得特定的行為,即機器行為的發展。這裡有三個基本的途徑:第一個途徑:人類通過演算法直接賦予機器行為的發展;第二個途徑:利用特定的互動訓練,刺激、塑造機器行為;第三個途徑:機器通過自身的經驗獲得某些行為,比如說機器可以通過記憶或強化學習等方式自主獲得某種行為的能力。機器行為的進化過程中,機器行為可以在發展中與所處環境和人不斷地互動,朝著環境和人特定的方向進化。同時由於機器不同於生命體,它的進化可以突破某種生命體的侷限性,而且可進化的機器行為可以傳播至群體廣泛的機器行為存在,也可能受到某些限制,阻止其傳播,機器可表現出非常不同於有機進化的軌跡。比如進化後的無人駕駛演算法,可以共享至無人駕駛汽車群體,實現行為能力的傳播。對此,我們對人與智慧型手機器的行為關聯做一個小結:1、機器塑造了人類行為:在社會系統中引入智慧型手機器可以改變人類行為的方式,智慧型手機器具有改變社會結構的潛力。2、人類塑造了機器行為:人類通過對人工智慧系統進行主動輸入或被動行為觀察的訓練來塑造機器行為,使用演算法直接來改變機器的行為。3、人機混合協同行為:大多數人工智慧演算法在複雜的混合系統中與人類共存的領域發揮著重要作用,如何分析和刻畫這類複雜系統中人機互動的屬性和行為,包括合作、競爭和協調都是至關重要的問題。討論4:具身智能和行為生成具身智能是一種機器自主感知環境、學習和理解行動的能力,從生物進化的角度來看,地球上所有智力活動都是生物通過自己的身體與環境互動後,通過自身學習與進化遺留下來的智力遺產。智能是具身化和情境化的,具身智能強調智能生物的智能化程度和它的身體結構存在著很強的相關性,也就是說身體不是等待載入演算法的機器,而是身體本身應該參與演算法的進化。非具身學習和具身學習對比是有差異的。非具身學習一般通過“大模型無監督預訓練+小樣本有監督微調”範式訓練神經網路,訓練得到的深度學習模型可以直接部署到不同的硬體環境,即演算法的學習獨立於硬體與環境,性能表現完全取決於模型的泛化能力。而具身學習通過在虛擬環境中訓練大模型得到常識表徵,在具體場景中通過強化學習來完成模型的進化,模型可以在特定的硬體和環境中完成自主的適配。由於大模型利用了超大規模的訓練資料,並且包含大量參數,使得它具備了超強的泛化能力與優秀的應用性能。大模型的具身智能行為生成可以分為兩大部分:一、人機互動;二、系統與環境的互動在人機互動部分,人與自然語言或圖文資訊的形式,將任務需求輸入到多模態大模型中,模型對不同形式的輸入進行特徵的嵌入後,完成任務理解和概念推演,並生成知識和決策,最後由機器人生成面向任務指令的相應行為。在系統與環境互動部分,機器人首先利用自身感測器,完成對情境的具身感知,然後根據大模型的學習結果對情境產生行為,最終完成行為的輸出。討論5:基於表徵學習與因果推理的具身智能計算框架要想使機器具有類人的認知能力,首先要建立事件模型,將物體、事件、事實等知識進行有效表徵,進而建構一個持續學習的系統,在解決一個具體任務時,機器根據感知資料、意識先驗、表徵學習、知識庫進行推理,尋找完成任務的最優策略。意識先驗的概念比較抽象,當你處在一個情景中,試圖去理解它,你會意識到它某些現實層面的情景或過去的經歷。意識先驗是在原始輸入和某些更高級表徵基礎上形成的抽象層次。討論6:動態開放環境中的人機協同的具身智能為了讓具身智能表現的更像人類智能,還需要在動態開放的環境中強化人機協同。以往的運動策略學習傾向於把人排除在外,僅由試錯、搜尋獲得儘可能大的長期累積回報的策略,無法適應開放動態的環境。而人在回路的決策學習,由任務、目標引導搜尋,實現行為決策的類人化。此外,還可以通過嵌入式視覺學習、模仿學習和互動學習,引入人的作用。動態開放環境中人機協同具身智能的一種基本框架。人在回路的人機協同決策可以使具身智能向人類學習。自動駕駛系統通過行為克隆向人類駕駛員學習,自動駕駛系統通過10個小時的學習已具有基本的駕駛行為,但仍然無法避障和應對突發事件。自動駕駛面臨著那些挑戰?自動駕駛是開放環境中一類重要典型具身智能系統,在複雜交通環境下,自動駕駛安全要有可靠的駕駛行為。首先,它需要解決複雜交通場景中的“周密感知”,無論天氣或照明情況如何,必須在所有條件下檢測道路特徵。其次,它需要進行“預行為”的理解,因為人類駕駛員都是根據預行為傳達行駛意圖。再次,它需要對“意外遭遇”做出應對,而簡單的基於規則的自動駕駛不可能提前為每個場景編碼。最後,“網路安全”,如軟體的漏洞或駭客的惡意行為等等。自動駕駛行為是如何生成的?首先,系統結合經驗與常識、場景理解以及交通態勢評估,並利用模型對結構化道路場景和非結構化道路場景進行預訓練,生成導航路徑。隨後,基於具身智能完成目標狀態採樣、待選運動路徑生成和最優運動路徑選擇,進行運動規劃,最後生出合理的、可執行的駕駛行為。重點討論自動駕駛行為決策,將思維抽象為符號計算對人工智慧的發展產生了重大的推動作用,但為所有的交通對象建立模型是不可能的。帶來這些困難的一個直接原因是:許多交通場景的複雜性和動態性,並不都是可觀測和可控的,行駛過程中對異常情況的處理能力,是無法通過事先大量樣本訓練得到,而且也無法獲得大量的負樣本,交通事故就是一大類負樣本,而人類駕駛員開車是將車外的無窮狀態空間約簡為動態變化的“可行駛”的“二域狀態空間”,自動駕駛行為決策就是要尋找一個可行駛區域。因此,從認知層面要解決的問題,就是如何把複雜未知的現實世界,變化成有限空間環境的語義理解,我們把它稱之為一種直觀的理解。怎樣定義自動駕駛這個問題?需要把場景感知和情景認知區別開來。所謂場景是指某個交通場合在一個特定的時間和特定的空間中,具體情景或景象,可以定義為一種實體,當然這種實體的描述是通過感測器的資料來獲得的。情境是指某一段時間和空間許多具體情形的概括,情境的境是指構成和隱含在場景中,相互交織的因素及其相互之間的關係,所以情境計算是對場景中各個對像在空間的行為互動關係解釋,交通場景中各種物體或對象空間關係和行為的描述在自動駕駛中就顯得非常重要了。如何發展一種具有進化的、自主學習的自動駕駛系統?需要從認知的角度去瞭解人類駕駛員是如何注意並獲取交通環境資訊的。而交通環境資訊是如何在大腦中儲存和加工的,特別是在產生駕駛行為的背後存在怎樣的內部表徵。首先,我們來看看人類駕駛員如何注意並獲取交通環境的資訊。在交通場景認知的選擇性注意中,目標的重要性是一種高級屬性,它包含目標的物理屬性、運動屬性、行為屬性。其次,我們以交通場景的注意、記憶和學習過程為例,簡單討論人類對交通場景認知的加工機制。人的大腦對感覺記憶中的一些特定資訊的注意即選擇,對注意到的資訊進行組織,再通過學習在短期記憶中建立聯絡,將長期記憶的資訊傳遞到短期記憶,以連接傳入的資料,即整合。最後將短期記憶的內容進行編碼,轉換為長期記憶。在組織、整合與編碼之間存在著互動機制,實際上人在知道發生了什麼之前,他的注意力已被顯著性對象所捕獲,人類駕駛員對交通場景的理解是在記憶和先驗知識的基礎上進行的模式匹配。自動駕駛演算法需要在一定程度上引入人類對交通場景認知的加工機制,人類對變化非常敏感,突然變化,比如說顏色、紋理、大小、位置、運動,對注意力影響最大。注意機制已經成為建構自動駕駛AI架構的靈感來源。產生駕駛行為的背後存在怎樣的內部表徵問題?人類駕駛員在駕駛過程中是將車窗外無窮狀態空間約簡為動態變化的“可行駛”和“不可行駛”的“二域狀態空間”,並根據常識和交通規則,以及對交通場景的感知來產生相應的駕駛行為。因此,自動駕駛需要對交通環境進行分層的認知表徵,它們分別是空間定位層、行為模型層、知識策略層和任務驅動層,這樣就可以從認知的層面將複雜、未知的現實世界變換成有效的自覺物體的語義推理。如何建構自動駕駛環境的“認知地圖“?建構自動駕駛認知地圖需要包括車輛、交通標識、障礙物、行人等構成的可行駛區域的基本屬性。同時要有遞迴網路所學習到的關於預注意機制、駕駛意圖等高級認知屬性,把車輛當前狀態與交通知識作為認知地圖的一部分。要根據場景動態的變化,來形成實踐上的認知地圖的訓練。依賴認知地圖就可以使自動駕駛系統從類人的角度去理解交通場景正在發生的動態隨機變化。這裡進一步給出一種具有選擇性注意機制的自動駕駛認知計算實現架構。在這個計算架構中,利用摺積神經網路提取場景的顯著性空間特徵,這些特徵與先驗知識相結合,形成一種對時間可視化認知地圖,通過長短期記憶的注意機制,界定認知地圖中物體間的關聯,然後通過價值迭代模型將對環境的認知對應到行為空間,給出行駛決策。模擬測試也是自動駕駛重要的關鍵技術之一,自動駕駛汽車在大規模商業化應用前需要進行大量的測試,相關研究報告指出:在不犯錯誤的情況下,自動駕駛汽車需要行駛4.4億公里,才能證明其在車禍致死率和人類駕駛員的水平相當。假設由100輛自動駕駛汽車,每天測試24小時,一年測試365天,測試平均時速60公里每小時,需要耗時8.37年。相當於一輛車在地球與月球之間往返572次,顯然採用實際道路測試將耗費大量時間。而模擬測試可以提供一種高效率、低成本的自動駕駛測試。作為自動駕駛重要的關鍵技術,模擬測試需要關注的一大挑戰為異常交通場景的感知與處理,由於異常交通場景出現機率低、缺乏測試資料,因此需要利用圖形學、電腦視覺生成多樣化測試資料,在模擬環境中對自動駕駛車輛進行充分快速的測試驗證。這裡我們給出了一種基於大模型的自動駕駛模擬技術的基本框架,應用機器學習可以生成多樣性交通場景來評價自動駕駛系統在不同交通場景下的駕駛性能,如安全性、舒適性、協調性,以及演算法的可靠性,以及是否遵守相關法律法規。該基本框架由資料集包括注入的真實感測器資料、機器場景描述、測試場景分類、典型場景選擇與表徵、典型場景生成,包含一些副樣本等五大部分組成。這裡是自動駕駛模擬系統測試生成多樣性交通場景,如前車變道,對交通場景標識識別,夜間會車,以及前方突然出現行人。我們團隊開展自動駕駛研究二十餘年,走到今天我們取得了很大的進步,但實現完全自動駕駛依然是一個令人興奮而又望而生畏的艱難挑戰。最後給出一個移動智能體在開放環境下基於視覺和雷射雷達生成導航路徑的短影片。今天我的報告就到這裡,謝謝大家! (在行人)