世界上最強大的“政客”和“民意操縱者”,正在人工智慧實驗中誕生


近期,騰訊科技和《人類簡史》作者尤瓦爾・赫拉利展開了一場深度對話:

對談尤瓦爾·赫拉利:人類對秩序的渴求先於真相,是網際網路和AI控制個人的首要原因

在對話中,赫拉利著重探討了人工智慧對個體決策的潛在影響,表達了對技術被少數人掌控的憂慮。

然而,最新研究顯示,AI的威脅已遠超赫拉利的預判。2024年4月發表在arXiv預印本平台的“SocioVerse”研究論文揭示了一個更為嚴峻的現實:AI技術已突破個體影響的邊界,邁入群體操控的新階段。

這項由復旦大學主導、聯合上海創新研究院、羅切斯特大學、印第安納大學以及中國社交媒體平台小紅書共同完成的研究,通過建構一個基於1000萬真實使用者資料的社會模擬系統,展示了AI不僅能夠理解和影響單個個體,它還可以操控成千上萬的人,甚至預測並潛在地塑造整個社會的集體行為。

這種從微觀個體到宏觀社會的技術躍遷,讓赫拉利的擔憂顯得幾乎過於保守——我們面臨的風險遠比他當時預見的要嚴重得多。

如果說赫拉利擔憂的是AI成為精通心理學的個人操縱者,那麼“SocioVerse”則表明,AI正在演變為洞悉社會規律的超級架構師——一個能解碼社會結構、預判群體動態,並可能改寫社會運行邏輯的數字巨靈。

這一技術躍遷將AI風險從微觀個體層面提升至宏觀社會維度,其潛在衝擊的深度與廣度,遠超我們此前的想像,其潛在後果之深遠令人顫慄。

SocioVerse:數字孿生社會背後的神秘面紗

SocioVerse意圖建構一個前所未有的系統:一個能夠模擬和預測真實人類社會行為的完整數字世界。

回溯至二十世紀中葉,社會學理論奠基人亨普爾和歐本海默就曾預言:真正的因果解釋必須建立在社會現象的可預測性基礎上。此後的多年間,儘管計算社會學不斷髮展,但傳統社會模擬技術始終面臨根本性侷限——它們要麼過度簡化社會複雜性,要麼與現實世界嚴重脫節,無法捕捉瞬息萬變的社會動態、多元群體的行為差異,以及微妙的人際互動機制。

SocioVerse的誕生徹底改寫了這一局面。這個系統不再是對社會的粗糙模仿,而是一個具備高度保真度的數字鏡像。

通過整合最前沿的人工智慧技術,它實現了對社會系統的全要素建模,包括:

  • 動態演化的社會環境
  • 具有獨特行為模式的個體
  • 複雜的社會互動網路
  • 微妙的資訊傳播機制

這一突破使得SocioVerse超越了傳統社會模擬的範疇,成為首個能夠與現實社會保持同步演進的數字孿生體。其建模精度和系統完備性,標誌著計算社會學研究達到了前所未有的高度。

用1000萬個虛擬人,構築一個流變真實的世界

之所以SocioVerse算是能模擬這個社會的項目,是因為它確實建構了一個能“以人類社會的方式運行”的社會模型——一個具備時間性、個體性、情境性、互動性與變遷性的系統。這使它不僅能模擬社會行為,還能模擬社會變遷。

在大多數社會學入門課程中,教師總會畫一張簡單的圖:一些點(個體)和連接這些點的線(關係)。但這張圖從來沒有告訴我們,一個人為什麼轉發了某條微博、為什麼開始焦慮地關注房價,或者,為什麼在看到“AI裁員”的新聞時,忽然改變了對技術的態度。

這是人的行為不是在真空中產生的,它總是在事件的時間線上、身份的社會結構中、語境的互動場中發酵。社會,不是一堆人,而是一種資訊的共振結構。

這正是SocioVerse的起點:如果我們要模擬社會,就不能只模擬人,還要模擬資訊,及其如何穿透人群,塑造情緒,匯聚成共識或撕裂。

於是,他們設計了四個協作的引擎:社會環境引擎、使用者引擎、場景引擎、行為引擎。這四者的協作,恰好對應了社會結構中最核心的四個邏輯維度:時間性(事件如何演化)、個體性(誰在被影響)、情境性(在那種互動中)和互動性(如何相互作用)。

第一步,個體維度:從標籤到人格的進化

SocioVerse的使用者引擎可能是它最具人類學雄心的部分。他們從Twitter(X)與小紅書上採集了超過1000萬個真實使用者資料,超過7100萬條社交發言。然後,用三個最強LLM(GPT-4o、Claude 3.5、Gemini 1.5)給每一個人打標籤。

這些標籤不光包括我們熟知的人口學標籤,比如年齡、性別、種族、地區;在這一層,基本就是傳統推薦引擎的極限了。

而LLM的語義理解使得這一系統還可以對使用者的政治傾向、消費偏好、價值觀打標籤。除此之外,他們甚至能對你的人格本身做標記,在實驗中,他們應用了Big Five人格模型(開放性、責任心、外向性、宜人性、神經質)對智能體做了分類,甚至連他們做表達的語義風格也可以分類模擬,比如它是偏情緒表達,還是喜歡邏輯分析。這使得這一系統中的模擬人Agent具有了過往系統所完全沒有的細膩度和真實性。

完成這一系列打標後,系統會將標籤交由人工評審,再訓練成分類器,讓整個使用者庫真正變成一個活的社會人群圖譜。這些圖譜包含:

  • 基礎屬性:年齡、地域、職業等人口學特徵
  • 心理特徵:大五人格特質(開放性、盡責性等)
  • 行為特徵:表達風格(如“理性分析型”或“情緒宣洩型”)
  • 價值取向:政治立場、消費觀念等深層傾向

這使得研究者能精準呼叫特定人群畫像,如“技術樂觀的95後程式設計師”或“對AI持懷疑態度的中年主婦”。

第二步,時空維度:動態演進的社會劇場

如果說社會是一個系統,那它首先是一個時間系統。人們的行為不是在“狀態”中生成,而是在“處理程序”中變化。

為了實現社會的時間性變化,在建立完個人後,SocioVerse還建立了一套“社會環境引擎”

它通過即時抓取新聞事件、政策變動、經濟指標等資料,建構持續演化的社會背景。以美國大選模擬為例,系統不僅輸入候選人政見,還整合了各州失業率等經濟資料、社交媒體話題熱度、突發公共事件影響,形成了一部24小時更新的“社會紀錄片”。

第三步,場景維度:情境敏感的行為模擬

首先是場景引擎。我們對一個問題的回應,並不是脫離上下文的“意見表達”,而是被放置在某種語境中——餐桌上的談話和問卷調查、微博發帖和面對面的訪談,是完全不同的體驗。

SocioVerse就通過場景引擎,去模擬不同行為發生的“結構性環境”。

比如當它模擬“選舉投票行為”時,就會選擇匿名系統反饋。當它模擬“社交平台發言”時,要加入“會被誰看到”“評論如何反饋”的社交反饋機制。而當它模擬“使用者接受經濟調查”時,需要把問題置於是否信任問卷、是否擔心隱私等背景因素中。

在“國家經濟調查”這一模擬中,系統重建了一個與統計局高度一致的問卷環境——涵蓋食品、住房、醫療、交通、教育等八大項,並設定了不同的發放方式和媒介管道。

結果顯示,當問卷從“政府官網”發出時,虛擬智能體普遍持“慎重”、“合規”態度。而他們在答題時也更傾向中性回答、謹慎表達負面意見。

而同樣的話題從“小紅書推薦博主”發出時,虛擬智能體則更容易將其當作“社交參與”或“生活方式表達”。也更容易在回答中真實反饋支出痛點、表達焦慮或消費偏見(例如“最近醫療真的太貴了”“房租太高撐不住了”)。

這意味著,它確實模擬了資訊裹挾的情境。而非僅僅用AI模擬了聊天。

第四步,互動維度:資訊傳播的連鎖反應

情景造好後,下面就是通路模擬。資訊進入通路,然後把“個體”變成“彼此相關的個體”。SocioVerse稱這個為行為引擎

這一引擎採用了雙軌系統。對於規則清晰的群體性行為,比如投票、選擇、點贊等,SocioVerse採用了成熟的傳統Agent-Based Modeling(ABM)建模;而對於語言表達、態度生成、情緒反應等複雜互動,則呼叫大語言模型生成,給予每個Agent其“人格+歷史+資訊輸入+場景位置”,生成其行為。

以川普發表演講為例,系統不僅能生成智能體對事件的初始態度,更能模擬其在社交平台的發帖行為、資訊傳播路徑及引發的連鎖反應。從意見領袖的率先發聲,到普通使用者的跟風討論,再到觀點對立引發的輿論極化,每個環節都在演算法驅動下層層遞進,完整復現現實世界中熱點事件從萌芽到爆發的全生命周期。

值得注意的是,行為引擎的核心並非簡單復刻行為本身,而是建構一個閉環的資訊生態系統。在這裡,每個智能體的言論都可能經歷“傳播-誤讀-再創作-擴散”的循環,如同現實社會中的謠言發酵或熱點炒作,讓虛擬世界產生與真實社會同步共振的輿論漣漪。

雖然這個引擎名為行為引擎,但SocioVerse模擬的不只是行為本身,更是行為被看見、被誤讀、被引用以及引發反應的資訊循環機制。

當社會環境引擎注入即時事件、使用者引擎定義角色特徵、場景引擎設定互動規則、行為引擎啟動動態反饋,四大模組共同驅動著SocioVerse的數字社會模型。

這個系統不僅能感知時間的流動、識別個體的差異、還原場景的真實,更能捕捉人與人之間微妙的影響鏈條,最終建構出一個充滿生命力的數字孿生社會。

驚人的預測能力:三個真實世界模擬的震撼結果

單看整套系統的設計,SocioVerse基本上做到了對人作為社會分子,其所受的核心影響因素做了深入毛孔的拆解。

也正是因此,SocioVerse展示了相當準確的預測真實世界行為的能力。

他們一共進行了三組實驗,都相當準確。

第一組是美國總統選舉預測。研究團隊建構了一個包含33萬多個虛擬選民的模型。其中每個虛擬選民都具有12個關鍵人口統計特徵。他們使用迭代比例擬合技術確保這些虛擬選民的分佈與美國各州的真實人口分佈一致。隨後,他們設計了一份包含49個問題的詳盡調查問卷,涵蓋從社會安全到LGBTQ+權利的各種政治議題。

結果在使用Qwen2.5-72b模型時,系統在所有州的預測準確率達到了92.2%,而在關鍵搖擺州的精準率也高達80%。根據現實中美國“贏者通吃”的選舉人票分配規則,這意味著AI幾乎可以完美預測整個美國總統選舉的結果。

第二組則是突發新聞反饋分析——在這個場景中,研究者以ChatGPT的發佈作為目標事件,嘗試預測公眾對這一技術突破的反應。他們首先界定了潛在受眾群體(對技術感興趣的小紅書使用者),然後從使用者池中採樣了2萬個智能體,基於ABC態度模型(情感、行為、認知)設計了一份18個問題的問卷,覆蓋公眾認知、感知風險、感知收益、信任、公平和公眾接受度六個維度。

結果AI智能體的反應與實際使用者的反應高度一致,甚至在細微的觀點分佈上都表現出驚人的相似性。GPT-4o模型模擬的結果在KL散度指標上的得分僅為0.196,意味著預測分佈與真實分佈幾乎重合。

第三個實驗是中國國家經濟調查——這一模擬展示了系統在經濟行為預測方面的能力。研究團隊根據中國國家統計局的方法論,從使用者池中採樣了1.6萬個智能體,涵蓋全國31個地區。他們精心設計了一份經濟問卷,詢問關於食品、服裝、住房、日用品、交通通訊、教育娛樂、醫療保健和其他七大類消費的具體支出情況。

當模擬結果與官方統計資料比較時,所有測試的AI模型都展現出令人難以置信的精準性,尤其是在發達地區的表現更為突出。Llama3-70b模型在所有消費類別上的均方根誤差低至0.026,意味著它能幾乎完美地複製中國居民的消費模式。

這三個實驗說明,SocioVerse確實已經成了一個能夠準確模擬和預測大規模社會現象的強大系統。從新聞反應到政策影響,幾乎沒有任何社會現象能超出其模擬範圍。

並非虛擬小鎮,而是虛擬現實

很多人會說這個邏輯和之前的斯坦福小鎮沒啥區別啊,只是智能體數量擴大了,行為更多集中在資訊互動上了。

確實,在SocioVerse之前,這類AI智能體社會模擬項目其實已經有過不少了。2023年末的“斯坦福小鎮”虛擬社區,這一試驗中讓25個AI智能體在這個封閉環境中生活和互動。

而上一個出圈的實驗是Project Sid ,他們把斯坦福小鎮拓展到1000人的水平,並且把場景換成了minecraft,那裡的智能體居民也逐步形成了社區和選舉。

但SocioVerse從本質上和這類實驗完全不同。

斯坦福小鎮與真實世界之間存在一道清晰的界限:它是一個完全封閉的虛構環境,所有角色都是人為建立的,沒有任何真實人類資料的直接輸入。它更像是一個精心設計的互動小說,而非真實社會的鏡像。

SocioVerse則完全不同。它直接建立在1000萬真實人類的行為資料之上,每一個智能體都不是憑空想像的角色,而是基於真實使用者的詳細檔案。

雖然研究者聲稱他們採取了保護使用者隱私的措施,如只提取公開帖子內容並過濾異常資料,但這些措施並不能改變一個基本事實:SocioVerse正在從大規模真實人類行為中提取模式,並用這些模式來預測更廣泛群體的反應。它不是在一個想像的世界中進行試驗,而是在建立一個與我們共同生活的社會世界的“數字孿生”。

這種直接與真實世界對接的特性,使SocioVerse成為一種全新類型的社會工具——一個不僅能夠觀察和分析社會,還能夠預測甚至可能影響社會的系統。這不再是學術上的思想實驗,而是一種可能對現實世界產生深遠影響的技術。

AI將社交平台變成“數字牧羊人”

過去,當平台擁有了比較粗糙使用者資料時,他們用這些資料塑造了推薦演算法,進而製造了達成平台利益最大化的資訊繭房。而現在,當它擁有一個能夠如此精準地預測人類行為的系統時,會有什麼能阻止他們將其從預測轉向去影響群體的決策?

與傳統的社會工程或宣傳不同,這種新型影響更加精細、更加個性化、也更加難以察覺。它不是通過明顯的不實資訊操作公眾,而是通過微妙地調整真實資訊的呈現方式,放大某些方面同時淡化其他方面,以產生預期的心理和行為反應。

這就是無聲的控制,一根完美的牧羊杖。

擁有著AI助力的平台的能力遠遠超越了傳統的個性化推薦,進入了對集體行為和社會偏好的積極塑造領域。如果說資訊繭房只是針對個人的最大注意力抽取技術,那SocioVerse就將是對全社會的指揮棒。平台可以隨意的指點,而我們則只能在不知覺的情況下隨之起舞。

這項研究,正是依靠著擁有上億使用者的社交媒體,真實的使用者資料才有可能被獲取。而有了這套系統。我們在平台上的意見,和呼喊不再會是需求本身。而只不過是系統捕捉到的,可利用以達成它個體目的的資訊而已。

這無可反擊的意志,世界上最強大的“政客”和“民意操縱者”,正在實驗中誕生。

這可能是AI時代,我們所面對的最壞的可能。 (騰訊科技)