《紐約客》丨那些訓練人工智慧、榨乾電網的資料中心內部到底是什麼樣子?

Inside the Data Centers That Train AI and Drain the Electrical Grid

一個資料中心的耗電量堪比費城,它如今是美國的新型工廠,既創造未來,也支撐著經濟。這樣的局面能持續多久?

本文即將刊登於2025 年11 月3 日《紐約客》雜誌,印刷版標題為:“Information Overload.”作者:Stephen Witt著有“The Thinking Machine”一書。

「我確實認為,世界上的許多地方終會佈滿資料中心,」OpenAI執行長山姆·奧特曼曾這樣表示。圖譜繪製:Jun Cen

從美國幾乎任何一座城市出發,往幾乎任何方向行駛,不久後你都會看到一座資料中心——它像一個巨大的白色盒子,從平整過的土地上拔地而起,兩側是發電機,周圍圍著柵欄,活像個監獄大院。用於人工智慧的資料中心是美國的新型工廠。這類中心裡塞滿了運算設備,接收資訊並輸出人工智慧成果。自2022年ChatGPT推出以來,它們的數量開始以驚人的速度激增。 「我確實認為,隨著時間推移,世界上的許多地方都會佈滿資料中心,」OpenAI執行長山姆·奧特曼最近說道。

美國領先的人工智慧資料中心獨立營運商是CoreWeave,該公司成立於8年前,最初只是一次隨意的嘗試。 2017年,紐約一家中型避險基金的交易員決定開始挖掘加密貨幣,並以這些貨幣作為他們夢幻足球聯盟的入場費。為了挖掘加密貨幣,他們購買了一塊圖形處理器(GPU),這是輝達公司生產的高性能微晶片。這款GPU原本是針對電玩玩家銷售的,但輝達提供的一款軟體能將其變成一台低成本超級電腦。 “從資本回報率的角度來看,這個嘗試非常成功,所以我們開始擴大規模,”CoreWeave的聯合創始人之一布萊恩·文圖羅告訴我,“要是能在五天左右收回成本,誰會想多做幾次這樣的生意。”

不到一年時間,這些交易員便辭去了避險基金的工作,購買了數千塊GPU,放在新澤西州文圖羅祖父的車庫裡運作。 2018年加密貨幣市場崩盤後,CoreWeave從破產的礦工那裡收購了更多微晶片。不久之後,該公司打造了一個平台,讓外部客戶能夠使用這些GPU。隨後在2022年,文圖羅偶然發現了Stable Diffusion——一款產生影像的人工智慧工具。他向這款人工智慧輸入不同場景的描述,它便產生了精準且精美的插圖。 「這東西一定會讓全世界為之著迷,」文圖羅回憶起當時的想法時說道。

Stable Diffusion的訓練是在與CoreWeave設備類似的輝達設備上完成的。文圖羅和他的共同創辦人嗅到了一生中難得的商業機會。 CoreWeave募集了1億美元,幾乎全部用來購買輝達的硬體。不久後,輝達執行長黃仁勳安排了與他們的會面。 「他花了大約十分鐘調侃我是新澤西來的,」文圖羅說。但最終,輝達收購了該公司的部分股份。到了2022年中,CoreWeave開啟了一項全新的業務:為人工智慧開發者和滿是輝達設備的倉庫牽線搭橋。

現代資料中心的建置始於1990年代,當時商業互聯網剛興起。資料中心承載著網站運作、電子郵件協調、支付處理以及視訊和音樂串流傳輸等功能。亞馬遜在建造資料中心方面格外積極——維吉尼亞州勞登縣建造了大量資料中心,該地區也因此被稱為「資料中心走廊」。甚至在人工智慧熱潮興起之前,資料中心就已經有利可圖;在某些年份,亞馬遜網路服務部門的利潤超過了公司的零售業務,而其銷售額卻遠低於零售業務。

但隨著輝達GPU的問世以及大規模人工智慧訓練的發展,資料中心產業發生了翻天覆地的變化。 2022年11月,ChatGPT推出後迅速爆紅。 「整個世界都為之瘋狂,」文圖羅說。微軟與OpenAI合作,為ChatGPT的運作提供所需的資料中心算力支援。當微軟無法滿足需求時,便轉而尋求CoreWeave的協助。

使用輝達硬體如今成了一種身份象徵——標誌著用戶在人工智慧領域是認真的。與工程師談論這些設備時,我不禁想起有一次看到一群年輕人冒著嚴寒排隊,只為購買街頭潮牌Supreme的運動鞋。

今年早些時候,CoreWeave上市了。文圖羅和他的共同創辦人如今都成了億萬富翁。該公司擁有數十萬塊GPU,其平台除了為OpenAI提供服務外,還為Meta(元宇宙)和其他主要實驗室的模型提供訓練支援。

今年夏天,我參觀了CoreWeave位於拉斯維加斯郊區的設施。這是一棟大型倉庫式建築,周圍圍著厚厚的柵欄,每隔一段距離就裝有監視攝影機。我穿過旋轉門,一名穿著防彈背心、腰間別著泰瑟槍的保全上前接待了我。交出手機後,我從自動分發器拿了兩副酸橙綠顏色的耳塞,然後進入了設施內部。

陪同我的有三位CoreWeave的工程師,這些技術達人適應超大規模資本主義的方式,就像達爾文筆下的雀類適應加拉巴哥群島一樣。來自公司總部的雅各·雲特身材瘦削、能言善辯,頭髮梳得一絲不苟。克里斯多福‧康利戴著墨鏡、留著鬍子,熱情地為我講解設備相關知識,他主要負責硬體方面的工作。肖恩·安德森曾是大學籃球中鋒,身高七英呎(約2.13公尺),穿著一件印有「更多節點」(MOAR NODES)字樣的T卹。

他們所說的“節點”,是一個個淺淺的計算設備托盤,每個托盤重約70磅(約31.75公斤),裝有4塊水冷GPU以及一系列其他設備。將18個這樣的托盤堆疊起來,再用電纜連接到一個控制單元,就組成了輝達GB300電腦架。這種機架比冰箱略高一些,成本高達數百萬美元。在業務繁忙的年份,一個普通機架的耗電量會超過100戶家庭的總耗電量。數十個這樣的機架一直延伸到視野盡頭。

CoreWeave將這些機架放在白色的金屬機櫃裡,這既有助於散熱,也能減弱噪音。康利打開一個機櫃的門,要我查看運作中的機架,一股氣流撲面而來。噪音大得驚人,彷彿我打開了一個掃帚間,卻發現裡面有一台正在運轉的噴射引擎。我看著閃爍的指示燈和旋轉的風扇。 「耳鳴是這裡的職業風險,」康利對著我大喊。

我環顧四周,設施內有數百個一模一樣的機櫃。我們上方是一條金屬走道,走道兩側排列著為計算設備供電的配電裝置。我不禁聯想到修道院中的修士、兵營裡的士兵、牢房中的囚犯。我好奇,什麼樣的人會自願在這樣的地方工作? “人力資源部門告訴我,我不能再問這類問題了,但我喜歡招聘那些能承受很多痛苦的人,”雲特後來說道,“比如耐力運動員這類人。”

CoreWeave沒有告訴我那天是那家客戶在使用他們的技術,但雲特暗示,我們所看到的這場模型訓練規模並不大。他開始詳細介紹機架的配置。我根本聽不清楚他在說什麼,只能像在夜總會聊天那樣,故作睿智地點著頭。即便塞了耳塞,我的耳朵還是開始嗡嗡作響,頭也漸漸痛了起來。雲特轉向我。 “有時候,某個客戶會一次性佔用整個場地好幾周,”他大喊道,頭髮在風扇排出的氣流中飄動,“我們把這種情況稱為'英雄級運行'(hero runs)。”

CoreWeave的硬體可以從頭開始完整地訓練出一個人工智慧模型。軟體開發人員通常在矽谷的工作站上,將一個名為「權重」(weights)的數位檔案以及海量訓練資料上傳到資料中心。這些訓練資料可以是文字、圖像、醫療記錄,實際上幾乎可以是任何內容。在初始設定中,「權重」是隨機的,此時的人工智慧不具備任何能力。

之後,會讓人工智慧接觸一部分訓練數據,並要求它對接下來可能出現的內容做出預測——例如一個句子中接下來的幾個字母。未經訓練的人工智慧所做的預測肯定是錯的,但至少它能從中學會不該怎麼做。 「權重」必須經過調整,才能吸收這項新資訊。背後的運算過程十分複雜,尤其依賴一種名為「矩陣乘法」的運算。

1940年,數學家G·H·哈代寫道:「美感是第一道考驗:醜陋的數學在世界上不會有長久的立足之地。」然而,我們的文明如今正將大量富餘資源投入其中的矩陣乘法,卻毫無美感可言,就像一個人用鎚子往木板上釘釘子一樣。它既不優美,也不對稱:事實上,在矩陣乘法中,a乘以b並不等於b乘以a。隨著矩陣規模不斷擴大,完成這些算術運算需要強大的運算能力。最新的大型語言模型可能包含約一兆個獨立「權重」。要完成這類模型的“英雄級運行”,可能需要持續數周時間,動用數萬個GPU,進行10的24次方次運算——這個數量比宇宙中可觀測到的恆星數量還要多。

資料中心必須與當地電力公司合作,才能應對這些訓練任務。在CoreWeave的資料中心,流經晶片的水進入時是室溫,流出時卻比熱水澡的水溫還要高。這些水會先在儲水箱中冷卻,然後再循環回系統中。機房內空氣的溫度、濕度和顆粒含量也都受到嚴密監控。 「冷凝水是我們的大敵,」康利嚴肅地說。

所有這些微晶片、電力、風扇、資金、數據、水冷泵和電纜——這一切的存在,都是為了調整「權重」這個小小的數位檔案。這個檔案小到可以存放在一個外接硬碟裡,但其重要性卻不言而喻。開發這份「權重」檔案以及類似檔案所投入的資金,是人類史上規模最大的資本投入之一。

當訓練完成後,「權重」檔案的副本會分發到全國各地的資料中心,使用者可以透過網路存取這些副本,這個過程稱為「推理」(inference)。使用者提出問題,促使人工智慧產生一個個名為「令牌」(tokens)的智慧單元。一個「令牌」可能是一小塊像素,也可能是一個單字的片段。人工智慧要寫出一篇大學學期論文,大約需要產生5000個“令牌”,所消耗的電力相當於一台微波爐以最大功率運行約3分鐘。隨著人工智慧要處理的請求越來越複雜——無論是產生視訊、音頻,還是提供心理諮詢——對運算能力的需求將會倍增。

再乘以每周使用ChatGPT的8億多人,資料中心數量激增的現象就不難理解了。如今,ChatGPT的受歡迎程度已經超過維基百科;年輕人把它簡稱為“Chat”,就像“Google”(Google)代表網路搜尋一樣,“Chat”成了人工智慧的代名詞。我曾與微軟的一位資料中心主管交談,他認為未來我們對人工智慧的需求會像現在對網路或電力的需求一樣,變得不可或缺,而目前的資料中心建設規模可能還不夠。 「我更擔心的是我們建得太少,而不是太多,」這位高層說。

微軟是資料中心領域的主要營運商之一,這項業務已成為推動美國經濟成長的主要動力。儘管微軟仍在開發作業系統和辦公室軟體,但正是投資人對資料中心的看好,推動其市值達到約4兆美元,成為全球市值第二高的公司。為微軟提供微晶片的輝達公司,則位居全球市值榜首。

要進入微軟的資料中心並非易事,難度堪比進入諾克斯堡(美國聯邦黃金儲備庫)。這些設施中正在開發的人工智慧價值連城。 “以往,要是想偷價值連城的東西,人們會想'開卡車來運',”CoreWeave的首席技術官彼得·薩蘭基告訴我,“但在這裡,有人只要帶個U盤進去,就能把OpenAI的全部知識產權都拷貝走。”

不過今年秋天,在打了彷彿有200通電話之後,我終於受邀參觀了微軟一處正在興建的大型資料中心園區。我承諾不拍照、將手機留在外面、不詳細描述內部細節,也不透露設施在美國的具體位置。 9月,我開車長途跋涉,來到了一個偏僻之地。這個資料中心周圍是農田,該地區至少還有其他三家公司正在建造資料中心。田野裡縱橫交錯地佈滿了高壓電塔的電線,到處都在冒出一個個醜陋的大型盒子。

該園區的外部沒有任何微軟的標誌——甚至連一個標誌都沒有。柵欄後面,經過好幾個車輛檢查站,園區內一片空曠,只有一個角落排列著一排編了號的棚屋。這些棚屋是白色的,窄而高,長度相當於好幾個足球場;它們讓我想起了小時候在明尼蘇達州博覽會上看到的牲畜棚。每個棚屋的兩側都排列著柴油發電機和工業空調。

我參觀時,那裡已有5個棚屋,規劃中大約會建10個。到處都是工程車:高空作業車、推土機、裝載電纜捲的卡車。有人在我要參觀的那間棚屋前做了些綠化,幾株小植物在樹蔭下生長著。

在棚屋內部,我見到了朱迪·普里斯特和史蒂夫·所羅門,兩人都是微軟高層,他們的職業生涯一直在管理倉庫大小的電腦系統。普里斯特是一名電機工程師,畢業於麻省理工學院,眉毛修剪得很精緻,一頭金色捲髮十分惹眼。所羅門是機械工程師,回答我的問題時總是滔滔不絕地講技術細節。兩人似乎都對能參與這場新的工業革命感到興奮不已。普里斯特興奮地講述了她最近一次就醫的經歷:看完病後,她收到了一份由人工智慧輔助生成的、記錄她與醫生對話的摘要。所羅門的立體聲音響出了點問題,他拍了一張音響背面介面的照片,上傳到了Chat(ChatGPT)。他告訴我,人工智慧回覆了7種可能的故障排除方案。說到這裡,他的語氣略微有了些變化,在我看來,這表明他在表達某種情緒。 「第三種方案管用了,」他說。

穿上鋼頭靴,看完一場PowerPoint簡報後,我通過了一個安檢口,進入了核心區域。這個設施比CoreWeave的資料中心更安靜、更整潔,空間也更寬敞。數百組一模一樣、閃爍著指示燈的伺服器和運算設備連接在冷卻站旁,嗡嗡作響地運行著,佔據了大部分地面空間。用紮帶捆紮好的線纜束沿著天花板延伸:有電線、數據線,還有水管和氣管。這些線纜連接到更大的線纜束,進而與其他棚屋相連,使所有棚屋的設備能協同工作,形成一台一體化的巨型電腦。光是這5個棚屋,用於計算的區域總面積就相當於20個足球場。

普里斯特解釋說,一次高水準的模型訓練可能會佔用整個系統長達一個月的時間。我和一名技術人員站在控制中心,監控電力消耗狀況。我們看著功率數值不斷飆升——這表明電腦正在處理訓練資料;隨後功率又降了下來——此時電腦正在將結果寫入檔案。隨著人工智慧從一個檢查點進入下一個檢查點,這種功率的起伏不斷重複。在這棟建築的某個地方,模型正在不斷優化;在這棟建築的某個地方,電腦正在學習如何「思考」。

離開資料中心後,我迫切地想與人交流。沿著公路開了半英里(約0.8千米),我看到一個穀倉的頂部從一處正在建造的資料中心後面露了出來。我駕車穿過一片滿是灰色建築、灌溉管道、電線和翠綠田野的區域,最後抵達了一個塵土飛揚的院子,院子裡停滿了拖拉機和皮卡車。在那裡,我見到了一位第四代苜蓿種植者,他穿著藍色牛仔褲、格子襯衫,戴著一頂繡有油罐車圖案的棒球帽。

這位農民指了指橫穿他田地的電線,這些電線是當地電力公司在20世紀40年代鋪設的。 「我們一直覺得這些東西是個累贅,」他說,「我們認為它們會降低土地價值。」但如今,他表示,能接入變電站成了一件極其划算的事——他的一個鄰居稱,自己把一塊農田賣給了一家數據中心開發商,每英畝(約0.4公頃)的價格超過100萬美元,這比農場一輩子還要高的價值。這位農民說,他家也在一點點出售土地。

農場北邊有一座新建的資料中心,東邊還有一座正在興建中。微軟那片廣闊的設施佔據了整片視野,它就建在他家自1979年起就一直在耕種的一塊土地上。他告訴我,我打算很快搬走──周圍的環境已經不適合耕種,甚至不適合人類居住了。

我問這位農民,住在資料中心旁邊,有沒有註意到對環境的影響。他說,對供水的影響不大。 「說實話,我們用的水可能比他們還多,」他說。 (訓練一個最先進的人工智慧模型所需的水量,比一平方英里(約2.59平方公尺)農田一年的用水量還要少。)但電力情況就不一樣了:這位農民表示​​,當地電力公司計劃三年內第三次提高電價,最近一次提議的漲幅達到了兩位數。最讓他痛心的是那些富含養分的表層土壤──他家透過精心的作物輪作,一直養著這些土壤。 “微軟調來一台挖掘機,一天之內就把所有土壤都挖走了!”他說,語氣像是在談論一件遺失的傳家寶,“足足有6到10英呎(約1.8到3米)厚,全沒了。”

我們看著一隻黃色的狗站起身,繞著小圈子走了走,然後又回到樹蔭下睡著了。樹的後面,有一座巨大的長方形倉庫,把樹都比得矮小了。我問這位農民是否用過人工智慧。 “我用Claude,”他說,“Google現在不行了。”

資料中心正開始給美國電網帶來巨大壓力。 1999年,星座能源公司收購了三哩島核電廠唯一一座仍在運作的反應堆,並在接下來20年裡一直運作該反應爐。 2019年,該公司關閉了這座反應堆,認為它在經濟上已無利可圖。負責管理星座能源公司核電機組的高層布萊恩漢森為員工舉辦了一場告別派對。 “派對上有食物,但沒人想吃,”他說,“氣氛就像在參加葬禮。”

或許不久後,三哩島將再次響起歡慶的派對聲。星座能源公司宣佈,將於2027年重新啟用該設施,並將其更名為克蘭清潔能源中心。與微軟簽訂的一份大額合約是促成這項決定的關鍵因素。 「要是八年前有人告訴我,我們會重新啟用這座核電廠,我絕對不會相信,」漢森說。 (該核電廠的第二座反應爐曾在1979年發生放射性氣體外洩事故,此次仍將維持關閉狀態。)

像漢森這樣的能源產業主管,每天都會收到大量要求增加供電的請求。他表示,數據中心「所需的電力規模,可能比我們以往接入電網的任何用戶都要大一個數量級。你可以想像一下,費城這座城市的電力負荷約為10億瓦。現在,想像一下要在電網上增加多個10億瓦規模的數據中心,而且不止一個,而是好多個。」

當一座資料中心投入營運時,零售用電客戶通常也要分擔電費成本:2025年上半年,美國各電力公司申請的零售電價漲幅總額接近300億美元。今年春季,電力公司申請的電價漲幅幾乎是去年同期的兩倍。彭博社的一項分析估計,在資料中心周邊地區,過去五年批發電價上漲了200%以上。而且電價很可能會繼續上漲——發電廠的發電量遠遠無法滿足需求。Google前執行長艾瑞克‧施密特表示,美國需要為全國電網新增920億瓦的電力供應,才能滿足資料中心的需求,相當於再增加92個費城的電力消耗量。如果電力供應不足,美國的人工智慧開發者可能會被中東和中國的同行超越,這些地區目前已在推動大型資料中心專案。

資料中心要實現經濟可行性,必須24小時不間斷運作。 (我參觀的微軟資料中心,每年允許的非計畫停機時間僅5分15秒。)風能、太陽能等依賴天氣條件的再生能源,目前只能滿足這類需求的一小部分。核能也無法拯救我們,至少短期內不行;漢森表示,要在美國新建任何大型核反應堆,都需要數年時間。他語氣中帶著羨慕地告訴我:“中國正在建造26座核反應爐。”

短期內,新建資料中心的電力供應將主要依賴化石燃料。開發商紛紛在馬塞勒斯頁岩(阿巴拉契亞地區一個巨大的地下天然氣儲層)等天然氣儲量豐富的地區購置土地。今年4月,總部位於賓州的荷馬城重建公司宣佈,計劃將匹茲堡郊外一座已閒置的燃煤電廠改造為美國最大的天然氣發電廠,該電廠幾乎將專門為資料中心供電,發電量可達約45億瓦。據一家環保非營利組織稱,荷馬城發電廠每小時可能向大氣中排放多達400萬磅(約181.44萬公斤)二氧化碳,相當於400萬輛汽車怠速時的排放量。

據估計,目前地球正以每十年0.3攝氏度的速度變暖,這速度大約是冰河時期末期的10倍。上一個冰河時期結束後,海平面上升了400英呎(約121.92公尺)。像荷馬城這樣的發電廠以及全球更多類似設施的建成,將加速這災難性進程。而川普政府對此的回應是,限制在政府官方溝通中使用「氣候變遷」一詞。

資料中心也會造成局部污染。伊隆馬斯克旗下的xAI公司在孟菲斯的博克斯敦(一個以非裔美國人為主的社區)附近建造了一座以天然氣為動力的資料中心。該地區本就是田納西州氣喘急診就診率最高的地方,自從這座發電廠建成後,會加重氣喘病情的二氧化氮濃度又飆升了9%。富裕地區則試圖阻止資料中心的建置。 2024年11月,在維吉尼亞州華倫頓(華盛頓特區的一個富裕郊區),選民們罷免了支援新建亞馬遜資料中心的市議員,選出了反對開發的新國會成員。 (弗吉尼亞州鄰近縣的民主黨人安·惠勒因支援數據中心建設而失去了職位,她抱怨稱,活動人士持有一種“香蕉心態”(BANANA),即“任何地方都絕對不能新建任何設施”(Build Absolutely Nothing Anywhere Near Anyone)。)

未來幾年,資料中心建設預計將佔美國國內生產毛額的2%到3%。 19世紀,鐵路建設對美國國內生產毛額的貢獻估計為6%。鐵路改變了美國,創造了巨大的財富(儘管分配不均),但當時的鐵路建設熱潮也催生了歷史上最大的投機泡沫之一。隨後便爆發了1893年的經濟大恐慌:失業率飆升,數百家銀行倒閉,民粹主義情緒高漲,動搖了美國的政治版圖。

投資公司黑石集團總裁、另類資產管理負責人喬恩·格雷,提到了羅恩·切爾諾所寫的約翰·D·洛克菲勒傳記。 「很多鐵路公司都破產了!」他說,「你得努力避免這種問題,因為你根本不知道最終結局會怎樣。」黑石集團已發行債券用於建設數據中心;為了避免成為破產的一員,格雷會通過與微軟、亞馬遜等科技巨頭簽訂15年的租賃協議來避險風險,這些科技巨頭是目前信用評級最高的客戶群體之一。通常情況下,除非已有確定的客戶,否則黑石集團不會投資興建資料中心。 「這不像在邁阿密或杜拜投資公寓,」格雷說。

資料中心持續建置的前提是,在棚屋裡安裝更多輝達晶片,就能開發出更先進的人工智慧。到目前為止,這一前提已被證明是正確的:最新一代人工智慧的性能達到了前所未有的水平。 OpenAI的GPT-5甚至能夠自主開發其他相對簡單的人工智慧。然而,「晶片越多,智慧越高」並非鐵律,研究人員也不完全清楚這種「規模效應」為何會存在。人工智慧領域先驅德米斯·哈薩克斯在談到規模效應時表示:“我們是否會遇到瓶頸,這是一個需要實證檢驗的問題。沒人能給出確切答案。”

也有可能出現某種技術創新,使這種超大規模建設變得不再必要。今年早些時候,中國公司深度求索(DeepSeek)公佈了一種似乎更有效率的人工智慧訓練模式,消息一出,輝達的股價應聲暴跌,單日市值蒸發近6000億美元(不過後來股價已回升)。

唐納德·川普已將資料中心建設列為國家優先事項;科技公司高層在白宮宣佈新項目,也漸漸成了一種慣例。但為了迎合川普,這些高階主管可能會誇大其詞。在9月的白宮晚宴上,馬克·祖克柏表示,未來幾年,Meta將在資料中心及相關基礎設施上投入6,000億美元。當時麥克風還開著,祖克柏俯身對川普小聲說:「抱歉,我還沒準備好。我不確定你想讓我報那個數字。」亞馬遜全球數據中心營運負責人凱裡·珀森告訴我,電力公司對一些新的數據中心開發商提出的供電請求持懷疑態度。 「看看這些請求隊列中的需求量,再看看建設所需的資金規模,你就會發現,根本沒有那麼多錢,」珀森說。

儘管人工智慧擁有種種驚人能力,但它可能會讓投資者失望。它或許會成為一種無利可圖的商品:Claude、Grok、Gemini和ChatGPT的功能都十分相似,而且技術創新很快就會被競爭對手複製。科技巨頭們其實並沒有無限的資金:隨著微軟、Meta等公司在資料中心競賽中投入大量資金,它們的現金儲備也不斷減少。投資人的預期可能也不切實際:美國股市的估值比率已接近網路泡沫時期的水平,創投市場也變得過熱。 「投資人通常不會給一個只有6個人的團隊幾十億美元,卻連產品都沒有。這種情況很罕見,但如今卻在發生,」傑夫貝佐斯最近表示。

話雖如此,也有可能這些炒作並非毫無根據。輝達執行長黃仁勳(我最近出版了他的傳記)是世界級電腦科學家,正是他生產的微晶片,讓人工智慧時代成為可能。 「以前,我們每兩年才能推出新的晶片,」微軟工程師普里斯特說,「現在,每隔幾個月就能有新晶片問世。」輝達目前約佔標準普爾500指數市值的8%,這是至少45年來單一股票在該指數中佔比最高的水平。黃仁勳能否持續研發出更先進的晶片,關係重大。如果美國人想安享退休生活,輝達就必須成功。

水、電力和土地都是稀缺資源,但正如其名稱所示,資料中心最寶貴的「商品」其實是資料。 Claude的訓練資料來自LibGen(圖書館genesis),這是一個龐大的盜版電子書庫,可透過種子檔案下載。今年9月,Claude的開發者Anthropic公司同意向這些書籍的版權持有人支付15億美元賠償金,平均每項侵權賠償約3000美元——這是歷史上最大的集體訴訟版權侵權和解案。 (本刊包括我在內的部分人員也在索賠人之列。)針對OpenAI和輝達的類似訴訟仍在審理中。

微軟並不知道客戶會向其資料中心上傳什麼內容──這些資料屬於客戶私有。很難判斷人工智慧時代版權侵權的規模,但在我看來,相較之下,Napster(早期音樂共享平台)的侵權行為就像交換混音磁帶一樣微不足道。現代人工智慧的發展方式,是先收集所有能取得的線上數據——包括音訊、影片、幾乎所有英文出版物,以及超過30億個網頁——至於後續的法律問題,則留給律師去解決。

但如今,人們開始談論「數據短缺」的問題。據估計,已建立索引的互聯網上約有400兆個單詞,但正如OpenAI聯合創始人安德烈·卡帕西所指出的,其中大部分都是「毫無價值的垃圾」。高品質文字的獲取難度更高。研究人員表示,如果當前趨勢持續下去,到2026年至2032年間,人工智慧開發者可能會耗盡可用的人類文字資料。由於人工智慧聊天機器人是在「回收」現有內容,它們難免會陷入陳腔濫調,表達方式也會很快變得乏味。要讓它們產生新穎、高品質的文字並非易事——我自己就嘗試過。

微軟的普里斯特告訴我,她並不擔心資料耗盡:除了文字,還有廣闊的資料領域等待探索,人工智慧開發者才剛起步。下一個前沿領域是「世界模型」數據,這些數據將用於訓練機器人。大量視訊資料和空間資料將輸入資料中心,用於開發自主機器人。輝達的黃仁勳也想進軍這個市場,去年他曾在舞台上與兩個可移動機器人一同亮相。在洛杉磯,我曾在無人駕駛汽車後面等待過,最近還差點撞上一輛自主配送車。但直到最近一次北京之行,我才真正開始明白機器人革命會是什麼樣子。

在中國,機器人隨處可見。我在商場裡看到它們整理貨架、打掃。有一次,我在飯店房間點了外賣,送餐的是一個兩英呎高、外形象垃圾桶的輪式機器人,還帶著孩童般的聲音。我打開門,看到它站在門口,身上裝飾著仿管家服裝的飾品,用普通話嘰嘰喳喳地說著什麼,我驚訝不已。機器人正面的艙門彈開,一盤麵條滑了出來。它又嘰嘰喳喳地叫了一聲。我接過食物,艙門關上,機器人便透過滾輪離開了。我站在原地,手裡拿著餐盤,心裡不禁想:我以後還會和人類交流嗎? ♦ (邸報)