微軟CEO納德拉最新採訪:AI模型不會贏家通吃,規模將成為決定因素

從ChatGPT到DeepSeek,以及前兩天通用智能體Monica的問世,AI行業的變化越來越快。

在快速變化之中,我們應該如何看待AI行業當下的發展。

不久前,微軟CEO薩蒂亞·納德拉(Satya Nadella)在一則訪談中,詳細闡述了自己對於當下AI行業的看法,當中的很多觀點很有價值。

在納德拉看來,AI大模型不會出現贏家通吃的局面。而微軟的策略也很清晰,只需要成為最後那些贏家中的一個。

在模型商品化過程中,規模將成為極為重要的競爭因素。因為任何事情的規模達到一定數量級後,性質就會發生變化,這有點類似於當年的雲端運算。

這也是為什麼微軟要去建造超大計算叢集的原因。

同時,納德拉也在警惕對於模型層的巨大投資。在他看來,供給側驅動需求固然成立,但最終供給和需求必須達到某種平衡。

單純的模型競賽毫無意義,真正的競爭在於AI是否能創造實際價值,變成一種可以被廣泛使用並推動利潤增長的商品。

烏鴉君整理了這次訪談內容,希望對你有所幫助。

本次訪談分為以下部分:

01.當某種技術能具備規模優勢,就必須長期下注

02.在大市場裡,只要成為贏家之一就夠了

03發達國家經濟增長率,才是衡量技術革命成功與否的關鍵指標

04.投資OpenAI的思考:供需達到平衡,讓AI成為可以被廣泛使用並推動利潤增長的商品

05.大模型不僅需要變得更好,還需要變得更便宜

06.AI普及的真正的問題,變革管理或流程變革

07.量子計算不會取代經典計算

08.決策好做,堅持難

09.遊戲資料之於微軟,如同YouTube之於Google

10.AGI能否到來的關鍵因素之一,信任


/ 01 /

當某種技術能具備規模優勢,

就必須長期下注

德瓦爾凱什・帕特爾:

微軟剛取得兩項重大突破,《自然》雜誌報導了馬約拉納零能模晶片,還有人類世界行動模型。

你講過上世紀80年代和90年代看到的一些情況,現在又發現有類似的事兒發生。

你是怎麼想的?

薩提亞·納德拉:

這讓我想起自己剛進入科技行業那幾年,最早能追溯到90年代的時候。

那時候我剛加入微軟,Windows NT才剛開始發展。

大家一直在爭論到底該用RISC(精簡指令集電腦),還是CISC(複雜指令集電腦)。還有人在討論,到底能不能用x86架構來搭建伺服器。

從最核心的矽晶片平台,到作業系統,再到應用層面,整個技術體系都在不停地發展和完善。

我覺得,雲端運算和巨量資料在這過程中起了很大作用。

很明顯,分散式運算和雲端運算改變了原來的客戶端—伺服器模式,網路也發生了翻天覆地的變化。

感覺比我過去參與的事情,更像是一個完整的技術堆疊。

德瓦爾凱什・帕特爾:

回顧80年代和90年代,有些公司做對了決策成了長期贏家,有些則沒有成功。

比如,你在太陽微系統公司(Sun Microsystem)的經歷,他們在90年代網際網路泡沫時期有過獨特的故事。

當時,有人認為資料中心的建設是泡沫,但正是這些基礎設施的建設,為今天的網際網路奠定了基礎。

從你這段經歷中,你是否可以總結出那些東西能經得起時間考驗?那些是真正的長期趨勢?那些只是短暫的現象?

薩提亞·納德拉  :

我參與了至少四次重大變革。

首先是客戶端-伺服器模式的興起,其中包括圖形使用者介面和X86架構的誕生。X86架構讓伺服器的建構成為可能。

1991年,我在太陽微系統公司工作時,參加了專業開發人員大會(PDC),在莫斯康中心親眼見證了微軟首次展示Windows 3.0的介面。

當時我就意識到,X86架構將在伺服器領域佔據主導地位。

當某種技術能具備規模優勢,就必須長期下注。

客戶端的技術發展也推動了伺服器端的進步,從而催生了客戶端-伺服器應用程式模型。

接下來是網路的崛起。網路成為我們必須應對的重要趨勢,從那時起我們開始著手相關工作。

1993年底,我剛加入微軟時,網景瀏覽器(Netscape)或馬賽克瀏覽器(Mosaic)問世,這標誌著網際網路時代的到來。

瀏覽器的出現改變了應用模型,我們通過多種方式適應這一變化,比如在Word中支援HTML、開發自己的瀏覽器參與競爭,並在伺服器端建構Web伺服器。

然而,我們錯過了網路上最大的商業模式。

當時我們認為網路將是完全分佈式的,沒有預見到搜尋會成為組織網路資訊的核心贏家。

Google看到了這一點並成功執行。這讓我學到一個教訓:

不僅要把握技術趨勢,還要清楚價值會在那裡產生。商業模式的轉變往往比技術趨勢更具挑戰性。

在人工智慧領域,我認為有兩個明確的價值點。

一是超大規模雲服務提供商,因為智能與計算量成正比,誰能進行大量計算,誰就是贏家。

二是人工智慧對基礎設施的需求。以ChatGPT為例,它不僅需要GPU的進步,還需要不斷最佳化計算與儲存的比例。

人工智慧工作負載對計算能力的需求呈指數級增長,尤其是在測試階段,人工智慧代理會呼叫更多程序,進一步擴大計算需求。

這對Azure等超大規模雲服務提供商來說是一個巨大的機會。不過,市場是否會呈現贏家通吃的局面?我認為並非如此。

在企業市場,買家不會容忍單一供應商壟斷。就像客戶端-伺服器時代與甲骨文(Oracle)和IBM的競爭一樣,買家希望有多家供應商選擇。因此,超大規模業務不會是贏家通吃的市場。

在模型領域,也會有開源和閉源模型共存的局面。就像作業系統領域有Windows這樣的閉源系統,也有Linux這樣的開源系統,兩者形成制衡。

開源模型將確保閉源模型不會壟斷市場。此外,如果人工智慧真的如預期般強大,政府也不會允許私營公司在全球範圍內獨佔鰲頭。

因此,整體來看,這不會是一個贏家通吃的局面。


/ 02 /

在大市場裡,

只要成為贏家之一就夠了

德瓦爾凱什・帕特爾:

有些人持有模型可能會被商品化的觀點,幾十年前也曾有人對雲端運算持有類似的觀點,認為雲端運算從根本上來說就像是一個晶片和一個盒子。

但最終,當然,你和其他許多人都發現,你們在雲端運算領域擁有驚人的利潤率,並且你們找到了實現規模經濟和增加其他附加值的方法。

從根本上說,即使拋開那些專業術語,如果你們擁有通用人工智慧(AGI),並且它能幫助你們開發更好的人工智慧,現在在強化學習(RL)中是利用合成資料。

也許在未來,會有一個自動化的人工智慧研究員,這似乎是鞏固你們優勢的一個好方法。我很好奇你對此有什麼看法?

薩提亞·納德拉:

在大規模應用中,沒有什麼東西是真正的商品。

拿雲端運算來說,很多人覺得雲端運算就是把伺服器堆在一起,沒什麼特別的。但實際上,當你規模擴大時,事情就沒那麼簡單了。

營運超大規模雲服務需要非常專業的知識。早期很多人以為這很容易,覺得託管服務提供商也能做好,但事實證明,這些業務並不成功。

超大規模雲服務的不同之處在於,它需要複雜的技術和管理能力。比如Azure,要管理全球60多個地區的計算資源,這不是隨便誰都能複製的。

所以關鍵問題是:這是一個只有一個贏家的市場嗎?答案是否定的。在一個大市場裡,完全可以有幾個贏家共存,而你只要成為其中之一就夠了。

同樣的道理也適用於模型層。模型最終需要運行在超大規模計算平台上,這種聯絡是無法割裂的。

模型不僅需要計算能力,還需要儲存狀態資料,並依賴常規計算資源來運行代理程序。

正因如此,一個人不可能獨自擁有一個模型並完全獨立運行它,至少在超大規模雲服務領域是這樣。

德瓦爾凱什・帕特爾:

作為超大規模雲服務提供商,還有一個獨特的優勢,尤其是在推理擴展方面。

如果未來模型的訓練和推理都依賴資料中心和GPU,這些硬體的成本可以分攤在多個用途上,既用於訓練,也用於推理。

我很好奇你認為微軟和Azure屬於那種超大規模雲服務提供商呢?是在預訓練方面嗎?還是在提供O3類型的推理服務方面呢?

或者說,你們只是打算託管和部署市場上的任何單個模型,並且對這些模型做到不偏袒任何一個呢?

薩提亞·納德拉:

我們希望發展方向能遵循摩爾定律,就像過去在其他領域所做的那樣。

每年更新計算資源,根據使用壽命折舊,並高效分配這些資源,以高利用率運行各種任務。

有時會有大型訓練任務,需要極高的峰值計算能力,同時還需要協調和支援。為了滿足這些需求,資料中心的規模必須足夠大。

但歸根結底,無論從預訓練還是其他角度看,計算資源的需求都會變得非常龐大。如果預訓練規模持續擴大,甚至可能需要跨越多個資料中心的邊界。這其實並不罕見。

一旦開始跨越資料中心的邊界,情況會有所不同,但分散式運算的本質不會改變。我們需要建構計算資源,既能支援大型訓練任務,也能滿足測試階段的需求。

如果強化學習(RL)進一步發展,可能會先建構一個大型模型,然後進行大量強化學習和測試工作。這實際上意味著更多的訓練計算量,因為需要為不同任務建立高度專業化的精簡模型。

此外,還有服務需求。光速限制了資料傳輸的速度,因此不能只靠一個資料中心為全球提供服務。

比如,不能只在德克薩斯州建一個資料中心,然後用它服務全世界。必須在全球範圍內部署推理計算資源,才能高效地為各地使用者提供服務。

順便提一下,我希望儲存裝置和計算資源能夠靠近這些計算資源。因為人工智慧加速器本身是無狀態的,除了儲存訓練資料外,還需要復用多個訓練任務的資料。

我們需要記憶體,也需要建立環境,讓代理能夠在其中執行任務。這就是我對建構超大規模計算資源的整體思考方式。


/ 03 /

發達國家經濟增長率,

才是衡量技術革命成功與否的關鍵指標

德瓦爾凱什・帕特爾:

根據最近的報告,微軟每年從人工智慧中賺了130億美元。但如果按照現在的增長趨勢,未來四年這個數字可能會漲到10倍,也就是1300億美元。

如果真的能達到這個規模,你覺得我們會怎麼利用這些智能技術呢?這種大規模的智能會朝什麼方向發展?

是通過辦公軟體(比如Office)來實現嗎?還是我們會把這些智能交給別人去託管?又或者,要實現這樣的收入目標,是不是必須擁有通用人工智慧(AGI)?那這個AGI會是什麼樣子?

薩提亞·納德拉:

這是個重要問題。如果智能技術真的迎來爆發式增長,甚至變得像商品一樣普及,那麼在討論微軟的收入之前,我們首先應該關注的是全球GDP的增長情況。

目前,唯一真正的制約因素是經濟增長。這也是為什麼我們在談論通用人工智慧(AGI)時可能過於樂觀了。

以發達國家為例,它們的經濟增長率大約只有2%,如果考慮通貨膨脹,實際增長率幾乎為零。假設現在是2025年,雖然我不是經濟學家,但從這些資料來看,我們正面臨嚴峻的增長挑戰。

當我們把人工智慧比作工業革命時,真正值得關注的是發達國家的經濟增長率是否能在扣除通膨後達到5%、7%,甚至10%。這才是衡量技術革命成功與否的關鍵指標。

這不僅僅是供給側的問題。實際上,很多文章都在討論這一點,我很高興看到這種討論。因為在這個過程中,最大的受益者不會是科技公司,而是那些廣泛應用智能技術的傳統行業。

這些行業的生產力會大幅提升,從而推動經濟更快增長。當這種情況發生時,整個科技行業也會隨之繁榮。

因此,僅僅宣稱在AGI領域取得了某個里程碑式的進展,並沒有實際意義,那可能只是在基準測試上做文章。真正的衡量標準應該是:世界經濟是否能夠實現10%的增長?


/ 04 /

投資OpenAI的思考:供需達到平衡,讓AI成為可以被廣泛使用並推動利潤增長的商品

德瓦爾凱什・帕特爾:

如果世界經濟每年增長10%,而當前全球經濟總量約為100兆美元,那麼每年將新增約10兆美元的價值。

在這種情況下,作為一家超大規模雲服務提供商,800億美元的收入雖然看似龐大,但如果真的相信未來幾年能夠推動全球經濟以這樣的速度增長,是否應該考慮投入8000億美元來支援這一處理程序?

這裡的關鍵在於,是否有足夠的計算能力來部署人工智慧技術,從而完成這些任務?這才是真正的瓶頸所在。

薩提亞·納德拉:

這是正確的。目前的情況是,經典的觀點往往是供給側驅動的,認為“只要建好了,使用者自然會來用”。

這種想法確實存在,我們也曾冒過這樣的風險去實踐。但最終,供給和需求必須達到某種平衡。

這就是為什麼我同時關注供給和需求兩方面。如果只專注於供給側的炒作,而不考慮如何為客戶創造真正的價值,就很容易偏離正軌。

因此,我非常關注我們的收入情況,並選擇公開這些資料。有趣的是,很少有人談論他們的實際收入。

但對我來說,收入是一個重要的指標,它幫助我們理解問題的核心,並作為一個制約因素來指導決策。

當然,供給和需求不需要在任何時候都完全對稱,但我們必須有證據表明,能夠將過去的投入轉化為當下的需求,這樣才能繼續投資,甚至是指數級的投資。

同時,也要確保不會因為供需速度不匹配而出現問題。

德瓦爾凱什・帕特爾:

這兩種觀點之間是否存在矛盾,值得探討。

一方面,你在早期進行了大膽的投資,比如2019年投資OpenAI。當時還沒有Copilot或具體的應用場景,但你選擇了提前佈局。

這類似於工業革命時期對鐵路的大規模投入,當時人們將GDP的6%到10%用於鐵路建設。

如今,我們的情況有所不同,沒有跟之前一樣能夠通過“賣車票”賺到利潤,反而有很大的損失。

薩提亞·納德拉:

微軟在這上面虧了不少錢。

但對我來說,關鍵問題在於,發展計算資源必須保持平衡。這不僅僅是單純地增加計算能力,而是要建構一種能夠同時支援訓練和服務下一個大型模型的計算能力。

在做到這兩點之前,你甚至無法真正利用自己的投資。

這不是一場單純的模型競賽,而是一場創造實際價值的競爭——讓人工智慧成為一種可以被廣泛使用並推動利潤增長的商品。

因此,必須有一個全面的思路,而不是只關注某一方面。這是我的看法。

順便提一下,關於網際網路泡沫時期的情況,有一點值得注意:現在大家都意識到,我們需要更多的能源和計算能力。這是件好事!

所有人都會參與競爭。不僅是公司在部署資源,各國也會投入資金。我很高興看到這一點,因為我正在大規模建設,同時也租賃了大量資源。

我對未來充滿期待,比如2025年、2027年、2028年,我將租賃大量計算能力。當我看到這些帳單時,我會覺得這很棒。因為隨著計算能力的大規模建設,唯一可能發生的事情就是價格下降。


/ 05 /

大模型不僅需要變得更好,還需要變得更便宜

德瓦爾凱什・帕特爾:

說到價格下降,最近DeepSeek模型發佈後,我提到了詹森悖論(Jen's paradox)。

這個悖論的核心在於,當某種商品的需求具有高度彈性時,價格下降會顯著刺激需求增長。但問題是,AI的發展是否會因為價格下降而受到限制?

從消費者的角度來看,智能的成本已經非常低了,比如每百萬個標記(tokens)只需2美分。

我真的需要價格降到0.02美分甚至0.002美分嗎?至少在我的使用場景中,價格已經不是主要瓶頸。

如果要讓模型變得更智能,可能需要100倍的計算量和更大規模的訓練運行。

雖然我很高興看到公司願意進行這樣的投入,但從我的角度來看,這似乎並不是最緊迫的問題。雖然,在企業端的情況可能有所不同。

那麼,真正需要將價格降到每百萬個標記0.002美分的關鍵使用場景是什麼呢?這可能是我們需要深入探討的問題。

薩提亞·納德拉:

關鍵問題其實是標記的效用,對吧?從某種意義上說,兩件事需要同時發生:

智能不僅需要變得更好,還需要變得更便宜。

每當有技術突破時,比如DeepSeek或其他類似的工作,標記的性能前沿就會發生變化,曲線會彎曲,前沿會移動,而這只會進一步刺激需求。

我是這樣看待這個問題的。這其實和雲端運算的情況很相似。

有一件有趣的事值得一提:在客戶端-伺服器時代,我們伺服器的服務量已經達到瓶頸。

但當我們將伺服器部署到雲端後,這個瓶頸被突破了。

這是因為使用者可以以更低的成本獲取計算資源,並且按需付費,而不是像以前那樣購買昂貴的許可證。這徹底擴大了市場。

舉個例子,當我曾經去印度這樣的國家推廣SQL伺服器時,我們在傳統伺服器時代的銷售非常有限。

但後來發現,印度的雲端運算市場規模遠遠超過了我們過去在伺服器時代的成就。我認為同樣的事情會再次發生。

想像一下,如果未來在全球南方的開發中國家,人們能夠以極低的成本獲得用於醫療保健的標記,這將帶來前所未有的變革。


/ 06 /

AI普及的真正問題,在於管理流程變革

德瓦爾凱什・帕特爾:

作為一個財富500強公司的CEO,為數億甚至數十億人部署產品的人,你認為這些能力的部署速度會有多快呢?

即使,你有可以工作的智能代理,但考慮到所有的合規性問題和所有內在的瓶頸,這會是一個難以突破的瓶頸嗎?還是會很快克服這些問題呢?

薩提亞·納德拉:

真正的問題是變革管理或流程變革。這是一件有趣的事情。

我經常使用的一個類比是,想像一下像我們這樣的跨國公司在個人電腦、電子郵件和電子表格出現之前是如何進行預測的?

當時傳真機到處都是,有人收到那些傳真,然後寫一份辦公室內部備忘錄,然後備忘錄四處傳閱,人們輸入數字,然後最終可能在第二季度即將開始時才得出一個預測。

然後有人說,“我只要用一個Excel電子表格,把它放在電子郵件裡,發出去,人們會去編輯它,然後我就會得到一個預測。”

所以,整個預測業務流程都改變了,因為工作成果和工作流程都發生了變化。這就是將人工智慧引入知識工作中要發生的事情。

事實上,當我們想到這些智能代理時,最根本的事情是有了新的工作和工作流程。

例如,對我來說,當我知道要接受你的採訪時,我會去我的Copilot那裡,然後說“嘿,我要和德瓦爾凱什談論關於量子計算的宣佈,以及我們為遊戲生成建構的這個新模型,給我總結一下我在去之前應該瞭解的所有東西。”

然後它知道那兩篇《自然》雜誌上的論文,它按照要求做了。事實上,我甚至說,“用播客的格式給我。”

然後它做得很好,就好像我們兩個在聊天一樣。然後我把它分享給了我的團隊,所以我把它拿過來,放在我們的頁面(pages)上,然後分享出去。

所以這是所有從事知識工作的人的一個根本性的變革管理,突然要弄清楚這些新的模式,即我將如何以新的方式完成我的知識工作。

這將會需要時間。這在銷售、財務和供應鏈等領域都會是這樣。

所以,對於現有的企業來說,我認為這是將會發生的情況之一。我喜歡用的一個類比,就是製造商在精益生產方面所做的事情。

精益生產,它成為了一種方法,通過這種方法,人們可以在製造業中對端到端的流程進行最佳化,從而變得更有效率。

這是一種持續改進,即減少浪費並增加價值。這也會應用到知識工作中,但還需要時間。

精益生產所做的一件事是從物理上改變了一個工廠的樣子。它揭示了一些人們直到真正關注的流程和工作流程時才意識到的瓶頸。


/ 07 /

量子計算不會取代經典計算

德瓦爾凱什・帕特爾:

微軟宣佈了在量子計算方面有了重大突破,你能解釋一下這裡發生了什麼嗎?

薩提亞·納德拉:

我認為這裡的根本突破或者說我們一直以來的願景是,在物理學上取得突破,才能建造出一台實用規模的量子電腦。

所以,我們選擇了這樣一條道路,也就是,押注於一種物理屬性,減少量子位元(quri)的噪聲,從而使其更可靠穩定。

這就是為什麼我們選擇了馬約拉納零能模(maira zero modes)作為研究方向,這個概念在20世紀30年代就被提出了。

理論上沒有問題,關鍵在於我們實際上能製造出這些東西嗎?

我們現在終於發現了馬約拉納零能模在一種新物質態中的存在證明,在物理學上取得了突破。

我們把這比作量子計算領域的電晶體時刻,在這個時刻,我們實際上有了一種新的物質態,即拓撲態,這意味著我們現在可以可靠地隱藏量子資訊並對其進行測量,還能製造它。

有了這個核心技術,我們就可以開始建造一個馬約拉納一號(Maio, a chip, that Marana one)晶片,這是第一個能夠擁有一百萬個物理量子位元的晶片。

在此之後,經過邏輯量子層面的不斷糾錯,我們就有了一台真正能被用於實踐的量子電腦。

德瓦爾凱什・帕特爾:

你是說最終一百萬個量子位元將整合在一個晶片尺寸內。太神奇了。

其他公司宣佈了才擁有100個物理量子位元的晶片,比如Google、IBM和其他公司。當你宣佈這個突破時,你們似乎遠遠超越他們了。

薩提亞·納德拉:

我們採取了一種不同的策略,把軟體和硬體分開開發。

我們正在建構自己的軟體系統,同時也與其他團隊合作,包括使用中性原子、離子阱甚至光子技術的團隊。

這意味著未來可能會有多種類型的量子電腦。我們最近宣佈的一個進展是實現了24個邏輯量子位元。

其次,我們在量子糾錯方面取得了重要突破,這讓我們的系統,即使在中性原子或離子阱量子電腦上,也能運行20多個邏輯量子位元。這個數字預計還會繼續增長。

我們的目標是從基礎原理出發,研發基於拓撲量子位元的超級量子電腦。這就是這次突破的核心意義所在。

德瓦爾凱什・帕特爾:

太神奇了,一百萬個拓撲量子位元,數千個邏輯量子位元,達到那個水平的預計時間線是怎樣的呢?

薩提亞·納德拉:

量子電腦能讓我們做的第一件事就是建造更多的量子電腦,因為它將使模擬逐個原子建構變得容易。

接下來真正要做的事情是,就是去建造第一台容錯量子電腦。這是合乎邏輯的一步。

也許在2027年、2028年、2029年,我們將能夠實際建造出這台電腦。

德瓦爾凱什・帕特爾

在2027年、2028年,當你讓它運行起來時,你認為它會是什麼樣的呢?

是通過應用程式程式設計介面(API)來訪問的東西嗎?還是你會在內部將其用於自己的研究,比如材料科學和化學方面呢?

薩提亞·納德拉:

我們在大約兩年前取得的突破是將高性能計算(HPC)棧、人工智慧棧和量子計算結合起來考慮。

事實上,如果你仔細想想,人工智慧就像是模擬器的模擬器,而量子計算就像是對自然的模擬器。

那麼,量子計算會做什麼呢?

順便說一下,量子計算不會取代經典計算,量子計算在它擅長的領域表現出色,而經典計算也會繼續存在。

量子計算對於任何不是資料密集型的,但在狀態空間探索方面要求更高的任務來說,將是非常出色的。

我希望用量子電腦取代一些高性能計算的部分。比如,量子計算在人工智慧、化學、物理學、生物學等領域就會表現得很出色。

如果你將人工智慧和量子計算結合起來,也許你可以用量子計算來生成合成資料,然後人工智慧可以利用這些資料來訓練更好的模型,這些模型知道如何對化學、物理學或其他類似的領域進行建模。

這兩者將一起被使用。即使在今天,這實際上就是我們將高性能計算和人工智慧結合起來所做的事情。


/ 08 /

決策好做,堅持難

德瓦爾凱什・帕特爾:

你能跟我談談你是如何做出這些研究決策的嗎?

這些決策在20年或30年後實際上會帶來回報,尤其是像微軟這樣規模的公司。

顯然你對這個項目的技術細節非常瞭解。

對於微軟研究院所做的所有事情,你都能這樣深入瞭解並做出決策嗎?

你對目前正在進行的、有望在20年後獲得回報的投資有什麼看法呢?這些決策是自然地從公司內部產生的,或者說你是如何跟蹤所有這些事情的呢?

薩提亞·納德拉:

這要感謝比爾(Bill)能在1995年創辦微軟研究院(MSR)。

我認為,在這些由好奇心驅動的研究機構的悠久歷史中,創辦一個專注於基礎研究的研究機構是很了不起的。

多年來,微軟研究院已經積累了強大的機構實力。所以,當我考慮資金分配、預算或者說每年把資源投入到那裡時,我會想,看,這是微軟研究院的預算,我們每年都要在知道大多數這些投資在短期內不會有回報的情況下進行投入。

也許微軟的第六任首席執行官會從中受益。

真正讓我思考的是,當像量子計算或者一個新模型出現時,這樣的機會來臨時,作為一家已經在各方面取得成功的公司,你是否還能靈敏的否抓住這些機會?

回顧一下科技行業的歷史,並不是那些沒有進行投資的公司失敗了,而是你需要有一種文化,知道如何將一項創新轉化為實際的成果並進行規模化發展。

坦率地說,這對首席執行官和管理團隊來說是很困難的部分。這既需要良好的判斷力,也需要良好的企業文化。

微軟研究院有很多項目,我們本應該率先推進,但我們沒有。

我總是問自己為什麼,這是因為我們沒有足夠的信念,也沒有一個完整的思路,不知道如何不僅要接受這項創新,還要將其轉化為一個有用的產品,並建立一個我們可以推向市場的商業模式。

首席執行官和管理團隊的工作不僅僅是對某一件事情感到興奮,而是要能夠真正地將整個事情執行下去。這說起來容易做起來難。


/ 09 /

遊戲資料對於微軟來說,

就像YouTube對於Google一樣重要

德瓦爾凱什・帕特爾:

你們在同一天宣佈了兩項重大突破,量子計算和人類世界行模型Muse。我很想讓你多講講後者。

顯然像Dolly和Sora這樣的生成模型已經取得了令人難以置信的成就。

從某種意義上說,我們過去曾使用人工智慧來對智能體進行建模,現在我們使用同樣的技術來對智能體周圍的世界進行建模,並提供一致的即時效果。

我們會在這個播客上疊加展示這個模型的視訊,這樣人們就有機會親自看到它。這本身就令人難以置信。

在你擔任首席執行官期間,微軟已經投入了數百億美元來發展遊戲業務,收購智慧財產權。

回想起來,如果你能將所有這些資料整合到一個大型模型中,這可以讓你獲得同時訪問和體驗多個遊戲世界的體驗。

如果這是遊戲行業未來的發展方向,那麼我們之前的投資似乎是非常明智的。

你之前有預見到這一點嗎,還是只是一個巧合呢?

薩提亞·納德拉:

我不會這麼說。

坦率地說,我們投資遊戲不是為了大模型,而是歷史上發生過一件有趣的事情。


在我們開發Windows系統之前,我們就開發了我們的第一款遊戲,飛行模擬器(Flight Simulator)是微軟的產品,遠遠早於我們開發Windows系統。

所以,遊戲業務在微軟有著悠久的歷史,我們想要從事遊戲業務是因為我們熱愛遊戲本身。

這就是為什麼我們總是從一開始就明確,我討厭那種只是為了達到其他目的而存在的業務,遊戲業務本身就應該是有價值的目標。

然後,我們必須將所有這些資產整合在一起,並通過增加價值來更好地管理這些資產。

例如,現在雲遊戲對我們來說是一個很自然的投資方向,因為這將擴大市場規模(TAM),並增加人們在任何地方玩遊戲的可能性。

人工智慧和遊戲業務的結合也是一樣,我們絕對認為這會有所幫助,從長遠來看,這甚至可能會像電腦生成圖像(CGI)對遊戲行業產生的變革一樣。

作為世界上最大的遊戲發行商,這將是很有幫助的。

但與此同時,你必須製作出高品質的遊戲。作為一個遊戲發行商,你首先必須專注於這一點。

但是這個資料資產,不僅在遊戲領域會很有趣,它還將成為一個通用的行動模型和世界模型,這太棒了。

我認為遊戲資料對於微軟來說,就像YouTube對於Google一樣重要。所以我對此感到很興奮。

德瓦爾凱什・帕特爾:

我想說的是,你可以在許多不同類型的遊戲中獲得統一的體驗。這與微軟過去所做的其他事情,比如混合現實(makes reality),是如何結合的呢?

也許這會給小型遊戲工作室一個機會,讓他們在5年或10年後能夠製作出像3A大作這樣的遊戲。

薩提亞·納德拉:

我是這樣看待這三件事情的,它們在某種程度上是基石。

有趣的是,甚至在五六七年前,我就說過我們想要下的三個大賭注是人工智慧、量子計算和混合現實。

我仍然相信這一點,因為從某種意義上說,存在的一些重大問題需要解決,而存在感就是混合現實的終極目標,比如你和我現在進行這樣的播客節目,你能創造出真正的存在感嗎?

我認為這仍然是一個很難解決的挑戰。

坦率地說,我原以為它會更容易解決,但也許是因為社交方面的原因,比如人們要佩戴裝置等,這使得它變得更難。

我們對將要和阿德里爾(admirall)以及帕爾默(Palmer)一起做的事情感到興奮,包括他們將如何推進Ivas項目。

因為,這是一個很棒的應用案例。我們會在這方面繼續努力。

但同時,二維介面也很重要,比如Teams軟體,由於疫情,我們真正實現了通過二維介面創造存在感的能力,我認為這將繼續發展。

這是一個長期的趨勢,量子計算我們已經討論過了,人工智慧是另一個趨勢。

這就是我關注的三件事情,我會思考如何將這些事情結合起來,最終不是為了技術而技術,而是為瞭解決我們人類在生活中想要的一些基本問題,並且在經濟方面,推動我們的生產力。

如果我們能在這方面做對,那麼我認為我們就真的取得了進展。


/ 10 /

AGI能否到來的關鍵因素之一,信任

德瓦爾凱什・帕特爾:

你在很早之前就投資了OpenAI,2017年甚至更早。

你說說過,有人可能會說我們正在孕育一個新的物種,這個物種的智能可能沒有上限。

當然,在2017年就談論這個還為時尚早,我們一直在從更細緻的層面談論智能體、辦公軟體Copilot、資本支出等。

但我們現在把視角放大,考慮一下你說的這個說法,然後你作為一個超大規模雲服務提供商的負責人,同時也在進行研究、開發這些模型,並為建構一個新物種提供訓練、推理和研究支援。

從宏觀的角度來看,你是怎麼看待這件事情的呢?或者你認為在你擔任首席執行官期間,我們會朝著超人類智能的方向發展嗎?

薩提亞·納德拉:

我看待這個問題的方式是,你絕對需要信任。

我的意思是,我認為在我們聲稱這是一個像新物種這樣重大的事情之前,我們必須首先解決的根本問題是,無論是在個人層面還是社會層面,都要有真正的信任。

這種信任是至關重要的,因為我認為這裡最大的限制因素將是我們的法律體系,我們可以稱之為基礎設施。

我們一直在談論所有的計算基礎設施。那麼法律基礎設施將如何發展來應對這個問題呢?

整個世界是基於人類擁有財產、享有權利和承擔責任等概念建構的。

這是我們首先必須考慮的基本問題,也就是說,對於人類現在使用的任何工具,這意味著什麼呢?如果人類要將更多的權力委託給這些工具,那麼這個結構將如何演變呢?

在這個問題真正得到解決之前,我認為僅僅談論技術能力是不夠的。

就像如果我們不能弄清楚如何解決這個問題,我們就無法部署這些智能。歸根結底,除非有人類為其承擔責任,否則今天是不可能部署這些智能的。

這也是為什麼我認為即使是最強大的人工智慧,本質上也是在人類授予的一些委託權力下工作的。

人工智慧真正的問題將出現在法庭上。沒有一個社會,會允許有人說“是人工智慧做的”。

德瓦爾凱什・帕特爾:

如果你認為世界會出現10%的經濟增長,這實際上取決於能否讓像通用人工智慧(AGI)這樣的東西發揮作用,對吧?

AGI的實現將會取代相當龐大的人類勞動力成本,一旦你弄清楚了其中的法律影響,即使在你的任期內,這似乎也是相當可行的。

當你想到這些的時候,你認為AGI會是你職業生涯中最大的成就嗎?

薩提亞·納德拉:

讓我們談談我們的民主社會。我認為,為了擁有一個穩定的社會結構並使其正常運轉,你不能只有資本回報而沒有勞動力回報。

你可以談論這個問題,但你知道,60%的勞動力回報必須得到重新評估。

以我自己簡單的、也許可以說是天真的方式來看,我們將開始重視不同類型的人類勞動。今天被認為是高價值的人類勞動,也許會變得普通。

可能會有一些我們將重視的新事物,包括那些來幫助我進行物理治療或其他類似事情的人。

無論情況如何,我們都會重視這些。

但最終,如果我們沒有勞動力回報,並且工作沒有意義和尊嚴,那麼這將是在一致性方面部署任何這些技術的另一個限制因素。 (烏鴉智能說)