按:本文為著名科技分析師Ben Thompson與微軟CEO Satya Nadella和CTO Kevin Scott的訪談。
訪談主要涉及微軟最新發布的AI PC硬件,以及支撐當前人工智慧浪潮的策略考量。兩位微軟高層也解釋了與OpenAI的合作關係具體如何運作,以及微軟如何在全公司範圍內轉向人工智慧,也談到了雲端運算領域的競爭格局和策略思考。
核心觀點:
1. 能源就是一切。有了更多的再生能源、更好的電網和更強的算力,經濟的其他各個領域都能真正受益。
2. 微軟的核心競爭力在於建立平台,讓其他人再次基礎上發展業務和產品的。
3. AI是十年一遇,甚至一代一遇的重要機會。
4. 如果無法每年投入500到600億美元的資本支出,就拿不到進入超大規模雲端運算市場的門票。
5. 與OpenAI 的合作關係就像當年與英特爾的合作關係,它既定義了產業,也定義了微軟,長期穩定的合作來自於持續的雙贏。
5. 未來五年,世界最需要的是無所不在的超大規模算力。
6. 世界人口未來會持續減少,為了維持生活水平,必須要有很大的生產力提升。 AI能讓人們公平地獲取需要的東西,從而擁有尊嚴,過著美好的生活。
以下部分為微軟CEO Satya Nadella的訪談,有刪減
主題:微軟的調整 | Copilot+ PC |人工智慧平台| OpenAI合作夥伴關係| 人工智慧的整合與模組化| 資本支出與未來
Ben Thompson:我曾在微軟工作過。事實上,我在這裡參加了2012年的第一次Build大會,那是一次非常獨特的活動。我不確定你是否還記得,當時它與Windows 團隊在紐約舉辦的另一場以消費者為中心的活動之間存在競爭關係。如今,微軟似乎是一家更團結的公司。你認為這段時間在文化和組織上發生了哪些變化?
Satya Nadella:好吧,讓我這麼說吧,Ben。對我來說,我的記憶可以追溯到91 年的PDC(專業開發者大會),那時我們第一次討論Win32。事實上,那時我還在Sun 公司工作,甚至還沒有加入微軟,我對未來的發展非常清楚,PC和它要做的事情以及伺服器架構對我來說在91 年就已經非常清楚了。
我覺得這對任何科技公司來說都超級重要,就是要有我所說的完整思維。對我來說,完整思維始於「系統創新是什麼?」——無論是晶片、作業系統還是應用平台。那麼,為什麼這對任何消費者或任何應用程式開發者來說都是可取的?因此,對我來說,無論是在Azure 方面還是在Windows 方面,甚至是在今天早上的Windows Copilot+ PC 上,都需要這樣的創新,我們已經很久沒有這樣完整的想法了,我們已經有了—— Arm,我覺得我們已經拿到了。我們已經擁有了應用平台。微軟自己在開發應用,第三方也在開發應用。因此,對我來說,從文化上講,能夠讓你建立完整產品的東西才是我認為必須努力的方向。
Ben Thompson:你提到了消費者和開發者。你沒有提到企業這個詞。你是否覺得,完整的思維目前正在這三個層面發揮作用?
Satya Nadella:這是一個很好的問題。我認為,企業也是終端用戶。事實上,我覺得在微軟,只要我們處於最佳狀態,我們就能──如果你還記得,我們一直是一家知識工作者公司。
Ben Thompson:沒錯。但我認為,企業的購買者和使用者之間的分岔有時確實是個棘手的問題
Satya Nadella: 老實說,我在90 年代初加入的公司不是這樣。
Ben Thompson:因為那時只有開發者。
Satya Nadella: 還有終端用戶。所以,我經常回想的一件事就是,我們真正考慮的是終端用戶。對我來說,Excel 是一個面向終端用戶的產品。
Ben Thompson:肯定是在80年代。
Satya Nadella:早在它成為IT 之前。因此,回過頭來看,這並不意味著我希望我們現在不做真正滿足IT 需求的事情。事實上,Paul Maritz曾經說過:神奇之處在於終端使用者、開發者和IT。順便說一句,要成為一家優秀的企業公司,你必須善於協調這三者之間的關係。這意味著,如果你把開發者和終端用戶等同起來,你就能成為一家出色的消費性公司,而且是分門別類的,對嗎?消費者現在是一個很廣泛的概念。它可能意味著很多很多東西。我們不會去做好萊塢電影或其他很多事情,但說到遊戲,我稱之為生產力,我們想做得很好。
Ben Thompson:沒錯,人們都忘了,微軟不僅在消費領域和PC領域,而且在伺服器領域和商品硬體等方面都是顛覆性的。是否存在孰先孰後的轉變?我認為可能有一段時間微軟對消費領域抱有很大的期望,但也許是人們在工作中使用PC,然後他們希望在家裡使用PC,而手機在這方面顯然有些不同,但這仍然是微軟的甜蜜點嗎?
Satya Nadella:是的,我認為這就是。就拿Windows 來說吧,我希望我們能為工作和家庭兩用的用戶打造出色的Windows PC,甚至在外形設計上也是如此。如果人工智慧浪潮已經來臨,那就讓我們重新設計作業系統和硬體。因此,這就是我希望我們能真正做好的事情,而今天就是朝著這個方向邁出的良好一步。
Ben Thompson:是的,我印像很深,我覺得它很有說服力,它似乎讓人真正明白了為什麼要購買Windows,而自從瀏覽器出現並將應用程式從桌面上剝離後,這種感覺似乎就不復存在了。你是如何利用這一點並向其靠攏的呢?你們的市場定位是否會發生重大轉變?是否只是依靠原始設備製造商,你認為它會自己賣出去?你們是要以以前沒有的方式進行大量投資,還是一直在投資?
Satya Nadella:我們一直在投資,但在科技領域,時機就是一切,對吧?我們一直在研究Arm,我們談論NPU已經很久了。
Ben Thompson:是的,十年前,微軟推出了Arm PC,我當時就在現場。
Satya Nadella:所以,關鍵點是它正在整合。想想剛剛發生了什麼事。有了所有這些模型,以及我們能夠擁有的能力,無論是從隱私的角度,還是從延遲的角度,或者是COGS(成本)的角度,擁有內建模型,因為當你使用…
Ben Thompson:老實說,你在台上發言時有點像蘋果的風格。首先,你提到「MacBook」的次數比喬納森·艾維(Jony Ive)時代的蘋果還要多,這很明顯是在做對比。關於本地隱私的討論很多,但你提到的這些本地模型很關鍵——COGS,從你的角度看,如果使用客戶的能源,那實際上是免費的。你認為你們在這方面能走多遠?例如AI PC,我一直在等規格參數,你確實提到了,16GB的記憶體對Windows來說還不錯,但對AI來說還是偏小。
Satya Nadella:現在有了45 TOPS,我覺得這款Copilot PC 已經邁出了第一步,我喜歡我們在AI PC 上邁出的第一步,但有了這款Copilot+ PC,我覺得我們就成功了。順便說一句,我非常相信分散式計算仍將是分散式的,所以它實際上是一致的。就拿Recall 來說吧,我認為這是一個殺手鐧功能,我們已經研究了很長一段時間。
Ben Thompson:我一直在Mac 上使用「倒帶」功能,這無疑是一種超能力。
Satya Nadella:是的,關鍵是現在有了語義索引(Semantic Index),我可以鍵入自然語言查詢,然後進行Recall,甚至是我們忘記了的事實,我透過視覺來記憶事物,透過聯想來記憶事物,而現在能夠不用學習搜索,而只需鍵入我的意圖就能回憶起來。但是,Recall 的有趣之處在於——如果你注意到它,它不僅會返回到之前的頁面,而且由於語義索引的存在,我可以調用此時此刻的內容,因此這種能力需要大量的邊緣計算。
另一個引人入勝的地方是,我喜歡的一個演示是,你可以在玩《使命召喚》時,使用NPU(全部45個TOPS),而不會因為玩遊戲而損壞電池,這種能力讓操作系統知道如何合理使用所有晶片和系統,我認為這將是我們的真正突破。
Ben Thompson:要示範這一點很容易,你在Surface PC 上示範的繪圖和增強繪圖功能就非常酷。一個永恆的問題是,Android 遇到了與Windows 之前同樣的問題——是的,你為這些AI PC定義了規格,但你如何提供一致的體驗呢?
Satya Nadella:這是一個很好的問題,Ben。這一直是我們生態系統的難題之一。坦白說,我認為我們都在學習如何真正做好作業系統——坦白說,這是晶片的問題。
例如我們與高通合作時,需要很多工作來確保他們的晶片達到最佳狀態。現在,英特爾、AMD都在做類似的事情,這非常好——如果我用雲中的情況做類比,我很高興看到一些對晶片非常了解的頂尖人士將他們的精力投入到構建出色的產品中。
Ben Thompson:當你處於挑戰者的位置,而不是處於領導地位時,你會覺得更容易推動各方朝正確的方向前進?
Satya Nadella:我想是的。這都是競爭的結果,在競爭中我們會更強大、更有紀律,當你有東西要去贏得時,就會更嚴格地執行,因此,這很好,所以我們有最好的晶片創新。不知道你有沒有註意到OEM的創新…
Ben Thompson:之後我就去看看。
Satya Nadella:你應該去看看。戴爾、惠普、三星、宏碁、聯想都參與了。順便說一句,Surface 定下了基調,但這並不是說Surface 定下基調後就沒人跟進了,坦率地說,我們能把所有的東西整合在一起,這實際上是對生態系統的一種證明,也是對領導力的一種證明,其他硬體廠商會想,讓我們來試試,就是它了,這些東西十年一遇,一代一遇。
但我認為,即使追溯到30 年前,就在這片土地上,我們推出了Windows '95。你可以說,「哦,那是Windows 的鼎盛時期」——但你知道嗎,即使是在Windows 的鼎盛時期,我們也忘了一樣東西,那就是網路。就在那個十二月,我們推出了SR-1,也就是瀏覽器。然而,在AI時代,我感覺從結構上我們更加完善了,我們有更多的機會可以贏得勝利,整個生態系統也與我們一同創新。
Ben Thompson:有一個問題。你一直把人工智慧稱為平台機會。我有一個問題,甚至在你做介紹的時候,我就在準備這個問題,那就是平台機會在多大程度上可以與硬體無關,沒有模式轉變,無論是進入市場還是完全揭示這些功能?
在這方面,這次演講很有意思,因為它非常具體,「你看,這讓Windows 變得更好了,你可以透過購買裝置來獲得這些功能」。我曾經寫過一篇文章,說我認為你的一個偉大勝利就是基本上取消了Windows 在微軟中的中心地位。當然,它對你來說很重要,但它不會成為一切的中心。你是否有能力以前所未有的方式實現全面發展? Windows 對你們未來的驅動力有多重要?它對實現這一平台機會是否至關重要,還是說你仍然可以在iOS 或Android 上獲得這一機會?
Satya Nadella: 首先,我的做法都是基於當今世界的現狀,而不是憑空想像。其次,我希望我們能同時把我們的每一層東西整合到一個有凝聚力的架構中,以滿足開發者和終端使用者的利益。
Ben Thompson:在我離開微軟的時候,我想要一份關於Windows 的備忘錄,時機剛好,我就寫了這篇文章。我當時覺得這太瘋狂了,但現在看來更有意義。
Satya Nadella:因為在某種程度上,我坦白說,我覺得我們必須真正確保為這兩億多台已售出的設備做最好的工作。但這並不意味著其他已售出的10 億台設備不重要。對於其他十億台設備,我們需要進行偉大的創新,這一點我稍後再談,但首先讓我們對2 億Windows 用戶說,我們能透過這次平台轉變為他們帶來什麼神奇的東西?這就是從晶片到體驗再到第三方開發者——順便說一句,這並不是孤立的,Windows 本身並不獨立。
我不知道你是否注意到了,但今天有一件事超級關鍵:採取邊緣人工智慧。有兩個挑戰──怎麼確保隱私,怎麼確保安全?如果你的分類器無法根據過去一小時內發生的所有對抗性攻擊不斷學習,就無法在前沿模型或最新模型上提供安全性,而這將在雲端完成。因此,我希望能夠呼叫雲端服務。這有點像Windows Defender,如果你沒有連接到雲端,你如何擁有Windows Defender?人工智慧安全也是一樣。所以,你希望雲端做它擅長的事,你希望客戶端做它擅長的事,我認為這才是關鍵。
另一件有趣的事情是,我對Copilot Runtime 感到非常興奮。對我來說,我想要一個真正的命名空間——順便說一句,WebNN 這東西太酷了,我可以寫一些JavaScript 並使用WebNN 獲取一個模型,然後讓NPU 在本地運行。我可以訪問GAP.com 或任何網站,現在我可以開始添加人工智慧功能,並在本地卸載人工智慧。我認為,雲端運算、網路和邊緣技術的結合是一種具有凝聚力的想法。
事實上,這讓我們在為Android 建立系統時佔盡先機。事實上,在明天的Build 大會上,你會聽到我們談論的一件事,我很興奮,那就是使用Phi,對嗎?現在,作為開發者,你可以在Azure AI雲端上使用Phi作為託管模型服務,你可以使用現有的晶片技術,基本上是Project Silica,這在Windows上已經存在,或者你可以將其封裝到你的應用程式中,然後在Android和iOS上使用。這就是我們打算推進的方向。
Ben Thompson:我們原本不打算多談Windows。我有些更大的想法,不過這次演示確實非常引人注目,足以讓人以全新的視角重新思考這個領域。
Satya Nadella:我們會讓你回到Windows 上的,Ben。
Ben Thompson:我對Windows 沒有任何障礙,我只是討厭改變!
Ben Thompson:微軟似乎是一家更團結的公司,我之前提到過這一點,當你去拜訪客戶時,知道他們背後有一家團結一致的公司的支持,這一點有多重要?
Satya Nadella: 你是說在微軟內部?
Ben Thompson:不,要面對外部客戶,例如大企業、大公司。
Satya Nadella:我認為,客戶對我們的期望是,第一,既是,我會說,我非常非常關注的一件事。因為我們是一家公司,所有這些部分都在一起,整合很重要,但每一層也必須獨立存在。
因此,對我來說,我對微軟的看法是,是的,我們最終並不像一個企業集團,我們必須有一個真正的論點,那就是架構的凝聚力。客戶關心我們,關心我們帶來的整合價值,但他們也非常關心每件事情是否具有競爭力。因此,是的,客戶關心這一點,我們內部也必須堅持這一點。事實上,我們的最佳狀態不只是整合,還必須是整合加上堆疊每一層的競爭力。
Ben Thompson:那麼,當你談到「一個微軟」的整合時,你如何解決與OpenAI 合作的問題?對此的擔憂是否有增加?比如說,“微軟很不錯,你們都在朝著正確的方向前進,但這裡似乎存在著一種依賴關係,我們不確定你們是否能控制它,這意味著我們也無法控制它”,這些對話進行得如何?
Satya Nadella:對我們來說,我認為與OpenAI 的合作關係就像當年與英特爾的合作關係,或者在我們構建SQL 時與SAP 的合作關係一樣,因為它既定義了行業,也定義了微軟,所以我們對這種合作關係非常投入。這是一個簡單的邏輯。
Ben Thompson:誰擁有算力,誰就能主宰世界?
Satya Nadella:沒錯。早在2019 年,我們就下了一個非常規的賭注,當時我們覺得,也許應該投入大量的算力,因為這是OpenAI 比其他任何公司(甚至包括微軟內部人員)都更有信心的事情,所以我們才下了這個賭注,而且在過去的五年裡,這個賭註一直在發揮作用、我一直專注於確保未來五年的合作關係,正如你所知——事實上,這是雙方成功的關鍵時期,長期穩定來自於持續的雙贏,至少我是這麼做的。
我認為,對他們來說,我們提供基礎設施,他們是模型建構者。他們建立應用程序,我們建立應用程序,第三方建立應用程序,如此循環往復。競爭是會有的,也會有一些完全垂直整合的競爭。垂直整合的效果很好。你必須保持開放的心態,有時合作是唯一的出路。
Ben Thompson:你提到OpenAI在運算方面有信念,而這也是微軟肯定會倚重的,考慮到谷歌在模型,尤其是基礎設施方面的領先優勢,人工智慧領域是否或是否應該有一種反谷歌的聯盟?我們是否看到這種聯盟的出現,不僅是微軟和OpenAI,還有可能是蘋果?
Satya Nadella:我看著它說,聽著,我認為總有一些人可以進行垂直整合。我總是回過頭來看,有蓋茲/格羅夫模式,也有蘋果模式,或許還有新的Google模式,這就是垂直整合模式。我認為這兩種模式都有可取之處。
從長遠來看,我更相信橫向專業化。就拿晶片來說,英偉達執行長黃仁勳(Jensen Huang)坐在那裡,非常積極地執行著令人難以置信的路線圖。今天,你猜怎麼著?他需要確保領先的人工智慧模型是在英偉達晶片上訓練出來的。
你猜怎麼著?谷歌不是在英偉達晶片上訓練出來的,谷歌銷售英偉達晶片驅動的算力,但谷歌的模型是在TPU上訓練出來的。我想黃仁勳也會注意到這一點。 AMD執行長蘇姿豐正在進行創新。我們正在製造自己的晶片。
因此,每個人都會想要進行晶片創新和模型創新。 OpenAI、Meta與Llama、Mistral、所有這些小型語言模型,正在進行大量的工作。
無論如何,我們的任何應用,例如Copilot,絕對會使用GPT-4o,並與Phi 和其他應用混合使用。因此,我認為任何企業,他們最感興趣的都是模型即服務(MAAS, model-as-a-service)。因此,我認為這將是一個更加多樣化的市場,至少我的歷史教訓是,贏者通吃的情況非常少見,我們需要非常清楚這一點,並確保你在這種情況下做好準備。但在其它情況下,我們需要採取廣泛的平台策略。
Ben Thompson:這當然有道理,你說的是模型商品化的想法。微軟從Inflection AI 公司聘請了許多人才,看來你們要確保自己提供的模型具有多元性。但如果模型將被商品化,為什麼雲端運算的動態會與過去12、15 年有什麼不同呢?這會有什麼新變化嗎?
Satya Nadella:我認為這是一個非常好的觀點。我認為超大規模企業在這方面具有根本性的結構優勢,從某種意義上說,如果你說五年後的世界更需要什麼,我會說超大規模運算公用設施隨處可見。如果你仔細思考一下,我認為經濟成長的新公式與以往一樣清晰,那就是你需要更多的再生能源、更好的電網和更好的算力,如果你擁有了這些,那麼經濟的其他各個領域都能真正從這兩件事中受益。任何一個國家、任何一個社區,如果能在效率上達到最佳前沿,就能在經濟成長中占得先機、如虎添翼。因此,如果你考慮到這高層次的前提,那麼絕對是這樣。
Ben Thompson:但競爭態勢呢?因為Amazon是最早進入雲端運算領域,他們基本上囊括了所有SaaS企業的客戶。微軟與其企業客戶群一起轉向雲端。而Google則在說,“來,我們的雲端是最棒的,試試我們的服務”,但他們卻處於遙遠的第三位。競爭態勢會以類似的方式發展嗎?資料引力(data gravity)會佔據主導地位嗎?也許AI是新興事物,但實際的競爭態勢是否仍…
Satya Nadella:我想我還沒有遇到至少有一家企業客戶是使用單一雲端服務的。我記得我剛開始接觸雲端運算時,每個人都會談論它,好像這會是一個贏家通吃的市場,而我總是想,我們只是在伺服器領域領先,當人們甚至說微軟贏了時,我不太明白。每一類伺服器,無論是作業系統、資料庫、網頁伺服器,或是所有這些中間層的東西,都有兩三個玩家。
因此,從根本上說,我認為這個市場肯定容得下兩家,甚至三家企業的空間,而且,收入份額,這是前微軟首席執行官Steve Ballmer經常跟我說的——收入份額與市場份額在多玩家市場中是兩碼事。
但是,我還是認為三家公司都有發展空間,亞馬遜AWS曾經經歷過六年、七年沒有競爭對手的時期,現在,競爭對手出現了,我們也來到了這個階段。我對下一階段感到非常、非常樂觀。我們並非從零開始。事實上,如果有的話,我們有一個起點,而那改變了一切。以B2C客戶為例,無論是Shopify、Spotify,或是它什麼公司。多虧了OpenAI API,以前這些客戶都不是Azure的使用者。現在,他們不僅是Azure的用戶,而且是忠實的Azure用戶,這對我們來說是一個巨大的轉折。
Ben Thompson:你們談到了你們對收入支出的可視性,那麼在這種競爭態勢下,你們是否有什麼優勢?毫無疑問,你必須投資人工智慧,但在過去7 年裡,你的資本支出相對於毛利的比例從13% 上升到26%,這是一個巨大的成長——是什麼讓你相信這將帶來回報,還是說這不重要,因為競爭態勢決定了你無論如何都要投資?
Satya Nadella:我認為你正確地指出了經濟規律,我們是一個資本支出很高的實體。大多數人關注我們的資本支出,只是因為人工智慧。但拜託,即使剔除人工智慧,我們也是一個知識密集和資本密集型企業,這是超大規模企業所需要的。如果你現在還不能每年投入500 到600 億美元的資本支出,你拿不到進入超大規模市場的門票,這是進入市場的必要條件。
但同時,這也將始終受市場狀況的限制。你的支出不能遠遠超過你的收入成長。因此,有一個絕對的調控因素,那就是,訓練計算分配的階躍函數會改變時,訓練區塊就會隨之變化,但推理最終是由需求驅動的。因此,如果把這兩者結合起來,我覺得即使有週期性的變化,調整起來也不是很難。這是一個純粹的商業管理問題,我不是為了一個季度而管理它,
Ben Thompson:你不像華爾街那麼擔心。問一個簡單的問題,因為我喜歡這個問題。比爾蓋茲說,我們高估了兩年內發生的事情,低估了十年內發生的事情。因為感覺兩年內發生了很多事,這些單位還正確嗎?
Satya Nadella:我認為這些可能都是正確的單位,以摩爾定律為例,在Epoch AI 網站上有一張漂亮的圖表,我非常喜歡,他們談到了機器學習,從1950 年開始,機器學習演算法的運行次數就一直遵循摩爾定律。它每15、16 個月翻一番,然後到了2010 年,翻了3 倍,而且我認為它的斜率實際上更陡峭,可能每六個月翻一番,甚至比這還少,這很難讓你保持頭腦清醒。每個人都說,“哦,我直到什麼是指數級增長”,相信我,生活在那個世界——
Ben Thompson:當那個指數級成長時,事情就變得完全不同了。
Satya Nadella:是的,這很難。這就是為什麼我認為人工智慧安全是一件超級重要的事情,我們必須牢記這一點,但我們也必須牢記,會有新的創新出現。那麼,如何在確保安全的前提下運用新的創新呢?這是一場截然不同的比賽。
----
以下部分為微軟CTO Kevin Scott的訪談,有刪減
主題:人工智慧平台| 人工智慧擴充| 人工智慧作為工具| 與OpenAI的合作夥伴| 規模法則| 資本支出
Ben Thompson:讓我們把時間倒退10 年左右,帶我回顧微軟從人工智慧、高效能運算或人工智慧運算,到與OpenAI 建立合作關係所走過的歷程。有沒有哪一點讓你意識到這就是你需要走的路?
Kevin Scott:是的,當然。有趣的是,我在微軟才工作了七年半多一點,十年前,我還在LinkedIn 負責工程和營運團隊,當時我們已經非常明顯地看到,人工智慧正走在一條非常有趣的新曲線上。當時的人工智慧還不是現在的生成式人工智慧,但人們透過真正複雜的統計機器學習所做的事情,以及我們在10 年前就已經從這些系統的擴展中獲得的好處,速度之快出乎我的意料。
我做這個工作的時間相對較長,所以在谷歌上市前後,我就在谷歌建立了很多機器學習系統,包括當時運行廣告拍賣的大型機器學習系統。當時,規模的重要性已經非常明顯。但是,六年前的一個相對較新的更新是,這種規模的擴大導致人工智慧模型開始表現得像平台一樣。
因此,我們開始看到,這些大型語言模型的擴展特性使得這些大型語言模型可以重複用於很多很多不同的事情,而不是專門為某一件事情建立一個模型,然後你應用了大量的擴展,而那一件特定的事情,例如廣告的點擊率(CTR)預測變得非常好。
Ben Thompson:實際上,這是我想問的問題,因為你和Satya一直在談論平台的轉變,「平台」這個詞一直在出現。
Kevin Scott: 是的。
Ben Thompson:我本來想問你這是什麼意思,但我從你的回答中聽出,你說的平台是指可推廣性。
Kevin Scott:沒錯。它是一個元件,能以非常靈活、通用的方式與你正在建立的軟體系統進行組合。因此,在人工智慧的世界裡,像微軟這樣的公司可能有上百個不同的團隊,從上到下負責數據,機器學習演算法,用於訓練機器學習的系統,部署系統的方式,以及如何從部署過程和實際使用情況中獲得回饋,並將其納入模型,以便隨著時間的推移不斷改進一切。
整個流程裡有上百個小飛輪在轉動,而非一個中央模型的訓練工作,你從中獲得的東西在你已有的大量應用中都非常有用,而且它還為構建大量以前不可能實現的新事物提供了可能性。
Ben Thompson:因此,我想再強調一下平台的概念。我從你那裡聽到的,也許我沒有從你那裡聽到,我在與你交談之前就已經想到了,但有一些平台,比如Windows 就是一個平台,這就是我們對平台的看法。你有應用程式接口,有網絡效應,這是一個雙面網絡,一邊是開發者,一邊是用戶,但也有像x86 這樣的平台。
Kevin Scott: 是的。
Ben Thompson:我認為你使用的平台一詞比較接近x86,而不是Windows,這種看法對嗎?
Kevin Scott:是的。
Ben Thompson:或許更恰當的例子是通用處理,因為當你談到從專用到通用的轉變時,這聽起來就像是從只做一件事的專用處理器到可廣泛編程的通用邏輯晶片的轉變。
Kevin Scott:是的,我認為x86 可能是一個非常恰當的對比,因為x86 的有趣之處在於它是一個通用的基礎架構,允許編寫大量軟體,而且系統、平台的功能隨著時間的推移不斷增強,因為它每隔18 個月左右就會變得更便宜,同時功能也更強大。因此,很多人都可以在它的基礎上進行開發,從而實現能力的快速提升。
x86 和作業系統、PC製造商以及在其基礎上建立應用程式的人員之間有著明確的界限。有時,微軟同時開發應用程式和作業系統,所以兩者都有一點,但人們在Wintel 平台上做事情的可能性是無限的,這與微軟預測的所有有用的東西無關,人們可以相信這是一個有趣的平台,因為你有一個叫做摩爾定律的指數,最終會導致這個東西完全無所不在。
Ben Thompson:我們將討論摩爾定律,我知道這是你和Satya經常討論的問題,也是你想討論的問題,但你提到了Wintel。 x86 的結果是,到了後來,你有了Windows,有了Linux,最後甚至有了Mac 或其他,所以你確實有了層級,但總的來說,從開發者的角度來看,他們關心的是作業系統層。
對於人工智慧模型,我的問題是,真正的機會會在哪裡出現?讓我們倒回去。我認為,英偉達現在的一個有趣之處在於,很明顯,我們有很多理由出於世俗原因看好英偉達,但我認為有一個結構性原因值得關注,那就是CUDA,這是我們都很專業的地方,我們為這個做框架,為那個做框架。 LLM 將其泛化,而現在,實際上有更高層次的事情正在發生,你不需要知道CUDA 就能建立人工智慧應用。但這是實際的一層,還是會有一個位於其上的作業系統?
Kevin Scott:很難說。可能不是作業系統的意義上的——
Ben Thompson:雖然不是傳統的作業系統,但也有這種背景。
Kevin Scott: 是的。我認為這就是電腦的發展史,人們總是不斷地提升抽象程度。
Ben Thompson:由於採用了新模式,我們正在重新編排。
Kevin Scott:是的,百分之百,我認為這完全正確。所以,我不知道抽象程度到底會是怎樣,但現在已經非常不同了。我們現在有了及時的工程師,他們只需用自然語言發出指令,例如你希望系統做什麼或不做什麼,就能哄騙這些系統去做非常複雜的事情。我們正在開發各種各樣的工具,用來找出,你必須在大型語言模型的上下文視窗中塞進一堆東西,才能讓它做你想做的事情。我們在微軟研究院建立的GraphRAG 系統就是這樣一個工具,它可以進行圖結構化的上下文合成,這樣你就可以非常有效率地使用上下文,而不會向模型發送不必要的標記,這是件好事,因為發送的標記越多,成本就越高,延遲也就越高,而你只需要獲取它需要的信息,就可以回答你需要回答的問題,或者完成你需要完成的任務。
所以,我不知道抽象的全部內容是什麼,所以我們為什麼要談論Copilot 堆疊這個概念,我們甚至還沒搞清楚Copilot 堆疊中的所有內容到底是什麼。在過去的幾年裡,我們已經弄清楚了部署現代應用程式所必須具備的大量要素,但即使模型變得越來越強大,抽象程度也會越來越高。回到你對Windows 的比喻,Windows 的第一版並沒有DirectX,因為當時的圖形處理功能還不夠強大,根本無法考慮使用著色器。
Ben Thompson:不是沒有人創造它,而是還沒有人想到它。
Kevin Scott對,所以還有很多事情要做。但我認為,你至少會從我們這裡看到的是,除了強大的前沿模型之外,你還需要具備哪些元件,才能建立這些真正豐富、有趣的新應用。
Ben Thompson:是Copilot 堆疊嗎?從長遠來看,在我看來,如果你是一個開發者,如果你是一個在1975 年和1985 年和1995 年考慮建立電腦應用程式的開發者,你的決策範圍是完全不同的。在某些方面,你要做什麼是顯而易見的,那麼你對這種演變將如何發生有何看法?
Kevin Scott:嗯,所以我認為,我們現在的觀點是,當所有這些平台出現時,這些抽象概念都會分層。因此,在抽象堆疊的底部,你有一個大型的基礎模型,然後你有資料集和檢索機制,以一種非常謹慎的方式,確保模型能夠存取它需要存取的信息,以完成任務。在此基礎上,你還會有一堆正在進行協調的東西,因此你可能需要跨多個模型進行操作,以完成你想要完成的任務,而出於成本、品質或資料隱私的原因,你可能需要這樣做。
在未來的一年裡,我們真正希望看到的事情之一是將推理發生的地方分解。如果你能做到這一點,我認為你會希望盡可能多的推理、盡可能多的人工智慧都在設備上進行,只有當設備上的能力或容量耗盡時,你才需要呼叫雲端更強大、更複雜的東西。
Kevin Scott: 我認為,我們現在達成的共識和你一樣,隨著各種平台的出現,都會經歷一系列抽象層的疊加。在抽象堆疊的底部,有一個大型基礎模型,然後有資料集和檢索機制,確保模型能夠存取完成任務所需的資訊。在此基礎上,我們有一系列工具來進行編排,可能需要跨多個模型操作,以滿足成本、品質或資料隱私的要求。
在未來的一年裡,我們期待看到推理發生的位置更加多元。一部分推理可以在設備上進行,如PC或手機,如果可能的話,我們應盡可能在設備上進行推理。只有當設備能力或容量不足時,才需要呼叫雲端更強大、更複雜的資源。
Ben Thompson:在這個過程中,最重要的是編排代理,它首先要決定是在本地執行還是雲端執行。如果選擇雲端執行,我們還需要考慮如何最佳化提示或請求,以減少標記數量,提高效率。就像你之前提到的Windows上的Phi模型,其實最重要的部分不僅在於Windows上的協作繪圖,更在於透過雲端為Copilot降低成本。
Kevin Scott: 我認為這是一個重要的問題,而且抽象層次也越來越多。關鍵在於,如果你正在打造一個真正有用且目標用戶非常廣泛的產品,那麼你需要盡可能地將它分發給盡可能多的人。因此,成本(COGS)絕對是一個需要考慮的因素。所以,如果有一些方法能讓你以高品質產品的形式提供給他們,例如透過雲端卸載到一個小模型來提供那個應用程序,那就太好了。絕對應該這樣做。
Ben Thompson:我記得你之前提到我們不必太擔心成本(COGS),因為一切都會變得非常便宜。
Kevin Scott: 會的。
Kevin Scott:我認為目前整個領域的有趣之處在於,前沿模型的能力確實呈指數級增長,而且我不認為我們已經接近邊際收益遞減的地步。
Ben Thompson:如果我們遇到了規模擴張的阻礙,會是什麼?是數據還是什麼?
Kevin Scott:我覺得數據已經很難了。我認為,就某些前沿模型的規模而言,每個人都會遇到這樣的問題,要有足夠的數據來支持它是一個挑戰。我的意思是,Phi 模型的一大創新之處在於,你實際上是用一個前沿模型來產生...
Ben Thompson:合成數據。
Kevin Scott:我們這麼做已經很多年了,我們曾經為非生成模型這麼做過。因此,如果你想建立一個電腦視覺分類器模型,並想確保它經過訓練後不會從底層訓練數據集中反映出偏差,你可以使用生成模型來生成一大堆合成數據,以獲得公平的訓練數據分佈,從而獲得你想要的模型性能。因此,我認為產生合成資料是人們建立小型模型和大型模型的一種日益強大的方法。特別是對於強化學習來說,我認為這真的很有價值。
Ben Thompson:是什麼推動了這一點?你提到了基礎模型,你在台上與山姆·奧特曼(Sam Altman)打了個比方,就像我們從較小的動物開始,什麼是較小的動物?
Kevin Scott:鯊魚。先是鯊魚,然後是虎鯨,現在藍鯨是一個尚未命名的訓練模型,顯然將在某個時候發布。那麼答案是否是,很多效率和很多擴展能力都在較小的模型中,因為這些大模型可以產生所有合成數據,可以提供所有——你可以優化,但這並不能回答基礎模型的問題。你認為它們的擴展能力如何?
Kevin Scott:要完全回答這個問題,又不透露一大堆我不想透露的東西,有點困難。
Ben Thompson:我想這就夠了。
Kevin Scott:但是,我認為合成資料對於訓練大型基礎模型也很有用,所以試想一下,如果你想訓練一個基礎模型,讓它非常、非常、非常擅長編碼,有很多方法可以產生具有特定特徵的合成程序,因為程式是這些確定性實體,你可以合成生成一些東西,然後透過類似模型檢查器的東西運行它,以證明"它是否可編譯?"、"它是否產生了一組輸出?"、"它是否是一個有效的輸入,你可以把它放到訓練過程中? "。透過在這些領域產生合成數據,你可以為任何模型設計出訓練課程,或至少部分訓練課程,在這些領域中,生成形式良好的訓練輸入是非常直接的,可以讓模型在你試圖訓練的特定課程中表現得更好。但這並不意味著所有數據都可以是合成的。
Ben Thompson:你之前舉例說明了做點擊率預測、廣告定位的模型,你說的是編碼。所有這些的好處是,雖然你在製作一個機率模型,但你使用的數據是確定的,對嗎?
Kevin Scott:正確。
Ben Thompson:因此,當你達到這種可通用的功能時,是什麼讓你有信心這種可通用性可以擴展到一些領域,在這些領域中,幾乎就像一個極端,你有純粹的創造力,在那裡沒有錯誤的答案,在那裡工作得很好,還有另一個極端,你在一個具有驗證功能的領域中工作,這樣你實際上可以以並行的方式讓人工智能發揮作用,並得到最好的答案,因為你可以給它打分數。但還有一個中間地帶,我認為人們——我稱之為"懶惰功能"——希望人工智慧為他們完成工作,但現實問題是,並不一定有一個評分員。那麼,人工智慧是否能通用於此領域呢?
Kevin Scott: 是的,我認為我們將能夠泛化很多事情。在Phi論文中,我們提到的一件事,標題大概是《教科書就是你需要的全部》,這也讓我很有信心。我們有能力對人類專家進行相當有限的課程培訓,使他們能夠做非常專業的事情。
就像我作為電腦科學家接受訓練的方式一樣,我閱讀了大量的電腦科學論文和教科書,並做了大量的問題集,不斷地練習、練習、再練習。經過一段時間,我夠稱職,可以在世界上做一些有用的事情了。所以,這讓我有信心,我們將能夠找出如何為這些模型產生足夠的課程,並找到一個學習函數,讓我們建立出具有相當強大認知能力的東西。
現在,我不知道的事情是——這將是一個我們很快就會弄清楚的值得關注問題——我和一些人打賭,我想像一台計算機會在數學家之前證明“黎曼猜想”。黎曼猜想是數學中一個有著百年歷史的難題之一,由希爾伯特(David Hilbert)在19世紀末或20世紀初提出,大家一直在努力解決這個問題。黎曼猜想基本上是關於素數分佈的一個陳述,這是一個非常困難的問題。這是一個容易陳述的問題,但一直有一些極其聰明的人在努力解決它很長時間了。所以,我實際上相信這是一個可能非常複雜的問題,其證明將會令人難以置信。我的預測是,一台電腦將在人類之前解決這個問題,並且可能涉及人類的協助。它不會是完全自主的。
Ben Thompson:你在今天的主題演講中說,你一輩子都熱愛工具。
Kevin Scott: 是的。
Ben Thompson:人工智慧是否仍將是一種工具?
Kevin Scott:是的,我想是的。
Ben Thompson:為什麼會這樣?為什麼它不會是一種更自主的東西?
Kevin Scott:我們都不知道,但我認為我們已經掌握了很多關於人類想要什麼的線索。自1997 年「深藍」(Deep Blue)在西洋棋上擊敗Gary Kasparov以來,還沒有一個人類在下棋方面比電腦更勝一籌,但人們卻不關心兩台電腦在西洋棋上的對弈,大家關心的是人類在西洋棋上的對弈。
Ben Thompson:那麼,有沒有一種觀點認為,也許人工智慧會接管一切,但我們根本不會關心,因為我們只會關心其他人類?
Kevin Scott:我不認為人工智慧會取代任何東西,我認為它將繼續成為我們用來為彼此製造東西、為彼此服務、為彼此做有價值事情的工具。
我認為我們所追求的是意義和聯繫,我們希望為彼此做事,我認為我們有巨大的機會利用這些工具,以略有不同的方式做更多這些事情。但我並不擔心我們會因此而失去位置感或目標感。
Ben Thompson:在你成長的維吉尼亞州,人工智慧將如何改善生活?
Kevin Scott:今天早上我在台上講了我媽媽的故事,我想她去年秋天在健康方面遇到了很大的困難。
許多地方的人口都在減少。中國,義大利,日本,德國,人口都在減少。你可以去看看很多地方的人口何時達到高峰。我認為法國將在2030年代初的某個時候達到頂峰,
所以我們未來將生活在一個人口減少的世界裡,所以為了保持我們的生活水平,我們需要更少的人完成工作,隨著時間的推移,為了更好的生活水平,必須要很大的生產力提升。一定有某種辦法,用更少的人完成所有需要完成的事。
在美國農村的一些地方,有煤礦中的金絲雀,我們都將在某個時刻面臨這個問題,那裡沒有醫生排隊照顧那裡迅速老化的人口。因此,我認為人工智慧在這些地方的應用方式是,它能讓人們公平地獲得所有你需要獲得的東西,從而擁有尊嚴,過上美好的生活。我知道所有這些聽起來都很抽象,都是一些遙遠的問題。
Ben Thompson:我來自威斯康辛州的一個小鎮,我很清楚你在說什麼。
Kevin Scott:是的,這是一件真實的事情,我想到了我媽媽陷入的醫療危機,我認為系統中的每個人都在盡力而為,但盡力而為仍然不夠好。我想,如果我沒有乾預,她的結果可能會大不相同。我想到那些沒有兒子可以介入的老太太,如果人工智慧可以在介入過程中發揮一些作用,讓人們對自己的醫療保健有更多的自主權,對自己的教育有更多的自主權,對自己的創業機會有更多的自主權,我認為這一定說是好事。當然也不代表我們可以完全不去考慮它的風險和弊端。
Ben Thompson:我認為總的來說,特別是在我們這個圈子裡,與許多其它技術革命不同,我們還沒有充分思考過其潛在的益處。當你談論所有這些好事時,大家通常會說,「哦,我最好也提一下安全性問題」。但如果你去問這個領域之外的人,他們會說,「哦,我們知道這些好處」——但往往忽略了這部分。就像在說,「不,等等,我們能停下來談談嗎?我們能真正深入討論一下這些好處是什麼嗎?」所以,我很欣賞你對這一點的看法。
Kevin Scott:我確實認為,至少還有一次科技革命具有這種性質,那就是印刷革命,當時有了印刷機。
Ben Thompson:教會——花了10 年、15 年時間,但他們很快就趕上了時間的大潮。
Kevin Scott:是的,實際上,時間比這更長,經歷了大約一個世紀的動盪和動亂,而最終的結果是今天的世界。如今的人類無法想像一個沒有文字、沒有書籍和資訊自由流通的世界。
Ben Thompson:我們也最終建立了一個完全重新組織的威斯特伐利亞體系。我們經歷了多年的戰爭,發生了很多事情。我們經歷了整個宗教改革的破裂,發生了很多事情?
Kevin Scott:是的,我的妻子是一位受過訓練的早期現代歐洲歷史學家,她現在是一位慈善家。印刷革命是我們家庭對話的一部分。
Ben Thompson:是不是因為你是局外人,你曾在谷歌、LinkedIn 工作過,所以你可以來到微軟說:「我不確定你是否意識到你比谷歌落後了多少,你需要在這裡做一些非常激進的事情”?
Kevin Scott:也許吧。我認為,微軟當時實際上已經意識到它被遠遠落後。
Ben Thompson:大體上,你不需要說服任何人?
Kevin Scott: 是的。問題是怎麼辦?我總是被問題吸引。
Ben Thompson:你需要一個使用才能的地方。
Kevin Scott: 沒錯,我是個工程師出身,你會注意到,大家解決問題的方式各不相同。有人擅長開始,有人擅長收尾,而很少人兩者都擅長。我選擇的工作大多是關於——就像電影《魔法保姆麥克菲》(Nanny McPhee)那樣,我不知道你是否看過。
麥克菲是一個虛構的保姆角色,我並不是說我有魔法,但她的角色是,當孩子們需要她但不想要她時,她必須留下;而當他們不再需要她但希望她留下時,她必須離開。這就是吸引我去做的事情。就像,“好吧,這是一個棘手的情況。我認為我可以幫忙解決這個特定的問題。”
Ben Thompson:既然微軟在某些方面落後了,你是否覺得這是一個挑戰和機會?
Kevin Scott:這並不是說整個公司落後了——微軟很好,雲端運算和其他業務很強。這是關於在人工智慧方面的落後,人工智慧在2017 年並沒有那麼明顯的重要性。
Ben Thompson:這是否與其產品組合有關?例如,如果必應的規模更大,他們的廣告業務也更多,那麼他們的廣告收入就會更多——還是疏忽所致?是什麼驅動了他們?
Kevin Scott:很難說。我認為現在投資人工智慧有一點非常明確,那就是你必須對自己的投資方式保持嚴謹。這不是一個你想讓千花齊放的領域,你要把資源分散到不同的賭注上,而這一切最終都會帶來巨大的收益。
因此,我認為微軟在人工智慧方面投入了大量資金,並有大量人員從事相關工作,但人工智慧確實被分散到了許多不同的領域,而在企業中,讓人工智慧分散到許多不同的領域實在是太昂貴、太複雜了。我認為這是人們至今仍在苦苦掙扎的問題。
Ben Thompson:那麼,你是如何說服微軟的:「你看,你花了這麼多錢,我們明白了。你們有微軟研究院,有XYZ。實際上,你們只需要做的是,你們的核心能力,微軟,是花錢的能力,而OpenAI 這個組織沒有錢,但有能力建立需要做的事情,我們必須一起合作」?
Kevin Scott:我想對這種說法提出質疑。我不認為我們的核心能力是花錢。如果從公司的DNA 來看,我認為我們的核心能力是建立一個平台,讓其他人可以在上面建立他們的業務和產品。
Ben Thompson:很公平。這樣一來,你花的錢就少了很多。
Kevin Scott:是的,我認為在成功方面確實如此。因此,我們的論點基本上與迄今為止的論點幾乎一模一樣。這就像,我們現在看到的技術趨勢是,它表現得像一個平台,而平臺本身將真正受益於專注,並對什麼是你想投入資金的東西有自己的觀點"。不僅僅是你的資金,還有你花在開發這個新平台上的所有機會成本。
Ben Thompson:雖然微軟一直預設「建置而非購買」。在這種情況下,問題不是“購買”,而是"建構與合作",這是一個更岌岌可危的立場。是什麼證據或是什麼時刻說服了董事會說「我們沒有時間追趕了」?
Kevin Scott: 我認為大約是在2019年我們與OpenAI達成第一筆合作的時候,那時我們對規模化規律有了相當清晰的認識。我們意識到必須立即行動,而有兩三個選擇。在我看來,以及Satya的判斷中,這是讓我們迅速啟動並進入市場最快的方式。
Ben Thompson:但風險在於,你將許多控制權交給了一個你無法完全掌控的實體。作為這項主張的主要支持者,2013年11月你感受到的壓力有多大?
Kevin Scott: 那確實是有壓力的。但我要重申的是,我認為微軟作為一個平台供應商,多年來與合作夥伴一起建立複雜事物方面做得相當出色。這不像PC革命完全由微軟完成,而是微軟與英特爾、英偉達以及整個OEM生態系統共同合作的成果。即使是Azure的成功,也離不開我們與其它基礎設施供應商如Databricks和Snowflake的合作,以及眾多運行在我們雲端和其它雲端的服務。因此,在當今時代,如果你真的在談論這些超大規模的平台,我們必須非常擅長合作。不能有這樣的想法:我要自己包辦一切,這太難了。
Ben Thompson:回到抽象的問題,在這種情況下,你是否有信心,廣義地說,這讓你夜不能寐,那麼除了誰擁有算力誰就能統治世界這一事實之外,模型最終會被商品化嗎?如果到了緊要關頭,當然,你必須做一些工作,但Office 應用程式可以運行任何模型,不一定要是OpenAI 模型。
Kevin Scott:我認為這與商品化關係不大,更多的是與我們現在正在做的兩個步驟有關,這就好比你有一個正在快速發展的前沿領域,我認為如果你想成為一個現代人工智慧雲,或者你想建立現代人工智慧應用,你最好能夠存取前沿模型,這已經是板上釘釘的事情了。我認為,OpenAI 在建立這些前沿模型和很好地利用計算資源方面做得非常出色,隨著前沿模型的推進,你將擁有一個由非常非常聰明的人組成的生態系統,他們正在想辦法優化其中的各個部分。
Ben Thompson:你覺得Phi 是對你的策略的真正驗證嗎?你從什麼都做不了到建立起最好的小型模型,基本上只花了幾年時間?
Kevin Scott:是的,我認為Phi的有趣之處並不在於它取代了什麼,而是它與我們已經擁有的東西結合得很好,因為你可以用前沿模型做很多事情,我不希望任何人感到困惑。我認為,我今天在構建大會上所傳達的信息有一半是這樣的:"你真的需要考慮這個前沿模型的發展速度有多快,一個真正的錯誤就是過於沉迷於大家都在做的線性優化"。
Ben Thompson:科技界是否已經忘記了在摩爾定律的基礎上進行建構的感覺?如果你回到上世紀八九十年代,你需要花上一段時間來了解——你需要構建一個低效的應用程序,因為你想優化用戶體驗的前端,而你只是相信英特爾會解決你所有的問題。
Kevin Scott: 是的,你說得對。
Ben Thompson:是不是有些方面被遺忘了?
Kevin Scott: 我認為是的。
Ben Thompson:因為每個人都抱怨程式臃腫,但實際上有時候你需要它,因為效能問題會得到解決。
Kevin Scott: 是的,你可以在之後解決臃腫的問題。
Ben Thompson:沒錯。
Kevin Scott: 你不希望有無意義的臃腫,但你也不想…
Ben Thompson:你不想為了消除它而過度優化。
Kevin Scott: 回想我職業生涯的早期,大家曾經以此為傲。你編寫這些程序,然後深入你的關鍵路徑函數的內部循環,編寫大量的…
Ben Thompson:就像,好的,你從0.0002毫秒優化到0.0001毫秒了。
Kevin Scott: 確實有一段時間,這是很重要的,是區分有用之物和廢物的關鍵。但因為你有了摩爾定律,這個指數級改進的過程,如果你沒有意識到這一點,你所做的一切可能只是在為某事的內部循環編寫彙編語言,而錯過了寫出更強大軟體的所有機會。
我在讀研究所時是一個編譯器優化的人。我有個朋友,托德·普羅布斯廷(Todd Proebsting),他是亞利桑那大學的教授,曾在微軟研究院工作過一段時間。他提出了普羅布斯廷定律(Proebsting'Law),這是對摩爾定律的一種戲謔。普羅布斯汀定律說,編譯器最佳化研究人員使電腦程式的效能翻倍的工作每18年進行一次。
他說得沒錯。這也是我決定不再做編譯器優化人員的原因之一,因為你可以花六個月的時間去研究非常非常複雜的東西,並將基準提高4%,而在同一時間內,材料科學家和架構師會將這個東西的速度提高一倍。那你在做什麼?與其試圖優化舊的慢速系統,不如想辦法利用即將到來的新的快速系統。
Ben Thompson:是什麼驅動了這一切?你剛才談到了即將推出的新機型,但你也提到了GPT-4 的情況,GPT-4o,成本降低了12 倍,速度提高了6 倍。現在,我認為如果你真正深入研究,GPT-4o 在某些方面不如GPT-4 好,但它在其他一些方面卻很好,而且已經進行了優化。這僅僅是模型的優化嗎?這是一種解決方案和推論,你能找出新的方法來解決這個問題嗎?這其中有哪些驅動因素?
Kevin Scott:是的,所以我認為你有兩個基本要點。其一是硬體正在變得越來越好,英偉達做了大量工作,AMD現在也做得很好,微軟的自研晶片也在進行中,還有很多公司在各自的環境中構建自己的晶片、儘管更小的晶體管越來越便宜,並為通用計算提供了更大的能量,但至少在目前,我們在如何將這些晶片用於人工智能這種令人尷尬的並行應用方面,仍有足夠的創新空間。
Ben Thompson:嗯,總是有更多的創新空間。即使不能從晶體管方面完全獲取,也可以在網路等其它方面進行創新。
Kevin Scott: 是的。
Ben Thompson:“我們將從整體上重新創造它”,這是《點球成金》(Moneyball)中一句話。
Kevin Scott: 我們從硬體方面獲得了很大的性價比優勢,但更為關鍵的是,我們在創新上投入了大量的精力。這包括如何優化整個系統軟體堆疊,以及如何利用新型的資料格式。目前,許多工作都轉向使用更快的平行資料處理,例如採用FP8而不是對模型進行全部的32位元算術運算,這有助於更有效率地使用內存,完成更多的操作。
Ben Thompson:因此,有一種反直覺的說法是,你使用的精確度較低,在某種程度上比較笨,而這實際上是更好的答案,因為價格和速度更重要?
Kevin Scott:到目前為止,精度降低並不會使任何東西變笨,只是你看神經網路中的所有激活,它們都非常非常稀疏。神經網路很大,但每個激活訊號都不多。
Ben Thompson:讓我印象深刻的是,這種平行方法的最大特點,就是它的抽象程度無所不在。在我看來,最具吸引力的應用是那些能將並行性發揮到極致的應用,這也是一種不要糾結於任何一種計算精度的應用。如果代價是並行性的降低,你就需要更多,更多,更多。
Kevin Scott:沒錯,所以硬體越來越好,我們的技術也越來越好,例如訓練技術和建構推理引擎的技術比硬體好得更快。
Ben Thompson:你如何對投入的資金產生信心?這可能是人們的疑問。例如,哦,你會說,"好吧,我們對我們的收入有信心",那信心是什麼?是Office Copilot 的收入嗎?是API 使用量嗎?是過度投資好,還是沒有足夠的運算能力和推理能力好?
Kevin Scott:我們現在看到的情況是,運算能力過剩的弊端相對較小,這只是理論上的,因為現實情況是我們沒有過剩的運算能力。現在人們對所有這些人工智慧產品和服務的需求都非常高,我們只是在做一些瘋狂的事情,以確保我們有足夠的運算能力,並對整個系統進行足夠的優化,從而滿足我們所看到的需求。
展望未來,這裡有大量的經濟機會。我認為,API 業務從無到有,從小到大,速度之快前所未有。 Copilot 業務具有巨大的吸引力。 Copilot的用戶參與度是我們在任何新的Microsoft 365辦公室產品中見過的最高水平,也許是有史以來最高的。所以,很多時候,你會去銷售一個新的企業產品,然後需要相當長的時間讓產品擴散到組織中。
Ben Thompson:聽起來,如果你們能在資本支出上花更多錢,你們一定會這麼做,難道你們只是受到供應的限制?
Kevin Scott:是的,但如果我能在CapEx上投入更多...
Ben Thompson:資料中心的能源也是一個考慮因素。
Ben Thompson:你在需求上沒有顧慮嗎?
Kevin Scott: 不,現在沒有。
(硬AI)