川普上任第一天就宣佈了他的AI基礎設施計畫,還取了個花哨的名字:“StarGate星門計畫“”,這是OpenAI和軟銀以及Oracle的合資企業,重點是“基礎設施建設”。
說白了,這就是懂王拿投靠過來的孫正義的投資(還記得之前孫正義在海湖山莊被宣佈要投資米國n個億嗎)去建設一個算力中心,OpenAI確實有這個需求,因為之前就爆出OpenAI算力不夠,這個新算力基礎設施絕對是OpenAI的燃眉之急。Oracle入局也可以理解,可以搭上AI時代快車, 否則感覺就要邊緣化了。
值得注意的是,這三位在懂王的就職典禮上都只能坐在台下觀眾席,沒有出現在主席台。(主席台就坐的科技圈大佬是Google CEO劈柴,Meta CEO小扎,Amazon創始人貝索斯,當然還有馬斯克,微軟CEO似乎不在台上,黃仁勳大家都知道,在中國大陸和員工過年呢)
這個星門計畫的出現很有點意思的,首先是馬斯克並不參與其中,而主角之一還是和馬斯克有大仇的OpenAI Sam Altman。 馬斯克隨後就發推諷刺軟銀根本沒錢(最新消息是Sam Altman回應他們開工了,希望馬斯克把國家的重要事情放在首位。但還是禮貌的再補了一句他認為馬斯克是當代最鼓舞人心的企業家)
所以這裡可以看到,懂王和馬斯克的立場並非全部一致,之前有取消電動車補貼,這裡是拋開馬斯克去搞了算力中心 - 當然,馬斯克也不會摻合這個,他自己的xAI用了最快的速度就搭建了世界上最大的算力中心之一。
關於這個計畫,其實比馬斯克更值得關注的,則是微軟CEO薩提亞的表態。微軟在這個事情裡就很微妙了。之前微軟和OpenAI呈現的是獨家繫結的狀態, 那麼這一次,完全沒有微軟的事。那麼,微軟對OpenAI的控制力還有多少, 以後OpenAI獨立單飛微軟能攔得住不?
更嚴重的是,微軟的股價之前很多是繫結了AI-繫結了OpenAI的溢價,OpenAI這個事情從長遠來說是否會影響微軟的市值?薩提亞的訪談顯然必須表現得雲淡風輕,但實際上呢?
在AI這個事情上,城主反而是更看好Google的內部路線,雖然之前被OpenAI打得找不到北,但最新的Gemini2.0發佈找到了感覺,算是走上正軌了。反觀微軟,AI深度繫結OpenAI,雖然開始吃了一波紅利,但也給自己綁了顆雷,萬一OpenAI不聽話了呢?到目前為止,微軟自己的AI大模型不慍不火... 之前微軟挖來DeepMind前聯創穆斯塔法來做自己的AI CEO是否也有兩手準備的打算?但已有傳聞穆斯塔法和Sam Altman沒法談到一塊去了,恐怕微軟今後要整合內外部AI能力要付出更多努力咯。
以下是今天最新的兩個訪談全文,分別是OpenAI產品負責人Kevin(算是元老面孔裡還唯一留下來幫Altman的了。)以及微軟CEO薩提亞的表態。有興趣不妨一看。
主持人:
讓我們先來看一下昨晚的重大新聞,那就是“星際之門”(Stargate)。對於那些沒有閱讀或聽到這一突發新聞的人來說,這是OpenAI、Oracle和軟銀之間的里程碑式合資企業。總金額為1000億美元,將用於開始在美國進行投資。該投資計畫的重點是基礎設施建設,用於建構人工智慧。長期來看,整體投資規模預計達到5000億美元。告訴我們,我們將從中看到的初步實際好處是什麼。
凱文:
我們看到的第一件事是,就像你說的,Sam Altman——我們的首席執行官,Larry Ellison,MASA(孫正義),還有川普總統在羅斯福房間共同宣佈這家名為Stargate的新公司。Stargate計畫在未來幾年的時間裡,在美國投入5000億美元,以建立AI基礎設施。在接下來的四年裡,已有1000億美元的投資被承諾。
歸根結底,我們所看到的一切都在表明,更強大的計算能力能夠帶來更好的模型,而更好的模型使我們能夠開發更優秀的產品,從而為全球人群解決更多的問題。我們正在深入挖掘這一領域,並將繼續在這方面投資。
我們希望通過自己的努力,確保我們擁有足夠的基礎設施和計算能力,以實現我們知道隨著模型改進後能夠做到的一切事情。這也正是這一切的意義所在。
主持人:那麼,首先的切入點是資料中心嗎?你覺得這將是它邁出的第一步嗎?
凱文:
是的,資料中心裡存放著GPU,這些GPU將用於訓練模型和運行推理,這些技術構成了我們產品的支柱。從字面上來看,我們的觀察結果是,計算能力越強,模型也就越優秀。而且我們並沒有看到這種趨勢有減弱的跡象。所以,我們希望確保擁有足夠的計算能力,以便在未來10年內開發我們認為能夠為全球每個人提供服務的產品。
主持人:你們期待在美國製造這些晶片嗎?
凱文:NVIDIA是我們的技術合作夥伴之一,微軟也是我們的技術合作夥伴之一,所以……
主持人:但OpenAI呢?曾經有一些關於晶片製造的討論。
凱文:是的,我們拭目以待。
主持人:是的。
主持人:好吧,我想進入一些真正有趣的話題,關於產品層面的事情。我想問你這個問題,但我感覺已經知道答案了——房間裡有多少人正在使用ChatGPT?
凱文:太棒了。
主持人:
今天早上有多少人使用了ChatGPT?現在又有多少人正在使用它?很棒。
你是產品主管,我想我們可以聊聊你們已宣佈或者我們聽說過的一些產品。你可以告訴我它們具體將在何時推出嗎?
凱文:這就是我們今天在這裡要做的事情。
主持人:你還想發表什麼嗎?
凱文:我的目標是來到這裡發佈一些新聞。
主持人:這正是我們在《華爾街日報》所做的事情。
凱文:我知道一件事,團隊中的工程師喜歡產品經理給出日期,所以……
主持人:這將激勵你的團隊。 把這看作是對你們團隊的激勵。
凱文:好的,酷。
主持人:所以,看看,這將會是一個有趣的遊戲。
凱文:你真的在幫我這裡。這將會是一個有趣的遊戲,至少對我來說。
主持人:這將會非常有趣。 好的,GPT-O3。
凱文:
是的,我們對這個模型超級興奮。所以,讓我……也許我會退一步,如果你沒問題的話,確保人們理解這些模型是什麼。現在我們在這個領域看到了幾種趨勢。首先,模型變得便宜得多。你將GPT-O3與我們兩年前宣佈的模型相比,再比如GPT-4O Mini,它們的成本差異達到了100倍。GPT-O3的成本是之前的100倍,但我們看到成本在兩年內下降了99%。
與此同時,模型變得更聰明、更快,也更安全。這些趨勢是我們——包括我、Masa,以及許多其他人——認為值得投入大約5000億美元的原因之一。在這裡,我們看到一組令人難以置信的趨勢。我不知道在世界的其他地方是否能看到類似的現象。成本在大幅下降——99%的降幅——與此同時,這些技術又變得更加快速、智能和安全。這確實是一個非常特殊的現象,我不知道還有那裡能找到類似的例子。
所以,你們可能都熟悉GPT-4。你們可能在ChatGPT中已經默認使用它了。在去年年底,我們通過一個研究突破發佈了它。然後我們將這個突破應用到一個叫作O1的模型中。實際上,這是一套完全不同的命名體系。部分原因是因為這個模型能夠完成GPT-4無法完成的任務。
O1模型可以推理。GPT-4非常優秀,它知道很多資訊。如果你問它一個問題,你可以快速得到答案。這種方式有點像“系統一思維”(快速、直覺式的思維方式)。而O系列模型,尤其是O1及其後續版本,實際上能夠進行推理。比如說,如果我問你一個難題,或者讓你做一個填字遊戲,你不會直接給出一個答案。你可能會先觀察一下,然後思考:“好吧,第一個提示,我有幾個想法,但我還不完全確定。”
現在我知道第三個字母有一個A。那麼,它一定是這個。你就在建立假設,測試那些假設。有時你會反駁它們,有時你可以確認它們。然後你就可以在此基礎上繼續前進。這就是你解決任何難題的方式。這也是你解決像預訂航班這樣的事情的方式。這就是科學研究進行的方式。
所以這些模型第一次可以做到這一點。而且它們不僅僅是推理的能力,它們在很多方面都比GPT-4聰明得多。根據任何推理的Benchmark,它們的表現都超出常規。所以我們宣佈了這個消息。然後O3就是下一版本。我們跳過了一個版本,因為我們的朋友在Telefónica有一個叫O2的網路。
主持人:看,我在想這個。這可能是因為這是一個巨大的飛躍。
凱文:是的, 這就是我們應該說的。這就是你應該說的。但現在我們真的搞清楚了。。
主持人:我在這裡支援你。
凱文:
所以,O3。另一個實際上非常有趣的事情是,它也給我們帶來了樂觀的情緒。我認為,從GPT-3到GPT-4,我們花了18個月的時間。這相對來說是很快的。你可能不記得,如果我們今天回到GPT-3,在你習慣於GPT-4之後,你會覺得,當時那是令人震驚的。而且,我們輕鬆地超過了圖靈測試。每個人,我記得我當時想,我簡直不敢相信我生活在這樣一個存在這些東西的世界裡。但現在你回到GPT-3,它會讓你感覺,我不想使用那個。所以那花了18個月的時間。
我們在大約三個月的時間裡從O1到O3。所以迭代周期在縮短。而且,我們已經在訓練O3之後的模型。看起來我們將看到能力的另一次大飛躍。我們對此感到興奮的原因是,這些模型正在迅速變得非常聰明。我再說最後一件事。
主持人:然後你會告訴我它什麼時候發佈?
凱文:
當然,我會告訴你我們將要發佈的具體時間。請繼續。當我們推出O1的預覽時,評估這些模型的一種方式,尤其是在編碼方面,就是讓它們有效地參與競爭編碼比賽。這是一個不錯的基準,因為您可以以非同步方式進行這些操作。所以你可以把它們當作人類來參加比賽,並以與任何人類相同的方式進行評分。
這些模型的第一個版本大約相當於百萬名最佳程式設計師中的某個排名。這並不算差。你仍然在世界前 2% 或 3% 的水平。但是第二個版本,當我們實際上宣佈或者推出這個新模型的完整第一版 O1 時,它表現得像是世界上排名第千位最優秀的工程師,在這些競爭編碼問題上。O3 將是世界上第175位最優秀的工程師。而且再說一次,我們談論的是這之間大約 3、4、5 個月的時間。你已經從第百萬位上升到第175位。所以你可以想像未來會有什麼樣的發展,因為我們繼續看到有意義的進步。所以這就是為什麼我們對這些模型感到如此興奮。
我們通常推出這兩種版本。一種是迷你版,保留了很多核心能力,比如數學和軟體工程,但沒有保留所有的世界知識。但是它的推理速度非常快,成本也很低。然後我們還有那種完整的模型,將所有內容整合在一起。所以我們很快就會推出 O3 mini 版本,然後會跟進 O3。我預計,如果一切順利,我們之前提到的時間大概是二月或三月。所以這是我們的目標。
主持人:好的。
凱文:這是個長答案。但我覺得背景資訊很有幫助。
主持人:
我們將深入討論你剛才提到的許多內容,這非常有用。而且我認為這實際上為我接下來要問你的下一個產品——代理人,奠定了基礎。
凱文:很棒。
主持人:什麼時候?
凱文:
我認為 2025 年是AI代理人變得真實的一年。而且從現在開始,如果你使用 ChatGPT,你大多數是用它來回答問題。你問它一些事情,它給你一個答案。你問它一些事情,它給你一個答案。到 2025 年,ChatGPT 將開始為你在現實世界中做事情。
當我思考我自己的日子和我花時間的方式,或者說我在瀏覽器中花時間的方式時,就像是從數字世界開始。也許我在瀏覽器中所做的事情,有一半實際上是我感興趣的。我正在閱讀《華爾街日報》的文章。當然,是喬安娜的。
主持人:你對那個感興趣一半?
凱文:
不,我是說我一半時間感興趣。那是我感興趣的一個例子。所以,我在閱讀一些東西。我在觀看 YouTube 視訊或者其他的。我實際上對我在瀏覽器中所做的事情感興趣。另一半時間,我在填寫我孩子的足球表格之類的事情上。這佔用了我一天30分鐘的時間。我真的希望我能把那30分鐘拿回來。為什麼AI不能為我做這些事情呢?
這是ChatGPT能夠為您做的事情。我們不僅在研究我剛才提到的推理方面,還在研究我們稱之為多模態的技術,使ChatGPT不僅能夠理解您輸入的文字,還能夠以我們作為人類的各種方式進行互動。所以,您知道,它可以與您對話,您也可以和它對話。而且它可以理解您,順便提一下,它能夠理解大約50到100種語言。
它還可以看,這意味著您可以用手機指向它,它就可以理解正在發生的事情。它可以看到您的瀏覽器螢幕,理解瀏覽器中正在發生的事情,就像您和我一樣。您知道,它並不是在解析HTML,而是實際上看著螢幕上的視覺元素,並理解它們的含義。這是一個搜尋框。如果我點選這個,這就是將要發生的事情,等等。所以,一旦您擁有這些基礎功能,您就可以開始建構這些任務。
我們是在為人們解決問題。我們希望幫助您收回那些本來會用在並不是特別有意義事情上的時間。這樣,您就可以花更多時間去做更有意義的事。
主持人:
稍微退一步,我在想一個工具,我會這樣理解它。您告訴我是否就是你們正在建構的東西。它能夠看到我電腦螢幕上的內容。我告訴它去填寫我孩子的午餐表。也許我需要再精確一點。我按下回車,它就能去做那件事情。它可以提交嗎?就是說,您的想法是它在採取那個行動,甚至更進一步,真正去執行那個行動。
凱文:
是的,我還能告訴您關於發佈日期的更多資訊。實際上,我們已經發佈了一些這樣的功能。如果您使用... 我們在Mac和Windows上有一個桌面應用程式,您可以下載它。與之前在瀏覽器標籤中使用相比,通過這個桌面應用程式,您可以做更多的事情。
比如,在桌面應用程式中,ChatGPT可以在您的許可下看到整個螢幕,看到您正在使用的應用程式,以及您在做的事情。當然,我們會徵求您的明確許可,您必須在允許它查看任何特定窗口之前同意。但它已經能夠完成一些任務,比如查看您正在使用的應用程式。如果您在編寫程式碼,或者在終端中可能遇到了編譯器錯誤,而您不知道這是什麼,它可以提供幫助。你可以直接說,查看這個應用程式。然後,我該怎麼做?我該如何修復它?它可以讀取螢幕上的內容,並且可以說,好吧……你可以把自己複製和貼上得來得去。在不久的將來,你可以想像它會說,是的,讓我來幫你修復一下。所以我們已經在桌面應用程式中做到這一點。然後現在就是要更廣泛地推廣這個。但是,我的意思是……
主持人:今年。
凱文:
是的,絕對是。絕對是。你將在第一季度開始看到這些東西,並且會有持續的節奏。這其中有很多……我們希望以一種讓人們掌控的方式來做這個,模型並不完美。它們在第一季度或第二季度都不會完美。它們仍然會犯錯。而當它們在真實世界中為你做事情時,錯誤實際上會變得……它們的重視程度可能比你問 ChatGPT 時,它給出的錯誤答案更高。所以我們正在處理的一部分內容是……我們如何確保理解那些是可逆的,那些不可逆,並讓你控制它實際上要採取的任何行動?
也許它為你填寫了表單,然後說,嘿,看看,我完成了。為什麼不點選提交?在某些情況下,你可能會信任它,因為你已經做過幾次,並且對它點選提交感到放心。但是如果你讓它在亞馬遜上為你下單,你就不希望它點選提交。你希望它先填滿購物車,然後你再回來。所以教導模型這些檢查點在那裡是它不應行動的。只是讓它準備好,讓人做最後的決定。
我想這將會是一種障礙,或者說這個邊界可能會隨著模型的進步而變化。隨著我們對它們的瞭解加深,人們逐漸信任它們,但我們希望給人們更多的控制權。
主持人:這實際上是朝著信任的方向努力,就像是一種人工智慧信任的摔倒練習。
凱文:人工智慧信任的摔倒練習。這太棒了。
主持人:我再問一個或兩個產品。然後我們將討論其他一些事情。
凱文:我給你提供確切日期的表現怎麼樣?
主持人:你們覺得怎麼樣?我們表現得很好。
凱文:我給了你們季度的資訊。
主持人:你們曾承諾為創作者提供一個選擇退出的培訓工具。那個怎麼樣?
凱文: 我們仍在努力研究這一點,待我們有更多消息時會再談。
主持人: 第二季度?
主持人: 我們拭目以待。
主持人: 好吧。
主持人: 人形機器人?
凱文: 今年不會。
主持人: 今年不會。
主持人: 好吧。我們還有一年的時間。明年呢?
凱文:
我們拭目以待。如實說,我認為這將是下一個重大進展。不論是我們還是其他任何人。我認為人工智慧最自然的應用場所是數位領域,它將對我們所有人及我們如何使用時間產生重要影響。因為這些東西在某種程度上是數字原生的,這是最自然的地方。但如果你開始開發多模態技術,比如說話的能力、視覺的能力,以及開始理解真實世界,那麼機器人技術顯然是下一個方向。我認為,無論是我們還是其他人,這可能比我們正在經歷的當前革命晚了幾年的時間。我認為這對人工智慧來說將是一個巨大的一年,它將如何影響和改善我們所有的生活。我猜機器人技術還要再推遲兩到三年。
主持人:
但是你們也在研究這個,你們剛剛重新啟動了部分機器人研究實驗室。
凱文:
是的,我們開始考慮這個問題。所以一個小團隊正在嘗試瞭解,這是否真的是一個我們能在這一領域產生重大影響的領域?我們有第一方產品,比如ChatGPT等等。我們也提供開發者產品,每周有超過3億使用者在使用ChatGPT,我們還有300萬開發者在API上建構各種各樣的東西。無論我們如何努力利用自己的第一方產品,我們所能實現的僅僅是人工智慧在世界上影響的一小部分,這就是為什麼我們如此重視擁有一個出色的開發者項目。所以,不管我們是否進入這一方向,我們都希望確保所有在機器人技術領域做出驚人工作的公司也能訪問我們的模型。
主持人:
我想問一下關於合作夥伴關係的問題。凱文在人工智慧合作夥伴關係方面算是個瑞士國度,是吧?你們有蘋果公司,有微軟,還有其他一些科技公司,你們與他們建立了合作關係。但感覺這種中立狀態似乎只能持續一段時間。在你作為產品負責人和產品發佈方面的角色中,你是如何考慮與這些合作夥伴的合作的?具體來說,你們是否仍繼續與蘋果公司合作?微軟顯然也參與了新的星際之門項目。你對這些有什麼看法?
凱文:
從產品的角度來看,我希望 ChatGPT 可以做到隨時隨地都能使用,並且只需輕觸一下就可以訪問。所以,如果你不得不在手機上找到應用程式並進行搜尋,這樣的方式也沒問題。這是大多數應用程式的工作方式,人們通常會去這麼做。但是,如果我們能讓它觸手可及,比如通過長按 iPhone 側邊的一個按鈕就能立即訪問 ChatGPT,那就更好了。這樣一來,使用起來的頻率會更高,速度也會更快。降低向 ChatGPT 詢問問題的門檻,它就可以更好地幫助使用者。
這正是我們與蘋果合作的重要原因,我們對此感到非常興奮。蘋果的智能助手目前還處於非常早期的階段,我認為在大多數國家還沒有完全推出。但只要想像一下,或許有一天可以通過長按每一部 iPhone 上的一個按鈕,在全球範圍內即刻訪問 ChatGPT,那真是太棒了。
這也是為什麼,我們在這 12 天期間推出了 "1-800-ChatGPT"。我知道很多人使用 ChatGPT,但是有多少人用過 "1-800-ChatGPT"?聽說過它嗎?或者稍微瞭解一點?對嗎?從舉手人數來看,這就明顯少很多了。所以我們的想法是,如何讓每個人都更容易使用 ChatGPT。
我們提供了這個號碼——1-800-ChatGPT,我記得是 1-800-242-8478。你可以把它存到聯絡人列表裡,然後通過 WhatsApp 聯絡它。你可以像在 ChatGPT 應用裡一樣,向它提出任何問題。雖然它的回覆可能沒有在原生應用程式裡那麼豐富,但依然能完成不少很酷的任務。通過這種方式,突然間,全球範圍內任何擁有 WhatsApp 的人——也就是超過 30 億使用者,以及遍佈這些使用者所在的每個國家的人們——都可以完全免費訪問 ChatGPT。所以,這也是我們使命的一部分。
這不僅僅是開發 AGI(通用人工智慧),更重要的是以對人們生活有益的方式將其帶給人類。我們通過 API 來實現這一點,也因此為大約 300 萬開發者利用我們的 API 建立出令人驚豔的功能感到自豪。但與此同時,我們也希望通過我們的第一方產品將這些能力帶給使用者,並把它免費嵌入到大家可能每天會使用 100 次的應用程式中,比如和蘋果的合作。這是我們實現普及的另一種方式。
主持人:
我想問一下關於資金的問題。Sam Altman 幾周前發了一條推文,說你在提供每月 200 美元的專業計畫上是虧損的。
凱文:順便說一句,我們很喜歡這種狀態。
主持人:你喜歡虧損?
凱文:
是的。我喜歡人們,所以我們在去年年底推出了專業計畫。我們看到的情況是,我們提供免費的ChatGPT,您甚至無需登錄就可以直接存取網站。您沒有我們的帳戶,只需開始使用。如果您登錄,您的使用限制會稍微提高,但您仍然可以免費使用。然後,您還可以獲得一個PLUS計畫,每月支付我們20美元。您將獲得更多功能的存取權,並能夠使用我們一些更好的模型等等。
我們還發現,人們仍然會遇到使用限制。他們希望在一個月內使用超出20美元的AI和計算資源,因為對他們來說這項服務的價值是如此之高。所以我們想尋找一個方法,基本上能夠為使用者提供無限制的ChatGPT服務。現在這項服務是無限制的,但帶有一些限制條件,我們需要防止濫用等行為。我們將定價定在每月200美元。我不確定有多少消費者計畫的定價會達到這樣的高度。但我們認為,有很多人從ChatGPT中獲得了極大的價值,我們希望他們能夠儘可能多地使用這些功能。
讓我感到高興的是,有些人使用專業計畫的頻率如此之高,以至於他們每月實際使用的計算資源已經超過了200美元的價值。當然,我們現在還處於早期階段。我們並不天真,知道這家公司未來不可能永遠以這種方式營運。但你還記得我提到過成本會迅速降低,我們一直在努力讓成本不斷下降。我們的總體策略是儘量為使用者提供更多的人工智慧服務。
如果你看過去6到12個月的趨勢,我們已經削減了成本,提高了速率限制,提供了更多免費的服務,並在我們的PLUS計畫中增加了更多的價值。隨著時間的推移,我們還將繼續在專業計畫中投入更多資源。我們處在一個飛速變化的時代,成本在迅速下降,同時模型卻變得越來越智能。我們希望將更多的人工智慧技術交到人們手中,因為我們相信這對世界非常有益。你會發現很多人正在高頻使用專業計畫,這真的令人興奮。
主持人:
我們談了很多關於人工智慧的內容,也聊了你們所開發的產品,甚至是人工智慧本身。但我想談談凱文你的團隊。今年對你們來說是充滿挑戰的一年,甚至可以說過去兩年都是如此,但你實際上還剛剛開始。你是在六月份加入團隊的,之前曾在Meta和Twitter工作。在這些公司任職時,你正經歷了各種壓力劇增的時期,同時為大眾開發產品並試圖找到盈利的方式。我甚至聽你昨天在 Axios 上說,這個行業的人來來去去,但現在感覺真的很動盪。你對此有什麼想法?你如何引導你的團隊留在凱文公司並與你一起建設?
凱文:
有趣的是,在這些快速增長階段的公司,正如我早期在 Twitter 和後來的 Instagram 所感受到的,有時媒體報導的事情——無意冒犯——在內部並不會以同樣的方式激起公司的波瀾。在內部它們不是大事,但外面卻有這麼多文章發表。有時情況正好相反,實際上更重要的事情並不總是被報導。
主持人:你應該把這些洩露給我們。
凱文:謝謝。
主持人:如果你需要知道該去那裡。
凱文:所以這就是我這些年來一直做錯的事情。
主持人:繼續,繼續。
凱文:
知道了。無論如何,我還沒有... 我很幸運能夠在一些快速增長的公司工作過。我還沒有在一個沒有一些早期員工的地方工作過,這些員工在創造公司現在的樣子中扮演了重要角色。像是,“天那,我是在它只有 20 個人的時候加入的,現在它有 200 人或 2000 人”。這有點不同,我準備好迎接不同的旅程。所以我覺得這完全沒問題。我覺得,我們的工作就是尊重他們,感謝他們所做的工作,並且招聘世界上最優秀的人繼續朝著使命努力。而且,這就是我們每天所做的。
主持人:
但是,從非營利研究實驗室轉變為營利性的 **開放AI**,內部和外部都有很多反對聲音。你的團隊實際上是在這一切的核心。你們正在為盈利推出這些新產品,雖然尚未達到 200 美元的計畫,但聽起來很快就會。我想說,再次,我必須想像你們的團隊在這方面有拉鋸戰。
凱文:
實際上沒有。這是一個在外部討論得比內部多得多的問題——沒有人對此心懷憤懣。因為這個故事非常簡單明了。山姆已經說過很多次,OpenAI 始於一個非營利組織。當時的想法是由一小群人來建構人工智慧。而且在當時,順便說一句,沒有人相信這有可能。所以有一群瘋狂的人試圖建立 AGI,大家都說,“好吧,隨便你們去做你們要做的事。”
然後當他們實際開始取得突破時,比如 GPT-1、GPT-2,很明顯這需要很多錢。這需要大量的計算能力才能做到,這與非營利模式並不完全一致。所以在那時保持公司運轉的最簡單辦法是——記住,當時它還不是我們今天所認為的那種。當時,只有一小群人覺得他們看到了世界還未意識到的東西。於是,最簡單的做法就是將其作為整體公司的一個盈利實體來成立,以便能夠獲得資金,繼續我們的使命。現在公司已經壯大,現在顯然我們是一家更大規模的公司。而現在,人們覺得有一個非營利組織擁有越來越大的盈利組織,這很奇怪。所以這個想法實際上就是,讓我們誠實地面對我們所處的位置,並嘗試進行重組。順便說一下,這保留了非營利組織。這是我們使命中非常重要的一部分。我們認為在醫療保健、教育等領域,我們可以做出大量的善事。目標是讓非營利組織擁有整體公司的有意義的股份,並成為一個能夠在世界上做出很多好事的有意義的實體。
主持人:
我認為最大的擔憂是關於安全,我認為現在很多人正在尋求監管來解決這個問題。你上周末在華盛頓特區參加了一些就職典禮的活動。再次強調,川普昨晚在你宣佈這個基礎設施時在場。而且凱文一直積極呼籲一些監管。在接下來的四年中,你希望看到那些監管措施?
凱文:
好吧,我認為,事實上,AI在與其他受監管行業接觸時已經受到監管。所以,任何時候AI與醫療保健交叉時,AI必須遵守醫療保健法規。任何時候AI與法律交叉時,AI必須遵守法律法規和法律規則。這正是應該如此。因此,人工智慧已經以與其他產品、服務或實體相同的方式被監管。
我認為我們必須坦率地說,我們現在正處於一場競賽中。美國以及更廣泛的西方,需要贏得這場人工智慧競賽。我不希望看到中國贏得人工智慧競賽。我認為,如果一個其他國家首先取得人工智慧的突破,世界的格局將會非常不同。
因此,我認為我們必須首先著眼於如何促進創新。但我們並不反對監管。對我來說,我們應該避免的是出現一個由50個不同州的50個不同監管要求拼湊而成的監管環境,這會基本上將每個公司束縛住。不僅僅是我們,整個行業的每家公司都將無法做好任何事情。因為到那時,我們將會失敗。而那是一個更糟糕的結果。
主持人:你提到了那些行業。我們有FDA,我們有FAA,我們應該有FAI嗎?其他人可以想一個縮寫。
凱文:
是的,我不知道,答案就是這樣。我們一直在堅持我們願意接受監管。我認為我們只需要一種不會試圖或意外地扼殺一個新興產業,尤其是在早期階段的監管。
主持人:
好的。昨天,我採訪了來自Anthropic的達里奧,他與你在同一個位置。他基本上說,他在想2027年,那時人工智慧在很多方面都會比人類更優秀。這是否是開放AI的立場?這是你在實驗室看到的情況嗎?而那個問題的第二部分,你對此感到興奮的是什麼?那麼我們所有人應該因為害怕而前往達沃斯的避難所嗎?
凱文:
是的,真難以確定時間。這是研究。這就是在像凱文或Anthropic這樣的地方工作與我之前所有地方的不同之處。我們公司有數百人在進行研究,試圖揭示人類從未知道的事物。這在許多方面確實是學術風格的研究,所以很難確定時間。
與此同時,我之前提到過,從第百萬的程式設計師晉陞到第千的程式設計師,再到第175的程式設計師,這可能在三到四個月內就會發生。我們正處於一個非常陡峭的軌跡上。我甚至不知道是否會是2027年。我認為可能會更早。至於該…我傾向於認為,應對這股潮流的最佳方式是實際使用人工智慧。如果你和它保持距離,僅僅閱讀大量文章,那麼你可能會變得非常焦慮和害怕。或者你可以實際使用它,意識到它在日常生活中是如何幫助你的。在某些方面它仍然不完善。你可以感受到它在那些地方有所改善以及那些地方仍需提升。然後你實際上參與了未來十年將要發生的改變。
我認為這就是應對的方法,因為這也導致了……歸根結底,不管是監管還是制定社會標準等其他事情,這將是我們所有人——使用它的人將定義這些事物應該如何發展。使用它的人越多,實際上獲得資訊的人就越多,隨著我們經歷接下來幾年的重大變化,我們得到的答案也會更好。
主持人:
如果我們真的達到了通用人工智慧,而人類在很多工作中並不是很需要,你打算如何利用你的閒暇時間?我聽說你喜歡跑步。
凱文:
我確實喜歡。我跑步。我騎自行車。我有三個瘋癲的孩子,他們隨時都很瘋狂。我不知道。我認為人們有一種與生俱來的驅動力去做一些超越自身的事情。我認為人們需要一個生活使命,我覺得這不會改變,無論是在人工智慧之前還是之後。所以我個人並不認同那種認為我們會接受基本收入後,就懶洋洋地坐著,整天讀書的觀點。我認為人們需要一個更大的目標去追求。
看看所有這些變化,社會多年來經歷的任何重大變化,其中許多都是由於技術的進步。總是有很多人在變化尚未到來之前預言厄運,宣揚災難。從汽車、收音機、電視、電力到印刷,人們都非常適應這些變化。我們總是不希望回到那些發明之前的日子。我認為我們對人工智慧也會有同樣的感覺。人工智慧將改變世界,它已經在改變了。但我認為這會帶來積極的改變。我不認為在經歷這些變化之後,我們會回頭說:“你知道嗎,我真的想回到必須花一個小時給孩子們填寫足球表格的那個時候。”所以,對於即將到來的改變,我感到非常興奮。
主持人:
好的,我要問最後一個問題,關於人類和你曾經合作過的人類。你曾為一些非常獨特的領導者工作過。在Twitter,你為傑克·多爾西工作;在Meta,你為馬克·祖克柏工作;現在為山姆·阿爾特曼工作。我本來想讓你為他們排個名,但我覺得那不太公平。誰主持會議的效果最好?
凱文:誰主持會議的效果最好?天那。
主持人:這似乎是個非常人性化的問題。所以我想,我們都喜歡會議,人類嘛。
凱文:
是的。馬克比山姆更有條理,也比傑克更有條理。馬克總是會帶著一個經過深思熟慮的假設來討論任何問題。他非常有雄心壯志,但他總是在腦海中為從現狀到目標規劃了一條清晰的路線。我喜歡和他合作的一個原因是他總是願意接受反饋。你可以直接對他說:“我覺得你錯了,這就是原因。”不過你要做好準備迎接隨之而來的辯論,因為他也有充分理由支援自己的觀點。當然,你可以說服他接受你的觀點,但這需要你有一個非常成熟並經過深思的看法。
山姆更像是一位遠見卓識者。我認為山姆是在某些方面最出色的人之一。特別是在人類普遍不擅長應對指數增長的背景下,我們往往很難精準評估指數曲線帶來的變化。而山姆是我見過的在理解和預測指數增長所帶來的深遠影響方面表現最優秀的人之一。他會說:“好吧,如果這真的呈現指數增長趨勢,那麼三年後,它就不再是人類慣常預期的那種線性趨勢了。”
實際上,它會在這裡。這就是為什麼我們要建立一家花費5000億美元建立人工智慧基礎設施的公司。因為山姆在寫指數方面比我們其他人更優秀,能夠看到這些結果,並且實際上正在做我們需要做的事情,以便為此做好準備。
主持人:
川普總統昨天宣佈了一項新的合資企業,名為 Stargate,旨在在美國建立和發展人工智慧基礎設施。OpenAI、軟銀和甲骨文計畫初始投資 1,000 億美元,未來四年可能達到 5,000 億美元。微軟被列為新合資企業的合作夥伴之一。現在我們有幸邀請到微軟董事長兼首席執行官薩提亞·納德拉進行獨家採訪。早上好!非常感謝你。在這樣的時刻與您交談真是太好了,因為我們都在努力理解這一切以及它意味著什麼。
是否有可能達到 5,000 億美元,以及這對您與 OpenAI 的合作關係具體意味著什麼?我想尤其是在他們一直專屬使用 Azure 的情況下,現在顯然,他們也會在其他平台上開展業務。
薩提亞:
是的,首先,每當您資助並實質上是種子投資者的公司從其他人那裡籌集資金時,這都是好消息。對於 OpenAI,對於微軟以及我們的投資者來說,今天是個好日子。看,我們的合作關係還在繼續。我們將作為 Stargate 的技術合作夥伴,但更重要的是,我們與 OpenAI 的合作關係。
你提到過獨佔性。OpenAI 的 API 今後將獨佔 Azure。所以在那裡沒有變化。微軟對 IP 的訪問仍然繼續。實際上,因為這個原因,將會有更多的 IP。因此,我們將受益。我們的收益分享安排非常好。此外,OpenAI 在 Azure 消費方面做出了非常重大的承諾。所以,我們對此也非常興奮。總的來說,就我而言,這加速了 OpenAI 的模型工作,加速了微軟利用這些模型進入市場的能力,並真正推動了我們的業務增長。
主持人:
讓我問你這個。今天早上早些時候我們請來了你們的一位競爭對手,馬克·貝尼奧夫,他對這項合作關係非常批評。他所說的其中一件事是,這顯示出了兩家公司之間的裂痕,你們將會在長期內獨立發展自己的前沿模型。而且在薩姆·阿爾特曼和穆斯塔法之間似乎存在某種脫節,穆斯塔法是你們聘請來負責 AI 項目的。你能對此談談嗎?
薩提亞:
看,對於我們來說,與 OpenAI 的合作是至關重要的合作關係。我們非常喜歡它。它運作良好,為我們創造了很多價值。我們計畫繼續保持這種合作關係。目前在Azure上確實存在其他模型,有開源模型,我們還有自己的小型語言模型。我們會繼續保留所有這些,因為客戶最終會要求在這裡有選擇。這很好,我們會確保支援這一點。但在Azure上獨佔領先模型對我們來說是很大的優勢。這很好。
主持人:
讓我問你這個。大約一個半月前,我在DealBook上和山姆·奧特曼談過。他說:“我認為我們不會脫鉤。”你的觀點對。他還說:“看,我不會假裝沒有不一致或挑戰。”顯然是有一些。但總體而言,他表示他認為這是非常積極的。有那些地方沒有達成一致?我最近在你們的一份檔案中注意到的一件事是,你們實際上把OpenAI列為你們的競爭對手。我想這一定說明了你們長期的雄心。
薩提亞:
是的,更重要的是,我認為對於我們來說,星際之門實際上是一個答案。山姆想繼續擴展規模法則,以便建構更多的計算資源,從而訓練更多的模型。我們有一個屋頂工人,所以他首先來找我們。如果我們滿足了這些需求,那麼我們就可以通過。如果沒有,他可以去找其他供應商。因此,我認為這對山姆和我們來說都很好。所以這實際上是我們所做的一個調整,以支援他的需求,同時保持我們想要的戰略價值的完整性。
主持人: 你們已經投資了800億美元。你們最終會投入多少資金?
薩提亞:
所以在這裡,微軟每年投資800億美元的資本。而且今年我們正在投資。我不特別瞭解他們投資的細節。
主持人:
好的。所以,當你看到那項1000億美元的承諾,以及5000億美元的潛力時,我不知道你是否看到埃隆·馬斯克發推特說:“他們沒有錢。”錢並不存在。就好像這根本不會發生。你對此怎麼看?
薩提亞:
我只知道我會為我的800億美元負責。我將花費800億美元來建設Azure。客戶可以依靠微軟,OpenAI模型會在世界各地無處不在,提供OpenAI模型和其他模型服務。這就是我所知道的。
主持人:
這裡在達沃斯的另一個討論,以及在達沃斯之前的問題是是否存在一堵牆。規模法則是否會繼續如火如荼地發展?山姆·烏爾曼一直在說它們將繼續如火如荼地發展。桑達爾·皮查伊則建議,這實際上會比我們想像的更早變得有些複雜。你對這個問題有什麼看法?
薩蒂亞:
我認為兩者都是正確的,因為現實是,我認為這中間並沒有一個明確的“牆”。隨著規模的擴大,的確會遇到更大的困難。而且有趣的是,在預訓練規模方面,隨著規模的增長,這些困難也變得更加顯著。然而,薩姆和他的團隊已經展示了,即使在O1以及現在的O3中,推理時間的計算以及某種程度上實現推理擴展的能力,依然能夠很好地體現規模法則的累積效果。這意味著以前可能需要六個月才能實現規模的翻倍,現在三個月或更短時間就能實現。因此,我認為規模法則仍然充滿活力。
現在的問題在於,如何把這些能力積累起來,用於真正部署AI系統。如果說規模法則還在持續作用,那麼,我們需要思考如何將這種潛力轉化為真正的價值。
主持人:
你在你自己的前沿模型開發上進展如何?很顯然,你確實僱用了穆斯塔法。同時,你也有自己的一些努力正在進行中。這具體看起來是怎麼樣的?我們什麼時候能夠看到成果?另外,你認為這些前沿的AI努力最終會對你產生什麼樣的影響?我是說,你在OpenAI方面做得非常成功,這可能本身就是一項了不起的投資。那麼,你認為整個AI領域的格局在某個時刻會如何演變?
薩蒂亞:
為了說明問題,我們可以訪問OpenAI的智慧財產權,因此我們不會重複造輪子。對於能夠訪問OpenAI的資源和技術,我們感到非常高興。不過,除此之外,我們確實也在建構自己的模型。例如,我們開發了一個名為PHY的小型語言模型(SLM),這是一個公共模型。PHY4的參數規模可以說在同類產品中表現十分出色。除此之外,我們還有一些其他模型的開發工作。
對我來說,更重要的是如何在OpenAI的基礎上進一步建構價值。我們有一個出色的後期訓練堆疊,同時也進行了大量的中期訓練,特別是在多種不同語言中的應用。這些正是我們當前關注的重點。
主持人:
當你考慮到規模法則時,在這一切過程中,有多少僅僅與計算能力相關?如果今天有人能夠買到足夠的NVIDIA晶片,他們是否也能建立一個壯觀的大型語言模型?比如說,我看看埃隆·馬斯克在過去12個月所做的事情,確實引人注目。他建立了整個技術堆疊,也獲得了大量的NVIDIA晶片,終於做到了。這是否僅僅是資源的堆砌,而不在於方法論的創新?這其中有多少是關於處理能力,多少是關於演算法?
薩蒂亞: 看,這一切都是。計算就是智能。但在計算之上,你還需要演算法的突破。所以在某種程度上,看看為什麼規模法則有效,是因為我們越來越擅長利用演算法的變化、資料和資料的使用以及計算效率。這就是能力所在。當我們說規模法則時,這不僅僅是計算。實際上,它的增長速度快於計算增長。所以如果計算能力提升了10倍,能力就提升了100倍。
為什麼會這樣?這是軟體。 (Web3天空之城)