#訪談
黃仁勳深度訪談:“Token經濟”爆發,AI計算佔GDP比重將翻百倍,輝達10兆是必然!
電腦已從不賺錢的“儲存倉庫”升級為生產“Token商品”的創收工廠。黃仁勳推演,這一轉變將使計算佔全球GDP的比重暴增100倍,公司極大可能邁向10兆美元市值。針對電力瓶頸,他提出利用電網長期閒置冗餘,建構可在高峰期主動降速的“優雅降級”資料中心破局。此外他認為,能自主創收的AGI已經實現,AI門檻的消除不僅不會引發失業,反而將使全球“程式設計師”群體從3000萬激增至10億人。近日,輝達CEO黃仁勳做客知名科技播客Lex Fridman Podcast,圍繞AI縮放定律(Scaling Laws)、算力與電力瓶頸、AI工廠、公司未來展望以及AI對人類社會的影響等核心議題,進行了超兩小時的深度對話。Token已成全新商品,計算佔全球GDP比重將翻百倍黃仁勳的一個核心觀點是,計算的本質已經發生了根本性的躍遷——從過去人類預先錄製、電腦負責檢索的“儲存系統”,轉變為具備上下文感知能力的“生成系統”。更重要的是,電腦在現實經濟中的角色變了。過去的電腦是檢索系統,主要功能是檔案儲存。黃仁勳將其比喻為“倉庫”,而倉庫本身是不直接產生高額利潤的。而現在的AI電腦變成了“工廠”,並直接與企業的收入創造掛鉤。他認為,AI代工廠正在製造一種名為“Token”的商品,且這種商品已經被細分和定價。“我們不僅看到這家代工廠在生產人們想要消費的商品,而且這些代工廠製造的Token對許多不同受眾都極其有價值,甚至開始像iPhone一樣出現分層:你有免費的Token,有高級Token,還有處於中間層級的Token。”黃仁勳表示,“有人願意為每一百萬個Token支付1000美元,這個想法就在不遠的將來,這不是會不會發生的問題,而是何時發生的問題。”基於這種“Token工廠”模式,計算裝置完成了從成本中心向利潤中心的跨越。黃仁勳篤定地推演了這一宏觀趨勢:“如果生產力大幅提升,全球GDP將加速增長。我完全確信,未來用於計算的GDP佔比將是過去的100倍。”邁向10兆美元市值?黃仁勳:增長是必然的基於“Token”的經濟理論,黃仁勳回答了,輝達能否邁向10兆美元的新市值巔峰的討論。他表示:“這個數字(10兆)只是一個數字。”但他明確指出:“輝達的增長極大機率會發生,在我看來是必然的。”未來實現3兆美元營收的體量並非不可能。電力瓶頸解法:“用好閒置電”、打造“優雅降級”的資料中心關於AI擴張的瓶頸,黃仁勳直言:“電力是個擔憂,但不是唯一擔憂。”他給出兩條平行路徑:一是把能效繼續推高;二是想辦法獲得更多電力。在能效上,他強調指標是“每瓦每秒token數”,並稱通過“極致協同設計”提升能效:“我們的電腦價格在上升,但token生成效率上升得更快,所以token成本在下降……每年下降一個數量級。”在“如何獲得電力”上,他給出一個更具體的思路:電網按極端峰值設計,絕大多數時間有閒置。黃仁勳稱:目前的電網是按照極端天氣的最高峰值(加上安全余量)來設計的。“99%的時間裡,我們的電網都沒有達到最壞情況。”大多數時候可能只在峰值的60%左右運行。為利用這部分閒置能源,他認為需要改變雲廠商與電力公司之間嚴苛的供電合同,放棄對“六個九”(99.9999%)絕對可用性的盲目追求。“我們需要建構能夠‘優雅降級’(gracefully degrade)的資料中心。”黃仁勳解釋,“當電網說‘我們需要把你的電力降到80%’時,資料中心可以把關鍵負載轉移,或者降低計算速率。計算服務質量會輕微下降,但我們消耗的能源減少了。”供應鏈與記憶體:匯聚200家供應商,提前三年佈局HBM面對市場對ASML光刻機、台積電CoWoS先進封裝等環節可能制約AI產能的擔憂,黃仁勳表示並不焦慮。他說:“我告訴他們我需要什麼,他們告訴我打算怎麼做,我相信他們。”在系統工程上,輝達正在深刻改變基礎設施的製造模式。黃仁勳透露,僅一個Vera Rubin機架就包含130萬到150萬個元件,背後匯聚了200家供應商的技術。為了匹配這種極高的互聯密度(如NVLink-72),過去在資料中心現場拼裝零元件的傳統模式已徹底失效。輝達將資料中心的“超算組裝”前置到了供應鏈的“超算製造”環節。現在,機架必須在供應鏈中建好,每次以兩三噸的重量整機發貨。這意味著供應鏈在整機出廠前的測試階段,自身就需要具備吉瓦(GW)級的龐大電力儲備。而在最容易卡脖子的記憶體(Memory)領域,黃仁勳透露,大約三年前,HBM(高頻寬記憶體)的使用率極低,幾乎只在極少數超算中露面。但他當時就成功說服了多家記憶體大廠的CEO,讓他們相信HBM將是未來資料中心的主流,並促使產業鏈果斷投資擴產。此外,他還打破常規,推動供應商將原本專屬於手機的低功耗記憶體(LPDDR)改造並引入超算領域。“推理是思考”:從訓練、測試時擴展到“代理式擴展”對於AI縮放定律(Scaling Laws),黃仁勳把AI擴張拆成四條“擴展規律”:預訓練、後訓練、測試時擴展、代理式擴展。他回顧“資料枯竭”擔憂時稱:“我們會繼續擴大訓練資料……很多會是合成資料。”並給出判斷:“訓練不再受資料限制,資料將受限於算力。”對推理側的算力強度,他說得更直接:“推理就是思考,我認為思考很難……怎麼可能是算力輕的?”他認為測試時擴展包含“推理、規劃、搜尋”等,會推動推理算力需求上升。最深護城河、太空算力痛點與評價馬斯克當被問及輝達最大的護城河時,黃仁勳明確指向了CUDA龐大的裝機量與信任生態。“這不是3個人成就的CUDA,而是43000名員工共同推動的。”黃仁勳強調,這種護城河建立在數百萬開發者對輝達持續最佳化底層的信任之上,輔以橫向整合進入全球各類雲廠商、OEM和邊緣裝置的極廣生態。在算力基建的前沿探索上,針對將資料中心搬上太空以解決能源分配的設想,黃仁勳證實輝達GPU已經進入太空,但當前主要用於衛星高解析度圖像的邊緣端篩選。對於建構大規模太空資料中心,黃仁勳直言其存在核心的物理痛點:“太空中沒有傳導,沒有對流,只能靠輻射散熱。雖然極地有24/7的太陽能,但我們需要巨大的散熱器。”現階段最務實的做法,仍是先榨乾地球上的閒置電力。此外,任何算力藍圖的落地都需要極致的工程執行力。針對馬斯克旗下xAI僅用4個月便建成了擁有10萬塊GPU的Colossus超算中心,黃仁勳在市場化基建層面給出了極高評價。他將馬斯克的成功歸結為第一性原理思維與極簡主義。“他質疑一切:這有必要嗎?必須這樣做嗎?需要花這麼長時間嗎?”黃仁勳表示,“埃隆在眾多不同領域都有極深的造詣,同時他也是一個非常優秀的系統思考者。”他繼續評價道,“他能夠質疑一切,直到把一切縮減到不能再減的最低必要限度……他親自出現在行動的第一線。當你以如此強烈的緊迫感親自行動時,會促使其他所有人也以緊迫感行動。”未來只招會用AI的人?“全球程式設計師將從3000萬暴增至10億”針對全球勞動者對AI技術的焦慮,黃仁勳給出了一個非常務實的標準。他直言,如果今天要在兩名應屆畢業生中做選擇,他一定會僱傭那個“AI專家”,而非對AI一竅不通的人。黃仁勳強調,這一準則不僅限於技術崗位,而是涵蓋了會計師、律師、銷售人員、供應鏈經理、藥劑師,甚至是電工和木匠。在他看來,每個職業、每個層級都沒有例外,善用AI的人將展現出更高的交付價值。他進一步釐清了“被取代”的邊界:如果一個人的工作本質上就是一系列“任務”(Task),即任務本身就是你貢獻的全部價值,那麼被AI顛覆幾乎是必然的。但如果你的工作具有更深層的“目標”(Purpose),你就可以利用AI自動化處理那些常規瑣事,從而從一名單純的“執行者”跨越成為所屬行業的“創新者”。對於那些尚未起步的人,黃仁勳給出了最 disarming(令人寬慰)的建議:“如果你不知道如何使用AI,你大可以去問AI‘我該如何使用你’。它會從頭開始引導你完成全過程。”他認為,現在起步的門檻已經降至零,唯一的障礙只在於你是否決定開始。因為在這個時代,等待的成本正在隨著AI的進化而與日俱增。對於程式設計師,黃仁勳拋出了一個震撼的觀點:“輝達軟體工程師的數量將會增長,而不是減少……如果程式設計的定義是‘描述規範讓電腦去建構’,那麼能做到這一點的人數,剛剛從3000萬變成了可能達到10億。未來每個木匠都會是程式設計師,每個水管工都會因此瘋狂。”在談及AGI(通用人工智慧)的時間表時,如果將AGI定義為一個能夠自主開發應用並實現盈利的系統,黃仁勳表示:“我認為就是現在。我認為我們已經實現了AGI。”他設想了一個由AI自主建立的Web服務或數字影響力應用,突然獲得數十億使用者使用並賺取利潤的場景,這在當下已經具備技術可行性。訪談全文如下:黃仁勳訪談文字稿:輝達——4兆美元的公司與AI革命 | 萊克斯·佛里曼(Lex Fridman)目錄0:00 – 介紹0:33 – 極限協同設計與機架級工程3:18 – 黃仁勳如何管理輝達22:40 – AI縮放定律37:40 – AI縮放定律的最大阻礙39:23 – 供應鏈41:18 – 記憶體47:24 – 電力52:43 – 埃隆·馬斯克與Colossus56:11 – 黃仁勳的工程與領導哲學1:09:50 – 台積電與台灣1:15:04 – 輝達的護城河1:20:41 – 太空中的AI資料中心1:24:30 – 輝達市值會達到10兆美元嗎?1:34:39 – 壓力下的領導力1:48:25 – 電子遊戲1:55:16 – AGI時間表1:57:29 – 程式設計的未來2:11:01 – 意識2:17:22 – 死亡介紹萊克斯·佛里曼(00:00:00) 接下來是與輝達首席執行長黃仁勳的對話。輝達是人類文明史上最重要、最具影響力的公司之一,它是推動AI革命的引擎。輝達的巨大成功在很大程度上可以直接歸功於黃仁勳純粹的意志力,以及他作為領導者、工程師和創新者所做出的眾多卓越押注和決策。這裡是萊克斯·佛里曼播客。親愛的朋友們,現在有請黃仁勳。極限協同設計與機架級工程萊克斯·佛里曼(00:00:33) 您將輝達推向了AI的新時代,將焦點從晶片級設計轉移到了機架級設計。萊克斯·佛里曼(00:00:42) 我想可以公平地說,長期以來,輝達的制勝法寶在於建構儘可能完美的GPU。你們現在依然如此,但如今已經將此擴展到了對GPU、CPU、記憶體、網路、儲存、供電、冷卻、軟體、機架本身、你們宣佈的計算艙(Pod),甚至整個資料中心進行極限協同設計。讓我們談談極限協同設計。協同設計一個擁有如此多複雜元件和設計變數的系統,最困難的部分是什麼?黃仁勳(00:01:11) 謝謝你的提問。極限協同設計之所以必要,是因為現在的問題已經無法裝入單台電腦並僅靠單個GPU來加速了。你試圖解決的問題是,你希望計算速度的提升能超過你增加的電腦數量。假設你增加了1萬台電腦,但你希望速度提升一百萬倍。突然之間,你必須提取演算法,將演算法拆解、重構,對流水線進行分片,對資料進行分片,對模型進行分片。當你以這種方式分佈式地處理問題時,不僅僅是擴大問題的規模,而是分散問題,那麼所有環節都會成為瓶頸。黃仁勳(00:02:03) 這就是阿姆達爾定律(Amdahl's law)的問題:某項任務的加速幅度取決於它在總工作量中所佔的比例。如果計算佔問題的50%,即使我將計算速度無限提升(比如一百萬倍),整個工作量的速度也只提升了兩倍。現在突然之間,你不僅要分配計算任務、以某種方式對流水線進行分片,還必須解決網路問題,因為所有這些電腦都連接在一起。在我們這樣的規模下進行分散式運算,CPU是個問題,GPU是個問題,網路是個問題,交換機也是個問題。在所有這些電腦上分配工作負載同樣是個問題。黃仁勳(00:02:57) 這是一個極其複雜的電腦科學問題。我們必鬚髮揮各種技術的威力。否則,我們只能線性地擴展,或者依靠摩爾定律的能力來擴展,而隨著登納德縮放定律(Dennard scaling)的放緩,摩爾定律已經在很大程度上停滯了。黃仁勳如何管理輝達萊克斯·佛里曼(00:03:16) 這其中肯定有權衡。而且你們涉及了完全不同的學科。我確信你們在這些領域都有專家:高頻寬記憶體、網路和NVLink、網路卡、光學和銅纜連接、供電、冷卻等等。這些都是世界級的專家。你是如何把他們聚在一個房間裡弄清楚——黃仁勳(00:03:34) 這就是為什麼我的管理團隊這麼龐大。萊克斯·佛里曼(00:03:37) 專家和通才的合作過程是怎樣的?當你清楚必須要把那些東西塞進一個機架時,你們是如何把機架組裝起來的?把它們全部設計在一起的過程是怎樣的?黃仁勳(00:03:51) 首先我們要問:什麼是極限協同設計?我們正在對從架構到晶片、到系統、到系統軟體、再到演算法和應用程式的整個軟體棧進行最佳化。這是一個層面。我們剛才談論的第二個層面,超越了CPU、GPU、網路晶片、向上擴展(scale-up)交換機和向外擴展(scale-out)交換機。當然,你還得把供電和冷卻等因素包括進去,因為所有這些電腦都極其耗電。它們完成大量工作,能效非常高,但總體上仍然消耗大量電力。所以第一個問題是:它是什麼?黃仁勳(00:04:34) 第二個問題是:為什麼需要它?我們剛剛討論了原因。你希望分配工作負載,使得收益超過單純增加電腦數量的收益。第三個問題是:如何實現?你是怎麼做到的?黃仁勳(00:04:51) 這可以說是這家公司的奇蹟。當你設計一台電腦時,你必須有一個電腦作業系統。當你設計一家公司時,你應該首先思考你想讓這家公司產出什麼。我見過很多公司的組織架構圖,它們看起來都一樣。漢堡型組織架構圖、扁平型組織架構圖,以及汽車公司的組織架構圖,看起來如出一轍。這對我來說毫無意義。一家公司的目標是成為產出成果的機器、機制和系統。這個產出就是我們想要創造的產品。公司架構的設計應該反映它所存在的環境。黃仁勳(00:05:36) 這幾乎直接決定了你應該如何設定組織架構。直接向我匯報的管理團隊有60人。我不會和他們進行一對一的會議,因為那是不可能的。如果你想完成工作,你的團隊裡就不可能有60個人還能一一對談——萊克斯·佛里曼(00:05:51) 但你依然有60個直接下屬,並且跨越了——黃仁勳(00:05:53) 還要更多。萊克斯·佛里曼(00:05:54) 更多。而且大多數明星員工至少都涉足工程領域。黃仁勳(00:05:59) 幾乎所有人都是。有記憶體專家,有CPU專家,有光學專家。萊克斯·佛里曼(00:06:06) 難以置信。黃仁勳(00:06:06) 還有GPU、架構、演算法、設計等領域的專家。萊克斯·佛里曼(00:06:11) 所以你時刻關注著整個技術堆疊,並且必須就整個技術堆疊的設計進行激烈的討論?黃仁勳(00:06:18) 從來沒有那次對話是單人進行的。這就是為什麼我不做一對一會議。我們提出一個問題,然後所有人一起攻克它。因為我們在做極限協同設計。毫不誇張地說,公司一直都在進行極限協同設計。萊克斯·佛里曼(00:06:33) 即使你們在討論一個特定的元件,比如冷卻、網路,所有人也都在旁聽?黃仁勳(00:06:40) 完全正確。萊克斯·佛里曼(00:06:41) 並且他們可以提出意見:“這不適合配電。這不適合——”黃仁勳(00:06:45) 正是如此。萊克斯·佛里曼(00:06:45) “……這不適合記憶體。這不適合那個。”黃仁勳(00:06:49) 完全正確。誰想不聽就可以不聽。原因在於,團隊裡的人知道什麼時候該集中注意力。如果這件事他們本可以做出貢獻卻沒有做,我會點名批評他們。所以我會說:“嘿,快來,加入討論。”萊克斯·佛里曼(00:07:07) 正如你所說,輝達是一家適應環境的公司。你覺得在那個時間點可以說環境發生了改變,公司開始悄悄地適應?從早期用於遊戲的GPU,到深度學習革命的早期,再到現在我們開始將其視為一個AI工廠?輝達是做什麼的?它生產AI,讓我們建立一個生產AI的工廠吧。黃仁勳(00:07:32) 我可以系統地推理這個過程。我們最初是一家加速器公司。但加速器的問題在於應用領域太窄了。它的優勢是針對特定工作進行了極度的最佳化。任何專家都有這個優勢。極度專業化的問題在於,你的市場範圍更窄,但這也沒關係。真正的問題在於,市場規模也決定了你的研發能力。而你的研發能力最終決定了你在計算領域可能產生的影響力。當我們最初作為一個非常具體的加速器起步時,我們一直知道那是我們的第一步。黃仁勳(00:08:23) 我們必須找到一種方法成為加速計算公司。問題是,當你成為一家計算公司時,目標變得太過通用,這削弱了你的專業性。我把這兩個實際上存在根本衝突的詞連在了一起。我們作為計算公司做得越好,作為專家的表現就越差。我們越是專家,進行整體計算的能力就越弱。我故意把這兩個詞連在一起,這意味著公司必須一步一步地找到那條極其狹窄的道路,既要擴大我們的計算範圍,又不能放棄我們擁有的一最重要的專業能力。我們超越加速器邁出的第一步,是發明了可程式設計像素著色器。黃仁勳(00:09:13) 這是邁向可程式設計性的第一步。這是我們向計算世界進軍的第一段旅程。我們做的第二件事是將單精度浮點數(FP32)引入我們的著色器。支援IEEE標準的FP32是朝著計算方向邁出的一大步。這也是為什麼所有從事流處理器和其他類型資料流處理器研發的人發現了我們。他們說:“突然之間,我們也許可以使用這個計算密集度極高、且相容IEEE標準的GPU了。”黃仁勳(00:09:55) 我可以把以前在CPU上編寫的軟體拿過來,看看能不能用GPU來運行。這促使我們在FP32之上加入了C語言特性,我們稱之為Cg。Cg的發展路徑最終將我們引向了CUDA。一步一步地,我們將CUDA引入了GeForce,這是一項極具挑戰的戰略決策,因為它耗費了公司大量的利潤,當時我們根本負擔不起。但我們還是這樣做了,因為我們想成為一家計算公司。計算公司必須有計算架構。計算架構必須相容我們建構的所有晶片。萊克斯·佛里曼(00:10:42) 能詳細講講那個決定嗎?把CUDA放進GeForce,負擔不起卻依然決定這麼做?你能解釋一下這個決定嗎?為什麼敢於做出這樣的選擇?黃仁勳(00:10:53) 那是第一個幾乎可以說是關乎生死存亡的戰略決策。萊克斯·佛里曼(00:11:06) 給不瞭解這段歷史的人劇透一下,後來證明這是公司歷史上做出的最輝煌、最睿智的決策之一。CUDA成為了這個AI基礎設施世界中令人難以置信的計算基礎。所以設定一下背景,這最終被證明是一個好決定。黃仁勳(00:11:27) 是的,後來證明這是一個好決定。事情是這樣的。我們發明了這個叫CUDA的東西,它擴大了我們的加速器可以加速的應用程式範圍。問題是,我們如何吸引開發者來使用CUDA?因為計算平台的核心是開發者。開發者不會僅僅因為一個平台能執行一些有趣的操作就跑過來。他們來到一個計算平台,是因為它的裝機量大。因為開發者和所有人一樣,想要開發能觸及大量使用者的軟體。裝機量實際上是架構中最重要的一部分。這個架構本身可能會招致大量的批評。黃仁勳(00:12:18) 例如,沒有那個架構受到的批評比x86更多,它被認為是一個不夠優雅的架構,但它卻是當今的定義性架構。這是一個例子。實際上,許多由世界上最聰明的電腦科學家設計的極其優雅的RISC架構都在很大程度上失敗了。我舉了這兩個例子,一個是優雅的,另一個僅僅是勉強能用,然而x86存活了下來,原因在於——萊克斯·佛里曼(00:12:58) 裝機量就是一切。黃仁勳(00:12:59) 裝機量定義了架構。其他一切都是次要的,明白嗎?當時還有其他架構,CUDA出來了,OpenCL也在。有幾個競爭的架構。但我們做出的正確決定是,我們說:“聽著,歸根結底這是關於裝機量的問題,我們能把新計算架構推向世界的最好方法是什麼?”那個時候,GeForce已經取得了成功。黃仁勳(00:13:29) 我們每年已經能賣出數百萬個GeForce GPU。我們說:“我們應該把CUDA放到GeForce上,把它放進每一台PC裡,不管客戶用不用,並把它作為培養我們裝機量的起點。”與此同時,我們去吸引開發者,去大學裡寫書、開課,把CUDA放到各個地方。漸漸地,人們發現了它。當時PC是主要的計算工具,還沒有雲,我們可以把一台超級電腦交到學校裡每個研究員、每個科學家、每個工科學院、每個學生的手中。最終,奇蹟一定會發生。黃仁勳(00:14:15) 問題在於,CUDA極大地增加了GPU這個消費級產品的成本,完全吞噬了公司所有的毛利潤。那時候公司市值大概是80億美元?或者是六七十億美元?當我們推出CUDA後,我意識到它會增加很多成本,但這是我們堅信的東西。我們的市值一度跌到了大概15億美元。我們在谷底徘徊了一段時間,然後慢慢爬了回來,但我們堅持在GeForce上搭載CUDA。我總是說輝達是GeForce建立起來的殿堂,因為是GeForce把CUDA帶給了所有人。黃仁勳(00:15:10) 研究人員、科學家,他們之所以在GeForce上發現CUDA,是因為他們中很多人也是遊戲玩家。很多人反正也要自己組裝PC。在大學實驗室裡,很多人使用PC元件自己搭建叢集。我們就是這樣起步的。萊克斯·佛里曼(00:15:31) 然後這成為了深度學習革命的平台和基礎。黃仁勳(00:15:35) 那也是一個非常偉大的觀察結果。萊克斯·佛里曼(00:15:38) 在那個生死存亡的時刻,你還記得那些會議是什麼樣的嗎?作為一家公司決定拿一切去冒險,討論的情形是怎樣的?黃仁勳(00:15:48) 我必須向董事會表明我們想做什麼,管理團隊也知道我們的毛利率會被壓垮。你可以想像這樣一個世界:GeForce背負著CUDA的成本,但沒有遊戲玩家欣賞它,也沒有玩家願意為它買單。他們只願意付特定的價格,根本不在乎你的成本是多少。我們將成本增加了50%,而我們原本是一家毛利率35%的公司。所以做出這個決定非常艱難。但你可以想像,總有一天它會進入工作站,進入超級電腦,在這些領域,也許我們能獲取更高的利潤。黃仁勳(00:16:36) 所以你可以用理性的推導讓自己覺得能承受這個代價,但這仍然花了十年時間。萊克斯·佛里曼(00:16:45) 那更多是與董事會溝通說服他們,但在心理層面,隨著輝達不斷做出預測未來的大膽押注,並在一定程度上特別是現在定義了未來。我想向您請教一些智慧,關於您是如何有能力做出這些決策,帶領公司實現跨越的?黃仁勳(00:17:14) 首先,我有極強的好奇心。在某個時刻,會有一個推理系統非常清晰地使我確信這個結果將會發生。這必然會發生。所以在我的腦海中我是堅信的,當我內心堅信時,你也知道那是怎樣的。你在腦海中顯化了一個未來,那個未來如此令人信服,它不可能不發生。在這中間會有很多磨難,但你必須堅持你的信念。萊克斯·佛里曼(00:17:52) 所以你設想了未來,本質上從工程的角度,你將它變成了現實?黃仁勳(00:17:59) 是的。你要推理如何到達那裡。你要推理它為什麼必須存在。我們在這裡一起推理。管理團隊會去推理。我會花很多時間去推理。下一部分可能是一項管理技能。通常在領導層中,領導者會保持沉默,或者他們瞭解到一些事情,然後發表一些宣言:“這是全新的一年,到明年年底我們要有一個全新的計畫。”這裡進行大裁員,那裡進行大架構調整,提出新的使命宣言,設計新標識之類的東西。黃仁勳(00:18:43) 我從不這樣做。當我瞭解到某件事,並且它開始影響我的思考時,我會向我身邊的每個人明確表示:“這件事很有趣。這將會帶來改變。這將會影響那件事。”我會一步一步地去推理。很多時候我已經做出了決定,但我會抓住每一個可能的機會——外部資訊、新的洞察、新的發現、工程上的新啟示、新設立的里程碑——我會利用這些機會來塑造其他人的信念系統。我幾乎每天都在這麼做。我和董事會這麼做,和管理團隊這麼做,和員工這麼做。黃仁勳(00:19:33) 我試圖塑造他們的信念系統,這樣當某天我說“嘿,我們收購Mellanox吧”時,大家都會覺得這是理所當然的,我們絕對應該買。當我說“夥計們,讓我們在深度學習上全力以赴”並且告訴他們原因時,其實我已經為公司內部的各個組織鋪好了磚。每個組織、每個人可能都聽到了一些內容,大多數人都聽到了其中的片段。當我宣佈的那天,每個人都已經接受了其中的許多部分。黃仁勳(00:20:19) 在很多方面,當我宣佈這些事情時,我能想像員工們都在說:“黃仁勳,你怎麼這麼久才說?”事實上,我一直在塑造他們的信念系統。所以領導力,有時候看起來像是你在後面引導,但你一直在塑造他們,直到我宣佈的那天,大家100%買帳。但這正是你想要的結果。你想帶所有人一起前進。否則,如果我們突然宣佈關於深度學習的計畫,所有人都會說:“你在說什麼?”如果你宣佈全力投入某件事,你的管理團隊、董事會、員工、客戶會覺得:“這是從那兒冒出來的?”黃仁勳(00:21:02) “這太瘋狂了。”如果你回顧過去的GTC大會,看看那些主題演講,其實我同時也在塑造行業內合作夥伴的信念系統,我利用這一點來塑造我員工的信念系統。所以到了我宣佈某件事的時候,比如我們剛剛宣佈了Groq,其實過去兩年半我一直在談論相關的基石。你回顧過去會發現:“天那,他們已經談論這個談了兩年半了。”我一直在一步一步地打地基,所以當時機成熟宣佈時,大家都在說:“你怎麼花了這麼長時間?”萊克斯·佛里曼(00:21:44) 但這不僅僅是在公司內部。你正在塑造這個行業,以及更廣泛的全球創新格局。把這些想法拋出來,你真的在使現實具象化。黃仁勳(00:21:53) 我們不造電腦。實際上我們不建雲。我們原來是一家計算平台公司。所以沒有人能直接從我們這裡買到成品。這很奇妙。我們進行垂直整合以完成設計和最佳化,但在每個層級我們將整個平台完全開放,以便整合到其他公司的產品、服務、雲、超級電腦和OEM電腦中。所以令人驚嘆的是,如果沒有先說服他們,我根本做不成我現在做的事。GTC大部分的作用就是展現未來,以至於當我們的產品準備好時,他們會說:“你怎麼這麼慢才拿出來?”AI縮放定律萊克斯·佛里曼(00:22:39) 是的。很長一段時間以來,你都是廣義縮放定律(Scaling Laws)的信徒。你現在依然相信縮放定律嗎?黃仁勳(00:22:49) 是的。現在我們有了更多的縮放定律。萊克斯·佛里曼(00:22:51) 我認為你總結了四個階段的縮放定律:預訓練、後訓練、測試時間(推理)和智能體(Agentic)縮放。當你思考未來,深遠的未來和近期的未來時,你最擔心、最讓你徹夜難眠、為了繼續擴展必須克服的阻礙是什麼?黃仁勳(00:23:12) 我們可以回顧一下人們過去認為是阻礙的因素。在最初的預訓練縮放定律階段。人們理所當然地認為,我們擁有的高品質資料量將限制我們能達到的智能水平。這個縮放定律非常重要。模型越大,相應更多的資料就會帶來更聰明的AI。這就是預訓練。伊利亞·蘇茨克維(Ilya Sutskever)當時說:“我們的資料用光了”或者類似的話。“預訓練結束了”。整個行業都恐慌了,認為這就是AI的盡頭。但這顯然不是真的。黃仁勳(00:23:57) 我們將繼續增加用於訓練的資料量。其中很多資料可能是合成的(Synthetic),這也讓人們感到困惑。人們沒有意識到,或者忘記了,我們用來相互教導、相互告知的大部分資料其實也是“合成”的。它是合成的,因為它不是從自然界中直接長出來的。你創造了它。我消費它。我修改它,增強它,我重新生成它,其他人再消費它。我們現在已經達到了這樣一個水平:AI能夠獲取基礎事實(Ground Truth),對其進行增強……合成生成海量的資料。黃仁勳(00:24:47) 後訓練這部分繼續擴展,因此我們可以使用的人類生成的資料量將變得越來越小。我們用來訓練模型的資料量將繼續增長,直到我們不再受限於資料……訓練現在受限於算力。原因就是大部分資料是合成的。然後下一個階段是測試時間(推理),我還記得人們告訴我:“推理?哦,那很簡單。預訓練才難呢。那可是巨型系統。推理肯定很簡單。所以推理晶片只會是一些小晶片——”黃仁勳(00:25:32) “它們不會像輝達的晶片那樣。那太複雜、太昂貴了。在未來,推理將是最大的市場,它會變得很簡單,我們會把它商品化。每個人都能造自己的晶片。”這對我來說一直是不合邏輯的,因為推理就是思考,而我認為思考很難。思考比閱讀難得多。黃仁勳(00:25:59) 預訓練只是記憶和泛化,在關係中尋找模式。你只是在不停地讀。而測試時間縮放(推理)涉及的是思考、推理、解決問題。將未探索的經歷、新經驗分解為可解決的片段,然後我們通過第一性原理推理,或通過以前的例子和先前的經驗去解決它。或者僅僅是探索、搜尋、嘗試不同的方法。推理階段的整個測試時間縮放過程,實際上是關於思考的。它是關於推理、規劃和搜尋的。黃仁勳(00:26:50) 這怎麼可能是輕算力的呢?我們在這方面完全正確。測試時間的擴展是極度耗費算力的。接下來的問題是,現在我們在推理和測試時間縮放階段,那這之後是什麼?顯然,我們現在創造了一個智能體“人”,這個智能體“人”擁有我們開發的大語言模型。但在測試期間,這個智能體系統會去進行研究,敲擊資料庫,去使用各種工具,而它做的最重要的一件事,就是衍生並生成一大堆子智能體(Sub-agents)。這意味著我們正在組建龐大的團隊。通過僱傭更多的員工來擴展輝達,比擴展我自己要容易得多。黃仁勳(00:27:44) 因此,下一個縮放定律就是智能體縮放定律(Agentic Scaling Law)。這就好比複製AI。我們可以隨心所欲地快速衍生智能體。所以,我總結了四個維度的縮放定律。噹噹我們使用智能體系統時,它們會創造更多的資料,創造大量的經驗。對於其中一些,我們會說:“哇,這真的很好。我們應該把這個記住。”黃仁勳(00:28:12) 然後這個資料集又會回到預訓練階段。我們記憶並泛化它。然後我們在後訓練階段對其進行微調和完善。接著我們利用測試時間和智能體系統進一步增強它,然後輸出到行業中。這個循環會不斷持續下去。歸根結底,智能水平將通過一件事來擴展,那就是算力。萊克斯·佛里曼(00:28:41) 但這裡有一個棘手的問題,你必須預測未來,因為其中一些元件需要不同類型的硬體才能以最佳狀態運行。所以你必須預測AI的創新將走向何方。比如,混合專家模型(MoE)——黃仁勳(00:28:57) 非常對。萊克斯·佛里曼(00:28:58) 帶有稀疏性的模型。黃仁勳(00:28:59) 完全正確。萊克斯·佛里曼(00:29:00) 硬體不可能在一周內說換就換。你必須預測未來的形態。要做到這點非常可怕,也非常困難,對吧?黃仁勳(00:29:09) 比如,這些AI模型架構大約每六個月就會更新一次。而系統架構和硬體架構大約三年更新一次。所以你需要預測兩三年後可能會發生什麼。有幾種方法可以做到這一點。首先,我們自己在內部進行研究,這也是為什麼我們既有基礎研究,也有應用研究的原因。黃仁勳(00:29:40) 我們建立自己的模型。因此我們在這裡有第一手的生活經驗。這是我談到的協同設計的一部分。我們也是世界上唯一一家幾乎與世界上所有AI公司合作的AI公司。我們在力所能及的範圍內,試圖去感知人們正在經歷那些挑戰。萊克斯·佛里曼(00:29:59) 所以你在傾聽整個行業、各大AI實驗室的低語。黃仁勳(00:30:02) 沒錯。你必須傾聽並向所有人學習。最後一部分是擁有一個靈活的、能隨風而動的架構。CUDA的好處之一是,一方面它是極其強大的加速器;另一方面,它非常靈活。這種在專業化(否則無法加速CPU)和通用性(以便適應不斷變化的演算法)之間的驚人平衡,非常非常重要。這也是為什麼CUDA一方面極具韌性,另一方面我們還能不斷對其進行增強。黃仁勳(00:30:44) 我們現在已經到了CUDA 13.2。我們進化架構的速度非常快,以至於我們能夠跟上現代演算法的步伐。例如……當混合專家模型(MoE)出現時,這就是我們推出NVLink 72而不是NVLink 8的原因。我們現在可以將一個擁有4兆、10兆參數的模型放入一個計算域中,就好像它在一個GPU上運行一樣。人們可能沒注意到我說過這句話,但如果你看看Grace Blackwell機架的架構,它完全專注於做一件事:處理大語言模型(LLM)。僅僅一年後,你看到了Vera Rubin機架。它有儲存加速器,有被稱為Vera的出色新CPU。它有Vera Rubin和NVLink 72來運行LLM。黃仁勳(00:31:46) 它還擁有一個名為Rock的全新附加機架。所以這整個機架系統與上一個完全不同,它包含了所有這些新元件。原因在於上一代系統是為了運行MoE大型語言模型推理設計的。而這一代是為了運行智能體,智能體會呼叫各種工具。萊克斯·佛里曼(00:32:10) 顯然,該系統的設計肯定在Open-Claude、Codex等出現之前就已經完成了。所以你本質上是在預判未來。這來源於什麼?來自於行業內的低語,還是對技術最前沿的理解?黃仁勳(00:32:25) 不。萊克斯·佛里曼(00:32:25) 不是?黃仁勳(00:32:26) 沒那麼複雜。你只需要去推理。不管發生什麼,如果在某個時候我們要讓大語言模型成為一個數字工作者……讓我們用這個比喻。假設我們希望LLM成為數字工作者。它必須做什麼?它必須訪問基礎事實(Ground truth)。那就是我們的檔案系統。它必須能夠做研究。它不可能無所不知。我不想等到這個AI變得對過去、現在和未來的一切都無所不知之後再讓它發揮作用。因此,我不如讓它去做研究。很明顯;如果它想幫我,它就得使用我的工具。黃仁勳(00:33:13) 很多人會說:“AI會徹底摧毀軟體。我們不再需要軟體了。我們甚至不再需要工具了。”這太荒謬了。讓我們用一個思想實驗。你可以坐在那兒,品一杯威士忌,思考所有這些事情,一切都會變得顯而易見。如果我們要在未來10年內創造出能想像到的最神奇的智能體,假設它是一個人形機器人。如果這個人形機器人被創造出來,它是更有可能走進我家,用我現有的工具來完成它的工作?黃仁勳(00:33:54) 還是說它的手在一個場景下變成一把10磅重的錘子,在另一個場景下變成手術刀,而為了燒水,它的手指能發射微波?或者是它更可能直接使用微波爐?第一次走向微波爐時,它可能不知道怎麼用。但沒關係。它連接在網際網路上。它讀取這台微波爐的手冊,讀完後立刻成為專家。然後它就可以使用了。我認為我剛才描述的,實際上幾乎囊括了Open-Claude的所有屬性。黃仁勳(00:34:35) 它將使用工具,訪問檔案,能夠進行研究。它有一個IO子系統。當你以這種方式推理完畢後,你會說:“天那,這對計算未來的影響是極其深遠的。”原因是,我認為我們剛剛重新發明了電腦。然後你現在會問:“好,我們是什麼時候推理出這個的?我們什麼時候推理出Open-Claude的?”如果你去看我在GTC大會上使用過的Open-Claude示意圖,你會發現那是兩年前的事。就在兩年前的GTC上,我就在談論智能體系統,這與今天的Open-Claude完全吻合。當然,許多事情必須匯聚在一起才能發生。黃仁勳(00:35:26) 首先,我們需要Claude、GPT以及所有這些模型達到一定的能力水平。因此,他們的創新、突破和持續進步非常重要。然後,當然有人必須建立一個足夠穩健、足夠完整的開放原始碼專案,以便我們大家都能將其投入使用。我認為Open-Claude對智能體系統的影響,就如同ChatGPT對生成式系統的影響一樣。我認為這是一件非常重要的事情。萊克斯·佛里曼(00:36:02) 是的,這是一個非常特殊的時刻。我不太確定為什麼它能吸引全世界如此多的關注,但它確實做到了,甚至比Claude Code和Codex等還要引人矚目。黃仁勳(00:36:12) 因為消費者能夠接觸到它。萊克斯·佛里曼(00:36:13) 確實。但這很大程度上也是一種氛圍。彼得(Peter),我曾邀請他上過播客,他是個很棒的人。所以部分原因也是代表這個產品的人帶來的影響。黃仁勳(00:36:25) 毫無疑問。萊克斯·佛里曼(00:36:25) 部分原因是因為迷因(Memes),而且我們都在試圖弄清楚它。當擁有如此強大的技術時,如何移交你的資料讓它們能做有用的事?這裡存在極其嚴肅且複雜的安全問題,與之相關的事情也很可怕。無論是作為個體還是作為一種文明,我們都在摸索如何找到正確的平衡點。黃仁勳(00:36:44) 是的,我們立刻採取了行動,派出了許多安全專家。我們做了一個叫做OpenShell的項目。它已經被整合到了Open-Claude中。萊克斯·佛里曼(00:36:55) 輝達推出了NemoClaw(註:此處指輝達相關安全工具)。黃仁勳(00:36:58) 沒錯。萊克斯·佛里曼(00:36:59) 它安裝起來非常簡單,能確保安全性。黃仁勳(00:37:03) 我們給你三項權限中的兩項。智能體系統可以訪問敏感資訊,可以執行程式碼,也可以與外部通訊。如果我們在任何時候只給你這三項能力中的兩項,而不是全部三項,我們就能保證安全。在授予的這兩項能力中,我們還根據企業賦予你的任何權利來提供存取控制。然後我們將其連接到所有這些企業已經擁有的策略引擎上。所以我們將盡最大努力幫助Open-Claude變得更好。AI縮放定律的最大阻礙萊克斯·佛里曼(00:37:40) 你雄辯地解釋了我們如何擁有著一段被認為是阻礙、但最終我們克服了阻礙的漫長歷史。但現在展望未來,既然智能體將無處不在已經顯而易見,顯然我們需要大量的算力。那麼,進一步擴展的阻礙將會是什麼?黃仁勳(00:37:59) 電力是一個顧慮,但不是唯一的顧慮。這也是我們為什麼大力推進極限協同設計的原因,以便我們每年都能將每瓦每秒生成的Token數提高幾個數量級。在過去的10年中,按照摩爾定律,計算能力會提高大約100倍。而我們在過去10年中通過擴大規模,將計算能力提升了一百萬倍。我們將通過極限協同設計繼續這樣做。能效,即每瓦性能,完全影響著一家公司的收入,影響著一家工廠的收入。我們將把能效推向極限,以便儘可能快地降低Token的成本。黃仁勳(00:38:51) 我們的電腦價格在上漲,但我們生成Token的效率提升得快得多,因此Token的成本正在下降。每年都在以一個數量級的速度下降。萊克斯·佛里曼(00:39:04) 電力是一個很有趣的問題。試圖繞過電力障礙的方法是,通過提高每瓦每秒生成的Token數,使其變得越來越高效。當然,如何獲取更多的電力也是個問題。黃仁勳(00:39:16) 我們確實也應該獲取更多電力。供應鏈萊克斯·佛里曼(00:39:17) 這是一個非常複雜的問題。你談到過小型模組化核電站。針對能源有很多想法。AI供應鏈的瓶頸問題有多少次讓你徹夜難眠?比如擁有EUV光刻機的ASML,擁有像CoWoS這樣的先進封裝技術的台積電,以及擁有高頻寬記憶體的SK海力士?黃仁勳(00:39:38) 一直都在想,我們無時無刻不在解決這些問題。歷史上從未有一家公司在以我們這樣的規模增長的同時,還能加速這種增長。這簡直難以置信。人們甚至很難理解這一點。在整個AI計算領域,我們正在增加市場份額。因此,供應鏈的上下游對我們來說都極其重要。我花了很多時間與我合作的所有CEO交流:有那些動態將促使這種增長繼續甚至加速?這部分原因解釋了為什麼在GTC上,坐在我右邊的幾乎是整個上游IT行業的CEO和整個下游基礎設施行業的CEO。黃仁勳(00:40:32) 他們都在。有好幾百位CEO。我不認為歷史上曾有過幾百位CEO出席的主題演講。原因之一是,我在告訴他們我們現在的業務狀況。我在告訴他們不久的將來的增長驅動力以及正在發生的事情。我還在描述我們下一步將走向何方,以便他們可以利用所有這些資訊和動態來指導他們的投資決策。就像我通知我自己的員工一樣,我也這樣通知他們。記憶體黃仁勳(00:41:06) 當然,然後我會親自去拜訪他們,確保“嘿,聽著,我希望你們知道,在這個季度、今年、明年,這些事情將會發生。”如果你去看看DRAM(動態隨機存取記憶體)行業的CEO們——世界上排名第一的DRAM曾經是資料中心CPU使用的DDR記憶體。大約三年前,我成功說服了幾位CEO:儘管當時HBM(高頻寬記憶體)的使用非常稀少,甚至超級電腦都很少用,但這將成為未來資料中心的主流記憶體。一開始這聽起來很荒謬,但有幾位CEO相信了我,並決定投資製造HBM記憶體。黃仁勳(00:41:55) 另一种放到資料中心顯得有些奇怪的記憶體是用於手機的低功耗記憶體。我們希望他們能對其進行改造,以適用於資料中心的超級電腦。他們說:“用手機記憶體做超級電腦?”我向他們解釋了原因。現在看看這兩種記憶體:LPDDR5和HBM4。需求量簡直驚人。這三家公司(生產這些記憶體的)都迎來了歷史上創紀錄的一年,而這些都是擁有45年歷史的老牌公司。所以,我的部分工作就是去告知、塑造和啟發。萊克斯·佛里曼(00:42:36) 所以你不僅僅是在構想未來並激勵輝達公司的不同工程師,你還在塑造未來的供應鏈。你在和台積電、ASML進行對話。黃仁勳(00:42:50) 上游、下游。萊克斯·佛里曼(00:42:51) 上游,下游。所以這就是關鍵。黃仁勳(00:42:53) GE(通用電氣)、Caterpillar(卡特彼勒)。沒錯,那是我們的下游。就是這樣。萊克斯·佛里曼(00:42:59) 是的,整個系統。整個半導體行業涉及的極度困難的工程技術太多了,供應鏈是如此錯綜複雜,元件如此之多,這讓人感到可怕,但它竟然奇蹟般地運轉起來了。黃仁勳(00:43:18) 沒錯,深度的科學。深度的工程,不可思議的製造。如今大部分製造都已經是機器人化了。但我們有幾百家供應商,他們提供的技術組成了我們擁有130萬個元件的機架。每個機架有一百三十到一百五十萬個元件。Vera Rubin機架背後有200家供應商。萊克斯·佛里曼(00:43:45) 有趣的是,在讓你徹夜難眠的阻礙清單中,你沒有列出這一點。黃仁勳(00:43:49) 因為我已經做了所有必要的事情去——萊克斯·佛里曼(00:43:52) 好的。黃仁勳(00:43:52) 明白了嗎?我可以安心睡覺了,因為我已經搞定了。我對自己說:“好了,讓我推理一下。什麼對我們最重要?”因為我們將系統架構從你記憶中最初的DGX-1改變為NVLink-72機架級計算——這意味著什麼?這對軟體意味著什麼?對工程意味著什麼?對我們設計和測試的方式意味著什麼?這對供應鏈意味著什麼?其中一個影響是,我們將原本在資料中心進行的超級電腦整合工作,前置到了供應鏈中的超級電腦製造環節。黃仁勳(00:44:42) 如果你這麼做,你還必須認識到……假設你想建一個資料中心,需要50千兆瓦的超級電腦同時運行,而在供應鏈中製造那50千兆瓦的超級電腦需要一周的時間。那麼供應鏈每周就需要一千兆瓦的電力來建構和測試這些在供應鏈中的超級電腦,然後我才能發貨。萊克斯·佛里曼(00:45:25) 哦。黃仁勳(00:45:25) 而NVLink-72真的是在供應鏈裡建構超級電腦,然後以每個機架兩三噸的重量直接發貨。過去元件是分開運來的,我們在資料中心內部組裝。但現在不可能了,因為NVLink-72的密度太高了。所以這就是一個例子。我必須飛到供應鏈那裡,去見我的合作夥伴,說:“嘿,猜猜看?這就是我們將要做的……這是我們過去建構DGX的方式。現在我們要這樣建構。這將會好得多,因為我們在推理方面將需要它們。”推理的市場正在到來。推理的拐點即將到來。這將是一個巨大的市場。黃仁勳(00:46:05) 首先我向他們解釋發生了什麼,為什麼會發生,然後我要求他們每家都投入幾十億美元的資本支出。因為他們信任我,我也非常尊重他們,我給他們充分的機會來質疑我,我花時間向人們解釋事物,用第一性原理去推理。我畫圖表,進行第一性原理推理。當我跟他們談完時,他們知道該怎麼做了。萊克斯·佛里曼(00:46:35) 所以很大一部分是關於關係,以及建立對未來的共同願景。但你會擔心某些瓶頸嗎?供應鏈中最大的瓶頸是什麼?你擔心ASML的EUV工具嗎?擔心台積電的CoWoS封裝技術擴張速度夠不夠快嗎?正如你所說,你們不僅增長得難以置信地快,而且還在加速增長。感覺供應鏈中的每個人,這些顯然都是瓶頸環節,都必須擴大規模。你有沒有和他們溝通,比如如何才能更快地擴大規模?黃仁勳(00:47:12) 無時無刻不在溝通。萊克斯·佛里曼(00:47:12) 你擔心嗎?黃仁勳(00:47:13) 不擔心。萊克斯·佛里曼(00:47:13) 好的。黃仁勳(00:47:14) 因為我已經告訴他們我需要什麼。他們理解了我的需求。他們告訴了我他們將去做什麼,我也相信他們會去做到。電力萊克斯·佛里曼(00:47:22) 很有意思。聽到這個太好了。我們再在電力問題上稍作停留。你對解決能源問題有什麼期望?黃仁勳(00:47:30) 萊克斯,這是我特別想探討的一個領域,把這個資訊傳遞出去。我們的電網是為最壞的情況設計的,並且還留有一定的余量。但實際上99%的時間裡,我們根本達不到最壞的情況,因為最壞的情況僅僅是冬天最冷的幾天、夏天最熱的幾天以及極端天氣。大多數時候我們遠沒有達到極限情況,可能只運行在峰值負荷的大約60%。黃仁勳(00:48:08) 所以99%的時間裡,我們的電網都有多餘的電力被閒置著。但它們必須被閒置備用,以防萬一。當關鍵時刻到來時,醫院必須有電,基礎設施必須有電,機場必須運轉等等。我的問題是,我們是否可以去幫助他們理解並簽訂合同協議,重新設計電腦架構系統和資料中心。這樣,當社會基礎設施需要最大電力時,資料中心獲得的電力就會減少。黃仁勳(00:48:49) 反正這種情況也非常罕見。在那段時間裡,我們或者為那一小部分需求配備備用發電機,或者讓我們的電腦將工作負載轉移到其他地方,或者讓電腦運行得慢一點。我們可以降低性能,減少功耗,並在有人請求答案時提供稍微長一點的延遲響應。我認為,相比於期望100%的正常執行階段間——這些要求極其嚴苛的合同給電網帶來了巨大的壓力,現在他們將不得不進一步提高最大容量。我只是想利用他們閒置的多餘電力而已。萊克斯·佛里曼(00:49:36) 是的,這個話題討論得還不夠。是什麼阻礙了這一點?是監管嗎?是官僚主義嗎?黃仁勳(00:49:43) 我認為這是一個三方面的問題。首先是從最終客戶開始的。最終客戶對資料中心提出要求,認為它們絕對不能出現不可用的情況。所以最終客戶期望的是完美。為了交付這種完美,你需要發電機和電網供應商結合起來兌現這100%的承諾。每個人都要求“六個九”(99.9999%的可用性)。首先,現在我們必須讓所有人都明白,當客戶提出這些要求時,你們資料中心營運團隊的人可能並沒有和CEO溝通。我打賭CEO不知道這件事。我要去和所有的CEO談談。黃仁勳(00:50:28) CEO們可能根本沒關注正在簽署的合同條款,所有人當然都想簽最好的合同。他們去找雲服務提供商(CSP),那些參與談判的合同談判員……我都能想像出他們的樣子。他們談判這些多年的合同,雙方都想要最有利的條款。結果就是,CSP接著去找公用事業公司,要求“六個九”的保障。我認為第一件事就是要確保所有客戶、CEO們明白他們到底在要求什麼。第二件事,我們需要建設能夠優雅降級(Gracefully degrade)的資料中心。黃仁勳(00:51:13) 所以,如果公用事業公司、電網告訴我們:“聽著,我們必須把你們的電力供應降到80%。”我們會說:“完全沒問題。”我們會移動工作負載。我們會確保資料絕不丟失,但我們可以降低計算速率,使用更少的能源。服務質量會稍微下降一點。對於關鍵工作負載,我立刻把它轉移到其他地方,這樣我就沒有問題了。找到仍然擁有100%正常執行階段間的資料中心。萊克斯·佛里曼(00:51:44) 在資料中心裡實現智能的、動態的電力分配,這是一個多難的工程問題?黃仁勳(00:51:49) 只要你能設定出規範,你就能把它造出來。這句話說得很好。只要它符闔第一性原理和物理定律,我認為就沒問題。萊克斯·佛里曼(00:51:58) 你剛提到的第三件事是什麼?黃仁勳(00:52:00) 所以第二件事是資料中心。第三件事是我們需要公用事業公司也認識到這是一個機會。與其說“聽著,我需要五年時間才能增加電網容量”,不如說“如果你願意接受這種保障等級的電力,我下個月就能以這個價格為你提供”。如果公用事業公司提供更多不同層級的電力交付承諾,我認為所有人都能找出應對之策。目前電網裡的浪費實在是太多了。我們應該去解決這個問題。埃隆·馬斯克與Colossus萊克斯·佛里曼(00:52:43) 你高度讚揚了埃隆·馬斯克和xAI在孟菲斯(Memphis)的成就,他們在創紀錄的時間內——僅僅四個月,就建成了Colossus超級電腦。現在它擁有20萬個GPU,並且還在快速增長。在你的理解中,他解決問題的方法是否對所有資料中心建設者都有指導意義,從而促成了那樣的成就?他對待工程的態度,對待整個建設管理的方法?黃仁勳(00:53:15) 首先,埃隆在很多不同領域都有很深的造詣。同時,他也是一個非常優秀的系統思考者。因此,他能夠貫穿多個學科進行思考,他顯然會推動事物發展,質疑一切:第一,這是必要的嗎?第二,必須這樣用這種方式做嗎?第三,需要花這麼長時間嗎?他有能力質疑一切,直到把所有東西縮減到絕對必要的最低限度,你無法再剔除任何東西,而產品依然保留了必需的功能。他做到了你能想像到的極致的極簡主義,並且是在系統層面上做到這一點的。我還喜歡的一點是,他會親臨現場。黃仁勳(00:54:25) 他會親自去那裡。如果出現問題,他就會直接去現場說:“把問題指給我看。”當你將這些結合起來時,你就克服了許多過去的慣性思維:“我們一直都是這樣做的”,“我在等他們”。這完全是在找藉口。最後一點,當你帶著如此強烈的緊迫感親力親為時,會讓所有人也充滿緊迫感。每個供應商都在同時處理很多客戶的很多項目,但他有辦法讓他自己成為其他所有人項目中優先順序最高的那一個。他通過親身示範做到了這一點。萊克斯·佛里曼(00:55:09) 是的,我參加過很多那樣的會議。看他工作很有趣,因為真的沒有足夠多的人會去問這樣的問題:“這能做得更快一點嗎?怎麼做?為什麼非得花這麼長時間?”黃仁勳(00:55:21) 是的,對。萊克斯·佛里曼(00:55:22) 然後這通常會變成一個工程問題。當你到瞭解實際的基層真相時……我記得有一次我和他在一起,他真的在從頭到尾過一遍如何將電纜插入機架的整個流程。他與在現場執行該任務的工程師合作,他只是想瞭解這個過程是什麼樣的,如何才能減少出錯的可能。從組裝資料中心的每一個單項任務中建立直覺——萊克斯·佛里曼(00:55:52) 你開始在細節尺度和廣闊的系統尺度上立刻感覺到那裡存在低效,因此你可以讓它變得越來越高效。此外,你還擁有強大的執行力去說:“讓我們完全用不同的方式來做——”黃仁勳(00:56:08) 是的。沒錯。萊克斯·佛里曼(00:56:09) “——並移除所有可能的阻礙。”黃仁勳(00:56:10) 沒錯。黃仁勳的工程與領導哲學萊克斯·佛里曼(00:56:11) 你覺得輝達極限系統協同設計的方法,與埃隆處理系統工程的方式有相似之處嗎?黃仁勳(00:56:18) 首先,協同設計是終極的系統工程問題。所以我們從第一性原理出發來開展工作。我們做的另一件事——這也是我在30年前提出的一種哲學、一種心態或者說一種方法——叫做“光速”。光速不僅僅是指速度。光速是我的一個縮略語,代表著物理學的極限所在。所以我們做的每一件事都會與“光速”進行對比。記憶體速度、數學計算速度、電力、成本、時間、精力、人員數量、製造周期時間。黃仁勳(00:57:09) 當你思考延遲與吞吐量的權衡,當你思考成本與吞吐量、成本與容量的關係時,你會對所有這些不同的約束條件分別進行測試,將其逼近物理極限(光速)。然後當你綜合考量時,你知道必須做出妥協。因為實現極低延遲的系統架構與實現極高吞吐量的系統架構在根本上是不同的。但你想知道實現高吞吐量系統的極限是什麼?實現低延遲系統的極限又是什麼?然後當你考慮整個系統時,你就可以進行權衡。所以我強迫每個人從第一性原理、從極限出發去思考。黃仁勳(00:58:01) 在做任何事情之前,想想物理學允許的極限在那裡。我們用這個標準來測試一切。這是一種很好的思維框架。我不太喜歡另一種被稱為“持續改進”的方法。持續改進的問題在於……首先,你應該利用“光速思維”,從第一性原理出發來設計工程,僅受限於物理極限。當然,在這之後你會隨著時間不斷改進它。但我不喜歡面對一個問題時,有人說:“嘿,現在做這件事需要74天。我們現在能幫你縮短到72天。”我寧願把它全部推倒重來,歸零。黃仁勳(00:58:52) 然後說:“首先,解釋給我聽為什麼一開始需要74天。想想看我們今天能做到什麼程度。如果我完全從零開始建構它,需要多長時間?”通常,你會感到驚訝,答案可能是6天。剩下的那部分,從6天到74天的差距,可能是基於非常合理的妥協、降低成本以及各種各樣的原因。但至少你知道這些差距在那。既然你知道6天是有可能實現的,那麼從74天探討如何降到6天的對話,就會極其有效得多。萊克斯·佛里曼(00:59:30) 在你建構如此極其複雜的系統時,簡單性有時是一個值得追求的好啟髮式原則嗎?拿你們發佈的Vera Rubin計算艙(Pod)來說,這真是令人難以置信。我們談論的是7種晶片、7種晶片類型、5種專用機架類型、40個機架、1.2千兆個電晶體、近2萬個輝達裸片、超過1100個Rubin GPU、60百億億次浮點運算能力(exaflops)、10 PB/s的擴展頻寬。而這僅僅是一個……黃仁勳(01:00:03) 這僅僅是一個計算艙。萊克斯·佛里曼(01:00:04) 僅僅是一個計算艙。黃仁勳(01:00:06) 是的,僅僅是一個計算艙。萊克斯·佛里曼(01:00:07) 所以你有……甚至單單一個NVL72機架就有130萬個元件,1300個晶片,4000根線纜,全部塞進一個寬19英吋的機架裡。黃仁勳(01:00:19) 而且萊克斯,我們可能每周都要生產大約200個這樣的計算艙,給你提供個視角。萊克斯·佛里曼(01:00:25) 元件數量如此之多,我猜想“簡單性”是不可能實現的。但是在嘗試設計時,它是否會作為一種你努力追求的衡量指標?黃仁勳(01:00:35) 我最常說的一句話是,我們需要事物像必要時那樣複雜,但又要儘可能簡單。所以問題是,所有這些複雜性都是必要的嗎?我們必須對此進行測試,必須提出挑戰。除此之外的任何多餘的東西都是不必要的。萊克斯·佛里曼(01:00:56) 但這幾乎是不可思議的。從整個半導體行業來看,輝達正在做的是歷史上最偉大的工程之一。這些系統真的是工程學的奇蹟。黃仁勳(01:01:10) 它是世界上製造過的最複雜的電腦。萊克斯·佛里曼(01:01:13) 是的,這些工程團隊。我不是在比較,如果有一個工程團隊的奧運會,台積電在各個層面上都做著令人難以置信的工程工作,正如我所說的ASML也是,但輝達絕對是強有力的競爭者。真是令人驚嘆的團隊。黃仁勳(01:01:28) 可以說,這是每個單項運動的金牌得主,全都聚集在這裡了。中國(01:01:33) ……並且必須協同工作。而且直接向你匯報。這真是太棒了。你最近去了中國。所以問你這個問題很有意思,中國在建設其科技領域方面取得了令人難以置信的成功。據你瞭解,中國是如何在過去10年裡建立起這麼多令人難以置信的世界級公司、世界級工程團隊,以及這個技術生態系統……從而生產出這麼多令人驚嘆的產品的?黃仁勳(01:02:05) 原因有很多……嗯,首先,讓我們從一些事實開始。全球大約 50% 的 AI 研究人員是華人,而且他們大多仍在中國。我們這裡也有很多,但中國仍然有很出色的研究人員。他們的科技產業出現的時間點非常精準。在移動雲時代,他們貢獻的方式是軟體,所以這個國家有著在科學和數學方面受過良好教育的優秀孩子。他們的科技產業是在軟體時代建立的。他們對現代軟體非常熟悉。中國不是一個單一的經濟大國。它有很多省份和城市,其市長們相互競爭。(01:03:01) 這就是為什麼有這麼多電動汽車公司。這就是為什麼有這麼多 AI 公司。這就是為什麼有這麼多——你能想像到的每一類公司,他們都會創立其中一些。因此,結果就是他們內部有著極其激烈的競爭。你知道,最終存活下來的是那些令人難以置信的公司。他們的社會文化也是,家庭第一,朋友第二,公司第三。所以他們之間的交流非常多……他們本質上一直是開放原始碼的。(01:03:47) 所以他們為開源做出更多貢獻是非常合理的,因為他們可能會想,“我們要保護什麼呢?”我的工程師,他們的兄弟在那家公司,他們的朋友在那家公司,他們都是校友。你知道,校友這個概念。一旦是校友,就是一生的兄弟。所以他們分享知識非常非常快。所以保守技術秘密沒有意義。還不如把它開源。然後開源社區會放大、加速創新過程。所以你得到了這種快速、令人難以置信的優秀人才,由於開源以及朋友間的交流性質和激烈的競爭,創新速度極快。(01:04:35) 在公司之間,湧現出來的東西是不可思議的。所以這是當今世界上創新最快的國家,而這一點,我剛才所說的一切,都從根本上解釋了這些孩子是如何成長的,他們擁有出色的教育,父母希望他們在學校表現出色,他們的文化就是如此。這些,你知道,這些都是他們國家的一些特點,而且他們恰好在技術呈指數級發展的時代出現了。萊克斯·佛里曼(01:05:09) 另外,從文化上來說,成為一名工程師是很酷的事情。這與你提到的所有因素都有關聯……黃仁勳(01:05:16) 這是一個建設者國度。萊克斯·佛里曼(01:05:18) 這是一個建設者國度。黃仁勳(01:05:19) 是的,這是一個建設者國度。我們國家的領導人,很了不起,但大多是律師。他們國家的領導人——因為我們要靠法治來保障安全——他們的國家是從貧困中建立起來的。所以他們的大多數領導人都是了不起的工程師。一些最聰明的人。萊克斯·佛里曼(01:05:43) 稍微岔開一下,因為你提到了開源,我必須提到 Perplexity,你長期以來一直是它的粉絲。黃仁勳(01:05:51) 很喜歡,是的。萊克斯·佛里曼(01:05:52) 感謝你開源了 Nemotron 3 Super,你也可以在 Perplexity 裡面用它來尋找資訊。這是一個 1200 億參數的開源權重 MoE 模型。你對開源有什麼願景?你提到了中國,提到了 DeepSeek 和 MiniMax,所有這些公司都在真正推動開源 AI 運動,而 輝達 在接近最先進水平的開源大語言模型方面確實處於領先地位。你對此的願景是什麼?黃仁勳(01:06:28) 首先,如果我們要成為一家偉大的 AI 計算公司,我們必須理解 AI 模型是如何演變的。(01:06:36) 我喜歡 Nemotron 3 的一點是,它不僅僅是一個純粹的 Transformer 模型,它結合了 Transformer 和 SSM。而且我們很早就開始開發條件 GAN,也就是漸進式 GAN,它一步步地引向了擴散模型。所以,我們在模型架構和不同領域進行基礎研究,這讓我們能夠洞察什麼樣的計算系統對未來模型有好處。這是我們極致協同設計策略的一部分。第二,我認為我們正確地認識到,一方面,我們希望將世界級的模型作為產品,它們應該是專有的。另一方面,我們也希望 AI 能夠滲透到每一個行業、每一個國家、每一位研究人員、每一位學生中。(01:07:37) 如果一切都是專有的,那麼進行研究就很難,在其基礎上、周圍、與之一起創新也很難。所以……開源對於許多行業加入 AI 革命是根本必要的。輝達 擁有規模,我們也有動力——不僅有技能、規模,還有動力——只要我們還存在,就持續建構這些 AI 模型。因此,我們應該這樣做。我們可以開放,我們可以啟動每一個行業、每一位研究人員、每一個國家,讓他們能夠加入 AI 革命。還有第三個原因,那就是認識到 AI 不僅僅是語言。這些 AI 很可能會使用基於其他資訊模態訓練的工具、模型和子代理。(01:08:39) 可能是生物學、化學、物理學定律,或者流體力學和熱力學,並非所有這些都包含在語言結構中。所以必須有人去確保天氣預報、生物學 AI、用於生物學的 AI、物理 AI,所有這些都能被推向極限,推向前沿。我們不製造汽車,但我們希望確保每個汽車公司都能接觸到優秀的模型。我們不發現藥物,但我希望確保禮來公司擁有世界上最好的生物學 AI 系統,這樣他們就可以用它來發現藥物。所以這三個根本原因,既認識到 AI 不僅僅是語言,AI 非常廣泛,我們希望讓每個人都參與到 AI 世界中來,同時也要進行 AI 的協同設計。萊克斯·佛里曼(01:09:32) 嗯,我必須說,再次感謝你開源,真正地開源了 Nemotron 3 以及……黃仁勳(01:09:39) 是的,謝謝你提到這一點。我們開源了模型,開源了權重,開源了資料,開源了我們建立它的方法。是的,這非常了不起。台積電與台灣萊克斯·佛里曼(01:09:48) 這真的非常了不起。你來自台灣,並且與台積電關係密切。所以我得問問,我認為台積電在工程團隊和他們所做的令人難以置信的工程工作方面,也是一家傳奇公司。你如何理解台積電的文化和方法,來解釋他們是如何在半導體領域所做的一切中取得這種獨一無二、無與倫比的成功的?黃仁勳(01:10:19) 你知道,首先,關於台積電最深的誤解是,他們擁有的只是技術。以為他們只是有非常好的電晶體,如果有人拿出另一種電晶體,遊戲就結束了。是技術,當然,我指的不只是電晶體,還有金屬化系統、封裝、3D 封裝、矽光子學,他們擁有的所有技術。是技術讓這家公司變得特別。他們的技術讓這家公司變得特別。(01:10:59) 但他們協調需求的能力,協調全球數百家公司動態需求的能力,因為它們在上升、轉移、增加、減少、推遲、提前、客戶更換、晶圓啟動、晶圓停止、緊急晶圓啟動,所有這些隨著世界不斷變化而產生的複雜動態,而他們卻能以高吞吐量、高良率、非常好的成本、卓越的客戶服務來營運工廠。他們認真對待自己的承諾。(01:11:49) 當你的晶圓——因為他們知道他們在幫助你營運公司——當承諾的晶圓該出現時,晶圓就會出現,這樣你才能恰當地營運你的公司。所以他們的系統,他們的製造系統,我想說,是完全神奇的。第二點是他們的文化。這種文化一方面同時聚焦於技術,推進技術;另一方面同時以客戶服務為導向。很多公司非常以客戶服務為導向,但技術並不卓越。他們不在技術的最前沿。(01:12:27) 有很多公司處於技術的最前沿,但他們並不是最好的以客戶服務為導向的公司。所以這取決於他們如何平衡這兩者,而且他們在兩方面都是世界級的。然後第三點可能是我最看重的他們創造的技術,這種無形的東西叫做信任。我信任他們,把我的公司託付給他們。這是非常重要的一點。萊克斯·佛里曼(01:12:55) 當他們信任時,我的意思是,你們之間建立了非常緊密的關係,這種信任是基於多年來的表現建立的,但其中也涉及到人際關係。黃仁勳(01:13:05) 三十年了,我不知道通過他們做了多少成百上千億美元的業務,而我們沒有合同。這太棒了。萊克斯·佛里曼(01:13:15) 太神奇了。好的,有這麼個故事……在 2013 年,台積電的創始人張忠謀曾邀請你成為台積電的首席執行長,而你說你已經有工作了。這個故事是真的嗎?黃仁勳(01:13:30) 故事是真的。我沒有,我沒有輕視它。我深感榮幸,當然,我當時就知道,正如我現在所知,台積電是歷史上最重要的公司之一。張忠謀是我生命中評價最高的高管之一,也是我的商業夥伴和個人朋友。他的邀請讓我受寵若驚,真的非常榮幸。但我在這裡做的工作非常重要,我在心中已經看到了 輝達 的未來以及我們能產生的影響。這是非常重要的工作。這是我的責任,我唯一的責任,就是要實現它。所以我拒絕了,不是因為它不是一個令人難以置信的機會。這是一個令人難以置信的機會,但我就是不能接受。萊克斯·佛里曼(01:14:38) 我認為 輝達,輝達 和台積電都是人類文明史上最偉大的兩家公司。營運其中任何一家,我相信都是一項極其複雜的工作,需要……你必須全身心投入。各個層面的每個人,不僅僅是 CEO 層面。每個人都真的是全身心投入……黃仁勳(01:14:57) 是的。是的,毫無疑問。萊克斯·佛里曼(01:14:59) ……來完成這種程度的複雜性。黃仁勳(01:15:00) 所以現在我可以幫助兩家公司了。輝達的護城河萊克斯·佛里曼(01:15:02) 沒錯。現在 輝達 是世界上最有價值的公司。我得問一下,正如科技界人士所說,輝達 最大的護城河是什麼?即保護你免受競爭的優勢。黃仁勳(01:15:20) 作為一家公司,我們最重要的資產是我們計算平台的安裝基礎。今天我們最重要的東西是 CUDA 的安裝基礎。20 年前,當然沒有安裝基礎。但關鍵是……如果有人搞出一個 GUDA 或 TUDA,那根本不會有任何影響。原因在於,這從來都不僅僅是技術的問題。技術當然是不可思議的、有遠見的。但關鍵在於公司對它的投入、堅持、並擴大了它的影響力。讓 CUDA 成功的不是三個人,而是 43,000 個人。(01:16:17) 還有數百萬相信我們、信任我們會繼續開發 CUDA 1、2、3、13 的開發者,他們決定移植並將他們的軟體、他們堆積如山的軟體建構在 CUDA 之上。所以安裝基礎是第一大最重要的優勢。這個安裝基礎,再結合我們以這種規模執行的速度,歷史上沒有那家公司曾經建構過如此複雜的系統,絕對沒有。然後還要一年建構一次,這是不可能的。這種速度與安裝基礎相結合,在開發者的心目中,你只需……從開發者的角度來看,如果我支援 CUDA,明天它就會好 10 倍。我平均只需要等六個月。(01:17:16) 不僅如此,如果我在 CUDA 上開發,我能接觸到數億人、數億台電腦。我存在於每一個雲,每一家電腦公司,每一個行業,每一個國家。所以如果我建立一個開源包,並且首先把它放在 CUDA 上,我會同時獲得這兩個屬性。不僅如此,我 100% 相信 輝達 會一直保留 CUDA,維護它,改進它,並持續最佳化這些庫,只要他們存在。這一點你可以完全放心,最後這一點,信任。你把所有這些放在一起,如果我今天是一名開發者,我會首先瞄準 CUDA。我會最優先瞄準 CUDA。我認為歸根結底,這就是我們的首要,甚至是我們首要的……(01:18:16) ……核心優勢。我們的第二個優勢是我們的生態系統。我們垂直整合了這個極其複雜的系統,但我們橫向整合到每一家公司的電腦中。我們進入了Google雲,進入了亞馬遜,進入了 Azure。我們現在正在瘋狂地擴展 AWS。我們進入了像 CoreWeave 和 Nscale 這樣的新公司。我們進入了禮來公司的超級電腦。我們進入了企業電腦。我們在邊緣的無線基站裡。我的意思是,這簡直瘋狂。一個架構存在於所有這些不同的系統中。我們在汽車裡,在機器人裡,在衛星裡,我們甚至在太空中。所以你擁有這一個架構,並且生態系統如此廣泛,它基本上覆蓋了世界上每一個行業。萊克斯·佛里曼(01:19:03) 那麼,隨著 AI 工廠成為護城河,CUDA 的安裝基礎在未來將如何演變?你認為未來的 輝達 有可能完全圍繞 AI 工廠嗎?黃仁勳(01:19:16) 嗯,對我們來說,計算單位曾經是 GPU。然後它變成了一台電腦,然後變成了一個叢集。現在它是一個完整的 AI 工廠。當我看到一台電腦,當我看到 輝達 建造的東西時,在過去,我會想像晶片。然後當我發佈新產品、新一代產品時,比如,“女士們先生們,我們今天發佈 Ampere,”我會拿起晶片。那是我對正在建構的東西的心理模型。今天,我不會……拿起晶片仍然有點可愛。(01:19:47) 但它只是可愛。它不是我所做事情的心理模型。我的心理模型是這個巨大的千兆瓦級的東西,它連接到電網的發電系統。它有冷卻系統和極其龐大的網路。有 1 萬人在裡面試圖安裝它,數百名網路工程師在裡面,成千上萬的工程師在背後試圖給它通電。你知道,給那些工廠之一通電,正如你所知,不是某個人說“現在開機了”那麼簡單。需要成千上萬的人才能讓它啟動。萊克斯·佛里曼(01:20:22) 所以在心理上,你實際上……當你思考一個計算單元時,你實際上,當你晚上睡覺時,你現在思考的是一組機架,也就是整櫃,而不是單個晶片。黃仁勳(01:20:33) 是整個基礎設施。我希望我的下一個思維跳躍是,當我考慮建造電腦時,是行星級的規模。那將是下一個跳躍。太空中的 AI 資料中心萊克斯·佛里曼(01:20:42) 嗯,你怎麼看埃隆談到的太空角度,即在太空中進行計算,以解決一些……它可以使擴展能源方面的某些能源問題更容易解決。黃仁勳(01:20:56) 散熱問題並不容易。是的。萊克斯·佛里曼(01:20:58) 散熱。嗯,這涉及到大量的工程複雜性。所以……你知道,輝達 也已經宣佈你們已經在考慮這個問題了。黃仁勳(01:21:09) 是的,我們已經做到了。輝達 GPU 是太空中的第一批 GPU。我之前沒意識到,這很有趣……我可能早就該宣佈了。我們在太空中。你知道,我們某個 GPU 上有一個小小的宇航服。但我們已經在太空了。那裡是做大量成像工作的好地方。(01:21:32) 你知道,因為這些衛星擁有非常高解析度的成像系統,它們現在正在持續掃描地球。你希望為全球進行持續的釐米級成像,這樣你基本上就能擁有所有東西的即時遙測資料。你不想把這些資料傳回地球。那將是 PB 級、PB 級的資料。你只需要就在邊緣進行 AI 處理,扔掉所有不需要的東西,那些你之前見過、沒有變化的東西,然後只保留你需要的東西。所以 AI 必須在邊緣完成。顯然,如果我們放在極地,我們有 24/7 的太陽能。但是,那裡沒有傳導,沒有對流。(01:22:23) 所以,基本上只能靠輻射。但是,太空很大。我想,我們只需要在那裡放置巨大、巨型的散熱器。萊克斯·佛里曼(01:22:32) 你認為這個想法有多瘋狂?這是五年後、十年後、二十年後的事?我們正在談論 AI 擴展的障礙。黃仁勳(01:22:41) 你知道,我只是更務實一些。我首先尋找我下一個、再下一個機會所在。與此同時,我在培育太空領域。所以我派工程師去研究這個問題。我們開始……我們學到了很多。如何處理輻射?如何處理性能下降?如何處理持續的缺陷測試和驗證?如何處理冗餘?如何優雅地降級等等?所以我們可以做……軟體呢?你如何看待太空中的軟體、冗餘和性能?(01:23:24) 讓電腦永遠不會壞,它只是變慢而已。所以我們可以提前進行大量的工程探索。但與此同時,我最喜歡的答案是消除浪費。你知道,我們有那麼多閒置的電力,我想盡快利用起來。萊克斯·佛里曼(01:23:47) 是的。那裡,那裡……是的,地球上有很多唾手可得的果實……我們可以利用它們來擴展 AI。快速暫停一下。快速感謝我們的贊助商 30 秒。請在描述中查看他們。這確實是支援本播客的最佳方式。請訪問 lexfridman.com/sponsors。我們有用於好奇心驅動知識探索的 Perplexity,用於線上銷售的 Shopify,用於電解質的 LMNT,用於客戶服務 AI 代理的 Fin,以及用於電話系統(通話、簡訊、聯絡人)的 Quo,為您的業務服務。明智選擇,我的朋友們。現在,回到我與 黃仁勳 的對話。你認為 輝達 有朝一日會值 10 兆美元嗎?讓我們換個方式問。如果這是真的,那麼世界的未來會是什麼樣子?輝達 會值 10 兆美元嗎?黃仁勳(01:24:45) 我認為 輝達 的增長極有可能,而且在我看來是不可避免的。讓我解釋一下原因。我們是歷史上最大的電腦公司。僅這一點就應該引出一個問題:為什麼?當然原因……有兩個原因。首先,兩個基礎性的技術原因。第一個原因是,計算從一個基於檢索的檔案檢索系統轉變而來。幾乎所有東西都是一個檔案……我們預先編寫一些東西,預先錄製一些東西。我們畫一些東西,把它放到網上,放到一個檔案裡。我們使用推薦系統,一些智能過濾器,來找出要為你檢索什麼。所以,我們過去是一個預錄製、人類預錄製和檔案檢索系統。這很大程度上就是電腦的定義。(01:25:39) 而現在,AI 電腦是上下文感知的,這意味著它必須即時處理和生成令牌。所以,我們從基於檢索的計算系統轉變為基於生成的計算系統。在這個新世界裡,我們將需要比舊世界多得多的處理能力。在舊世界裡,我們需要大量的儲存。在這個新世界裡,我們需要大量的計算。這是第一部分。我們從根本上改變了計算以及計算的方式。唯一會導致它倒退……(01:26:15) ……就是如果這種計算方式,這種生成上下文相關、情境感知、在生成資訊之前基於新見解的計算方式,這種計算密集型的方式,如果它沒有效果,它才會倒退。所以,如果在過去 10 到 15 年從事深度學習的過程中,在任何一刻我得出了這樣的結論:“你知道嗎?這行不通。我認為這是條死胡同。”或者“它無法擴展,無法解決這種模式,無法用於這個應用。”那麼,我當然會有截然不同的感受,但我認為過去五年給了我比之前十年更多的信心。(01:27:04) 第二個想法是,電腦,因為它是一個儲存系統,所以大體上是一個倉庫。我們現在正在建造工廠。倉庫賺不了多少錢。工廠與公司的收入直接相關。所以,電腦做了兩件事。它不僅改變了它的運作方式,它在世界上的目的也改變了。它不再是一台電腦,而是一個工廠。它是一個工廠,用於產生收入。我們現在看到,這個工廠不僅在生產人們想要消費的產品、商品,我們還看到這些商品如此有趣,對如此多的不同受眾如此有價值,以至於令牌開始像 iPhone 那樣進行細分。你有免費令牌,有高級令牌,還有幾種中間層級的令牌。(01:28:10) 所以,事實證明,智能是一種可擴展的產品。有極高智能的產品,用於專門用途的令牌,人們願意為此付費。有人願意為每百萬令牌支付 1000 美元的想法即將到來。這不是會不會的問題,只是什麼時候的問題。所以,現在我們看到這個工廠生產的商品實際上是有價值的,並且能夠產生收入和利潤。現在的問題是,世界需要多少這樣的工廠?世界需要多少令牌?社會願意為這些令牌支付多少錢?如果生產力如此顯著地提高,世界經濟會發生什麼?會發生什麼……(01:29:08) 我們是否會……我們是否會發明新藥、新產品、新服務?所以,當你把這些事情結合起來,我絕對確信世界 GDP 的增長將會加速。我絕對確信,用於計算的 GDP 佔比將比過去多 100 倍——嗯——因為它不再是一個儲存單元。它是一個產品生成單元。所以,當你從這個角度來看,然後再反推 輝達 是什麼,輝達 做什麼,以及我們需要從多少新經濟、新產業中受益來解決這個問題,我認為我們會變得非常非常大。(01:29:58) 然後剩下的部分,對我來說,是:輝達 有可能在不久的將來成為一家收入達 3 兆美元的公司嗎?答案當然是肯定的。原因在於它不受任何物理限制。我沒有看到任何東西說,天那,3 兆美元是不可能的。事實證明,輝達 的供應鏈——這個負擔由 200 家公司分擔。我們在與這個生態系統的合作中擴展,問題是:我們有足夠的能源這樣做嗎?我們當然會有足夠的能源。所以,所有這些結合起來,那個數字只是一個數字,你知道?(01:30:51) 我還記得,輝達 是……在我們首次突破 10 億美元時,有位 CEO 提醒我,“你知道,Jensen,從理論上講,一家無晶圓半導體公司不可能超過 10 億美元。”我不會贅述原因,但這顯然不合邏輯,而且有很多證據表明並非如此。然後有人告訴我,“你知道,Jensen,因為其他某家公司,你永遠不會超過 250 億美元。”有人告訴我,“你永遠不會,你知道,因為……”所以這些都不是基於原則、基於第一性原理的思考。思考這個問題的簡單方法是,我們製造的是什麼,我們能創造的機會有多大?(01:31:42) 現在,輝達 做的不是市場份額生意。我剛才談到的大部分東西都不存在。這是困難的部分。如果 輝達 是一家 100 億美元的公司,試圖去奪取 輝達 的份額,那麼股東們很容易看到,哦,是的,如果他們能拿到 10% 的份額,他們就能變得這麼大。但人們很難想像我們能有多大,因為我沒有可以從誰那裡奪取份額的對象。你知道?所以我認為這是世介面臨的挑戰之一,即對未來的想像力。但我有的是時間,我會繼續推理,繼續談論它,每一次 GTC 都會讓它變得越來越真實。(01:32:27) 你知道,然後越來越多的人會談論它,總有一天,我們會到達那裡。我 100% 確信我們會到達那裡。萊克斯·佛里曼(01:32:34) 是的,你的這種觀點,基本上是令牌工廠,即每瓦每秒的令牌數,並且每個令牌都有價值。就像它是一個實際帶來價值的東西,它為不同的人帶來不同種類、不同數量的價值。這就是實際的產品——它確實可以粗略地看作是令牌。所以你有一堆令牌工廠。然後,根據第一性原理,很容易想像一個未來,考慮到 AI 可以解決的所有潛在問題,你將需要指數級更多的令牌工廠。黃仁勳(01:33:05) 是的。非常有趣的是,我對此如此興奮的原因是,令牌的 iPhone 已經問世了。萊克斯·佛里曼(01:33:11) 你怎麼稱呼它?等等,你是說 OpenClaw 的 iPhone?黃仁勳(01:33:13) 是的。萊克斯·佛里曼(01:33:14) 這很有意思。黃仁勳(01:33:15) 代理。萊克斯·佛里曼(01:33:16) 是的,代理。沒錯。黃仁勳(01:33:18) 總的來說是代理。令牌的 iPhone 已經問世了。它是歷史上增長最快的應用程式。它直線上升。直線上升。萊克斯·佛里曼(01:33:26) 這說明了問題。黃仁勳(01:33:27) 是的,毫無疑問,OpenClaw 就是令牌的 iPhone。萊克斯·佛里曼(01:33:31) 是否有什麼真正特別的事情,大約從 12 月開始發生,人們真正意識到了 Claude Code、Codex、OpenClaw 的力量?我的意思是,我很尷尬地承認,在來這裡的機場路上,我第一次在公共場合這樣做。我通過跟我的筆記型電腦說話來程式設計,打個引號。黃仁勳(01:33:59) 是的,沒錯。萊克斯·佛里曼(01:33:59) 我感到尷尬,因為我假裝在和一位人類同事說話。我不確定自己對未來的感覺,那時每個人……都在走來走去和他們的 AI 說話,但這是完成事情的一種非常高效的方式。黃仁勳(01:34:13) 更有可能的是,你的 AI 會一直打擾你。原因在於它做事太快了。它會向你報告,“我完成了那個。”“接下來你想讓我做什麼?”你知道,它……我認為大多數人沒有意識到的是,與他們聊天、發簡訊最多的人,將是他們的“爪子”或“龍蝦”。壓力下的領導力萊克斯·佛里曼(01:34:37) 多麼不可思議的未來。我讀到過,你將你的很多成功歸功於你比任何人都努力工作,並且比任何人都能承受更多痛苦的能力。所以我們可以列出這包含的許多事情。我的意思是,應對失敗、我們談到的成本和工程問題。人的問題、不確定性、責任、疲憊、尷尬、你提到過的公司瀕臨死亡的時刻,還有壓力。現在,作為這家公司的 CEO,各個經濟體和民族都圍繞它制定戰略,規劃他們的財務分配,規劃他們的 AI 基礎設施,你是如何應對如此巨大的壓力的?在如此多的國家和人民都依賴你的情況下,是什麼給了你力量?黃仁勳(01:35:38) 我意識到 輝達 的成功對美國非常重要。我們產生了巨額的稅收。我們為我們的國家確立了技術領導地位。技術領導地位對國家安全很重要。國家安全不僅僅是一個方面,而是所有方面。當我們的國家更加繁榮時,我們可以在國內政策和幫助社會福利方面做得更好。因為我們在美國創造了如此多的再工業化,我們創造了大量的就業機會。我們正在幫助將如何建造東西的方式轉回到美國,體現在許多不同的工廠、晶片、電腦,當然還有這些 AI 工廠。我完全意識到,這一點……(01:36:35) 而且我受益於此,這真是主流投資者、教師、警察的一份禮物,他們不知為何,出於什麼原因投資了 輝達,或者因為他們看了 Jim Cramer,買了一些股票,現在成了百萬富翁。(01:36:57) 我完全清楚這種情況。我清楚 輝達 是我們身後和下游一個龐大生態系統合作夥伴網路的核心。所以我處理這個問題的方式,正是我剛才所做的。我推理我們正在做什麼?它導致了什麼?它對其他人的利益有什麼影響,無論是積極的,還是例如通過巨大的負擔施加給供應鏈?因此,問題是,你打算怎麼做?對於我感受到的幾乎所有事情,我都會分解它,推理,“好吧,情況是怎樣的?發生了什麼變化?難在那裡?我打算怎麼做?”我……(01:37:56) 我分解它,解構問題,將這些情況的解構轉化為我可以做的、可管理的事情。之後我唯一能做的就是,“你做了嗎?是你做的還是你讓別人去做的?如果你沒做,你推理出你需要做,而你沒做,也沒有讓別人去做,那就別再為此煩惱了。”……你知道?所以,所以——(01:38:27) 所以我對自己相當嚴格。但是,我也會分解事情,這樣我就不會恐慌。我可以安心睡覺,因為我已經列出了需要做的事情清單,並且我確保所有可能危及我們公司、危及我的合作夥伴、危及我們行業的事情,我都告訴了某個人。所有我覺得可能危及任何人的事情,我都告訴了某個人。我告訴了那個能對此採取行動的人。所以,我要麼把這事從心裡放下了,要麼正在處理它。在那之後,Lex,你還能做什麼呢?萊克斯·佛里曼(01:39:10) 考慮到在建立 輝達 的旅程中經歷了那麼多瘋狂、強烈的痛苦,你有沒有經歷過心理上的低谷?黃仁勳(01:39:22) 哦,是的。哦,是的。當然。一直都有。一直都有。萊克斯·佛里曼(01:39:27) 然後你——黃仁勳(01:39:27) 一直都有。萊克斯·佛里曼(01:39:27) ……你只是把問題分解成碎片?看看你能做些什麼?黃仁勳(01:39:33) 一部分,Lex,一部分是遺忘。你知道,AI 學習最重要的屬性之一就是系統性遺忘。你需要知道什麼時候該忘記一些事情。你不能記住所有事情。你不能保留所有事情,你也不想背負所有事情。我很快做的一件事就是分解問題,推理問題,然後分擔它。我說我告訴所有人,我本質上是在分享那個負擔。(01:40:04) 儘可能快地。無論我擔心什麼,告訴別人。不要只是自己扛著。不要嚇到他們。把問題分解成更小的部分,讓人們參與進來,激勵他們能夠對此採取行動。但一部分就是遺忘。很多時候,你必須對自己狠一點。振作起來,別再為此煩惱了。讓我們行動起來。然後你起床。另一部分是你被下一束光所吸引,下一個未來,下一個機會,下一個,“好吧,那已經過去了。接下來是什麼?”我認為這就像你看偉大運動員那樣。他們只擔心下一分。上一分已經過去了。尷尬,挫折。(01:40:56) 你知道,因為我做了很多公開的工作。Lex,你也做了不少公開的工作。所以我做了很多公開的工作。所以你知道,我說了很多當時看起來合理或當時覺得有趣的話,大多隻是因為我當時覺得有趣。然後,當你回想起來,就沒那麼有趣了,但是……萊克斯·佛里曼(01:41:20) 是的。不,相信我,我知道。但你基本上是讓自己被未來的光芒所牽引。忘記過去,繼續——黃仁勳(01:41:27) 沒錯。萊克斯·佛里曼(01:41:28) ……繼續朝著那個目標努力。我的意思是,你說過,有句很有名的話,如果你事先知道打造 輝達 會有多難——實際上比你預期的要難一百萬倍——你就不會去做了。黃仁勳(01:41:46) 是的,沒錯。萊克斯·佛里曼(01:41:47) 但是,你知道,當我聽到這句話時,所有值得做的事情可能都是如此,對吧?黃仁勳(01:41:53) 沒錯。順便說一句,這正是我想解釋的,擁有孩子般的心態是一種不可思議的超能力。當我看到某件事時,我經常對自己說,幾乎所有事情我的第一反應都是,“能有多難呢?”你讓自己進入那種狀態,能有多難呢?從來沒有人做過。它看起來巨大無比。它將耗資數千億美元。它將需要所有這些……你就想,“是啊,但能有多難呢?”能有多難呢?(01:42:37) 所以,你必須讓自己進入那種心態。你其實不希望對所有事情、所有挫折、所有磨難、所有失望都進行過度模擬。你不想提前模擬所有那些。你不想知道那些。你想帶著“這將完美、這將很棒、這將非常有趣”的想法進入新的體驗。然後,當你身處其中時,你需要有耐力,需要有韌性,這樣當挫折真的發生時,那些挫折會讓你驚訝,失望會讓你驚訝,尷尬會讓你驚訝,屈辱會讓你驚訝。(01:43:17) 你不能讓……現在你只需要啟動另一部分,那就是忘掉它。繼續前進,持續前行。只要我對未來的假設以及未來為何會實現的那些假設沒有改變,或者沒有實質性地改變,那麼我就應該預期結果不會改變。所以我模擬的未來結果仍然會發生。如果它仍然會發生,我仍然會去追求它。(01:43:54) 我相信它會,你知道,所以這裡有二三種人類特質的結合:以清新心態進入體驗的能力,忘記挫折的能力,相信自己、相信你所相信的並忠於那個信念的能力。但你也在不斷地重新評估。(01:44:20) 我認為這種三、四、五種特質的結合對於韌性來說非常重要。我很幸運,無論是什麼人生經歷造就了這些,我擁有了那四、五種特質。我總是充滿好奇,總是在學習。我總是向每個人學習。我總是問我的……因為我凡事都很謙遜,我總是想,“天那,他們做得真好。他們做得太棒了。”我想知道他們在想什麼。他們如何……所以我在模擬每個人。在很多方面,我在模仿我觀察到的幾乎每個人,對吧?你對他們所做、你所觀察和尊重的一切都感同身受。所以你一直在學習。萊克斯·佛里曼(01:45:10) 你現在是地球上最富有的人之一。地球上最成功的人之一。保持謙遜並能夠……你是否覺得金錢、權力和名聲的影響,讓你更難在心裡承認自己是錯的?更難去聽取別人不同意的意見並向他們學習?諸如此類的事情。黃仁勳(01:45:41) 令人驚訝的是,並沒有。實際上我會說恰恰相反。因為我做了那麼多公開的工作,當我錯了的時候,幾乎每個人都能看到。萊克斯·佛里曼(01:45:53) 你被教育了。有道理。黃仁勳(01:45:55) 當我錯了——當我錯了或者結果並非如此,或者,你知道,我在外面說的大部分事情,我都是相當確定的。原因在於它會影響到別人,我想對此非常在意,非常謹慎。對於那些我在會議中推理的事情,很多事情的結果可能不同。但這從未阻止我推理。我管理和領導的方式是,我經常在人們面前推理。即使在我和你說話的時候,你也能看到我即時推理的過程。我想確保你理解我所說的,不是因為我告訴了你——(01:46:40) ……而是因為我對我要告訴你的事情非常謙遜。我向你展示了我是如何得出這個結論的步驟。然後你可以自己決定是否相信我最後說的話。所以我整天在會議上都是這麼做的。對我所有的員工,我不斷地推理,“讓我告訴你我是怎麼看的。”然後我進行推理。這給了每個人機會介入並說,“我不同意那一點。”通過推理並讓人們參與其中的好處是,他們不必不同意你的結果。他們可以不同意你的推理步驟。他們可以把我的思路引向不同的方向,然後我們可以一起向前推理。所以我們有點像在共同尋找路徑。這真的很棒。萊克斯·佛里曼(01:47:29) 是的,你有一種特質……當你解釋事情的時候,我能感覺到你實際上是在當場推理,帶著一種持續的開放心態,我可以感覺到我可以引導你的思維。這是非常美好的,你在這麼多年的成功和痛苦之後,還能保持這種狀態。我認為有時候痛苦會讓你封閉一點。我認為能保持——黃仁勳(01:47:57) 是的。對尷尬的容忍度,我認為是……萊克斯·佛里曼(01:47:59) 是的,那是……容忍度……我的意思是,這是真實存在的。就是多年來讓自己難堪。即使在那些會議上,知道周圍有人,你宣佈了一個想法,結果證明那個想法是錯的……並且能夠承認這一點並從中成長。這在人的層面上是非常困難的。黃仁勳(01:48:17) 是的。嗯,你知道。他們知道,他們知道我最近的第一份工作是刷廁所,所以。電子遊戲萊克斯·佛里曼(01:48:25) 我很高興你保留了在丹尼餐廳時的那種精神。我的意思是,那很美好。你從丹尼餐廳開始的整個旅程是美好的。讓我問你關於電子遊戲的問題。我是一個狂熱的遊戲迷。所以我必須感謝 輝達 多年來提供的令人難以置信的圖形。黃仁勳(01:48:47) 順便說一句,GeForce 至今仍然是我們的首要行銷策略。沒錯。人們在青少年時期就瞭解 輝達。然後他們上大學,知道 輝達 是誰,起初只是玩使命召喚、堡壘之夜。然後後來他們使用 CUDA,然後後來他們使用 輝達,還有 Blender、Dassault 和 Autodesk。萊克斯·佛里曼(01:49:16) 是的。我的意思是,我應該說我告訴一個朋友我要和你談話。他說,“哦,他們生產很棒的遊戲 GPU。”黃仁勳(01:49:25) 是的,沒錯。萊克斯·佛里曼(01:49:26) 就好像——黃仁勳(01:49:26) 沒錯。萊克斯·佛里曼(01:49:27) 你知道,還有更多,但是,是的,人們真的很喜歡它。它確實給很多人帶來了很多快樂。硬體真正將這些世界變得栩栩如生。DLSS 5 曾引發一些爭議。你能給我解釋一下這個爭議嗎?我想線上上的玩家們擔心它會讓遊戲看起來像 AI 垃圾。你怎麼看這個爭議?黃仁勳(01:49:56) 是的。我認為他們的觀點有道理,我能理解他們的想法,因為我自己也不喜歡 AI 垃圾。你知道,所有 AI 生成的內容看起來越來越相似,而且它們都很漂亮,所以我對他們的想法感同身受。但這不是 DLSS 5 試圖做的事情。我展示了幾個例子。DLSS 5 是 3D 條件下生成的,有 3D 引導的。它是由真實結構資料引導的。所以藝術家決定了幾何形狀。我們在每一幀中都完全忠實於幾何形狀。它由紋理、藝術家的藝術性來引導。所以每一幀,它都在增強,但不會改變任何東西。(01:50:55) 現在,問題在於增強。DLSS 5 也允許,因為系統是開放的,你可以訓練自己的模型來決定,你甚至可以在未來提示它。我希望它是一個卡通著色器。我希望它看起來像某種風格,所以你可以給它一個例子。它會以那種風格生成,完全符合藝術家的藝術性、風格和意圖。所以所有這些都是為藝術家做的,這樣他們就可以創造出更美麗但仍符合他們想要風格的東西。我認為他們得到的印象是遊戲會原樣發佈,然後我們會對它進行後期處理。這不是 DLSS 的意圖。(01:51:50) DLSS 是與藝術家整合的,所以它是關於給藝術家提供 AI 工具、生成式 AI 工具的。他們可以選擇不使用它,你知道?萊克斯·佛里曼(01:52:01) 我認為人們對人臉非常敏感。我們現在生活在這樣一個時刻,我認為這是一個美麗的時刻,人們對 AI 垃圾很敏感。它為我們提供了一面鏡子,幫助我們意識到我們所追求的是不完美。我們追求的有時不是完美的圖形。它幫助我們理解我們在創造的世界中發現什麼引人入勝。這很美。只要它是幫助我們創造那些世界的工具——黃仁勳(01:52:28) 是的,沒錯。萊克斯·佛里曼(01:52:28) ……它就很好。黃仁勳(01:52:29) 沒錯。又多了個工具而已,而且他們希望生成模型生成與照片級真實相反的東西。是的,它也能做到。所以這只是一個額外的工具。我想玩家們也可能很感激,在過去的幾年裡,我們向遊戲開發者介紹了皮膚著色器。許多遊戲都有皮膚著色器,包括次表面散射,使皮膚看起來更像皮膚。所以遊戲開發者們正在尋找越來越多的工具來表達他們的藝術。所以這只是一個額外的工具,他們可以決定使用什麼。萊克斯·佛里曼(01:53:16) 一個可笑的問題。你認為有史以來最偉大或最具影響力的遊戲是什麼?也許從 輝達 的角度來看?黃仁勳(01:53:24) 毀滅戰士。萊克斯·佛里曼(01:53:25) 毀滅戰士,毫無疑問。那是 3D 的開始。黃仁勳(01:53:28) 我會說是毀滅戰士,從藝術、文化影響以及行業的角度來看,它將 PC 變成了遊戲裝置。那是一個非常重要的時刻。當然,在此之前有飛行模擬公司。但他們沒有毀滅戰士那樣的普及度,未能讓整個行業將 PC 從辦公自動化工具轉變為家庭和玩家的個人電腦。所以毀滅戰士在這方面確實影響深遠。從實際遊戲技術角度來看,我會說是VR戰士。所以,你知道,我們和兩者都是很好的朋友。萊克斯·佛里曼(01:54:07) 還有最近的遊戲——我的意思是,賽博朋克 2077,非常棒的 GPU 加速圖形。就像——黃仁勳(01:54:16) 完全光線追蹤。萊克斯·佛里曼(01:54:17) 完全光線追蹤。還有,我個人非常喜歡,我是天際、上古捲軸的超級粉絲,你知道,它很久以前就發佈了,但人們發佈模組並且——黃仁勳(01:54:29) 我們喜歡模組。萊克斯·佛里曼(01:54:30) ……他們創造了這些令人難以置信的,我的意思是,它就像一個不同的遊戲,讓我可以一遍又一遍地重玩。它讓你意識到,你可以用一種全新的方式重新體驗你已經熱愛的世界。所以——黃仁勳(01:54:45) 沒錯。萊克斯·佛里曼(01:54:45) ……我一直都這麼做。我最喜歡的事情之一就是在天際中漫步。黃仁勳(01:54:48) 我們建立了一個叫做 RTX Mod 的東西。是的,它是一個模組工具。萊克斯·佛里曼(01:54:53) 太棒了。黃仁勳(01:54:53) 它允許社區將最新技術注入到舊遊戲中。萊克斯·佛里曼(01:55:00) 當然,造就一款偉大電子遊戲的不僅僅是圖形,還有故事和角色發展,但是——AGI 時間線黃仁勳(01:55:06) 沒錯。萊克斯·佛里曼(01:55:06) ……美麗的圖形可以增加沉浸感。那種彷彿被傳送到另一個地方的感覺。啊,你說過,我認為很準確,AGI 的時間線問題取決於你對 AGI 的定義。所以讓我問你一下可能的時間線。讓我們採用這個可能很荒謬的 AGI 定義,即一個能夠基本上完成你工作的 AI 系統。所以,營運,不,是創辦、發展並營運一家成功的科技公司,價值——黃仁勳(01:55:52) 一家好的公司還是一家普通的公司?萊克斯·佛里曼(01:55:54) 不。它必須價值超過 10 億,超過 10 億美元。所以,你知道,你知道做所有這些事情有多難。那麼,我們離那一步還有多遠?所以,我們談論的是 Open-Claude,它能做所有極其複雜的事情,首先需要創新,找到客戶,向他們銷售,管理,建立一個由一些代理、一些人組成的團隊,諸如此類的事情。這是 5 年、10 年、15 年、20 年後的事?黃仁勳(01:56:31) 我認為就是現在。我認為我們已經實現了 AGI。萊克斯·佛里曼(01:56:35) 你認為可以由這樣的 AI 系統來營運一家公司嗎?黃仁勳(01:56:37) 有可能,原因如下。你說的是 10 億,你沒有說永遠。所以例如……一個 Claude 能夠建立一個網路服務,一些有趣的小應用,突然之間,幾十億人花 5 毛錢使用它,然後不久之後就倒閉了,這並非不可能。在網際網路時代,我們看到了大量這類公司,而且那些網站中的大多數並不比今天 Open-Claude 能生成的更複雜。萊克斯·佛里曼(01:57:20) 有意思。實現病毒式傳播並將這種病毒式傳播變現。黃仁勳(01:57:23) 是的。只是我不知道它是什麼,但我當時也無法預測那些公司中的任何一個,你知道?程式設計的未來萊克斯·佛里曼(01:57:30) 你的這個說法會讓很多人興奮。黃仁勳(01:57:32) 是的,不。是的。萊克斯·佛里曼(01:57:33) 就像,你什麼意思?我可以直接啟動一個代理,然後賺很多錢?黃仁勳(01:57:38) 嗯,順便說一句,這正在發生,對吧?你知道當你去中國時,你會看到,你會看到很多人教他們的 Claude,讓他們的 Claude 出去找工作,工作,賺錢。我其實……如果出現某種社交事件,或者有人建立了一個數字影響者,超級可愛,或者某個社交應用,喂養你的小拓麻歌子之類的,然後一夜之間爆紅,我也不會感到驚訝。很多人用了幾個月,然後就消失了。現在,這 10 萬個代理中有一個能建成 輝達 的機率是零。(01:58:28) 然後,有一點我不會做,也希望我們大家都做的是,要認識到人們真的很擔心他們的工作。我只想提醒他們,你工作的目的與你用來完成工作的任務和工具是相關的,但不是一回事。我已經做了 33 年的工作。我是世界上在職時間最長的科技公司 CEO,34 年了。在過去 34 年裡,我用來完成工作的工具一直在變化,有時在兩三年的時間裡變化相當劇烈。有一個故事我非常想確保每個人都聽到,那就是電腦科學家、AI 研究人員說的第一個會消失的工作是放射科醫生。(01:59:25) 因為電腦視覺將達到超人的水平,它確實做到了。CV……電腦視覺在 2019、2020 年達到了超人水平,也許稍晚一點,2020 年?(01:59:39) 對吧?所以電腦視覺達到超人水平已經很久了。所以預測是放射科醫生會消失,因為研究放射掃描已成過去。AI 會做這件事。嗯,他們完全正確。電腦視覺完全是超人的。今天每一個放射學平台和軟體包都由 AI 驅動,然而放射科醫生的數量卻增長了。那麼問題是為什麼?現在我們在世界範圍內缺少放射科醫生。所以,第一,危言聳聽的警告過頭了,它嚇退了人們從事這個對社會如此重要的職業。所以它造成了傷害。那麼,為什麼它是錯的?原因在於,放射科醫生的目的是診斷疾病,幫助病人和醫生診斷疾病。(02:00:38) 因為我們現在可以更快地研究掃描結果,你可以研究更多的掃描,你可以診斷得更好,你可以更快地收治病人,你可以看到更多的人。醫院賺更多的錢。醫院裡有更多的病人。你需要更多的放射科醫生。我的意思是,令人驚奇的是,這是如此顯而易見地會發生的事情。輝達 的軟體工程師數量將會增長,而不是減少。原因在於,軟體工程師的目的與軟體工程師編碼的任務是相關的,但不是一回事。我希望我的軟體工程師解決問題。我不在乎他們寫了多少行程式碼,你知道?但他們的工作,他們工作的目的沒有改變。(02:01:25) 解決問題,團隊合作,診斷問題,評估結果,尋找要解決的新問題,創新,連接點。這些事情都不會消失。萊克斯·佛里曼(02:01:39) 你認為是否可能……我們甚至就拿程式設計來說。你認為世界上的程式設計師數量可能會增加,而不是減少嗎?黃仁勳(02:01:45) 是的。原因如下。什麼是程式設計?我相信……今天程式設計的定義,簡單地就是指定、規格說明,也許如果你想要更具指導性,你甚至可以給出你想要編寫的軟體的架構。那麼問題是,有多少人能做到?描述一個規格,讓電腦去……告訴電腦去建構什麼。有多少人?我認為我們從 3000 萬可能增加到了 10 億。所以未來的每一個木匠都將是一個程式設計師,只不過有了 AI 的木匠同時也是建築師。他們只是增加了能為客戶提供的價值。他們的藝術性極大地提升了。(02:02:43) 我相信每一個會計師,也是你的金融分析師,也是你的財務顧問。所以,所有這些職業都得到了提升……如果我是一個木匠,我看到 AI,我會完全瘋狂。我作為水管工能帶給客戶的服務,完全會瘋狂。萊克斯·佛里曼(02:03:04) 而目前是程式設計師和軟體工程師的人,我認為他們處於最前沿,能直觀地理解如何使用自然語言與代理溝通,以設計出最好的軟體。黃仁勳(02:03:20) 沒錯,完全正確。萊克斯·佛里曼(02:03:20) 所以隨著時間的推移,他們會融合,但我認為學習如何程式設計仍然有價值,比如學習什麼是程式語言。舊式的程式設計,程式語言的良好實踐是什麼,大型軟體系統的設計原則是什麼——黃仁勳(02:03:39) 沒錯。萊克斯·佛里曼(02:03:40) ……語言的?黃仁勳(02:03:43) 原因在於,Lex,你知道,正如你對聽眾所說的,我認為規格說明的目標,規格說明的藝術性,其目標和藝術性將取決於你試圖解決什麼問題。當我思考,當我思考為公司制定戰略、規劃公司方向以及我們應該做的事情時,我會在一個足夠具體的層面上描述它,讓人們大致理解方向並且可以採取行動。它足夠具體,他們可以據此採取行動,但我有意地降低規格說明的程度,這樣就能讓 43,000 名優秀的人把它做得比我想像的更好。(02:04:36) 所以當我與工程師共事,與人們共事時,我會考慮,我在試圖解決誰的問題,什麼問題?我和誰一起工作?規格說明的程度、架構定義的程度與此相關。所以每個人都將不得不學習,他們想在程式設計光譜的那個位置。編寫規格說明就是程式設計。所以你可能決定非常具體地規定,因為你尋求一個非常具體的結果。你可能決定,這是一個你想要更多探索的領域,所以你可能降低規格說明的程度,讓你能與 AI 來回互動,甚至突破自己的創造力邊界。所以這種你在光譜中位置的藝術性,這就是程式設計的未來。萊克斯·佛里曼(02:05:31) 但讓我們在程式設計之外再稍微談一下,我認為很多人,理所應當地,擔心他們的工作,對他們的工作有很多焦慮,尤其是在白領領域。我認為我們誰都不知道該如何應對自動化與新技術到來時總會帶來的動盪時代。我只是……首先,我認為我們都需要有同情心和責任感,去感受那些失去工作的個人和家庭所承受的實際痛苦。我認為每當像人工智慧這樣的變革性技術到來時,就會有很多痛苦,我不知道該如何應對這種痛苦。(02:06:21) 希望隨著工具的發展,它能給同樣的人創造更多的機會,讓他們從事同類型的工作,並使他們更高效、更有趣,就像在程式設計領域那樣。我不得不說,我在程式設計中獲得了如此多的樂趣。我從未有過如此多的樂趣。所以希望它能讓他們的工作自動化枯燥的部分,而把創造性的部分留給人類去負責。但仍然會有很多痛苦和磨難。黃仁勳(02:06:51) 所以我的第一個建議……這就是我現在處理焦慮的方式。事實上,我們之前剛談到過。對未來的巨大焦慮,對壓力的巨大焦慮,對不確定性的巨大焦慮,我首先分解它,然後我會告訴自己,“好吧,有些事情你可以做點什麼,有些事情你什麼都做不了。但對於你能做點什麼的事情,讓我們推理,推理一下,然後去做。”(02:07:20) 如果今天我們招聘一個新畢業的大學生,我有兩個選擇,一個對 AI 一無所知,另一個是使用 AI 的專家,我會僱傭那個使用 AI 的專家。如果我有一個會計,一個市場行銷人員,那個使用 AI 的專家,供應鏈,客戶服務,銷售人員,業務拓展,律師,我會僱傭那個使用 AI 的專家。所以我建議每一個大學生,每一位老師都應該鼓勵他們的學生去使用 AI。每一個大學生畢業時都應該是 AI 專家。每個人,如果你是木匠,如果你是電工,去用 AI。去看看它能做什麼來改變你當前的工作,提升你自己。(02:08:21) 如果我是農民,我絕對會用 AI。如果我是藥劑師,我會用 AI。我想看看它能做些什麼來提升我的工作,讓我自己成為革新這個行業的創新者。所以這將是我會做的第一件事。然後我也會幫助他們……事實是,技術將取代並消除許多工。因為它會自動化,如果你的工作就是那個任務——那麼你很可能被顛覆。如果你工作的目的包含你,某些任務……那麼你去學習如何使用 AI 來自動化這些任務就至關重要。然後中間還有廣闊的光譜。萊克斯·佛里曼(02:09:14) 順便說一句,AI 的美妙之處,比如聊天機器人版本,在於你可以分解……你有焦慮,你可以通過和它交談來分解問題。就像,我最近……你真的可以通過它思考你生活中的問題,通過……我不是指像治療那樣的問題。我指的是,非常實際地,“好吧,我擔心我的……”字面意思是,“我擔心我的工作。需要什麼技能?我需要採取那些步驟?”我如何更好地使用 AI?”你剛才說的一切,你都可以直接問,它會給你……一個逐點的計畫。我的意思是,它簡直就是一個很棒的人生教練,就是這樣。這——黃仁勳(02:09:51) 我不知道怎麼用 AI,AI 會說,“嗯,讓我來教你。”萊克斯·佛里曼(02:09:54) 沒錯。這非常元,但它——它有點不可思議。所以人們絕對應該——黃仁勳(02:10:00) 你不能走到 Excel 前說,“我不知道怎麼用 Excel。”萊克斯·佛里曼(02:10:02) 沒錯。黃仁勳(02:10:02) 你完蛋了。萊克斯·佛里曼(02:10:03) 我的意思是,這真的是 AI 在生活的各個方面為我所做的,消除了作為初學者第一次使用某物時的初始摩擦。我真的可以問任何一件事,“我需要採取的第一步是什麼?”黃仁勳(02:10:16) 沒錯。萊克斯·佛里曼(02:10:17) 它提供的這種手把手的指導,消除了世界提供的一切體驗中的摩擦……你知道,就像我私下跟你提到的,你提到,“我要去中國和台灣。”黃仁勳(02:10:30) 太棒了。萊克斯·佛里曼(02:10:31) 直接問,“我去那裡——”黃仁勳(02:10:31) 為你感到興奮。萊克斯·佛里曼(02:10:32) “我去那裡……做什麼……” “你知道,我去那裡?我怎麼……” 所有這些問題……立即得到回答,這太美好了。黃仁勳(02:10:37) 嗯,你去台灣的時候,直接問 AI……“Jensen 在台灣最喜歡的餐廳有那些?”它實際上會——萊克斯·佛里曼(02:10:45) 你不知道?黃仁勳(02:10:45) 哦,知道。萊克斯·佛里曼(02:10:46) 精準嗎?好的。好吧。黃仁勳(02:10:47) 遍佈台灣。萊克斯·佛里曼(02:10:50) 嗯,你在那邊是個大明星。就像我們私下提到的,也許我們會在電腦會展上碰面,那會非常棒。黃仁勳(02:10:58) 台北電腦展。輝達 GTC 台灣。意識萊克斯·佛里曼(02:11:01) 你認為關於人類本性、人類意識,是否存在某些根本上是非計算性的東西?也許是某些東西,無論晶片多麼強大,都無法複製?黃仁勳(02:11:18) 我不知道晶片是否會緊張。你知道,當然,導致焦慮、緊張或任何情緒的條件。我相信 AI 將能夠識別和理解這些。我不認為我的晶片會感受到這些。因此,那種焦慮、那種感覺、那種興奮、那種……所有這些感覺都體現在人類的表現中。例如,極其出色的人類表現,運動表現,平均或低於平均水平。同樣的情境,在不同的人身上,會產生整個光譜的人類表現,展現出不同的結果,展現出不同的表現。(02:12:15) 我認為我們正在建構的任何東西中,沒有任何東西表明,兩個不同的電腦在完全相同的情境下,會產生……當然,它們會產生統計上不同的結果,但那不是因為它們感覺不同。萊克斯·佛里曼(02:12:34) 是的,主觀體驗……天那,我們人類的主觀體驗確實有些特別的東西。就像我對你說的,和你談話我相當緊張。就像我對你說的,希望、恐懼、焦慮,以及生活本身,生活的豐富性。一切是多麼神奇。我們愛得有多深,我們的心碎得有多深,我們有多害怕死亡,當我們所愛的人去世時我們有多痛苦。所有這一切,全部。我知道很難……想像 AI 能夠……一個計算裝置能夠做到那樣。但這整件事還有很多我們尚未發現的奧秘,我對此持開放態度,願意接受驚喜。在過去——萊克斯·佛里曼(02:13:23) ……幾個月和幾年裡,我已經被驚到了很多次。擴展可以在智能領域創造一些不可思議的奇蹟。看著這一切真的非常奇妙,所以我願意接受驚喜。黃仁勳(02:13:34) 分解什麼是智能是非常重要的。你知道,我們一直使用的這個詞,它不是一個神秘的詞。智能是有含義的,你知道?(02:13:46) 它是一個系統……它是我們所做的事情,包括感知、理解、推理和制定計畫的能力。那個循環,那個循環,就是……智能的根本。智能不是一個完全等同於人性的詞。我認為區分這兩者非常重要。我們有兩個詞來描述。我不過度幻想,也不過度浪漫化智能。智能是……人們以前聽我說過,我實際上認為智能是一種商品。我被聰明人包圍著。我周圍都是比我聰明的人,在他們各自的領域裡。(02:14:39) 然而,我在那個圈子裡有一個角色。這其實挺有意思的。他們比我受教育程度高。他們上的學校比我好。他們在各自領域都比我深入。所有人。我有 60 個這樣的人。對我來說,他們都是超人。而不知何故,我卻坐在中間,協調著所有這 60 個人。所以你得問問自己……一個洗碗工有什麼特質,能讓這個洗碗工坐在一群超人的中間?這說得通嗎?(02:15:15) 所以,這就是我的觀點。我的觀點是,智能是功能性的。人性不是用功能性來定義的。它是一個大得多的詞。我們的人生經歷、我們對痛苦的忍耐力、我們的決心,這些都是不同於智能的詞。所以,我想幫助聽眾理解的是,如果我只能給他們一個資訊,那就是智能這個詞隨著時間推移被我們提升到了一個非常高的地位。萊克斯·佛里曼(02:15:50) 我們真正應該提升的詞是人性的光輝。黃仁勳(02:15:53) 品格,人性的光輝。萊克斯·佛里曼(02:15:55) 所有這些。黃仁勳(02:15:55) 所有這些。同情心、慷慨,你剛才說的一切,我相信這些都是超人的力量。而現在的智能將被商品化。因為我們談到了,最重要的是你的教育。現在,即使他們說你最重要的是你的教育,當你上學時,你獲得的不僅僅是知識。(02:16:22) 但不幸的是,我們的社會把所有東西都歸結為一個詞,而生活遠不止一個詞。我只是想告訴你,我的生活表明,在智力曲線上比我周圍的每個人都低,並不改變我是最成功的事實。所以,我希望這能激勵其他人——不要讓智能的民主化、智能的商品化導致你的焦慮。你應該為此受到鼓舞。萊克斯·佛里曼(02:17:00) 是的。我認為 AI 將幫助我們更多地頌揚人類。當然,人性與人類至上,我認為讓這個世界不可思議的是人類將永遠如此,而 AI 正是這個讓我們人類變得更強大的不可思議的工具——黃仁勳(02:17:18) 完全正確。萊克斯·佛里曼(02:17:18) ……人類更強大。黃仁勳(02:17:19) 完全正確。死亡萊克斯·佛里曼(02:17:21) 輝達 的成功以及我提到的數百萬人的生活都依賴於你。但你只是一個人,就像我們提到的,和我們一樣終有一死。你會考慮自己的死亡嗎?你害怕死亡嗎?黃仁勳(02:17:42) 我真的不想死。我生活很美好。我有一個很棒的家庭。我有非常重要的工作要做。這不是一生一次的經歷所暗示的,那種經歷可能很多人都有過,只是不是同一個人。我正在經歷的是人類史上一次的經歷。輝達 是歷史上最重要的科技公司之一。我們在做非常重要的工作。我對此非常認真。所以當然有些實際的事情,比如我們如何考慮繼任計畫?我以不相信繼任計畫而聞名。(02:18:36) 天那。黃仁勳(02:18:36) 原因不是因為我長生不老。原因在於,如果你擔心繼任計畫,如果你對繼任計畫充滿焦慮,那麼你該怎麼做?然後你把它層層分解。如果你關心你離開後公司的未來,你今天應該做的最重要的事情,就是儘可能頻繁、持續地傳遞知識、資訊、見解、技能、經驗,這就是為什麼我不斷在我團隊面前推理每一件事的原因。每一次會議都是一次推理會議。我在公司內外度過的每一刻,都是為了儘可能快地把知識傳遞給人們。(02:19:23) 我學到的東西在我桌上停留的時間不會超過一秒鐘。我正在傳遞這些資訊、這些知識——哦,天那,這個太酷了。在我自己還沒完全學完之前,我已經把它指給其他人了。“看看這個。這太酷了。你會想學這個的。”所以我不斷地傳遞知識,賦能於人,提升我周圍每個人的能力,這樣我所尋求的、我希望的結果是,我能死在工作中。並且希望我能瞬間死在工作中。沒有長時間的痛苦,你知道?這,呃——萊克斯·佛里曼(02:20:06) 嗯,從一個粉絲的角度來看,鑑於你對文明產生的極其巨大的積極影響,當然,我希望你能繼續下去。而且,看著 輝達 所做的一切本身就很有趣。就是那種創新速度。我是一個超級工程迷。輝達 持續進行著如此多令人難以置信的工程。光是看著就很有趣。這是對人性的頌揚,是對偉大建設者的頌揚,是對偉大工程的頌揚。所以,它代表著一些特別的東西。所以我希望你和 輝達 繼續下去。關於我們正在進行的這一切,關於人性,關於人類的未來,是什麼給了你希望?當你展望未來,當你經常思考未來,當你展望 10 年、20 年、50 年、100 年後,是什麼給了你希望?黃仁勳(02:20:56) 我一直對善良、慷慨、同情心、人類的能力抱有極大的信心。我一直對此非常有信心。有時甚至超過了我應該的程度。我也會被利用,但這從未讓我停止相信。我總是首先相信人們想做好事。人們想幫助別人。絕大多數情況下,事實證明我是對的。不斷地被證明是對的。而且常常超出我的預期。所以我對人類的能力充滿信心。我認為給我帶來巨大希望的是,我現在看到什麼是可能的,以及根據我們正在做的事情進行推斷,什麼將很可能發生。(02:22:22) 有那麼多我們想要解決的問題。有那麼多我們想要解決的問題。有那麼多我們想要建造的東西。有那麼多我們想做的好事,現在都觸手可及,而且在我有生之年觸手可及。你不可能不對那感到浪漫。你明白我的意思嗎?萊克斯·佛里曼(02:22:46) 活在當下是多麼激動人心的時刻。就像,真的——黃仁勳(02:22:49) 怎能——萊克斯·佛里曼(02:22:49) ……真的是這樣。黃仁勳(02:22:50) 你怎麼能不對那感到浪漫?事實上,期望疾病的終結是合理的。期望這是合理的。期望污染會大幅減少是合理的。期望以光速旅行確實在我們的未來是合理的。然後,不是遠距離,而是短距離。人們問我怎麼做。嗯,首先,很快,我會把一個人形機器人放在宇宙飛船上,它會是我的那個人形機器人,我們會盡快把它送出去,它會在飛行途中不斷改進和增強。(02:23:36) 然後到時候,我所有的意識都已經——你知道,我一生中的大部分資訊都上傳到了網際網路。把我所有的收件箱,把我所做的一切,我所說的一切。你知道,它們被收集起來,變成了我的 AI。到時候,我們只需以光速傳送它,追上我的機器人。萊克斯·佛里曼(02:24:00) 哦,太棒了。我的意思是,但對我來說,那是有點應用層面的。但同樣,對我來說,從最大化好奇心的角度來看,我只是,所有這些奧秘。那裡有太多……令人著迷的科學問題。黃仁勳(02:24:14) 理解生物機器就在眼前。不是 10 年。大概是 5 年。萊克斯·佛里曼(02:24:20) 然後你的生物機器,人類思維,並打開物理學、理論物理學的大門。太令人興奮了。黃仁勳(02:24:26) 解釋意識,那將是很棒的。萊克斯·佛里曼(02:24:29) 這一切都觸手可及。Jensen,非常感謝你多年來所做的一切。感謝你為世界所做的一切。感謝你成為你這樣的人。我看得出你是一個偉大的人,祝你今年取得巨大的成功。我等不及了。作為一個粉絲,我迫不及待地想看看你接下來會做什麼,希望能在台灣見到你,非常感謝你今天能來聊天。黃仁勳(02:24:52) 謝謝你,Lex。我過得很愉快。還有,如果我能再說一點。謝謝你做的所有採訪,你所展現的深度、尊重,以及你為揭示我們所有人所做出的研究,這些年你採訪過的那些了不起的人。我非常喜歡這些採訪。作為一個創新者,創造了這種長格式的、難以置信的、但又引人入勝的內容。總之,謝謝你做的一切。萊克斯·佛里曼(02:25:25) 這對我來說意義重大。謝謝你,Jensen。黃仁勳(02:25:27) 謝謝你,Lex。萊克斯·佛里曼(02:25:29) 感謝您收聽本次與 黃仁勳 的對話。要支援本播客,請查看描述中的贊助商連結,您還可以在那裡找到聯絡我、提問、反饋等連結。現在,讓我用 Alan Kay 的一句話作為結束。“預測未來的最佳方式是創造未來。”謝謝收聽,希望下次再見。 (invest wallstreet)
黃仁勳最新訪談:我們已經實現了 AGI,領導力、心理學、生命、意識、死亡和人性
黃仁勳最新一期 Lex Fridman 播客,2.5 小時深度對話,覆蓋了從晶片設計到人類意識的幾乎所有話題。概要1. CUDA 差點毀了 NVIDIA。 當年把 CUDA 塞進 GeForce 的決定,讓公司成本暴漲 50%,市值從七八十億美元直接跌到 15 億美元。黃仁勳扛了十年才緩過來,但正是這步棋奠定了今天 CUDA 的統治地位。2. 60 個直接匯報,不搞一對一。 黃仁勳的管理團隊超過 60 人,涵蓋 GPU、CPU、光學、記憶體等各領域專家。所有問題都是群體推理,沒有一對一談話,因為 NVIDIA 本質上就是在做「極致協同設計」。3. 四層 Scaling Law。 預訓練、後訓練、測試時推理、Agentic,四層 scaling law 環環相扣。黃仁勳認為,智能的擴展最終只取決於一件事:算力。4. OpenClaw 是 token 的 iPhone。 黃仁勳多次稱 OpenClaw 為「token 的 iPhone」,認為它對 agentic 系統的意義,就像 ChatGPT 之於生成式 AI。5. 「我認為我們已經實現了 AGI。」 按照「建立一家價值 10 億美元以上公司」的標準,黃仁勳認為 AGI 已經到來。當然,讓 10 萬個 Agent 來造一個 NVIDIA,成功率是零。6. 程式設計師會變多。 程式設計的定義正在改變。從 3000 萬程式設計師變成 10 億,因為未來每個木匠、會計、農民都能用自然語言「程式設計」。7. NVIDIA 不搶份額,創造市場。 黃仁勳說 NVIDIA 的挑戰在於「沒有人可以搶份額」,幾乎所有增長都來自全新的市場。8. 與台積電三十年沒簽過合同。 黃仁勳曾被張忠謀邀請擔任台積電 CEO,他婉拒了。三十年來雙方做了數百億美元的生意,沒有一紙合同,全憑信任。9. 智能是大宗商品,人性才是超能力。 黃仁勳團隊裡 60 個人都比他聰明,但他坐在中間協調所有人。他的觀點是:別讓「智能的商品化」帶來焦慮,該被抬高的詞是「humanity」。10. 希望死在崗位上。 黃仁勳不信「接班人計畫」,他的方式是每一天都在把知識、判斷、經驗傳遞給身邊每一個人。下為訪談對話全文:CUDA 賭命Lex:CUDA 最終成了一個極其輝煌的決定。但當時做這個決定的時候,是什麼樣的?黃仁勳:那可能是我做過的最接近「存亡級威脅」的戰略決策了。CUDA 擴大了我們能加速的應用範圍,但問題來了:怎麼吸引開發者?開發者來一個平台,跟技術炫不炫酷沒關係,關鍵是裝機量大。裝機量才是定義一個架構的關鍵,其他都是次要的。沒有那個架構比 x86 挨過更多罵,但它活下來了。同時期那些漂亮的 RISC 架構,反而大多失敗了。我們當時的想法是:GeForce 已經每年賣幾百萬塊了,乾脆把 CUDA 裝進每一塊 GeForce,不管使用者用不用。同時去大學裡推,寫書,開課,培育生態。問題是,CUDA 大幅增加了 GPU 成本。我們當時毛利率只有 35%,成本一下漲了 50%,利潤全被吃掉了。公司市值從七八十億跌到了 15 億。在那個區間裡……扛了很長一段時間,靠著 GeForce 一點一點爬回來。我常說,NVIDIA 是 GeForce 蓋起來的房子。正是 GeForce 把 CUDA 送到了每一個研究者、科學家、學生手裡。Lex:那種存亡時刻,你是怎麼做出這種決定的?黃仁勳:說到底還是好奇心驅動。到了某個時刻,我的推理系統會如此清晰地告訴我「這件事一定會發生」。一旦我在腦海中堅信了,你知道的,你會去 manifest 一個未來,那個未來如此有說服力,不可能不發生。中間會有大量痛苦,但你得相信你所相信的。而我在領導上從不搞那種「年底大改革」。不搞一次性大裁員、大重組、新 logo 什麼的。我學到一樣新東西,會立刻開始跟身邊的人分享。一步一步地塑造每個人的認知體系。等到我真的宣佈「我們要 all in 深度學習」的那一天,其實所有人心裡都在想:你怎麼現在才說。極致協同設計Lex:你把 NVIDIA 推入了一個新時代,從單晶片設計到了整機櫃設計。什麼是極致協同設計(extreme co-design),最難的部分是什麼?黃仁勳:問題已經裝不進一台機器了。你加了 1 萬台電腦,但你希望它快 100 萬倍。這時候你得重構演算法、切分流水線、切分資料、切分模型。一切都會成為瓶頸。這就是 Amdahl 定律的問題:如果計算只佔總工作量的 50%,你就算把計算加速一百萬倍,總體也只快了兩倍。所以我們得把所有技術都用上,CPU、GPU、網路、交換機、電力、冷卻……否則就只能線性擴展,或者靠已經放緩的摩爾定律。Lex:你的團隊有多大?黃仁勳:我的直接匯報有 60 多人。群體推理 vs 傳統管理Lex:那怎麼溝通?黃仁勳:我不搞一對一。我們把一個問題拿出來,所有人一起攻。因為我們在做極致協同設計,公司本身也是在做極致協同設計。就算在討論冷卻方案,做網路的人、做記憶體的人、做電力的人也在旁邊聽著。誰想退出就退出,但如果有人應該參與卻沒參與,我會把他揪過來。Lex:Vera Rubin 的 Pod 是怎樣的規模?黃仁勳:7 種晶片,5 種機架,40 個機架,1.2 千兆個電晶體,將近 2 萬顆 NVIDIA Die,1100 多顆 Rubin GPU,60 exaflops,10 PB/s 的頻寬。這只是一個 Pod。我們大概每周要產出 200 個這樣的 Pod。Lex:這麼複雜,簡潔還是你追求的目標嗎?黃仁勳:我最常說的一句話是:複雜度要剛好夠用,同時儘可能簡單。四層 ScalingLex:你還相信 Scaling Law 嗎?黃仁勳:相信,而且現在有更多 scaling law 了。Lex:你列了四個:預訓練、後訓練、測試時推理、Agentic。你最擔心那個瓶頸?黃仁勳:回頭看看大家以為的瓶頸吧。預訓練階段,Ilya Sutskever 說了句「資料用完了」之類的話,行業慌了,覺得 AI 到頭了。當然這是錯的。我們會繼續擴大訓練資料量,大量資料將是合成的。很多人不理解合成資料,但其實我們教彼此用的大多數資料本來就是「合成的」,它又不是從自然界長出來的,都是人創造的。AI 現在能拿真實資料,增強它,合成生成海量新資料。所以訓練的瓶頸不再是資料,變成了算力。然後是測試時推理。我還記得當時有人說「推理嘛,簡單的,推理晶片可以做得又小又便宜,不用 NVIDIA 那種大傢伙。」這個想法一直讓我覺得不合邏輯。推理就是思考,思考比閱讀難得多。預訓練本質是記憶和泛化,就是在讀。而推理是在想,在做推理、規劃、搜尋、分解問題……怎麼可能……計算量小呢?然後是 Agentic 層。一個 Agent 可以呼叫工具、查資料庫、做研究,最重要的是,它可以生成一大批子 Agent。擴展 NVIDIA 靠招更多員工,比擴展我自己容易多了。所以下一個 scaling law 就是 Agentic Scaling,本質上就是「AI 乘以 AI」。這四層循環下來,智能的擴展最終歸結為一件事:算力。四層 AI Scaling Law 循環OpenClaw 的 iPhone 時刻Lex:從去年 12 月起,人們好像突然覺醒了,Claude Code、Codex、OpenClaw,是不是有什麼特別的事情在發生?黃仁勳:OpenClaw 對 agentic 系統的意義,就像 ChatGPT 之於生成式 AI。它之所以火,是因為普通使用者也能用到了。OpenClaw 就是 token 的 iPhone。它是歷史上增長最快的應用。直線上升。Lex:我得承認,來的路上在機場,我……公開對著筆記型電腦說話程式設計了。挺尷尬的,因為我在假裝跟一個人類同事對話。黃仁勳:未來更可能的情況是,你的 AI 一直在煩你。因為它幹活太快了,一直跟你匯報「搞定了,下一步呢?」以後跟你聊天最多的人,應該就是你的 Claw,或者說你的🦞了。Agent 的安全邊界Lex:安全問題呢?這麼強大的技術,怎麼確保使用者資料安全?黃仁勳:我們立刻派了一批安全專家過去,搞了一個叫 OpenShell 的東西,已經整合進 OpenClaw 了。我們還發佈了 NemoClaw。核心原則是這樣的:agentic 系統有三種能力,訪問敏感資訊、執行程式碼、對外通訊。我們保證任何時刻最多開放其中兩種,但絕不同時開三種。在這兩種能力之內,再加上企業級的存取控制和策略引擎。這樣既能讓 Agent 幹活,又不至於失控。從加速器到計算平台Lex:NVIDIA 是怎麼從一個 GPU 加速器公司,一步步變成計算平台公司的?黃仁勳:加速器的問題在於,應用領域太窄。市場規模決定了你的研發能力,研發能力又決定了你在計算領域能產生多大影響。所以我們得擴大射程,但又不能丟掉專業化。這兩個詞之間有天然的張力:越通用,越不專業;越專業,越不通用。我們得在中間找到一條極窄的路。第一步,我們發明了可程式設計像素著色器。這是走向可程式設計性的第一步。第二步,我們在著色器裡放了 IEEE 相容的 FP32。這一步意義重大,因為之前在 CPU 上跑科學計算的人突然發現:這個 GPU 算力巨大,而且現在符合 IEEE 標準了,我的程式碼可以遷過來。然後是在 FP32 上面放 C 語言,我們叫 Cg。Cg 一路演進到了 CUDA。每一步都是在擴大計算的「光圈」,同時保住最核心的加速能力。一步一步走了十幾年。電力與供應鏈Lex:AI 擴展最大的瓶頸是什麼?黃仁勳:電力是個問題。但也是我們拚命搞極致協同設計的原因,我們要讓每秒每瓦產出的 token 數每年提升一個數量級。過去 10 年摩爾定律讓算力提升了 100 倍,我們提升了 100 萬倍。有一件事我特別想借你的平台呼籲一下。我們的電網,是按最壞情況設計的。 但 99% 的時間都不會出現最壞情況,電網通常只跑到峰值的 60%。剩下的容量就那麼閒著。我想做的是,跟電力公司簽一種新的協議:平時用它們的閒置容量,極端天氣時資料中心自動降功耗。我們可以把工作負載轉移到別的地方,或者讓電腦跑慢一點,少用能源,服務質量降一點點而已。Lex:什麼阻礙了這件事?黃仁勳:三方的問題。終端客戶要求資料中心永遠線上。資料中心營運商的合同談判人員在簽六個九的 SLA,CEO 可能根本不知道。然後電力公司也只提供一種承諾等級。如果三方都調整一下……電網裡就有大量現成的閒置電力可以用,這才是最唾手可得的資源。Lex:供應鏈呢?ASML 的 EUV、台積電的 CoWoS 封裝、SK 海力士的 HBM,這些瓶頸讓你睡不著覺嗎?黃仁勳:我一直在處理。我飛到每一家供應商那裡,跟 CEO 們解釋我們的增長邏輯。幾年前,我說服了幾家 DRAM 公司的 CEO 投資 HBM,當時 HBM 還只用在極少數超算上,聽起來瘋狂得很。又說服他們把手機用的低功耗記憶體適配到超算上。他們都創了 45 年公司歷史的營收記錄。這也是我工作的一部分,去塑造和啟發整個上下游。Lex:你擔心嗎?黃仁勳:不擔心。Lex:為什麼?黃仁勳:因為我告訴了他們我需要什麼,他們理解了,他們告訴我他們會做什麼,我相信他們會做到。馬斯克與 ColossusLex:你怎麼看馬斯克和 xAI 在孟菲斯用 4 個月建成 Colossus 超算這件事?黃仁勳:馬斯克在很多領域都有很深的涉獵,同時他又是一個出色的系統思考者。他質疑一切:第一,這件事有必要嗎?第二,必須這樣做嗎?第三,必須花這麼長時間嗎?他把一切壓縮到不能再少的最低必要量,同時保留了產品所需的全部能力。極度的極簡主義,系統等級的極簡。而且他會親自到現場。有問題,他就去了。「讓我看看問題在那。」當你親自展示出那種緊迫感,所有人都會跟著緊迫起來。Lex:我見過他那些會議。他會跟工程師一起蹲在地上,研究怎麼把線纜插進機架……黃仁勳:對。在 NVIDIA 我們有一個類似的方法論,叫「光速」。這不只是關於速度,它是我對「物理極限在那」的簡稱。每件事我們都要拿來跟光速對比。記憶體速度、算力、功耗、成本、時間、人力、製造周期。先搞清楚物理極限,再去做工程。我不喜歡「持續改進」的思路。別跟我說「現在要 74 天,我們能縮到 72 天」。我寧願從零開始問:「憑第一性原理,最快幾天能搞定?」答案可能是 6 天。剩下的 68 天可能都有道理,是各種妥協和成本最佳化。但至少你知道差距在那。知道了 6 天是可能的,從 74 到 6 的對話就會有效得多。中國是建設者國度Lex:你最近去了中國。中國過去十年是怎麼建立起這麼多世界級科技公司的?黃仁勳:全球大約一半的 AI 研究者是華人,大部分仍在中國。他們的科技行業恰好趕上了移動雲時代,他們的貢獻方式是軟體。這個國家的孩子數學和科學教育極好,對現代軟體相當熟悉。中國不是一個單一經濟體。各省各市的市長們互相競爭,所以才有這麼多電動車公司、這麼多 AI 公司。競爭極其激烈,活下來的都了不起。另外,他們的社會文化是家人第一、朋友第二、公司第三。工程師們的兄弟在那家公司、同學在這家公司,知識傳播極快。他們本質上一直是 open source 的。所以他們對開源社區貢獻大,完全合理,因為他們心想:「我們有什麼好藏的?」這是當今世界創新最快的國家。Lex:而且在中國,做工程師是件挺酷的事。黃仁勳:他們是一個建設者國度。我們國家的領導人都相當出色,但大多是律師。他們的國家是從貧困中建設起來的,所以領導人大多是傑出的工程師。開源與 NemotronLex:NVIDIA 發佈了開放原始碼的 Nemotron 3 Super,120 億參數的 MoE 模型。你對開放原始碼的願景是什麼?黃仁勳:要做好 AI 計算公司,我們必須理解 AI 模型是怎麼演進的。Nemotron 3 有個特別的地方:它不只是純 Transformer,還融合了 SSM(狀態空間模型)。我們很早就在做條件 GAN、漸進式 GAN,一步步走到了擴散模型。在模型架構上做基礎研究,能讓我們看清未來的計算系統該怎麼設計。這也是極致協同設計的一部分。開源有三個層面的原因。第一,我們確實需要世界級的模型作為產品,這些應該是專有的。但同時,我們也希望 AI 擴散到每一個行業、每一個國家、每一個研究者和學生手裡。如果一切都是閉源的,研究和創新就很難在上面展開了。第二,NVIDIA 有規模、有技能、也有動力去持續做這件事。我們能啟動每一個行業加入 AI 革命。第三,AI 遠不只是語言。這些 AI 會使用工具、呼叫子模型,而那些子模型可能是訓練在生物學、化學、物理學、流體力學上的。我們不造車,但我們要確保每家車企都能用上最好的模型。我們不做藥物發現,但我想確保禮來(Eli Lilly)能擁有世界最好的生物 AI 系統。Lex:而且你們是真正的開源,權重、資料、方法全部公開。黃仁勳:對,模型開源,權重開源,資料開源,連怎麼做的都開源了。這一點確實應該被更多人知道。台積電:信任Lex:你跟台積電的關係是什麼樣的?黃仁勳:對台積電最大的誤解是:覺得他們只有技術。好像有人做出了一個一樣好的電晶體,台積電就完了。他們真正了不起的地方,是那套製造管理系統。協調全球幾百家公司動態變化的需求,晶圓啟動、停止、緊急追加,客戶在變、產能在變,整個世界在不斷變化,而他們始終保持高吞吐、高良率、低成本、交付準時。然後是文化。他們同時做到了兩件通常矛盾的事:頂尖的技術前沿和頂尖的客戶服務。最後是信任。三十年,幾百億美元的生意,沒有合同。 這份信任了不起。Lex:2013 年張忠謀邀請你去當台積電 CEO?黃仁勳:是真的。我深感榮幸。張忠謀是我見過的最受尊敬的高管之一,也是我的好朋友。但 NVIDIA 的工作太重要了,我在心中已經看到了 NVIDIA 會變成什麼樣。這是我的責任,唯獨我的責任。所以我婉拒了。不是因為那個機會不夠好。那是一個不可思議的機會。但我沒辦法接受。NVIDIA 的護城河Lex:NVIDIA 最大的護城河是什麼?黃仁勳:CUDA 的裝機量。這是我們最重要的資產。CUDA 不是三個人做成功的,是 43000 人做成功的,加上幾百萬信任我們的開發者。他們把自己的軟體棧建在了 CUDA 上。從開發者的角度想:如果我支援 CUDA,明天它就會快 10 倍,平均只要等半年。而且我的程式碼能跑在幾億台裝置上,每個雲、每個行業、每個國家。我 100% 信任 NVIDIA 會一直維護和改進 CUDA。你把這些加在一起,如果我是開發者,我會 CUDA first。太空裡的 GPULex:你怎麼看在太空建資料中心這個想法?黃仁勳:NVIDIA 的 GPU 其實已經在太空了。我當時知道的時候還挺意外的,本來想高調宣佈一下,給 GPU 穿個小宇航服什麼的。那些衛星上有高解析度成像系統,在持續掃描地球,要做到釐米級的即時遙感。這些資料量是 PB 等級的,沒法全傳回地球。所以 AI 必須在邊緣端就地處理,把不需要的、沒變化的全扔掉,只留關鍵資訊。如果放在極地軌道,24 小時都有太陽能。但太空裡沒有傳導、沒有對流,散熱只能靠輻射。好在太空足夠大,搞幾個巨大的散熱板就行了。Lex:這個想法離落地有多遠?5 年?10 年?黃仁勳:我比較務實。我先去抓眼前最大的機會,同時派工程師去研究太空的問題:怎麼應對輻射?怎麼處理性能退化?怎麼做冗餘和容錯?怎麼讓電腦在太空裡不會壞,只是變慢?但眼下我最想做的事,還是把電網裡那些閒置的電力先用起來。那才是最唾手可得的。Token 工廠Lex:NVIDIA 可能價值 10 兆美元嗎?黃仁勳:讓我解釋一下為什麼 NVIDIA 的增長幾乎是必然的。計算經歷了一次本質變化。過去的電腦本質是一個「倉庫」,我們預先錄製內容,存成檔案,然後用檢索系統找出來。現在 AI 電腦是「工廠」,它即時理解上下文,即時生成 token。倉庫 vs 工廠:計算範式轉變倉庫不怎麼賺錢,工廠的產出直接跟收入掛鉤。而且這個工廠生產的商品,token,正在分層,就像 iPhone 一樣:有免費的 token、有中檔 token、有高級 token。有人願意為每百萬 token 付 1000 美元,這不是「會不會」的問題,只是「什麼時候」的問題。NVIDIA 面臨的挑戰在於想像力。我沒有人可以搶份額。幾乎我們說的所有增長都來自一個尚不存在的市場。外界確實不太容易想像。但我有的是時間,我會持續推理、持續講述,每一次 GTC 都會讓它變得更加真實。遊戲與 DLSS 5Lex:DLSS 5 引起了一些爭議。玩家們擔心遊戲會變成 AI slop(AI 氾濫內容)。你怎麼看?黃仁勳:說實話,我也不喜歡 AI slop。AI 生成的內容越來越多,看起來越來越像,都挺漂亮,但缺少個性。我理解玩家的感受。但 DLSS 5 做的事情不一樣。它是 3D 引導的、地面真實資料約束的。藝術家決定了幾何形狀,我們百分百忠於每一幀的幾何結構。它受紋理約束,受藝術家意圖約束。增強,但不改變。而且因為系統是開放的,你可以訓練自己的模型,未來甚至可以用 prompt 來控制風格:「我要卡通渲染風格」,「我要這種畫風」。所有這些都是為藝術家提供的工具,他們可以選擇用或者不用。玩家們可能以為我們是在遊戲出廠後強行做後處理。但實際上 DLSS 是跟藝術家整合的,是給創作者的 AI 工具。Lex:你覺得史上最偉大的遊戲是那個?黃仁勳:Doom。從文化影響力和行業意義來說,Doom 把 PC 從一個辦公自動化工具變成了一個遊戲裝置,這個轉變的意義太大了。從遊戲技術的角度,我會說 Virtua Fighter。Lex:我個人特別喜歡《上古捲軸:天際》,雖然是很久以前的遊戲了,但一直有人出 Mod……黃仁勳:我們做了 RTX Mod,這是一個 modding 工具,能讓社區把最新的渲染技術注入到老遊戲裡。而且別忘了,GeForce 到今天仍然是我們排名第一的行銷手段。人們在十幾歲的時候就通過玩遊戲認識了 NVIDIA。後來上了大學,開始用 CUDA,再後來用 Blender、用 Autodesk。AGI 已來?Lex:用一個定義來問:一個 AI 系統,能夠建立、發展並營運一家價值超過 10 億美元的科技公司。離這個 AGI 有多遠?黃仁勳:我認為已經實現了。Lex:什麼?黃仁勳:你說的是 10 億美元,而且沒說要永遠經營下去。完全有可能一個 Claude 建立了一個 Web 服務,某個小應用,幾十億人用了一下,每人 50 美分,然後很快就倒閉了。網際網路時代那些爆款網站,大多數都沒有比今天 OpenClaw 能生成的東西更複雜。Lex:你這話會讓很多人激動的。黃仁勳:你去中國看看,已經有一大幫人在教自己的 Claude 去找工作、做活、賺錢了。我不意外某個數字網紅、某個 Tamagotchi 養成類應用突然爆火幾個月然後消失。但讓 10 萬個 Agent 來造一個 NVIDIA……成功率是零。程式設計師會更多Lex:你覺得程式設計師數量會增加還是減少?黃仁勳:會增加。程式設計的定義變了。今天的程式設計就是寫規格說明。多少人能做到「告訴電腦去造什麼」?我覺得我們剛從 3000 萬擴大到了 10 億。未來每一個木匠都是程式設計師。而一個有 AI 的木匠,同時也是建築師。 他能給客戶提供的價值翻了幾倍。每個會計同時也是財務分析師和理財顧問。所有職業都被拉高了。Lex:放射科醫生的例子呢?黃仁勳:AI 研究者最早說會消失的職業就是放射科醫生。電腦視覺確實在 2019、2020 年就超越了人類。但放射科醫生數量反而增加了,現在全球還短缺。因為你搞清楚了,放射科醫生的「目的」是診斷疾病、幫助病人,而不是「看片子」這個任務本身。AI 讓看片子變快了,所以能看更多片子,診斷更多病人,醫院賺更多錢,需要更多放射科醫生。你的工作的目的和你用來做這份工作的工具,是相關的,但不是同一件事。NVIDIA 的軟體工程師也一樣。我要他們解決問題,不在乎他們寫了多少行程式碼。別怕,就去用Lex:很多人對自己的工作有焦慮。黃仁勳:我對焦慮的處理方式,剛才其實已經講過了:分解問題,想清楚那些能做,做了就不焦慮了。如果今天要招一個新畢業生,兩個人選,一個不懂 AI,一個精通 AI,我選後者。木匠、電工、農民、藥劑師,都應該去用 AI,看看它能怎麼提升你的工作。Lex:而且你可以直接問 AI:「我不知道怎麼用 AI。」黃仁勳:對,這就是 AI 最厲害的地方。你沒法走到 Excel 面前說「我不會用 Excel」。你完了。但 AI 會說:「好的,讓我來教你。」領導力與痛苦Lex:你說過你的成功來自比任何人都能吃苦。你怎麼應對這麼大的壓力?黃仁勳:我完全意識到 NVIDIA 的成功對美國的重要性。我們貢獻了大量稅收,建立了技術領先地位,這關乎國家安全的方方面面。我也知道有很多普通投資者,老師、警察,因為買了 NVIDIA 的股票成了百萬富翁。我的應對方式就是分解。發生了什麼?變了什麼?什麼難?我能做什麼?把大問題拆成小塊,然後一個一個解決,或者分配給能解決的人。凡是讓我擔心的事,我都會告訴一個能做點什麼的人。 說出來了,負擔就分攤了。然後就是遺忘。你得學會忘記。不能什麼都記著、什麼都扛著。分解問題、分享負擔、然後忘掉它。這跟頂級運動員一樣。上一分已經過去了,只關心下一分。Lex:你說過如果提前知道有多難就不會創辦 NVIDIA,但……黃仁勳:所有值得做的事情應該都是這樣。有一種超能力叫「孩子心態」。我面對幾乎所有事情的第一反應是:能有多難?沒有人做過,規模巨大,要花幾千億美元。你就這麼想:「能有多難呢?」你不要提前模擬所有的挫折和羞辱。你應該帶著「一切都會順順利利」的心態走進新體驗。等挫折真的來了,它們會讓你意外,但你得有韌性,得能忘掉,得繼續走。只要我對未來的假設沒變,我對輸出的判斷就不會變。那就繼續走。智能與人性Lex:你覺得人類意識中有什麼是晶片永遠無法複製的嗎?黃仁勳:我不確定晶片會不會緊張。AI 可以識別和理解情緒,但我的晶片不會「感受」到那些東西。而那些感受,焦慮、興奮、恐懼,深刻地影響著人的表現。兩個拿到完全相同資訊的人,可能產生截然不同的結果,並非某個演算法不同,純粹是因為「感覺不同」。Lex:那你怎麼看智能這個詞?黃仁勳:智能這個詞被抬得太高了。我身邊 60 個人,每一個在各自領域都比我聰明,他們學歷更高、學校更好、研究更深。但我坐在他們中間,協調所有人。你得問自己:一個洗碗工……憑什麼坐在一群超人類專家的中間?智能是功能性的東西。人性不是。人性是一個大得多的詞。我們的社會把太多東西塞進了「智能」這一個詞裡。但人的一生遠不止一個詞。我的經歷表明,在智能曲線上比身邊所有人都低,並不妨礙你成為最成功的那個。別讓智能的民主化、商品化給你帶來焦慮。你應該受到鼓舞。死在崗位上Lex:你想過自己的死亡嗎?黃仁勳:我真的不想死。我有很好的家庭,很好的生活,還有極其重要的工作。這不是「一生一次」的經歷,因為那暗示很多人都經歷過。這是「人類歷史一次」的經歷。我不相信接班人計畫。這並非因為我覺得自己不朽。如果你真擔心接班,那你現在該做什麼?答案是:每時每刻都在傳遞知識。任何學到的東西,在我桌上停留不超過一秒。我還沒完全消化完,就已經在指給別人看了。我希望的結局是,死在崗位上,最好是瞬間的,沒有漫長的痛苦。Lex:什麼給你希望?黃仁勳:我一直對人類的善良、慷慨和同理心有極大的信心。有時候比應有的還多,偶爾被佔便宜,但這從沒改變過我。期待疾病的終結,是合理的。期待污染大幅減少,是合理的。期待以光速旅行,也是合理的。不是遠距離,是短距離。怎麼實現?我很快就會把一個人形機器人送上太空飛船。它會在飛行途中不斷改進。等時機到了,我的意識,我的收件箱裡的一切,我說過的一切,我做過的一切,都已經上傳到網上了。到時候以光速發過去,追上我的機器人。Lex:這真精彩。理解生物機器,你覺得還要多久?黃仁勳:就在眼前了。大概五年。Lex:然後是人類大腦,理論物理……黃仁勳:解釋意識。那個就太酷了。 (AGI Hunt)
馬斯克2026封神訪談:AI、機器人、財富邏輯全顛覆,看完刷新認知
最近,馬斯克一場近3小時的深度訪談刷屏全球,沒有空話、全是硬核預判,直接把未來10年的文明走向攤開在所有人面前。作為科技圈最敢說、也最能把預言落地的人,他的每一句話,都在重新定義我們對工作、財富、科技的認知。這場訪談,沒有晦澀理論,全是可落地的時間表、反常識的真相、顛覆認知的未來,今天用最通俗的話,帶你吃透核心,聊聊我的真實看法。01. 馬斯克訪談核心乾貨,全是重點1. AI時代徹底到來,速度遠超想像馬斯克直言,2026年AGI通用人工智慧將落地,未來幾年AI總智能會超過全人類智能總和。AI不再是輔助工具,而是和人類平行的“智慧主體”,我們正站在文明躍遷的臨界點。2. 機器人取代勞動,工作變成“可選項”Optimus人形機器人將規模化普及,成本比汽車還低,包攬製造、家務、醫療等大量工作。未來10-15年,工作不再是生存必需,而是個人選擇,人類從體力勞動中徹底解放。3. 能源是終極底牌,中國優勢被點名認可未來科技競爭的核心不是晶片,是能源。馬斯克明確提到,中國在電力產能、製造業、基建效率上擁有壓倒性優勢,是AI、電動車、機器人領域的關鍵力量。4. 財富邏輯重構,別再盲目為退休存錢生產力爆炸式增長,商品和服務成本趨近於零,傳統“存錢養老”的邏輯會失效。未來是物質極豐時代,真正的財富,是把握趨勢、擁有創造價值的能力。5. 太空探索提速,火星殖民、月球建廠不是夢2030年啟動火星無人任務,20年內建火星城市,甚至要在月球建廠。馬斯克的目標,從來不止地球,而是讓人類成為多行星文明。02. 我的個人觀點:這不是科幻是即將到來的現實很多人覺得馬斯克的話太瘋狂,像天方夜譚,但回顧過去,他的SpaceX、特斯拉、星鏈,無一不是把“不可能”變成現實。在我看來,這場訪談最珍貴的,不是一個個驚人預言,而是給普通人敲響警鐘:世界正在以肉眼可見的速度變革,AI、機器人、新能源不是遙遠的科技概念,而是會衝進每個行業、改變每個人生活的浪潮。固守舊思維、停留在舒適區,只會被時代拋下。真正的安全感,從來不是存錢、求穩定,而是擁抱變化、跟上趨勢、擁有適應未來的能力。我們不必焦慮AI取代人類,因為科技的終極意義,是讓人類從重複勞動中解脫,去創造、去探索、去活成更完整的自己。03. 總結:這篇訪談,給我們的三個重要啟示第一,未來已來,不要視而不見。AI與機器人帶來的變革,不是遙遠的未來,而是正在發生的現在,越早認知,越能佔據主動。第二,能力比穩定更重要。舊的生存邏輯正在失效,提升自己、適應時代,才是最可靠的底氣。第三,保持開放,拒絕焦慮。技術進步的最終目的,是讓人類擁有更好的生活,與其恐懼變化,不如主動擁抱,找到屬於自己的位置。馬斯克的訪談,本質是一場未來啟示錄。他用最直白的方式告訴我們:變革已來,未來已至。不恐懼未知,不抗拒新生,保持學習,保持清醒,抓住時代的風口,我們每個人,都能在新時代裡,找到屬於自己的位置。(螺絲椒不辣)
深度訪談 | a16z最新發聲:當下的科技市場比以往任何時候都大!
核心速覽科技統治力: 全球市值前十的公司幾乎全是美國科技巨頭,科技正在吞噬整個市場份額。這不是 2000 年: AI 擁有成熟的雲基礎設施。ChatGPT 達到同樣搜尋規模的速度比 Google 快了 5.5 倍,需求端訊號極強。顛覆巨頭的公式: 真正的顛覆者將通過 “AI Agent 互動 + 非結構化資料利用 + 按任務結果付費” 來挑戰傳統 SaaS 巨頭。價值錯位: 目前全球有 20 億人用 AI,但僅 4000 萬人付費,未來貨幣化空間極其廣闊。“科技市場比以往任何時候都大,公司保持私有化的時間也比以往任何時候都長。” 這是 a16z 成長基金合夥人 David George 對當前市場最核心的判斷。科技統治全球:贏家通吃的時代我們正處在一個科技“吞噬”整個市場的時代。一個簡單而震撼的事實是:全球市值最高的公司中,前 6 名(有時是前 8 名)幾乎全部是美國科技公司。 科技公司正在逐漸佔據整個市場的市值份額。對於投資機構而言,這意味著機會集是巨大的。而當前最大的變數,就是 人工智慧(AI)。AI 基礎設施:規模空前,巨頭買單與以往的技術周期不同,這一次 AI 浪潮的基礎設施鋪設方式非常獨特:1. 巨頭的“軍備競賽”為初創公司鋪路科技巨頭(Google, Meta, Amazon, Microsoft)年化資本支出(Capex)高達 4000 億美元。這意味著最賺錢的公司正在為全行業承擔昂貴的基建成本。2. 成本下降速度超越摩爾定律成本暴跌: 過去兩年,訪問模型的輸入成本下降了超過 **99%**。質量飆升: 前沿模型的能力大約每 7 個月翻一番。AI 最終會像電力或 Wi-Fi 一樣,成為一種基礎性的、隨處可得的資源。為什麼這次不一樣?需求端的強力證據市場常擔憂 AI 是 2000 年網際網路泡沫的重演,但 a16z 認為需求側訊號截然不同:AI 的普及速度比 Google 快了 5.5 倍。目前全球已有超過一半的網際網路人口體驗過 AI 工具,這種爆發力是史無前例的。商業模式:巨大的“消費者剩餘”AI 的市場機會遠大於軟體市場。美國軟體支出僅佔 GDP 的 **1%**,而白領薪酬佔 GDP 的 20%。價值捕獲: 通常新技術創造的價值中,90% 流向使用者(消費者剩餘),10% 流向公司。即使只捕獲這 10%,也是天文數字。定價潛力: 目前全球約 20 億 AI 使用者中,僅 4000 萬人付費。當 (使用者量)已達數十億量級,未來的爆發點在於 (價格)的精細化運作——從統一訂閱轉向基於任務價值的差異化定價。公式化的貨幣化:結構性轉變:3.5 兆美元的私募市場一個不可逆轉的趨勢是:高增長的科技公司保持私有化的時間越來越長。上市周期拉長: 平均時長從 5-10 年延長到了 14 年。市場重心轉移: 10 年前,10 億美金以上的私有公司總市值約 5000 億;如今已翻 7 倍,達到 3.5 兆美元。增長稀缺: 公開市場中,只有 5% 的軟體公司能保持 25% 以上的增長。想要追求爆發力,投資者必須深入一級市場。顛覆巨頭的三個支點如何挑戰像 Salesforce 這樣的現有霸主?a16z 提出了一個顛覆框架:UI/UX 重新想像: 從“被動記錄”的表格轉變為“主動執行”的 Agent 模式。資料權易手: 從傳統的結構化資料庫轉向對全量非結構化資料的即時呼叫。商業模式創新: 徹底拋棄“按人頭計費(Seat-based)”,轉向“按任務成果計費”。儘管基礎設施建設存在能源和散熱的瓶頸,但使用者端的爆發式增長讓 a16z 對未來 10 年充滿信心。這一次,我們不是在等待未來,而是正在即時見證未來的加速。 (GD梯度下降)
【上】Anthropic CEO 深度訪談:為什麼 2027 年是人類的最後一道門檻?
關於 AGI(通用人工智慧)的預測,市面上充斥著兩種極端:一種是線性的悲觀,認為“摩爾定律已死”;一種是盲目的狂熱。 Anthropic CEO Dario Amodei,這位物理學博士出身的“實幹派”,提供了一個基於資料的第三種視角。他認為,我們正處於指數級增長的尾聲——不是因為增長停滯,而是因為終點已近。 這個終點,也就是他口中的“資料中心裡的天才國度”,最早將在 2026 或 2027 年 到來。我們將用三篇文章來為大家詳細解讀。01 定義終局:“資料中心裡的天才國度”在長達 3 小時的訪談中,Dario 拒絕使用模糊的 AGI 概念,而是給出了一個工程學上的精確定義:“Country of Geniuses in a Data Center”(資料中心裡的天才國度)。這不僅是能通過圖靈測試的聊天機器人。Dario 描述的是這樣一個系統: 它在雲端 7x24 小時運行,擁有成千上萬個獨立的智能體。每個智能體的能力都等同於人類頂尖專家——無論是寫程式碼、做數學推理,還是設計複雜的生物實驗。他的時間表非常具體: 在排除“不可約減的不確定性”後,他認為在 2026 年或 2027 年 實現這一願景的機率極高。他甚至直言,認為 2035 年還實現不了是“瘋狂的”(Crazy)。02 暴力美學的勝利:“大計算團”假說為什麼他如此確信?這並非盲目信仰,而是基於他在 2017 年撰寫的內部檔案《大計算團假說》(The Big Blob of Compute Hypothesis)。核心邏輯簡單得令人髮指:別整那些花哨的技巧,只管堆料。 只要集齊以下幾個要素,模型就會通過“縮放定律”自動變強:原始算力(Raw Compute)海量資料(Quantity of Data)訓練時長可擴展的目標函數(Objective Function)七年來,從 GPT-1 到 Claude 4.6,行業的發展從未偏離這個假設。現在,強化學習(RL)也被納入了這個公式。就像 AlphaGo 自我博弈一樣,現在的語言模型正在通過“思考”(Chain of Thought)進行自我強化。03 五十億美元的豪賭:在這個牌桌上,不敢梭哈就是死預測未來很容易,但用身家性命去押注很難。Dario 揭示了 AI 巨頭們面臨的真實財務困境——這是一場關於“提前量”的俄羅斯輪盤賭。訓練一個前沿模型需要數年時間建設資料中心。這意味著 CEO 必須在今天決定 2027 年的算力採購量。買早了(模型能力沒跟上): 每年數十億美元的折舊會瞬間擊穿現金流,公司破產。買晚了(模型如期爆發): 當“天才國度”降臨時,你手裡沒有算力去承接潑天的需求,直接出局。Anthropic 的策略是“激進但留有緩衝”。他們在賭指數級增長會持續,賭那個“天才國度”會如期而至。這解釋了為什麼即便當前 AI 變現尚處於早期,矽谷的資本支出(Capex)依然在瘋狂飆升——因為在通往終點的最後一公里,誰也不敢減速。 (大尹隱於網)
Figure CEO 2026年首次深度訪談:美國最終只剩3家人形公司,26年夏季開始不依靠中國供應鏈!
Figure公司首席執行長Brett Adcock宣佈,手工編寫機器人程序的時代正式結束。在Peter Diamandis的Moonshots播客節目中,Adcock接受了一次內容廣泛的採訪。他透露,隨著Helix 02的發佈,Figure公司已經達到了“軟體2.0”的里程碑。Helix 02是一種人工智慧架構,它使得Figure公司能夠從其機器人程序中刪除最後109,504行手工編寫的C++程式碼。此次採訪在 Figure 公司位於桑尼維爾的總部進行,讓我們得以最詳細地瞭解該公司的“系統 0、1、2”核心及其 2026 年雄心勃勃的製造路線圖。核心內容總結刪除“笨拙”的過去。此次發佈的核心是Helix 02的全面部署,Adcock將其描述為機器人智能的根本性重構。之前的版本依賴C++來實現下肢控制和平衡,而Helix 02引入了System 0 (S0) ——一個全身強化學習控製器,它完全通過神經網路來處理平衡、接觸和協調。“如果只靠程式碼啟髮式演算法,我們根本不可能做到今天你所看到的四分之一,”阿德科克告訴迪亞曼迪斯,他指的是Figure 03 中機器人將玻璃器皿放入洗碗機的演示。這種“像素到扭矩”的方法使機器人能夠實現“房間級自主控制”,使其能夠像一個連續的系統一樣導航和操作物體,而不會像傳統控製器那樣出現“走走停停”的延遲。Figure 03:為該模型建構的硬體。Adcock 將Figure 03展示為一款專為運行 Helix 堆疊而設計的“主力機”。該硬體在經濟效益方面實現了巨大飛躍,Adcock 聲稱其製造成本比 Figure 02 降低了 90%。主要改進包括:重量減輕: F.03 比其前身輕了 30 磅,提高了安全性和動力效率。感測器整合:新型掌部攝影機和指尖觸覺感測器(靈敏度低至 3 克)現在直接融合到神經策略中。運動方式:全新的“被動式腳趾”設計可實現更自然的步態和更深的運動範圍,克服了早期型號“笨拙”的平足行走方式。此次硬體成熟是在Figure 02 測試機退役之後實現的,該測試機在寶馬生產線上累計運行了 1250 小時。Adcock 指出,雖然寶馬的試點項目取得了成功,但其底層架構“過於粗放”,無法擴展到 Figure 設想的數百萬台裝置規模。HARK 和“全能模型”願景。阿德科克討論了HARK的創立,這是一個專注於數字和物理自主性的全新人工智慧實驗室。HARK似乎是Figure向“全能模型”(一種能夠同時處理語音、推理和物理動作的單一神經網路)轉型背後的驅動力。阿德科克利用實驗室的進展解釋了Figure為何在2025年終止與OpenAI的合作關係。 “我們的團隊遠遠領先於他們,”阿德科克說道,他認為通用機器人需要一種純粹的大型語言模型(LLM)無法達到的“具身物理學”水平。他貶低目前的LLM,稱其為“高級Google搜尋引擎”,缺乏必要的世界觀,無法避免撞穿玻璃牆或壓壞易碎物品。2026年:機器人建造機器人。2026年的時間表依然十分緊迫。Adcock預計今年將在Figure的“BotQ”生產線上引入機器人,朝著“自我複製”的生產模式邁進。BotQ工廠目前正在進行改造,以支援每年近5萬台產品的產能。雖然與 Sunday Robotics 的“洗碗機大戰”凸顯了 Figure 處理易碎玻璃器皿的能力,但最終的考驗仍然是家庭環境。Adcock 坦言,儘管他2026 年的路線圖目標是“未曾涉足”的家庭環境,但當機器人出現在他自己的孩子身邊時,他仍然會“照看”它。“我們的目標是讓機器人能夠完全自主地在家中運行,照顧我的所有孩子,”阿德科克說。“只有當我覺得足夠安全,可以讓它自由活動時,它才適合所有人使用。”他估計,到2026年底,具備外科手術般靈巧度的硬體將準備就緒,但要達到同樣的可靠性水平,“大腦”還需要更多的資料。全球競賽。談到與中國的競爭,阿德科克既表示讚賞,又不以為然。他承認中國的職業精神和人才素質,但認為大多數國際競爭對手仍然停留在“開環”模式——預先設定的程序或遠端操作,他戲稱之為“豆漿玩意兒”。“給我展示一分鐘機器人完整、閉環、即時地完成任務的視訊,”阿德科克挑釁道。“你肯定在其他地方沒見過這樣的視訊。”特斯拉首席執行長埃隆·馬斯克最近提出了截然不同的看法,他完全否定了Figure公司以及整個美國機器人行業。在特斯拉2025年第四季度財報網路直播中,馬斯克表示:“據我們所知,在中國以外,我們沒有看到任何重要的競爭對手。”Figure 計畫到 2026 年夏季,使其供應鏈中幾乎沒有中國零部件,從而進一步保護這家估值390億美元的初創公司免受地緣政治摩擦的影響,同時努力交付首批真正通用的人形機器人得了來之不易的重大成果。以下內容為視訊初步實錄(未作精校,僅作參考)第一章:開篇與Figure機器人的進化史Peter Diamandis:你們取得的成就讓我震驚。現在你們用神經網路能做到的事情,每年都讓我大開眼界,整個業務面貌看起來完全不同。令人驚嘆的是,隨著你們積累資料,這些資料正成為驚人的進入壁壘和資產。Brett Adcock:這裡重要的一點是,一旦一個機器人學會了如何做某項任務,整個機器人編隊就都知道了,而人類並不是這樣運作的。我們何時能看到機器人製造機器人?我們將把機器人投放到我們的Baku生產線上。這將會是世界上最大的經濟體,這是一個超級有影響力的業務,將為所有人帶來無處不在的商品和服務,進入富足時代。這也是一個超級有趣的業務,就像在建構我們都想要的科幻未來。世界上每個主要團隊都會進入這個領域,你別無選擇。Peter Diamandis:各位好,Dave和我現在在聖何塞的Figure總部。我們剛和朋友Brett Adcock錄完播客,非常精彩。快看,我們就在這裡。這是Figure 01,最初的原型,雖然有點原始但仍能運作。它運行了第一個大語言模型和神經網路。Brett實際上是親手組裝這些東西的,當時全是為了收集遙測資料來建構後續版本。Peter Diamandis: 這裡是Figure 02,更美觀、功能更強,全面運行神經網路,拋棄了所有的C++程式碼。然後我們看到了Figure 03,這是目前的主力機型。我們剛才參觀時,大概看到有一百台這樣的機器人在走廊裡走動、在測試台上運行、在洗碗。太驚人了。Brett Adcock: 確實。Figure 03增加了一個靈活的腳趾,這讓它可以蹲下,而之前的腳部設計很笨重。Figure 03還配備了手掌攝影機。我們把重量減輕了約30磅,製造成本降低了90%。這是我們和Figure 03之間的完美高度差。Peter Diamandis :歡迎來到Moonshots節目。我和Brett Adcock在Figure總部,旁邊是Figure 02。距離我們上次一起做節目已經過去大約18個月了。我對你們的進展感到震驚。在AI時代,18個月就像十年一樣。Brett Adcock :歡迎來到Figure總部。我們剛剛參觀了這裡,我們有30萬平方英呎的空間,還有40萬平方英呎在開發中。你們看到Figure 03在走廊裡走動,全自動機器人運行著Helix 2系統。我今天剛收到Helix 2發佈的通知。我們看到機器人在做廚房任務、搬運包裹、製造零件。我們至少看到了一百台機器人。第二章:神經網路革命與程式碼的終結Peter Diamandis :我依然記得Figure 01把Keurig膠囊放入咖啡機的場景,那是個大事件,因為那是用神經網路而非C++完成的。對我們來說,那是一個巨大的轉折點。Brett Adcock :我認為我們需要解決幾個關鍵問題。第一,你能否製造出低成本、能力接近人類的電動人形機器人?這是硬體方面。第二,你能否找到一種方法,不靠寫程式碼來解決問題?如何使用神經網路來學習那些人類的行為表徵和新任務?當我們做Keurig任務時,那是第一個在人形機器人上運行的雙臂神經網路實例。那一刻我們就決定:“好了,我們必須全力投入神經網路。”整個技術堆疊都需要是神經網路。今天你們看到了Helix 2,這是我們迄今為止最棒的版本。Peter Diamandis :我們看到了Figure 03在全自動模式下運行Helix 2,把東西放進洗碗機,完全沒有預程式設計。我喜歡它展現出的人性化元素,比如用臀部關門,用腳頂起洗碗機。Brett Adcock: 這就是神經網路的不同之處。你會得到意想不到的行為,有些是你永遠無法通過編碼寫出來的。如果是寫C++程式碼,你只能走到死胡同。相比程式碼,神經網路能做的事情讓我大吃一驚。如果是寫程式碼,我們連今天展示的四分之一都做不到。Peter Diamandis :令人驚嘆的是,資料成為了不可思議的壁壘。如果你用C++寫這些,你投入了數億美元,你會不敢動它。而在神經網路中,你可以說:“嘿夥計們,從頭開始重新訓練。”這是一種完全不同的範式。Brett Adcock: 確實。大概一兩年前,我們有幾十萬行C++手寫程式碼。寫這些程式碼很貴,很難測試。我們在Helix 1中刪除了大部分程式碼,但下半身控制仍是C++。就在今天,我們刪除了剩餘的10.9萬行C++程式碼。現在全是神經網路了。這是全機身的神經網路。我們花了大概一年時間重構Helix架構來實現這一點。現在,機器人能像人類一樣在空間中移動,協調手眼腳,並在幾百赫茲的頻率下輸出扭矩。第三章:與OpenAI的分手及物理世界的挑戰Peter Diamandis:起初你們和OpenAI在軟體上有合作,後來分道揚鑣了。能談談這個嗎?Brett Adcock:我遇到了Sam Altman和OpenAI團隊,他們很有興趣進入機器人領域。他們確實想建立非常緊密的合作關係。他們和微軟一起領投了我們的B輪融資。我們開始合作開發下一代人形機器人模型。我們非常看重如何用語言來調節整個技術堆疊。大語言模型(LLM)在很多方面就像一個世界模型,它在權重中理解什麼是事物,應該做什麼。但這種合作並沒有奏效。我們的團隊在幾乎一年的時間裡表現得比他們更好。我們在內部自己做所有的工作,我們有來自世界頂尖實驗室的人才。教別人如何為嵌入式系統建構AI模型變得沒有意義,所以我們決定自己做。Peter Diamandis :LLM是基於文字資料建構的,它有常識,但如果你把它安裝在物理機器裡,它並不知道自己在做什麼。你必須接觸世界。機器人有40多個自由度,狀態空間比宇宙中的原子還多,所以你無法一一模擬。Brett Adcock: 確實。我需要理解精細的接觸動力學。比如抓這個水瓶,我該如何定位手肘、骨盆、軀幹?LLM雖然覺得自己知道,但往往會完全失敗。我們嘗試過把LLM直接放在機器人裡進行“零樣本”(Zero-shot)測試,結果它確實能以正確的方向走,但直接撞上了一堵透明玻璃牆。它缺少對物理世界的理解。我們在Figure不僅要解決這個問題,我還成立了一個新的AI實驗室叫HARC,專注於這種物理與數字結合的AI。第四章:中美競爭、遠端操控與全自動的真相Peter Diamandis :關於中國,今年有報導稱中國有150多家機器人公司,出現了“機器人泡沫”。而在美國,嚴肅的玩家可能不到10家。你認為未來會發生什麼?會像汽車行業那樣整合嗎?Brett Adcock :這在每個深科技行業都會發生。最終全球會整合為少數幾家集團,遠少於10家。在美國可能只有兩三家。製造硬體很難,要讓神經網路在上面運行並規模化更難。我認為大家低估了其中的難度。Peter Diamandis: 我想知道人們是否意識到,很多機器人視訊其實是遠端操控(Teleoperation)的,而不是全自動。而我們剛才看到的是Helix 2進行了4分鐘的全自動操作,完全沒有預程式設計。Brett Adcock :我這輩子沒見過這麼多公司,背後藏著個人操控機器人,然後發視訊假裝是自動的。這就像我說我有自動駕駛公司,其實有個人在遠端開車。如果你想做對,必須全端相信神經網路。令人印象深刻的不是製造或遠端操控。你可以用很爛的硬體進行遠端操控。難的是在未見過的場景中進行端到端的神經網路控制,並實現數小時甚至數天的長時程工作。如果我們能解決通用機器人問題,那怕只有10台機器人能進入未知環境做真實工作,這才是區別所在。我們目前還處於“誰能解決通用機器人”的階段。Brett Adcock :那些功夫表演的視訊,本質上是你在讓人穿上動捕服做動作,然後讓機器人盲目重放(Open Loop)。這很容易,任何大學生都能做到。你真正想要的是閉環控制(Closed Loop),機器人能以每秒200次的速度推理並動態響應環境。這比開環重放要難上十萬倍、一百萬倍。第五章:Helix 2 架構與2026年展望Peter Diamandis :那麼2026年有什麼值得期待的?Helix 2的定義是什麼?Brett Adcock :Helix 2是一個巨大的飛躍。首先,我們在機器人內部整合了一個完全學習的控製器,我們稱之為System Zero。機器人體內沒有任何程式碼,它使用全機身強化學習控製器來移動。據我所知,還沒人能將其整合進全機身進行學習型操控和感知。其次,我們根據在寶馬工廠的經驗重構了架構。我們意識到之前的架構無法擴展到10萬台機器人。Helix 2是專為大規模預訓練資料設計的,而Figure 03則是專為運行Helix 2設計的。這是一個圍繞資料設計的閉環。Peter Diamandis:2026年你最大膽的預測是什麼?Brett Adcock :第一,我們將把機器人放到Baku生產線上,今年就開始讓機器人製造機器人。第二,我們要在工業和商業勞動力中規模化部署Figure 03。我們已經簽了多個客戶,明確了部署計畫。我們更傾向於租賃模式,就像人類也是被“租賃”的一樣(工資)。第三,也是最重要的,我們要解決通用機器人技術。我的願景是建構一個穿著緊身衣的“人類”,你可以和它交談,它有常識推理能力,有完美的記憶,可以成為你的伴侶。Peter Diamandis :是否會有兩個不同的模型?一個負責身體和物理的VLM,一個負責對話的大語言模型?Brett Adcock :我們相信最終會歸結為一個“Omni Model”(全能模型)。它在預訓練早期就將所有這些融合在一起。我們需要語音、語言調節策略、物理理解、記憶和個性。這不僅僅是完成任務,我們希望機器人能理解你的情緒。另外,我們現在只有一個神經網路,並沒有針對“洗碗”或“物流”的獨立網路庫。第六章:硬體、算力與供應鏈深度解析Brett Adcock :我們發現,即使有更多資訊輸入,比如學會彈鋼琴能讓你成為一個稍好的足球運動員一樣,資料會產生正向遷移。在Figure,我們試圖建立世界最好的模型。對人形機器人來說,多樣性至關重要。Peter Diamandis :你們使用常規GPU進行訓練,但推理(Inference)時的計算是在專用的、非H100的硬體上運行的,這成本可能便宜100倍。Brett Adcock :是的,而且它是完全在機器人板載運行的。我們可以進行非常快速的推理和策略部署,也不會消耗掉機器人所有的電力。我們主要關注供應鏈、電池和通訊。在通訊方面,我們在機器人上配備了Wi-Fi、5G和eSIM卡,所以即便沒有Wi-Fi,你也可以給機器人發簡訊。它還有藍牙。理想情況下,你希望隨時保持連接,但也希望機器人在斷網時仍能執行任務。Peter Diamandis :說到電池,現在的電池續航如何?順便說一句,我喜歡那種通過腳部無線充電的設計。Brett Adcock :目前單次充滿電可以運行大約4到5個小時。我們通過腳部進行感應式無線充電,功率約2千瓦。電池組容量大約是2千瓦時,所以充滿電大約需要一小時。這意味著它可以工作四五個小時,休息一小時充電。這很棒。我認為人們過於關注單次充電能跑多久了。並沒有多少任務需要連續工作幾小時而不休息。它可以進行機會性充電,比如在廚房水槽前鋪一塊充電墊,它在洗碗時就能充電。Peter Diamandis :人們確實在過度關注一些奇怪的指標,比如“它能跑多快”、“能做後空翻嗎”。Brett Adcock :你說的大部分都是開環(Open Loop)行為,也就是重放預設動作。而在Figure,我們需要看到的是真正的閉環控制:機器人像人類一樣移動、觸摸、搬運物體。這才是最難的問題所在。我們看到人形機器人領域出現了爆發式增長,但在達到“真實閉環控制”這一點上,出現極其陡峭的滑坡。你很少看到機器人能連續一分鍾不剪輯、不遠端操控地做家務。我們花了兩年時間,每周工作7天,才從幾分鐘的桌面操作發展到如今的全屋自主。Peter Diamandis :既然你選擇了垂直整合,目前的供應鏈有多少還依賴中國?Brett Adcock: 我想大概到今年夏天,我們的供應鏈裡幾乎就不會有中國的部分了。但我其實很喜歡中國,我在那裡待過很長時間。在美國看電視你會覺得那是巨大的衝突和戰爭,但當你真正去到中國,你會發現那裡的創業精神令人驚嘆。每個人都想贏,但也想合作,感覺就像在一個巨大的創業孵化器裡。Peter Diamandis :你們自己製造執行器和電機,我記得你提到Figure 02到Figure 03的成本降低了90%,這是驚人的。Brett Adcock: 我們進行垂直整合是因為迫不得已。如果能直接買到合適的電機或靈巧手裝上去,那是極好的,但這行不通。如果你不親自做工程設計,一旦某個環節出問題,你就完了。現成技術的成熟度太低了。早期我們也嘗試過外購,但基本都失敗了,所以只能自己設計。現在我們自己做總裝,一方面是因為沒人知道怎麼做更好,另一方面也是為了保護IP。Brett Adcock :即使我們使用現有的供應鏈,機器人也做不到你們今天看到的事情。如果你現在去買一個現成的人形機器人,它沒有合適的感測器,沒有足夠的算力,散熱不行,硬體不是圍繞神經網路棧建構的。很多從中國買機器人的團隊,最後都得自己改裝,背個大背包放電池和算力,但這無法規模化。這就像搞火箭卻想買現成的火箭一樣,行不通。Peter Diamandis: 看著像Unitree(宇樹科技)、Engine AI等中國公司,你最關注那一家?Brett Adcock :中國確實爆發出了很多優秀的人才和機器人。但我認為我們還沒看到這些系統展現出任何閉環AI控制能力。他們大多是在賣硬體,或者做大量的開環控制。這與設計全自動系統是完全正交的兩回事。如果要問Figure真正的競爭對手是誰,我認為主要就是“中國”這個整體。Peter Diamandis :這將會是世界上最大的經濟體,這是一個50兆美元的市場。Brett Adcock :沒錯,這大約占人類勞動GDP的一半。世界上每個主要科技集團都會進入這個領域,你別無選擇。但我認為這很難,因為我們正在做的是“火箭級”難度的設計。人形機器人的硬體工程難度可能堪比火箭設計。這可能是地球上最難的硬體之一。Peter Diamandis :現在有了Helix和巨大的神經網路,這是第七層能力嗎?還是它滲透到了其他層?Brett Adcock :在Archer,最高層的規劃是由飛行員完成的。而在Figure,隨著Helix 2的推出,現在完全是由神經網路來決定做什麼。誰來告訴技術堆疊該做什麼?這個“最高層行為”以前可能來自手把或開環指令碼,現在則來自神經網路的規劃和推理。第七章:家庭、AGI與未來願景Peter Diamandis :讓我們談談家庭應用。醫療保健和養老將是重要部分。你對這方面怎麼看?Brett Adcock: 我在中西部的一個農場長大,父母經營獨立輔助生活設施,所以我從小就接觸養老護理。我非常有激情去解決如何讓機器人進入養老護理,讓人們能居家養老。目前養老設施很難讓人願意搬進去,而且供不應求。Peter Diamandis :你認為AGI(通用人工智慧)需要具身實體嗎?Brett Adcock :當我今天使用AI時,我覺得它很笨,就像一個高級的Google搜尋引擎。我想建構的是Jarvis,我希望它能推理、有完美記憶、能接觸物理和數字世界。我的新實驗室HARC正在做這件事,我們讓AI從頭開始設計CAD圖紙,比如我讓它給我的兒子設計一個怪獸卡車,它在一小時內就能完成。目前的頂尖實驗室都在互相模仿,沒人真正建構能推理、有持久記憶並能接觸世界的多模態系統。我的AGI版本是:它能做人類能做的事,而不只是給我念搜尋結果。未來12到18個月將是我們見過的最大AI轉型期。Peter Diamandis: 機器人什麼時候能做手術?Brett Adcock :從硬體角度看,我認為2026年我們的硬體就能達到外科醫生的操作水平。如果你能通過遠端操控讓機器人做到,我們就能讓它學會。只要硬體允許,剩下的就是資料問題。第八章:設計哲學與為什麼是雙足雙臂Peter Diamandis:我的朋友Salim Ismail問,為什麼只有兩隻手?為什麼不讓機器人有四隻手或六隻手?Brett Adcock :我們的目標是做人類能做的事,並以最便宜、最輕便的方式實現。更輕意味著更安全,更便宜意味著可製造性和規模化。如果你開始增加額外的手臂,機器人會變重,成本變高,製造變難。而且在物流場景中,四隻手並不一定更快,因為空間有限。我們的執行器速度還有3到5倍的提升空間,目前的限制主要是軟體還不知道如何高速操作。Peter Diamandis :確實。如果你讓機器人快3到5倍,一旦出錯,代價會很高。特別是在家裡,要是踢到貓就不好了。Brett Adcock :沒錯。你想要一個成本在1萬到2萬美元的機器人,而不是5萬美元。成本主要取決於產量,所以你希望像造汽車一樣大規模製造標準化的機器人。第九章:規模化與十億級機器人市場Peter Diamandis :如果價格降到2萬美元,按租賃算大概是每天10美元,每小時40美分。你估計2035或2040年地球上會有多少機器人?Brett Adcock :每個人都應該擁有一個人形機器人來處理工作,商業領域可能還需要50到100億台。如果一切順利,我認為地球上可以有數百億台人形機器人。我們基本上是在製造一個廉價的、能24小時工作的“人類副本”。我希望在24個月內,所有的機器人都能由機器人製造。Peter Diamandis :如果展望24個月後的未來,需求量將是數十億台。這需要數兆美元的資金。你會讓世界再等5年,還是去籌集那1兆美元?Brett Adcock :融資市場是存在的,看看信用卡或汽車租賃市場就知道了。關鍵在於:第一,必須解決神經網路的規模化問題;第二,必須讓機器人參與製造機器人。如果我們今天能解決通用人形機器人技術,讓它能做你想做的一切,我覺得我們今天就能出貨10億台。Peter Diamandis: 這有點像《星際迷航》裡的創世計畫。你可以把一個盒子運到肯尼亞,打開盒子,它就開始利用當地資源製造Figure工廠,而所有的IP都通過聯邦學習傳回母艦。這能讓GDP增長100倍。第十章:安全、隱私與未來Peter Diamandis: 關於家庭中的安全和隱私,你怎麼看?之前有過智能音箱監聽使用者的訴訟。Brett Adcock :安全是讓機器人大規模進入家庭的首要問題。這裡有語義上的安全(如不打翻蠟燭),也有本質安全(不傷害人和寵物)。我們有一個完整的網路安全團隊在處理這些問題。如果能做到,它們會比人類更安全,就像自動駕駛汽車最終會比人類駕駛更安全一樣。我們有超人類的感知能力,360度視野,時刻線上。Peter Diamandis :網友問:你什麼時候會放心讓Figure抱你的新生兒?Brett Adcock :在Archer時我常說,直到我願意讓自己和家人坐上去,它才算足夠安全。對於Figure也是一樣。當我能把機器人全自動地放在家裡,並且放心它在孩子身邊時,那就是它準備好了。目前我們還沒有達到那個階段,但那是我們的目標。Peter Diamandis :我今天早上剛和Kathy Wood聊過,她也是你們的投資人。我在聖莫尼卡開車時,會和孩子們數Waymo(自動駕駛計程車)的數量。Brett Adcock :Google早在2005年就看到了這個願景,並堅持了16、17年。Waymo是一個了不起的產品,他們沒有動搖,最終做到了。這非常鼓舞人心。Peter Diamandis: 最後一個極客問題。我在達沃斯聽到大家說格陵蘭島的礦產無法開採,因為太冷了。如果有十億台機器人,我們能不能去格陵蘭島開採?Brett Adcock :我認為我們會先去格陵蘭島,然後再去小行星採礦。只要有更好的工程解決方案,加上無限的勞動力,我們一定能找到辦法。第十一章:Figure 03 實物導覽Brett Adcock :好的,這是Figure 01。我們在成立公司後一年內設計並讓它走了起來,這可能是歷史上最快的時間之一。雖然不漂亮,但它解鎖了我們的軟體開發。這是全鋁製結構,重約130-140磅。Brett Adcock :然後是Figure 03,這是我們的主力。我們讓機器人變得更瘦、質量更輕,但保持了同樣的速度和扭矩。它大約135磅(約61公斤),手部可以承重20公斤。這是一雙全新的手,指尖有觸覺感測器,覆蓋了柔軟的順應性材料。它是為了量產設計的,使用了軟性外殼,大大減少了夾傷點。我們大幅降低了成本,提升了散熱和計算系統。Peter Diamandis :為什麼選擇在臉上保留螢幕?Brett Adcock: 如果不小心,黑色的臉部可能會給人一種反烏托邦的感覺。我們有三個螢幕,可以顯示狀態,甚至播放Netflix。更重要的是,大腦(計算單元)就在頭部,這非常合理,便於散熱,也便於佈置攝影機和感測器。Peter Diamandis :這就是Figure在月球、在軌道、在海底的未來。我們很快會在太空中建立資料中心,需要有人去組裝它們。零重力環境將是絕佳的測試場。Brett Adcock: 百分之百。如果是那樣,我們可以帶它去飛零重力飛機測試。如果能在太空中運行,那將極其重要。我們也會去其他行星,這需要自動化。Peter Diamandis :今天的節目就到這裡,感謝大家收看Moonshots。 (人形機器人洞察研究)
Anthropic掌門人重磅訪談:AI正處於指數級增長尾聲,2026年將迎“資料中心裡的天才國度”,營收正以10倍極速狂飆
Dario Amodei在最新訪談中預測,2026-2027年將出現由AI組成的“資料中心裡的天才國度”,其智力密度堪比數萬名諾貝爾獎得主。在財務方面,他披露公司正經歷每年10倍的“恐怖”增長,預計2025年營收將衝擊100億美元大關。Amodei解釋了為何不敢豪擲兆提前囤積晶片:一旦需求爆發延後一年,巨大的現金流壓力將直接導致公司破產。在AI技術指數級爆發的前夜,Anthropic掌門人Dario Amodei拋出了震撼業界的預測:我們正處於“指數增長的黃昏”,最快到2026年,人類將迎來由數萬個頂尖大腦組成的“資料中心裡的天才國度”。近日,大模型獨角獸Anthropic首席執行長Dario Amodei在與Dwarkesh Patel的深度訪談中,罕見地披露了公司驚人的營收增速預期,並對AGI(通用人工智慧)的時間表、算力投資的財務邏輯以及地緣政治風險進行了詳盡闡述。Amodei認為,AI技術正處於從量變到質變的臨界點,未來2-3年將決定人類未來兩百年的走向。(Anthropic首席執行長Dario Amodei作客Dwarkesh Patel播客)01AI 正處於指數級增長末期Dario Amodei在訪談伊始就指出,我們已逼近 AI 指數增長曲線的尾聲,而世界尚未充分感知這場質變。從 GPT-1 到如今的專業級模型,AI 完成了從 “聰慧高中生” 到 “博士水準” 的躍遷,程式設計、數學等領域甚至實現超越,底層擴展定律從未失效,算力與資料的投入仍在持續兌現明確收益。指數增長的魔力藏在末期的爆發裡。Dario表示,Anthropic 年營收 10 倍的跨越式增長,Claude Code 讓工程師生產力倍增,模型上下文長度與泛化能力的快速突破,都在印證 “終點臨近” 的訊號。這場增長不只是參數的堆砌,更是智能本質的升級 —— 從資料擬合到自主泛化,AI 正在補齊最後幾塊關鍵能力拚圖。02“資料中心裡的天才國度”:重新定義2026Amodei在訪談中提出了一個極具衝擊力的概念——“資料中心裡的天才國度”(A Country of Geniuses in a Datacenter)。他回顧了過去三年的技術演進,認為AI模型已從“聰明的高中生”進化為“專業人士”。他大膽預測,到2026年或2027年,單一模型所展現出的智力水平、知識深度和邏輯推理能力,將不僅等同於一名諾貝爾獎得主,而是等同於數萬名頂尖天才協同工作的集合體。對於這一時間表的確定性,Amodei表現出極高的信心:“對於10年內實現這一願景,我有90%的把握;而對於這在未來1-2年內發生,我認為是50/50的可能性。”他指出,唯一的變數可能來自地緣政治災難(如晶片供應鏈中斷)或社會劇烈動盪。03營收狂飆:從1億到100億美元的“恐怖”曲線市場最為關注的財務資料方面,Amodei披露了Anthropic令人咋舌的增長曲線。他透露,公司營收正經歷著“怪異的每年10倍增長”(bizarre 10x per year growth)。Amodei在訪談中直言:“2023年,我們從0增長到1億美元;2024年,從1億美元增長到10億美元;而2025年,我們預計將達到90億至100億美元。這一指數級增長大致符合我的預期,甚至在今年第一個月,我們又增加了數十億美元的營收。”Amodei強調,儘管受到經濟擴散速度(Diffusion)滯後的影響,企業採納AI需要經過法律稽核、合規檢查等漫長流程,但技術本身的能力提升正在推動這一瘋狂的增長曲線。04算力豪賭與破產風險:CEO的財務平衡術面對如此確定的技術前景,為何不現在就舉債兆美元囤積晶片?Amodei給出了極具現實意義的財務解釋:算力擴容必須與收入增長和預測精度掛鉤,否則將面臨毀滅性風險。“如果我預測2027年會有兆級需求,從而提前購買了價值1兆美元的算力,但只要需求爆發的時間晚了一年,或者增長率稍微從10倍降至5倍,沒有任何避險手段能阻止公司破產。”Amodei解釋道,這種基於“對數收益定律”的投資回報需要精密核算。他指出,Anthropic目前的策略是“負責任地激進”,即投入的算力規模足以捕捉巨大的上行空間,但如果市場爆發推遲,公司憑藉其企業級業務的高毛利和現金流,依然能夠生存。他預計,Anthropic有望在2028年左右實現盈利,屆時AI將成為歷史上盈利能力最強的產業之一。05軟體工程的終局:從寫程式碼到取代工程師在具體落地場景上,Amodei將程式設計視為AI最先攻克的堡壘。他將AI在軟體工程領域的進化分為三個階段:第一階段:模型編寫90%的程式碼行(已實現)。第二階段:模型處理90%的端到端任務,如修復Bug、配置叢集、撰寫文件。第三階段:模型具備“職場經驗”,能夠理解複雜程式碼庫的上下文並設定技術方向。Amodei預測,在1-3年內,AI將能夠勝任高級軟體工程師的所有職責。“這並不意味著工程師會失業,而是生產力的巨大爆發。現在的模型能做到的不僅是補全程式碼,而是直接接管GPU核心編寫等高難度任務。”Anthropic首席執行長Dario Amodei深度訪談全文翻譯如下:06我們究竟在擴展什麼?Dwarkesh Patel(以下簡稱Dwarkesh): 我們三年前談過。在你看來,過去三年最大的更新是什麼?現在和當時的感覺有什麼最大的不同?Dario Amodei(以下簡稱Dario): 從宏觀上講,底層技術的指數級增長基本符合我的預期。雖然有一兩年的誤差。我不確定我是否預測到了程式碼方面的具體發展方向。但當我看這個指數曲線時,它大致符合我對模型進步的預期——從聰明的高中生到聰明的大學生,再到開始做博士和專業級的工作,在程式碼領域甚至超越了這個水平。前沿進展雖然有些不均衡,但大體符合預期。最令人驚訝的是,公眾缺乏對我們距離指數曲線終點有多近的認識。對我來說,這真是太瘋狂了——無論是圈內還是圈外的人——都在談論那些老掉牙的政治熱點問題,而我們已經接近指數曲線的尾聲了。Dwarkesh: 我想瞭解現在這個指數曲線是什麼樣子。三年前我問你的第一個問題是"擴展是怎麼回事,為什麼有效?"現在我有類似的問題,但感覺更複雜了。至少從公眾的角度來看,三年前有眾所周知的公開趨勢,跨越多個數量級的計算量,你可以看到損失函數如何改善。現在我們有了強化學習擴展,但沒有公開已知的擴展定律。甚至不清楚這背後的原理是什麼。這是在教模型技能嗎?是在教元學習嗎?現在的擴展假設是什麼?Dario: 實際上我的假設和2017年時一樣。我想我上次談過這個,但我寫過一篇叫做"大計算塊假設"的文件。它不是專門關於語言模型擴展的。我寫它的時候GPT-1剛出來,那只是眾多事物之一。那時候有機器人技術。人們試圖將推理作為獨立於語言模型的東西來研究,還有AlphaGo和OpenAI的Dota中那種強化學習的擴展。人們記得DeepMind的星海爭霸,AlphaStar。這是一份更通用的文件。Rich Sutton幾年後發表了"苦澀的教訓"。這個假設基本相同。它說的是,所有的聰明才智,所有的技術,所有"我們需要新方法來做某事"的想法,這些都不太重要。只有少數幾件事重要。我想我列出了七項。一是你有多少原始計算能力。 二是資料的數量。 三是資料的質量和分佈。它需要是廣泛的分佈。 四是你訓練多長時間。 五是你需要一個可以擴展到極致的目標函數。預訓練目標函數就是這樣一個目標函數。另一個是強化學習目標函數,它說你有一個目標,你要去實現這個目標。在這其中,有客觀獎勵,比如你在數學和編碼中看到的,也有更主觀的獎勵,比如你在RLHF或更高階版本中看到的。然後第六和第七項是關于歸一化或條件化的東西,只是為了獲得數值穩定性,這樣大計算塊就能以這種層流方式流動,而不是遇到問題。這就是那個假設,也是我至今仍然持有的假設。我沒有看到太多與之不符的東西。預訓練擴展定律是我們看到的一個例子。這些定律一直在持續。現在已經被廣泛報導,我們對預訓練感覺良好。它繼續給我們帶來收益。改變的是,現在我們也看到強化學習出現了同樣的情況。我們看到一個預訓練階段,然後是在此基礎上的強化學習階段。對於強化學習,實際上是一樣的。甚至其他公司在他們的一些發佈中也發表了內容說,"我們在數學競賽上訓練模型——AIME或其他競賽——模型表現如何與我們訓練它的時間呈對數線性關係。"我們也看到了這一點,而且不僅僅是數學競賽。這是各種各樣的強化學習任務。我們看到強化學習的擴展與我們在預訓練中看到的擴展是一樣的。Dwarkesh: 你提到了Rich Sutton和"苦澀的教訓"。我去年採訪了他,他實際上非常不認同大語言模型。我不知道這是否是他的觀點,但用一種方式來轉述他的反對意見:真正擁有人類學習核心的東西,不需要所有這些數十億美元的資料和計算,以及這些定製環境,來學習如何使用Excel,如何使用PowerPoint,如何瀏覽網頁。我們必須使用這些強化學習環境來內建這些技能的事實,暗示我們實際上缺少一個核心的人類學習演算法。所以我們在擴展錯誤的東西。這確實提出了一個問題。如果我們認為會有類似人類即時學習能力的東西,為什麼我們要做所有這些強化學習擴展?Dario: 我認為這把幾個應該分別思考的東西混在一起了。這裡確實有一個真正的謎題,但它可能並不重要。事實上,我猜它可能不重要。這裡有一個有趣的事情。讓我暫時把強化學習排除在外,因為我實際上認為說強化學習在這個問題上與預訓練有任何不同是一個誤導。如果我們看預訓練擴展,2017年Alec Radford做GPT-1時非常有趣。GPT-1之前的模型是在不代表廣泛文字分佈的資料集上訓練的。你有非常標準的語言建模基準。GPT-1本身實際上是在一堆同人小說上訓練的。那是文學文字,只是你能獲得的文字的很小一部分。那時候大概是十億個詞之類的,所以是代表你在世界上能看到的相當狹窄分佈的小資料集。它的泛化能力不好。如果你在某個同人小說語料庫上做得更好,它不會很好地泛化到其他任務。我們有所有這些衡量標準。我們有各種衡量它在預測所有其他類型文字方面表現如何的標準。只有當你在網際網路上的所有任務上進行訓練——當你從Common Crawl這樣的東西進行通用的網際網路抓取,或者抓取Reddit中的連結(這是我們為GPT-2做的)——你才開始獲得泛化能力。我認為我們在強化學習上看到了同樣的事情。我們首先從簡單的強化學習任務開始,比如在數學競賽上訓練,然後轉向涉及程式碼等更廣泛的訓練。現在我們正在轉向許多其他任務。我認為我們將越來越多地獲得泛化能力。所以這在某種程度上消除了強化學習與預訓練的區別。但無論那種方式都有一個謎題,那就是在預訓練中我們使用了數兆個token。人類看不到數兆個單詞。所以這裡確實存在樣本效率差異。這裡確實有不同的東西。模型從零開始,需要更多的訓練。但我們也看到,一旦它們被訓練好,如果我們給它們一百萬的長上下文——唯一阻礙長上下文的是推理——它們非常擅長在那個上下文中學習和適應。所以我不知道這個問題的完整答案。我認為有些事情正在發生,預訓練不像人類學習的過程,但它介於人類學習的過程和人類進化的過程之間。我們的許多先驗知識來自進化。我們的大腦不只是一塊白板。已經有整本書寫過這個。語言模型更像白板。它們真的是從隨機權重開始的,而人類大腦開始時就有所有這些區域連接到所有這些輸入和輸出。也許我們應該把預訓練——以及強化學習——看作存在於人類進化和人類即時學習之間的中間空間。我們應該把模型進行的上下文學習看作介於人類長期學習和短期學習之間的東西。所以有這樣一個層次結構。有進化,有長期學習,有短期學習,還有人類的即時反應。大語言模型的各個階段存在於這個光譜上,但不一定在完全相同的點上。沒有與某些人類學習模式相對應的類似物,大語言模型落在這些點之間。這有意義嗎?Dwarkesh: 有意義,雖然有些事情仍然有點令人困惑。例如,如果類比是這就像進化,所以樣本效率低是可以的,那麼如果我們要從上下文學習中獲得超級樣本高效的智能體,我們為什麼要費心建構所有這些強化學習環境?有些公司的工作似乎是教模型如何使用這個API,如何使用Slack,如何使用其他東西。如果那種能即時學習的智能體正在出現或已經出現,為什麼有這麼多重點放在這上面,這讓我感到困惑。Dario: 我不能代表其他人的重點。我只能談談我們是如何思考的。目標不是在強化學習中教會模型每一個可能的技能,就像我們在預訓練中不這樣做一樣。在預訓練中,我們不是試圖讓模型接觸到單詞可以組合在一起的每一種可能方式。相反,模型在很多東西上訓練,然後在預訓練中達到泛化。這是我近距離看到的從GPT-1到GPT-2的轉變。模型達到了一個點。我有過這樣的時刻,我想,"哦是的,你只要給模型一列數字——這是房子的價格,這是房子的平方英呎——模型就能完成模式並進行線性回歸。"雖然不是很好,但它做到了,而且它以前從未見過那個確切的東西。所以就我們正在建構這些強化學習環境而言,目標與五年或十年前預訓練所做的非常相似。我們試圖獲得大量資料,不是因為我們想覆蓋特定的文件或特定的技能,而是因為我們想要泛化。我認為你提出的框架顯然是有道理的。我們正在朝著AGI前進。此時沒有人不同意我們將在本世紀實現AGI。關鍵是你說我們正在接近指數曲線的終點。其他人看到這個會說,"我們從2012年以來一直在取得進展,到2035年我們將擁有類人智能體。"顯然,我們在這些模型中看到了進化所做的事情,或者人類一生中學習所做的事情。我想瞭解你看到了什麼,讓你認為這是一年後而不是十年後。擴展是藉口嗎?Dario: 這裡可以提出兩種說法,一種更強,一種更弱。從較弱的說法開始,當我在2019年第一次看到擴展時,我不確定。這是一個50/50的事情。我以為我看到了什麼。我的說法是,這比任何人想的都更有可能。也許有50%的機會會發生。關於你所說的,在十年內我們將達到我所謂的"資料中心裡的天才之國",我對此有90%的把握。很難超過90%,因為世界是如此不可預測。也許不可減少的不確定性使我們達到95%,你會遇到多家公司內部動盪、台灣被入侵、所有晶圓廠被導彈炸燬等情況。Dwarkesh: 現在你給我們下了詛咒,Dario。Dario: 你可以建構一個5%的世界,事情被推遲十年。還有另外5%,那就是我對可以驗證的任務非常有信心。對於編碼,除了那個不可減少的不確定性,我認為我們將在一兩年內達到目標。我們不可能在十年內還沒有達到能夠進行端到端編碼的程度。我的一點點根本不確定性,即使在長時間尺度上,是關於那些不可驗證的任務:規劃火星任務;做一些基礎科學發現,比如CRISPR;寫小說。這些任務很難驗證。我幾乎可以肯定我們有一條可靠的路徑到達那裡,但如果有一點點不確定性,就在那裡。在十年時間線上,我有90%的把握,這差不多是你能達到的最確定的程度。我認為說到2035年這不會發生是瘋狂的。在某個理智的世界裡,這會被認為是主流之外的觀點。但對驗證的強調暗示我對這些模型是泛化的缺乏信念。如果你想想人類,我們既擅長那些能得到可驗證獎勵的事情,也擅長那些不能的事情。Dario: 不,這就是為什麼我幾乎確定。我們已經看到從可驗證的事物到不可驗證的事物有相當大的泛化。我們已經看到了這一點。但似乎你強調這是一個會分裂的光譜,我們會在那些領域看到更多進展。這似乎不像人類變得更好的方式。Dario: 我們無法到達那裡的世界是我們做所有可驗證的事情的世界。其中許多會泛化,但我們沒有完全到達那裡。我們沒有完全填滿盒子的另一邊。這不是一個二元的事情。即使泛化很弱,你只能做可驗證的領域,我也不清楚在這樣的世界裡你能否自動化軟體工程。從某種意義上說,你是"軟體工程師",但作為軟體工程師的一部分工作包括寫關於你宏大願景的長備忘錄。Dwarkesh: 我不認為那是軟體工程師工作的一部分。Dario: 那是公司工作的一部分,不是專門針對軟體工程師的。但軟體工程師確實涉及設計文件和其他類似的東西。模型已經很擅長寫註釋了。再說一次,我在這裡提出的主張比我相信的要弱得多,以區分兩件事。我們在軟體工程方面已經幾乎到了。Dwarkesh: 按什麼標準?有一個標準是AI寫了多少行程式碼。如果你考慮軟體工程歷史上的其他生產力改進,編譯器寫了所有的軟體行。寫了多少行和生產力提高有多大之間是有區別的。"我們幾乎到了"是什麼意思?Dario: 生產力提高有多大,不僅僅是AI寫了多少行。Dwarkesh: 我實際上同意你的觀點。Dario: 我對程式碼和軟體工程做了一系列預測。我認為人們一再誤解它們。讓我列出這個光譜。大約八、九個月前,我說AI模型將在三到六個月內編寫90%的程式碼行。這發生了,至少在某些地方。它發生在Anthropic,發生在許多使用我們模型的下遊人員身上。但這實際上是一個非常弱的標準。人們以為我是說我們不需要90%的軟體工程師。這些事情相距甚遠。光譜是:90%的程式碼由模型編寫,100%的程式碼由模型編寫。這在生產力上有很大差異。90%的端到端軟體工程任務——包括編譯、設定叢集和環境、測試功能、編寫備忘錄等——由模型完成。100%的今天的軟體工程任務由模型完成。即使發生這種情況,也不意味著軟體工程師會失業。他們可以做新的更高級的事情,他們可以管理。然後在光譜的更遠處,對軟體工程師的需求減少了90%,我認為這會發生,但這是一個光譜。我在"技術的青春期"中寫過這個,我用農業經歷了這種光譜。Dwarkesh: 我實際上完全同意你的觀點。這些是彼此非常不同的基準,但我們正在以超快的速度通過它們。你的願景的一部分是從90到100會很快發生,並且會帶來巨大的生產力提升。但我注意到的是,即使在綠地項目中,人們從Claude Code或其他東西開始,人們報告啟動了很多項目...我們在外面的世界中看到軟體的復興了嗎,所有這些否則不會存在的新功能?至少到目前為止,似乎我們沒有看到。所以這確實讓我想知道。即使我從不需要干預Claude Code,世界也是複雜的。工作是複雜的。在自包含系統上閉環,無論是唯寫軟體還是其他什麼,我們會從中看到多大的更廣泛收益?也許這應該稀釋我們對"天才之國"的估計。Dario: 我同時同意你的觀點,這是這些事情不會立即發生的原因,但同時,我認為效果會非常快。你可以有這兩個極端。一個是AI不會取得進展。它很慢。它將永遠擴散到經濟中。經濟擴散已經成為這些流行語之一,成為我們不會取得AI進展或AI進展不重要的原因。另一個軸是我們將獲得遞迴自我改進,整個事情。你不能只在曲線上畫一條指數線嗎?在我們獲得遞迴後的許多納秒內,我們將在太陽周圍擁有戴森球。我在這裡完全是在諷刺這個觀點,但有這兩個極端。但我們從一開始就看到的,至少如果你看Anthropic內部,有這種奇怪的每年10倍的收入增長。所以在2023年,是從零到1億美元。在2024年,是從1億美元到10億美元。在2025年,是從10億美元到90-100億美元。Dwarkesh: 你們應該買10億美元的自己的產品,這樣你們就可以...Dario: 今年的第一個月,那個指數曲線...你會認為它會放緩,但我們在一月份又增加了幾十億美元的收入。顯然那條曲線不能永遠持續下去。GDP只有那麼大。我甚至猜測它今年會有所彎曲,但那是一條快速曲線。那是一條非常快的曲線。我打賭即使規模擴大到整個經濟,它也會保持相當快的速度。所以我認為我們應該考慮這個中間世界,事情非常快,但不是瞬間的,它們需要時間,因為經濟擴散,因為需要閉環。因為它很繁瑣:"我必須在我的企業內進行變更管理...我設定了這個,但我必須更改這個的安全權限才能使它真正工作...我有這個舊的軟體在編譯和發佈之前檢查模型,我必須重寫它。是的,模型可以做到這一點,但我必須告訴模型去做。它必須花時間去做。"所以我認為到目前為止我們看到的一切都與這樣的想法相容:有一個快速指數曲線,那就是模型的能力。然後還有另一個快速指數曲線,那是下游的,那就是模型擴散到經濟中。不是瞬間的,不是緩慢的,比任何以前的技術都快得多,但它有其限制。當我看Anthropic內部,當我看我們的客戶:快速採用,但不是無限快。Dwarkesh: 我能試試一個大膽的觀點嗎?Dario: 可以。Dwarkesh: 我覺得擴散是人們說的藉口。當模型不能做某事時,他們會說,"哦,但這是一個擴散問題。"但你應該與人類進行比較。你會認為AI固有的優勢會使新AI的入職擴散比新人類的入職容易得多的問題。AI可以在幾分鐘內閱讀你的整個Slack和你的drive。它們可以共享相同實例的其他副本擁有的所有知識。當你僱用AI時,你沒有這種逆向選擇問題,所以你可以只僱用經過審查的AI模型的副本。僱用人類要麻煩得多。人們一直在僱用人類。我們向人類支付超過50兆美元的工資,因為他們有用,儘管原則上將AI整合到經濟中應該比僱用人類容易得多。擴展並不能真正解釋。Dario: 我認為擴散是非常真實的,並不完全與AI模型的侷限性有關。再說一次,有些人使用擴散作為一種流行語來說這不是什麼大事。我不是在談論那個。我不是在談論AI將以以前技術的速度擴散。我認為AI的擴散速度會比以前的技術快得多,但不是無限快。我只舉一個例子。有Claude Code。Claude Code非常容易設定。如果你是開發人員,你可以直接開始使用Claude Code。大型企業的開發人員沒有理由不像個人開發人員或初創公司的開發人員那樣快速採用Claude Code。我們盡一切可能推廣它。我們向企業出售Claude Code。大型企業、大型金融公司、大型製藥公司,所有這些都在採用Claude Code,比企業通常採用新技術快得多。但同樣,這需要時間。任何給定的功能或任何給定的產品,比如Claude Code或Cowork,將被一直在Twitter上的個人開發人員、A輪初創公司採用,比被從事食品銷售的大型企業採用要早幾個月。只是有很多因素。你必須通過法律審查,你必須為每個人配置它。它必須通過安全和合規。公司的領導者離AI革命更遠,他們有遠見,但他們必須說,"哦,我們花5000萬美元是有意義的。這就是這個Claude Code的東西。這就是它為什麼幫助我們公司。這就是它為什麼讓我們更有生產力。"然後他們必須向下兩級的人解釋。他們必須說,"好的,我們有3000名開發人員。我們將如何向我們的開發人員推出它。"我們每天都有這樣的對話。我們正在盡一切努力使Anthropic的收入增長每年20或30倍,而不是10倍。再說一次,許多企業只是說,"這太有生產力了。我們將在我們通常的採購流程中走捷徑。"他們的行動比我們試圖向他們出售普通API時快得多,許多企業都在使用。Claude Code是一個更引人注目的產品,但它不是一個無限引人注目的產品。我認為即使是AGI或強大的AI或"資料中心裡的天才之國"也不會是一個無限引人注目的產品。它將是一個足夠引人注目的產品,也許可以獲得每年3-5倍或10倍的增長,即使你在數千億美元的規模上,這是非常難做到的,歷史上從未做到過,但不是無限快。Dwarkesh: 我認為它會是一個輕微的放緩。也許這不是你的主張,但有時人們談論這個就像,"哦,能力在那裡,但因為擴散...否則我們基本上就在AGI了。"Dario: 我不相信我們基本上就在AGI了。我認為如果你有"資料中心裡的天才之國"...如果我們有"資料中心裡的天才之國",我們會知道的。如果你有"資料中心裡的天才之國",我們會知道的。這個房間裡的每個人都會知道。華盛頓的每個人都會知道。農村地區的人可能不知道,但我們會知道。我們現在沒有那個。這是非常清楚的。持續學習是必要的嗎?Dwarkesh: 回到具體預測...因為有太多不同的東西需要消除歧義,當我們談論能力時,很容易互相誤解。例如,當我三年前採訪你時,我問你一個關於三年後我們應該期待什麼的預測。你是對的。你說,"我們應該期待這樣的系統,如果你和它們交談一個小時,很難把它們與受過良好教育的人類區分開來。"我認為你是對的。我在精神上感到不滿意,因為我的內部期望是這樣的系統可以自動化白領工作的大部分。所以談論你想從這樣的系統中獲得的實際最終能力可能更有成效。我基本上會告訴你我認為我們在那裡。讓我問一個非常具體的問題,這樣我們就可以精準地弄清楚我們應該很快考慮什麼樣的能力。也許我會在我很瞭解的工作背景下問這個問題,不是因為它是最相關的工作,而只是因為我可以評估關於它的主張。拿視訊編輯來說。我有視訊編輯。他們工作的一部分包括瞭解我們觀眾的偏好,瞭解我的偏好和品味,以及我們擁有的不同權衡。他們在許多個月的過程中建立起對上下文的理解。他們在工作六個月後擁有的技能和能力,一個可以即時掌握該技能的模型,我們應該什麼時候期待這樣的AI系統?Dario: 我想你在說的是我們正在做這個三小時的採訪。會有人進來,會有人編輯它。他們會說,"哦,我不知道,Dario撓了撓頭,我們可以把那個剪掉。""放大那個。""有這個長討論,對人們來說不太有趣。還有另一個對人們更有趣的東西,所以讓我們做這個編輯。"我認為"資料中心裡的天才之國"將能夠做到這一點。它能夠做到這一點的方式是它將對電腦螢幕有一般控制。你將能夠輸入這個。它還將能夠使用電腦螢幕上網,查看你所有以前的採訪,查看人們在Twitter上對你的採訪的評論,與你交談,問你問題,與你的員工交談,查看你所做的編輯歷史,並從中完成工作。我認為這取決於幾件事。我認為這實際上是阻礙部署的事情之一:在電腦使用方面達到模型真正精通使用電腦的程度。我們已經看到基準測試中的這種攀升,基準測試總是不完美的衡量標準。但我認為當我們一年零一個季度前首次發佈電腦使用時,OSWorld大約是15%。我不記得確切數字了,但我們已經從那裡攀升到65-70%。可能還有更難的衡量標準,但我認為電腦使用必須通過一個可靠性點。Dwarkesh: 在你繼續下一點之前,我能跟進一下嗎?多年來,我一直在嘗試為自己建構不同的內部LLM工具。通常我有這些文字輸入、文字輸出的任務,應該是這些模型的核心能力。然而我仍然僱用人類來做它們。如果是像"識別這個文字中最好的片段是什麼"這樣的事情,也許大語言模型在上面做了七分之十的工作。但沒有這種持續的方式讓我與它們互動,幫助它們在工作上做得更好,就像我可以與人類員工一樣。那種缺失的能力,即使你解決了電腦使用,仍然會阻礙我將實際工作外包給它們的能力。Dario: 這回到了我們之前談論的在工作中學習。這非常有趣。我認為對於編碼智能體,我不認為人們會說在工作中學習是阻止編碼智能體端到端完成所有事情的原因。它們一直在變得更好。我們在Anthropic有不寫任何程式碼的工程師。當我看生產力時,回到你之前的問題,我們有人說,"這個GPU核心,這個晶片,我以前自己寫。我只是讓Claude做。"生產力有巨大的提高。當我看Claude Code時,對程式碼庫的熟悉度或模型沒有在公司工作一年的感覺,這不是我看到的投訴列表中的高位。我認為我所說的是我們正在走一條不同的路徑。Dwarkesh: 你不認為編碼之所以如此,是因為有一個外部的記憶支架存在於程式碼庫中實例化嗎?我不知道有多少其他工作有那個。編碼取得快速進展正是因為它有這個其他經濟活動所沒有的獨特優勢。Dario: 但當你這麼說時,你暗示的是,通過將程式碼庫讀入上下文,我擁有人類在工作中需要學習的一切。所以那將是一個例子——無論它是否被寫下來,無論它是否可用——一個你需要知道的一切都從上下文窗口獲得的案例。我們認為的學習——"我開始這份工作,我需要六個月來理解程式碼庫"——模型只是在上下文中做到了。我真的不知道如何思考這個,因為有人定性地報告了你所說的。我相信你去年看到了,有一項重大研究,他們讓有經驗的開發人員嘗試在他們熟悉的儲存庫中關閉拉取請求。那些開發人員報告了提升。他們報告說使用這些模型他們感覺更有生產力。但事實上,如果你看他們的輸出以及實際合併回的內容,有20%的下降。他們使用這些模型的結果是生產力降低了。所以我試圖將人們對這些模型的定性感覺與以下幾點相協調:1)在宏觀層面,這個軟體的復興在那裡?然後2)當人們進行這些獨立評估時,為什麼我們沒有看到我們期望的生產力收益?Dario: 在Anthropic內部,這真的是毫不含糊的。我們承受著難以置信的商業壓力,並且因為我們做的所有安全工作而讓自己更加困難,我認為我們做得比其他公司多。在保持我們的價值觀的同時在經濟上生存的壓力是難以置信的。我們正在努力保持這個10倍收入曲線的增長。沒有時間胡說八道。沒有時間感覺我們有生產力而實際上沒有。這些工具使我們更有生產力得多。你認為我們為什麼擔心競爭對手使用這些工具?因為我們認為我們領先於競爭對手。如果這秘密地降低了我們的生產力,我們不會經歷所有這些麻煩。我們每隔幾個月就能看到最終生產力,以模型發佈的形式。對此沒有自欺欺人的餘地。這些模型使你更有生產力。1)人們感覺自己有生產力是由這樣的研究定性預測的。但2)如果我只看最終輸出,顯然你們正在取得快速進展。但這個想法應該是,通過遞迴自我改進,你製造了一個更好的AI,AI幫助你建構一個更好的下一個AI,等等等等。相反,我看到的是——如果我看你、OpenAI、DeepMind——人們只是每隔幾個月就在領獎台上移動位置。也許你認為那會停止,因為你贏了或者什麼的。但如果事實上上一個編碼模型有這些巨大的生產力收益,為什麼我們沒有看到擁有最好編碼模型的人有這種持久優勢。Dario: 我認為我對情況的模型是有一個逐漸增長的優勢。我會說現在編碼模型給出的總因子加速可能是,我不知道,15-20%。那是我的看法。六個月前,可能是5%。所以沒關係。5%不算數。它現在剛剛到達一個點,它是幾個因素中的一個,有點重要。那將繼續加速。我會說六個月前,有幾家公司大致處於同一點,因為這不是一個顯著因素,但我認為它開始加速越來越多。我還會說有多家公司編寫用於程式碼的模型,我們並不完全擅長阻止其中一些其他公司在內部使用我們的模型。所以我認為我們看到的一切都與這種滾雪球模型一致。再說一次,我在所有這一切中的主題是所有這一切都是軟起飛,軟的、平滑的指數曲線,儘管指數曲線相對陡峭。所以我們看到這個雪球聚集動力,它像10%,20%,25%,40%。隨著你的進行,阿姆達爾定律,你必須把所有阻止你閉環的東西清除掉。但這是Anthropic內部最大的優先事項之一。退一步說,在我們談論何時獲得這種在職學習之前?似乎你在編碼方面提出的觀點是我們實際上不需要在職學習。你可以有巨大的生產力提升,你可以為AI公司帶來潛在的數兆美元收入,而沒有這種基本的人類即時學習能力。也許那不是你的主張,你應該澄清。但在大多數經濟活動領域,人們說,"我雇了某人,他們在最初幾個月不是那麼有用,然後隨著時間的推移,他們建立了背景、理解。"實際上很難定義我們在這裡談論什麼。但他們得到了一些東西,然後現在他們是一個強大的力量,他們對我們如此有價值。如果AI沒有發展出這種即時學習的能力,我有點懷疑我們是否會在沒有那種能力的情況下看到世界的巨大變化。Dario: 我認為這裡有兩件事。現在有技術的狀態。再說一次,我們有這兩個階段。我們有預訓練和強化學習階段,你把一堆資料和任務扔進模型,然後它們泛化。所以這就像學習,但這就像從更多資料學習,而不是在一個人類或一個模型的一生中學習。所以再說一次,這位於進化和人類學習之間。但一旦你學會了所有這些技能,你就擁有它們。就像預訓練一樣,就像模型知道更多一樣,如果我看一個預訓練模型,它對日本武士的歷史瞭解比我多。它對棒球瞭解比我多。它對低通濾波器和電子學瞭解更多,所有這些東西。它的知識比我的廣泛得多。所以我認為即使只是那個也可能讓我們達到模型在一切方面都更好的地步。我們還有,再說一次,只是通過擴展現有設定的類型,上下文學習。我會把它描述為有點像人類的在職學習,但稍微弱一點,稍微短期一點。你看上下文學習,如果你給模型一堆例子,它確實能理解。上下文中確實發生了真正的學習。一百萬個token是很多的。那可以是幾天的人類學習。如果你想想模型閱讀一百萬個單詞,我需要多長時間才能閱讀一百萬個?至少幾天或幾周。所以你有這兩樣東西。我認為現有範式中的這兩樣東西可能就足以讓你獲得"資料中心裡的天才之國"。我不確定,但我認為它們會讓你得到其中的很大一部分。可能有差距,但我當然認為就目前而言,這足以產生數兆美元的收入。那是第一點。第二點,這個持續學習的想法,單個模型在工作中學習的想法。我認為我們也在研究這個。很有可能在接下來的一兩年內,我們也會解決這個問題。再說一次,我認為你在沒有它的情況下走了大部分路。每年數兆美元的市場,也許所有我在"技術的青春期"中寫的國家安全影響和安全影響都可以在沒有它的情況下發生。但我們,我想其他人,正在研究它。很有可能我們將在接下來的一兩年內到達那裡。有很多想法。我不會詳細討論所有這些,但一個就是讓上下文更長。沒有什麼能阻止更長的上下文工作。你只需要在更長的上下文上訓練,然後學會在推理時為它們提供服務。這兩個都是我們正在研究的工程問題,我假設其他人也在研究它們。Dwarkesh: 這個上下文長度增加,似乎從2020年到2023年有一個時期,從GPT-3到GPT-4 Turbo,從2000上下文長度增加到128K。我覺得從那時起的兩年左右,我們一直在相同的範圍內。當上下文長度變得比那長得多時,人們報告模型考慮完整上下文的能力出現定性下降。所以我很好奇你在內部看到了什麼,讓你認為,"1000萬上下文,1億上下文,以獲得六個月的人類學習和建立上下文"。Dario: 這不是一個研究問題。這是一個工程和推理問題。如果你想提供長上下文,你必須儲存你的整個KV快取。在GPU中儲存所有記憶體、處理記憶體是很困難的。我甚至不知道細節。在這一點上,這是一個我不再能夠跟上的細節水平,儘管我在GPT-3時代知道它。"這些是權重,這些是你必須儲存的啟動..."但現在整個事情都翻轉了,因為我們有MoE模型和所有這些。關於你談論的這種退化,有兩件事,不要太具體。有你訓練的上下文長度和你服務的上下文長度。如果你在小上下文長度上訓練,然後嘗試在長上下文長度上服務,也許你會得到這些退化。它比什麼都沒有好,你可能仍然提供它,但你會得到這些退化。也許在長上下文長度上訓練更難。我想,同時,問一些可能的兔子洞。如果你必須在更長的上下文長度上訓練,那不是意味著對於相同數量的計算,你能獲得的樣本會更少嗎?也許不值得深入研究。我想得到更大圖景問題的答案。我不覺得對為我工作了六個月的人類編輯和與我一起工作了六個月的AI有偏好,你預測那將是那一年?Dario: 我對此的猜測是有很多問題,基本上當我們有"資料中心裡的天才之國"時,我們可以做到這一點。我對此的看法,如果你讓我猜,是一到兩年,也許一到三年。真的很難說。我有一個強烈的觀點——99%,95%——所有這些將在10年內發生。我認為那只是一個超級安全的賭注。我有一個預感——這更像是一個50/50的事情——它將更像是一到兩年,也許更像是一到三年。所以一到三年。天才之國,以及稍微不那麼有經濟價值的編輯視訊任務。Dwarkesh: 聽起來很有經濟價值,讓我告訴你。Dario: 只是有很多像那樣的用例。有很多類似的。所以你預測在一到三年內。如果AGI即將到來,為什麼不購買更多計算?Dwarkesh: 然後,一般來說,Anthropic預測到2026年底或2027年初,我們將擁有"具有瀏覽當今人類進行數字工作的介面的能力、匹配或超過諾貝爾獎獲得者的智力能力以及與物理世界互動的能力"的AI系統。你兩個月前接受DealBook採訪時強調了你公司相對於競爭對手更負責任的計算擴展。我試圖協調這兩種觀點。如果你真的相信我們將擁有一個天才之國,你想要儘可能大的資料中心。沒有理由放慢速度。一個諾貝爾獎獲得者的TAM,實際上可以做諾貝爾獎獲得者能做的一切,是數兆美元。所以我試圖協調這種保守主義,如果你有更溫和的時間線,這似乎是理性的,與你關於進展的陳述觀點。Dario: 它實際上都吻合在一起。我們回到這個快速但不是無限快的擴散。假設我們以這個速度取得進展。技術以這麼快的速度取得進展。我非常確信我們將在幾年內到達那裡。我有一個預感,我們將在一兩年內到達那裡。所以在技術方面有一點不確定性,但非常有信心它不會相差太多。我不太確定的是,再說一次,經濟擴散方面。我真的相信我們可以在一兩年內擁有資料中心裡的天才之國的模型。一個問題是:在那之後多少年,數兆的收入開始滾滾而來?我不認為它保證會是立即的。可能是一年,可能是兩年,我甚至可以延伸到五年,儘管我對此持懷疑態度。所以我們有這種不確定性。即使技術進展如我懷疑的那樣快,我們也不確切知道它將以多快的速度推動收入。我們知道它即將到來,但根據你購買這些資料中心的方式,如果你相差幾年,那可能是毀滅性的。這就像我在"慈愛機器"中寫的那樣。我說我認為我們可能會得到這個強大的AI,這個"資料中心裡的天才之國"。你給出的那個描述來自"慈愛機器"。我說我們將在2026年得到它,也許是2027年。再說一次,那是我的預感。如果我相差一兩年,我不會感到驚訝,但那是我的預感。假設發生了。那是起跑槍。治癒所有疾病需要多長時間?那是推動大量經濟價值的方式之一。你治癒每一種疾病。有一個問題是有多少歸製藥公司或AI公司,但有巨大的消費者剩餘,因為——假設我們可以為每個人提供訪問,我非常關心這一點——我們治癒所有這些疾病。需要多長時間?你必須進行生物學發現,你必須製造新藥,你必須經過監管過程。我們在疫苗和COVID中看到了這一點。我們把疫苗推廣給每個人,但花了一年半。我的問題是:從AI首次存在於實驗室到疾病實際上為每個人治癒,需要多長時間才能讓每個人都得到治癒一切的方法——AI是理論上可以發明的天才?我們有脊髓灰質炎疫苗50年了。我們仍在試圖在非洲最偏遠的角落根除它。蓋茲基金會正在盡其所能嘗試。其他人也在盡其所能嘗試。但這很困難。再說一次,我不期望大部分經濟擴散會像那樣困難。那是最困難的情況。但這裡有一個真正的困境。我對此的看法是,它將比我們在世界上看到的任何東西都快,但它仍然有其限制。所以當我們去購買資料中心時,再說一次,我看的曲線是:我們每年都有10倍的增長。在今年年初,我們看到的是100億美元的年化收入。我們必須決定購買多少計算。實際建構資料中心、預訂資料中心需要一兩年時間。基本上我是在說,"在2027年,我得到多少計算?"我可以假設收入將繼續每年增長10倍,所以到2026年底將是1000億美元,到2027年底將是1兆美元。實際上將是5兆美元的計算,因為它將是1兆美元一年持續五年。我可以購買從2027年底開始的1兆美元計算。如果我的收入不是1兆美元,即使是8000億美元,世界上沒有任何力量,沒有任何避險可以阻止我破產,如果我購買那麼多計算。儘管我大腦的一部分想知道它是否會繼續增長10倍,但我不能在2027年購買每年1兆美元的計算。如果我在那個增長率上只相差一年,或者如果增長率是每年5倍而不是10倍,那麼你就會破產。所以你最終處於一個世界,你支援數千億,而不是數兆。你接受一些風險,即有如此多的需求以至於你無法支援收入,你接受一些風險,即你弄錯了,它仍然很慢。當我談到負責任的行為時,我的意思實際上不是絕對數量。我認為確實我們的支出比其他一些玩家少一些。實際上是其他事情,比如我們是否經過深思熟慮,還是我們在YOLO並說,"我們要在這裡做1000億美元或在那裡做1000億美元"?我的印象是其他一些公司沒有寫下電子表格,他們並不真正理解他們正在承擔的風險。他們只是做事情,因為聽起來很酷。我們仔細考慮過。我們是一家企業業務。因此,我們可以更多地依賴收入。它不如消費者那麼善變。我們有更好的利潤率,這是購買太多和購買太少之間的緩衝。我認為我們購買的數量允許我們捕獲相當強勁的上行世界。它不會捕獲完整的每年10倍。事情必須變得相當糟糕,我們才會陷入財務困境。所以我們仔細考慮過,我們做出了那個平衡。這就是我說我們負責任的意思。Dwarkesh: 所以似乎我們實際上可能只是對"資料中心裡的天才之國"有不同的定義。因為當我想到實際的人類天才,資料中心裡的一個實際的人類天才之國,我會很樂意購買價值5兆美元的計算來運行資料中心裡的一個實際的人類天才之國。假設摩根大通或Moderna或其他什麼不想使用它們。我有一個天才之國。他們會創辦自己的公司。如果他們不能創辦自己的公司,他們受到臨床試驗的瓶頸...值得說明的是,對於臨床試驗,大多數臨床試驗失敗是因為藥物不起作用。沒有療效。Dario: 我在"慈愛機器"中恰恰提出了這一點,我說臨床試驗將比我們習慣的快得多,但不是無限快。Dwarkesh: 好的,然後假設臨床試驗需要一年時間才能成功,這樣你就可以從中獲得收入並製造更多藥物。好的,那麼,你有一個天才之國,你是一個AI實驗室。你可以使用更多的AI研究人員。你也認為聰明人從事AI技術工作有這些自我強化的收益。你可以讓資料中心從事AI進展。從購買每年1兆美元的計算與每年3000億美元的計算中獲得的收益是否有實質性更多?Dario: 如果你的競爭對手購買1兆,是的,有。嗯,不,有一些收益,但同樣,有這個機會,他們之前就破產了。再說一次,如果你只相差一年,你就會毀掉自己。那就是平衡。我們正在購買很多。我們正在購買相當多。我們購買的數量與遊戲中最大玩家購買的數量相當。但如果你問我,"為什麼我們沒有簽署從2027年中期開始的10兆美元計算?"...首先,它無法生產。世界上沒有那麼多。但第二,如果天才之國來了,但它在2028年中期而不是2027年中期來呢?你破產了。Dwarkesh: 所以如果你的預測是一到三年,似乎你應該想要到2029年最晚有10兆美元的算力?即使在你陳述的時間線的最長版本中,你正在擴大建設的計算似乎也不一致。Dario: 是什麼讓你這麼認為?人類工資,比如說,每年大約是50兆美元——Dwarkesh: 所以我不會專門談論Anthropic,但如果你談論這個行業,今年該行業正在建設的計算量可能是,稱之為,10-15千兆瓦。它每年大約增長3倍。所以明年是30-40千兆瓦。2028年可能是100千兆瓦。2029年可能像300千兆瓦。我在腦子裡做數學,但每千兆瓦成本可能是100億美元,每年大約10-15億美元。你把所有這些加在一起,你得到的大約是你描述的。你得到的正是那個。到2028年或2029年,你每年得到多兆。Dwarkesh: 那是對行業而言。Dario: 那是對行業而言,沒錯。Dwarkesh: 假設Anthropic的計算每年持續3倍增長,然後到2027-28年,你有10千兆瓦。乘以,如你所說,100億美元。所以那就像每年1000億美元。但那麼你是說到2028年TAM是2000億美元。Dario: 再說一次,我不想給出Anthropic的確切數字,但這些數字太小了。Dwarkesh: 好的,有趣。AI實驗室將如何真正盈利?Dwarkesh: 你告訴投資者你們計畫從2028年開始盈利。這一年我們可能獲得作為資料中心的天才國度。這現在將解鎖醫學、健康和新技術的所有進步。這難道不正是你想重新投資業務並建立更大的“國度”以便他們能做出更多發現的時候嗎?Dario: 在這個領域,盈利能力是一件有點奇怪的事情。我不認為在這個領域,盈利能力實際上是衡量消耗與投資業務的指標。讓我們以此為例。我實際上認為,當你低估了你將獲得的需求量時,就會發生盈利,而當你高估了你將獲得的需求量時,就會發生虧損,因為你是提前購買資料中心的。這樣想。再次強調,這些是程式化的事實。這些數字並不精準。我只是試圖在這裡建立一個玩具模型。假設你一半的算力用於訓練,一半的算力用於推理。推理有一些超過50%的毛利率。所以這意味著如果你處於穩定狀態,你建立了一個資料中心,如果你確切知道你獲得的需求,你會獲得一定數量的收入。假設你每年支付1000億美元用於算力。在每年500億美元上,你支援1500億美元的收入。另外500億美元用於訓練。基本上你是盈利的,你賺了500億美元的利潤。那是今天這個行業的經濟學,或者不是今天,而是我們預測的一兩年後的情況。唯一讓這不成立的情況是如果你獲得的需求少於500億美元。那麼你有超過50%的資料中心用於研究,你就不盈利了。所以你訓練了更強的模型,但你不盈利。如果你獲得的需求比你想像的多,那麼研究就會受到擠壓,但你能夠支援更多的推理,你就更盈利了。也許我解釋得不好,但我試圖說的是,你首先決定算力的數量。然後你有一些推理與訓練的目標願望,但這由需求決定。它不是由你決定的。Dwarkesh: 我聽到的是,你預測盈利的原因是你系統性地投資不足於算力?Dario: 不,不,不。我是說這很難預測。關於2028年以及何時發生的事情,那是我們試圖對投資者盡力而為。所有這些東西都因為不確定性錐體而非常不確定。如果收入增長足夠快,我們可以在2026年盈利。如果我們高估或低估了下一年,那可能會劇烈波動。Dwarkesh: 我試圖弄清楚的是,你腦子裡有一個業務模型,投資、投資、投資,獲得規模然後變得盈利。有一個單一的時間點事情會好轉。Dario: 我不認為這個行業的經濟學是那樣運作的。Dwarkesh: 我明白了。所以如果我理解正確的話,你是說由於我們應該獲得的算力數量和我們實際獲得的算力數量之間的差異,我們在某種程度上被迫盈利。但這並不意味著我們將繼續盈利。我們將把錢再投資,因為現在AI已經取得了如此大的進步,我們想要一個更大的天才國度。所以回到收入很高,但虧損也很高。Dario: 如果我們每年都精準預測需求是多少,我們每年都會盈利。因為花費50%的算力用於研究,大致上,加上高於50%的毛利率和正確的需求預測會導致盈利。那就是我認為有點存在但被這些提前建設和預測錯誤所掩蓋的盈利商業模式。Dwarkesh: 我想你把50%當作一種既定的常數,而事實上,如果AI進展很快,你可以通過擴大規模來增加進展,你就應該擁有超過50%並且不盈利。Dario: 但我要說的是。你可能想把它擴大更多。記住對數規模收益。如果70%只能讓你通過1.4倍的因子得到稍微小一點的模型……那額外的200億美元,那裡的每一美元對你來說價值都要小得多,因為是對數線性的設定。所以你可能會發現將那200億美元投資於服務推理或僱傭更擅長他們所做事情的工程師更好。所以我說50%的原因……那不完全是我們的目標。它不完全會是50%。它可能會隨時間變化。我要說的是對數線性回報,它導致你花費業務的一小部分。比如不是5%,不是95%。然後你會得到遞減的回報。Dwarkesh: 我感覺很奇怪,我在說服Dario相信AI的進步或其他什麼。好的,你不投資於研究是因為它有遞減的回報,但你投資於你提到的其他事情。Dario: 我認為宏觀層面的利潤——再次強調,我在談論遞減的回報,但是在你每年花費500億美元之後。這一點我相信你會提出,但在天才身上的遞減回報可能會相當高。更一般地說,市場經濟中的利潤是什麼?利潤基本上是說市場上的其他公司可以用這筆錢做比我更多的事情。把Anthropic放在一邊。我不想提供關於Anthropic的資訊。這就是為什麼我給出這些程式化的數字。但讓我們推導行業的均衡。為什麼不是每個人都把100%的算力花在訓練上而不服務任何客戶?這是因為如果他們沒有獲得任何收入,他們就無法籌集資金,無法進行算力交易,無法在下一年購買更多算力。所以將會有一個均衡,每家公司在訓練上的花費少於100%,當然在推理上的花費也少於100%。很明顯為什麼你不只是服務當前模型而從不訓練另一個模型,因為那樣你就沒有任何需求,因為你會落後。所以有一些均衡。不會是10%,不會是90%。讓我們作為一個程式化的事實說,它是50%。那就是我要表達的意思。我認為我們將處於這樣一個位置,即你在訓練上花費的均衡少於你在算力上能夠獲得的毛利率。所以底層經濟學是盈利的。問題是當你購買下一年的算力時,你有這個地獄般的需求預測問題,你可能猜低了並且非常盈利但沒有算力用於研究。或者你可能猜高了,你不盈利並且擁有世界上所有的算力用於研究。這說得通嗎?僅僅作為一個行業的動態模型?Dwarkesh: 也許退一步說,我不是說我認為“天才國度”會在兩年內到來,因此你應該購買這些算力。對我來說,你得出的最終結論非常有道理。但這似乎是因為“天才國度”很難,還有很長的路要走。所以退一步說,我試圖弄清楚的是,你的世界觀似乎與那些說“我們距離產生數兆美元價值的世界還有10年”的人相容。Dario: 那根本不是我的觀點。所以我會做另一個預測。我很難看到在2030年之前不會有數兆美元的收入。我可以建構一個合理的世界。也許需要三年。那將是我認為合理的終點。就像在2028年,我們得到了真正的“資料中心裡的天才國度”。收入到2028年進入低幾千億,然後天才國度將其加速到數兆。我們基本上處於擴散的慢端。需要兩年才能達到數兆。那將是直到2030年的世界。我懷疑即使綜合技術指數和擴散指數,我們也會在2030年之前到達那裡。Dwarkesh: 所以你提出了一個模型,Anthropic盈利是因為看起來從根本上我們處於一個算力受限的世界。所以最終我們繼續增長算力——Dario: 我認為利潤的來源是……再次強調,讓我們把整個行業抽象出來。讓我們想像我們在經濟學教科書裡。我們有少數幾家公司。每家都可以投資有限的金額。每家可以將一部分投資於研發。他們有一定的邊際服務成本。該邊際成本的毛利潤率非常高,因為推理是高效的。有一些競爭,但模型也是差異化的。公司將競爭推高他們的研究預算。但因為只有少數幾個玩家,我們有……那叫什麼?古諾均衡(Cournot equilibrium),我想,就是少數公司均衡。重點是它不會平衡到零利潤的完全競爭。如果經濟中有三家公司,並且都在某種程度上獨立地理性行事,它不會平衡到零。Dwarkesh: 幫我理解一下,因為現在我們確實有三家領先的公司,而且它們沒有盈利。所以什麼在改變?Dario: 再次強調,現在的毛利率非常正。發生的事情是兩件事的結合。一是因為我們仍處於算力的指數級擴展階段。一個模型被訓練出來。假設去年訓練一個模型花費了10億美元。然後今年它產生了40億美元的收入,推理成本為10億美元。再次強調,我在這裡使用程式化的數字,但這將是75%的毛利率和這25%的稅。所以那個模型整體賺了20億美元。但與此同時,我們花費100億美元訓練下一個模型,因為存在指數級擴展。所以公司虧錢。每個模型都賺錢,但公司虧錢。我所說的均衡是一個我們擁有“資料中心裡的天才國度”的均衡,但那個模型訓練的擴展已經更加平衡了。也許它還在上升。我們仍然試圖預測需求,但它更加平穩了。Dwarkesh: 我對那裡的幾件事感到困惑。讓我們從當前世界開始。在當前世界,你是對的,正如你之前所說,如果你把每個單獨的模型當作一家公司,它是盈利的。但當然,作為前沿實驗室的生產函數的一大部分是訓練下一個模型,對吧?Dario: 是的,那是對的。Dwarkesh: 如果你不那樣做,那麼你會盈利兩個月,然後你就沒有利潤了,因為你不會擁有最好的模型。但在某個點,這達到了它能達到的最大規模。然後在均衡中,我們有演算法改進,但我們花費大致相同的金額來訓練下一個模型,就像我們花費來訓練當前模型一樣。在某個點,你用光了經濟中的錢。固定的勞動總量謬誤……經濟將會增長,對吧?那是你的預測之一。我們將在太空中擁有資料中心。Dario: 是的,但這又是我談到的主題的另一個例子。我認為有了AI,經濟增長將比以往任何時候都快。現在算力每年增長3倍。我不相信經濟每年會增長300%。我在《仁慈的機器》中說過,我認為我們可能會獲得每年10-20%的經濟增長,但我們不會獲得300%的經濟增長。所以我想最終,如果算力成為經濟產出的大部分,它將受限於此。Dwarkesh: 所以讓我們假設一個算力保持上限的模型。前沿實驗室賺錢的世界是一個他們繼續取得快速進展的世界。因為從根本上說,你的利潤受限於替代品有多好。所以你能夠賺錢是因為你擁有前沿模型。如果你沒有前沿模型,你就不會賺錢。所以這個模型要求永遠沒有穩態。你永遠不斷地取得更多的演算法進展。Dario: 我不認為那是真的。我是說,我覺得我們在上經濟學課。你知道泰勒·科溫(Tyler Cowen)的名言嗎?我們永遠不會停止談論經濟學。Dwarkesh: 我們永遠不會停止談論經濟學。Dario: 所以不,我不認為這個領域會成為壟斷。我所有的律師都不希望我說“壟斷”這個詞。我不認為這個領域會成為壟斷。你確實有些行業只有少數幾個玩家。不是一個,而是少數幾個玩家。通常,你獲得像Facebook或Meta這樣的壟斷——我總是叫他們Facebook——是通過這種網路效應。你獲得只有少數幾個玩家的行業的方式,是非常高的進入成本。雲就是這樣。我認為雲是這方面的一個好例子。雲領域有三個,也許四個玩家。我認為AI也是一樣,三個,也許四個。原因是它太昂貴了。經營一家雲公司需要如此多的專業知識和如此多的資本。你必須投入所有這些資本。除了投入所有這些資本外,你還必須擁有所有這些其他需要大量技能才能實現的東西。所以如果你去找某人說,“我想顛覆這個行業,這是1000億美元。”你會像,“好的,我投入1000億美元,並且我也賭你能做所有這些其他人一直在做的事情。”結果只是降低了利潤。你進入的影響是利潤率下降。所以,我們在經濟中一直有這樣的均衡,只有幾個玩家。利潤不是天文數字。利潤率不是天文數字,但它們不是零。這就是我們在雲上看到的。雲是非常同質化的。模型比雲更具差異化。每個人都知道Claude擅長的事情與GPT擅長的事情不同,與Gemini擅長的事情不同。不僅僅是Claude擅長程式設計,GPT擅長數學和推理。它比那更微妙。模型擅長不同類型的程式設計。模型有不同的風格。我認為這些東西實際上彼此非常不同,所以我預計會看到比雲更多的差異化。現在,實際上有一個反駁論點。那個反駁論點是,如果生產模型的過程,如果AI模型自己能做那個,那麼那可能會擴散到整個經濟中。但這並不是讓AI模型普遍商品化的論點。那有點像是一次性讓整個經濟商品化的論點。我不知道在那個世界裡會發生什麼,基本上任何人都可以做任何事,任何人都可以建造任何東西,根本沒有任何護城河。我不知道,也許我們想要那個世界。也許那是這裡的終極狀態。也許當AI模型可以做所有事情時,如果我們解決了所有的安全和安保問題,那就是經濟再次自我扁平化的機制之一。但這有點遠在“資料中心裡的天才國度”之後了。Dwarkesh: 也許表達那個潛在觀點的更精細的方式是:1) 看來AI研究特別依賴原始智力,這在AGI的世界裡將特別豐富。2) 如果你只看今天的世界,似乎很少有技術像AI演算法進展那樣擴散得如此之快。所以這確實暗示這個行業在結構上是擴散性的。Dario: 我認為程式設計進展很快,但我認為AI研究是程式設計的超集,其中有些方面並沒有進展得那麼快。但我確實認為,再次強調,一旦我們搞定程式設計,一旦我們讓AI模型進展得很快,那麼這將加速AI模型做其他所有事情的能力。所以雖然現在程式設計進展很快,我認為一旦AI模型正在建構下一個AI模型並建構其他所有東西,整個經濟將以同樣的速度發展。不過我在地理上有點擔心。我有點擔心僅僅是接近AI,聽說過AI,可能就是一個區分因素。所以當我說10-20%的增長率時,我擔心的是矽谷和世界上與矽谷有社會聯絡的部分增長率可能是50%,而在其他地方並沒有比現在的速度快多少。我認為那將是一個相當糟糕的世界。所以我經常思考的一件事是如何防止這種情況。Dwarkesh: 你認為一旦我們擁有了這個資料中心裡的天才國度,機器人技術會在那之後很快解決嗎?因為看起來機器人技術的一個大問題是人類可以學習如何遠端操作當前的硬體,但目前的AI模型不能,至少不能以超高效的方式。所以如果我們擁有這種像人類一樣學習的能力,難道不應該也立即解決機器人技術嗎?Dario: 我不認為這依賴於像人類一樣學習。它可以通過不同的方式發生。再次強調,我們可以讓模型在許多不同的視訊遊戲上訓練,這就像機器人控制,或者許多不同的模擬機器人環境,或者只是訓練它們控制電腦螢幕,然後它們學會泛化。所以它會發生……它不一定依賴於類人學習。類人學習是它可能發生的一種方式。如果模型像,“哦,我拿起一個機器人,我不知道怎麼用,我學習,”那可能發生是因為我們發現了持續學習。那也可能發生是因為我們在很多環境上訓練模型然後泛化,或者可能發生是因為模型在上下文長度中學會了那個。實際上那種方式並不重要。如果我們回到我們一小時前的討論,那種事情可以通過幾種不同的方式發生。但我確實認為,無論出於何種原因,當模型擁有這些技能時,機器人技術將被徹底變革——無論是機器人的設計,因為模型在這方面將比人類好得多,還是控制機器人的能力。所以我們將更擅長建構物理硬體,建構物理機器人,我們也將在控制它方面變得更好。現在,這是否意味著機器人行業也將產生數兆美元的收入?我的回答是肯定的,但會有同樣的極其快速但不無限快的擴散。所以機器人技術會被徹底變革嗎?是的,也許再加一兩年。這就是我思考這些事情的方式。Dwarkesh: 有道理。對於極快的進展有一種普遍的懷疑。這是我的看法。聽起來你們將在幾年內以某種方式解決持續學習。但就像幾年前人們沒有談論持續學習,然後我們意識到,“哦,為什麼這些模型不像它們可能的那樣有用,即使它們顯然通過了圖靈測試並且是許多不同領域的專家?也許就是這個東西。”然後我們解決了這個東西,我們意識到,實際上,還有另一個人類智能能做而這些模型不能做的事情,它是人類勞動的基礎。所以為什麼不認為會有更多像這樣的東西,我們發現了更多人類智能的碎片?Dario: 嗯,說清楚點,我認為持續學習,正如我之前所說,可能根本不是一個障礙。我認為我們可能僅僅通過預訓練泛化和RL泛化就能到達那裡。我認為可能根本就沒有這樣一個東西。事實上,我會指出ML的歷史,人們提出一些看似障礙的東西,最後都在“算力大團塊”中溶解了。人們談論,“你的模型如何跟蹤名詞和動詞?”“它們可以在句法上理解,但不能在語義上理解?這只是統計相關性。”“你可以理解一段話,你不能理解一個詞。有推理,你不能做推理。”但突然之間,結果證明你可以非常好地做程式碼和數學。所以我認為實際上有更強的歷史表明,其中一些事情看起來是個大問題,然後就有點溶解了。其中一些是真實的。對資料的需求是真實的,也許持續學習是一件真實的事情。但再次強調,我會讓我們立足於像程式碼這樣的東西。我認為我們可能會在一兩年內達到模型可以端到端做SWE的地步。那是一個完整的任務。那是人類活動的一個完整領域,我們只是說模型現在可以做了。Dwarkesh: 當你說端到端時,你的意思是設定技術方向,理解問題的背景,等等?Dario: 是的。我是指所有這些。Dwarkesh: 有趣。我覺得那是AGI完備的,這也許在內部是一致的。但這不像說90%的程式碼或100%的程式碼。Dario: 不,我給出了這個光譜:90%的程式碼,100%的程式碼,90%的端到端SWE,100%的端到端SWE。新的任務為SWE創造出來。最終那些也會被完成。那裡有一個長長的光譜,但我們正在非常快地穿越這個光譜。Dwarkesh: 我確實覺得很有趣,我看過你做的幾個播客,主持人會像,“但Dwarkesh寫了關於持續學習的文章。”這總是讓我笑出聲,因為你已經做了10年的AI研究員。我確信會有某種感覺,“好的,所以一個播客主寫了一篇文章,每次採訪我都被問到這個問題。”Dario: 事實是我們都在試圖一起弄清楚這個問題。有些方面我能看到別人看不到的東西。這些天這可能更多地與在Anthropic內部看到一堆東西並必須做出一堆決定有關,而不是我有其他人沒有的偉大研究洞察力。我在經營一家2500人的公司。實際上對我來說,擁有具體的研究洞察力要比10年前甚至兩三年前難得多。Dwarkesh: 隨著我們走向一個完全可以直接替代遠端工人的世界,API定價模型仍然是最合理的嗎?如果不是,定價AGI或服務AGI的正確方式是什麼?Dario: 我認為這裡將會有很多不同的商業模式同時被試驗。我實際上確實認為API模型比許多人想像的更持久。我思考這個問題的一種方式是,如果技術正在快速進步,如果它是指數級進步,這意味著總是有過去三個月開發出的新用例的表面積。你建立的任何產品表面總是面臨變得無關緊要的風險。任何給定的產品表面可能對模型的一定能力範圍有意義。聊天機器人已經遇到了限制,讓它變得更聰明並不能真正幫助普通消費者那麼多。但我不認為那是AI模型的限制。我不認為那是模型足夠好以及它們變得更好對經濟無關緊要的證據。這對那個特定的產品無關緊要。所以我認為API的價值在於,API總是提供一個非常接近底層的機會,在最新的東西上進行建構。總是會有這種新初創公司和新想法的前沿,這些在幾個月前是不可能的,現在因為模型進步而成為可能。我實際上預測它將與其他模型並存,但我們將始終擁有API商業模式,因為總是需要一千個不同的人嘗試以不同的方式試驗模型。其中100個成為初創公司,其中10個成為成功的大型初創公司。兩三個真正最終成為人們使用某一代模型的方式。所以我基本上認為它總是會存在的。與此同時,我確信也會有其他模型。不是模型輸出的每個token都值同樣的錢。想想當有人打電話說,“我的Mac壞了,”或者什麼,模型說,“重啟它。”那些token的價值是什麼。某人以前沒聽過,但模型說了1000萬次。也許那值一美元或幾美分或什麼。而如果模型去一家製藥公司說,“哦,你知道,你正在開發的這個分子,你應該把那個芳香環從分子的那一端拿下來放在那一端。如果你那樣做,奇妙的事情就會發生。”那些token可能值數千萬美元。所以我認為我們肯定會看到認識到這一點的商業模式。在某個點,我們將看到某種形式的“按結果付費”,或者我們可能會看到類似勞動的補償形式,那種按小時計費的工作。我不知道。我認為因為這是一個新行業,很多事情都會被嘗試。我不知道什麼最終會被證明是正確的事情。Dwarkesh: 我同意你的觀點,人們必須嘗試各種事情來弄清楚使用這團智能的最佳方式是什麼。但我發現Claude Code很引人注目。我不認為在初創公司的歷史上有一個單一的應用程式像程式設計智能體那樣競爭激烈。Claude Code是這裡的類別領導者。這對我來說似乎很令人驚訝。這似乎並非本質上非得Anthropic來建構。我想知道你是否有關於為什麼必須是Anthropic,或者Anthropic是如何最終建構了一個除了底層模型之外還成功的應用程式的解釋。Dario: 實際上發生的方式非常簡單,那就是我們有自己的程式設計模型,它們擅長程式設計。大約在2025年初,我說,“我認為時機已經到來,如果你是一家AI公司,你可以通過使用這些模型對自己的研究進行非同尋常的加速。”當然,你需要一個介面,你需要一個駕馭它們的工具。所以我鼓勵內部人員。我沒有說這是你們必須使用的一件事。我只是說人們應該嘗試這個。我想它最初可能叫Claude CLI,後來名字最終改成了Claude Code。在內部,它是每個人都在使用的東西,並且看到了快速的內部採用。我看著它說,“也許我們應該對外發佈這個,對吧?”它在Anthropic內部看到了如此快速的採用。程式設計是我們做的很多事情。我們有數百人的受眾,在某些方面至少代表了外部受眾。所以看起來我們已經有了產品市場契合度(product market fit)。讓我們發佈這個東西。然後我們發佈了它。我認為僅僅是我們自己正在開發模型,我們自己知道我們最需要如何使用模型,我認為這正在創造這種反饋循環。Dwarkesh: 我明白了。也就是說,比如說Anthropic的一個開發者就像,“啊,如果它在這個X事情上更好就好了。”然後你就把那個烤進你建構的下一個模型中。Dario: 那是其中一個版本,但還有就是普通的產品迭代。我們在Anthropic有一堆程式設計師,他們每天都使用Claude Code,所以我們得到快速反饋。這在早期更重要。現在,當然,有數百萬人使用它,所以我們也得到了一堆外部反饋。但能夠獲得這種快速的內部反饋真是太棒了。我認為這就是為什麼我們發佈了一個程式設計模型而沒有發佈一家製藥公司。我的背景是生物學,但我們沒有任何發佈一家製藥公司所需的資源。法規會摧毀AGI的紅利嗎?Dwarkesh: 現在讓我問你關於讓AI向好的方向發展。看起來無論我們對AI如何向好發展有什麼願景,都必須與兩件事相容:1) 建構和運行AI的能力正在極其迅速地擴散,以及 2) AI的數量,我們擁有的數量和它們的智力,也將非常迅速地增加。這意味著很多人將能夠建構大量未對齊的AI,或者那些只是試圖增加足跡或擁有像Sydney Bing那樣奇怪心理但現在是超人類的AI。在一個我們擁有大量不同的AI(其中一些未對齊)到處運行的世界裡,我們擁有一個均衡的願景是什麼?Dario: 我認為在《技術的青春期》中,我對權力平衡持懷疑態度。但我特別懷疑的是,你有三四家公司都在建構源自同一事物模型,它們會相互制衡。甚至任何數量的它們會相互制衡。我們可能生活在一個進攻佔主導地位的世界,一個人或一個AI模型足夠聰明,可以做一些對其他所有事物造成損害的事情。在短期內,我們現在的玩家數量有限。所以我們可以從有限數量的玩家開始。我們需要落實保障措施。我們需要確保每個人都做正確的對齊工作。我們需要確保每個人都有生物分類器。這些是我們立即需要做的事情。我同意這並不能解決長期問題,特別是如果AI模型製造其他AI模型的能力激增,那麼整個事情可能會變得更難解決。我認為從長遠來看,我們需要某種治理架構。我們需要某種既保留人類自由,又允許我們治理大量人類系統、AI系統、混合人類-AI公司或經濟單位的治理架構。所以我們將需要思考:我們如何保護世界免受生物恐怖主義的侵害?我們如何保護世界免受鏡像生命(mirror life)的侵害?可能我們將需要某種AI監控系統來監控所有這些事情。但我們也需要以一種保留公民自由和我們憲法權利的方式來建構它。所以我認為就像其他任何事情一樣,這是一個具有一套新工具和一套新漏洞的新安全景觀。我的擔憂是,如果我們有100年讓這一切非常緩慢地發生,我們會習慣它。我們已經習慣了社會中存在爆炸物,或者存在各種新武器,或者存在攝影機。我們會在100年裡習慣它,我們會制定治理機制。我們會犯錯。我的擔憂僅僅是這一切發生得太快了。所以也許我們需要更快地思考如何讓這些治理機制發揮作用。Dwarkesh: 看來在一個進攻佔主導地位的世界裡,在下個世紀的過程中——這個想法是AI正在使下個世紀會發生的進步在五到十年的某個時期內發生——即使人類是唯一的玩家,我們也仍然需要同樣的機制,或者權力平衡同樣難以處理。Dario: 我想我們有AI的建議。但從根本上說,這似乎並不是一個完全不同的球賽。如果制衡要起作用,它們對人類也會起作用。如果它們不起作用,它們對AI也不會起作用。所以也許這註定了人類的制衡也是失敗的。再次強調,我認為有某種方法可以讓這發生。世界各國政府可能不得不共同努力讓這發生。我們可能不得不與AI討論建立社會結構,使這些防禦成為可能。我不知道。我不想說這在時間上太遙遠,但這在技術能力上太遙遠,可能會在很短的時間內發生,以至於我們很難提前預測它。Dwarkesh: 說到政府介入,12月26日,田納西州立法機構提出了一項法案,該法案稱,“如果一個人故意訓練人工智慧提供情感支援,包括通過與使用者進行開放式對話,即屬犯罪。”當然,Claude試圖做的事情之一就是成為一個體貼、知識淵博的朋友。總的來說,看起來我們將擁有這種拼湊的州法律。由於AI,普通人可能體驗到的很多好處將被削減,特別是當我們進入你在《仁慈的機器》中討論的那類事情時:生物自由、心理健康改善等。似乎很容易想像這些被不同的法律像打地鼠一樣打掉的世界,而像這樣的法案似乎並沒有解決你所擔心的實際生存威脅。我很好奇想瞭解,在像這樣的事情背景下,Anthropic反對聯邦暫停州AI法律的立場。Dario: 有許多不同的事情同時發生。我認為那條特定的法律是愚蠢的。這顯然是由那些可能對AI模型能做什麼和不能做什麼知之甚少的立法者制定的。他們就像,“AI模型服務我們,這聽起來很可怕。我不希望那發生。”所以我們實際上不支援那個。但這並不是被投票表決的事情。被投票表決的事情是:我們將禁止所有州對AI的監管10年,而沒有任何明顯的聯邦AI監管計畫,這需要國會通過,這是一個非常高的門檻。所以這種我們要禁止各州做任何事情10年的想法……人們說他們有聯邦政府的計畫,但桌面上沒有實際提案。沒有實際嘗試。考慮到我在《技術的青春期》中列出的關於生物武器和生物恐怖主義自主風險等嚴重危險,以及我們一直在談論的時間線——10年是永恆——我認為那是瘋狂的事情。所以如果那是選擇,如果你強迫我們選擇,那麼我們將選擇不暫停。我認為那個立場的好處超過了成本,但如果那是選擇,那不是一個完美的立場。現在,就我們應該做的事情而言,我會支援的事情是,聯邦政府應該介入,不是說“各州你們不能監管”,而是“我們要這樣做,各州你們不能偏離這個標準。”我認為只要聯邦政府說:“這是我們的標準。這適用於所有人。各州不能搞別的。”這種意義上的優先權(preemption)我是可以接受的。如果是以這種正確的方式進行,我會支援。但是如果現在的想法是各州說:“你們什麼都不能做,而我們(聯邦政府)也什麼都不做,”這在我們看來非常不合理。我認為這種做法經不起時間的考驗,實際上隨著你看到的所有反對聲音,它已經開始顯得過時了。至於我們想要什麼,我們討論過的事情是從透明度標準開始,以便監控其中一些自主性風險和生物恐怖主義風險。隨著風險變得更加嚴重,隨著我們獲得更多證據,我認為我們可以採取更有針對性的激進措施,比如規定:“嘿,人工智慧生物恐怖主義真的是個威脅。讓我們通過一項法律,強制人們必須使用分類器。”我甚至可以想像……但這要看情況。這取決於最終威脅有多嚴重。我們現在還不能確定。我們需要以一種理智誠實的方式來推進這件事,我們要提前說明,目前風險尚未顯現。但我當然可以想像,按照目前事態發展的速度,今年晚些時候我們可能會說:“嘿,這個人工智慧生物恐怖主義的東西真的很嚴重。我們應該採取行動。我們應該把它寫入聯邦標準。如果聯邦政府不行動,我們就應該把它寫入州標準。”我完全可以看到這種情況發生。我擔心的是這樣一個世界:如果你考慮到你預期的進步速度,再考慮到立法的生命周期……正如你所說,由於擴散滯後,收益來得比較慢,以至於我認為這種拼湊式的州法律,按照目前的軌跡,真的會起到阻礙作用。我的意思是,如果擁有一個情感聊天機器人朋友這種事都會讓人們抓狂,那麼想像一下我們希望普通人能夠體驗到的來自人工智慧的真正好處吧。從健康和健康壽命的改善,到心理健康的改善等等。然而與此同時,似乎你認為危險已經出現在地平線上了,但我並沒有看到那麼多……相比於人工智慧的危險,這似乎對人工智慧的好處尤其有害。所以這可能就是我認為成本效益分析不太合理的地方。Dwarkesh Patel: 這裡有幾件事。人們談論有成千上萬條這樣的州法律。首先,絕大多數、絕大多數的法律都不會通過。理論上世界是按某種方式運作的,但僅僅因為通過了一項法律,並不意味著它真的會被執行。執行它的人可能會想:“天那,這太蠢了。這意味著要關閉田納西州建造過的所有東西。”很多時候,法律的解釋方式會使其不像看起來那麼危險或有害。當然,另一方面,如果你通過一項法律來阻止壞事發生;你也會遇到同樣的問題。Dario Amodei: 我的基本觀點是,如果我們能決定通過什麼法律以及如何做事——當然我們只是其中的一小部分意見——我會解除很多圍繞人工智慧健康益處的管制。我不那麼擔心聊天機器人的法律。實際上,我更擔心藥物審批流程,我認為人工智慧模型將極大地加快我們發現藥物的速度,而審批管道會被堵塞。審批管道將無法準備好處理所有湧入的東西。我認為監管程序的改革應該更多地偏向這樣一個事實:我們將會有很多東西出現,它們的有效性和安全性實際上將非常清晰明了,這是一件美妙的事情,而且非常有效。也許我們不需要圍繞它建立所有這些上層建築,那些原本是為那個藥物幾乎不起作用且經常有嚴重副作用的時代設計的。與此同時,我認為我們應該大幅加強安全和安保方面的立法。就像我說過的,從透明度開始是我認為試圖不阻礙行業發展、試圖找到正確平衡的觀點。我很擔心這一點。有些人批評我的文章,說:“那太慢了。如果我們那樣做,人工智慧的危險會來得太快。”好吧,基本上,我認為過去六個月以及接下來的幾個月將是關於透明度的。然後,如果當我們對這些風險更加確定時——我認為最早在今年晚些時候我們可能會確定——如果這些風險出現了,那麼我認為我們需要在實際看到風險的領域非常迅速地採取行動。我認為這是做這件事的唯一方法,就是要靈活。現在的立法程序通常並不靈活,但我們需要向所有相關人員強調這件事的緊迫性。這就是為什麼我要發出這個緊迫的資訊。這就是為什麼我寫了《技術的青春期》(Adolescence of Technology)這篇文章。我想讓政策制定者、經濟學家、國家安全專業人士和決策者閱讀它,這樣他們就有希望比原本更快地採取行動。Dwarkesh Patel: 有沒有什麼你可以做或倡導的事情,能讓人們更確定人工智慧的好處能夠更好地實現?我覺得你已經和立法機構合作說過:“好吧,我們要在這裡防止生物恐怖主義。我們要增加透明度,我們要加強對舉報人的保護。”但我認為,默認情況下,我們期待的實際利益似乎在各種道德恐慌或政治經濟問題面前非常脆弱。Dario Amodei: 實際上對於發達國家,我並不太同意這一觀點。我覺得在發達國家,市場運作得相當好。當某樣東西有很大的賺錢空間,而且它顯然是最好的可用替代品時,監管體系實際上很難阻止它。我們在人工智慧本身就看到了這一點。如果我們談論藥物和技術的益處,我不那麼擔心這些益處在發達國家受到阻礙。我有點擔心它們進展太慢。正如我所說,我確實認為我們應該努力加快FDA的審批流程。我確實認為我們應該反對你描述的這些聊天機器人法案。單獨來看,我反對它們。我認為它們很愚蠢。但我實際上認為更大的擔憂是開發中國家,那裡沒有運作良好的市場,而且我們往往無法在已有的技術基礎上進行建設。我更擔心那些人會被甩在後面。我也擔心即使開發出了治療方法,也許密西西比農村的某個人也無法很好地獲得它。那是我們在開發中國家擔憂的一個縮小版。所以我們一直在做的事情是與慈善家合作。我們與向開發中國家、撒哈拉以南非洲、印度、拉丁美洲和世界其他發展中地區提供藥物和健康干預措施的人合作。我認為這是那件如果不干預就不會自動發生的事情。Claude的總結Dwarkesh Patel: 你們最近宣佈 Claude 將擁有一部符合一套價值觀的憲法,而不一定只是為了終端使用者。我可以想像這樣一個世界:如果它是為了終端使用者,它就保留了我們今天世界擁有的權力平衡,因為每個人都有自己的人工智慧為他們辯護。壞人與好人的比例保持不變。這似乎對我們今天的世界很有效。為什麼不那樣做,而是要有一套特定的人工智慧應該遵循的價值觀更好?Dario Amodei: 我不確定我會那樣劃分區別。這裡可能有兩個相關的區別。我認為你在談論這兩者的混合。一個是,我們是否應該給模型一套關於“做這個”與“不做這個”的指令?另一個是,我們是否應該給模型一套關於如何行動的原則?這純粹是我們觀察到的一種實踐和經驗性的東西。通過教導模型原則,讓它從原則中學習,它的行為更加一致,更容易覆蓋邊緣情況,而且模型更有可能做人們想要它做的事情。換句話說,如果你給它一個規則列表——“不要告訴人們如何偷接汽車點火線,不要說韓語”——它並不真正理解這些規則,而且很難從這些規則中概括出來。這只是一個“做與不做”的清單。然而如果你給它原則——它有一些硬性的護欄,比如“不要製造生物武器”,但是——總的來說你是在試圖理解它應該旨在做什麼,它應該旨在如何運作。所以僅從實踐角度來看,這被證明是一種更有效的訓練模型的方法。這就是規則與原則的權衡。然後還有你在談論的另一件事,即修正性(corrigibility)與內在動機的權衡。模型應該在多大程度上像一種“緊身衣”,只是直接遵循給它指令的人的指令,與模型應該在多大程度上擁有一套內在的價值觀並自己去做事情?在那方面我實際上會說,關於模型的一切都更接近於它應該主要做人們想要它做的事情的方向。它應該主要遵循指令。我們不是試圖建立某種自己跑去統治世界的東西。我們實際上非常偏向於可修正的一方。現在,我們確實說有些事情模型不會做。我認為我們在憲法中以各種方式說過,在正常情況下,如果有人要求模型做一個任務,它應該做那個任務。那應該是默認的。但是如果你要求它做一些危險的事情,或者傷害別人,那麼模型就不願意那樣做。所以我實際上把它看作是一個主要可修正的模型,它有一些限制,但這些限制是基於原則的。然後根本的問題是,這些原則是如何確定的?這不是Anthropic特有的問題。這將是任何人工智慧公司的問題。Dwarkesh Patel: 但因為你們是真正寫下原則的人,所以我可以問你這個問題。通常,憲法是被寫下來的,刻在石頭上的,並且有一個更新和改變它的過程等等。在這種情況下,它似乎是一份Anthropic的人寫的檔案,可以隨時更改,指導著將成為許多經濟活動基礎的系統的行為。你怎麼看待這些原則應該如何設定?Dario Amodei: 我認為這裡可能有三種大小的循環,三種迭代方式。一種是我們在Anthropic內部迭代。我們訓練模型,我們對它不滿意,我們就修改憲法。我認為這樣做很好。每隔一段時間發佈憲法的公開更新是好的,因為人們可以評論它。第二層循環是不同的公司有不同的憲法。我認為這很有用。Anthropic發佈一份憲法,Gemini發佈一份憲法,其他公司發佈一份憲法。人們可以看它們並進行比較。外部觀察者可以批評說:“我喜歡這份憲法裡的這一條,和那份憲法裡的那一條。”這為所有公司創造了一種軟性激勵和反饋,去取其精華並加以改進。然後我認為還有第三個循環,即人工智慧公司之外的社會,以及不僅僅是那些沒有硬實力的評論者。在那裡我們做了一些實驗。幾年前,我們與集體智慧項目(Collective Intelligence Project)做了一個實驗,基本上是民意調查,問人們我們的人工智慧憲法裡應該有什麼。當時,我們納入了其中一些變化。所以你可以想像用我們對憲法採取的新方法做類似的事情。這有點難,因為當憲法是一個“做與不做”的清單時,這種方法更容易採取。在原則層面上,它必須有一定的連貫性。但你仍然可以想像從各種各樣的人那裡獲取觀點。你也可以想像——這是一個瘋狂的想法,但這整個採訪都是關於瘋狂的想法——代議制政府系統有輸入。我今天不會這樣做,因為立法過程太慢了。這正是我認為我們應該對立法過程和人工智慧監管持謹慎態度的原因。但在原則上沒有理由你不能說:“所有人工智慧模型都必須有一部憲法,它以這些東西開始,然後你可以在後面附加其他東西,但這部分特殊章節必須優先。”我不會那樣做。那太僵化了,聽起來過於指令性,就像我認為過於激進的立法那樣。但這確實是你可以嘗試做的一件事。有沒有什麼不那麼強硬的版本?也許吧。我真的很喜歡第二個控制循環。Dwarkesh Patel: 顯然,這不是實際政府憲法運作或應該運作的方式。並沒有這種模糊的感覺,即最高法院會感受人們的感覺——氛圍是什麼——並相應地更新憲法。對於實際政府,有一個更正式、程序化的過程。但是你有一個憲法之間競爭的願景,這實際上非常讓人想起一些自由意志主義特許城市的人過去常說的,關於群島式的不同政府會是什麼樣子。誰能最有效地運作以及人們在那裡最快樂,這之間會有選擇。在某種意義上,你正在重現那個群島烏托邦的願景。Dario Amodei: 我認為那個願景有值得推薦的地方,也有會出錯的地方。這是一個有趣的,在某些方面令人信服的願景,但有些事情會出錯,是你沒想到的。所以我雖然也喜歡第二個循環,但我覺得整件事必須是第一、二、三個循環的某種混合,這取決於比例。我認為那必須是答案。Dwarkesh Patel: 當有人最終寫出相當於這個時代的《原子彈的製造》(The Making of the Atomic Bomb)的書時,什麼是歷史記錄中最難收集到的、他們最可能錯過的東西?Dario Amodei: 我認為有幾件事。一個是,在這個指數增長的每一個時刻,外部世界在多大程度上不理解它。這是一種經常存在於歷史中的偏見。任何實際發生的事情在回過頭看時都顯得不可避免。當人們回顧時,他們將很難把自己放在那些實際上在押注這件並非不可避免的事情發生的人的位置上,我們有過像我為規模化(scaling)或持續學習將被解決所做的論證那樣的爭論。我們內部有些人認為這發生的機率很高,但外部世界根本沒有對此採取行動。我認為它的怪異,不幸的是它的封閉性……如果我們離它發生還有一年或兩年,街上的普通人完全不知道。這是我試圖通過備忘錄、通過與政策制定者交談來改變的事情之一。我不知道,但我認為那只是一件瘋狂的事情。最後,我想說——這可能適用於幾乎所有歷史危機時刻——它是發生得多麼絕對地快,所有事情都是同時發生的。你可能認為經過精心計算的決定,實際上是你必須做出那個決定,然後你必須在同一天做出其他30個決定,因為一切發生得太快了。你甚至不知道那些決定最終會變得至關重要。我的擔憂之一——儘管這也是對正在發生的事情的一種洞察——是某些非常關鍵的決定將是某人走進我的辦公室說:“Dario,你有兩分鐘。這件事我們應該做A還是做B?”有人給我這個隨機的半頁備忘錄問:“應該做A還是B?”我說:“我不知道。我要去吃午飯了。做B吧。”結果那成了有史以來最重要的事情。Dwarkesh Patel: 最後一個問題。通常沒有科技CEO每隔幾個月寫50頁的備忘錄。看起來你已經成功地為自己建立了一個角色,並圍繞你建立了一家公司,這與這種更具知識分子類型的CEO角色是相容的。我想瞭解你是如何建構這一點的。那是怎麼運作的?你只是離開幾個星期,然後告訴你的公司,“這是備忘錄。這是我們要做的”?也有報導說你在內部寫了很多這樣的東西。Dario Amodei: 對於這一篇特別的,我是寒假期間寫的。我很難找到時間真正去寫它。但我以一種更寬以此的方式思考這個問題。我認為這與公司文化有關。我可能花了三分之一,也許40%的時間來確保Anthropic的文化是好的。隨著Anthropic變得越來越大,直接參與模型的訓練、模型的發佈、產品的建構變得越來越難。有2500人。我有某些直覺,但很難參與每一個細節。我儘可能多地嘗試,但有一件事是非常有槓桿作用的,那就是確保Anthropic是一個工作的好地方,人們喜歡在那裡工作,每個人都把自己看作團隊成員,每個人都在一起工作而不是相互對抗。我們看到隨著其他一些人工智慧公司的成長——不點名——我們開始看到脫節和人們互相爭鬥。我會爭辯說甚至從一開始就有很多這樣的情況,但情況變得更糟了。我認為我們在保持公司團結方面做得非常好,即使不是完美的,讓每個人都感受到使命,我們對使命是真誠的,每個人都相信那裡的其他人是為了正確的理由而工作。我們是一個團隊,人們並沒有試圖以犧牲他人為代價來獲得晉陞或在背後捅刀子,同樣,我認為這在其他一些地方經常發生。你是怎麼做到這一點的?這是很多事情。是我,是負責公司日常營運的Daniela,是聯合創始人,是我們僱傭的其他人,是我們試圖創造的環境。但我認為文化中重要的一點是,其他領導者也是,但尤其是我,必須闡明公司是關於什麼的,為什麼要做它正在做的事情,它的戰略是什麼,它的價值觀是什麼,它的使命是什麼,它代表什麼。當你達到2500人時,你不能逐個人去做這件事。你必須寫,或者你必須對全公司講話。這就是為什麼我每兩周在全公司面前講一個小時的話。我不會說我在內部寫文章。我做兩件事。第一,我寫這個叫DVQ的東西,Dario Vision Quest(Dario願景探索)。不是我給它起這個名字的。那是它收到的名字,這是我想反對的名字之一,因為它聽起來像是我要去吸食佩奧特掌(致幻仙人掌)什麼的。但這名字就這麼叫開了。所以我每兩周在公司面前出現一次。我有一份三四頁的檔案,我就講三四個不同的話題,關於內部正在發生什麼,我們正在生產的模型,產品,外部行業,整個世界與人工智慧的關係以及地緣政治等等。就是這些的混合。我非常誠實地講一遍,我說:“這就是我在想的,這就是Anthropic領導層在想的”,然後我回答問題。這種直接聯絡有很多價值,當你把事情順著鏈條向下傳遞六層時很難實現。公司很大一部分人來參加,或者是現場或者是虛擬的。這真的意味著你可以交流很多東西。我做的另一件事是我在Slack裡有一個頻道,我就寫一堆東西並經常評論。通常那是回應我在公司看到的事情或人們問的問題。我們做內部調查,有些事情人們很關心,所以我把它們寫下來。我對這些事情非常誠實。我就非常直接地說出來。關鍵是要建立一個對公司講實話的名聲,實事求是,承認問題,避免那種公司官話,那種在公共場合通常必要的防禦性溝通,因為世界很大,充滿了惡意解讀事情的人。但是如果你擁有一家你信任的人的公司,我們也試圖僱傭我們信任的人,那麼你真的可以完全不加過濾。我認為這是公司的一個巨大優勢。它使它成為一個更好的工作場所,它使人們不僅僅是各部分的總和,並增加了我們完成使命的可能性,因為每個人都在使命上保持一致,每個人都在辯論和討論如何最好地完成使命。Dwarkesh Patel: 好吧,作為外部版“Dario願景探索”的替代,我們有了這次採訪。這次採訪有點像那個。這很有趣,Dario。謝謝你接受採訪。Dario Amodei: 謝謝你,Dwarkesh。 (硬AI)
蔡崇信:曾被馬雲批不懂營運,被迫轉崗 | 附訪談原文
近日,在史丹佛大學商學院的一場訪談中,阿里巴巴董事會蔡崇信首次公開談及一段創業往事:他早年加入阿里後曾擔任三個月 COO,隨後被馬雲直言 “不懂營運”,並調整崗位。蔡崇信透露,1999年接觸阿里時,公司尚未註冊、零收入,而馬雲僅擁有一個域名與初創網站。他被馬雲的領導氣質與溝通能力打動,認為教師出身的馬雲擅長識人、育人與凝聚團隊。在他看來,“創業要找你願意共事、能追隨、可學習的人,對我而言,馬雲既是夥伴也是導師。”蔡崇信稱,自己加入阿里前僅與馬雲交談了一小時,便決定投身這家初創公司。他還披露,當時自己是當了三個月的首席營運官,然後馬雲“解僱”了他,馬雲稱,“你根本不懂如何營運。”於是,他便轉為首席財務官。訪談期間,蔡崇信還談到了自己為何2013年離開阿里日常管理崗位,他表示,這是他和馬雲共同商定的策略,當時阿里業務已涵蓋B2B、淘寶、支付寶、雲端運算等多個類股,他們意識到需要給陸兆禧、張勇等年輕一代機會。官方網站顯示,蔡崇信於1999年加入阿里巴巴集團,為公司創始人之一,自公司成立以來一直為董事會成員。蔡崇信曾擔任首席財務官至2013年,並擔任執行副主席至2023年9月,目前擔任阿里巴巴集團主席。蔡崇信是阿里巴巴合夥人制度的創始合夥人之一。他同時是阿里巴巴集團關聯公司螞蟻集團的董事。以下為訪談原文(英文原文在後):主持人傑裡米:Joseph Tsai,歡迎你。Joseph Tsai(蔡崇信):謝謝你,傑裡米。很高興來到這裡。主持人傑裡米:很榮幸你能來。當我準備這次採訪並試圖理清思路時,阿里巴巴已經變得多麼龐大和全球化。真正讓我印象深刻的是,在你的職業生涯中,你是如何跨越文化的,嗯,東方和西方,法律和商業,體育和科技。所以我想從你的第一次跨文化專業經歷開始。你在台灣出生和長大,13歲時搬到美國,就讀於紐澤西州的勞倫斯維爾學校。那段經歷對你來說是什麼感覺?Joseph Tsai(蔡崇信):嗯,當時很害怕。嗯,我去之前的第一次嗯,嗯,你知道我從未上過七年級。我在台灣上小學。然後我媽媽說,喬,我要送你去國外上學。但是你必須學會說英語。而且我當時根本不會說英語。所以呃,我去上了英語補習班一年,跳過了七年級。所以我八年級時去了勞倫斯維爾。呃,在那段補習班的日子裡,我基本上就是背單詞,但我連一句完整的英語都說不出來。這有點像,想像一下你並不真的懂這門語言。你不知道如何溝通,然後你就置身於一個全新的文化環境中,就像剛著陸。我的意思是就像剛下船一樣,對吧?然後降落在這裡,一個非常獨特的環境。你知道,寄宿學校,那是一所全男生寄宿學校,所以這有其自身的困境而你只能適應。我想我當時是想成為他們中的一員,我想融入其中。我看起來不一樣,我穿得不一樣,說不同的語言。嗯,所以對我來說,被其他人接受是非常重要的。嗯,然後很快,我就開始投身體育運動了。嗯,不幸的是我被棒球隊開除了。想像一個來自台灣的孩子,棒球小聯盟,你知道我沒有進球隊,沒有進游泳隊,嗯,然後我說該死,我要嘗試全新的事物。嗯,我踢足球,美式足球,然後進入長曲棍球,嗯,因為我不會打棒球,這是一項春季運動。長曲棍球,棒球是春季運動。我進不了棒球隊,所以我去打長曲棍球了。嗯,有趣的是昨天我跟傑裡米,我覺得他當時很擔心。你知道的,所以他想做個準備會議。所以我們昨天花了一小時準備這次談話。主持人傑裡米:是的,我倆都熱愛體育,我是湖人隊鐵桿球迷。很明顯,喬是個體育迷、網迷和自由迷。Joseph Tsai(蔡崇信):是的,我不會怪你的。但不管怎樣,湖人隊現在做得更好了。恭喜你,主持人傑裡米:非常感謝。非常感謝。Joseph Tsai(蔡崇信):然後我們發現我們都是橄欖球運動員,主持人傑裡米:身材矮小的線衛。喬,你找到感覺了。你從早期的體育挑戰中恢復過來了。你進入了長曲棍球。你曾就讀於耶魯大學的本科和法學院,對嗎?你在一家稅務律師事務所工作,最終進入了私募股權行業。但喬的投資生涯才4年,他就遇到了一個名叫馬雲的人,他正在建立一家公司。與其他17位聯合創始人一起,它是一個線上交易平台,早期零收入就只有幾千名使用者。那麼,是什麼讓你確信那是做出改變的合適時機?當時不僅僅是零收入,Jack(馬雲)甚至連公司都沒有。它甚至還沒有註冊成立。所以Jack,Jack當時只有一個域名和一個新網站。我還記得我第一次去看他的時候,我爬上了二樓的公寓。那裡有一堆鞋子。你知道的,在外面。你要脫下鞋子,你走進去,然後你知道,我們聊了大約一個小時。他就有那種魅力,那種領導氣質。Jack以前是個老師,我認為老師能成為很好的領導者,因為你必須善於溝通,你還需要具備識別優秀人才的能力,發掘並培養優秀學生,就像老師所做的那樣。所有這些品質都逐漸顯現出來,而這正是我覺得非常吸引人的地方。我沒能理解這個商業計畫,因為當時網際網路對每個人來說都是新的,他說的是利用網際網路讓中國所有製造東西的公司都參與進來,把東西交易到海外,讓外國買家和買家來網站購買中國的東西。嗯,這是一個批發市場。所以阿里巴巴的第一個網站實際上是英文寫的。因為它是為世界其他地區打造的。嗯,談話一個小時後,我說,Jack,你知道我需要去洗手間休息一下。於是我走進洗手間,水槽上有十把牙刷。所以我意識到人們只是睡在那裡,住在那裡,睡在睡袋裡。嗯,有點像創業文化。而我決定,嗯,你知道,我會這樣對年輕人說,當你想換工作,或是當你找到新工作想做點不同的事情時,找到你想合作的人。那些你想追隨的人,以及你想學習的導師,對我來說,傑克既是朋友,也是商業夥伴,也是導師。他教會了我很多東西。我覺得我可以從他身上學到很多。而且當時,你知道在網際網路時代,如果公司名字帶.com後綴,所有人都以為你會在6個月內成為百萬富翁。但對我來說,那個人是傑克。那種人格魅力,那種領導特質正是源自他曾經的教師經歷。主持人傑裡米:是啊,你和傑克的合作顯然挖到了金礦。在與傑克的合作中。史丹佛大學的很多同學都在考慮創辦公司和尋找聯合創始人。那麼,正確的公式是什麼?他們應該在聯合創始人身上尋找什麼?Joseph Tsai(蔡崇信):首先,我認為他們應該,找一個能相處的人。比如你是否願意和這個人出去喝杯啤酒,在下班後。我認為這是第一次考驗。我認為接下來重要的是互補性,也就是他們擅長而你不擅長的方面。以及你擅長而他們不擅長的方面。保持這種互補心態。無論用什麼詞來形容。能夠互相彌補確實非常重要,這樣創始人就不會互相妨礙。阿里巴巴最初有18位創始人,我認為我們都很好地相互補充,我們帶來了不同的技能組合。我認為當你考慮創辦公司時,就是,你知道,你會想出去找18個人一起創業,但我認為只有兩三個創始人有時會成為問題,因為隨著業務規模的擴大,你的文化會被稀釋,而且周圍沒有創始人與員工建立接觸點,而有18個創始人,我們有這個優勢。你知道,我們能夠,每位創始人可以接觸更多員工,所以,我覺得這很重要。還有就是那些你想朝夕相處的人並共度美好時光,因為創業初期你不會經常回家或者說工作與生活的平衡不會是你該關注的重點。主持人傑裡米:是的,我想我應該問一下,你在公寓裡也有放牙刷嗎?Joseph Tsai(蔡崇信):是的,嗯,我後來帶了自己的牙刷。主持人傑裡米:所以我想談談這一點,關於有這麼多位聯合創始人,總共有18位,這非常非常獨特。嗯,並於1999年加入阿里巴巴擔任首席財務官時,你才是真正進入公司。Joseph Tsai(蔡崇信):我當時不是CIO。而是當了三個月的首席營運官,然後傑克解僱了我,因為他說,“喬,你根本不懂如何營運。我當時就想,"好吧,沒關係。那我就當首席財務官吧。主持人傑裡米:好吧,又一次,你從棒球反彈到長曲棍球,從首席營運官再到首席財務官。現在,這群聯合創始人彼此之間已經有些聯絡了,而你算是新加入的人。你是受過美國教育的律師兼投資人,你來自台灣,他們都是中國大陸人,你是怎麼找到方法跨越那種文化?Joseph Tsai(蔡崇信):我認為首要的是,我通常更傾向於做一個傾聽者。我懷著謙卑的心態投入這項工作,我是去學習的。我對網際網路一無所知。我從未在一家以中國大陸員工為主的中國公司工作過,因為我之前的所有工作經驗要麼是在美國,要麼是在香港。所以我覺得自己沒有立場來指手畫腳,所以我傾聽了很多,然後試著去再次嘗試融入勞倫斯維爾的生活,試著成為人群中的一員,成為社區的一份子。我認為這對我幫助很大。我認為你必須全力以赴,你要帶著謙遜的態度去工作,因為總會有人,你會發現你的同事,你的合作夥伴比你更聰明,他們能教會你很多。你需要以這種心態對待工作。主持人傑裡米:是的,進入並成為一個傾聽者,並且保持謙遜,這顯然對你很有幫助。隨著時間的推移,傑克真的覺得這個超乎尋常的人物是中國科技行業的面孔。你全程都在那裡,但主要是在幕後。為什麼?Joseph Tsai(蔡崇信):嗯,因為他更擅長站在舞台的最前面。他更擅長演講。他是一個更出色的精神領袖。嗯,對吧?我認為這非常重要。我原認為自己這些年來有所進步。在與人溝通方面,但這對他是天生的,只要站上舞台,讓所有員工共處一室,然後直接宣佈,看,這就是我們的方向。這就是我們這麼做的原因。而且他非常有說服力,所以更擅長這個。主持人傑裡米:這是另一個很好的例子,可以找到一個具有互補技能的人,共同致力於同一項任務。現在,據我所知,你和傑克是飛到沙丘路這邊只有幾分鐘的路程,對吧?向投資者推銷並籌集種子輪。你還記得那次行程嗎?Joseph Tsai(蔡崇信):處理程序不算順利,我想我們搞砸了。我們開了大約15次會。我們連一個投資者都沒有找到。我想這是因為在史丹佛商學院,他們教你帶著PPT之類的東西去展示。對吧?你得向人們展示些什麼比如演示或類似的,比如演示什麼的。我們什麼都沒有,我們空手而來。人們會說,Jack,你的商業計畫是什麼?Jack說:我沒有商業計畫。他當時確實說過,我沒有商業。但當時中國的趨勢是,事後看來,你本可以看到的。我的意思是事後看來你本可以預見。這是網際網路技術的交匯點,也是中國加入世界貿易組織的時期,這意味著中國與世界其他地區的貿易往來將呈爆炸式增長。如今你來到中國,中國是一個製造業強國。一切都是中國製造的,而且質量越來越好,越來越高,技術越來越高。嗯,但種子在那時已經播下,那是一個即將加入世貿組織的時代。想像一下讓所有這些製造商和貿易公司把他們的產品都搬到網上,讓世界其他地方看到,這就是當時的一個商業構想。但傑克不僅僅談論業務。他說:"我的使命是讓天下沒有難做的生意。”這就是我們當時的使命,這就是我們告訴投資者的話。至今這仍是我們的使命。你可以訪問我們的網站,阿里巴巴官網寫道“讓天下沒有難做的生意”。主持人傑裡米:太不可思議了。所以這是一個沒有商業計畫的任務優先領導者。你們從那趟旅行回來採納那些投資人的反饋了嗎?Joseph Tsai(蔡崇信):並沒有。因為投資者看起來很困惑,他們沒有給我們很多反饋。他們有點沉默寡言。我想他們只是想直接拒絕我們。但那次經歷很重要,因為我們回來後說,我們必須做我們相信的事情,而不是讓投資者告訴我們應該做什麼。我認為這是一個非常重要的一課。幸運的是,我們籌集到一些資金。一些投資者終於非常懷疑地加入了。我還記得我們的A輪融資,我們當時確實請來了高盛。我是說你以為自己去了沙丘路,然後你就得到了高盛。他們當時,高盛像大型私募股權公司一樣進行投資。交易然後他們還有可以說是一個新興科技投資業務,而我恰好知道有個朋友是合夥人,當時在經營那家企業。然後她打電話跟我說,喬,你知道的。我有好消息和壞消息。當時,我已經很沮喪,被各種拒絕搞得心灰意冷。我當時想,再也受不了任何壞消息了,那就先告訴我好消息吧。她說:好吧,我們投資委員會已經決定追加阿里巴巴。我當時想,太棒了。差點都要掛掉電話,她說:等等,等等,你想聽壞消息嗎?我說,好啊,什麼壞消息?她說,“嗯,我們還決定投資另外五家公司,它們的商業模式與你們非常相似,我們就是想看看,讓你們互相競爭一下。主持人傑裡米:結果你們競爭得很好,你們上升到了頂峰,你們從高盛那裡拿到了第一輪,然後又從軟銀那裡拿到了另一輪,然後飛速發展了。在接下來的10年裡,你們推出了支付,即時通訊、消費者對消費者市場、企業對消費者市場,廣告和雲基礎設施產品,該產品目前是世界第四大,在中國擁有40%的市場份額。因此,阿里巴巴成為了一款超級應用。其中一項重大內部成果就是淘系業務。阿里巴巴的消費者對消費者市場,你能帶我們回到淘寶上線的那一刻嗎?當時面對的是來自eBay中國的真正壟斷。Joseph Tsai(蔡崇信):那是在2000年代初,eBay收購了一家名為易趣的公司,所以他們立刻佔據了很大的市場份額。在最高峰時期,他們在消費者電子商務中佔據了90%的市場份額。而我們是新入場的玩家,話說有一天,我是說當時我正在和這裡的院長交談,她提到了一個叫簡的兒子,他是C-RIP的CEO,而她的丈夫是第一任CTO吳炯。阿里巴巴的第一任CTO他來自雅虎。所以,抱歉,這是個冗長的故事。當傑克決定推出一個消費者市場時,他非常興奮。他曾與軟銀的孫正義談過,孫正義非常支援,因為這是個宏大的構想。Masa會支援任何大項目,任何需要大量資金的事物,他都會支援。而且Jack非常興奮。他說:"我從MASA那裡拿到了資金,我要做這件事。然後他去找John Wu,我們的首席技術官,John說,“想都別想,除非我死,否則我們絕不會做這個”,這是因為John的工作,John曾在Yahoo購物部門工作過。而且那並不成功。所以他對我們進入消費者電商領域並不看好。但顯然傑克否決了所有人的意見。我當時...我不知道我是有策略地,我...我無法做出那個判斷。但我決定我們要這樣來架構它,這樣在經濟上我們就不會完全受損。所以實際上從第一天開始,淘寶實際上是一家合資企業,由阿里巴巴和軟銀各持股50%的合資公司,直到大約六歲,七年後雅虎對我們進行了投資,我們抓住機會將淘寶剩餘部分整合進阿里以巴巴實現100%控股。這是我們做過的最明智的決定。否則如今淘寶仍將有一半歸軟銀所有,而我們也不知道它會走向何方。所以,但當我們開始做淘寶時,它是一個秘密項目。如果你們對阿里巴巴有點瞭解的話,幾乎所有的初創企業都曾在這個公寓裡起步,就是馬雲最初的那套公寓,你知道的,那裡有鞋子還有牙刷。所以我們帶了七個人的團隊進入這間公寓,他們都必須簽署保密協議。他們不能告訴同事、配偶或任何人。於是有一天,你知道,你就是那個坐在隔壁隔間的人,旁邊隔間的人消失了,然後他們,你知道,人們都在問,他們去那兒了?所以這最初七個人組建了淘寶業務,他們去了Jack原來的公寓,開展工作,建立那個市場。然後是我們首次推出時的情景,首批在淘寶上售賣的商品都來自每個人的衣櫃。大家只是打開衣櫃然後說:"我們有什麼?能找到什麼在Tabao上賣?我們用大量雜貨填滿了那個市場。這件事就是這樣開始的。據我記得我們把這個項目保密了將近一年,這是個秘密項目。我是說網站上線後人們就知道Taabao的存在了,但沒人知道它和阿里巴巴有關聯。主持人傑裡米:確實,當你想到它是如何將阿里巴巴如此成功的因素結合起來的時,你會發現這是非常了不起的,傑克是一個有遠見的人,他當時是你的首席技術官,有著更保守的心態,然後你組建了合資企業。然後是你們為實現這一目標所關注的焦點。你們在淘寶上取得了很大的成功。顯然,在兩年內,阿里巴巴奪回了市場。你們佔據了ebay 60%的市場份額,最終ebay關閉了中國業務。如今,阿里巴巴是世界上最成功、最重要的公司之一,地球上每六個人中就有一個人定期與阿里巴巴生態系統互動。Joseph Tsai(蔡崇信):我需要把它放在我們的投資者簡報中。主持人傑裡米:幫我核實一下資料。如果你想讓我加入,我很樂意參與。所以現在你處於不同的位置。你就像ebay曾經一樣,現在正面臨著嶄露頭角的挑戰者。是的,那麼你們是如何從現有職位上繼續創新的呢?Joseph Tsai(蔡崇信):嗯,我們並非總能做對。我們經歷過一些時期,當我們停止創新時,我們就為此付出了代價。嗯,作為一家大公司。你知道,從定義來說,我的意思是我們有12萬名員工。在這麼大的地方管理員工非常困難,每個人都有自己的角色,對吧?讓人們都去思考關於未來的新事物,創新是很困難的事。因為當你有一個成熟的企業時,你就必須制定商業計畫,你必須設定既定的目標。你有收入,需要達到預期。所有這些事情都會讓你分心,讓你失去創新思維。嗯,然後有人說,你知道為什麼你不成立一個名為創新部的部門,讓這些人創新?這也行不通,因為這些人往往會迷失方向,而且你也不會把最優秀的人才分配到這。你知道因為創新者的困境基本上意味著你的核心業務是最重要的,你會開發並分配最多的資源給它,因為它能帶來收入和利潤以及企業的商業價值。你該如何解決這個問題?你會怎麼處理?我認為這總是沒有完美的答案,但我認為你需要做的一件事是向人們灌輸某種主人翁意識。他們不僅僅是為老闆工作。每個人都應該為他們的客戶工作。你知道很多人都想讓他們的老闆高興。但我認為傑克會說的最重要的事情就是讓你的客戶高興。你如果你是企業的所有者,你就會關心客戶對吧,然後你就必須……如果你關心客戶,那你就會開始擔心了我的客戶正在使用,他們習慣這樣使用產品。但如果有人推出了不同的東西,就像我們這行的情況,一種不同的平台互動方式。你知道我們最初是從列表功能開始的,現在是搜尋功能,現在是短影片,類似不同的平台互動方式。你必須開始考慮這些事情,因為你的客戶不會永遠陪伴你,如果不創新。所以我認為擁有這種主人翁意識很重要,要擔憂顧客未來會需要什麼。你必須領先一步,就像史蒂夫·賈伯斯說的你只需要創造某個產品,然後告訴顧客這就是他們需要的。我認為這是你必須具備的思維方式。另一點是你必須快速做出決策,在我們的行業中,在一個高速發展的科技行業裡,你總是面臨著資訊不足的困境,無法讓你做出完美的決策。因此你必須能夠容忍資訊不全的情況,然後果斷做出決定並堅持執行。如果之後發現錯了,就迅速轉向不同的方向。因此保持這種靈活性也是創新的關鍵。主持人傑裡米:是的。這種敏捷性和主人翁意識顯然對阿里巴巴起到了作用。你們於2014年在美國上市,這是當時歷史上規模最大的首次公開募股。這標誌著阿里巴巴作為一家真正的全球性公司的到來,符合傑克最初的願景。這是一家全球性公司,現在可以接觸到全球投資者。為什麼這很重要?Joseph Tsai(蔡崇信):全球化為什麼重要?嗯,我認為公司擁有投資者,上市後他們就是你的利益相關方之一,當然你也知道,我開場時就說過,我們只做我們堅信的事,而且我們不會聽從投資者的意見,但如今作為一家大公司,我們擁有非常精明的投資者,他們會就行業動態給我們提供反饋。告訴我們競爭對手的動向,不僅是中國國內的競爭對手,還有全球範圍內的競爭對手,對吧。我們身處一個全球競爭的行業,特別是談到AI,雲端運算,你知道那是全球性業務,所以你能從全球投資者那裡獲得很好的視角。但當然在我們決定的時候,當阿里巴巴2014年進行IPO時,我們原本計畫在香港上市,但最終沒有這麼做,我們去了紐約。這其中有很多需要考慮的因素。我想告訴你,你知道,原本有些複雜的原因,我們分析了所有因素。但簡單的原因是紐約證券交易所你知道很有名,而且市場流動性很高。我認為今天大多數全球投資者仍然是美國人或者有美國血統,所以這對我們來說很自然某種程度上是進入了資本市場在美國。主持人傑裡米:ipo後,你辭去了首席財務官的職務,擔任副董事長。阿里巴巴經歷了你之前討論過的10年,這是10年挑戰中創新性較低的一段。2023年,你以董事長的身份回歸。你談到了快速決策。那麼,你能向我們介紹一下你作為主席回來時做出的快速決定嗎?Joseph Tsai(蔡崇信):第一,我不會說是我做的決定。我們作為一個新的管理團隊,包括我們的CEO。我們決定了要專注的方向。我們將專注於電子商務這一核心業務,我們將把重點放在人工智慧和雲上,我們要加大投入力度。但它屬於基於CPU的計算業務,我們決定AI將成為推動未來基於雲GPU的雲端運算業務需求的關鍵。我們選擇了這兩條賽道,我們要做到極致優秀的領域,我們將具備極強的競爭力,至於其他資產或業務對我們而言就沒那麼重要了。你必須明確什麼是重點,什麼不是。所以明確重點就是首要決策。第二個決策是關於賽道的選擇。我們要在這些領域做到極致,我們需要什麼樣的資源,不論是資金還是人力都要投入最優質的資源進去。第三個決策是關於其他事務。要麼出售要麼徹底退出或者通過某種方式管理,以免分散管理團隊的注意力。這非常重要,管理團隊精力有限。你一天只有24小時。你不會同時照看八家不同的企業。我們以前去找投資人時,會說阿里巴巴有六個不同的事業部。這個業務類股,那個業務類股,這太蠢了!但你知道,如果我是投資者,開始聽一個傢伙說話,然後他說我有六個生意,那麼他們會說,你到底要專注於什麼?你知道,完全沒有重點。所以,我們我們實際上精簡了很多。我們出售了一些不重要的資產或非戰略性資產。但也有一些業務處於灰色地帶。它們並非核心中的核心。然而,它們具有戰略價值。一個例子是我們的水果配送業務。這是一家名為餓了麼的企業。我們被競爭對手打得落花流水。我們當時只有大約20%的市場份額。我們的競爭對手佔了約70%的市場份額。每個投資者都在問,你們什麼時候退出外賣業務,直接放棄食品配送?我告訴人們,我們就是你們說的那個食品配送本身。我們可能並不想單純做外賣業務,但整個配送基礎設施將會對電子商務非常重要,因為它是即時商業配送基礎設施。如果你想買東西,你點餐,30分鐘內就能送到,甚至更快。但如果未來人們想買衣服,行李箱、手機任何東西,他們都希望30分鐘內送達。如果我賣掉那家公司,我就會失去快速配送的基礎設施。儘管這項業務本身並非我們的核心業務,但它具有戰略意義。所以我們不得不在灰色地帶做出抉擇,該如何處理這些業務?當時存在大量業務,其中許多灰色地帶業務的管理團隊都主動來找我們,聲稱自己具有戰略重要性,我們就像我和你一樣,然後我就覺得,我才不像你那樣。主持人傑裡米:我不想成為那種人!Joseph Tsai(蔡崇信):但之後你必須稍微直接一點,你必須說,對不起。我知道你工作很努力,做得很好,但你不會成為我們業務的核心。我們得想辦法,要麼為你找到一個合作夥伴,要麼承擔風險,要麼做一些不同的事情。主持人傑裡米:是的,在過去的幾年裡,對戰略的清晰和關注對你很有幫助。你和團隊。你提到了加倍投入雲端運算和人工智慧,所以我想談談人工智慧真的是世界上最大的兩個經濟體——美國和中國——之間競爭的最新舞台。你如何看待比賽的進行?Joseph Tsai(蔡崇信):我認為AI是公司之間的競賽,但AI不應該是國家之間的競賽。這是一種技術,這是電力。我把ai描述為,擁有AI如同擁有水和空氣。你能想像如果一個國家拒絕另一個國家獲取某種生命必需之物嗎?所以我不認為這是一場兩國之間的競賽。我認為人們可以在很多領域進行合作。並為世界帶來福祉。如今人工智慧在醫療領域已取得諸多成就。我們已經能夠通過AI可以檢測胰腺癌的早期階段。你知道的,很多這些積極效益應該讓每個人都能享受到。所以,我並不認同這種觀點。網友提問廢話比較多,筆者就精選了一條關於阿里職場的問題翻譯給大家!網友提問:我想問你一個關於阿里巴巴文化的問題。人們經常將阿里巴巴文化描述為具有很強的阿里味,阿里巴巴在中文中有自己的語言、制度和期望。這有助於提高性能。這也可能造成壓力和官僚主義。你如何看待在保持強大的企業文化和確保開放性、包容性之間的權衡,Joseph Tsai(蔡崇信):就像我說的,你必須喜歡和你一起工作的人。所以,如果我要定義阿里味的本質是什麼?那就是下班後你想和同事喝杯啤酒,或者甚至不是下班後,因為這也是工作的一部分,因為因為你正在與同事共度時光。嗯,我認為這很重要,就像那種文化氛圍。如何避免官僚主義?你必須明確界定那些重要那些不重要,並敢於告訴員工他們的部門並不重要。你必須要有勇氣直言不諱,我認為很多公司犯錯就是因為他們不想傷害員工。我是說用"包容性'這個詞,很抱歉,我們是在經營企業。我們無法讓每個人都參與進來。如果他們無法為你的目標做出貢獻,你就必須讓他們知道。https://singjupost.com/joe-tsai-co-founder-and-chairman-alibaba-find-your-people-transcript/TRANSCRIPT:JEREMY TEPPER: Joe, welcome to View from the Top.JOE TSAI: Thank you, Jeremy. Very happy to be here.JEREMY TEPPER: Well, it’s an honor to have you here. And as I was preparing for this interview and trying to wrap my head around just how massive and global Alibaba has become, what really struck me is how you have navigated across cultures throughout your career. East and west, law and business and sports and tech. So I actually want to start with your first cross-cultural major experience. You were born and raised in Taiwan and you moved to the US at age 13 to attend the Lawrenceville school in New Jersey. What was that like for you?Navigating a New CultureJOE TSAI: It was scary. My first, well, first before I went, I never went to seventh grade. I was in elementary school in Taiwan. And then my mother said, “Joe, I’m going to send you to school overseas, but you have to learn how to speak English.” And I didn’t know how to speak English, so I went to an English cram school for one year and skipped seventh grade. So I went into Lawrenceville in the eighth grade.During that cram school year, I basically memorized vocabulary, but I couldn’t put together a sentence in English. And that was sort of—so imagine you didn’t really know the language, you don’t know how to communicate, and then you’re in a completely new cultural environment. Just kind of just land, I mean literally like fresh off the boat, right. And landing in this very unique environment. Boarding school. It’s an all boys boarding school, so that has its own sort of pitfalls and you just have to fit in.I think I wanted to be one of the guys. I wanted to conform. I wanted to fit in. I look different, I dress different, I speak a different language. So it’s very important for me to feel like, get accepted by the rest of the guys. And then very quickly I went into sports. I got cut from the baseball team, unfortunately. Imagine a kid from Taiwan, Little League baseball. And I didn’t make the team, didn’t make the swimming team.But then I said, the hell with it. I’m going to try completely new things. I played football, American football, and then got into lacrosse because I couldn’t play baseball. It’s a spring sport, lacrosse, and baseball is spring sports. Couldn’t make the baseball team, so I went to play lacrosse.So the funny thing is, yesterday Jeremy and I, I think he was very worried, so he wanted to have like a prep session. We spent—so yesterday we spent an hour to prep for this talk. We talked nothing but sports.JEREMY TEPPER: Yeah, we both love sports. And I’m a huge Lakers fan. And obviously Joe is a big sports fan and a Nets fan and a Liberty fan.JOE TSAI: So we talked about that. Yeah, I won’t blame you for that. But anyway, the Lakers are doing better right now, so congratulations.JEREMY TEPPER: Thank you so much. Thank you.JOE TSAI: And then we found out that we were both football players in high school.JEREMY TEPPER: Yeah, undersized linebackers. Well, Joe, you found your footing. You kind of rebounded from those early sports challenges. You got into lacrosse. You went to Yale for undergrad and law school.JOE TSAI: Right.The Leap to AlibabaJEREMY TEPPER: You found yourself at a tax law firm and ultimately went into private equity. But just four years into Joe’s investing career, he came across a guy named Jack Ma, who was building a company alongside 17 other co-founders. It was an online marketplace. Zero revenue and a few thousand users very early. So what convinced you that was the time to make the leap?JOE TSAI: It was not only zero revenue, Jack didn’t even have a company. It wasn’t incorporated. And so Jack, all Jack had was a domain name and a fresh website. And I still remember the first time I went to see him. I climbed up the stairs of the second floor, second story apartment. There were a bunch of shoes outside. You take off your shoes, you go inside, and we talked for about an hour.And I thought Jack was fascinating. He had just charisma, that leadership quality. Jack used to be a teacher. And I think teachers make very good leaders because you have to communicate well. You also have to be able to identify good talent, good students, and develop them like what teachers do. So all those quality kind of came through. And that was what I was really, I found very appealing.I couldn’t understand the business plan because the Internet was new to everybody at the time. And he was talking about using the Internet to get all the companies in China that makes stuff and trade stuff to overseas and have foreign purchasers and buyers coming to the website to buy stuff from China. It’s a wholesale marketplace. So Alibaba’s first website was actually an English language because it was made for the rest of the world.So an hour into the conversation, I said, “Jack, let’s, you know, I need to have a bathroom break.” So I go into the bathroom and there were like 10 toothbrushes on the sink. So I realized people were just sleeping, living their sleeping bags all over the place.And they were—it was the early days of, you know, kind of the startup culture.JEREMY TEPPER: Yeah.JOE TSAI: And I decided, you know, I would say this to young people when you want to switch jobs or when you find a new job and you want to do something new. Find the people, the people that you want to partner with, the people that you want to follow, the mentors that you want to learn from. And to me, Jack is both a friend, a business partner, and also a mentor. He’s taught me a lot of things, and I felt like I could learn a lot from him.And also at the time, the Internet, if your business had a .com name in it, everybody thought that you were going to become a millionaire in six months. But for me, it was Jack. That personality, that leadership quality that actually came through from having been a teacher.Finding the Right Co-FoundersJEREMY TEPPER: Yeah, you clearly struck gold in that partnership with Jack. And a lot of our classmates here at Stanford are thinking about starting companies and looking for co-founders. So what’s the right formula? What should they be looking for in their co-founders?JOE TSAI: Well, first I think they should—it’s something that you can get along with, like, do you want to go out and have a beer with this person, you know, after work? I think that’s the first test.I think the next thing is complimentary, being complementary. So something that they’re good at, you’re not good at, and something you’re good at, they’re not good at. Having that complementary mentality, whatever that word is, being able to complement each other is really, really important so that the founders are not stepping on each other’s feet.Alibaba started with 18 founders, and I think we all complimented each other. Well, people brought different skill sets to things. And I think as you think about starting companies, it’s, you know, it’s not like you want to go out and find 18 people to found a company with, but I think only two or three founders sometimes is a problem because as you scale the business, your culture gets diluted and there’s no founder around to touch have touch points with employees.And having 18 founders, we had that advantage. You know, we were able to—each founder is able to touch more employees of the company, so I think that’s important. And then just people that you feel you want to spend 24/7 with and have a good time, because as a startup, you’re not going to go home very much or this work-life balance is not going to be something you should be focused on.JEREMY TEPPER: Yeah, I guess I should ask, did you have a toothbrush in the apartment as well?JOE TSAI: Yeah, I brought my toothbrush afterwards.JEREMY TEPPER: Oh, perfect.Bridging Cultural DividesJEREMY TEPPER: So I want to touch on this point of having this many co-founders, 18 in total. It’s very, very unique. And in joining them at Alibaba as CFO in 1999, you were really entering—JOE TSAI: By the way, I was for three months, and then Jack fired me because he said, “Joe, you have no clue how to do operations.” I was like, “All right, fine, I’ll be the CFO.”JEREMY TEPPER: Well, yet again, you rebounded from baseball to lacrosse, COO to CFO. Now, that group of co-founders had some connectivity to each other already, and you were kind of the new person coming in. You’re an American educated lawyer and investor. You’re from Taiwan. They were all Chinese mainlanders. How did you find a way to bridge that cultural—JOE TSAI: I think the first thing is—well, I’m usually more of a listener, and I approach the work just with humility. I’m there to learn. I didn’t know anything about the Internet. I had never worked with a company where it’s majority mainland Chinese in China, because all my prior work experience had been either in the United States or in Hong Kong.So for me, it wasn’t my place to come in and tell people what to do. So I listened a lot and just try to, again, that Lawrenceville experience, try to blend in, try to be one of the crowd, one of the person in the community. And I think that’s helped me a lot.I think you have to bring everything you do, you have to bring a sense of humility to the work, because there’s going to be people, you’re going to find your colleagues, your partners that are smarter than you are that can teach you a lot, and you need to approach your work with that kind of mindset.JEREMY TEPPER: Yeah. Going in and being a listener and being a humble one at that clearly served you well. Now, over time, Jack really became this larger than life figure, the face of the Chinese tech industry. And you were there for the entire journey, but largely behind the scenes. Why is that?JOE TSAI: Because he’s better at being in front on the stage.JEREMY TEPPER: I think you’re doing pretty great.JOE TSAI: He’s a better speaker. He’s a better inspirational leader. Right. I think it’s very, very important. I mean, I think I would like to think I’ve improved over the years in terms of communicating to people, but he’s a natural for him. Just getting on stage, have all the employees in the same room and just say, “Here’s our direction. This is why we’re doing it.” And he’s very persuasive. So he’s better at it.The Sand Hill Road ExperienceJEREMY TEPPER: Well, it’s another great example of finding somebody with a complementary skill set and working together toward the same mission. Now, your first step with Jack, as I understand it, was flying out here to Sand Hill Road, just a few minutes away to pitch investors and raise your seed round. How do you remember that trip?JOE TSAI: That didn’t go very well. I think we struck out. We had something like 15 meetings. We didn’t get a single investor interested in investing in our company. And that’s because I think at Stanford GSB you’re taught to show up with a PowerPoint or something, right? You have to show people something, a demo or something. We didn’t have anything. We came empty handed.And people are like, “Jack, what’s your business plan?” Jack says, “I don’t have a business plan.” He actually said, “I don’t have a business plan.” But the trends at the time in China was, I mean in hindsight you could have seen was the intersection of Internet technology and also China coming into the WTO, which meant trade between China and the rest of the world was going to explode.And today you go to China. China is a manufacturing powerhouse. Everything is made in China and they’re getting better and better, higher and higher quality, higher and higher tech technology. But the seeds were sown back then. That was just on the cusp of entering into the WTO and imagine getting all these manufacturers and trading companies bring all their products online for the rest of the world to see. That was the business idea.But Jack didn’t just talk about the business. He said, “My mission is to make it easy to do business anywhere.” That was our mission at the time. That’s what we told investors. And today that is still our mission. You can go on our website, Alibaba website says to make it easy to do business anywhere.JEREMY TEPPER: That’s incredible. So a mission first leader with no business plan. Did you guys come back from that trip, incorporate feedback from those investors?Lessons from Early FundraisingJOE TSAI: Not really, because the investors just looked very baffled. They didn’t give us a lot of feedback. They were kind of reticent. They were just, I think they just wanted to reject us outright. But that experience was important because we came back and we said we have to do what we believe in rather than have investors tell us what we should do. And I think that was a very important lesson.And then fortunately we were able to raise some capital. Some investors finally very skeptically bought in. I still remember our Series A round. We actually had Goldman Sachs come in. I mean you think, you know, you went to Sand Hill Road and you got Goldman Sachs. At the time, Goldman was investing like large private equity deals and then they had sort of a, you know, emerging technology investment business. And I happen to know, have a friend who is a partner who’s running that business.And then she calls me up and she said, “Joe, you know, I’ve got good news and bad news.” And at the time, you know, by then I was so, you know, disappointed with all the rejections. I was like I can’t stand any bad news. So tell me the good news first. And she said, “Well, we have our investment committee have approved the investment in Alibaba.” I was like that’s great. I was about to hang up. She said, “Wait, wait, you want to hear the bad news?” And I said, “Fine, what’s the bad news?” And she said, “Well, we also decided to back five other companies that’s very similar to your business model and we’re just going to see, let you guys compete.”JEREMY TEPPER: You guys did and you rose to the top. You guys raised the round from Goldman Sachs, then another round from Softbank and then it was really off to the races. Over the next 10 years you guys launched payments, messaging, a consumer to consumer marketplace, a business to consumer marketplace, advertising, and a cloud infrastructure offering which is now the fourth largest in the world and has 40% market share in China. So Alibaba became a super app.Now one of those major in-house wins was Taobao, Alibaba’s consumer to consumer marketplace. Can you take us back to the moment of launching Taobao against what was at the time a real monopoly from eBay China?The Secret Launch of TaobaoJOE TSAI: It was back in the early 2000s. eBay had acquired a company called EachNet. So immediately they had a large market share and at the highest point they had like 90% market share of consumer e-commerce. And we were the new player coming in.And so one day, well going back, I mean I think I was talking to the dean here and she mentioned someone, Jane Sun, who is the CEO of Ctrip, and her husband was the first CTO, John Wu, first CTO at Alibaba. He came from Yahoo. So sorry, this is a long-winded story.And when Jack decided to launch a consumer marketplace, Taobao, he was very excited. He had talked to Masa at Softbank and Masa was very supportive. And because it’s a big idea, Masa will support anything that’s big, anything that costs a lot of money he will support. And Jack’s very excited. He said, “I got the money from Masa, I’m going to do this.” And he goes to John Wu, our CTO, and John said, “No way in hell, over my dead body are we going to do this.”And that’s because John had worked on Yahoo Shopping and it was not successful. So he didn’t have a very positive view of us going into the consumer e-commerce space. But then obviously Jack overruled everybody and I was, I didn’t know strategically, I couldn’t make that judgment. But I decided that we were going to structure it so that financially we weren’t going to get totally hurt.So actually from day one, Taobao actually was a joint venture, 50/50 JV between Alibaba and SoftBank. And it wasn’t until like six, seven years later, when Yahoo invested in us, we took the opportunity to fold in the rest of Taobao into Alibaba to own 100%. And that was the big, the best decision we’ve ever made. Otherwise today, Taobao will still be half owned by SoftBank. Right? And we wouldn’t know where it would go.So, but when we started Taobao, it was a secret project. And if you guys know Alibaba a little bit, pretty much almost all the startup new businesses went through this apartment, the Jack original apartment, with the shoes and the toothbrushes. So we took away a team of seven people into this apartment. They all had to sign NDAs. They couldn’t tell their colleagues or spouses or anybody. So one day, you know, the person that you’re sitting next to, the cubicle next door, at the cubicle next door disappeared. And they, you know, people are like, where do they go?So the first seven people seeded the Taobao business. They went to the Jack, the Jack original apartment to, you know, do the work, create that marketplace. And then our first, when we launched it, the first items being sold on Taobao came from everybody’s closet. Everybody just went to their closet and said, “What do we have? What can we find to sell it on Taobao?” We seeded that marketplace with a lot of junk. That’s how this thing started.And I remember it was for almost a year, we kept it a secret project. I mean, the website was launched so people knew Taobao existed, but nobody knew it was connected to Alibaba.JEREMY TEPPER: It’s really quite remarkable when you think about how it combines what has made Alibaba so successful. The complementary skill sets between Jack the visionary, your CTO at the time, who had a more conservative mindset, and then you structuring the joint venture and then the focus that you guys applied to get this off the ground.You guys had a lot of success with Taobao. Obviously. Within two years, Alibaba took back the market, you guys took 60% market share. And eBay China ultimately closed down. Now today, Alibaba is one of the most successful and important companies in the world. One in six people on this planet interacts with Alibaba’s ecosystem regularly now. I think that’s right.JOE TSAI: I need to put that into our investor presentation.JEREMY TEPPER: Fact check me on that. Yeah. If you want me to join, I’m happy to hop in. So now you’re in a different position. You are the incumbent, like eBay once was, and you’re facing up and coming challengers.JOE TSAI: Yes.JEREMY TEPPER: So how do you guys continue to innovate from that incumbent position?The Challenge of Innovation at ScaleJOE TSAI: Well, we don’t always do it right. We’ve gone through periods where, when we stopped innovating and we suffer from it. As a large company, by definition, we have 120,000 employees. It’s very difficult to have people in such a large place. Everybody has their role. Right. It’s very difficult to get people to think about new things, about the future, innovate.Because when you have an established business, then you have to set business plan, you have to set established goals, you have revenue projection that you need to meet, and all those things get preoccupied and take you away from an innovative mindset. And then some people will say, “Well, why don’t you just set up a division called the innovation division to have those people innovate?” That doesn’t work either because those people tend to get lost. And also, you’re not going to allocate the best talent to that, you know, because the innovator’s dilemma basically, by definition means that what your core business is the most important thing and you’re going to allocate the most resources to it because it generates revenues and profits and value, enterprise value for the business.How do you address that? How do you deal with it? I think it’s always, there’s no perfect answer. But I think the one thing that you need to do is to instill in people some sense of ownership. They’re not just working for their boss. Everybody should work for their customers. And, you know, a lot of people want to make their boss happy. But I think the most important thing Jack would say is to make your customer happy. You are, if you’re the owner of the business, then you care about the customers, right?And then you have to, then if you care about the customers, then you start to worry, “All right, my customers are using, they’re used to using the product this way. But what if someone else comes in with something different?” Like you know, in our business, a different way to engage with the platform. You know, we started with a listing, then a search, now it’s short video. Like different ways of engaging with the platform. You have to start thinking about these things because your customer is not going to stay with you forever if you don’t innovate.So I think sense of ownership, worrying about what the customers will want in the future, and you have to be a step ahead. Almost like what Steve Jobs says, you need to just invent something and then tell the customers that’s what they need. I think that’s the mindset you need to have.The other thing is you have to make decisions very quick. And in our business, in a high growth technology business, you are always living with a deficiency of information that allows you to make the perfect decision. And so you have to be able to tolerate not having full information and then just making a decision and commit to it. And then if you find out you’re wrong, pivot fast in a different direction. So having that agility is also key to being innovative.Going Global: The 2014 IPOJEREMY TEPPER: Yeah, that agility, that sense of ownership has clearly worked for Alibaba. You guys went public in the US in 2014 in what was at the time the largest IPO in history. And it marked Alibaba’s arrival as a truly global company in line with Jack’s original vision. And this was a global company with access to now global investors. Why was that important, being global?JOE TSAI: Why is that important, access to global investors specifically?JEREMY TEPPER: Why is that important, access to global investors specifically?JOE TSAI: Well, I think having investors in your company and being a public company, they’re one of your constituencies. And you know, of course I started this talk by saying, you know, we do what we believe in, we don’t listen to investors. But now as a large company, we have very smart investors that give us feedback about the industry, about what our competitors are doing. Not just competitors in China, but competitors around the world. Right. We were in a globally competitive industry, especially talking about AI cloud. You know, that’s, you know, that’s a global business. So you get a very good perspective from global investors.But of course, at the time when we decided, when Alibaba went IPO in 2014, we were going to go list in Hong Kong, but we ended up not doing that. We went to New York. There were a lot of considerations that went into it. I would like to tell you there was some intricate reason and we analyze everything, but the simple reason was the New York Stock Exchange is, you know, well known, and there was a lot of market liquidity. Most global investors, I think still is today are American or have American roots. So it was natural for us to sort of tap into the capital markets in the United States.Returning as ChairmanJEREMY TEPPER: Well after the IPO you stepped down as CFO and stepped into the role of vice chairman. And Alibaba went through a 10 year period which you discussed earlier was on the less innovative side, a 10 year period of challenge. And you returned as chairman in 2023. You talked about quick decision making. So can you walk us through the quick decisions you made when you returned as chairman?Strategic Focus and Resource AllocationJOE TSAI: Number one, I wouldn’t say I made the decision. We collectively, as a new management team, including our CEO Eddie Wu, we decided what we were going to focus on. We were going to focus on our core business of e-commerce and we were going to focus on AI and cloud. We were doubling down. I mean we had a cloud business, but it’s a CPU-based compute business. We decided that AI is going to drive future need for cloud GPU-based cloud computing business.And so you pick those two lanes where we’re going to be extremely good at, we’re going to be extremely competitive and then the rest of the assets or businesses that we have are just less important. And you have to decide what’s important, what’s not. So deciding what’s important, first decision, the second decision is okay in the lanes that we want to be very good at, what kind of resources we want to allocate to, whether it’s capital or people, you want to put the best resources into it.The third decision is on the rest of the stuff. Let’s sell them or get rid of an exit or whatever. Somehow manage them in a way so that it’s not distracting to the management team. It’s very important. Management team has limited bandwidth. You only have 24 hours a day. You’re not going to be able to watch eight different businesses.I mean we used to go to investors and say Alibaba has six different divisions and this here, these segment and that segment, that’s stupid. You know, if I was an investor, start listening to a guy you know that says I have six businesses, then they’re going to say what are you going to really focus on? There’s no focus. So we actually streamlined a lot of that. We sold unimportant assets or non-strategic assets.But then there are some businesses that are in the gray area. They are not core core. However, they have strategic value. One example is our food delivery business. It’s a business called Element. We were getting killed by our competition. We had, you know, had like, only 20% market share, our competition, like 70% market share. And every investor is like, when are you going to exit this business? Just get out of food delivery.And I told people we are. You’re right. Food delivery itself, we may not want to be in the food delivery business per se, but the whole delivery infrastructure was going to be important for e-commerce because it’s an instant commerce delivery infrastructure. If you want to buy stuff, you order meals, they’ll come to you in 30 minutes or even shorter period of time. But what if in the future people want to buy clothing, luggage, their cell phones, whatever. They want it in 30 minutes.If I sold that business, I would have lost that quick delivery infrastructure. And so even though that business itself was not core to us, it has strategic importance. So we had to sort of decide in the gray area what to do with those. There were a lot of businesses where a lot of the management teams of those gray area businesses came to us and said, oh, we’re strategic and important. And we’re like, I’m like, you’re not.JEREMY TEPPER: I would hate to be one of those folks.JOE TSAI: But then you have to be a little bit direct. You have to say, I’m sorry, I know you’ve worked very hard, you’ve done a very good job, but you’re just not going to be core to our business. And we kind of have to find some way to either find a partner for you to take on the risk or do something different.The AI Race: Companies vs. CountriesJEREMY TEPPER: Yeah. That clarity and focus on the strategy has served you well over the last few years. You and the team you brought up doubling down on cloud computing and AI. So I want to talk about that. AI is really the newest arena for a race between the world’s two largest economies, the United States and China. How do you see the race playing out?JOE TSAI: I think AI is a race among companies. But AI shouldn’t be a race between countries. It’s a technology. It’s electricity. I described AI as having access to AI as having access to water and air. Can you imagine if a country denies another country something that’s essential to life?So I don’t see this race as a race between two countries. I think there is a lot of areas where people can cooperate and benefit the world. AI today has achieved a lot in the medical area. We’ve been able to have AI tools that could detect early stages of pancreatic cancer. And I mean, a lot of these positive benefits should be available to everybody.So I don’t subscribe to this view that there should be a race between two countries. I can understand that there’s a school of thought that says if the military gets a hold of AI, that whoever runs faster or develops AI faster for military use will have supremacy. But let’s just limit that to the military field and let AI capabilities proliferate around the world. And that’s the way to go, I think.JEREMY TEPPER: Yeah, I think most people today would agree that AI has this potential to be hugely transformative globally, but yet there are two very different strategies between Chinese companies and American companies. China, Chinese companies have access to very low cost of energy. They’re pursuing mass distribution open source, like Alibaba is. And American companies have a hardware semiconductor advantage. So maybe we don’t call it a race, but which approach do you think will win?JOE TSAI: We have to define what winning means. I think for me, winning means it gets proliferated. I hate the word diffusion. I wanted to say proliferation. But then people bring in kind of the analogy of nuclear weapons, whatever. So AI should be used by the most number of people and in whichever society where they have most people use AI and benefit from AI is going to be the winner.Building Qwen: Scaling AI Through ExperienceJEREMY TEPPER: Well, Alibaba has pursued that strategy. Qwen Alibaba’s model recently surpassed 700 million downloads globally. It’s the leading open source model in the world. How much of Qwen’s success, your success in building Qwen as a product comes from prior successes scaling other products like Taobao?JOE TSAI: A lot. If you think about these large scale Internet companies with hundreds of millions or even billions of users, the problems that we try to solve is the problem of scale, the problem of concurrent users coming in. So the problems of parallel computing. So having that experience really helped us in developing the right algorithms to, you know, ultimately that turned into AI.And our effort in, you know, the modern AI as we know it is based on the transformer architecture. So we had development efforts dating back to 2019. And remember, this is like three years before OpenAI publicly came out with ChatGPT. But we didn’t put enough resources into it. Right back then, people were still debating whether that’s the right technology path versus something different.But once back, you know, in 2022, when ChatGPT came out, I think everybody woke up and said, we need to double down, we need to put those investments in. But by then we would have, we had already, you know, years of three, at least three years of development, development in transformers, but also large scale computing.That’s all we had invested in our cloud infrastructure back 17 years ago. When we decided that our e-commerce business was getting so large in terms of users and also the data that we have to manage, we have to develop proprietary software to manage computing clusters. And basically my layman’s way of thinking about it is your software enables clusters of 50,000 computers, 100,000 computers, to work and think like one brain, even though they’re located in different data centers. Right.So that’s the technology that we develop, proprietary that formed the basis of our cloud computing business today. So we went into cloud computing out of necessity, not because it was a hot thing back 17 years ago. Nobody has heard about cloud computing. Nobody really thought it was a business. So, yeah. So basically we had a lot of good foundational work that’s done before sort of the current craze about the current version of AI.Sports Investments and Following Your PassionJEREMY TEPPER: Yeah. Well, it will be interesting to see how this competition plays out. I want to return to a lifelong passion of yours on this point of competition, sports. You acquired majority ownership of both the NBA’s Brooklyn Nets and the WNBA’s New York Liberty in 2019, and together they were recently valued at nearly double what you acquired them for. How did you know these were great investments and not just passion projects?JOE TSAI: I didn’t. I thought they were safe investments in the sense that the value was not going to go down. I think a few years ago I gave the analogy of if you live in New York City, you see a, you know, rooftop apartment, Park Avenue apartment, that’s. You buy into it, you’re not going to lose money because it’s in a good location. It’s a prize asset that everybody wants.So I thought the downside was going to be protected. But I did not anticipate how much value the valuation of these professional sports teams have increased over the last few years. There are two leagues in the United States, the NFL and the NBA, where there’s tremendous amount of value being created. And that’s because of the media rights, meaning broadcast rights, streamers and TV networks pay a lot for these media rights to be able to broadcast your games. And that’s supported the increase in valuation.JEREMY TEPPER: Yeah, you applied that investor mindset, assessing risk in becoming an investor in these two amazing franchises. Now, you turned a true passion sports into an investment strategy and business school. Advice on passion is somewhat mixed. Some say avoid turning it into a career, and others say you got to do what you love. Where do you stand?JOE TSAI: I can’t imagine if you woke up every morning, you went to work and you hated your job. That’s, you know, that’s not a recipe for success, but you don’t, you know, you could be passionate about a lot of things, but at least you have to be interested in what you do and you want to do it better. Whether you call it passion or something different or dedication or interest, you know, there’s gradations.You know, if one of you says, “I’m passionate about cooking” and then you go out and try to open up a restaurant, that’s great. But that’s probably not why you went to Stanford Business School for, you know. So my advice is find the people first. Find the people that you want to spend time with. And then obviously the mission of the company and the stuff that you do is something that you have an inherent interest in. Whether you call that passion or not. You should be passionate about your colleagues, about your co-workers. That’s what I call passion.Q&A: Capital Allocation and Business StructuringJEREMY TEPPER: Well, with that, Joe, I’d like to turn it over to a few of my classmates who have prepared questions for you. Hi Joe, thank you so much for coming over and speaking with us today. My name is Katherine. I’m a current MBA 2 student and before GSB I actually spent 3 years working at JP Morgan Hong Kong as a coverage banker for Alibaba Group, working across many business units and then ecosystem players such as Alicloud, Huma, Alipicture, Ali Health, et cetera.What really amazed me is Alibaba’s capability of pioneering very sophisticated business structuring and capital allocation. Looking back, what are some decisions that you’ve made or the group have made are misunderstood by the market, but it’s really critical for the growth of the company?JOE TSAI: Well, I would like to think we’re very sophisticated in technology, in products, this and this. You know, I mean I think we do a pretty decent job in terms of managing the capital markets and, and I guess so-called financial engineering. I’m sorry, your question is what is…JEREMY TEPPER: Yeah, what are some decisions on business structuring and capital allocation that are potentially misunderstood by the market yet to be very critical for Alibaba’s growth today?The AI Investment ChallengeJOE TSAI: Yeah, yeah, look, I think today everybody is worried about the amount of capital that’s being allocated to AI. Different at the different layers. Right. In our company, AI means a full stack of things. You know, how much money we put into developing our LLM, how much CapEx we make into our cloud infrastructure. So there’s, and also we have, in order to sort of test how good your AI is, you have a consumer application. Right.So we now have the Chengwen app which is our consumer app. So how much money do you allocate to promoting marketing, to promote the consumer application? So along the full stack you have to allocate capital. And I think every company that’s serious about AI is doing all these things and perhaps that’s the part that investors are trying to figure out whether you’re allocating correctly to different parts of the stack.I don’t think there is the right, I don’t even have the right answer for you, but I do think that these three things that I’ve mentioned, a consumer AI application, the large language model that’s backing up, that’s supporting the application, and also the infrastructure that’s supporting everything, those are equally important. And you kind of have to anticipate that. You just have to believe that there’s going to be demand like infrastructure, you know, the infrastructure investments.You have to be very forward looking, securing data center capacity, securing the energy, buying the equipment. There is a lead time to it. But I think that your judgment of whether there’s going to be demand should be based on what ultimately the users, the enterprises that are going to need a demand as opposed to some philosophical pursuit of AGI. There is a lot of philosophical pursuit of AGI right now that’s driving the demand. But then at the end of the day, you need to kind of look at what the market can bear.Maintaining Alibaba’s CultureJEREMY TEPPER: Hi Joe, my name is Hong, I’m MBA1 currently at GSB. I was also a coverage banker at Credit Suisse in Hong Kong. And I wanted to ask you a question on Alibaba’s culture. People often describe Alibaba’s culture as having a very strong Ali flavor, AKA Alibur in Chinese, with its own language systems and expectations. While this has helped drive performance, it can potentially also create pressure and bureaucracy. How do you think about the trade off between maintaining a strong corporate culture and ensuring openness, inclusiveness and innovation as Alibaba continues to mature in the future?JOE TSAI: Like I said, you have to like the people you work with. So I think if I were to define what is the essence of Ali, it is, you want to have a beer with your coworker after work or it’s not even after work because it’s also part of work because you’re spending time with your coworkers and I think that’s important.And you know, the culture. How do you avoid bureaucracy? Right. Well, you have to define what’s important, what is not, and be able to tell people that their division is not important. You have to have the guts to tell them. I think a lot of companies make mistakes because they don’t want to hurt the people. I mean use the word inclusive. I’m sorry, we’re running a business. We can’t include everybody in the enterprise. If they’re not going to be contributing to where you want to go, you have to let them know.The Most Challenging Step in AI TransformationJEREMY TEPPER: Thanks Joe for all the great sharing. So I’m Musea, second year MBA. Sadly I’m now coverage banker for Alibaba, but I actually work as a product manager in China and also build partnership with Alibaba cloud and broader ecosystem. So I was wondering since Alibaba’s ecosystem and also full stack AI strategy as you mentioned, really fascinated me. So from your perspective, what has been the most challenging and most difficult step to made but is really crucial for the company in terms of AI transformation?JOE TSAI: I think what is difficult is every part of the stack that I mentioned that we have to invest in costs a lot of money and then you invariably people ask, what’s the ROI? But like I said, you have to have a certain belief that it is strategically important and you’re not going to focus today on ROI.And the other thing is it’s not like we came to this with a well designed grand plan that these are layers of the AI stack that we have to. They all come sort of in different moments and if they didn’t have their own individual success at their layer, then they wouldn’t have gotten attention. Right. So it was a very bottoms up process. Then when you look back in hindsight, you think, well that’s kind of haphazard because there was no grand design to begin with.What if your LLM development was unsuccessful? Then you would not have put any more resources into it. And it turns out that having a really good large language model, a large foundational model is really, really important in the AI race. I’m not talking about race between countries, I’m talking about race among companies. So those are some of the difficulties and in a way there’s a little bit of luck involved. But then at the end of the day I go back to the people you have to work, you know, identify the right people to work on these projects.Rapid Fire RoundJEREMY TEPPER: Thank you, Joe. And thank you to my classmates for those thoughtful questions. Joe, before we wrap up, we’re going to do a View from the Top tradition, the Rapid Fire segment. Are you ready?JOE TSAI: Yeah.JEREMY TEPPER: All right, let’s do it. City that feels most like home to you.JOE TSAI: Taipei. That’s where I was born.JEREMY TEPPER: Favorite sports arena food.JOE TSAI: Barclays center for sure.JEREMY TEPPER: Ok, but what item at Barkley Center?JOE TSAI: I can know for some reason. I’m thinking of the Vietnamese Banh Mi pork sandwich.JEREMY TEPPER: All right. Yeah, I’m a hot dog guy, but yeah, that’s great, too. Best purchase you’ve ever made through Taobao.JOE TSAI: Oh, a pair of gym shorts. Under Armour. Nice. I think I bought them 10 years ago. I’m still wearing them when I exercise.JEREMY TEPPER: It’s a great endorsement for Under Armour, the app on your phone that you use most.JOE TSAI: I have two apps that use a lot most. One is a Quinn app because that’s now it’s an assistant for me when I do research, you know, whatever. I want to know something, I go to the Quinn app. The other one is Twitter. I get all my news. If I want to know what’s going on in the world, I can get it instantaneously from serving. I mean, now the algorithm is so good, so they know what I’m looking for. It’s basically subjects on AI and sports. Those are the two things.JEREMY TEPPER: Well, last rapid fire question on sports. Would you rather win an NBA title with the Brooklyn Nets or become a professional lacrosse player?JOE TSAI: Oh, that’s a tough one. Both have low probability, but I’ll take the NBA title.JEREMY TEPPER: All right.JOE TSAI: NBA title it is.Final Advice: Win Locally FirstJEREMY TEPPER: And to close one final question, and this one isn’t rapid fire. What’s your best piece of advice for those in the crowd today hoping to build a global company?JOE TSAI: I don’t think you should think about global. Building a global company from day one, because you have to win local. It’s if you have a grand plan. I mean, the world is a large place. To build a global company, you have to have a lot of infrastructure that starts with small pieces. So you have to win. Have small wins. So think about small wins and win locally where you start. You have to win the market where you started.And then you can think about going overseas, going global, because with those winning local battles, you’re training your team, you’re developing talent that enables you to be a global player. So you got to start somewhere.JEREMY TEPPER: Ladies and gentlemen, Joe Tsai. Thanks, Joe.JOE TSAI: Thank you. (瑞恩資本RyanbenCapital)