#訪談實錄
Gemini 面臨的最大風險|DeepMind 首席技術官最新訪談實錄
11月25日,Google DeepMind 首席技術官兼 Google 首席 AI 架構師 Koray Kavukcuoglu 接受了Google for Developers的訪談。本次對話探討了 Scaling Law的現狀、基準測試的本質、Gemini 關注的重點領域,強調指令遵循、工具呼叫和國際化,以及多模態模型最終走向“單一權重”的演進路徑等話題。Koray Kavukcuoglu 堅信,AI 進步的步伐並未放緩,Scaling 仍在持續。他指出,基準測試不等於進步,它只是定義“未解決問題”的臨時工具。當模型分數接近頂峰,舊基準便失效,真正的進步標準必須從“刷榜”轉向模型在現實世界中被科學家、律師、工程師等專業人士使用的廣度與深度。在技術路徑上,Koray 強調程式碼與工具呼叫是智能的全新“倍增器”。模型不僅是工具的使用者,更是工具的製造者。他認為,直接從軟體工程師等終端使用者處獲取的反饋訊號,對模型後訓練階段的質量提升具有決定性意義,這種“與產品整合並獲取訊號”的模式已成為理解問題的核心驅動力。Koray 預測,圖像生成與文字生成最終將統一於“單一模型權重”之下,儘管目前仍面臨像素級完美與概念連貫性的雙重挑戰,但這將是必然趨勢。此外,他透露Gemini 面臨的最大風險並非外界擔憂的安全問題,而是“創新枯竭”——即誤以為只要照搬成功公式進行擴展即可,他認為唯有持續在架構和理念上進行創新,才是通往 AGI 的唯一路徑。01 基準測試的侷限與 Scaling LawGemini 3 已經上線,反響積極。回看從 2.5 到 3.0 的處理程序,感覺進步的步伐並未放緩。目前業界對 Scaling有諸多討論,你認為這種趨勢還能持續嗎?此外,有些基準測試如 HLE、ARC-AGI-2 分數飆升,而像 GPQA Diamond 這樣的靜態基準測試依然屹立不倒。你是如何看待這些基準測試的演變以及它們與實際進步之間的關係的?Koray Kavukcuoglu:我對這些進步感到非常興奮,尤其是研究方面的進展。身處研究一線時,你會發現各個領域都充滿了令人興奮的事物,從資料、預訓練、後訓練到方方面面。我們看到了很多熱情、進步和新想法。歸根結底,這一切都源於創新和想法。我們做出的東西越有影響力,越能進入現實世界被人們使用,我們實際上就會獲得更多的靈感,因為你的接觸面擴大了,獲得的訊號種類也增加了。我認為問題會變得更難、更多樣化,隨之而來的挑戰也會升級,但這種挑戰是好事。這也是我們建構智能的動力。有時如果你只看一兩個基準測試,可能會覺得分數提升的空間變小了,但我認為這很正常。基準測試是在某個任務還具有挑戰性時定義的。隨著技術進步,舊的基準測試就不再能代表最前沿的水平了。於是你會定義新的基準測試。這在機器學習中非常正常。基準測試和模型開發總是相輔相成的。你需要基準測試來指導模型開發,但只有當你接近現有目標時,你才知道下一個前沿在那裡,從而定義新的基準。(關於 GPQA 等難題)那裡面確實有一些很難的問題。那些我們仍然無法解決的難題,依然在測試著某種能力。但如果你看看我們在 GPQA 上的表現,我們並不是停留在二三十分需要追趕到九十分,而是已經接近頂峰,所以它所定義的“未解決問題”正在減少。在某種程度上,尋找新的前沿和基準是件好事。定義基準測試真的很重要。如果我們把基準測試等同於進步,那並不一定總是一致的。進步是進步,基準是基準。理想情況下它們是百分百一致的,但現實從來不是這樣。對我來說,衡量進步最重要的標準是我們的模型被現實世界中的科學家、學生、律師、工程師所使用。人們用它做各種事情,比如創意寫作、發郵件。從簡單到困難的光譜,以及不同的主題和領域都很重要。如果你能持續在這些方面提供更大的價值,我認為那就是進步。基準測試只是幫助你量化這一點。02 程式碼與工具呼叫是智能的倍增器,模型本身正在變成一種可建構工具的工具你是如何考慮從一個模型版本到下一個版本的持續最佳化的?比如在指令遵循、國際化語言支援以及程式碼和工具呼叫方面,我們的最佳化目標是什麼?此外,作為 Gemini 3 發佈的一部分,我們推出了 Google Anti-Gravity 作為一個新的 Agentic 編碼平台。為了從模型角度提升質量,你有多看重這種“產品腳手架”(Product Scaffolding)在獲取反饋訊號方面的作用?Koray Kavukcuoglu:有幾個重要的領域。其中之一是指令遵循。這要求模型能夠理解使用者的請求並嚴格執行。你不希望模型只是回答它覺得自己該回答的內容。指令遵循能力非常重要,這也是我們一直在做的。對我們來說,國際化也很重要。Google 是一家非常國際化的公司,我們希望觸達全球使用者,所以這部分很關鍵。你必須持續關注這些領域。它們看起來可能不像知識的前沿,但因為要在那裡與使用者互動,所以非常重要。正如我所說,這一切都是為了從使用者那裡獲得訊號。(關於程式碼與工具呼叫)接下來,如果你進入稍微技術一點的領域,函數呼叫、工具呼叫、Agentic 行為和程式碼真的很重要。函數呼叫和工具呼叫之所以重要,是因為我認為這是智能的一個全新倍增器,不僅模型可以自然地使用我們建立的所有工具和函數進行推理,而且模型還可以編寫自己的工具。你可以認為模型本身也是一種工具。這是一件大事。顯然程式碼很重要,不僅因為我們是軟體工程師,還因為有了程式碼,你實際上可以建構任何在你筆記型電腦上運行的東西。而在筆記型電腦上發生的不只是軟體工程。我們現在做的很多事情都發生在數字世界中,而程式碼是這一切的基礎,它能與你生活中幾乎所有事情整合。這就是為什麼這兩者結合在一起能極大地擴展使用者的能力。我喜歡舉 Vibe coding 這個例子。很多人很有創造力,有很多想法,突然之間你讓他們變得高產了。從有創意到有產出,你只需要把它寫下來,應用程式就會在你面前呈現。大多數時候它都管用,而當它管用時感覺棒極了。這種反饋循環很棒。突然之間,你讓更多人成為了建設者。能夠建構東西的感覺是很棒的。(關於產品腳手架的作用)對我來說這非常重要。Anti-Gravity 本身是一個令人興奮的產品,但從模型的角度看它具有雙重價值。首先從模型端來看,能夠與終端使用者,在這裡是軟體工程師整合,並直接向他們學習,瞭解模型那裡需要改進,這對我們來說至關重要。Gemini App 也是出於同樣的原因,直接理解使用者非常重要。Anti-Gravity 和 AI Studio 也是如此。擁有這些我們緊密合作的產品,然後理解、學習並獲取使用者訊號,作用是巨大的。Anti-Gravity 一直是非常關鍵的發佈合作夥伴。雖然他們加入不久,但在發佈的最後兩三周,他們的反饋真的起到了決定性作用。Search AI Overviews 搜尋 AI 概覽也是一樣,我們從中獲得了很多反饋。對我來說,與產品的整合並獲取訊號是我們理解問題的主要驅動力。當然我們有基準測試,所以我們知道如何推動 STEM、科學、數學這些硬核智能的發展。但理解現實世界的用例真的很重要,因為技術必須在現實世界中有用。03 通過產品連接使用者是建構智能的路徑作為新任首席 AI 架構師,你的職責擴展到了確保 Google 的產品能真正利用這些模型,Gemini 3 發佈首日就覆蓋了所有產品介面。相比一年半前單純的研發,這種“既要模型好,又要產品用好”的雙重目標增加了多少複雜性?此外,我們在某種意義上正在與客戶共同建構 AGI,在這種開放模式下,你是如何考量安全與穩健性的?Koray Kavukcuoglu:確實增加了複雜性,但我們在建構智能。很多人問我身兼雙職的問題。我有兩個頭銜,但這在很大程度上是同一件事。如果我們要建構智能,就必須通過產品、通過連接使用者來實現。作為架構師,我試圖做的是確保 Google 的產品能獲得最好的技術支援。我們不是要親自“做”產品,我們不是產品經理,我們是技術開發者。我們開發技術,訓練模型。當然每個人都有自己的觀點,但對我來說,最重要的是以最佳方式提供模型和技術,然後與產品團隊合作,讓他們在這個 AI 世界中建構最好的產品。這是一個新世界。新技術正在定義使用者的期望、產品的表現形式、資訊的傳遞方式,以及你可以用它做的所有新鮮事。對我來說,這就是要在整個 Google 範圍內實現這一點,與所有產品團隊合作。這令人興奮,不僅從使用者獲得的產品角度,也從我之前提到的角度,那是我們的主要驅動力。感知使用者需求、獲取使用者訊號對我們來說至關重要。這就是我想做這件事的原因。這是我們建構 AGI 的路徑。這也是我們建構智能的路徑,通過產品。(關於安全與穩健性)而且我認為這實際上也是一個非常值得信賴、久經考驗的系統。這是一種我們正在越來越多採用的工程思維。在這個問題上保持工程思維很重要。當東西經過精心設計,你知道它是穩健的、安全的。所以我們在現實世界中做事,採用的是所有經過驗證的建構理念。這也反映在我們如何考量安全和安保。我們試圖從底層、從一開始就考慮這些,而不是事後諸葛亮。所以在做後訓練模型、預訓練和處理資料時,我們始終銘記在心。每個人都要思考這個問題。我們有安全團隊嗎?顯然有,他們帶來了相關技術。安保團隊也一樣。但關鍵是讓參與 Gemini 的每個人都深入參與這個開發過程,並將其作為第一原則。這些團隊本身也是我們後訓練團隊的一部分。當我們開發這些模型、進行迭代和發佈候選版本時,就像我們關注 GPQA、HLE 這些基準測試一樣,我們也關注安全和安保指標。我認為這種工程思維很重要。04 程式碼與智能體仍需突破最後的體驗瓶頸Gemini 3 的發佈就像 NASA 的阿波羅計畫,雖然參與者眾多,但這確實是 Google 全球團隊的共同努力。你如何評價這種跨國協作?同時,雖然模型在許多基準測試上都是 SOTA,反響也很積極,但如果快進到下一次發佈,還有什麼事是你希望列在“真希望我們做了 X、Y、Z”的清單上的?在享受當下的同時,你看到了那些具體的差距?Koray Kavukcuoglu:關於 Gemini 3,我們也剛反思過。對我來說,重要的一點是這個模型是一個真正的 Team Google 模型。每個 Gemini 版本的發佈都需要來自美洲、歐洲、亞洲等世界各地的人員參與。我們有遍佈全球的團隊在做貢獻。不只是 Google DeepMind 團隊,而是 Google 的所有團隊。這是一個巨大的協作成果。我們與 AI Mode 同步發佈,與 Gemini App 同步發佈。這些都不容易。他們在開發過程中與我們並肩作戰。只有這樣,在模型準備好的第一天,我們才能一起發佈。我們一直在這樣做。當我們說“跨越 Google”時,不僅僅是指那些積極建構模型的人,所有的產品團隊也在貢獻力量。(關於未來的差距)我認為應該兼顧。我們要享受這一刻,那怕只享受一天也是好的。這是發佈日,人們在讚賞這個模型,所以我希望團隊也能享受這一刻。但與此同時,在每一個領域,我們也看到了差距。寫作完美嗎?不完美。編碼完美嗎?也不完美。特別是在 Agentic 行為和編碼領域,我認為還有很大的提升空間。那是增長最令人興奮的領域之一。我們需要識別那裡可以做得更多,並且我們會去做。我認為我們已經走了很遠。可以說,對於那些從事編碼的人,無論是軟體工程師還是想建構東西的創意人士,這個模型基本上滿足了他們 90% 到 95% 的需求。我願意認為這個模型是他們能用的最好的工具。但在某些情況下,我們可能還需要做得更好。關於程式碼和工具使用,回顧 Gemini 的發展歷程,顯然我們在 1.0 版本時非常側重於多模態能力,而在 2.0 版本中,我們才開始建構一些智能體基礎設施。你覺得為什麼我們沒有從一開始就在智能體工具使用方面處於業內領先地位?畢竟在多模態領域,Gemini 1 從一開始就是業內領先的。Koray Kavukcuoglu:我不認為這是刻意為之。坦率地說,回過頭看,我認為這與模型的使用方式有關,也就是開發環境與現實世界的聯絡緊密程度。我們與現實世界的聯絡越緊密,就越能理解實際發生的真實需求。在 Gemini 的研發征程中,我們的起點是 Google 深厚的 AI 研究底蘊。我們擁有大量傑出的研究人員和輝煌的 AI 研究歷史。但 Gemini 的研發也是一個從研究環境向工程思維轉變的過程,讓我們進入了一個真正與產品緊密相連的領域。看著現在的團隊,我感到非常自豪,因為這個團隊的大多數成員,包括我自己,在四五年前還在寫論文。那時我們在做 AI 研究。而現在,我們站在技術的最前沿,通過與產品使用者的互動來開發技術。這是一種完全不同的思維模式。以前我們可能很久才出一個成果,現在我們每六個月建構一次大模型,然後每一到一個半月就進行一次更新。這是一個驚人的轉變,而我們成功跨越了這一轉變。05 圖像與文字架構正在趨同,最終將融合為單一模型的“物理理解力”隨著 Veo 3、Nano Banana 模型的出現,我們在產品化方面取得了巨大成功。在追求 AGI 的過程中,你是如何看待生成式媒體模型的定位?它們是否也是理解物理世界和萬物運行規律的關鍵部分?Koray Kavukcuoglu:如果你回到 10 到 15 年前,生成式模型主要集中在圖像上,因為我們可以更直觀地檢查結果。此外,這種理解世界、理解物理規律的想法正是開發圖像生成模型的主要驅動力。我們在生成式模型方面做過的一些令人興奮的工作可以追溯到 10 年前,比如 WaveNet。20 年前,我們還在做圖像模型。我在讀博士時,那時大家都在做生成式圖像模型。我們經歷過那個階段。我們當時有叫 PixelCNNs 的圖像生成模型。某種程度上,當時大家意識到文字領域能取得更快的進展。但我認為圖像模型的回歸是非常自然的。在 Google DeepMind,我們在很長一段時間裡都擁有非常強大的圖像、視訊和音訊模型。將這些能力結合起來是順理成章的。我們現在的方向正是我們一直強調的多模態,而且是輸入輸出層面的多模態。這就是我們的方向。隨著技術的進步,這兩個不同領域之間的架構和理念正在相互融合。過去這些架構截然不同,但現在它們正在高度趨同。所以並不是我們在強行整合什麼,而是技術在自然地融合。隨著這種融合,大家都明白了從那裡可以獲得更高的效率,理念在何處演進,我們看到了一條共同的路徑。這條共同路徑結合得非常好。Nano Banana 是最初的那些時刻之一,你可以對圖像進行迭代,可以與模型對話。文字模型通過文字擁有了大量的世界認知,而圖像模型則從另一個角度理解世界。當你將這兩者結合時,會產生令人興奮的化學反應,因為人們會感覺到這個模型理解了他們想要表達的神韻。我們談談 Nano Banana Pro,這是在 Gemini 3 Pro 之上建構的全新業內領先圖像生成模型。團隊是否看到了在 Pro 級模型中做這件事的早期訊號,即利用 Pro 的架構可能會在文字渲染和世界理解等更細微的用例上獲得更強的性能?Koray Kavukcuoglu:我認為這可能是我們看到不同技術協同發揮作用的地方。對於 Gemini 模型,我們一直秉持的理念是,每個模型版本都是一個模型家族。我們有 Pro、Flash、Flash-Lite 這一系列模型。因為在不同的尺寸下,你在速度、精準性、成本等方面會有不同的權衡。隨著技術融合,我們在圖像方面自然也有同樣的體驗。所以我認為團隊的想法是,既然有 3.0 Pro 的架構,我們是否可以利用在第一版中學到的所有經驗,通過增加尺寸來調整這個模型,使其更側重於圖像生成?我認為最終我們得到了能力更強的東西。它能理解非常複雜的文件。一些最令人興奮的用例是,你有一大堆非常複雜的文件,輸入進去,我們依靠這些模型來回答問題,你還可以要求它生成一張相關的資訊圖表,效果非常好。這就是自然的輸入輸出多模態發揮作用的地方,這感覺就像魔法一樣。(關於統一權重)Tulsee 曾承諾我們將擁有統一的 Gemini 模型權重。現在的進展表明我們實際上已經非常接近那個目標了,即在圖像生成和文字生成上實現統一,儘管歷史上架構是不同的。這是否是一個確定的目標?目前有那些因素在阻礙這一處理程序?Koray Kavukcuoglu:正如我所說,技術和架構正在對齊,所以我們看到這正在發生。人們在定期進行嘗試。但這只是一個假設,你不能基於意識形態來做這件事。科學方法就是科學方法。我們提出假設,進行嘗試,然後看結果。有時成功,有時失敗。但這就是我們必須經歷的過程。目標越來越近了。我很確定在不久的將來,我們會看到這些東西結合在一起。逐漸地,它將越來越趨向於單一模態。但這需要大量的創新。仔細想想,這其實很難。輸出空間對模型來說至關重要,因為那是學習訊號的來源。目前,我們的學習訊號主要來自程式碼和文字。這是輸出空間的主要驅動力,也是我們在這些方面表現出色的原因。現在,要能夠生成圖像,我們在影像品質上的調整已經非常精細。這是一件很難的事情。生成像素級完美的質量很難。而且圖像在概念上必須是連貫的,每個像素不僅關乎質量,還關乎它如何與圖片的整體概念相融合。訓練一個能同時做好這兩件事的模型更難。我看待這個問題的方式是,我認為這絕對是可能的。這終將實現。關鍵在於找到正確的模型創新來達成它。06 DeepMind 利用 DeepThink 等項目在主線外探索新邊界DeepMind 現在擁有許多業內領先的模型。13 年前你是 DeepMind 的第一位元深度學習研究員,當時人們對這項技術並不興奮,而現在它驅動著所有核心產品。當你反思這段旅程時,你想到了什麼?Koray Kavukcuoglu:這令人驚訝嗎?這是充滿希望的、積極的結果。當我在讀博士時,我想每個讀博士的人都一樣,你相信你所做的東西很重要,或者將會變得重要。你對那個課題充滿熱情,你認為它會產生巨大的影響。我當時也是這種心態。這就是為什麼當 Demis 和 Shane 聯絡我,我們交談後,我對 DeepMind 感到非常興奮。得知有一個地方真正專注於建構智能,並且將深度學習作為核心,我非常激動。在那個年代,擁有一家專注於深度學習、專注於 AI 的初創公司是很不尋常的。我認為那是非常有遠見的。後來我組建了深度學習團隊,團隊不斷壯大。我認為其中一件事,我對深度學習的方法一直是一種關於如何處理問題的心態。第一原則是它總是基於學習的。這就是 DeepMind 的核心,一切都押注在學習上。從我們早期的工作開始,到強化學習和智能體,以及我們要一路走來所做的一切,這是一段令人興奮的旅程。你投身這些事業,總是希望有一個積極的結果。但反思過去,我想說我們很幸運。我們很幸運生活在這個時代,因為我認為很多人投身 AI 或他們熱衷的領域,都認為那是屬於他們的時代,是技術將會成功的時候。但它確實正在當下發生。我們也必須意識到,AI 之所以能在當下爆發,不僅僅是因為機器學習和深度學習的進步,還因為硬體的進化達到了某種狀態,網際網路和資料積累達到了某種狀態。是許多因素因緣際會。我很幸運能實際從事 AI 工作並一路走到這一刻。(關於里程碑對比)回顧 AlphaFold 等歷史里程碑,與現在相比,我們在組織團隊、將科學轉化為結果的經驗上有何不同?DeepThink 作為一個在奧林匹克數學競賽中實戰的模型,在其中扮演了什麼角色?Koray Kavukcuoglu:我認為在如何組織團隊,或者什麼是成功的文化特質,以及如何將艱難的科學和技術問題轉化為成功的結果方面,我們在過去的許多項目中積累了大量經驗,從 DQN、AlphaGo、AlphaZero 到 AlphaFold。所有這些項目都極具影響力。通過它們,我們學到了很多關於如何圍繞一個特定目標、一個特定使命進行組織,以及如何作為一個較大的團隊進行協作。我記得在 DeepMind 早期,我們會有一個 25 人的團隊一起做一個項目,並且 25 個人一起署名寫論文。每個人都會對我們說,肯定沒有 25 個人真的都在做這個吧。我會說,不,他們確實都做了。因為在科學和研究領域,這種規模並不常見。我認為那種知識、那種心態是關鍵。我們通過這些經歷完成了進化。這真的很重要。同時,對於最近這兩三年,我們將這種經驗與工程思維相結合,即我們要開發一條模型主線,並且我們學會了如何利用現有模型在這條主線上進行探索。我看到這一點的絕佳例子,每次想到這個我都感到很高興,是我們的 DeepThink 模型。那些是我們用來參加國際數學奧林匹克競賽、ICPC 競賽的模型。我認為那是一個非常酷且恰當的例子,因為我們在進行探索。你挑選這些宏大的目標。國際數學奧林匹克競賽真的很重要,它涉及真正極難的問題。向每一位參賽的學生致敬,這真的是了不起的事情。能夠把一個模型放到那個賽場上,當然,你會有一種衝動去為此專門定製一些東西。但我們試圖做的是利用那個機會來進化我們現有的技術,或者構想出與我們現有模型相容的新想法。因為我們相信我們所擁有技術的通用性。回顧當年那篇論文只有 25 位作者,而今天 Gemini 3 的貢獻者名單可能有 2500 人。看到這些問題現在的規模如此之大,這種從科學小團隊向大規模工程協同的轉變帶來了那些思考?Koray Kavukcuoglu:確實如此。這對我們很重要,這也是 Google 最棒的地方之一:這裡有太多各自領域的頂尖專家。我們受益於 Google 擁有的全端方法,因為在每一層都有專家,從資料中心到晶片再到網路,以及如何大規模運行這些系統。目前已經發展到一種狀態,再次回到這種工程思維,即這些環節是密不可分的。當我們設計一個模型時,是基於它將運行在什麼硬體上來設計的。同樣,我們在設計下一代硬體時,也知道模型大概會往那個方向發展。這非常美妙。但是協調這一切,當然需要成千上萬的人協同工作並做出貢獻。我們需要認識到這一點,這本身就是一件美妙的事情。07 Gemini 最大的風險是創新枯竭在這個時代,你如何看待 DeepMind 在“純粹的科學探索”與“僅僅試圖擴大 Gemini 規模”之間的平衡?要繼續擴大規模顯然需要創新,你如何看待這種決策?Koray Kavukcuoglu:那是關鍵所在,找到這種平衡真的非常重要。即使是現在,當人們問我“Gemini 最大的風險是什麼”時,我思考過很多,我認為 Gemini 最大的風險是創新枯竭。因為我真的不相信我們已經找到了“成功秘籍”,接下來只需要照章執行就行了。我不相信這一套。如果我們的目標是建構智能,我們要通過產品與使用者一起實現這一目標,那麼擺在面前的問題是非常具有挑戰性的。我們的目標依然極具挑戰且尚未實現。我不覺得我們已經掌握了既定公式,只需要單純地擴展或執行。唯有創新才能實現這一目標。關於創新,你可以將其視為在不同尺度上,或在與當前方向不同的切入點上進行的探索。當然我們有 Gemini 模型,在 Gemini 項目內部我們也進行了大量探索。我們探索新架構、新想法、不同的做事方式。我們必須這樣做,我們也在持續地這樣做。這就是所有創新的源泉。但同時,我認為 DeepMind 或整個 Google DeepMind 進行更多的探索對我們來說至關重要。我們必須做這些事,因為有些東西可能受限於 Gemini 項目本身而無法在其中探索。所以我們能做的最好的事情是,無論是在 Google DeepMind 還是在 Google Research,我們都要探索各種各樣的想法,並將這些想法引入進來。歸根結底,Gemini 不僅僅是一種架構。Gemini 是你想要實現的目標。你想要實現的目標是智能,你想通過產品來實現它,使整個 Google 真正運行在這個 AI 引擎上。從某種意義上說,具體是什麼架構並不重要。我們目前有一套方案,我們有演進的方法,我們將通過它不斷進化。而這背後的動力源泉將是創新,永遠都是創新。因此找到這種平衡,或者找到以不同方式進行創新的機會是非常關鍵的。在 I/O 大會現場我親身感受到了你、Sergey Brin 和 Demis Hassabis 展現出的人性溫暖。當你思考幫助塑造和營運這個團隊時,這種文化對你意味著什麼?Koray Kavukcuoglu:首先非常感謝你,你讓我有點不好意思了。但我認為這很重要。我相信我們的團隊,我相信信任夥伴並給予人們機會。團隊的層面很重要,這至少是我可以說我在 DeepMind 工作期間學到的東西。因為我們曾經是一個小團隊,你在那裡建立了那種信任。然後當你成長時,如何維持這種信任很重要,要創造這樣一種環境,讓人們感覺到我們真的在乎解決那些具有挑戰性的技術和科學問題,那些能產生影響、對現實世界有意義的問題。我認為這仍然是我們正在做的事情。正如我所說,Gemini 就是關於這一點的。建構智能是一個高度技術化、極具挑戰性的科學問題。我們必須以這種方式去處理它。我們也必須懷著謙卑之心去處理它,必須時刻審視自己。希望團隊也有同樣的感受。這就是為什麼我總是說我真的為團隊感到驕傲,他們配合得驚人地好。今天我們在樓上的茶水間聊天,我對他們說:“雖然很累人,很艱難,我們都筋疲力盡了,但這正是它的本質。”對此我們沒有完美的架構。每個人都聚在一起,協同工作並互相支援。這很難,但讓這一切變得有趣和愉快的,以及讓你能解決真正難題的,我認為在很大程度上是因為擁有正確的團隊在一起並肩作戰。 (數字開物)
馬斯克All-In獨家訪談實錄:從X平台到可持續能源的全景思考 | Notes
簡介埃隆・馬斯克是橫跨電動汽車、商業航天、人工智慧、社交媒體與可持續能源領域的全球科技領軍者。一文讀懂馬斯克對談:AI、自動駕駛與能源革命的核心方向。從掌舵特斯拉推動自動駕駛革命,到以SpaceX突破航天邊界,再到重塑X平台(原Twitter)、創立xAI 深耕AI安全,他的每一步佈局都深刻影響著全球科技走向,堪稱 “科技變革的造浪者”。在本期All-In Podcast播客訪談中,馬斯克毫無保留地分享了一系列重磅資訊:X平台演算法最佳化,Grok AI可精準篩選內容;他打造的Grokipedia直言將超越維基百科;還曝光了昔日平台審查的隱秘細節,回應了曾引發熱議的 “言論自由” 話題。此外,對話中更不乏行業焦點:特斯拉董事會投票的核心訴求、OpenAI從 “開源” 到 “閉源” 的訴訟爭議、無方向盤的Cyber Cab何時量產,以及他對太陽能與核聚變能源的犀利判斷,每一個話題都直擊科技圈核心。這場對話既有硬核科技的革新思路,也有行業爭議的直白觀點,想要讀懂馬斯克對 AI、能源與未來的全景思考,這場對談的細節裡藏著更詳盡的答案。本期目錄X平台新演算法:內容刷屏背後的邏輯維基百科的失敗與網際網路資訊的未來收購Twitter三周年:言論自由的變革與挑戰特斯拉董事會投票:馬斯克會離開嗎?OpenAI訴訟:非營利到營利的“背叛”?AI能效與自動駕駛的未來比爾·蓋茲對氣候變化、能源生產的看法轉變X平台新演算法:內容刷屏背後的邏輯主持人Jason:這演算法到底怎麼回事?我一整天都在刷Sydney Sweeney的裙子相關內容。上周薩克斯更誇張,居然連續兩周被演算法推薦去參加SluckCon。我發現,現在只要你在X平台上對任何內容表現出興趣,比如點選查看,要是還點了贊,演算法就會立刻跟上,給你推送更多同類內容,而且是大量推送。Elon Musk:沒錯,我們之前確實遇到了一個問題,直到周末才解決。有個嚴重漏洞導致關注列表內容無法顯示,也就是說,即便你關注了某個人,也看不到他們的動態,這顯然是重大漏洞。另外,演算法之前沒考慮“使用者停留瀏覽”的行為,但只要你有互動,比如點贊、回覆,它就會過度推送。就像David說的,只要你收藏、回覆或任何形式互動,就會收到大量同類內容。主持人Jason:Sacks,你當時是怎麼互動的?該不會是收藏了SluckCon的內容吧?主持人Sacks:不過這演算法也有個好處,你能看到其他人對同一話題的看法,這其實挺實用的,相當於從多個角度瞭解你感興趣的內容。Elon Musk:但問題在於推送太過度,顯然是演算法矯正過頭了,只要你有一點互動,就像“猛灌”同類內容,彷彿在說“你嘗了一口,那我們再給你三大份”。主持人Jason:我猜現在這些演算法調整都用到了Grock。Elon Musk:我們正在逐步刪除Twitter的遺留演算法規則,但問題是,這些舊規則就像“拆東牆補西牆”的木桿,抽掉一根就可能引發新問題。就像那個網際網路梗圖:一台複雜機器全靠一根小木棍支撐,上面可能寫著“亞馬遜AWS東部區域”。主持人Jason:其實最好的方式是結合新舊模式:既保留原來按時間順序顯示好友動態的功能,又加入新的演算法推薦,兩者兼顧。Elon Musk:不過現在使用者仍能通過“關注”標籤頁查看純時間線。我們接下來會新增“精選關注”選項。因為如果你的關注列表裡有人發內容特別頻繁,關注頁會變得很難用。新增選項後,Grock會篩選出你關注的人發佈的最有趣內容,展示在“精選關注”頁。這樣一來,關注頁會實用得多,能讓你直接看到最想看的內容。目前我們已基本修復“過度推送”漏洞。另一個重大變化是:Grock現在會讀取平台上所有內容,每天約1億條,這還只是英文內容,其他語言會更多。初期我們讓Grock優先讀取這1億條中最熱門的1000萬條,進行理解、分類並匹配使用者。這絕對不是人類能完成的工作。等系統穩定後,我們會擴展到每天1億條全量讀取。屆時,Grock會從1億條內容中精準篩選出你最感興趣的推送給你。主持人Jason:要支撐這樣的運算,大概需要多少算力?比如幾萬台伺服器?Elon Musk:我估計需要5萬台H100晶片。而且這還會取代傳統搜尋,使用者以後能用自然語言在X平台搜尋,我們會提供語義搜尋服務,無論是文字、圖片還是視訊,只要語義匹配就能搜出來。主持人Chamath:你收購Twitter已經三年了吧?現在是三周年紀念嗎?Elon Musk:是的,三年了。主持人Jason:三年後的今天,你後悔過收購嗎?顯然沒有。你當時的核心使命是維護言論自由,現在看來已經實現了。而且把它納入xAI體系後,它作為資料來源的價值也變得極高。回過頭看,你收購它的初衷是為了阻止瘋狂的“覺醒病毒”,讓真相再次存在於世界上。太好了,使命達成了,現在它有了光明的未來。Elon Musk:沒錯,我們還推出了“社區筆記”功能。現在你在X平台看到任何內容,只要點選Grock圖示,它就能幫你分析內容真實性、補充資訊,甚至深入研究你感興趣的點。可以說,我們在言論自由和資訊核驗上取得了很大進展,人們現在能更清楚地分辨資訊真假,戳穿宣傳話術。Grock的最新版本在這方面表現特別好。維基百科的失敗與網際網路資訊的未來Elon Musk:我們借助最新版本的Grok建立了Grokipedia,我認為它比維基百科更中立、更準確,而且實際上比維基百科頁面包含的資訊多得多。主持人Chamath:你們是用維基百科作為種子資料了嗎?或者說,你們是怎麼做到的?Elon Musk:嗯,我們使用了AI。主持人Chamath:是完全無監督訓練、用純合成資料,還是參考了維基百科?Elon Musk:其實直到最近,我們才具備打造Grokipedia的能力。第一步,我們訓練了一個“極致求真”版本的Grock,它擅長邏輯清晰的分析,能把任何論點拆解成核心要素,判斷這些要素是否矛盾、結論是否能從前提合理推導。簡單說,我們讓Grock大量學習批判性思維,它在這方面的能力變得非常強。之後,我們讓這個版本的Grok梳理維基百科中最熱門的100萬篇文章,進行補充、修改和刪除。具體來說,Grock會檢索網際網路上所有公開資訊,修正維基百科的錯誤,同時補充大量上下文。很多宣傳話術的問題在於:雖然陳述的事實技術上是真的,但無法全面反映一個人或一件事的全貌。這一點很關鍵。維基百科的人物傳記,久而久之會變成“仇家聚集地”:被你解僱、商業競爭中輸給你的人,或者心懷不滿的人,都會在上面添負面資訊。主持人Jason:我看過自己的Grokipedia詞條,內容比維基百科豐富五六倍,而且更具代表性、更準確。維基百科的詞條更新頻率很低,還由50個匿名使用者決定內容,非常不合理。Elon Musk:Grockipedia目前還只是0.1版本,等迭代到1.0時,我相信它會好10倍。即便現在,它不僅能修正錯誤,還能更全面、真實地描述人物和事件,比如物理學相關詞條,就比維基百科好得多。主持人Chamath:那你們有沒有計畫讓Google等搜尋引擎降低維基百科權重、提升Grokipedia排名?畢竟現在很多人仍把維基百科當權威來源。Elon Musk:其實這主要靠使用者自發傳播。如果大家在自己的網站引用Grokipedia、在社交媒體分享,或者搜尋時優先點選Grokipedia結果,它在Google的排名自然會上升。剛上線那天,在Google搜“Grokipedia”,它會提示“你是不是想說維基百科”,完全搜不到我們的內容。不過現在情況好多了。主持人David:上線後的資料怎麼樣?增長勢頭好嗎?Elon Musk:非常好,它已經火遍全網了。我相信隨著更多人使用,大家會自己判斷。當你看到Grokipedia上關於某個熟悉話題或人物的詞條,會發現它比維基百科更全面、精準、中立,自然會願意分享。而且我們還沒給Grokipedia加圖片和視訊功能呢,之後我們會用Grock Imagine將詞條文字生成解釋性視訊。無論是教你打領帶、解釋化學反應,還是飲食、醫療知識,都能通過視訊直觀呈現。主持人Chamath:當模型具備 “極致求真” 能力後,你覺得是否需要更好的評估標準,來判斷訓練資料的真實性?比如有些訓練資料本身就有問題。Elon Musk:市面上其實有很多評估標準,我對Grokipedia的成功很有信心。維基百科的問題很明顯:資訊稀疏、錯誤多、更新不及時,還幾乎沒有圖片和視訊。而Grokipedia不僅精準、全面、有視訊,還支援互動,遇到不懂的地方,選中內容就能向Grok提問。它不是比維基百科好一點,而是好100倍。主持人David:你收購 Twitter後的三年裡,很多人說要離開Twitter,但最後也沒去別的平台。現在你通過Grokipedia和X平台打破了“覺醒思想”的控制,傳遞真相,但會不會有人依然只追求“確認偏誤”,不願意接受真相?Elon Musk:確實,很多人會因為自己所屬的政治或意識形態陣營,堅信某些觀點,那怕證據就在眼前。比如有些視訊裡,有人向持極端觀點的人展示反駁內容,但那些人根本不願意看。就像地平論者,無論你拿出什麼證據,他們都不會相信地球是圓的,因為在他們眼裡,一切都是謊言。主持人Jason:我認為在回覆中點選Grok並向它提問的功能,真的變成了一枚“追求真相的導彈”。比如我發了資料後,讓Grok驗證精準性,它還會補充相關資訊。再加上“社區筆記”功能,現在有了雙重保障:社區的共識觀點和Grok的專業分析。Elon Musk:而且現在X平台上幾乎所有非廣告內容都有Grok圖示,一鍵就能獲取分析,還能深入追問,想挖多深都可以。我們的目標是讓X平台成為全球最好的真相來源,在這裡能聽到各種觀點,但這些觀點都會經過“社區筆記”(由歷史上持不同意見的人共同認可)和Grok的雙重核驗。而且“社區筆記”的程式碼和資料都是開放原始碼的,任何人都能獨立驗證。收購Twitter三周年:言論自由的變革與挑戰主持人Sacks:我們最初邀請你過來,是因為收購Twitter三周年。還記得當時你收購前住在我家,前一天還讓我的員工幫忙找洗手池嗎?Elon Musk:現在想想還覺得好笑。我的安保團隊去五金店買洗手池,店家一直問 “想要那種水龍頭、適配那種水管”,但我們只想要一個洗手池,不管這些細節。店家都覺得我們奇怪,差點不讓我們買。他們肯定沒想到,我們買洗手池只是為了玩梗。主持人Jason:還有個難忘的細節,就是我開車去Twitter總部,發現周圍居然有合法停車位。Elon Musk:這在舊金山市中心簡直不可思議,畢竟車窗隨時可能會被砸。當時Twitter總部兩棟樓,一棟完全空無一人,另一棟只有5%的人在辦公。主持人Jason:在那棟入住率只有5%的大樓裡,我們去食堂吃飯時,發現做飯的員工居然比來吃飯的推特員工還多。Elon Musk:我們後來才知道,當時一頓午餐的實際成本高達400美元。原本20美元的成本,因為只有5%的人就餐,分攤後漲了20倍。更離譜的是,我們想在白板上畫圖,發現馬克筆都幹了,說明大概兩年多沒人用過。而且空無一人的那棟樓,男衛生間裡每周還會定期補充衛生棉條,簡直匪夷所思。主持人Sacks:還有一整個房間的Stay Woke主題周邊——T恤、圍巾、連帽衫,還有寫著“我是工程師”的磁性徽章。主持人Chamath:說實話,真正的工程師根本不需要用徽章證明自己,程式碼就是最好的證明。主持人Jason:說點嚴肅的,那30天裡我們看到的浪費現象觸目驚心。作為上市公司,Twitter在軟體訂閱上花了很多冤枉錢。有些SaaS軟體買了兩年都沒安裝,還有為空置辦公室支付的工位管理軟體費用,甚至有分析行人流量的軟體,而大樓里根本沒人。主持人Sacks:收購Twitter最重大的遺產還是言論自由。人們的記憶總是短暫的,他們忘了三年前的輿論環境有多糟糕。Donald Trump、Jordan Peterson、Jay Bacharia、Andrew Tate等不同立場的人物,都被Twitter封禁。而且除了直接封禁,還有隱蔽的“影子封禁”。Twitter多年來一直聲稱他們沒有進行影子封禁。說這是偏執的保守派陰謀論。Elon Musk:Twitter的“信任與安全團隊”長期從事這種操作,卻多年來一直否認。我的意思是,這個團隊的名字極具奧威爾式諷刺。“嗨,我來自信任部門。我們想和你談談你的推文。順便看看你的私信?”就憑說這話的人來自信任部門?這不就是現實版的“真理部”嗎?主持人Sacks:高管們多年來一直堅持說他們沒有從事這種操作,甚至在宣誓時也不承認。你收購後曝光了這些操作,我們才發現他們還開發了一套複雜工具,實現降權、影子封禁等功能。之後其他社交媒體平台的類似操作也被曝光,包括Google,把不想要的內容放到搜尋第二頁,就相當於“隱性遮蔽”,因為沒人會翻到第二頁。更重要的是,你公開了“Twitter檔案”,讓調查記者不受限制地查閱內部郵件,揭露了FBI有80名特工參與內容下架請求,深度介入封禁、影子封禁等審查行為。這在以前是完全無法想像的。主持人Jason:政府有沒有要求你們刪除內容?還是他們現在必須遵守政策,必須申請搜查令,必須走正規程序,而不是僅僅向高管施壓?Elon Musk:我們現在的政策是嚴格遵守法律。不同國家的法律不同,比如有些國家沒有言論自由相關法律,我們如果不遵守,就會被當地封禁。但我們不會超出法律範圍行事。如果某個國家的法律本身有問題,那應該由當地民眾要求領導人修改法律,而不是我們越權。所以,我認為正確的政策就是遵守任何國家的法律。不過也有棘手情況,比如巴西有個法官要求我們違反當地法律封禁帳號,還下了禁言令,導致我們被巴西封禁了一段時間。主持人Sacks:我只想就言論自由問題最後說一點,然後我們可以繼續下一個話題。我認為人們似乎忘了,當時的審查範圍一直在擴大,性別、氣候變化等話題都成了 “敏感領域”,“仇恨言論” 的定義不斷拓寬,越來越多人因為表達觀點被封禁或影子封禁。如果不是你收購Twitter並開放平台,這種趨勢還會繼續。也正是在此之後,其他社交網路才開始警醒,並開始更有力地反擊審查政策。Elon Musk:沒錯,Twitter打破僵局後,其他平台也不得不跟進,因為他們的操作變得越來越明顯。而且有了Twitter的“掩護”,他們也更敢於向言論自由傾斜。不過現在其他平台依然存在一定的影子封禁,但比以前少多了。主持人David:現在全球似乎有越來越多限制言論自由的法律,比如英國就有不少人因為社交媒體言論被捕入獄。你怎麼看這種趨勢?Elon Musk:確實有這樣的全球趨勢,很多國家以“打擊仇恨言論”為名,壓制言論自由。但言論自由的核心意義在於:允許人們表達你不喜歡甚至痛恨的觀點。如果你能壓制自己不喜歡的言論,總有一天,別人也會壓制你的言論。英國現在大概有兩三千人因為社交媒體言論入獄,有些甚至是輕微言論,而有些暴力犯罪者卻被釋放,只為關押這些人,這是非常錯誤的。這也正是美國開國元勛將第一修正案(言論自由)放在首位的原因:他們來自沒有言論自由的國家,深知其重要性。特斯拉董事會投票:馬斯克會離開嗎?主持人Chamath:換個話題,特斯拉的董事會投票很快就要出結果了。ISS(機構股東服務公司)和Glass Lewis(格拉斯劉易斯公司)的建議太離譜了,比如Ira Aaron Prize因為不符合性別要求沒得到推薦,而Kathleen作為非裔美國女性,也被以 “不夠多元化” 為由反對。Elon Musk:我認為這反映了上市公司治理的根本問題。現在約一半的股市由被動指數基金控制,而這些基金大多把投票權外包給ISS和Glass Lewis這樣的諮詢機構。我把它們稱為“企業ISIS”,因為它們根本不持有任何公司股份,卻像“恐怖分子”一樣左右公司決策,所以我認為這裡存在根本性的責任缺失。這些諮詢機構被極左活動人士滲透,而指數基金有信託責任,它們應該為股東利益最大化投票,因為很多人的401K退休儲蓄(美國常見退休儲蓄計畫)都依賴這些基金。但現在,ISS和 Glass Lewis實際上控制了一半股市的投票權。這次特斯拉的投票名義上是關於我的薪酬,但核心不是錢,我不會用這些錢買遊艇之類的東西。關鍵是,我要確保Optimus機器人項目順利推進,保證機器人的安全性,這需要我擁有足夠的話語權。我希望能有25%的投票權,足夠產生重大影響,但又不足以讓我在“發瘋”時無法被解僱。我擔心的是,如果沒有足夠的投票權,可能會因為政治原因被這些機構解僱,到時候就無法保障機器人的安全性了。主持人Jason:如果投票沒通過,你會離開特斯拉嗎?Elon Musk:這麼說吧,如果我能輕易地被激進投資者解僱,我當初根本就不會推進機器人項目,絕對不會。主持人Jason:這很合理。誰能有能力營運特斯拉的四五個主要產品線?人們不理解這背後的複雜性。這不僅僅是一家汽車公司,還涉及電池、卡車、自動駕駛等多個核心產品線,這是一個非常複雜的業務,你經營了幾十年。我不認為有一個能替代Elon的人能直接跳進來掌舵。OpenAI訴訟:非營利到營利的“背叛”?主持人Chamath:如果我們再轉回公司治理的話題,還有另一件有趣的事,就是關於OpenAI的重組。有趣的是,我讀了那封信,你的訴訟被排除在加州總檢察長允許的範圍之外,基本上是說這件事可以通過,這意味著你的訴訟還在繼續,而且可能進入陪審團審判階段?你有什麼想法嗎?Elon Musk:是的,陪審團審判大概在明年二三月份進行。有大量證據表明,OpenAI成立時的定位是“開源非營利機構”,公司章程裡明確寫著,任何高管或創始成員都不能從OpenAI獲得經濟利益。你可以用“網站時光機(Wayback Machine)”查看早期的OpenAI官網,從頭到尾都寫著“開源非營利”,直到後來發現有巨大利益可圖,才開始改變說法。他們試圖把“OpenAI”的“Open”解釋為“對所有人開放”,而非“開源”,但這個名字是我起的,我很清楚它的原意。主持人Jason:如果他們現在開源,或者給你應得的股份,當然你並不需要錢。但如果他們給了你理應擁有的股份,來換取你的支援呢?你顯然有不同的目標,對吧?Elon Musk:是的。如果從商業公司邏輯看,我提出了公司理念、命名、提供A輪/B輪/C輪融資、招募核心團隊,還分享了我所有的知識,理應擁有至少一半股份。但我建立它的初衷,是把它打造成面向全球的開源非營利機構。主持人Chamath:如果能改變現狀,你覺得應該現在就把他們的模型開源嗎?Elon Musk:理應如此,這正是OpenAI成立的初衷。諷刺的是,現在最好的開源模型大多來自中國,我們的Grok 2.5開源模型也非常出色,而且會繼續開源更多模型。而OpenAI所謂的“開源模型”根本無法使用,他們只是開源了一個殘缺不全的版本作為遮羞布而已。你見過有人真正在用OpenAI的開源模型嗎?反正我沒見過。主持人Jason:AI帶來的就業替代是大家熱議的話題,你覺得這個過程會有多快?社會該如何應對?Elon Musk:我把AI比作“超音速海嘯”——規模大、速度快,而且無論我是否願意,它都在到來。其實我曾經試圖減緩AI的發展速度。當初建立OpenAI,是為了制衡Google,當時Google在AI領域幾乎壟斷,而Larry Page根本不重視 AI 安全。我還記得有一次,我跟Larry說 “我們必須確保AI不會毀滅人類”,他居然說我是 “物種歧視者”,就像種族歧視一樣,因為我更重視人類智能而非機器智能。當時Google收購了DeepMind,而我其實是第一個把DeepMind介紹給Larry的人,現在想想真該謹慎一點。當時的情況是:Google掌控所有AI技術、電腦資源和資金,負責人卻不重視安全,還反對保護人類利益。這種情況下,我只能建立競爭對手,也就是與Google相反的“開源非營利機構OpenAI”。但不幸的是,它現在應該改名叫“封閉逐利AI”(Closed for Maximum Profit AI)。主持人Jason:Sam Altman說要籌集1.4兆美元建設資料中心。我覺得他是認真的,但這簡直離譜到“邦德反派”等級。我的意思是,我會說是“大膽的”,但我不想侮辱這個詞。AI能效與自動駕駛的未來主持人Chamath:你在財報電話會議上說,未來可以把所有特斯拉車輛連接起來,利用閒置時間提供推理算力,總算力可能達到100吉瓦。這是真的嗎?Elon Musk:如果未來特斯拉車輛保有量達到1億輛,每輛車都配備最先進的推理電腦(假設每輛車推理算力為1千瓦),而且都有內建電源、冷卻系統和網路連線,那麼總算力確實能達到100吉瓦。主持人David:最近有不少“無注意力模型”的論文發佈,據說能將每令牌(token)的能耗降低好幾個數量級。你怎麼看待AI算力的能效發展?Elon Musk:人類大腦就是高效算力的絕佳例子,我們的大腦僅消耗約20瓦功率,其中用於高級認知功能的只有10瓦左右。人類僅憑這個“10瓦生物電腦”,就發明了飛機、雷射、網際網路,發現了相對論和量子力學。而現在的AI超級電腦,那怕是100兆瓦甚至1吉瓦算力,也還不能完成人類能做的所有事。這說明AI算力的能效還有巨大提升空間,目前它與人類大腦的能效相差好幾個數量級。在特斯拉和xAI,我們也一直在推動推理算力能效的大幅提升。主持人Chamath:如果自動駕駛技術足夠成熟、安全,你會不會停止生產傳統汽車,全力投入生產自動駕駛計程車(Cyber Cab)?Elon Musk:其實我們現在生產的所有汽車,都具備自動駕駛計程車的能力。比如Model 3和 Model Y看起來和普通汽車一樣,但都配備了先進的AI電腦、AI軟體和攝影機。我們特意把攝影機裝在不顯眼的位置,比如後視鏡前方、車門後視鏡處、車牌上方和B柱,避免影響美觀。這些車都具備完全無人駕駛能力。而我們專門打造的Cyber Cab沒有方向盤和踏板——在自動駕駛時代,這些都是多餘的。Cyber Cab將於明年第二季度開始生產,之後會大規模擴產,最終每年可能生產數百萬輛。主持人Jason:Cyber Cab 設計極具吸引力,不少網友呼籲加裝方向盤,你為何未採納這一建議?Elon Musk:我們不會裝方向盤。人們可能覺得自己想開車,但實際並非如此。你坐優步(Uber)或來福車(Lyft)時,有沒有想過“我想搶過方向盤自己開”?應該從來沒有過吧。主持人Jason:一次也沒有。Elon Musk:最多零次。主持人Jason:我的Model Y剛升級到14.1版本,過去幾天一直在用Mad Max模式。駕駛體驗很獨特,感覺它總想盡快到達目的地。Elon Musk:是的,那個模式會假定你正趕時間。就像你多給司機20美元讓他們開快點,比如趕醫療預約之類的。主持人Jason:不過自動駕駛的安全風險很高,優步和Cruise都發生過嚴重事故。你知道,有人被撞了,然後他們又撞了那個人第二次,還被拖行了。所以你們一直很謹慎。Elon Musk:現在的車輛其實已經具備很強的自動駕駛能力,但我們必須極度謹慎,那怕發生一次事故,都可能成為全球頭條,而且媒體對特斯拉的要求會更嚴格。主持人Jason:我很欣賞你們啟用了安全員的做法,他們只是坐在車裡,不需要做任何操作,這是非常正確的決定,沒必要因為別人的批評改變。Elon Musk:是的,我們預計今年12月之前,部分車輛就能實現“無安全員”的自動駕駛。主持人Jason:你們在奧斯汀的試點已經積累了豐富的經驗,能談談這三、四個月的時間你們學到了什麼嗎?Elon Musk:實際上,進展相當順利。我們學到的核心經驗,是車隊管理與網約車軟體的自主開發。我們需要自己編寫類似優步的軟體,只不過開發的是自動駕駛汽車而非有人駕駛汽車。比如,當車輛達到1000輛規模時(我們計畫年底前在灣區部署1000輛以上,奧斯汀部署500輛以上),要確保這些車輛不會同時湧向同一個超級充電站,不會在同一個路口擁堵。還有很多特殊情況需要處理,比如需求高低峰時車輛該如何調度?是繞圈等待還是找停車位?遇到標識模糊的殘疾人停車位,車輛該如何判斷?會不會停進過於狹窄的車位,導致無法上下車?主持人Jason:還有監管問題。不同城市、機場的監管要求也不一樣,這需要大量的協調和努力,而且非常耗時。Elon Musk:舉個例子,在聖何塞機場,車輛必須連接機場的兩台伺服器,完成5美元的下車費用支付才能接送乘客。這些細節雖需逐一攻克,但用不了多久,“空無一人的自動駕駛汽車”就會成為常態。比爾·蓋茲對氣候變化、能源生產的看法轉變主持人David:最後想問問你對比爾·蓋茲最新備忘錄的看法,他在氣候問題上的立場似乎發生了180度大轉彎,這是怎麼回事?Elon Musk:比爾·蓋茲作為微軟創始人,按理說應該具備很強的科學素養,但我和他的直接交流讓我很意外,他其實並不懂科學。有一次他來奧斯汀的 Tesla 超級工廠參觀,居然說 “長續航半掛卡車是不可能實現的”。我告訴他 “我們已經造出了這樣的卡車,百事可樂公司正在使用,你可以自己開車驗證,或者派信任的人去”,但他堅持說 “這不可能,根本行不通”。我追問他 “你是質疑電池的能量密度,還是卡車的能耗效率?這兩個資料直接決定續航里程”,他卻根本不知道這些關鍵資料。連核心資料都不瞭解,就斷定技術不可行,這顯然太草率了。蓋茲說氣候問題正在變得乏味,拜託。主持人Jason:他是不是要為Sam Altman或其他人建立資料中心?我不知道。Azure是什麼情況?他改變了立場,這太讓人費解了。Elon Musk:其實氣候問題的真相,既不像有些人說的“根本不存在”,也不像極端環保主義者說的“5年後地球就會被淹沒”。你只需要花50美元在亞馬遜上買一個二氧化碳監測儀,就能親自測量大氣中的碳濃度。你會發現,大氣中的二氧化碳濃度(ppm)每年以2-3個單位的速度穩步上升。把地下數十億甚至數兆噸的碳轉移到大氣和海洋中,必然會改變大氣和海洋的化學成分,這是不爭的事實。爭議的焦點只是影響程度和時間尺度。我認為,我們至少還有50年時間應對氣候變化問題,不是5年,也不是500年。所以正確的做法是理性推進可持續能源,向太陽能和電池驅動的未來轉型,讓整個體系向這個方向傾斜。我不認為需要巨額補貼,但也不應該給石油天然氣行業提供補貼。石油天然氣行業享受的很多稅收減免已經存在了幾十年,他們不認為這是補貼,但實際上,只有某個行業能享受的特殊稅收政策,本質就是補貼。理想情況下,應該取消所有行業的補貼,但政治現實是,石油天然氣行業在共和黨有很強的影響力,不僅不會取消補貼,反而會新增。而可持續能源的很多激勵措施卻被取消了,不過有些激勵措施確實也有些過頭了。總而言之,我認為科學上的正確結論是我們必須向可持續能源未來轉型。石油、天然氣和煤炭都是有限資源,總有一天會耗盡,我們最終還是要轉向可持續能源。主持人David:但諷刺的是,現在太陽能發電的成本似乎比很多化石能源更低,所以市場本身就已在向這個方向轉變。但如果繼續給傳統能源提供補貼,可持續能源就很難公平競爭。Elon Musk:不過,太陽能面臨一個巨大障礙。中國是太陽能電池板的主要生產國,他們的製造能力非常強,目前中國的太陽能電池板年產能約1.5太瓦,而美國的年平均用電量只有 0.5 太瓦。即便考慮晝夜差異、陽光角度等因素,需要將太陽能產能除以5,中國的太陽能電池板穩態輸出也能達到美國總用電量的2/3。也就是說,中國僅用18個月生產的太陽能電池板,就能滿足美國的全部電力需求。主持人Chamath:你怎麼看待核能(近場太陽能)?Elon Musk:只要對環境沒有明顯危害,任何能源形式都可以嘗試。但問題是,很少有人願意讓核反應堆建在自己家附近。如果你的鄰居說 “我要賣房,新業主會在這裡建核反應堆”,大多數人的反應都會是反對。不過核能其實非常安全,美國海軍的潛艇和航空母艦上都有核反應堆,潛艇內部空間狹小、人員密集,卻依然安全運行。核裂變的安全性被很多宣傳誇大了風險。我認為核裂變是一個不錯的選擇,只是監管環境讓核能推廣變得非常困難。然後,認識到太陽的巨大能量也很重要。從規模上看,太陽的能量是無與倫比的,太陽的質量佔太陽系總質量的99.8%,木星佔0.1%,剩下的所有天體加起來才佔0.1%。那怕把整個太陽系的其他天體都燃燒掉,產生的能量和太陽比起來,依然可以忽略不計。太陽每秒產生的能量,比地球所有能源加起來還要多10億倍以上。研究物理學的人都知道 “卡爾達肖夫指數(Kardashev Scale)”:1型文明能利用行星的大部分能量,2型文明能利用恆星的大部分能量,3型文明能利用星系的大部分能量。目前人類還只是接近1型文明的1%。要邁向2型文明,太陽能是必然選擇,其他能源都只是“噪音”。主持人Jason:這令人難以置信,對吧?太陽能顯然是終極解決方案。當然,我的意思是短期必須使用其他來源作為過渡,但長期來看,方向是明確的。Elon Musk:我們可以將其稱為“星辰供電”(Star Power),也許我們在這方面的品牌宣傳上有點問題。別叫它太陽能,叫它“星光”(Starlight)。星光,多完美的名字,這可是來自恆星的力量,一顆恆星蘊含著多麼龐大的能量啊。主持人Jason:多到用不完。Elon Musk:嗯,所以有時候人們問“你會把能量傳回地球嗎?”,我當時想:“你想融化地球嗎?”那麼巨大的能量傳回來,我們會瞬間被汽化。所以,電力必須在本地產生和消耗,這本質上就是分佈式能源。並且,我認為未來大部分能量將被用於計算和智能,所以未來會出現大量的、由太陽能驅動的人工智慧衛星。主持人David:恆星之所以能發光發熱,是因為它巨大的質量產生了強大的引力,從而點燃了核聚變反應,對吧?我們現在已經可以在地球上實現可控核聚變了。我記得幾年前我們聊過,當時你很確定我們無法預知地球上的核聚變何時能成功,我不知道你對此的看法是否有所改變?Elon Musk:我想澄清一下我的看法。我大學時是學物理的,高中時一度考慮過以物理為職業,我有個兒子現在就在攻讀物理。當時我得出的結論是,要在物理學上有所作為,我可能得等下一代對撞機或望遠鏡建成,但我始終對這門學科有濃厚的興趣。所以,回到在地球上建造核聚變反應堆這件事上,我認為這實際上不是一個難題。我的意思是它並非完全微不足道,但只要你把托卡馬克裝置(Tokamak)造得足夠大,問題就會變得越簡單。這其實是一個表面積與體積比的問題:你需要在維持核心極度高溫的同時,保證反應堆的外壁不被熔化。這和火箭發動機的設計邏輯異曲同工。火箭發動機的核心區域溫度極高,但燃燒室壁絕不能熔化,訣竅在於建構顯著的溫度梯度。中心區域滾燙,越靠近燃燒室壁溫度越低,以此確保內壁安全無損。同理,只要擴大環形托卡馬克反應堆的規模,最佳化其表面積與體積比,相關難題就能迎刃而解。任何懂數學的人都能明白,建造一個能量輸出大於輸入的反應堆是完全可行的,而且規模越大越容易。這一邏輯的終極形態,正是像太陽這樣靠引力約束的巨型天然熱核反應堆,它無需人工維護,還完全免費。那麼問題來了:既然天空中就有這樣一個巨大且免費的天然太陽,我們又何必煞費苦心在地球上打造一個微不足道的“人造小太陽”呢?主持人David:沒錯,但地球上能接收到的太陽能量還不到它總輸出的十億分之一。因此,若想真正利用太陽的全部能量,就必須找到“包裹”它的方法,這才是我們的終極目標。Elon Musk:如果有人想把反應堆當成趣味項目,當然沒問題,盡可以去探索嘗試。但要是把它視作嚴肅的能源解決方案,那和太陽這個終極能源相比,就顯得微不足道了。僅僅是到達地球表面的太陽能,功率密度就高達每平方公里1吉瓦,或者說每平方英里2.5吉瓦,這是一個巨大的數字。目前市售太陽能電池板的效率在25%到26%左右。如果排列密度達到80%,每平方公里的實際輸出約為200兆瓦。再搭配電池儲存電能(夜間用電量會大幅下降,所需電池數量比想像中少),完全可以實現持續供電。一個簡單好記的資料是:每平方公里的太陽能每天能產生約1吉瓦時的電能。主持人David:實現這種規模的最大技術挑戰,是太陽能電池板和電池的製造規模化。我們有足夠的原材料嗎?Elon Musk:當然有。太陽能電池板的主要成分是矽(原料源自沙子),非常豐富。電池方面,磷酸鐵鋰電池的主要成分是鐵,鐵是地球含量最豐富的元素,佔地球質量的32%,還有磷、碳和鋰,這些元素也都非常常見。我們已經在特斯拉官網上公佈過相關計算:僅用太陽能電池板和電池,就足以滿足全球的能源需求,不存在原材料短缺的問題。主持人Jason:好了,埃隆,那就拜託你繼續推進這些偉大的事業,比如給地球供電、研發腦機介面、發射衛星,還有其他各種有趣的項目。很高興能和你聊天。Elon Musk:很高興見到你們,隨時聯絡。 (創新觀察局)