陶哲軒 x Lex Fridman = π!3小時14分播客:AI 能幫人類解決最難的問題嗎?

陶哲軒和Lex Fridman聊了整整3小時14分——巧的是,時長正好是π(3.141592...)

這位被稱為「數學界莫扎特」的菲爾茲獎得主,在播客裡聊起了數學界最難的問題、AI如何幫助數學家,還有他自己是怎麼思考問題的。

這對話裡透露的資訊量實在太大了。

從流體爆炸到液體電腦

陶哲軒先聊起了Navier-Stokes方程——這可是千禧年七大數學難題之一,解決了直接拿100萬美元獎金。

這方程描述的是流體運動,比如水怎麼流動。

問題是:如果你給水一個初始速度,它會不會在某個點突然「爆炸」,速度變成無窮大?

現實中我倒是沒見過洗澡水突然以光速飛出去,但數學上還真說不準。

陶哲軒幹了件特別有意思的事:他改了物理定律。

「數學家就是可以改變方程的。」他說。

他把流體的能量轉移方式給改了——正常情況下,大渦流會分散成好幾個小渦流,能量會被分散。但他硬是設計了個方程,讓所有能量都往一個地方鑽

更絕的是,他還設想了個「液體電腦」:

想像一下,不是用電子,而是用水流來做計算。兩股水流碰撞,就像邏輯閘的AND或OR操作。然後用這些水流搭建出一台圖靈機!

有意思的地方來了:這個水做的機器人,它的使命就是造一個更小的自己,然後把所有能量傳給小機器人,自己關機消失。小機器人醒來後重複這個過程,越造越小,越來越快...

「這就像個流體版的馮·諾依曼機器。」陶哲軒解釋道。

雖然這在真實的Navier-Stokes方程裡還做不到,但在他的改版方程裡,確實會發生爆炸。

AI 能證明數學定理嗎?

播客中自然不少了陶哲軒對AI 的看法。

DeepMind的AlphaProof已經能解決國際數學奧林匹克的題目了,相當於拿了銀牌水平。但陶哲軒指出了個關鍵問題:

「他們用了3天的Google伺服器算力來解一道高中數學題。這不是個可擴展的方案。」

問題難度指數級增長,但計算資源不會。

更要命的是,AI生成的數學證明有個特點:表面看著完美,錯誤卻藏得特別深

「人類寫的爛證明,你一眼就能看出來爛在那。但AI生成的證明,它看起來滴水不漏,直到你發現某個地方有個特別蠢的錯誤——而且是人類絕對不會犯的那種。」

陶哲軒覺得,AI最缺的是數學家的「嗅覺」:

就像AlphaGo能感覺出圍棋局面的好壞,數學家也能聞出某個證明思路是不是靠譜。「大多數時候,你把一個問題隨便變換一下,反而會變得更難。真正能簡化問題的變換特別少。」

22萬個代數問題,50個人一起證

陶哲軒正在搞一個特別瘋狂的項目:用Lean語言形式化22萬個代數定律之間的關係。

比如交換律(X×Y = Y×X)能推出結合律嗎?

答案是不能。但有些定律確實能推出其他定律。他們要把所有可能的推導關係都搞清楚。

「目前22萬個問題,只剩2個沒解決了。今天早上我還在處理最後的形式化工作。」

最牛的是,這個項目有50個數學家參與——在數學界,這已經是超大規模合作了。

陶哲軒說,Lean最大的好處是能讓全世界的人原子等級地合作:

「你可以說:我卡在第67行了,需要證明這個東西。因為所有上下文都在程式碼裡,其他人立刻就能理解你的問題,然後說:哦,你需要用這個技巧。」

素數、孿生素數和賭場

聊到素數,陶哲軒用了個特別形象的比喻。

證明「99%的數都會怎樣怎樣」,就像證明「在賭場玩久了肯定輸錢」——機率論告訴我們這是對的。

但數學要求100%確定。萬一有個數字就是那個例外呢?就像賭場裡理論上也可能有人一直贏。

孿生素數猜想(相差2的素數對是否有無限多個)就特別難證,因為:

「你可以輕易地編輯素數表,刪掉0.01%的素數,就能讓孿生素數消失。但素數的其他統計性質幾乎不變。」

這意味著任何證明方法都必須抓住素數某個極其微妙的特徵——不能太粗糙,否則分不清真素數和被動過手腳的假素數。

考拉茲猜想:簡單到讓人抓狂

這個猜想極其簡單:

偶數除以2

  • 奇數乘以3加1
  • 重複操作

比如13→40→20→10→5→16→8→4→2→1

猜想說:不管從那個數開始,最終都會到1。

陶哲軒證明了99%的數確實會掉下來,但那1%的例外...

「可能存在某個特殊的數,它編碼了一台會自我複製的機器,永遠不會掉到1。」

Conway已經證明,如果把規則稍微改複雜一點,確實能造出這種「永動機數字」。

數學家怎麼想問題?

陶哲軒分享了他的思維方式,特別親民:

「戰略性作弊」——如果問題有10個困難點,先把9個關掉,只留1個,解決後再開另一個。

他說自己看過很多香港功夫片:「英雄被100個人圍攻,但鏡頭總是安排他一次只打一個人。如果壞人真的一擁而上,電影是難看了,但英雄肯定完蛋。」

有次為了理解某個向量場的動力學,他躺在地板上,閉著眼睛想像自己就是那個向量場,在空間裡翻滾...

「我阿姨進來看到我在地板上滾來滾去,問我在幹嘛。」

「這事兒...挺複雜的。」

AI會拿菲爾茲獎嗎?

Lex問:AI什麼時候能作為合作者拿菲爾茲獎?

陶哲軒想了想:「2026年應該會有AI參與的研究論文發表。不是菲爾茲獎等級的,但是真正的研究。」

至於AI獨立發現數學猜想?「這個十年內可能會發生。」

比如AI可能會發現兩個看起來毫不相關的數學對象之間的聯絡——這種事人類數學家最愛干,AI學會了也不奇怪。

數學的未來:實驗數學崛起

陶哲軒認為,數學正在從純理論學科變成理論+實驗並重的學科。

以前數學家主要靠紙筆,偶爾用電腦驗證。但現在有了Lean這樣的工具,大規模實驗成為可能。

「現在修改一個定理裡的常數,從12改到11,手工要重新檢查每一步。但在Lean裡,你改一個數字,編譯器會告訴你那幾行需要修正,大部分證明自動就過了。」

更瘋狂的是,以後期刊可能會優先發表形式化驗證過的論文——因為不用擔心證明有錯。

看完整個訪談,我也大致明白了陶哲軒對AI輔助數學的態度:

他不覺得AI會取代數學家,但也不是那種「AI永遠不懂真正的數學」的保守派。

相反,他在積極探索怎麼用AI、用Lean、用各種新工具,讓數學研究的方式發生質變。

或許若干年後回頭看,2024年就是數學從手工作坊走向工業化生產的轉折點。

而陶哲軒,正站在這個轉折點上,一邊證明著人類極限的數學定理,一邊探索著數學的新玩法。

嗯,時長3:14,確實很應景!

附播客對話全文——

陶哲軒:數學、物理學中的最難問題與人工智慧的未來 | Lex Fridman 播客 #472

簡介

Lex Fridman(00:00:00)以下是我與陶哲軒的對話,他被廣泛認為是歷史上最偉大的數學家之一,常被稱為"數學界的莫扎特"。他獲得了菲爾茲獎和數學突破獎,在數學和物理學的眾多領域都有開創性的貢獻。對我來說,這是一個巨大的榮譽,原因很多,包括Terry在我們所有互動中表現出的謙遜和善良。這意義重大。這裡是Lex Fridman播客。要支援它,請查看描述中的贊助商或訪問LexFridman.com/sponsors。現在,親愛的朋友們,這裡是陶哲軒。

第一個難題

Lex Fridman(00:00:49)你遇到的第一個真正困難的研究級數學問題是什麼,一個讓你停下來思考的問題?

陶哲軒(00:00:57)在本科教育中,你會學到真正困難的不可能問題,比如黎曼假設、孿生素數猜想。你可以讓問題變得任意困難。這實際上不是問題。事實上,甚至有些問題我們知道是無法解決的。真正有趣的是那些處於我們能夠相對容易做到的和無望的邊界上的問題,那些現有技術可以完成90%工作,你只需要剩下的10%的問題。我想作為博士生,Kakeya問題確實吸引了我的注意。它剛剛被解決了。這是我在早期研究中大量工作的問題。歷史上,它來自日本數學家Soichi Kakeya在1918年左右提出的一個小謎題。這個謎題是,你在平面上有一根針,或者想像在路上開車,你想讓它執行掉頭,你想轉動針,但你想在儘可能小的空間中做到這一點。所以,你想使用最小的區域來轉動它,但針可以無限機動。所以,你可以想像只是讓它旋轉。作為單位針,你可以讓它圍繞中心旋轉,我想這給你一個面積為π/4的圓盤。或者你可以做三點掉頭,這是我們在駕校教人們做的。這實際上需要π/8的面積,所以比旋轉稍微有效一些。有一段時間人們認為這是轉動東西的最有效方式,但Besicovitch證明實際上你可以用任意小的面積轉動針。所以,0.01,有一些非常複雜的多次前後掉頭的方法,你可以轉動一根針,在這樣做的過程中,它會經過每個中間方向。

Lex Fridman(00:02:51)這是在二維平面上嗎?

陶哲軒(00:02:52)這是在二維平面上。所以,我們理解二維的一切。所以,下一個問題是:三維會發生什麼?所以,假設哈勃太空望遠鏡是太空中的一個管子,你想觀察宇宙中的每一顆星星,所以你想旋轉望遠鏡到達每一個方向。這裡不現實的部分是,假設空間非常寶貴,這完全不是,你想佔用儘可能小的體積來旋轉你的針,以便看到天空中的每一顆星星。你需要多小的體積來做到這一點?所以你可以修改Besicovitch的構造。所以如果你的望遠鏡厚度為零,那麼你可以使用任意小的體積。這是二維構造的簡單修改。但問題是,如果你的望遠鏡不是零厚度,而是非常非常薄,某個厚度δ,作為δ的函數,能夠看到每個方向所需的最小體積是多少?

(00:03:45)所以,隨著δ變小,隨著針變得更細,體積應該下降。但它下降得多快?猜想是它下降得非常非常慢,大致像對數一樣,這經過大量工作後得到了證明。所以,這似乎是一個謎題。為什麼它有趣?所以,它令人驚訝地連接到偏微分方程、數論、幾何、組合學中的許多問題。例如,在波傳播中,你在水中飛濺,你創造水波,它們向各個方向傳播,但波表現出粒子和波類型的行為。所以,你可以有所謂的波包,這是一個非常區域化的波,在空間中區域化並在時間中朝某個方向移動。所以如果你在空間和時間中繪製它,它佔據一個看起來像管子的區域。可能發生的情況是,你可以有一個最初非常分散的波,但它們都在稍後的時間聚焦在一個點上。你可以想像向池塘中投入一顆鵝卵石,漣漪散開,但如果你時間逆轉那個場景,波運動方程是時間可逆的,你可以想像漣漪匯聚到一個點,然後發生大的飛濺,甚至可能是奇點。所以這是可能的。從幾何學上來說,發生的是也有光線,所以如果這個波代表光,例如,你可以想像這個波是以光速傳播的光子的疊加。

(00:05:15)它們都在這些光線上傳播,它們都聚焦在這一點上。所以,你可以有一個非常分散的波聚焦成在空間和時間中一點非常集中的波,但然後它又散焦,它分離。但潛在地,如果猜想有負面解決方案,這意味著有一種非常有效的方法將指向不同方向的管子包裝到非常非常狹窄的區域,非常非常窄的體積。那麼你也能夠創造開始時一些...會有一些波的排列,開始時非常非常分散,但它們會集中,不只是在一個點,而是在空間和時間中有很多集中。你可以創造所謂的爆炸,其中這些波的振幅變得如此巨大,以至於它們所遵循的物理定律不再是波方程,而是更複雜和非線性的東西。

納維-斯托克斯奇點

(00:06:08)所以在數學物理學中,我們非常關心某些方程和波方程是否穩定,它們是否可以創造這些奇點。有一個著名的未解決問題叫納維-斯托克斯正則性問題。納維-斯托克斯方程,控制不可壓縮流體如水的流動的方程。問題是:如果你從水的光滑速度場開始,它能否集中到某個點的速度變為無窮大?這叫做奇點。我們在現實生活中看不到這種情況。如果你在浴缸裡飛濺水,它不會在你身上爆炸或有水以光速離開或任何東西,但潛在地這是可能的。

(00:06:49)事實上,近年來,共識已經轉向相信,實際上,對於某些非常特殊的初始配置,比如說水,奇點可以形成,但人們還沒有能夠實際建立這一點。克萊基金會有這七個千禧年獎問題,為解決其中一個問題提供100萬美元獎金,這就是其中之一。在這七個中,只有一個被解決了,龐加萊猜想[聽不清00:07:18]。所以,Kakeya猜想不是直接與納維-斯托克斯問題相關,但理解它將幫助我們理解波集中等方面,這將間接地可能幫助我們更好地理解納維-斯托克斯問題。

Lex Fridman(00:07:32)你能談談納維-斯托克斯嗎?所以存在性與光滑性,如你所說,千禧年獎問題,你在這個問題上取得了很大進展。2016年,你發表了一篇論文,《平均三維納維-斯托克斯方程的有限時間爆炸》。所以,我們試圖弄清楚這個東西...通常它不會爆炸,但我們能確定地說它永遠不會爆炸嗎?

陶哲軒(00:07:56)對,是的。所以是的,這字面上是100萬美元的問題。所以,這是區分數學家和幾乎其他所有人的地方。如果某事在99.99%的時間裡成立,對大多數事情來說這已經足夠好了。但數學家是少數真正關心是否真的100%的所有情況都被覆蓋的人。所以,大多數流體,大多數時候水不會爆炸,但你能設計一個非常特殊的初始狀態來做到這一點嗎?

Lex Fridman(00:08:29)也許我們應該說這是一組控制流體動力學領域的方程,試圖理解流體如何表現。結果證明這是一個真的...流體是一個極其複雜的東西要建模。

陶哲軒(00:08:43)是的,所以它有實際重要性。所以這個克萊獎問題涉及所謂的不可壓縮納維-斯托克斯,它控制像水這樣的東西。有一個叫可壓縮納維-斯托克斯的東西,它控制像空氣這樣的東西,這對天氣預報特別重要。天氣預報,它做大量的計算流體動力學。其中很多實際上只是試圖儘可能好地解決納維-斯托克斯方程。也收集大量資料,以便他們可以初始化方程。有很多移動部分,所以從實踐上來說這非常重要。

Lex Fridman(00:09:09)為什麼很難證明關於這組方程的一般性結果,比如它不會爆炸?

陶哲軒(00:09:17)簡短的回答是麥克斯韋妖。所以,麥克斯韋妖是熱力學中的一個概念。如果你有一個裝有兩種氣體的盒子,氧氣和氮氣,也許你開始時所有氧氣在一邊,氮氣在另一邊,但它們之間沒有屏障。然後它們會混合,它們應該保持混合。它們沒有理由應該不混合。但原則上,由於它們之間的所有碰撞,可能有某種奇怪的陰謀,也許有一個叫麥克斯韋妖的微觀惡魔,每次氧氣和氮氣原子碰撞時,它們會以這樣的方式反彈,氧氣有點漂移到一邊,然後氮氣去另一邊。你可能有一個極其不可能的配置出現,我們從未見過,統計上極其不可能,但數學上這是可能的,我們無法排除這一點。

(00:10:06)這是在數學中經常出現的情況。一個基本例子是π的數字3.14159等等。數字看起來沒有模式,我們相信它們沒有模式。從長期來看,你應該看到同樣多的1、2、3和4、5、6,π的數字應該沒有偏好,比如說偏好7而不是8。但也許π的數字中有某個惡魔,每次你計算更多數字時,它會偏向一個數字而不是另一個。這是一個不應該發生的陰謀。沒有理由它應該發生,但用我們目前的技術無法證明它。所以,回到納維-斯托克斯,流體有一定的能量,因為流體在運動中,能量被傳輸。

(00:10:53)水也是粘性的,所以如果能量分散在許多不同的位置,流體的天然粘性會阻尼能量,會變為零。這是當我們實際用水做實驗時發生的情況。你飛濺,有一些湍流和波浪等等,但最終它會安定下來,振幅越低,速度越小,越平靜。但潛在地有某種惡魔不斷將流體的能量推入越來越小的尺度,它會移動得越來越快。在更快的速度下,粘性的效果相對較少。所以可能發生的是,它創造了某種所謂的自相似斑點情景,流體的能量從某個大尺度開始,然後它將所有能量轉移到流體的較小區域,然後以更快的速度移動到更小的區域,等等。

(00:11:55)每次這樣做,也許需要前一次一半的時間,然後你實際上可以收斂到在有限時間內所有能量集中在一點。這種情景被稱為有限時間爆炸。所以,在實踐中,這不會發生。水是所謂的湍流。所以,確實如果你有一個大的水渦,它會趨向於分解成更小的渦流,但它不會將所有能量從一個大渦流轉移到一個更小的渦流。它會轉移到也許三個或四個,然後那些分裂成也許三個或四個它們自己的小渦流。所以能量被分散到粘性可以控制一切的程度。但如果它能夠以某種方式集中所有能量,保持它們在一起,並且做得足夠快以至於粘性效應沒有足夠的時間讓一切平靜下來,那麼這種爆炸可能發生。

(00:12:51)所以,有一些論文聲稱,"哦,你只需要考慮能量守恆,仔細使用粘性,你可以不僅為納維-斯托克斯,而且為許多許多這類方程保持一切在控制之下。"過去有許多嘗試獲得納維-斯托克斯所謂的全域正則性,這與有限時間爆炸相反,即速度保持光滑。它們都失敗了。總是有一些符號錯誤或一些微妙的錯誤,無法挽救。

(00:13:17)所以,我感興趣的是試圖解釋為什麼我們無法反證有限時間爆炸。我無法為實際的流體方程做到這一點,那太複雜了,但如果我能平均納維-斯托克斯的運動方程,基本上如果我能關閉水相互作用的某些類型,只保留我想要的。特別是,如果有流體,它可以將能量從大渦流轉移到這個小渦流或另一個小渦流,我會關閉將能量轉移到這個的能量通道,只將其導向這個更小的渦流,同時仍保持較低的能量守恆。

Lex Fridman(00:13:58)所以,你試圖製造一個爆炸?

陶哲軒(00:14:00)是的,是的。所以,我基本上通過改變物理定律來設計一個爆炸,這是數學家被允許做的一件事。我們可以改變方程。

Lex Fridman(00:14:08)這如何幫助你更接近某事的證明?

陶哲軒(00:14:11)對。所以,它提供了數學中所謂的阻礙。所以,我所做的基本上是,如果我關閉方程的某些部分,當你關閉某些相互作用時,通常會使它變得不那麼非線性,使它更正則,不太可能爆炸。但我發現通過關閉一組非常精心設計的相互作用,我可以迫使所有能量在有限時間內爆炸。所以,這意味著如果你想為納維-斯托克斯的實際方程證明正則性,你必須使用真實方程的某個特徵,而我的人工方程不滿足。所以,它排除了某些方法。

(00:14:55)關於數學的事情是,它不只是採用一個將要工作的技術並應用它,而是你需要不採用不工作的技術。對於真正困難的問題,通常有幾十種你可能認為可能適用於解決問題的方法,但只有在大量經驗之後,你才意識到這些方法沒有辦法工作。所以,有這些相鄰問題的反例排除了...它為你節省了很多時間,因為你不會在你現在知道不可能工作的事情上浪費精力。

Lex Fridman(00:15:30)它與流體動力學的那個特定問題有多深的聯絡,或者這是你對數學建立的一些更一般的直覺?

陶哲軒(00:15:38)對。是的。所以,我的技術利用的關鍵現像是所謂的超臨界性。在偏微分方程[聽不清00:15:46]中,這些方程經常像不同力之間的拔河。在納維-斯托克斯中,有來自粘性的耗散力,這很好理解。它是線性的,它使事情平靜下來。如果粘性是所有存在的,那麼永遠不會發生任何壞事,但也有傳輸,空間中一個位置的能量可以因為流體運動而傳輸到其他位置。這是一個非線性效應,這導致了所有問題。所以,在納維-斯托克斯方程中有這兩個競爭項,耗散項和傳輸項。如果耗散項佔主導,如果它很大,那麼基本上你得到正則性。如果傳輸項佔主導,那麼我們不知道發生了什麼。這是一個非常非線性的情況,不可預測,湍流。

(00:16:32)所以,有時這些力在小尺度上平衡但在大尺度上不平衡,反之亦然。納維-斯托克斯是所謂的超臨界。在越來越小的尺度上,傳輸項比粘性項強得多。粘性項是使事情平靜下來的東西。這就是為什麼問題很難。在二維中,蘇聯數學家Ladyzhenskaya,她在60年代證明了在二維中沒有爆炸。在二維中,納維-斯托克斯方程是所謂的臨界,傳輸和粘性的效果即使在非常非常小的尺度上也大致相同強度。我們有很多技術來處理臨界和亞臨界方程並證明正則性。但對於超臨界方程,不清楚發生了什麼,我做了很多工作,然後有很多後續工作表明,對於許多其他類型的超臨界方程,你可以創造各種爆炸例子。

(00:17:27)一旦非線性效應在小尺度上主導線性效應,你可以有各種壞事發生。所以,這是這條工作線的主要洞察之一,即超臨界性與臨界性和亞臨界性,這產生了很大差異。這是區分一些方程是好的、可預測的關鍵定性特徵...像行星運動,有某些方程你可以預測數百萬年或至少數千年。這不是真的問題,但我們無法預測兩周後的天氣是有原因的,因為它是一個超臨界方程。在非常精細的尺度上發生了很多真正奇怪的事情。

Lex Fridman(00:18:04)所以,每當有某種巨大的非線性來源時,這可能為預測將要發生的事情創造一個巨大的問題?

陶哲軒(00:18:13)是的。如果非線性以某種方式在小尺度上更多地特色和有趣。有許多非線性方程,但在許多方程中,你可以通過總體來近似事物。例如,行星運動,如果你想理解月球或火星的軌道,你真的不需要月球的微觀結構或地震學或質量是如何精確分佈的。基本上,你幾乎可以將這些行星近似為點質量,只有總體行為是重要的。但如果你想建模流體,比如天氣,你不能只說,"在洛杉磯溫度是這個,風速是這個。"對於超臨界方程,精細尺度資訊真的很重要。

Lex Fridman(00:18:54)如果我們可以在納維-斯托克斯方程上停留一點。你建議過,也許你可以描述它,解決它或否定地解決它的方法之一是構造一種液體電腦,然後表明來自計算理論的停機問題對流體動力學有後果,以這種方式表明它。你能描述這個想法嗎?

陶哲軒(00:19:22)對,是的。這來自構造這個爆炸的平均方程的工作。作為我必須做的部分,有這種天真的方法,你只是保持推動。每次你得到一個尺度,你儘可能快地立即將其推到下一個尺度。這是強制爆炸的天真方法。事實證明在五維和更高維度中,這有效,但在三維中有這個我發現的有趣現象,如果你改變物理定律,你只是總是試圖將能量推入越來越小的尺度,發生的是能量開始同時分散到許多尺度,所以你在一個尺度上有能量。你將其推入下一個尺度,然後一旦它進入那個尺度,你也將其推到下一個尺度,但前一個尺度仍有一些能量剩餘。

(00:20:16)你試圖同時做所有事情,這分散了太多能量。然後事實證明這使其容易受到粘性的攻擊,實際上只是阻尼一切。所以,事實證明這種直接中止實際上不起作用。有其他作者的一篇單獨論文實際上在三維中證明了這一點。所以,我需要的是程式設計一個延遲,有點像氣閘。所以,我需要一個方程,它將從在一個尺度上做某事的流體開始,它會將這個能量推入下一個尺度,但它會待在那裡直到來自較大尺度的所有能量都被轉移。只有在你推入所有能量後,然後你打開下一個門,然後你也推入那個。

(00:21:01)所以,通過這樣做,能量一次一個尺度地慢慢前進,使得它總是在一個時間區域化在一個尺度上,然後它可以抵抗粘性的效應,因為它沒有分散。為了實現這一點,我必須構造一個相當複雜的非線性。它基本上...它被構造得像一個電子電路。我實際上為此感謝我的妻子,因為她受過電氣工程師的訓練,她談到她必須設計電路等等。如果你想要一個做某事的電路,也許有一個閃爍然後關閉然後開關的燈。你可以從更原始的元件,電容器和電阻器等等建構它,你必須建構一個圖表。

(00:21:47)這些圖表,你可以用眼球跟隨並說,"哦是的,電流會在這裡積累,它會停止,然後它會那樣做。"所以,我知道如何建構基本電子元件的類似物,比如電阻器和電容器等等。我會以這樣的方式將它們堆疊在一起,創造出能打開一個門的東西。然後會有一個時鐘,一旦時鐘達到某個閾值,它會關閉它。它會變成一個魯布·戈德堡類型的機器,但用數學描述。這最終奏效了。所以,我意識到如果你能對實際方程做同樣的事情,如果水的方程支援計算...所以,你可以想像蒸汽朋克,但它真的是水朋克類型的東西,其中...現代電腦是電子的,它們由通過非常小的導線傳遞並與其他電子相互作用的電子提供動力等等。

(00:22:39)但不是電子,你可以想像這些以某種速度移動的水脈衝。也許有兩種不同的配置對應於位向上或向下。可能如果你有兩個這些移動的水體碰撞,它們會以某種新配置出來,這將類似於AND門或OR門,輸出將以非常可預測的方式依賴於輸入。你可以將這些鏈在一起,也許建立一個圖靈機。然後你有完全由水製成的電腦。如果你有電腦,那麼也許你可以做機器人技術,液壓等等。所以你可以建立某個基本上是流體類似物的機器,叫做馮·諾依曼機器。

(00:23:26)馮·諾依曼提出如果你想殖民火星,將人員和機器運輸到火星的純粹成本是荒謬的,但如果你能將一台機器運輸到火星,這台機器有開採星球、創造一些更多材料、冶煉它們並建構同一台機器的更多副本的能力,那麼隨著時間的推移,你可以殖民整個星球。所以,如果你能建構一個流體機器,這是一個流體機器人。它在生活中的目的,它被程式設計為在某種冷態下建立自己的較小版本。它還不會開始。一旦它準備好,大的機器人水配置會將其所有能量轉移到較小的配置中,然後關閉。然後它們清理自己,剩下的是這個最新的狀態,然後會打開並做同樣的事情,但更小更快。

(00:24:19)方程有某種縮放對稱性。一旦你這樣做,它可以繼續迭代。所以,這原則上會為實際的納維-斯托克斯創造一個爆炸。這就是我設法為這個平均納維-斯托克斯完成的。所以,它提供瞭解決問題的路線圖。現在,這是一個白日夢,因為要使這成為現實還缺少很多東西。我無法建立這些基本邏輯閘。我沒有這些水的特殊配置。有候選者,這些包括可能工作的渦環。但模擬計算相比數字計算也非常令人討厭,因為總是有錯誤。你必須一路做大量的錯誤糾正。

(00:25:05)我不知道如何完全關閉大機器,所以它不會干擾較小機器的寫入,但原則上一切都可能發生。它不違反任何物理定律,所以這是這種事情可能的證據。現在有其他小組正在追求使納維-斯托克斯爆炸的方法,這些方法遠沒有我的這種方法那麼荒謬複雜。他們實際上追求的更接近直接自相似模型,這不能完全工作,但可能有一些更簡單的方案他們想要描述以使這個工作。

Lex Fridman(00:25:40)從納維-斯托克斯到這個圖靈機,這裡有一個真正的天才飛躍。從你試圖得到的自相似斑點情景,到越來越小的斑點,到現在有一個液體圖靈機變得越來越小,以某種方式看到如何用它來說關於爆炸的事情。這是一個大飛躍。

生命遊戲

陶哲軒(00:26:08)有先例。數學的特點是它真的擅長髮現你可能認為完全不同的問題之間的聯絡,但如果數學形式相同,你可以建立聯絡。在所謂的細胞自動機方面有很多先例,其中最著名的是康威的生命遊戲。有這個無限的離散網格,在任何給定時間,網格要麼被細胞佔據,要麼是空的。有一個非常簡單的規則告訴你這些細胞如何演化。有時細胞活著,有時它們死亡。當我是學生時,這是一個非常流行的螢幕保護程序,實際上只是有這些動畫進行,它們看起來非常混亂。事實上,它們有時看起來有點像湍流,但在某個時候人們在這個生命遊戲中發現了越來越有趣的結構。例如,他們發現了這個叫滑翔機的東西。

(00:27:00)滑翔機是四個或五個細胞的非常小配置,它演化並且只是朝某個方向移動。這就像這些渦環[聽不清00:27:09]。是的,這是一個類比,生命遊戲是一個離散方程,流體納維-斯托克斯是一個連續方程,但數學上它們有一些相似的特徵。隨著時間的推移,人們在生命遊戲中發現了越來越有趣的東西。生命遊戲是一個非常簡單的系統。它只有三個或四個規則,但你可以在其中設計各種有趣的配置。有一些叫滑翔機槍的東西,什麼都不做,只是一次吐出一個滑翔機。經過大量努力,人們設法為滑翔機建立AND門和OR門。

(00:27:48)有這個巨大的荒謬結構,如果你有一個滑翔機流從這裡進來,一個滑翔機流從這裡進來,那麼你可能產生極端滑翔機出來。也許如果兩個流都有滑翔機,那麼會有輸出流,但如果只有其中一個有,那麼什麼都不出來。他們可以建構這樣的東西。一旦你能建構這些基本門,那麼僅從軟體工程,你可以建構幾乎任何東西。你可以建構圖靈機。它們是巨大的蒸汽朋克類型的東西。它們看起來荒謬。但然後人們也在生命遊戲中生成了自我複製對象,一個巨大的機器,一個[聽不清00:28:31]機器,在很長時間內,總是看起來像裡面有滑翔機槍在做這些非常蒸汽朋克的計算。它會建立另一個可以複製的自己版本。

Lex Fridman(00:28:42)這太不可思議了。

陶哲軒(00:28:42)很多這實際上是由業餘數學家眾包完成的。我知道那項工作。這部分激發了我對納維-斯托克斯提出同樣想法的靈感。嚴肅地,模擬比數字差得多。你不能直接採用生命遊戲中的結構並將其插入。但同樣,它表明這是可能的。

Lex Fridman(00:29:06)這些細胞自動機有一種湧現,局部規則...也許它類似於流體,我不知道,但在尺度上運作的局部規則可以創造這些令人難以置信的複雜動態結構。你認為其中任何東西都適合數學分析嗎?我們有工具來說關於這方面的深刻事情嗎?

陶哲軒(00:29:34)問題是,你可以得到這些湧現的非常複雜的結構,但只有在非常仔細準備的初始條件下。這些滑翔機槍和門和自推進機器,如果你只是隨機放置一些細胞並解開它們,你不會看到任何這些。這與納維-斯托克斯的類似情況一樣,在典型的初始條件下,你不會有任何這種奇怪的計算進行。但基本上通過工程,通過以非常特殊的方式專門設計事物,你可以做聰明的構造。

Lex Fridman(00:30:07)我想知道是否可能證明...基本上證明只有通過工程你才能創造有趣的東西。

陶哲軒(00:30:16)是的。這是數學中反覆出現的挑戰,我稱之為結構和隨機性之間的二分法,你可以在數學中生成的大多數對象都是隨機的。它們看起來像隨機的,比如數字供應,我們相信這是一個好例子。但有很少數量的東西有模式。但現在,你可以通過構造來證明某事有模式...如果某事有簡單模式,你有證明它做某事比如每隔一段時間重複自己,你可以做到,你可以證明...例如,你可以證明大多數數字序列沒有模式。如果你只是隨機選擇數字,有所謂的低大數,它告訴你從長遠來看你會得到同樣多的1和2。但我們有更少的工具來...

(00:31:01)如果我給你一個特定的模式,比如π的數字,我如何表明這沒有某種奇怪的模式?我花了很多時間的一些其他工作是證明所謂的結構定理或逆定理,它們給出某事何時非常結構化的測試。一些函數是所謂的可加的。如果你有自然數到自然數的函數,也許2對應到4,3對應到6等等,一些函數是所謂的可加的,這意味著如果你將兩個輸入加在一起,輸出也被加在一起。例如,乘以常數。如果你將一個數乘以10...如果你將A加B乘以10,這與將A乘以10和B乘以10然後將它們加在一起相同。一些函數是可加的,一些函數有點可加但不完全可加。

(00:31:47)例如,如果我取一個數,將其乘以2的平方,我取其整數部分,所以10乘以2的平方根大約是14點什麼,所以10到14,20到28。在那種情況下,可加性有時是真的,所以10加10是20,14加14是28。但由於這種舍入,有時有舍入誤差,有時當你加A加A時,這個函數不太給你兩個單獨輸出的和,而是和加減一。所以,它幾乎可加,但不完全可加。

(00:32:21)在數學中有很多有用的結果,我已經在開發這樣的東西上做了很多工作,效果是如果一個函數表現出這樣的結構,那麼基本上有一個它為什麼是真的原因。原因是因為有一些其他附近的函數,實際上是完全結構化的,這解釋了你擁有的這種部分模式。如果你有這些逆定理,它創造了這種二分法,你研究的對像要麼根本沒有結構,要麼它們以某種方式與某種結構化的東西相關。在任何情況下,你都可以取得進展。這個很好的例子是在數學中有一個古老的定理-

無窮

陶哲軒(00:33:01)這個很好的例子是在數學中有一個古老的定理叫塞邁雷迪定理,在1970年代得到證明。它涉及試圖在一組數字中找到某種類型的模式,算術級數的模式。像3,5,7或10,15,20這樣的東西,塞邁雷迪,恩德雷·塞邁雷迪證明任何足夠大的數字集合,所謂的正密度,其中包含任何你希望長度的算術級數。

(00:33:28)例如,奇數的密度是1/2,它們包含任何長度的算術級數。在那種情況下,這是顯而易見的,因為奇數真的非常結構化。我可以取11,13,15,17,我可以很容易地在那個集合中找到算術級數,但塞邁雷迪定理也適用於隨機集合。如果我取一組奇數,我為每個數拋硬幣,我只保留我得到正面的數...所以我只是拋硬幣,我隨機取出一半的數,我保留一半。這是一個根本沒有模式的集合,但僅從隨機波動,你仍然會在那個集合中得到大量算術級數。

Lex Fridman(00:34:10)你能證明在隨機中有任意長度的算術級數嗎-

陶哲軒(00:34:17)是的。你聽說過無限猴子定理嗎?通常,數學家給定理起無聊的名字,但偶爾他們起有色彩的名字。

陶哲軒(00:34:24)無限猴子定理的流行版本是,如果你在房間裡有無數隻猴子,每隻都有打字機,它們隨機打出文字,幾乎肯定,其中一隻會生成哈姆雷特的整個劇本,或任何其他有限的文字字串。這需要一些時間,實際上相當長的時間,但如果你有無數隻,那麼它會發生。

(00:34:44)基本上,定理是如果你取一個無限的數字字串或其他什麼,最終你希望的任何有限模式都會出現。可能需要很長時間,但最終會發生。特別是,任何長度的算術級數最終會發生,但你需要一個極長的隨機序列才能發生這種情況。

Lex Fridman(00:35:04)我想這是直觀的。這就是無窮。

陶哲軒(00:35:08)是的,無窮吸收了很多罪。

Lex Fridman(00:35:11)是的。人類應該如何處理無窮?

陶哲軒(00:35:15)你可以將無窮想像為一個你沒有界限的有限數的抽象。現實生活中沒有什麼是真正無限的,但你可以問自己這樣的問題,"如果我有任意多的錢會怎樣?",或者,"如果我能跑得任意快會怎樣?",數學家形式化這一點的方式是,數學已經找到了一種形式主義來理想化,而不是某事極其大或極其小,實際上是確切地無限或零,當你這樣做時,數學往往變得更清潔。我的意思是,在物理學中,我們開玩笑說假設球形奶牛,現實世界的問題有各種現實世界的效應,但你可以理想化,將一些東西傳送到無窮,將一些東西傳送到零,數學變得更簡單。

Lex Fridman(00:36:06)我想知道使用無窮多久迫使我們偏離現實的物理學。

陶哲軒(00:36:17)有很多陷阱。我們在本科數學課上花很多時間教分析,分析通常是關於如何取極限以及是否...

(00:36:28)例如,A加B總是B加A。當你有有限項並且你加它們時,你可以交換它們,沒有問題,但當你有無限項時,你可以玩這些顯示遊戲,你可以有一個收斂到一個值的級數,但你重新排列它,它突然收斂到另一個值,所以你可能犯錯誤。當你允許無窮時,你必須知道你在做什麼。你必須引入這些ε和δ,有某種類型的推理波浪,幫助你避免錯誤。

(00:36:58)近年來,人們開始取在無限極限中為真的結果,並所謂地有限化它們。你知道某事最終是真的,但你不知道何時。現在給我一個速率。...如果我沒有無數隻猴子,而是大量有限隻猴子,我必須等多久才能出現哈姆雷特?這是一個更定量的問題,這是你可以用純有限方法攻擊的東西,你可以使用你的有限直覺,在這種情況下,事實證明它是你試圖生成的文字長度的指數。

(00:37:36)這就是為什麼你從未看到猴子創造哈姆雷特。你也許可以看到它們創造一個四字母單詞,但沒有那麼大的,所以我個人發現一旦你有限化一個無限陳述,它變得更直觀,不再那麼奇怪。

Lex Fridman(00:37:51)即使你正在處理無窮,有限化是好的,這樣你可以有一些直覺?

陶哲軒(00:37:57)是的,缺點是有限化的群更混亂。無限的通常首先被發現,早幾十年,然後後來,人們有限化它們。

數學與物理

Lex Fridman(00:38:07)既然我們提到了很多數學和很多物理學,數學和物理學作為學科、作為理解、看世界的方式有什麼區別?也許我們可以加上工程,你提到你妻子是工程師,在電路方面給了新的視角。看世界的這種不同方式,鑑於你做過數學物理,你戴過所有的帽子。

陶哲軒(00:38:30)對。我認為科學總的來說是三個東西之間的相互作用。有現實世界,有我們對現實世界的觀察,觀察,然後我們對世界如何工作的心理模型。

(00:38:46)我們不能直接接觸現實。我們所有的只是觀察,這些是不完整的,它們有錯誤,有許多許多情況,我們想知道,例如,明天的天氣如何,我們還沒有觀察,但我們想要。一個預測。

(00:39:04)然後我們有這些簡化的模型,有時做不現實的假設,球形奶牛類型的東西。這些是數學模型。

(00:39:11)數學關注模型。科學收集觀察,它提出可能解釋這些觀察的模型。數學做的是,我們停留在模型內,我們問這個模型的後果是什麼?什麼觀察,模型會對未來觀察做什麼預測,或過去觀察?它適合嗎?觀察資料?

(00:39:35)所以肯定有共生關係。我想數學在其他學科中是不尋常的,我們從假設開始,比如模型的公理,並問從那個模型中得出什麼結論。在幾乎任何其他學科中,你從結論開始。"我想做這個。我想建一座橋,我想賺錢,我想做這個,"然後你找到到達那裡的路徑。很少有關於"假設我做了這個,會發生什麼?"的推測。規劃和建模。推測小說也許是另一個地方,但僅此而已,實際上。我們在生活中做的大部分事情都是結論驅動的,包括物理學和科學。我的意思是,他們想知道,"這個小行星要去那裡?明天的天氣會是什麼?",但數學也有從公理出發的另一個方向。

Lex Fridman(00:40:32)你認為...在物理學中,理論和實驗之間存在這種緊張關係。你認為發現關於現實的真正新穎想法的更強大的方式是什麼?

陶哲軒(00:40:42)嗯,你需要兩者,自上而下和自下而上。這真的是所有這些之間的相互作用...隨著時間的推移,觀察、理論和建模都應該更接近現實,但最初,這總是情況,它們開始相距很遠,但你需要一個來弄清楚推動另一個的地方。

(00:41:04)如果你的模型預測實驗沒有預測的異常,這告訴實驗者在那裡尋找更多資料來完善模型。所以它來回進行。

(00:41:21)在數學本身內,也有理論和實驗成分。只是直到最近,理論幾乎完全主導。99%的數學是理論數學,有非常少量的實驗數學。人們確實做它。如果他們想研究素數或其他什麼,他們可以生成巨量資料集。

(00:41:41)一旦我們有了電腦,我們必須做一點。雖然甚至在此之前...比如高斯,他發現了重新猜想,數論中最基本的定理,叫素數定理,它預測到一百萬,到一兆有多少素數。這不是一個明顯的問題,基本上他所做的是他計算,主要是自己,但也僱傭人類電腦,專業工作是做算術的人,計算前十萬個素數或什麼,製作表格並做預測。這是實驗數學的早期例子,但直到最近,這不是...

(00:42:22)理論數學就是更成功。當然,做複雜的數學計算直到最近是不可行的,即使現在,即使我們有強大的電腦,只有一些數學事物可以數值探索。

(00:42:37)有一個叫組合爆炸的東西。如果你想讓我們研究,例如,塞邁雷迪定理,你想研究從1到1000的所有可能數字子集。只有1000個數字。有多糟糕?事實證明,從1到1000的不同子集的數量是2的1000次方,這比任何電腦目前能夠列舉的都要大得多。

(00:42:59)所以有某些數學問題很快就變得無法通過直接暴力計算來處理。國際象棋是另一個著名的例子。國際象棋位置的數量,我們無法讓電腦完全探索,但現在我們有AI,我們有工具來探索這個空間,不是100%成功保證,而是通過實驗。所以我們現在可以經驗性地解決國際象棋。例如,我們有非常非常好的AI,它們不探索遊戲樹中的每一個位置,但它們找到了一些非常好的近似,人們實際上正在使用這些國際象棋引擎來做實驗國際象棋。他們重新審視關於國際象棋的舊理論,"哦,當你做這種類型的開局時...這是一種好的移動類型,這不是,"他們可以使用這些國際象棋引擎來實際完善,在某些情況下,推翻關於國際象棋的傳統智慧,我確實希望數學在未來會有更大的實驗成分,也許由AI驅動。

Lex Fridman(00:44:05)我們當然會談論這一點,但在國際象棋的情況下,還有數學中的類似事物,我不相信它提供了對不同位置的某種正式解釋。它只是說那個位置更好或不好,你可以作為人類直覺,然後從那裡,我們人類可以構造問題的理論。

現實的本質

(00:44:27)你提到了柏拉圖洞穴寓言。如果人們不知道,它是人們觀察現實的陰影,而不是現實本身,他們相信他們觀察到的就是現實。在某種意義上,這是數學家,也許所有人類正在做的,看著現實的陰影嗎?我們真的能夠接觸現實嗎?

陶哲軒(00:44:55)嗯,有這三個本體論的東西。有實際現實,有觀察和我們的模型,從技術上講它們是不同的,我認為它們總是不同的,但隨著時間的推移它們可以變得更接近,變得更接近的過程往往意味著你必須丟棄你最初的直覺。天文學提供了很好的例子,比如世界的最初模型是平的,因為它看起來平坦且很大,宇宙的其餘部分,天空,不是。太陽,例如,看起來真的很小。

(00:45:38)所以你從一個實際上遠離現實的模型開始,但它符合你擁有的觀察。所以事情看起來不錯,但隨著時間的推移,當你做越來越多的觀察時,使其更接近現實,模型被拖著一起,隨著時間的推移,我們必須意識到地球是圓的,它旋轉,它圍繞太陽系運行,太陽系圍繞銀河系運行,等等,宇宙正在膨脹。膨脹正在自我膨脹,加速,事實上,今年非常最近...甚至宇宙本身的加速,現在有證據表明它是非恆定的。

Lex Fridman(00:46:13)背後的解釋為什麼...

Lex Fridman(00:46:18)它正在趕上。我的意思是,它仍然是暗物質,暗能量,這種東西。

陶哲軒(00:46:23)我們有一個解釋的模型,非常好地符合資料。它只是有一些你必須指定的參數。人們說,"哦,那是保險係數。有足夠的保險係數,你可以解釋任何事情,"但模型的數學觀點是你想在你的模型中有更少的參數和觀察集中的資料點。

(00:46:43)如果你有一個帶有10個參數解釋10個觀察的模型,那是一個完全無用的模型,它是所謂的過度擬合,但如果你有一個帶有兩個參數解釋一兆觀察的模型,基本上是暗物質模型,我認為它有14個參數,它解釋了天文學家擁有的PB級資料。

(00:47:06)你可以想像一個理論。想像物理數學理論的一種方式是它是宇宙的壓縮,資料壓縮。你有這些PB級的觀察,你想將其壓縮到一個你可以用五頁描述並指定一定數量參數的模型,如果它能以合理的精度符合幾乎所有你的觀察,你做的壓縮越多,你的理論越好。

Lex Fridman(00:47:32)事實上,我們宇宙和其中一切的一個偉大驚喜是它根本是可壓縮的。這是數學的不合理有效性。

陶哲軒(00:47:40)是的,愛因斯坦有一句這樣的話。"關於宇宙最不可理解的事情是它是可理解的。"

Lex Fridman(00:47:45)對,不只是可理解的。你可以做一個像e=MC²這樣的方程。

陶哲軒(00:47:49)對此實際上有一些可能的解釋。數學中有這個叫普遍性的現象。許多複雜系統在宏觀尺度上來自微觀尺度上的許多微小相互作用,通常,由於交換爆炸,你會認為宏觀尺度方程必須比宏觀尺度方程無限地、指數地更複雜,它們是,如果你想完全精確地解決它們。如果你想建模一盒空氣中的所有原子...

(00:48:21)阿伏伽德羅數是巨大的。有大量的粒子。如果你實際上試圖跟蹤每一個,那會是荒謬的,但某些定律在微觀尺度上出現,幾乎不依賴於宏觀尺度上發生的事情,或者只依賴於非常少的參數。

(00:48:35)如果你想建模盒子中一千兆個粒子的氣體,你只需要知道溫度和壓力和體積,以及一些參數,比如五個或六個,它建模了你需要知道的關於這些10的23次方或其他什麼粒子的幾乎一切。我們在數學上對普遍性的理解遠不如我們希望的那樣,但有更簡單的玩具模型,我們確實很好地理解了為什麼普遍性發生。最基本的是中央極限定理,它解釋了為什麼鐘形曲線在自然界中無處不在,如此多的東西由所謂的高斯分佈,著名的鐘形曲線分佈。現在甚至有這個曲線的模因。

Lex Fridman(00:49:18)甚至模因也廣泛適用。模因的普遍性。

陶哲軒(00:49:22)是的,如果你喜歡,你可以變得更深層,但有許多許多過程。例如,你可以取許多獨立隨機變數並以各種方式將它們平均在一起。你可以取簡單平均或更複雜的平均,我們可以在各種情況下證明這些鐘形曲線,這些高斯,出現,這是一個令人滿意的解釋。

(00:49:44)有時它們不會。如果你有許多不同的輸入,它們都以某種系統性方式相關,那麼你可以得到遠離鐘形曲線的東西出現,知道[聽不清00:49:55]何時失敗也很重要。所以普遍性不是100%可靠的依賴東西。全球金融危機是這個的一個著名例子。人們認為抵押貸款違約有這種高斯類型行為,如果有十萬美國人有抵押貸款的人口,問他們中有多少比例會違約他們的抵押貸款,如果一切都是去相關的,它會是一個資產鐘形曲線,你可以管理期權和衍生品的風險等等,有一個非常美麗的理論,但如果經濟中有系統性衝擊可以推動每個人同時違約,那是非常非高斯行為,這在2008年沒有被完全考慮。

(00:50:45)現在我認為有一些更多的意識,這種系統性風險實際上是一個更大的問題,僅僅因為模型漂亮和好,它可能不匹配現實。計算模型做什麼的數學真的很重要,但驗證模型何時符合現實何時不符合的科學...你需要兩者,但數學可以幫助,因為例如,這些中央極限定理,它告訴你如果你有某些公理比如非相關性,如果所有輸入彼此不相關,那麼你有這種高斯行為,事情很好。它告訴你在模型中尋找弱點的地方。

(00:51:25)如果你對塞邁雷迪定理有數學理解,有人提議使用這些高斯[聽不清00:51:32]或其他什麼來建模違約風險,如果你受過數學訓練,你會說,"好的,但你所有輸入之間的系統相關性是什麼?"然後你可以問經濟學家,"那有多大風險?"然後你可以去尋找那個。所以科學和數學之間總是有這種協同作用。

Lex Fridman(00:51:52)在普遍性話題上一點,你以在數學的令人難以置信的廣度上工作而聞名和受到讚揚,讓人想起一個世紀前的希爾伯特。事實上,偉大的菲爾茲獎獲得者數學家蒂姆·高爾斯說你是我們最接近希爾伯特的人。他是你的同事。

陶哲軒(00:52:16)哦是的,好朋友。

Lex Fridman(00:52:16)但無論如何,你以這種既深入又廣泛進入數學的能力而聞名。你是問這個問題的完美人選。你認為有線索連線學的所有不同領域嗎?數學是否有某種深層的、潛在的結構?

陶哲軒(00:52:36)肯定有很多連接線索,數學進步的很多可以通過取...通過以前沒有連接的數學的兩個領域,並找到連接的故事來表示。

(00:52:50)一個古老的例子是幾何和數論。在古希臘時代,這些被認為是不同的學科。數學家在兩個方面都工作。歐幾里得在幾何方面工作,最著名的,但也在數字方面,但它們真的不被認為是相關的。有一點,比如你可以說這個長度是這個長度的五倍,因為你可以取這個長度的五個副本等等,但直到笛卡爾,他開發瞭解析幾何,你可以通過兩個實數來參數化平面,一個幾何對象。所以幾何問題可以轉化為關於數字的問題。

(00:53:35)今天這感覺幾乎微不足道。這沒有內容。當然,平面是X和Y,因為這是我們教的,它是內化的,但這是一個重要的發展,這兩個領域被統一了,這個過程在整個數學中一次又一次地繼續。代數和幾何被分開,現在我們有這個流體的,連接它們的代數幾何,一次又一次,這確實是我最喜歡的數學類型。

(00:54:06)我認為成為數學家有不同的風格。我認為刺蝟和狐狸...狐狸知道很多事情一點點,但刺蝟知道一件事非常非常好,在數學中,肯定有刺蝟和狐狸,然後有人可以扮演兩個角色,我認為理想的合作,英國數學家涉及非常...你需要一些多樣性,比如狐狸與許多刺蝟合作或反之亦然,但我主要認同為狐狸,當然。我喜歡套利,以某種方式。學習一個領域如何工作,學習那個車輪的技巧,然後去另一個人們不認為相關的領域,但我可以適應技巧。

Lex Fridman(00:54:49)所以看到領域之間的聯絡。

陶哲軒(00:54:52)是的。有其他數學家比我深得多。他們真的是刺蝟。他們知道一個領域的一切,他們在那個領域更快更有效,但我可以給他們這些額外的工具。

Lex Fridman(00:55:05)我的意思是,你說過你可以既是刺蝟又是狐狸,取決於上下文,取決於合作。如果可能的話,你能談談這兩種思考問題的方式之間的區別嗎?比如你遇到一個新問題,尋找聯絡與非常單一的焦點。

陶哲軒(00:55:26)我對狐狸範式更舒服。是的。我喜歡尋找類比,敘述。我花很多時間...如果有一個結果,我在一個領域看到它,我喜歡這個結果,這是一個很酷的結果,但我不喜歡證明,它使用我不太熟悉的數學類型,我經常試圖使用我喜歡的工具自己重新證明它。

(00:55:53)通常,我的證明更糟,但通過練習他們在做,所以我可以說,"哦,現在我可以看到另一個證明試圖做什麼,"從那裡,我可以得到一些對那個領域使用的工具的理解。所以這非常探索性,非常...在瘋狂的領域做瘋狂的事情,重新發明輪子很多,而刺蝟風格,我認為,更學術。你非常基於知識。你跟上這個領域的所有發展,你知道所有歷史,你對每個特定技術的優點和弱點有非常好的理解。我認為你比尋找敘述更依賴計算。是的,我也可以做到,但其他人在那方面非常好。

Lex Fridman(00:56:44)讓我們退後一步,也許看看數學的有點浪漫化版本。我想你說過早期在你的生活中,數學更像是一個解謎活動,當你年輕的時候。你第一次遇到一個問題或證明,你意識到數學可以有某種優雅和美麗是什麼時候?

陶哲軒(00:57:11)這是一個好問題。當我來到普林斯頓研究生院時,約翰·康威當時在那裡,他幾年前去世了,但我記得我參加的最早的研究講座之一是康威關於他稱之為極端證明的講座。

(00:57:28)康威就是有這種對各種事物的驚人思考方式,你通常不會那樣想。他認為證明本身佔據某種空間。如果你想證明某事,比如說有無窮多個素數,你有所有不同的證明,但你可以在不同的軸上對它們進行排名。一些證明是優雅的,一些證明是長的,一些證明是基本的等等,所以有這個雲,所以所有證明的空間本身有某種形狀,他對這個形狀的極端點感興趣。在所有這些證明中,那一個是最短的,以犧牲其他一切為代價,或最基本的或其他什麼?

(00:58:09)他給出了一些著名定理的例子,然後他會給出他認為在這些不同方面是極端證明的東西。我發現這真的開闊眼界,不只是為結果得到證明很有趣,而是一旦你有了那個證明,試圖以各種方式最佳化它,證明本身有一些工藝性。

(00:58:40)這確實影響了我的寫作風格,比如當你做數學作業時,作為本科生,你的作業等等,你被鼓勵只是寫下任何有效的證明並交上去,只要它得到一個勾號,你就繼續,但如果你想讓你的結果真正有影響力並被人閱讀,它不能只是正確的。它也應該是閱讀的樂趣,有動機,可以適應泛化到其他事物。在許多其他學科中都是一樣的,比如編碼。數學和編碼之間有很多類比。我喜歡類比,如果你沒有注意到的話。你可以編碼某些東西,義大利面條程式碼,對某個任務有效,它是快速和骯髒的,它有效,但有很多寫好程式碼的良好原則,這樣其他人可以使用它,在其上建構,這樣它有更少的錯誤等等,數學中有類似的東西。

Lex Fridman(00:59:37)是的,首先,那裡有很多美麗的東西,[聽不清00:59:42]是數學史上偉大的思想之一,電腦科學,甚至考慮證明的空間並說,"好的,這個空間看起來像什麼,極端是什麼?"

(00:59:56)你提到編碼作為類比很有趣,因為也有這個叫程式碼高爾夫的活動,我也覺得美麗和有趣,人們使用不同的程式語言試圖編寫完成特定任務的最短可能程序,我相信甚至有這方面的比賽,這也是一個很好的方式來壓力測試不僅僅是程序,或在這種情況下,證明,而且也是不同的語言。也許那是不同的符號或用來完成不同任務的其他東西。

陶哲軒(01:00:31)是的,你學到很多。我的意思是,這可能看起來像一個輕浮的練習,但它可以產生所有這些洞察,如果你沒有這個人工目標要追求,你可能不會看到...

Lex Fridman(01:00:43)對你來說,數學中最美麗或優雅的方程是什麼?我的意思是,人們在美中經常尋找的東西之一是簡單性。如果你看e=MC²...當一些概念聚集在一起時,這就是為什麼歐拉恆等式經常被認為是數學中最美麗的方程。你在那個中找到美嗎,在歐拉恆等式中?

陶哲軒(01:01:08)是的。我說過,我發現最吸引人的是不同事物之間的聯絡...所以如果你...π等於負一。人們使用所有基本常數。好的。我的意思是,那很可愛,但對我來說...

(01:01:24)指數函數,由歐拉,是測量指數增長。複利或衰減,任何連續增長、連續減少、增長和衰減,或擴張或收縮的東西,都由指數函數建模,而π來自圓和旋轉,對吧?如果你想旋轉一根針,例如,一百度,你需要旋轉π弧度,i,複數,表示虛軸的交換,90度旋轉。所以方向的改變。

(01:01:53)指數函數表示在你已經在的方向上的增長和衰減。當你在指數中放入i時,現在不是在與你當前位置相同方向的運動,而是在與你當前位置成直角的運動。所以旋轉,然後,所以E的πi次方等於負一告訴你,如果你旋轉時間π,你最終在另一個方向。所以它統一了通過擴張和指數增長的幾何或通過這個復化行為、旋轉π i的動力學。它連接了所有這兩個數學,動力學、幾何和複數。它們都被認為幾乎...它們都是數學中的鄰居,因為這個恆等式。

Lex Fridman(01:02:37)你認為你提到的Q,來自這些不同領域的符號的碰撞,只是一個輕浮的副作用,還是你認為當符號...雖然我們的老朋友在夜晚聚在一起時有合法的價值?

陶哲軒(01:02:54)嗯,這是你有正確概念的確認。當你第一次研究任何東西時,你必須測量事物,給它們命名,最初有時,因為你的模型,再次,離現實太遠,你給錯誤的事物最好的名字,你只是後來發現什麼真正重要。

Lex Fridman(01:03:14)物理學家有時可以這樣做,但結果還好。

陶哲軒(01:03:18)實際上,物理學[聽不清01:03:19] e=MC²。一個大事情是E,對吧?當亞里士多德第一次提出他的運動定律時,然後伽利略和牛頓等等,他們看到他們可以測量的東西,他們可以測量質量和加速度和力等等,所以牛頓力學,例如,F=ma,是著名的牛頓第二運動定律。這些是主要對象。他們在理論中給了它們中心位置。

(01:03:44)只是在人們開始分析這些方程後,總是似乎有這些守恆的量。特別是,動量和能量,某些東西有能量並不明顯。它不是你可以直接測量的東西,就像你可以測量質量和速度一樣,兩者都是,但隨著時間的推移,人們意識到這實際上是一個真正的基本概念。

(01:04:05)漢密爾頓,最終在19世紀,將牛頓物理定律重新表述為所謂的哈密頓力學,其中能量,現在稱為哈密頓量,是主導對象。一旦你知道如何測量任何系統的哈密頓量,你可以完全描述動力學,比如所有狀態發生什麼。它真的是中心演員,這最初並不明顯,這種視角的改變在量子力學出現時真的很有幫助,因為研究量子力學的早期物理學家,他們在試圖適應他們的牛頓思維方面有很多困難,因為一切都是粒子等等,到量子力學,因為一切都是波,但它看起來真的非常奇怪。

(01:04:51)你問,"F=ma的量子版本是什麼?",真的很難給出答案,但事實證明,在經典力學中秘密在幕後的哈密頓量,也是量子力學中的關鍵對象,也有一個叫哈密頓量的對象。它是不同類型的對象。它是所謂的算子而不是函數,但同樣,一旦你指定它,你就指定了整個動力學。

(01:05:17)有一個叫薛定諤方程的東西,一旦你有哈密頓量,它就精準地告訴你量子系統如何演化。並排,它們看起來完全不同的對象。一個涉及粒子,一個涉及波等等,但有了這種中心性,你可以開始實際轉移很多直覺和事實從經典力學到量子力學。例如,在經典力學中,有這個叫諾特定理的東西。每次物理系統中有對稱性時,就有守恆定律。物理定律是平移不變的。如果我向左移動10步,我體驗到與在這裡相同的物理定律,這對應於動量守恆。如果我轉一個角度,我體驗相同的物理定律。這對應於角動量守恆。如果我等10分鐘,我仍然有相同的物理定律。

陶哲軒(01:06:00)如果我等10分鐘,我仍然有相同的物理定律。所以有時間平移不變性。這對應於能量守恆定律。所以對稱性和守恆之間有這種基本聯絡。這在量子力學中也是真的,即使方程完全不同,但因為它們都來自哈密頓量,哈密頓量控制一切,每次哈密頓量有對稱性時,方程就會有守恆壁。一旦你有正確的語言,它實際上使事情清潔得多。

(01:06:32)我們無法統一量子力學和廣義相對論的問題之一,我們還沒有弄清楚基本對像是什麼。例如,我們必須放棄空間和時間是這些幾乎歐幾里得類型空間的概念,它必須是,我們知道在非常小的尺度上會有量子波動。有時空泡沫,試圖使用笛卡爾坐標X、Y、Z。這是一個非起動器,但我們不知道用什麼來替換它。我們實際上沒有概念,組織一切的哈密頓量的類似物。

萬有理論

Lex Fridman(01:07:09)你的直覺說有萬有理論嗎,這甚至可能統一,找到統一廣義相對論和量子力學的語言?

陶哲軒(01:07:19)我相信如此。物理學的歷史一直是統一,就像多年來的數學一樣。[聽不清01:07:26]磁學是分離的理論,然後麥克斯韋統一了它們。牛頓統一了天體運動和地球上物體的運動等等。所以應該發生。只是,再次,回到觀察和理論的模型,我們問題的一部分是物理學是自己成功的受害者。我們的兩個大物理理論,廣義相對論和量子力學現在如此好,以至於它們一起覆蓋了我們可以做的99.9%的所有觀察。你必須去極其瘋狂的粒子加速或早期宇宙或真的很難測量的東西,以便從這兩個理論中的任何一個得到任何偏差,以至於你可以實際弄清楚如何將它們結合在一起。但我有信心我們幾個世紀以來一直在這樣做,我們以前取得了進展。沒有理由我們應該停止。

Lex Fridman(01:08:18)你認為你會是開發萬有理論的數學家嗎?

陶哲軒(01:08:24)經常發生的是,當物理學家需要某種數學理論時,通常有一些數學家早期工作出來的前身。當愛因斯坦開始意識到空間是彎曲的時,他去找一些數學家問,"有一些數學家已經提出的彎曲空間理論可能有用嗎?"他說,"哦是的,我想黎曼想出了什麼。"所以是的,黎曼開發了黎曼幾何,這正是各種一般方式彎曲的空間理論,這幾乎正是愛因斯坦理論所需要的。這又回到了數學的弱點和不合理有效性。我認為工作良好、解釋宇宙的理論,往往也涉及解決數學問題工作良好的相同數學對象。最終,它們只是以有用方式組織資料的兩種方式。

Lex Fridman(01:09:17)只是感覺像你可能需要去一些很難直覺的奇怪土地。你有弦理論。

陶哲軒(01:09:25)是的,那是幾十年來的領先候選。我認為它慢慢失寵。它不匹配實驗。

Lex Fridman(01:09:33)所以當然,一個大挑戰是實驗非常困難,因為如你所說,兩個理論都多麼有效。但另一個是你談論的你不只是偏離時空。你進入一些瘋狂的維數。你做各種奇怪的東西,對我們,我們已經從我們開始的這個平地走了這麼遠,如你提到的,現在我們的有限猿後代認知很難直覺那個現實真正是什麼。

陶哲軒(01:10:10)這就是為什麼類比如此重要。是的,圓形地球不直觀,因為我們被困在上面。但一般的圓形對象,我們有相當好的直覺,我們對光如何工作等等有興趣。實際上鍛鍊日食和太陽和月亮的相位等等如何能被圓形地球和圓形月亮和模型真正容易地解釋是一個好練習。你可以拿一個籃球和一個高爾夫球和一個光源,實際上自己做這些事情。所以直覺在那裡,但你必須轉移它。

Lex Fridman(01:10:47)這對我們來說是一個大的智力飛躍,從平到圓形地球,因為我們的生活主要生活在平地上。載入那個資訊,我們都理所當然地接受它。我們理所當然地接受很多東西,因為科學已經為這種東西建立了很多證據,但我們在一個圓形岩石上飛過太空。是的,那是一個大飛躍。你必須進行一連串那些飛躍。我們進步得越來越多,

陶哲軒(01:11:15)對,是的。現代科學也許,再次,是自己成功的受害者,為了更準確,它必須移動得越來越遠離你最初的直覺。對於沒有經歷整個科學教育過程的人來說,因此它看起來更可疑。我們需要更多接地。有科學家做優秀的外展,但有很多科學事情你可以在家做。很多YouTube視訊我最近做了YouTube視訊,Grant Sanderson,我們早期談過這個,古希臘人如何能夠測量像月球距離、地球距離這樣的東西,使用你也可以自己複製的技術。它不必都是花哨的太空望遠鏡和非常令人生畏的數學。

Lex Fridman(01:12:01)是的,我強烈推薦。我相信你給了一個講座,你也和Grant做了一個令人難以置信的視訊。試圖將自己置於那個時代被神秘籠罩的人的思想中是一個美麗的體驗。你在這個星球上,你不知道它的形狀,大小。你看到一些星星,你看到一些東西,你試圖在這個世界中定位自己,試圖對遙遠的地方做一些一般性的陳述。

陶哲軒(01:12:29)視角變化真的很重要。你說旅行開闊思維,這是智力旅行。將自己置於古希臘人或其他時期的人的思想中,做假設,球形[聽不清01:12:41],任何,推測。這就是數學家做的,一些其他,藝術家實際上做的。

Lex Fridman(01:12:48)令人難以置信的是,在極端約束下,你仍然可以說非常強有力的東西。這就是為什麼它鼓舞人心。回顧歷史,當你沒有太多東西來弄清楚東西時,能弄清楚多少。

陶哲軒(01:13:01)如果你提出公理,那麼數學做。你跟隨那些公理到它們的結論,有時你可以從最初假設走很長的路。

廣義相對論

Lex Fridman(01:13:10)如果我們可以停留在奇怪的土地上。你提到了廣義相對論。你為愛因斯坦場方程的數學理解做出了貢獻。你能解釋這項工作,從數學觀點,廣義相對論的那些方面對你有趣?對你有挑戰?

陶哲軒(01:13:31)我已經在一些方程上工作。有一個叫波對應方程或Sigma場模型的東西,它不完全是時空引力本身的方程,而是可能存在於時空上的某些場。愛因斯坦的相對論方程只是描述空間和時間本身。但然後有其他場生活在其上。有電磁場,有叫Yang-Mills場的東西,有這整個不同方程層次結構,其中愛因斯坦被認為是最非線性和困難的之一,但在層次結構中相對較低的是這個叫波對應方程的東西。所以它是一個波,在任何給定點被固定在一個球上。我可以想像空間和時間中的一束箭頭。是的,它們指向不同方向,但它們像波一樣傳播。如果你擺動一個箭頭,它會傳播並使所有箭頭移動,有點像麥田中的小麥束。

(01:14:27)我對全域正則性問題感興趣。再次對這個問題,這裡的能量是否可能在一點收集?所以我考慮的方程實際上是所謂的臨界方程,它實際上在所有尺度上的行為大致相同。我能夠勉強表明你實際上無法強制一個場景,其中所有能量集中在一點,能量必須稍微分散,只是稍微。它會保持正則。是的,這是在2000年。這是我之後對[聽不清01:14:58]感興趣的部分原因。我開發了一些技術來解決那個問題。這個問題真的是非線性的,因為球的曲率。有某種非線性效應,這是一個非擾動效應。當你正常看它時,它看起來比波方程的線性效應更大。所以即使你的能量很小,也很難保持事情在控制之下。

(01:15:23)但我開發了所謂的規範變換。方程有點像小麥束的演化,它們都來回彎曲,所以有很多運動。但如果你想像通過在空間的不同點附上小相機來穩定流動,這些相機試圖以捕獲大部分運動的方式移動,在這個穩定的流動下,流動變得更線性。我發現了一種變換方程以減少非線性效應數量的方法,然後我能夠解決方程。我在澳大利亞拜訪我阿姨時發現了變換,我試圖理解所有這些場的動力學,我無法用筆和紙做,我沒有足夠的電腦設施來做任何電腦模擬。

(01:16:08)我最終閉上眼睛躺在地板上,想像自己實際上是這個向量場,滾來滾去試圖看如何改變坐標,使得所有方向的東西都會以合理線性的方式表現。是的,我阿姨走進來看到我這樣做,她問,"我為什麼這樣做?"

Lex Fridman(01:16:28)複雜是答案。

陶哲軒(01:16:30)"是的,是的。好的,好的。你是一個年輕人。我不問問題。"

解決困難問題

Lex Fridman(01:16:34)我必須問關於你如何處理解決困難問題,如果可能進入你的思想,當你思考時,你在你的思想中可視化數學對象、符號,也許你在你的思想中可視化什麼?通常當你思考時?

陶哲軒(01:16:57)很多筆和紙。作為數學家你學到的一件事是我稱之為策略性作弊。數學的美在於你可以改變問題並隨心所欲地改變規則。你無法在任何其他領域做到這一點。如果你是工程師,有人說,"在這條河上建一座橋,"你不能說,"我想在這裡建這座橋,"或,"我想用紙而不是鋼建它,"但數學家,你可以做任何你想要的。這就像試圖解決一個有無限作弊程式碼可用的電腦遊戲。你可以設定這個,有一個很大的維度。我設定為一。我先解決一維問題。有一個主項和一個誤差項。我要做一個球形呼叫假設[聽不清01:17:45]項為零。

(01:17:45)你應該解決這些問題的方式不是這種鋼鐵人模式,你讓事情最大困難,而是你應該處理任何合理數學問題的方式是,如果有10個東西讓你的生活困難,找到一個問題版本,關閉九個困難,但只保留其中一個並解決它。然後你解決九個作弊。好的,你解決10個作弊,然後遊戲是微不足道的,但你解決九個作弊。你解決一個問題,教你如何處理那個特定困難。然後你關閉那個,你打開其他東西,然後你解決那個。在你知道如何分別解決10個問題,10個困難後,然後你必須開始一次合併幾個。

(01:18:26)作為孩子,我看了很多這些來自我們文化的香港動作電影,一件事是每次有打鬥場面,也許英雄被一百個壞人小兵群擁或什麼,但它總是被編排,使得他總是一次只與一個人打鬥,它會擊敗那個人並繼續。因為那樣,他可以擊敗所有人。但如果他們打得更聰明一點,只是一次群擁那個傢伙,這會使電影更糟,但他們會贏。

Lex Fridman(01:19:02)你通常是筆和紙嗎?你與電腦和LaTeX工作嗎?

陶哲軒(01:19:08)主要是筆和紙實際上。在我辦公室我有四個巨大的黑板,有時我只是必須將我對問題知道的一切寫在四個黑板上,然後坐在我的沙發上看整個東西。

Lex Fridman(01:19:20)它都是符號像符號還是有一些圖畫?

陶哲軒(01:19:23)哦,有很多繪畫和很多隻對我有意義的定製塗鴉。黑板的美在於你擦除,它是一個非常有機的東西。我開始越來越多地使用電腦,部分因為AI使做簡單編碼事情變得容易得多,如果我想繪製一個函數,這相當複雜,有一些迭代或什麼,我必須記住如何設定Python程序以及如何做完整循環工作並偵錯它,需要兩個小時等等。現在我可以在10,15分鐘內做到這一點。我使用越來越多的電腦來做簡單探索。

AI輔助定理證明

Lex Fridman(01:20:01)如果我們可以談論一點AI。也許一個好的入口點是談論一般的電腦輔助證明。你能描述Lean形式證明程式語言以及它如何作為證明助手幫助,也許你如何開始使用它以及它如何幫助你?

陶哲軒(01:20:25)Lean是一種電腦語言,很像標準語言如Python和C等等,除了在大多數語言中,焦點是使用可執行程式碼。程式碼行做事,它們翻轉位或它們使機器人移動或它們在網際網路上傳送你的文字或什麼。Lean是一種也可以做到的語言。它也可以作為標準傳統語言運行,但它也可以產生證書。像Python這樣的軟體語言可能做一個計算並給你答案是七。好的,三加四的和等於七嗎?

(01:20:59)但Lean可以產生不只是答案,而是它如何得到七的答案作為三加四的證明以及涉及的所有步驟。它建立這些更複雜的對象,不只是陳述,而是附有證明的陳述。每行程式碼只是將前面的陳述拼湊在一起建立新陳述的方式。這個想法不新。這些東西叫證明助手,它們提供語言,你可以建立相當複雜的數學證明。它們產生這些證書,如果你信任Lean的編譯器,它們給出100%保證你的論證是正確的,但他們使編譯器真的很小,有幾個不同的編譯器可用於Lean。

Lex Fridman(01:21:45)你能給人們一些關於在筆和紙與使用Lean程式語言之間寫作的區別的直覺嗎?形式化陳述有多難?

陶哲軒(01:21:56)Lean,很多數學家參與了Lean的設計。它被設計成單獨的程式碼行類似於單獨的數學論證行。你可能想引入一個變數,你想證明一個矛盾。有各種標準的事情你可以做,它被寫得...理想地應該像一對一對應。實際上,它不是,因為Lean向一個極其迂腐的同事解釋證明,他會指出,"好的,你真的是這個意思嗎?如果這是零會發生什麼?好的,你如何證明這個?"Lean有很多自動化來試圖不那麼煩人。例如,每個數學對象必須帶有一個類型。如果我談論X,X是實數還是自然數還是函數還是什麼?如果你非正式地寫東西,如果你有上下文,它通常是。你說,"顯然X等於讓X是Y和Z的和,Y和Z已經是實數,所以X也應該是實數。"Lean可以做很多那個,但每隔一段時間它說,等一下,你能告訴我更多關於這個對像是什麼嗎?什麼類型的對象?你必須在哲學層面思考更多,不只是你正在做的計算,而是每個對象實際上在某種意義上是什麼。

Lex Fridman(01:23:17)它使用像LLM這樣的東西來做類型推斷還是你匹配實數?

陶哲軒(01:23:23)它使用更傳統的所謂老式AI。你可以將所有這些東西表示為樹,有總是演算法將一個樹匹配到另一個樹。

Lex Fridman(01:23:30)所以弄清楚某事是實數還是自然數實際上是可行的。

陶哲軒(01:23:36)每個對象都帶有它來自那裡的歷史,你可以追溯它。

陶哲軒(01:23:41)是的。它被設計為可靠性。現代AI沒有被使用,這是一個不相交的技術。人們開始在Lean之上使用AI。當數學家試圖在Lean中程式設計證明時,通常有一個步驟。好的,現在我想使用微積分的基本東西,比如說做下一步。Lean開發者建立了這個叫Mathlib的大項目,數萬個關於數學對象的有用事實的集合。

(01:24:09)在那裡某個地方是微積分基本,但你需要找到它。很多瓶頸現在實際上是引理搜尋。有一個你知道在那裡某個地方的工具,你需要找到它。有各種專門為Mathlib的搜尋引擎引擎,你可以做,但現在有這些大語言模型,你可以說,"我需要在這一點上的微積分基本。"它就像,好的,例如,當我編碼時,我有GitHub Copilot安裝為我IDE的外掛,它掃描我的文字,它看到我需要什麼。說我甚至可能打字,現在我需要使用微積分基本。然後它可能建議,"好的,試試這個,"也許25%的時間它確切地工作。然後另外10-50%的時間它不完全工作,但它足夠接近,我可以說,哦是的,如果我只是在這裡和這裡改變它,它會工作。然後一半時間它給我完全垃圾。但人們開始在上面使用AI一點點,主要在基本上花哨自動完成的層面上,你可以打字證明的一行的一半,它會找到,它會告訴你。

Lex Fridman(01:25:11)是的,但一個花哨的,特別是帶大寫字母F的花哨,去除了數學家從筆和紙轉移到形式化時可能感受到的一些摩擦。

陶哲軒(01:25:23)是的。是的。所以現在我估計形式化證明所需的時間和精力大約是手寫的10倍。所以這是可行的,但令人討厭。

Lex Fridman(01:25:36)但這不會殺死成為數學家的整個氛圍嗎?有一個迂腐的同事?

陶哲軒(01:25:42)對吧?是的,如果那是它的唯一方面,但有些情況下實際上正式做事情更愉快。我形式化了一個定理,最終陳述中出現了某個常數12。這個12在整個證明中被攜帶,一切都必須檢查所有這些其他數字,這些數字必須與這個最終數字12一致。我們用這個數字12寫了一篇關於這個定理的論文。幾周後有人說,"哦,我們實際上可以通過重新工作一些這些步驟將這個12改進為11。"當這種情況發生在筆和紙上時,每次你改變你的參數,你必須逐行檢查你證明的每一行仍然工作。可能有微妙的東西,你沒有完全意識到的一些屬性,不是數字12,你甚至沒有意識到你在利用。證明可能在微妙的地方分解。

(01:26:29)我們用這個常數12形式化了證明,然後當這篇新論文出來時,我們說,"哦,"形式化花了三周時間,20個人形式化這個原始證明。我說,"現在讓我們將證明更新為11。"你可以用Lean做的是在你的標題定理中,你將你的12改為11,你運行編譯器,在數千行程式碼中,你有90%仍然工作,有幾個用紅線標出。現在,我無法證明這些步驟,但立即隔離你需要改變那些步驟,但你可以跳過所有工作得很好的東西。

(01:27:04)如果你用良好的程式設計實踐正確程式設計,你的大部分行不會是紅色的。只會有幾個地方,如果你不硬編碼你的常數,而是使用智能策略等等,你可以將你需要改變的東西區域化到非常短的時間內。在一兩天內,我們更新了我們的證明,因為這是一個非常快速的過程,你做一個改變。現在有10個東西不工作。對於每一個,你做一個改變,現在有5個更多的東西不工作,但這個過程比筆和紙收斂得更平滑。

Lex Fridman(01:27:40)這是為了寫作?你能夠閱讀它嗎?如果其他人有證明,你能夠,與紙相比是什麼?

陶哲軒(01:27:48)是的,證明更長,但每個單獨部分更容易閱讀。如果你拿一篇數學論文,你跳到第27頁,你看第六段,你有一行數學文字,我通常無法立即閱讀它,因為它假設各種定義,我必須回去,也許10頁前這被定義了,證明分散在所有地方,你基本上被迫相當順序地閱讀。它不像比如說小說,理論上你可以打開小說中途開始閱讀。有很多上下文。但當[聽不清01:28:23] Lean時,如果你將游標放在一行程式碼上,那裡的每個對象,你可以懸停在上面,它會說它是什麼,它來自那裡,東西在那裡被證明。你可以比翻閱數學論文更容易地追溯事物。

(01:28:34)Lean真正啟用的一件事實際上是在真正原子尺度上協作證明,你真的無法在過去做到。傳統上用筆和紙,當你想與另一個數學家合作時,要麼你在黑板上做,你可以真正互動,但如果你通過電子郵件或什麼做,基本上,是的,你必須分段。說,"我要完成第三部分,你做第四部分,"但你不能真正在同一件事上工作,同時合作。

(01:29:03)但用Lean,你可以試圖形式化證明的某部分並說,"我在第67行卡住了。我需要證明這個東西,但它不太工作。這是我遇到困難的三行程式碼。"但因為所有上下文都在那裡,其他人可以說,"哦,好的,我認識你需要做什麼。你需要應用這個技巧或這個工具,"你可以做極其原子等級的對話。因為Lean,我可以與世界各地的幾十個人合作,其中大多數我從未親自見過,我甚至可能不知道他們在證明領域實際上有多可靠,但Lean給我一個信任證書,所以我可以做無信任數學。

Lex Fridman(01:29:43)這裡有很多有趣的問題。一個,你以成為偉大的合作者而聞名。在數學中合作解決困難問題的正確方法是什麼?你是做分而治之類型的事情嗎?還是你專注於特定部分,你在頭腦風暴?

陶哲軒(01:30:05)總是首先有頭腦風暴過程。是的,數學研究項目,從其性質來看,當你開始時,你真的不知道如何做問題。它不像工程項目,理論已經建立了幾十年,實現是主要困難。你必須弄清楚甚至什麼是正確的路徑。這就是我說的首先作弊。它就像回到橋樑建設類比。首先假設你有無限預算和無限數量的勞動力等等。現在你能建這座橋嗎?好的,現在有無限預算,但只有有限勞動力,對吧?現在你能做到嗎?等等。當然沒有工程師能夠實際做到這一點。就像我說的,他們有固定要求。是的,總是在開始時有這種果醬會議,你嘗試各種瘋狂的事情,你做所有這些不現實的假設,但你計畫以後修復。

(01:30:57)你試圖看是否有某種可能工作的方法骨架。然後希望那將問題分解為更小的子問題,你不知道如何做。但然後你專注於子問題。有時不同的合作者更擅長處理某些事情。我知名的一個主題是與Ben Green的主題,現在叫Green-Tao定理。這是一個陳述,素數包含算術級數。所以這是他的[聽不清01:31:26]的修改。我們合作的方式是Ben已經證明了對長度為三的級數的類似結果。他證明了類似的素數包含大量長度為三的級數,甚至素數的子集,某些子集做,但他的技術只對三級數工作。它們不對更長的工作。

(01:31:46)但我有這些來自[聽不清01:31:48]理論的技術,這是我一直在玩的東西,我當時比Ben更瞭解。如果我能證明與素數相關的某些集合的某些隨機性屬性,有某種技術條件,如果我能有它,如果Ben能提供我這個事實,我可以得出定理。但我問的是數論中一個真正困難的問題,他說,"我們沒有辦法證明這個。"他說,"你能使用我有機會證明的弱假設來證明你定理的部分嗎?"他提出了他能證明的東西,但對我來說太弱了。我無法使用這個。所以有這種來回對話,一個駭客-

Lex Fridman(01:32:29)不同的作弊-

陶哲軒(01:32:31)是的,是的,我想更多作弊。他想更少作弊,但最終我們找到了一個屬性,A,他能證明,B,我能使用,然後我們能證明我們的定理。有各種動力學。每個合作都有一些故事。沒有兩個是相同的。

Lean程式語言

Lex Fridman(01:32:51)然後在翻轉的一面,像你提到的Lean程式設計,現在這幾乎像一個不同的故事,因為你可以建立,我認為你提到過問題的藍圖,然後你可以真正做分而治之,你在分離的部分工作,它們使用電腦系統證明檢查器本質上確保一路上一切都是正確的。

陶哲軒(01:33:17)它使一切相容和可信。是的,目前只有少數數學項目可以這樣切割。在當前藝術狀態下,大多數Lean活動是形式化已經被人類證明的證明。數學論文基本上在某種意義上是藍圖。它將困難陳述如大定理分解為我一百個小引理,但通常不是所有都寫得足夠詳細,每一個都可以直接形式化。

(01:33:46)藍圖是一篇論文的真正迂腐寫版本,其中每個步驟都儘可能詳細地解釋,只是試圖使每個步驟自包含或只依賴於非常特定數量的已經證明的先前陳述,使得生成的這個藍圖圖的每個節點可以獨立於其他節點處理。你甚至不需要知道整個東西如何工作。它就像現代供應鏈。如果你想建立iPhone或其他複雜對象,沒有一個人可以建立單個對象,但你可以有專家,如果他們從其他公司給予一些小部件,他們可以將它們組合在一起形成稍大的小部件。

Lex Fridman(01:34:27)我認為這是一個真正令人興奮的可能性,因為如果你能找到可以這樣分解的問題,那麼你可以有數千個貢獻者,對吧?完全分佈式。

陶哲軒(01:34:39)我之前告訴你理論和實驗數學之間的分裂。現在大多數數學是理論的,只有一點點是實驗的。我認為Lean和其他軟體工具提供的平台,GitHub和這樣的東西將允許實驗數學擴大到比我們現在能做的大得多的程度。現在,如果你想對某種數學模式或什麼做任何數學探索,你需要一些程式碼來寫出模式。我的意思是,有時有一些電腦代數包可以幫助,但通常它只是一個數學家編碼大量大量的Python或其他什麼。因為編碼是如此容易出錯的活動,讓其他人在編寫程式碼模組上與你合作是不現實的,因為如果其中一個模組有錯誤,整個東西就不可靠。你得到這些由非專業程式設計師,數學家寫的定製義大利面條程式碼,它們笨拙和緩慢。因為那個,真的很難大規模生產實驗結果。

(01:35:45)但我認為用Lean,我已經開始一些項目,我們不只是用資料實驗,而是用證明實驗。我有這個叫等式理論項目的項目。基本上我們在抽象代數中生成了大約2200萬個小問題。也許我應該退後告訴你項目是什麼。好的,抽象代數研究像乘法、加法和抽象性質這樣的運算。例如乘法是可交換的。X乘Y總是Y乘X,至少對數字。它也是結合的。X乘Y乘Z與X乘Y乘Z相同。這些運算遵守一些定律,不遵守其他定律。例如,X乘X不總是等於X。所以那個定律不總是真的。給定任何運算,它遵守一些定律,不遵守其他定律。我們生成了大約4000個這些可能的代數定律,某些運算可以滿足。

(01:36:38)我們的問題是那些定律暗示那些其他定律,例如,可交換性暗示結合性嗎?答案是否,因為事實證明你可以描述一個遵守可交換定律但不遵守結合定律的運算。通過產生例子,你可以表明可交換性不暗示結合性。但一些其他定律確實通過替換等等暗示其他定律,你可以寫下一些代數證明。我們看所有這4000個定律之間的對,這達到2200萬個這些對。對於每一對我們問,這個定律暗示這個定律嗎?如果是,給一個證明。如果不是,給一個反例。2200萬個問題,每一個你可以給本科代數學生,他們有合理的機會解決問題,雖然有幾個,至少2200萬個,像一百個左右真的相當困難,但很多是容易的。項目只是計算確定整個圖,那些暗示那些其他的。

Lex Fridman(01:37:31)順便說一下,這是一個令人難以置信的項目。這樣一個好想法,這樣一個好的測試,我們一直在談論的事情在一個了不起的規模。

陶哲軒(01:37:38)這不會是可行的。文獻中的藝術狀態就像15個方程以及它們如何應用,這是人類用筆和紙可以做的極限。你需要擴大規模。你需要眾包,但你也需要信任所有的,沒有一個人可以檢查2200萬個這些證明。你需要它被電腦化。只有用Lean才變得可能。我們也希望使用很多AI。項目幾乎完成。在這2200萬個中,除了兩個都已經解決。

陶哲軒(01:38:12)嗯,實際上,那兩個,我們有筆和紙證明,我們正在形式化它。事實上,今天早上我在工作完成它,所以我們幾乎完成了這個。

Lex Fridman(01:38:25)你能得到多少人?

陶哲軒(01:38:26)大約50個,在數學中被認為是巨大的數字。

Lex Fridman(01:38:30)這是巨大的數字。這太瘋狂了。

陶哲軒(01:38:32)是的。我們將有一篇50個作者的論文和一個誰貢獻了什麼的大附錄。

Lex Fridman(01:38:38)這裡有一個問題,不要也許更一般地談論它。當你有這個人才庫時,有沒有辦法通過人們的專業水平來組織貢獻,貢獻者?現在,好的,我問了很多大麻問題,但我想像一群人類,也許在未來,一些AI,可以有ELO評級類型的情況嗎?

Lex Fridman(01:39:00)可以有Elo評級類型的情況,這種遊戲化嗎?

陶哲軒(01:39:07)這些lean項目的美在於你自動得到所有這些資料,所以一切都被上傳到GitHub。GitHub跟蹤誰貢獻了什麼。你可以在任何以後的時間點生成統計資料。你可以說,"哦,這個人貢獻了這麼多行程式碼"或其他什麼。這些是非常粗糙的指標。我絕對不希望這成為你終身職位評審或什麼的一部分。但我的意思是,我認為在企業計算中,人們確實使用一些這些指標作為員工績效評估的一部分。同樣,這是學者有點害怕走的方向。我們不太喜歡指標。

Lex Fridman(01:39:49)然而學者使用指標。他們只是使用舊的,論文數量。

陶哲軒(01:39:56)是的,這是真的...

Lex Fridman(01:39:59)感覺這是一個指標,雖然有缺陷,但正在朝著正確方向發展。對吧。

Lex Fridman(01:40:06)這很有趣。至少這是一個非常有趣的指標。

陶哲軒(01:40:08)是的,我認為研究很有趣。我認為你可以做研究這些是否是更好的預測器。有這個叫古德哈特定律的問題。如果一個統計實際上被用來激勵績效,它就被遊戲化了,然後它不再是有用的衡量標準。

Lex Fridman(01:40:22)哦,人類。總是遊戲化...

陶哲軒(01:40:25)這是理性的。我們為這個項目做的是自我報告。有來自科學的標準類別,人們給出什麼類型的貢獻。有概念和驗證和資源和編碼等等。有大約十二個左右類別的標準列表,我們只是要求每個貢獻者...有所有作者和所有類別的大矩陣,只是勾選他們認為他們貢獻的地方的框,給一個粗略的想法。也,你做了一些編碼,你提供了一些計算,但你沒有做任何筆和紙驗證或其他什麼。

(01:41:02)我認為那個解決了。傳統上,數學家只是按姓氏字母順序排列。我們沒有科學中"主要作者"和"第二作者"等等的傳統,我們為此感到自豪。我們使所有作者平等地位,但它不太擴展到這個大小。十年前我參與了這些叫polymath項目的東西。這是眾包數學但沒有lean元件。它被限制,你需要一個人類主持人來實際檢查所有進來的貢獻實際上是有效的。這是一個巨大的瓶頸,實際上,但仍然我們有大約10個作者左右的項目。但我們當時決定,不試圖決定誰做了什麼,而是有一個單一的筆名。我們建立了這個虛構角色叫DHJ Polymath,本著[聽不清01:41:51]的精神。這是20世紀一群著名數學家的筆名。

(01:41:56)論文是以筆名作者的,所以我們沒有人得到作者信用。這實際上出於幾個原因證明不太好。一個是如果你實際上想被考慮終身職位或其他什麼,你無法使用這篇論文在你的...當你提交作為你的出版物之一時,因為它沒有正式作者信用。但我們後來認識到的另一件事是當人們提到這些項目時,他們自然地提到參與項目的最著名的人。"這是Tim Gower的playoff項目。""這是陶哲軒的playoff項目,"而沒有提到參與的其他19個或其他什麼人。

陶哲軒(01:42:37)我們這次嘗試不同的東西,我們有,每個人都是作者,但我們將有一個帶有這個矩陣的附錄,我們將看看那如何工作。

DeepMind的AlphaProof

Lex Fridman(01:42:45)這兩個項目都是令人難以置信的,只是你參與如此巨大的合作這個事實。但我想我看到Kevin Buzzard幾年前關於Lean程式語言的講座,你說這可能是數學的未來。看到世界上最偉大的數學家之一擁抱這個,看起來像鋪平數學未來的道路,這也令人興奮。

(01:43:12)我必須在這裡問你關於AI整合到整個過程中。DeepMind的alpha proof使用強化學習在IMO問題的失敗和成功的正式lean證明上訓練。這是某種高級高中?

陶哲軒(01:43:32)哦,非常高級,是的。

Lex Fridman(01:43:33)非常高級,高中級數學問題。你對這個系統有什麼看法,也許這個能夠證明高中級問題的系統與研究生級問題之間的差距是什麼?

陶哲軒(01:43:47)是的,困難隨著證明中涉及的步驟數量指數增加。這是評論爆炸。大語言模型的事情是它們犯錯誤,如果證明有20個步驟,你的[聽不清01:44:01]在每個步驟有10%的失敗率走錯方向,實際到達終點是極其不可能的。

Lex Fridman(01:44:09)實際上,讓我在這裡走一個小切線,從自然語言對應到正式程序的問題有多難?

陶哲軒(01:44:19)哦是的。這極其困難,實際上。自然語言,非常容錯。你可以犯一些小語法錯誤,用第二語言說話,可以得到你在說什麼的一些想法。但正式語言,如果你得到一個小錯誤,那麼整個東西就是無意義的。甚至正式到正式都非常困難。有不同的不相容前綴和語言。有Lean,但也有Cox和Isabelle等等。甚至從正式動作轉換到正式語言是一個未解決的問題。

Lex Fridman(01:44:52)這很迷人。好的。但一旦你有非正式語言,他們使用他們的RL訓練模型,類似於他們用於圍棋的AlphaZero,然後試圖想出工具,也有一個模型。我相信這是幾何問題的單獨模型。

AI在數學競賽中的表現

Lex Fridman(01:45:12) 那麼這個系統有什麼令你印象深刻的地方,你認為差距在那裡?

陶哲軒(01:45:18) 是的,我們之前談到過,隨著時間推移,令人驚嘆的事情會變得正常化。所以現在不知何故,幾何當然成了銀彈問題。

Lex Fridman(01:45:27) 對,確實如此。我的意思是,仍然很美妙...

陶哲軒(01:45:31) 是的,這些都是展示可能性的偉大工作。但這種方法目前無法擴展。三天的Google伺服器時間才能解決一道高中數學題。這不是一個可擴展的前景,特別是隨著複雜性的指數級增長。

Lex Fridman(01:45:49) 我們應該提到,他們獲得了銀牌水平的表現。相當於銀牌的表現。

陶哲軒(01:45:55) 首先,他們花費的時間遠超過分配的時間,而且他們得到了人類幫助形式化的協助,但他們也給自己的解答打滿分,我想這是經過形式化驗證的。所以我覺得這很公平。現在有一些努力,將來某個時候會有一個提議,實際舉辦一個AI數學奧林匹克,與人類選手同時獲得相同的奧林匹克問題,AI也會在相同的時間內得到相同的問題,輸出必須由相同的評委來評分,這意味著必須用自然語言而不是形式語言來寫。

Lex Fridman(01:46:37) 哦,我希望這能實現。我希望這個IMO能夠實現。我希望下一屆就能實現。

陶哲軒(01:46:41) 這屆IMO不會實現。在規定時間內表現還不夠好。但有一些較小的競賽,有一些答案是數字而不是長篇證明的競賽。AI在有具體數值答案的問題上實際上要好得多,因為很容易對此進行強化學習。"是的,你答對了,你答錯了。"這是一個非常清晰的訊號,但長篇證明要麼必須是形式化的,那麼Lean可以給出贊成或反對,要麼是非形式的,但那樣你需要人類來建立和判斷。如果你想要進行數十億次強化學習運行,你雇不到足夠的人來評分。語言模型僅僅對人們得到的常規文字進行強化學習就已經夠困難了。但現在我們實際上要僱傭人員,不僅僅是給出贊成或反對,而是要在數學上檢查輸出,是的,這太昂貴了。

人類數學家 vs AI

Lex Fridman(01:47:45) 所以如果我們探索這個可能的未來,人類在數學方面做的最特別的事情是什麼,你認為AI在一段時間內無法破解?發明新理論?提出新猜想還是證明猜想?建構新的抽象?新的表示?也許AI在看到不同領域之間的新聯絡方面有困難?

陶哲軒(01:48:17) 這是個好問題。我認為數學家所做工作的性質隨時間變化很大。一千年前,數學家必須計算復活節的日期,進行非常複雜的計算,但這些都已經自動化了,幾個世紀以來,我們不再需要那些了。他們曾經需要進行球面導航,用三角學導航如何從舊世界到新世界,非常複雜的計算。同樣,這些都已經自動化了。甚至許多本科數學,即使在AI之前,比如Wolfram Alpha。它不是語言模型,但它可以解決很多本科水平的數學任務。所以在計算方面,驗證常規事務,比如有一個問題說,"這裡有一個偏微分方程問題,你能用20種標準技術中的任何一種來解決嗎?"然後說,"是的,我已經嘗試了所有20種,這裡是100種不同的排列和我的結果。"

(01:49:12) 我認為這種類型的事情會工作得很好,一旦你解決了一個問題就擴展到讓AI攻擊一百個相鄰的問題。人類仍在做的事情...AI現在真正困難的地方是知道何時走錯了路。它可以說,"哦,我要解決這個問題。我要把這個分成這兩種情況。我要嘗試這種技術。"有時候,如果你幸運,這是一個簡單的問題,那就是正確的技術,你解決了問題。有時候它會有問題,它會提出一種完全無意義的方法,但看起來像證明。

(01:49:53) 這是LLM生成數學的一個令人煩惱的地方。我們有人類生成的非常低品質的數學,比如沒有正式訓練等等的投稿,但如果人類證明是壞的,你很快就能看出它是壞的。它犯了非常基本的錯誤。但AI生成的證明,它們可能表面上看起來完美無瑕。這部分是因為強化學習實際上訓練它們做的是,產生看起來正確的文字,對於許多應用來說這已經足夠好了。所以錯誤通常非常微妙,然後當你發現它們時,它們真的很愚蠢。就像沒有人類會真正犯那種錯誤。

Lex Fridman(01:50:36) 是的,在程式設計語境中這真的很令人沮喪,因為我經常程式設計,是的,當人類製作低品質程式碼時,有一種叫做"程式碼異味"的東西,對吧?你可以立即察覺有徵象,但對於AI生成的程式碼...

陶哲軒(01:50:53) [聽不清 01:50:53]。

Lex Fridman(01:50:52) 你說得對,最終你會發現一個明顯愚蠢的東西,但它看起來就像好程式碼。

Lex Fridman(01:51:00) 這也非常棘手且令人沮喪,出於某種原因,必須要工作。

陶哲軒(01:51:05) 所以這種嗅覺,這是人類擁有的一樣東西,有一種隱喻的數學嗅覺,目前還不清楚如何讓AI最終複製它。AlphaZero等在圍棋和國際象棋等方面取得進展的方式,在某種意義上它們已經為圍棋和國際象棋位置開發了一種嗅覺,這個位置對白方有利,對黑方有利。它們無法說明原因,但僅僅擁有這種嗅覺就讓它們能夠制定策略。所以如果AI獲得了對某些證明策略可行性的嗅覺能力,因為我要嘗試將這個問題分解為兩個小子任務,它們可以說,"哦,這看起來不錯。這兩個任務看起來比你的主要任務更簡單,而且它們仍然很有可能是真的。所以這值得嘗試。"或者"不,你讓問題變得更糟了,因為這兩個子問題實際上都比你的原始問題更難,"這實際上是如果你嘗試隨機的東西通常會發生的,通常很容易將問題轉化為更難的問題。很少你會轉化為更簡單的問題。所以如果它們能夠獲得這種嗅覺,那麼它們可能開始與人類水平的數學家競爭。

Lex Fridman(01:52:24) 這是一個困難的問題,但不是競爭而是合作。好的,假設。如果我給你一個神諭,能夠做你所做工作的某個方面,你可以與它合作,你希望那個神諭能夠做什麼?你希望它也許是一個驗證器,比如檢查,做程式碼?比如"是的,陶教授,正確,這是一個有前途的富有成果的方向"?或者你希望它生成可能的證明,然後你看那一個是正確的?或者你希望它也許生成不同的表示,完全不同的看待這個問題的方式?

陶哲軒(01:53:10) 是的,我認為以上所有。很大程度上我們不知道如何使用這些工具,因為這是一個範式...我們過去沒有過的。足夠勝任理解複雜指令、可以大規模工作,但也不可靠的系統。這是一個有趣的...有點不可靠,以微妙的方式,而提供足夠好的輸出。這是一個有趣的組合。我的意思是,你有與你合作的研究生,他們有點像這樣,但不是大規模的。我們有以前的軟體工具可以大規模工作,但非常狹窄,所以我們必須弄清楚如何使用,所以蒂姆·高爾斯實際上,你提到他實際上在2000年就預見到了。他設想數學在實際上二十五年後會是什麼樣子。

陶哲軒(01:54:09) 是的,他寫了他的文章,一個未來數學助手與他自己之間的假想對話。他試圖解決一個問題,他們會進行對話。有時人類會提出想法,AI會評估它,有時AI會提出想法,有時需要競賽,AI會說,"好的,我已經檢查了這裡需要的100種情況,"或者"首先你為所有N設定了這個,我已經檢查了N到100,目前看起來不錯,"或者"等等,在N等於46時有問題。"所以只是一個自由形式的對話,你事先不知道事情會走向何方,但只是基於,"我認為想法會在雙方提出。"計算可以在雙方提出。

(01:54:53) 我與AI進行過對話,我說,"好的,我們要合作解決這個數學問題,"這是一個我已經知道解的問題,所以我嘗試提示它。"好的,所以這是問題。"我建議使用這個工具,它會找到這個。"好的,它可能開始使用這個,然後它會回到它之前想做的工具。你必須不斷地將它引導到你想要的路徑上,我最終可以強迫它給出我想要的證明,但這就像放牧貓。我必須付出的個人努力量,不僅僅是提示它,還要檢查它的輸出,因為很多看起來會工作的東西,我知道第17行有問題,基本上在與它爭論。這比無協助地做更令人筋疲力盡,但這是目前的技術水平。

Lex Fridman(01:55:44) 我想知道是否會發生相變,不再感覺像放牧貓。也許你會驚訝於這來得如此之快。

陶哲軒(01:55:54) 我相信如此。在形式化方面,我之前提到形式化一個證明比手寫它需要10倍的時間。有了這些現代AI工具以及更好的工具,Lean開發者做得很好,加入越來越多的功能,使其使用者友好,從九到八到七...好吧,沒什麼大不了的,但有一天它會降到一點一。這是一個相變,因為突然當你寫論文時,首先在Lean中寫它,或通過與AI的對話,這通常是與你即時的,變得有意義,期刊接受變得自然。也許他們會提供加速審稿。如果論文已經在Lean中形式化,他們只會要求審稿人評論結果的重要性以及它如何與文獻聯絡,而不太擔心正確性,因為那已經被認證了。數學論文變得越來越長,除非它們真的很重要,否則很難為真正長的論文獲得好的審稿。這實際上是一個問題,形式化正好在正確的時間來解決這個問題。

Lex Fridman(01:57:04) 由於工具和所有其他因素,越來越容易猜測,然後你會看到更多像數學庫將潛在地指數增長,因為這是一個良性循環。

陶哲軒(01:57:16) 我的意思是,過去發生的這種類型的一個相變是LaTeX的採用。所以LaTeX是所有數學家現在使用的排版語言。所以過去人們使用各種文書處理器和打字機等等,但在某個時候LaTeX變得比所有其他競爭對手更容易使用,人們會在幾年內轉換。這只是一個戲劇性的基礎轉變。

AI贏得菲爾茲獎

Lex Fridman(01:57:37) 這是一個瘋狂的、遙遠的問題,但什麼年份,我們距離AI系統成為贏得菲爾茲獎的證明的合作者還有多遠?那種水平。

陶哲軒(01:57:55) 好吧,這取決於合作的水平,對吧?

Lex Fridman(01:57:58) 不,它應該獲得菲爾茲獎。所以一半一半。

陶哲軒(01:58:03) 已經。我可以想像如果它是一篇獲獎論文,在寫作中有一些AI協助,就像訂單自動完成已經,我用它加速我自己的寫作。你可以有一個定理和一個證明,證明有三種情況,我寫下第一種情況的證明,自動完成就建議。現在這是第二種情況的證明如何工作。它完全正確。那很棒。節省了我五到十分鐘的打字時間。

Lex Fridman(01:58:30) 但在那種情況下,AI系統不會獲得菲爾茲獎。我們說的是20年、50年、100年?你怎麼想?

陶哲軒(01:58:42) 好的,所以我在印刷品中給出了一個預測,到2026年,也就是現在的明年,將會有與AI的數學合作,所以不是菲爾茲獎獲獎等級,但是實際的研究等級論文。

Lex Fridman(01:58:54) 部分由AI生成的已發表想法。

陶哲軒(01:58:58) 也許不是想法,但至少一些計算、驗證。

Lex Fridman(01:59:03) 這已經發生了嗎?

陶哲軒(01:59:04) 這已經發生了。有一些問題是通過與AI對話的複雜過程解決的,提出建議,人類去嘗試,合同不起作用,但它可能提出不同的想法。很難確切地解開。肯定有一些數學結果只有在有人類認證和AI參與的情況下才能完成,但很難解開功勞。我的意思是,這些工具,它們不能複製做數學所需的所有技能,但它們可以複製其中一些非平凡的百分比,30%、40%,所以它們可以填補空白。程式設計是一個很好的例子。用Python程式設計對我來說很煩人。我不是本地人,我不是專業程式設計師,但有了AI,這樣做的摩擦成本大大降低。所以它為我填補了那個空白。AI在文獻回顧方面變得相當好。

(02:00:15) 我的意思是,它仍然有幻覺引用不存在參考文獻的問題,但我認為這是一個可解決的問題。如果你以正確的方式訓練等等,並使用網際網路驗證,你應該在幾年內達到這樣的程度:你有一個需要的引理並說,"之前有人證明過這個引理嗎?"它會基本上做一個花哨的網路搜尋並說,是的,有這六篇論文,其中發生了類似的事情。我的意思是,你現在可以問它,它會給你六篇論文,其中也許一篇是合法和相關的,一篇存在但不相關,四篇是幻覺。它現在有非零的成功率,但有太多垃圾,訊號雜訊比如此之差,以至於當你已經對關係有所瞭解時它最有幫助,你只需要被提示想起一篇已經在你記憶中潛意識存在的論文。

Lex Fridman(02:01:14) 相對於幫助你發現你甚至不知道的新內容,但這是正確的引用。

陶哲軒(02:01:20) 是的,它有時可以做到,但當它做到時,它被埋在選項列表中,其他的-

Lex Fridman(02:01:26) 那些是壞的。我的意思是,能夠自動生成正確的相關工作部分。那實際上是一件美好的事情。那可能是另一個相變,因為它正確地分配功勞。它讓你跳出思維孤島。

陶哲軒(02:01:42) 是的,不,現在有一個很大的障礙需要克服。我的意思是這就像自動駕駛汽車。安全邊際必須非常高才能可行。所以是的,許多AI應用都有一個[聽不清 02:01:54]-莫羅問題,它們可以開發80%、20%時間工作的工具,但仍然不夠好。實際上,在某些方面甚至比好更糟。

Lex Fridman(02:02:08) 我的意思是,問菲爾茲獎問題的另一種方式是,你認為你會在那一年醒來並真正感到驚訝?你讀到標題、新聞或AI做的某事,真正的突破。某事。像菲爾茲獎,甚至一個假設。它可能真的只是這個AlphaZero圍棋時刻那種事情。

陶哲軒(02:02:33) 是的,這個十年我可以看到它在人們認為不相關的兩個事物之間做出猜想。

Lex Fridman(02:02:42) 哦,有趣。生成一個猜想。那是一個美麗的猜想。

陶哲軒(02:02:45) 是的。實際上有很大機會是正確和有意義的。

Lex Fridman(02:02:50) 因為這實際上是可行的,我想,但資料世界是...

Lex Fridman(02:02:56) 不,那將是真正令人驚嘆的。

陶哲軒(02:02:59) 當前模型困難很大。我的意思是,這個版本...物理學家有讓AI發現新物理定律的夢想。夢想是你只是給它所有這些資料,這是我們之前沒有看到的新模式,但實際上,即使是當前最先進的技術甚至在從資料中發現舊物理定律方面都有困難。或者如果它做到了,就有很大的污染擔憂,它這樣做只是因為它在這個訓練中的某個地方,以某種方式新穎,博伊爾定律或你試圖重建的任何東西。

(02:03:35) 部分原因是我們沒有為此合適類型的訓練資料。對於物理定律,我們沒有具有一百萬種不同自然定律的一百萬個不同宇宙。我們在數學中缺少的很大一部分實際上是負空間...所以我們有人們能夠證明的已發表內容,以及最終被驗證或產生反例的猜想,但我們沒有關於被提出的事物的資料,它們是很好的嘗試,但然後人們很快意識到這是錯誤的猜想,然後他們說,"哦,但我們實際上應該以這種方式改變我們的聲明來修改它,實際上使它更合理。"

(02:04:16) 有一個試錯過程,這是人類數學發現的真正組成部分,我們不記錄它,因為它令人尷尬。我們犯錯誤,我們只喜歡發表我們的勝利。AI無法訪問這些資料來訓練。我有時開玩笑說,基本上AI必須經歷研究生院,實際上去上研究生課程,做作業,去辦公時間,犯錯誤,獲得如何糾正錯誤的建議並從中學習。

以下是 Lex Fridman 與陶哲軒關於數學家格里戈裡·佩雷爾曼(Grigori Perelman)及其解決龐加萊猜想的對話片段翻譯:

格里戈裡·佩雷爾曼與龐加萊猜想

Lex Fridman(02:04:47): 我想請教你一下關於格里戈裡·佩雷爾曼的問題。你曾提到自己在做研究時會刻意保持理智,不讓某個問題完全吞噬自己,儘管有時候確實會深深地愛上一個問題,直到解出它才肯罷休。但你也指出,這種“痴迷”的方式有時確實會取得非凡成果,佩雷爾曼就是一個例子。他獨自研究七年,幾乎與外界斷絕聯絡,最終證明了龐加萊猜想。你能解釋一下這個被解決的“千禧年大獎”問題,以及佩雷爾曼走過的這段旅程嗎?

陶哲軒(02:05:31): 龐加萊猜想是一個關於“曲面空間”的問題。我們可以用地球來類比,它是一個二維曲面。不同的曲面,比如帶孔的圓環(環面)或有多個孔的形狀,各自代表不同的“拓撲結構”。我們已經能夠初步對這些曲面分類,其中一個關鍵指標叫做“虧格”(genus)——即有幾個孔。比如,球體的虧格是 0,而甜甜圈(環面)是 1。

一個重要特性是“單連通性”:在球面上,任何閉合的環都可以連續縮小,最後收縮成一個點;但在環面上則不行,因為環會被“卡”在中間的孔上,無法完全收縮。

龐加萊提出了一個更高維度的版本:如果我們有一個三維空間,它滿足類似的單連通性,是否就能確定它是“三維球面”?這就是龐加萊猜想。

(02:07:09) 奇怪的是,這個問題在四維、五維以上的情況反而更容易解決——因為高維空間更“寬裕”,可以進行各種變形。但三維的情況非常棘手。數學家嘗試了各種方法:把空間切割成小三角形、小四面體,或者運用代數工具,比如基本群、上同調等,但都沒能成功。直到理查德·漢密爾頓提出了一個新的方向——用偏微分方程的方式來解決。

(02:07:52) 想像你有一個“被揉皺”的三維球體,它的真實結構其實就是個球,但外觀卻扭曲不清。就像一個氣球表面,你往裡面充氣,它會慢慢變圓、變光滑——除非它其實是一個環面(甜甜圈),那充氣時會遇到“奇點”而無法繼續。漢密爾頓發明了一種“流”——Ricci 流,可以把空間慢慢“熨平”,讓它變得更像球體。

(02:09:20) 你問二維情況是否難?答案是:是的,數學非常複雜,幾乎與愛因斯坦的場方程同級。儘管二維有一些特殊技巧幫忙,但三維的 Ricci 流是超臨界的,也就是說非線性會隨著流動而不斷增強,甚至可能集中在越來越小的區域,形成各種“奇點”。有些奇點還可以“手術”解決,比如環形結構中間變細,可以剪開再單獨處理。但如果出現非常複雜的“打結奇點”,那幾乎無從下手。

佩雷爾曼的突破在於他引入了新的數學工具,比如“簡約體積”和“”等不依賴尺度的新量,將原本超臨界的問題“降維”成臨界問題,使得非線性部分變得可以掌控。然後他成功分類了所有可能的奇點,並對每種情況都提出瞭解決辦法——從而最終解決了龐加萊猜想。

(02:11:54) 這是一系列極為大膽的創新步驟。今天的 AI 模型也許可以在“嘗試列表”中列出類似想法,但它還遠遠無法靠直覺判斷那一條才是正確路徑。而佩雷爾曼顯然擁有極強的判斷力——從 A 到 B 是個漫長的過程。

Lex Fridman(02:12:01): 從方法角度來說,你自己也經歷過類似艱難的過程。當你發現投入幾天甚至幾周的努力失敗了,你會怎麼應對?

陶哲軒(02:12:27): 我會換一個問題去做。我屬於“狐狸型”數學家,而不是“刺蝟型”。

Lex Fridman: 所以你能中途暫停一下,去看別的問題?

陶哲軒: 對。有時你可以適度“修改”問題,如果某種特殊情況反覆阻礙你,就可以先假設這個問題不出現,看看其他部分能否走通。這種“戰術性幻想”是可以接受的。有時一旦確認只是某一個點卡住了,但整體結構是可行的,那就值得堅持下去。

(02:13:21) 有時犯錯誤反而能激發新發現。我們有一個項目花了兩個月以為解出了一個偏微分方程問題,結果準備慶祝時發現一個關鍵引理裡第13項根本沒法估計,比前12項總和還難搞。我們差點放棄,但因為前期投入太多,硬著頭皮又堅持了兩年,最終找到另一種方法,才真正解決了這個問題。

(02:14:58) 如果當初沒經歷“虛假黎明”,我們可能早就換題了。就像哥倫布錯誤估算地球大小,原本是想找印度航道,反而意外發現新大陸一樣。

Lex Fridman(02:15:31): 你在遇到這些打擊時,會有情緒崩潰或自我懷疑嗎?畢竟數學很容易讓人“走火入魔”,就像下棋讓人精神崩潰一樣。

陶哲軒(02:15:59): 每位數學家的情感投入程度不同。對有些人來說,數學就是工作,不成就換題。但也確實有人陷入所謂“數學病”——他們花上數年專攻一個問題,甚至犧牲職業發展,賭一個“大贏”。這種策略偶爾有效,但需要極強心理素質,我不推薦。

(02:16:54) 我個人不會在某一個問題上投入過多情感。研究中,我們不需要事先“承諾”必定解決什麼問題——尤其在科研基金申請時,只需表明大致方向、探索一些有趣現象即可。即便最終沒解決原問題,只要發現了相關的新現象,也算是有價值的成果。

孿生素數猜想

Lex Fridman(02:17:27) 但我確信對你來說,有這樣的問題。你在數學史上最難的問題上取得了如此大的進展。那麼有沒有一個問題一直困擾著你?它潛伏在黑暗的角落裡,孿生素數猜想、黎曼假設、哥德巴赫猜想?

陶哲軒(02:17:48) 孿生素數,聽起來……看,我的意思是,像黎曼假設這樣的問題,它們實在太遙不可及了。

陶哲軒(02:17:55) 是的,甚至沒有可行的方向。即使我啟動了我在這本書中知道的所有技巧,仍然沒有辦法從A點到達B點。我認為需要數學其他領域首先出現突破,然後有人意識到將其運用到這個問題上會很有用。

Lex Fridman(02:18:18) 所以也許我們應該退一步,談談素數。

Lex Fridman(02:18:23) 它們經常被稱為數學的原子。你能談談這些原子提供的結構嗎?

陶哲軒(02:18:31) 自然數有兩個基本運算:加法和乘法。所以如果你想生成自然數,你可以做兩件事中的一件。你可以從1開始,不斷地給自己加1。這就生成了自然數。所以從加法角度來看,它們很容易生成:一、二、三、四、五。或者你可以取素數,如果你想通過乘法來生成,你可以取所有的素數——二、三、五、七——然後把它們都乘在一起。這給你所有的自然數,除了可能1以外。所以有兩種不同的方式來思考自然數:從加法的角度和從乘法的角度。分別來看,它們並不那麼糟糕。所以任何只涉及加法的關於自然數的問題,都相對容易解決。

(02:19:11) 任何只涉及乘法的問題也相對容易解決。但令人沮喪的是,當你把兩者結合在一起時,突然你得到了極其豐富的……我的意思是,我們知道數論中有一些陳述實際上是不可判定的。有某些多項式在一些變數中,在自然數中是否有解?答案取決於一個不可判定的陳述,即數學公理是否一致。但即使是結合乘法性質(如素數)和加法性質(如偏移2)的最簡單問題,我們分別都很好地理解它們,但如果你問當你把素數偏移2時,能否得到?你多久能得到另一個素數?將兩者聯絡起來一直異常困難。

Lex Fridman(02:19:59) 我們應該說孿生素數猜想就是這樣,它斷言存在無限多對相差為2的素數對。現在有趣的是,你在推進這個領域回答這種複雜問題方面非常成功。就像你提到的格林-陶定理。它證明了素數包含任意長度的等差數列。

Lex Fridman(02:20:25) 你能證明這樣的事情真是令人難以置信。

陶哲軒(02:20:27) 對。是的。所以我們因為這種研究而意識到的是,不同的模式有不同程度的不可破壞性。使孿生素數問題困難的是,如果你把世界上所有的素數都拿來——3、5、7、11等等——其中有一些孿生素數,11和13是一對孿生素數,等等。但如果你想要刪除這些孿生素數,你很容易就能做到。孿生素數會出現,而且有無限多個,但它們實際上相當稀疏。不是,我的意思是,最初有相當多,但一旦你到了百萬級、兆級,它們就變得越來越稀少。實際上你可以,如果有人能夠訪問素數資料庫,你只需要在這裡和那裡編輯掉一些素數。

(02:21:15) 他們可以通過移除大約0.01%的素數或者一些精心選擇的素數來使孿生素數猜想變為假的。所以你可以呈現一個經過審查的素數資料庫,它通過了素數的所有這些統計測試。它遵循素數的多項式定理和其他效應,但不再包含任何孿生素數。這是孿生素數猜想的一個真正障礙。這意味著任何在實際素數中尋找孿生素數的證明策略,當應用於這些稍微編輯過的素數時必須失敗。所以必須是素數的一些非常微妙、精細的特徵,你不能僅僅從聚合統計分析中得到。

Lex Fridman(02:22:01) 好的,那麼這條路行不通。

陶哲軒(02:22:02) 是的。另一方面,等差數列被證明更加穩健。你可以取素數,實際上可以消除99%的素數,你可以取任何你想要的90%。結果證明,我們證明的另一件事是你仍然得到等差數列。等差數列更像是蟑螂。

Lex Fridman(02:22:21) 不過是任意長度的。

Lex Fridman(02:22:25) 所以對於不知道的人來說,等差數列是一個數字序列,它們相差某個固定的量。

陶哲軒(02:22:32) 是的。但這又像是無限猴子類型的現象。對於你的集合的任何固定長度,你不會得到任意長度的數列。你只會得到相當短的數列。

Lex Fridman(02:22:40) 但你說孿生素數不是無限猴子現象。我的意思是,它是一個非常微妙的猴子。它仍然是無限猴子現象。

陶哲軒(02:22:48) 對。是的。如果素數真的是真正隨機的,如果素數是由猴子生成的,那麼是的,事實上無限猴子定理會——

Lex Fridman(02:22:56) 哦,但你說孿生素數,你不能使用相同的工具。它看起來幾乎不隨機。

陶哲軒(02:23:05) 嗯,我們不知道。我們相信素數表現得像一個隨機集合。所以我們關心孿生素數猜想的原因是一個測試案例,看我們是否能真正自信地說素數表現得像一個隨機集合,錯誤機率為0%。我們知道素數的隨機版本至少包含孿生素數,機率為100%,或者當你走得越來越遠時,機率趨向於100%。所以我們相信素數是隨機的。等差數列之所以不可破壞,是因為無論它看起來是隨機的還是看起來像周期性的結構,在這兩種情況下等差數列都會出現,但出於不同的原因。這基本上是所有……有許多這種等差數列類型定理的證明。

(02:23:54) 它們都通過某種二分法來證明,你的集合要麼是結構化的,要麼是隨機的,在這兩種情況下你都可以說一些東西,然後你把兩者結合起來。但在孿生素數中,如果素數是隨機的,那麼你很高興,你贏了。如果素數是結構化的,它們可能以消除孿生素數的特定方式結構化。我們不能排除那一個陰謀。

Lex Fridman(02:24:16) 然而,據我瞭解,你能夠在K-元組版本上取得進展

陶哲軒(02:24:21) 對。是的。所以關於陰謀的一個有趣的事情是,任何一個陰謀論都很難反駁。如果你相信世界是由蜥蜴人統治的,這裡有一些證據表明它不是[聽不清02:24:32]工作,那只是關於蜥蜴人的談論。你可能遇到過這種現象。

陶哲軒(02:24:41) 幾乎沒有辦法明確地排除一個陰謀。在數學中也是如此。一個專門致力於消除孿生素數的陰謀,你也必須滲透到數學的其他領域,但據我們所知,它可能是一致的。但有一個奇怪的現象,你可以讓一個陰謀排除其他陰謀。所以如果世界是由蜥蜴人統治的,它也不能同時由外星人統治,對吧?

陶哲軒(02:25:09) 所以一個不合理的事情很難反駁,但多個,就有工具了。所以是的,例如,我們知道有無限多個素數,它們沒有兩個,也就是……所以有無限對素數,它們相差至多246,實際上是程式碼。

Lex Fridman(02:25:26) 哦,所以有一個界限——

陶哲軒(02:25:28) 對。所以有孿生素數,有一種叫做表親素數的東西,相差4。有一種叫做性感素數的東西,相差6。

Lex Fridman(02:25:36) 什麼是性感素數?

陶哲軒(02:25:38) 相差6的素數。這個名字遠沒有……它引起的興奮遠比名字暗示的要少。

陶哲軒(02:25:45) 所以你可以製造一個陰謀來排除其中一個,但一旦你有50個,事實證明你不能同時排除所有這些。在這個陰謀空間中,它需要太多的能量。

Lex Fridman(02:25:55) 你如何做界限部分?你如何為差值建立界限——

Lex Fridman(02:26:01) ……有無限多個?

陶哲軒(02:26:03) 所以它最終基於所謂的鴿子籠原理。鴿子籠原理是這樣一個陳述:如果你有若干只鴿子,它們都必須進入鴿子籠,你的鴿子比鴿子籠多,那麼其中一個鴿子籠必須至少有兩隻鴿子。所以必須有兩隻鴿子彼此靠近。所以例如,如果你有100個數字,它們都在1到1000的範圍內,其中兩個必須至多相差10,因為你可以把從1到100的數字分成100個鴿子籠。比方說如果你有101個數字。101個數字,那麼其中兩個必須距離小於10,因為其中兩個必須屬於同一個鴿子籠。所以這是數學中的一個基本特徵,一個基本原理。

(02:26:45) 所以它對素數不太適用,因為當你往外走時,素數變得越來越稀疏,越來越少的數字是素數。但事實證明有一種給數字分配權重的方法。所以有一些數字有點像素數,但它們除了自己和1之外沒有完全沒有因子。但它們有很少的因子。事實證明我們理解幾乎素數比理解素數要好得多。所以例如,很久以前就知道存在孿生幾乎素數。這已經被計算出來了。幾乎素數是我們能理解的東西。所以你實際上可以將注意力限制在一個合適的幾乎素數集合上。而素數總體上相對於幾乎素數是非常稀疏的,實際上幾乎素數要稀疏得多。

(02:27:33) 你可以建立一個幾乎素數的集合,其中素數的密度比如說是1%。這給你一個機會通過應用某種鴿子籠原理來證明存在僅相差100的素數對。但為了證明孿生素數猜想,你需要將素數的密度提高到50%的閾值。一旦你達到50%,你就會得到孿生素數。但不幸的是,有障礙。我們知道無論你選擇什麼樣的好的幾乎素數集合,素數的密度永遠不能超過50%。這就是奇偶性障礙,我很想打破它。所以我的長期夢想之一是找到突破這個障礙的方法,因為它不僅會開啟孿生素數猜想,還會開啟哥德巴赫猜想。

(02:28:12) 數論中的許多其他問題目前都被阻塞,因為我們目前的技術需要超越這個理論上的奇偶性障礙。這就像超越光速一樣。

Lex Fridman(02:28:24) 是的。所以我們應該說孿生素數猜想,數學史上最大的問題之一。哥德巴赫猜想也是。它們感覺像鄰居。有沒有那些日子你覺得你看到了路徑?

陶哲軒(02:28:37) 哦,是的。是的。有時你嘗試某些東西,它工作得非常好。你再次得到我們之前談到的數學嗅覺感覺。你從經驗中學到,當事情進展得太順利時,因為有某些困難是你必須遇到的。我想一位同事可能會這樣說,如果你在紐約街頭,被蒙上眼睛,被放在車裡,幾小時後眼罩被摘掉,然後你在北京。我的意思是那太容易了。沒有跨越海洋。即使你不確切知道做了什麼,你也懷疑有什麼不對。

Lex Fridman(02:29:21) 但這仍然在你的腦海中嗎?你偶爾會回到素數那裡看看嗎?

陶哲軒(02:29:29) 是的,當我沒有更好的事情要做的時候,這種情況越來越少。這些天我忙於很多事情。但當我有空閒時間,我不是,我太沮喪了,不想做我真正的研究項目,我也不想做我的行政工作,或者我不想為我的家人做一些差事。我可以為了樂趣玩這些東西。通常你什麼都得不到。你只能說,"好吧,行。再一次,什麼都沒發生。我會繼續前進。"很偶爾這些問題中的一個實際上得到解決。嗯,有時正如你說的,你認為你解決了它,然後你向前推進也許15分鐘,然後你想,"我應該檢查這個。這太容易了,好得不真實。"通常確實如此。

Lex Fridman(02:30:11) 你的直覺對這些問題何時會被解決怎麼說,孿生素數和哥德巴赫?

陶哲軒(02:30:16) 孿生素數,我認為我們會——

陶哲軒(02:30:19) ……繼續得到更多部分結果。它確實需要至少一個……這個奇偶性障礙是最大的剩餘障礙。有一些猜想的簡單版本,我們真的很接近了。所以我認為在10年內我們會有更多更接近的結果,我們可能不會有完整的結果。所以孿生素數有些接近。黎曼假設我完全沒有頭緒。我認為它會偶然發生。

Lex Fridman(02:30:47) 所以黎曼假設是關於素數分佈的一種更一般的猜想,對吧?

陶哲軒(02:30:53) 對。是的。它陳述了從乘法角度來看,對於只涉及乘法、不涉及加法的問題,素數真的表現得儘可能隨機。所以在機率中有一個叫做平方根消除的現象,如果你想要,比如說對美國某個問題進行民意調查,你詢問一兩個選民,你可能抽樣了一個壞樣本,然後你得到一個非常不精確的全體平均值測量。但如果你抽樣越來越多的人,精準性就會越來越好。精準性根據你抽樣人數的平方根改善。所以如果你抽樣1000人,你可以得到2或3%的誤差範圍。所以在同樣意義下,如果你以某種乘法意義測量素數,有一種你可以測量的特定類型統計,它叫做黎曼資料函數,它上下波動。

(02:31:42) 但在某種意義上,當你不斷地平均越來越多,如果你抽樣越來越多,如果它們是隨機的,波動應該下降。有一種非常精確的方式來量化這一點。黎曼假設是一種非常優雅的方式來捕捉這一點。但與數學中的許多其他方式一樣,我們很少有工具來顯示某些東西真正真正表現得很隨機。這實際上不只是一點點隨機,而是要求它表現得像真正隨機集合一樣隨機,這種平方根消除。我們知道,因為與奇偶性問題實際相關的事情,我們大多數常用技術無法希望解決這個問題。證明必須出人意料。但那是什麼,沒有人有任何嚴肅的提議。有各種解決方式。正如我說的,你可以稍微修改素數,你可以破壞黎曼假設。

(02:32:37) 所以它必須非常精細。你不能應用有巨大誤差範圍的東西。它必須剛好工作。有所有這些陷阱,你必須非常巧妙地躲避。

Lex Fridman(02:32:50) 素數真是令人著迷。

Lex Fridman(02:32:53) 對你來說,素數最神秘的是什麼?

陶哲軒(02:33:00) 這是一個好問題。推測地,我們有一個好的模型。我的意思是,正如我說的,我的意思是它們有某些模式,比如素數通常是奇數。但除了有一些明顯的模式,它們表現得非常隨機,只是假設它們表現得很好。所以有一種叫做克拉默素數隨機模型的東西,在某一點之後,素數就像一個隨機集合一樣表現。對這個模型有各種輕微的修改。但這一直是一個非常好的模型。它符合數值。它告訴我們要預測什麼。我可以完全確定地告訴你孿生素數猜想是真的。隨機模型給出了壓倒性的機率它是真的,我就是無法證明它。我們的數學大部分針對解決其中有模式的事物進行了最佳化。

(02:33:39) 素數有這種反模式,幾乎所有東西實際上都有,但我們無法證明這一點。我想素數是隨機的並不神秘,因為它們沒有理由有任何秘密模式。但神秘的是,真正迫使隨機性發生的機制是什麼?這只是缺失的。

考拉茲猜想

Lex Fridman(02:34:04) 另一個令人驚訝的困難問題是考拉茲猜想。

Lex Fridman(02:34:10) 簡單陳述,在其簡潔性中美麗地可視化,但極其難以解決。然而你能夠取得進展。保羅·艾爾德什說過關於考拉茲猜想,數學可能還沒有準備好面對這樣的問題。其他人已經聲明這是一個極其困難的問題,完全超出了現今數學的能力範圍,這是在2010年,然而你取得了一些進展。為什麼如此難以取得進展?你能解釋一下它是什麼嗎?

陶哲軒(02:34:41) 哦,是的。所以這是一個你可以解釋的問題。一些視覺輔助會有幫助。但是的,所以你取任何自然數,比如說13,你對它應用以下程序。所以如果它是偶數,你除以2,如果它是奇數,你乘以3再加1。所以偶數變小,奇數變大。所以13會變成40,因為13乘以3是39,加1得到40。所以這是一個簡單的過程。對於奇數和偶數,它們都是非常容易的操作。然後你把它們放在一起,仍然相當簡單。但然後你問當你迭代它時會發生什麼?你取剛剛得到的輸出並將其反饋回去。所以13變成40,40現在是偶數,除以2是20。20仍然是偶數,除以2,10,5,然後5乘以3加1是16,然後8,4,2,1。然後從1開始,它變成1,4,2,1,4,2,1。它永遠循環。所以我剛才描述的這個序列,13,40,20,10,這些被稱為冰雹序列,因為有一個過度簡化的冰雹形成模型,實際上並不完全正確,但仍然以某種方式作為一個初步近似教給高中生,是一個小的冰塊獲得冰晶形成並被雲覆蓋。由於風,它上下移動。有時當它冷時,它獲得更多質量,也許它融化一點。這個上下移動的過程產生了這種部分融化的冰,最終導致冰雹,最終它落到地面。所以猜想是,無論你從多高開始,你取一個數字,它在百萬或十億級,這個過程如果你是奇數就上升,下降,它最終總是落到地面。

Lex Fridman(02:36:23) 無論你從那裡開始,用非常簡單的演算法,你最終都會到達1。你可能會爬升一段時間——

陶哲軒(02:36:29) 是的。所以是的,如果你繪製這些序列,它們看起來像布朗運動。它們看起來像股票市場。它們只是以看似隨機的模式上下移動。事實上,通常就是這樣的,如果你輸入一個隨機數字,你實際上可以證明,至少在最初,它看起來像隨機遊走。這實際上是一個向下漂移的隨機遊走。這就像如果你總是在賭場玩輪盤賭,賠率稍微對你不利。所以有時你贏,有時你輸。但從長遠來看,你輸的比贏的稍微多一點。所以通常如果你只是一遍又一遍地玩下去,你的錢包會歸零。

Lex Fridman(02:37:07) 所以從統計學上講,我們到達這裡是有道理的?

陶哲軒(02:37:11) 是的。所以我證明的結果大致是說,統計上大約99%的所有輸入會向下漂移到也許不是一直到1,但會比你開始時小得多。所以這就像如果我告訴你,如果你去賭場,大多數時候你最終,如果你玩得足夠久,你最終錢包裡的錢會比你開始時少。這有點像我證明的結果。

Lex Fridman(02:37:35) 那麼為什麼這個結果……你能沿著這個思路繼續證明完整的猜想嗎?

陶哲軒(02:37:42) 嗯,問題是我使用了機率論的論證,總有這種例外事件。所以在機率中,我們有這個大數定律,它告訴你這樣的事情:如果你在賭場玩一個期望值為負的遊戲,隨著時間的推移,你幾乎肯定保證,機率儘可能接近100%,你保證會虧錢。但總有這種例外的異常值。即使在遊戲賠率不利的情況下,你仍然有數學可能性只是繼續贏得比輸的稍微多一點。非常像在納維-斯托克斯方程中,大多數時候你的波可以分散,可能只有一種異常的初始條件選擇會導致你爆炸。可能有一種異常的特殊數字選擇,你輸入進去,它會射向無窮大,而所有其他數字都墜落到地球,墜落到1。

(02:38:40) 事實上,有一些數學家,比如亞歷克斯·康托羅維奇,他們提出這些考拉茲迭代實際上像這些類似的自動機。實際上,如果你看看它們在二進制中發生了什麼,它們確實看起來有點像這些生命遊戲類型的模式。類比於生命遊戲如何能夠創造這些大規模的自我複製對象等等,可能你可以創造某種比空氣重的飛行機器。一個實際上編碼這個機器的數字,它的工作就是編碼,就是創造一個更大的東西的版本。

Lex Fridman(02:39:17) 編碼在數字中的比空氣重的機器——

Lex Fridman(02:39:20) ……永遠飛翔。

陶哲軒(02:39:22) 所以康威事實上也研究過這個問題。

陶哲軒(02:39:26) 康威,如此相似,事實上,這是納維-斯托克斯項目的更多靈感之一。康威研究了考拉茲問題的推廣,其中不是乘以3加1或除以2,你有更複雜的分支列表。但不是有兩種情況,也許你有17種情況,然後你上下移動。他證明了一旦你的迭代變得足夠複雜,你實際上可以編碼圖靈機,你實際上可以使這些問題不可判定,並做這樣的事情。事實上,他為這些分數線性變換發明了一種程式語言。他稱之為frac-trat,作為對full-trat的戲仿。他證明了你可以程式設計,它是圖靈完備的,你可以製作一個程序,如果你輸入的數字編碼為素數,它會沉到零。

(02:40:13) 它會下降,否則它會上升,諸如此類。所以這類問題的一般類別真的像所有數學一樣複雜。

Lex Fridman(02:40:23) 我們談到的元胞自動機的一些神秘性,有一個數學框架來對元胞自動機說任何東西,也許需要同樣的框架。是的,哥德巴赫猜想。

陶哲軒(02:40:35) 是的。如果你想做到這一點,不是統計地,而是你真的想要100%的所有輸入都落到地球。是的。所以可能可行的是,是的,統計上99%到達1,但所有的,那看起來很難。 (AGI Hunt)