諾貝爾物理學獎破天荒頒給「AI教父」!Hinton成首點陣圖靈獎諾貝爾物理學獎雙料得主
爆冷!2024年的諾貝爾物理學獎,花落John Hopfield和Geoffrey Hinton,理由是運用物理學原理訓練人工神經網路。委員會宣佈獲獎名單時,所有人倒吸一口冷氣。現在,網友已經炸鍋了。
就在剛剛,2024年諾貝爾物理學獎揭曉。
獎項頒發給John Hopfield和Geoffrey Hinton!
兩人獲得諾貝爾物理學獎的理由是,他們使用物理學工具訓練了人工神經網路,這些方法是當今強大機器學習的基礎。他們的工作,讓如今的深度神經網路和深度學習得以誕生。
John Hopfield創造了一種可以儲存和重構資訊的結構。Geoffrey Hinton發明了一種可以自主發現資料特徵的方法,這種方法對現在使用的大型人工神經網路變得至關重要。
是的,一位電腦科學家和一名分子生物學家,受人腦神經元啟發創造出的「人工神經網路」,獲得了今年的諾貝爾物理學獎。
而Hinton,也成為史上首點陣圖靈獎+諾貝爾物理學獎的獲獎者。
Geoffrey E. Hinton
接到諾獎委員會的電話後,Hinton的第一反應是:「我驚呆了!沒有想過這件事會發生在我身上。」
媒體提問環節中有人問到Hinton會使用哪些AI工具,他直接表示:「我經常用GPT-4,雖然它給出的答案不總是對的,但是很有用。」
Geoffrey Hinton發明了一種可以自動發現資料特徵的方法,從而執行諸如識別圖片中特定元素等任務。
Geoffrey Hinton以Hopfield網路為基礎,建立了一個使用不同方法的新網路:玻爾茲曼機。後者可以學習識別給定類型資料中的特徵元素。
Hinton使用了統計物理學的工具,通過輸入在機器執行階段很可能出現的例子來訓練機器。
玻爾茲曼機可用於分類圖像或建立與其訓練模式類型相似的新例子。在此基礎上,Hinton繼續研究,幫助啟動了當前機器學習的飛速發展。
出生於學霸世家
2018年,Geoffrey Hinton與Yoshua Bengio和Yann LeCun一起獲得了圖靈獎,以表彰他們在深度學習領域做出的奠基性貢獻。
2012年,Hinton和他的學生發表了一篇題為「Deep Neural Networks for Acoustic Modelling in Speech Recognition」的開創性論文。
論文首次證明了神經網路是當時最先進的技術——在識別語音模式方面優於隱馬爾可夫模型(HMM)和高斯混雜模型(GMM)等經典模型。而這一年,正是人工智慧的突破之年。
論文地址:https://research.google/pubs/pub38131/
同在2012年,Hinton和Alex、Ilya在ImageNet競賽中獲勝,他們基於神經網路建立的電腦視覺系統能夠識別1000個物體。
論文地址:https://dl.acm.org/doi/10.1145/3065386
2013年,Hinton的公司DNNresearch被Google收購,而他本人也被Dean招募進Google兼職。
然而,就在10年之後的2023年,作為深度學習泰斗、神經網路之父Geoffrey Hinton突然宣佈離職。
我對我的畢生工作,感到十分後悔。
John J. Hopfield
John Hopfield發明了一個使用保存和重建模式方法的網路,其中我們可以將節點想像成像素。
Hopfield網路利用了材料由於其原子自旋而具有特性的物理學——這種特性使每個原子成為一個微小的磁鐵。整個網路的描述方式等同於物理學中發現的自旋系統中的能量,並通過找到節點之間連接的值來訓練,使保存的圖像具有低能量。
當Hopfield網路被輸入一個失真或不完整的圖像時,它會有條不紊地處理節點並更新它們的值,使網路的能量下降。
因此,網路逐步尋找最接近輸入的不完美圖像的已保存圖像。
跨學科心路歷程
Hopfiled生於1933年,曾任普林斯頓大學分子生物學教授。
有趣的是,他的父親John Joseph Hopfiled是波蘭著名的物理學家,他年輕時也一直在從事物理學方面的研究,後來參與神經網路相關項目後才轉向生物學方向。
Hopfiled本科畢業於美國斯沃斯莫爾學院,1958年獲得康奈爾大學物理學博士學位,導師是從事固體物理學研究的Albert Overhauser。
畢業後,Hopfield曾在貝爾實驗室擔任了兩年的技術人員,之後在巴黎高等師範學院、加州大學伯克利分校、玻爾研究所、加州理工學院、普林斯頓大學、劍橋卡文迪許實驗室等頂尖機構都曾有過研究或教職經歷。
至於為何從固態物理轉向生物學,Hopfiled在2013年Annual Reviews的一篇文章中,回憶了自己當年的奇妙經歷,並詳細闡述了對當下生物學和物理學如何融合發展的思考。
根據Hopfiled的回憶,他是一個有點「三分鐘熱度」的人,喜歡廣泛接觸各種研究領域,而從固態物理進入神經系統層面的生物資訊處理,完全是一次偶然經歷。
1977年冬天,他正在在哥本哈根的玻爾研究所擔任客座教授,安排了許多拓寬自己眼界的研討會,但沒有給發現新的研究課題。
而回到普林斯頓後不久,他就被「神經科學研究計畫」(NRP)的負責人找上了門,作為一名物理學家,闖入了一個全是心理學家和生物學家的研究小組。
Hopfiled形容,自己當時是被迷住了——「對我來說,思想如何從大腦中產生是我們人類提出的最深刻的問題,而這個擁有多元化人才和極大熱情的NRP小組正在追求這一目標」。
1986年,Hopfiled在加州理工聯合創辦了計算和神經系統博士項目;等到了1997年,Hopfiled已經「不務正業」太久,完全偏離了傳統物理學領域,甚至無法在任何物理系謀取職位。加入普林斯頓的分子生物系時,沒有人認為他是物理學家。
對於自己的「不務正業」,Hopfiled並不覺得是個問題,畢竟自從他邁入學術界的60年代開始,物理學逐漸開始舉步維艱、掙扎求存。
年輕時廣泛接觸生物學的Hopfield就堅持認為學者應該有廣闊的視野和思考,大半生從事跨學科研究後,Hopfild依舊支援生物和物理的「聯姻」。
在這篇回憶文章的最後,Hopfiled寫道:
「物理學多次不得不做出選擇,要麼努力保留一個新的組成部分,就像十幾歲的孩子一樣,要麼將其作為一門獨立的學科送入荒野。我很高興許多(也許是大多數)物理學家現在普遍將複雜系統物理學,特別是生物物理學視為該家族的成員。物理學是一種關於世界的觀點。」
運用物理學原理發現資訊中的模式
對於物理學獎為何要頒發給John Hopfield和Geoffrey Hinton,委員會給出了如下的詳細解釋。
許多人都見證過電腦如何能夠在語言之間翻譯、解釋圖像,甚至進行合理的對話。也許不太為人所知的是,這種技術長期以來對研究很重要,包括對大量資料的分類和分析。
機器學習在過去15~20年裡飛速發展,並利用了一種稱為「人工神經網路」的結構。
如今,當我們談論人工智慧時,通常指的就是這種技術。儘管電腦無法思考,但機器現在可以模擬記憶和學習等功能。
正是今年的物理學獎獲得者,使其成為可能。他們使用物理學的基本概念和方法,開發了利用網路結構處理資訊的技術。
機器學習與傳統軟體不同。在機器學習中,電腦通過示例學習,使其能夠解決過於模糊和複雜而無法通過逐步指令管理的問題,例如解釋圖片並識別其中的物體。
模擬大腦
人工神經網路使用整個網路結構處理資訊。這種靈感最初來自於理解大腦如何工作的願望。
在20世紀40年代,研究人員開始探索大腦神經元和突觸網路的底層數學原理。
另一個突破性的拼圖來自心理學,歸功於神經科學家Donald Hebb的假說,該假說認為學習發生是因為當神經元一起工作時,它們之間的連接會得到加強。
後來,這些想法被進一步發展,通過建構人工神經網路作為電腦模擬來模擬大腦網路的功能。
在這些模擬中,大腦的神經元被賦予不同值的節點所模擬,而突觸則由節點之間可以變強或變弱的連接來表示。Donald Hebb的假說仍然被用作通過訓練更新人工網路的基本規則之一。
在20世紀60年代末,一些令人沮喪的理論結果導致許多研究人員懷疑,這些神經網路永遠無法實現應用。
然而,在20世紀80年代,人們對人工神經網路的興趣重新被喚醒,當時幾個重要的想法產生了重大影響,其中包括今年諾貝爾物理學獎獲獎者的工作。
聯想記憶
在1982年,John Hopfield發現了聯想記憶。
當Hopfield網路接收到一個不完整或稍微扭曲的模式時,一種重建方法可以找到最相似的儲存模式。
此前,Hopfield曾利用自己的物理學背景,探索分子生物學中的理論問題。
當他受邀參加一個神經科學會議時,他被大腦結構研究的知識所吸引,開始思考簡單神經網路的動力學。當神經元一起工作時,它們可以產生新的強大特徵,這些特徵對於只看網路單獨元件的人來說是不明顯的。
隨後,利用描述自旋相互影響時材料如何演變的物理學原理,他建構了一個具有節點和連接的模型網路。
Hopfield建構的網路(Hopfield network)有通過不同強度的連接相互連接的節點。每個節點可以儲存一個單獨的值——在Hopfield的最初工作中,這可以是0或1,就像黑白圖片中的像素。
Hopfield用一個等同於物理學中自旋系統(spin system)能量的屬性來描述網路的整體狀態。
隨後,Hopfield和其他人繼續發展Hopfield網路工作原理的細節,包括可以儲存任何值的節點,而不僅僅是零或一。
如果把節點想像成圖片中的像素,它們可以有不同的顏色,而不僅僅是黑色或白色。改進的方法可以保存更多圖片,並在它們非常相似時區分它們。
只要資訊是由許多資料點建構的,就同樣可以識別或重構任何資訊。
用十九世紀物理學進行分類
當Hopfield發表關於聯想記憶的文章時,Geoffrey Hinton正在美國匹茲堡的CMU工作。
他曾經思考:機器是否能以類似人類的方式學習處理模式,為分類和解釋資訊找到自己的類別。
Hinton與同事Terrence Sejnowski一起,從Hopfield網路出發,利用統計物理學的思想,建構了新的東西。
統計物理學可以分析單個元件可以共同存在的狀態,並計算它們發生的機率。一些狀態比其他狀態更有可能發生;這取決於可用能量的數量,
這在十九世紀物理學家Ludwig Boltzmann的方程中有所描述。Hinton的網路利用了這個方程,在1985年發表了引人注目的「玻爾茲曼機」。
玻爾茲曼機通常使用兩種不同類型的節點。資訊被輸入到可見節點中。其他節點形成一個隱藏層。隱藏節點的值和連接也對整個網路的能量有貢獻。
經過訓練的玻爾茲曼機可以在以前沒有見過的資訊中識別熟悉的特徵。它成為了生成式模型的雛形。
機器學習的今天和明天
John Hopfield和Geoffrey Hinton從20世紀80年代開始的工作,奠定了2010年左右開始的機器學習革命的基礎。
在Hopfield 1982年的文章中,他的網路有30個節點。而如今的大語言模型,參數可能超過一萬億。
長期以來,機器學習一直被用於諾貝爾物理學獎中熟悉的領域,比如使用機器學習來篩選和處理髮現希格斯粒子所需的大量資料,以及減少測量碰撞黑洞引力波時的噪音,或搜尋系外行星。
物理學為機器學習的發展提供了工具,同時也從人工神經網路中收益。
百年諾獎,很少犯錯
自1901年以來,諾貝爾物理學獎幾乎每年都會頒發一次。
得獎的1~3三位科學家將永垂青史,獲得物理學界最負盛名的獎項。
諾貝爾物理學獎的部分吸引力,在於它的神秘性。每個獎項頒發原因的確切細節,在頒發後50年內仍然保密。
諾貝爾物理學委員會是如何運作的?《物理世界》曾對前委員會主席有一篇採訪,讓我們瞭解世界頂尖的物理學獎項是如何被評選出來的。
瑞典粒子理論家Lars Brink曾八次擔任諾貝爾物理學委員會委員。
他表示,每年頒發這個被譽為科學界最高榮譽的獎項是一項艱巨的任務,絲毫不容出錯。
「這是如此享有盛譽的獎項,我們必須謹慎行事,不能犯任何錯誤。」他自豪地表示,在這個獎項一百多年的悠久歷史中,「錯誤寥寥無幾」。
只能說,今年委員會真是給全世界準備了一個大驚喜。
參考資料:
https://www.nobelprize.org/prizes/physics/2024/press-release/
https://physicsworld.com/a/inside-the-nobels-lars-brink-reveals-how-the-worlds-top-physics-prize-is-awarded/ (新智元)