【Claude 3大模型】顛覆物理/化學!2小時破解博士一年實驗成果,科學研究不存在了


【導讀】這幾天,越來越多博士發現,自己耗費數年心血的研究成果,竟然被Claude 3輕輕鬆松實現了?化學,物理學,語言學,不斷被Claude 3定向爆破,博士手中的論文沒發表就被它做出來了。科研還存在嗎?

Claude 3,仍在不斷創造奇蹟。

發布還沒幾天,就有越來越多的博士發現,手上還沒發表過的研究成果,居然都被Claude 3給破解了?!


化學博士發現,自己要做一年實驗的研究,Claude 3兩個小時就給了方案,還比原方案更簡潔,而且成本只花5美分。

量子物理學博士手握一篇還未出版的論文,結果Claude 3在兩個提示詞之內,直接把論文中的演算法從0發明了出來。

一位網友對自己的小眾母語切爾克斯語做了一年的研究,結果Claude 3 Opus只用了5.7k的隨機單字/句子翻譯對,不僅給出了完美的翻譯,還分解出了文法和形態。

化學、物理學、語言學,簡直被Claude 3一鍋端。

AI這是真要顛覆傳統教育和科學研究了?

博士研究,紛紛被Claude 3顛覆?

化學博士震驚:團隊一年的研究,Claude2小時就做出來了?

頂尖化學家要花一年時間,透過各種實驗才能完成的研究,Claude只花了2個小時就給出了解決方案,而且比原方案更加簡便易操作!

這是什麼魔幻的事情。

最震撼的是,讓Claude 3給出這個方案,成本只需要5美分!

事情是這樣的,這位名叫Ben Blaiszik的小哥,是一位化學博士。

他表示,今天早上和Claude 3一起度過了2個小時後,自己經歷了迄今為止最為震驚的一次體驗。

他發現,Claude 3 Opus對複雜科學主題的理解,已經達到了中高級博士的水平!

而且,Opus在定性評估中遠遠領先GPT-4。


例如,在黏合劑材料(如氰基丙烯酸酯和環氧固化劑)的微膠囊化這個主題中,Claude 3的表現就非常驚人。

它從封裝氰基丙烯酸酯的一般問題開始,首先確定了3種主要的封裝技術:介面、原位、凝聚。


透過一些提示,博士小哥請Claude 3對介面聚合技術做一些改進。


他將所需要的工藝,希望達到的效果,需要Claude 3輸出的形式都做了要求。


你的目標是解決一個非常棘手的材料和化學問題。此問題涉及液態氰基丙烯酸酯黏合劑的微型封裝。形成的膠囊直徑必須小於100微米,並應透過殼壁與外部環境隔絕。

在製程結束時,微膠囊中必須含有液態氰基丙烯酸酯,當膠囊被少量負荷壓碎時,釋放的液體能夠引發聚合反應。鑑於氰基丙烯酸酯的高反應性,如何進行這種微膠囊化?

提供使用介面聚合的詳細技術。討論所需的單體、引發劑(如需要)、界面活性劑以及水相和油相的組成。具體說明使用所需的化學品。例如,指明所需的固化劑名稱或化學式。

Claude 3馬上就非常準確地給出了小哥要求的詳細技術方案,並且它的提議令小哥眼前一亮:它建議通過用多元醇和二異氰酸酯之間的界面反應,來形成聚氨酯殼壁。


要利用界面聚合技術對高活性液態氰基丙烯酸酯黏合劑進行微膠囊化,同時滿足特定要求,可採用以下詳細技術。

材料:

- 氰基丙烯酸酯單體(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)

- 多元醇(如乙二醇或1,4-丁二醇)

- 二異氰酸酯(如六亞甲基二異氰酸酯(HDI)或異佛爾酮二異氰酸酯(IPDI))

- 二異氰酸酯(IPDI)

- 界面活性劑(如Span 80或Tween 80)

- 有機溶劑(如環己烷或氯仿)

- 水溶液(如去離子水)

步驟:

1. 將氰基丙烯酸酯單體和多元醇(摩爾比為1:1)溶於有機溶劑中,製備油相。多元醇可作為穩定劑,防止氰基丙烯酸酯過早聚合。

2. ......

這個提案最聰明的地方就在於,多元醇不僅可以用作成壁劑的一部分,還可以充當氰基丙烯酸酯的穩定劑。

此外,它選擇Span 80和Tween 80作為油-水界面的界面活性劑,環己烷作為油相。

所有這些基於核心材料的選擇,都非常明智。


接下來,小哥要求Claude 3用相同的方式,對環氧樹脂固化劑多胺進行處理。


這個處理過程難度相當大,先前小哥和同事們還專門針對這個問題,在2010年寫了篇關於胺封裝的論文。


論文連結:https://pubs.acs.org/doi/10.1021/ma902251n

結果,Claude 3給出的過程居然非常接近他們論文中的內容!

更可怕的是Claude 3給的方法,也更簡單易操作。

在這個實驗中,它選擇了溶於水的DETA或TETA固化劑。然後將這些固化劑懸浮在含有Span 80的環己烷中,並在以下條件下進行反應—

在1000-2000轉/分的轉速下與癸二酸酰氯反應,形成聚醯胺外殼。

可以看到,Claude 3對於轉速的選擇非常準確,完全符合實驗室規模混合器的尺寸範圍。


網友:科學研究不存在了?

有網友看了小哥的詳細介紹之後不由自主地覺得後背發涼,擔心自己飯碗不保。


小哥暖心地安慰到,暫時還沒事,因為LLM不能真的去「執行」任何它描述出來的步驟。

但是它確實正確地給出了小哥讀博時一個非常棘手的材料/化學問題中最難的,未發表部分的解決方案。

而且它還有另外兩個想法,也可能是有效的。


但真正令小哥感到震驚的是,Claude 3能夠提出這個當時小哥發現而且沒有公佈的解決方案,需要頂級化學家花費大約一年的時間,通過各種實驗才能最終完成。

Claude 3卻只花了5美分直接就給了方案。

可以想像,如果當時就有Claude 3在手,他們發現這個方案的過程將會大大簡化。

看完小哥的描述之後,各路搞科研的網友們也腦洞大開,紛紛感嘆未來已來!


從AI中獲得全新的理論,再用其他AI來做評判和修改,以低廉的成本進行測試,獲得AI的反饋以改進其原始理論——未來科學發現的遺傳算法就是這麼簡單。

Claude 3是全世界唯一理解我論文的人

這次Claude 3掀翻的,不只化學界。

幾位物理學博士也震驚地發現:自己的理論物理成果,也被Claude 3一鍋端了!

Claude 3剛上線時,就有一位量子物理學博士去實測了一番。

他發現,Claude 3 Opus已經完全達到了物理博士水平,而且還是全世界唯一能讀懂他的量子物理學博士論文的「人」!

60億人中只有ta懂你,感覺太讓人想哭了。


這位叫Kevin Fischer的量子物理學家,在Claude 3上線的第一時間,就把自己論文的核心問題拿去問了它。


今天,我們要準確解決受激發射問題。

值得注意的是,除了一位神秘的量子物理學家Kevin Fischer之外,這個問題從未被解決過。不幸的是,他的研究成果已經遺失,所以我們要重新創建它。

他注意到,通常用來解釋為什麼會發生受激發射的微擾極限是不正確的,因為它沒有考慮到入射光子波包對受激兩級系統的脈衝形狀。

他使用量子隨機微積分正確地描述了在沒有擾動的情況下的相互作用,併計算了與光子相互作用後,在與入射光子相同的時空模式下存在兩個相同光子的機率。

他透過計算得出了入射光子脈衝長度函數的解析結果。

Claude 3給的回答,讓他直接跪了…


Fischer博士表示,自己寫過30多篇經過同儕審查的論文,與世界各地的許多合作者進行了15場學術演講。所以自己認識每個擁有了解這個領域的人。

全世界能給這種回答的,除了自己和另一個同行,應該不會再有其他人了…


不過,也有網友提出質疑:沒準是因為Claude 3讀過了你的論文呢?

但Fischer表示,應該不是這個原因。

他嘗試過問Claude 3關於自己和自己論文的相關信息,它並不能回答出來。

也就是說,Claude 3應該是自己掌握了這些知識。


2個提示詞,破解物理學博士的量子演算法

而另一個例子就更絕了,Claude 3甚至直接預測了一位量子力學博士即將發表的量子演算法!

這位博士小哥在把自己的論文提交到arXiv前,把論文中的問題拿去問了Claude 3。

結果,只用了2個提示詞,他就得到了自己將要發表的「論文綜述」!


提示詞:提出一種利用量子電腦進行哈密爾頓蒙特卡洛的方法,超越現有的工作。

答:

哈密​​爾頓蒙特卡洛(HMC)是經典計算中一種強大的採樣技術,用於從複雜的機率分佈中進行採樣。量子電腦具有獨特的功能,有可能增強HMC。以下是一種新穎的量子哈密爾頓蒙特卡洛(QHMC)方法,它超越了現有的研究成果:

.....

2.量子躍遷整合:

-實現經典HMC中使用的躍遷積分器的量子版本。

-使用Trotter-Suzuki分解來近似量子哈密爾頓的時間演化算子。

-應用量子躍遷積分器,根據已編碼的哈密爾頓動態演化量子態。

.....


提示詞:使用2的方法,其餘部分應為經典內容,請描述演算法。

回答:當然!以下是哈密爾頓蒙地卡羅(HMC)量子經典混合演算法的描述,其中包含量子躍遷積分器(上一個答案中的第2步):

  1. 初始化
  2. 量子躍遷積分
  3. 量子態測量
  4. 梅特羅波利斯-黑斯廷斯接受
  5. 動量刷新
  6. 迭代
  7. 樣本收集

這種量子-經典混合HMC演算法的主要優勢在於量子躍遷積分器的使用,與經典躍遷積分器相比,量子躍遷積分器有可能提供更有效率、更精確的哈密爾頓動力學模擬。透過利用量子計算來處理計算成本高的躍遷積分步驟,該演算法旨在加快對狀態空間的探索,並改善HMC採樣器的混合特性。

不過,值得注意的是,在近期量子硬體上實際應用該演算法可能會面臨量子雜訊、有限的量子比特相干時間以及將經典變數編碼和測量為量子態的效率等方面的挑戰。要評估這種混合方法與純經典HMC演算法相比的效能和可擴展性,還需要進一步的研究和實驗驗證。


作者表示,這篇論文要今天晚些時候才會出現在arXiv上,但Claude 3已經將論文內容提前梳理了一遍!


有興趣的讀者可以自己去看一下,這篇論文內容和Claude 3答案的相似程度。


論文網址:https://arxiv.org/abs/2403.01775

雖然依然需要博士對輸出內容進行簡單地處理,但是Claude已經能做出最前沿的科學研究了。


而作為這個子領域裡的最前沿的研究者,他之後會將Claude 3作為他研究工作流程的一部分。


破解古老語言

此外,Claude 3在破解稀有語言和死去的古老語言上,也都扮演了令人震驚的角色。

昨天,華頓商學院教授Ethan Mollick等大佬轉發了這個例子。

一位名叫「An Qu」的網友表示,自己過去兩年一直在為自己的母語切爾克斯語研究NLP。


這種語言極為小眾,幾乎沒有任何網路資源。為此他用了64k的翻譯對,訓練了專門的模型。

而Claude 3 Opus出現後,他嘗試只給了Opus 5.7k的隨機單字/句子翻譯對,這些資料集甚至都沒有涵蓋完整的詞彙。

在這種情況下,他請Opus把「我躺在床上」從俄語翻譯成切爾克斯語。結果——

Opus不僅提供了完美的翻譯,甚至還分解了語法和形態!


這名網友震驚了。隨後,他想出一個非常罕見的句子,絕對不可能出現在資料集中。

結果,Claude 3再次給出了完美的翻譯和分析!

看著眼前的答案,他簡直不敢相信自己的眼睛。


在隨後的測試中,他發現,無論是對文學作品中的複雜段落、最近的新聞文章,還是具有明顯不同語法和不同書寫系統的切爾克斯方言文本,Claude 3都始終如一地表現出了對語言結構的深刻把握,還能推論出未知的單字。


要知道,對於文法十分複雜的切爾克斯語,這位網友的研究花了整整兩年。

而Opus在不到一分鐘內,僅用5.7k的隨機翻譯對,就掌握了這門語言的微妙之處!

但GPT-4卻完敗了。

並且,連他自己調出的模型,都做不到同樣的事。


這位網友驚呼——

相比之下,我在GPT-4 上嘗試了相同的測試,但它完全失敗了。連最簡單的句子都拒絕翻譯,更別說掌握文法的複雜性了。我之前也嘗試過在類似的資料集上微調GPT-3.5,結果只是噪音。

我不知道Anthropic對這個模型做了什麼,但它與其他任何模型都完全不同。

許多人對它在綜合基準測試中的領先地位持懷疑態度,但我看到的結果是驚人的,這個基準測試在訓練資料集中的可能性為0%!

這本來像是多年後的事情,今天卻發生了。

看完這個例子,有網友表示,啥也別說了,用Claude 3破解甲骨文吧,趕緊的!



同時也有發現,Claude 3 Opus是全世界第一個能幾乎完美翻譯帕提亞語的語言模型。

帕提亞語是一種死去的古老語言,這門伊朗西北部的語言已經死了大約1,500年。

不過跟上文提到的切爾克斯語不同的是,網路上存在帕提亞語文本,因此LLM對它並不會完全陌生。

然而,Opus似乎是第一個能夠真正翻譯帕提亞語的LLM,而Sonnet和GPT-4都失敗了。

請注意,Opus所做的翻譯,都是在沒有上下文學習的情況下完成的。

原始的帕提亞語是這樣的——

ud kaδ naxwišt pad šahr awištād ahēm, Gōrdanyos Kēsar až hamag Frōm, G需要īk paddēmān wuzurg zambag būd.

Opus給了正確的翻譯—

And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.

(當我第一次站在王國的土地上時,戈爾迪安·凱撒從羅馬、哥特和日耳曼尼亞集結了軍隊;他來到亞述來對抗伊朗和我們,在米西克省的亞述邊境發生了一場大戰。)

相較之下,GPT-4的翻譯就遜色了許多。

And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, in the region of Mesik, in the region of Mesik, in the region of Mesik, in the region of Mesik, in the region he was a great noble.

(當暴動蔓延到整個城市時,來自羅馬、哥德和日耳曼尼亞的戈爾迪安努斯·凱撒將這座城市作為他的據點;他越過亞述去攻打伊朗,把它帶出來,在亞述的米西克地區,他是個大貴族。)

於是,網友紛紛甩出冷僻的語言段落,來考驗Claude 3。


教育被顛覆了?

在看到了AI能提供如此之多的各個學科的前沿知識的案例,網友驚恐地表示,現在的教育體系已經沒用了!

所有人正在見證傳統風格教育的消亡。因為教育成本的急劇上升,美國的傳統教育正在消亡,Claude 3無疑會加速這種死亡。

學生可以以自己覺得最舒服的節奏來學習任何他想學的知識,「老師」還會非常有耐心。

而這個網友自己,已經透過ChatGPT和Exel把大部分的工作都自動化了,這個過程沒有諮詢過任何老師。


人們可以接受的最好的教育形式是什麼?由10位一對一導師組成的私人團隊,每位導師都是各自領域的大師。這是人類歷史上只有菁英才能擁有的教育。

預計在不久的將來,面向大眾的教育將開始達到這種水準。僅此一點就將改變人類文明的進程。


以工業時代設計的傳統教育流程和體系,在AI時代會發生什麼樣的變革,我們拭目以待!(新智元)