上市緊要關頭,大神卡帕西加盟Anthropic

2026年最重要的人事變動之一,莫過於安德烈·卡帕西(Andrej Karpathy)去了Anthropic。

就在2026年5月19日晚,卡帕西發了一條X,稱他現已入職Anthropic,重新投身研發工作。

卡帕西是OpenAI的聯合創始人之一,也曾領導特斯拉的自動駕駛團隊。

這個消息之所以炸裂,不單單是說卡帕西的身份顯赫,關鍵是他加入Anthropic的時機。

Anthropic計畫在2026年下半年上市,現在正是需要行業頂級人才背書的時刻。

而卡帕西,剛好就是這麼一個行業支柱,絕對的燈塔級人物。

他的加入,勢必會讓Anthropic如虎添翼。

不光是如此,卡帕西在Anthropic干的活也是非常有意思,他要讓Claude自己來研究自己,自己去提升自己。

01. 卡帕西加入Anthropic做什麼?

卡帕西加入的是Anthropic的預訓練團隊,但他幹的可不是一般預訓練的活兒。

Anthropic預訓練負責人尼古拉斯·約瑟夫(Nicholas “Nick” Joseph)轉了卡帕西加入的這條X,並寫到,卡帕西將組建一支團隊,專注於使用Claude大模型,來推進預訓練相關研究工作。

預訓練的本質是讓大模型對事物有基礎的認知,就像咱們口中的常識一樣,下雨要打傘、出門帶鑰匙。

後面的微調、RLHF、安全對齊、產品化,都建立在這個底座之上。

而卡帕西要做的,是讓模型參與到預訓練這個過程中,讓AI研究AI自己。

這裡可能有點繞,我儘量把它解釋清楚。預訓練是一個階段,而在這個階段裡,模型需要進行多次大規模訓練。

第一次大規模訓練的時候,團隊可能嘗試某個架構和資料配比,然後根據訓練的結果發現其中的問題,調整第二次大規模訓練方案,然後再最佳化、再訓練,一直往復。

研究團隊在這個過程中需要做無數個決策,比如用什麼資料、怎麼清洗、怎麼配比、用什麼架構、怎麼調超參數、訓練過程中出問題了怎麼辦等等。

一個模型跑了幾周的大規模訓練,結果發現一開始的方向錯了,那這幾周的算力和時間就全部浪費了。

所以如果能在訓練前,通過AI的輔助研究,排除掉一部分錯誤的方向,那麼模型的訓練效率就會更高。

那為什麼這事得卡帕西來呢?

其實是因為卡帕西的身份很特殊,他的經歷囊括研究員、工程師和產品經理三大類股。

他在OpenAI工作過兩次,第一次是2015年作為聯合創始人加入,擔任研究科學家,專注於深度學習和電腦視覺,直到2017年離開加入特斯拉。

第二次是2023年回歸OpenAI,參與GPT-4的改進工作,直到2024年再次離開,創辦了Eureka Labs。

2017年的時候,馬斯克親自聘請卡帕西,讓他領導特斯拉的電腦視覺工作。卡帕西負責特斯拉的全自動駕駛和Autopilot項目,直到2022年離開。

這些工作讓卡帕西對大規模工程化這件事,有了更深刻的理解。

就拿特斯拉來說,你要把自動駕駛部署到百萬輛車上。還需要它能在真實世界中工作、要處理各種極端情況、要在有限的算力和功耗下運行,沒點工程手段根本拿不下來。

很多AI研究者只會做實驗,發論文,但不知道怎麼把模型變成產品。卡帕西是既懂AI,也懂工程,還懂產品。

所以Anthropic的這個崗位,非卡帕西莫屬。

換一種思路,卡帕西的加入對Anthropic來說,也是一次重大勝利。

Anthropic計畫在2026年上市。技術和產品雖然也很重要,但華爾街根本看不懂大模型,他們只看得明白你們企業有什麼樣的人物。

卡帕西在AI行業內顯然是個圖騰一樣的存在。

不光是AI圈,他在教育圈也是大佬。

2015年,卡帕西和李飛飛一起設計了史丹佛大學第一門專門講授深度學習的課程,他是主要講師。這門課的視訊網上觀看次數超過了80萬次。

近年來,他在YouTube上發佈了大量技術講解視訊,教人們如何從零開始建構如同GPT那樣的大語言模型。教學風格清晰,對問題深入淺出,能把最複雜的技術問題講得讓普通人也能理解。

02. 在Anthropic組建反OpenAI聯盟

隨著卡帕西的加入,Anthropic的OpenAI diaspora聯盟變得更加強大了。

這是外網發明的一個非常戲謔的叫法,diaspora這個詞的原意是“離散群體、散居群體”。

放在OpenAI diaspora這個詞裡,指的就是那些曾經在OpenAI工作,後來離開OpenAI,到Anthropic裡的人。

Anthropic的兩位聯合創始人阿莫迪兄妹,他倆都是OpenAI的前高管。達里歐曾是OpenAI的研究副總裁,丹妮拉曾是OpenAI的副總裁。

除此以外還有湯姆·布朗(Tom Brown),他是GPT-3論文的第一作者。現在的湯姆是Anthropic的研究副總裁。

還有克里斯·奧拉(Chris Olah),現任Anthropic可解釋性研究負責人。

他在OpenAI工作期間,開創了神經網路可解釋性的多個重要方向。別人訓練模型只看結果好不好,克里斯想知道AI到底是怎麼工作,大模型思考的時候,到底是那一層神經元在起作用。

還有傑拉德·卡普蘭(Jared Kaplan),scaling laws的主要研究者之一。

Scaling laws現如今早已是家喻戶曉,講的是擴大算力規模,模型能力就會繼續提升。

還有山姆·麥克坎迪許(Sam McCandlish),同樣是scaling laws的重要貢獻者,也是GPT-3訓練的關鍵人物,現在是Anthropic的研究科學家。

為什麼這些人會離開OpenAI?

理由也是眾說紛紜。阿莫迪兄妹在離開OpenAI時表示,他們對OpenAI的方向有不同看法,尤其是在AI安全方面。他們認為OpenAI過於關注商業化,而對安全研究投入不夠。

所以他們創辦Anthropic,希望建立一個更關注安全的AI公司。

外媒還流傳著這樣一種說法,是OpenAI在2019年轉型為營利性公司後,整個公司的文化和優先順序都發生了變化。

OpenAI的高層們開始考慮收入、利潤、估值和股東回報,對一些早期成員來說,這種轉變是難以接受的。

這不是說商業化本身是錯的。

但對那些更關心研究和安全的人來說,他們開發產品還需要對市場和客戶負責,這件事背離了他們做研究的初心。

所以他們離開了,創辦了Anthropic。

Anthropic一開始就說自己是公益公司(PBC),這個身份在法律上就跟普通公司不一樣。

普通公司的董事會只對股東負責,賺錢就行。公益公司的董事會得同時考慮公共利益,每年還要出報告,說自己為社會做了什麼。如果光顧著賺錢不管公益,股東可以告你。

但光有這個身份還不夠,Anthropic還搞了一套更狠的機制,叫“長期利益信託基金”(LTBT)。

簡單說就是,公司之外專門設了一個獨立機構,由五個人組成,這五個人必須是AI安全、國家安全、公共政策這些領域的專家。

他們手裡握著一類特殊的T類股票,在極端情況下,比如AI可能造成災難性風險的時候,這五個人可以否決董事會的決定,強制公司把安全放在第一位。

就算投資人和管理層都想冒險賺快錢,這五個外部專家可以一票否決。

卡帕西的加入,給整個團隊帶來的是一種強烈的認同感。

“咱哥幾個,曾經既然能在OpenAI創造了GPT的奇蹟,現在我們到了Anthropic,照樣能再創輝煌!”

我對比了一下2015年OpenAI的創立公告,發現了一個很有意思的事情。由於卡帕西加入了Anthropic,導致現在Anthropic裡的OpenAI創始團隊人數,已經和OpenAI打平了。

OpenAI這邊有奧特曼、布魯克曼和沃伊切赫·扎倫巴(Wojciech Zaremba),Anthropic有德克·金馬(Durk Kingma)、卡帕西,還有已經離職的約翰·舒爾曼(John Schulman)。

不過,這不是說Anthropic反對OpenAI的技術路線。事實恰恰相反,Anthropic的技術路線和OpenAI非常相似,都是基於大規模語言模型,都相信scaling laws,都在追求AGI。

Anthropic反對的,是OpenAI的商業化優先策略,以及OpenAI在安全研究上的不足。

可以肯定的是,在AI程式設計和ToB這兩個領域,Anthropic領先OpenAI太多了,以至於Codex明明體驗下來要比Cowork更好,但大家仍然會選Anthropic的產品。

更重要的是,卡帕西還給Anthropic帶來了名人效應。

誰會不想跟卡帕西這樣的行業圖騰共事呢? (字母AI)