台北時間5月20日,OpenAI創始成員、前特斯拉AI總監安德烈·卡帕西(Andrej Karpathy)公開宣佈,已加入大模型公司Anthropic。
他稱,未來幾年將是LLM(大語言模型)前沿領域非常關鍵的塑造期,非常高興能加入團隊並重返研發一線。他依然對教育充滿熱情,並計畫在適當時機恢復相關工作。在此之前,卡帕西曾短暫將精力投入其創辦的AI教育初創公司Eureka Labs。
據悉,卡帕西已於本周正式入職Anthropic的預訓練團隊,向該團隊負責人、同樣出身OpenAI的尼克·約瑟夫(Nick Joseph)匯報。Anthropic發言人證實,卡帕西將在公司內建立一支全新的研發小組,核心任務是開展一項具有遞迴性質的前沿探索:利用Anthropic旗下的旗艦大模型Claude自身的能力,來加速前沿模型的預訓練研究。
作為全球人工智慧領域的明星科學家,卡帕西履歷資深。他師從著名電腦視覺學者李飛飛,是OpenAI2015年成立時的11位創始成員之一。2017年至2022年期間,他出任特斯拉高級AI總監,主導了特斯拉全自動駕駛(FSD)與自動輔助駕駛項目。2023年2月,卡帕西曾重返OpenAI,主要負責模型中期訓練與合成資料生成。一年任期後,於2024年2月再次離開OpenAI,後創立AI教育初創公司Eureka Labs。
卡帕西加盟Anthropic的消息在行業內引發了廣泛關注,觀察人士指出,卡帕西是近年來繼前OpenAI對齊負責人揚·萊克(Jan Leike)、聯合創始人約翰·舒爾曼(John Schulman,現已加入Thinking Machines Lab)、創始團隊成員德克・金馬(Durk Kingma)之後,又一位投奔Anthropic的OpenAI核心元老。在各家人工智慧巨頭競相推進商業化與資本運作的節點,卡帕西這樣的技術旗幟性人物選擇加入,將極大增強Anthropic在學術界與高精尖人才圈中的號召力。
另外在技術路線層面,卡帕西新團隊的核心任務——利用現有模型去加速預訓練階段,揭示了前沿大模型開發的一大趨勢。傳統的大模型訓練極度依賴海量人工標註資料和純粹的算力堆疊。行業評論指出,卡帕西對幹淨、結構化訓練資料集及高效訓練方法的重視,與Anthropic的技術路線高度契合。通過推進模型遞迴自我改進與合成資料生成,AI研發有望向更高程度的自動化邁進,這可能成為未來幾年大模型拉開性能差距的關鍵。
目前,由達里歐·阿莫代(Dario Amodei)領導的Anthropic正處於快速擴張期,市場消息稱Anthropic計畫在2026年下半年推進IPO,最快有望於10月上市,整體估值正衝向1兆美元,核心人物的加入被視為關鍵背書,向資本市場和企業級客戶釋放技術信心,證明公司具備長期維持在第一梯隊的核心研發實力。 (第一財經)
