他曾在高中接觸深度學習,本科機器人創業、實習助力Gemini 2.0開發、橫跨AI與哲學雙領域……如今,不到4年讀完MIT博士,完成答辯。在OpenAI,他將繼續推進「世界模型」——這項可能重塑通用人工智慧路徑的前沿技術。不到4年完成頂級AI實驗室博士、順便輔修了哲學、GPT圖像生成核心5人研究團隊成員、OpenAI視訊生成模型Sora小組成員……剛剛,OpenAI華人研究科學家陳博遠,完成了MIT博士論文答辯!他激動地表示:我很興奮能夠在工業界繼續推進世界模型的發展——現在加入了GPT圖像生成和Sora視訊團隊。沒有什麼比看到自己的研究改變領域範式更令人興奮的事情了!在如此重要的時刻,他自然也感謝了導師和親友,得到了大家的祝賀。最後,他強調:視覺世界模型對於具身智能將至關重要。此外,他承諾,一如既往地與社區分享知識。華人天才,劍指世界模型陳博遠(Boyuan Chen),現任OpenAI研究科學家,負責訓練GPT圖像生成技術的五位研究人員之一,同時也是Sora視訊生成團隊的成員。他擁有麻省理工學院(MIT)電子工程與電腦科學(EECS)博士學位,並輔修哲學。他的研究重點是世界模型、具身人工智慧和強化學習。他認為,結合這些領域,AI能夠更好地理解並與物理世界互動。2023年5月-2023年8月,在GoogleDeepMind實習期間,他跟隨Fei Xia博士學習。在DeepMind,他主要參與了基於大規模合成資料的多模態大語言模型(MLLM)訓練項目;建構完整資料合成pipeline,其指令微調技術後續被Gemini 2.0採用。在博士答辯中,陳博遠特意感謝了DeepMind的導師Fei Xia。陳博遠還是個高中生時,參加了一個夏令營。這是兩人第一次見面,Fei Xia就向陳博遠介紹了深度學習——那時他甚至還不懂Python和NumPy。這正是他踏入AI領域的起點,Fei Xia就像他的「吳恩達」。Fei Xia兩次邀請他到GoogleDeepMind完成高含金量實習。讀博第一年,陳博遠因為沒有論文產出陷入低谷。這是他讀博最艱難階段,而Fei Xia協助他發表了首個爆款研究NLMap。項目地址:https://nlmap-saycan.github.io/此後,兩人還合作了SpatialVLM。論文連結:https://arxiv.org/abs/2401.12168他發表的多篇論文,在學術界和工業界均獲得認可,包括《Diffusion Forcing》、《SpatialVLM》和《History Guidance》等。矢志通用機器人在去年的部落格中,他對具身智能做出了樂觀的判斷:我可以負責任地告訴大家具身智能一定是下一個一百年最令人激動的技術,並且我們在有生之年很有希望見證通用機器人的誕生。同時,他也更願意看到社會細水長流地投入通用機器人的發展——看到科研工作者,如我導師Russ所說的那樣,「可以以結果為導向的科研,但不可以網紅視訊為導向」;看到政府和投資人在長線看好具身智能的同時,不因為硬體公司的融資需要而盲目相信機器人大模型;看到創業者勇往直前,用細分領域的成功為真正的通用機器人鋪路。在隨筆最後,他表示,「自己也願意用自己的一生給世界帶來真正的通用機器人」而OpenAI被曝出:在通往通用人工智慧(AGI)的競賽中,加大了機器人技術的工作力度,正在組建一個能夠開發控制機器人演算法的團隊,並且似乎正在聘請專門從事人形機器人研究的機器人專家。師出名門,文理雙修在2021-2025年期間,他在MIT電腦科學與人工智慧實驗室(MIT CSAIL)讀博士,師從Russ Tedrake教授和Vincent Sitzmann教授。2017-2021年,在加州大學伯克利分校本科階段,他師從機器人領域大牛Pieter Abbeel教授,獲電腦科學榮譽專業(EECS榮譽班)、應用數學雙學位。他本科畢業於加州大學伯克利分校,主修電腦科學和數學,並在伯克利學過一年哲學。在讀本科期間2017年11月-2020年3月,他還創辦了一家面向中小學的機器人教育公司,主導競賽用機器人套件的軟硬體開發,產品直接面向參賽學生群體。 (新智元)