#科學家
別再忽視它了!耶魯科學家:管理壓力=守護心臟的第一步
壓力管理有助於保持心臟健康。幾乎每個人都經歷過壓力——一種情緒或身體上的緊張感,它可能源於任何讓你感到沮喪、憤怒或焦慮的事件或想法。但你知道壓力會影響你的身體嗎?尤其是你的心臟?許多人都經歷過短期壓力,這是一種對特定事件的生理和心理反應,通常會很快消退,例如發表演講或緊急剎車避讓迎面而來的車輛。然而,慢性壓力是指長期持續感到壓力和不堪重負——例如,它可能源於惡劣的工作環境、照顧家人或無力支付帳單等。科學家雜誌AI繪圖 GPT-5.2“壓力有時會被低估為心臟病的一個風險因素,”耶魯大學醫學院心臟病專家雷切爾·蘭珀特醫學博士說。事實上,一些專家更進一步指出,壓力是導致心臟病的主要風險因素之一,其重要性不亞於不健康的飲食、缺乏運動、吸菸、過度飲酒和肥胖。我們採訪了蘭伯特博士;耶魯大學醫學院心臟病專家、耶魯大學醫學院預防心血管健康項目主任埃裡卡·斯帕茨醫學博士;以及耶魯大學醫學院專攻心臟病學的心理學家艾莉森·加菲博士——她們都對壓力對心臟的影響有著濃厚的興趣,無論是在臨床上還是在她們的研究中。下面,他們將探討壓力與心臟健康之間的聯絡,以及保持心臟健康的策略。1. 壓力會以多種方式影響心臟。壓力可通過多種途徑導致心臟病。“長期或慢性壓力會導致體內炎症水平升高,從而增加動脈斑塊的積聚,進而引發冠狀動脈疾病等問題,”蘭伯特醫生說道。冠狀動脈疾病可導致心臟病發作、心律失常和心力衰竭。此外,壓力還會促使腎上腺分泌兒茶酚胺類激素,其中一種是腎上腺素,也被稱為“戰鬥或逃跑”激素,它能在壓力情況下提高精神警覺性。但腎上腺素也會導致心跳加快和血壓升高。長期過量分泌腎上腺素最終會損害心臟。另一種壓力激素——皮質醇——的長期高水平也會導致血壓、血糖、膽固醇和甘油三酯水平升高。對於長期處於壓力之下的人來說,其結果可能是胸痛、心律不齊、呼吸急促,以及心臟病發作和中風風險增加。短期壓力也會產生影響。蘭伯特醫生說:“例如,對於動脈內已有斑塊積聚的人來說,腎上腺素激增有時會導致斑塊破裂,形成血栓,血栓可能會增大到足以完全阻塞血流,從而引發心臟病發作。”蘭伯特醫生補充說,對於患有心律失常(異常心律)等心臟疾病的人來說,突然的壓力會加劇他們的症狀。但壓力也會對心臟產生間接影響。“當人們感到無法擺脫慢性壓力環境時,他們可能會通過不健康的行為來應對,”加菲說。“我們知道,壓力與不健康的飲食、吸菸和飲酒過量等行為密切相關。”她補充說,這些行為會導致高膽固醇和高血壓等健康問題,而這些都是心臟病的主要危險因素。2. 壓力對人的影響各不相同。加菲解釋說,壓力對每個人的影響都不同——心臟病也是如此。“對不同的人來說,壓力源或壓力因素是主觀的——而且,這種挑戰的影響也因人而異,取決於你過去的經歷以及你如何應對情緒上的影響,”她說。蘭伯特博士補充說,因此,一些經歷過巨大壓力的人會患上心臟病,而另一些人則不會。“這和癌症的情況類似,”她說。“吸菸者中,有些人不會得癌症,有些人則會。這是為什麼呢?這是遺傳易感性、環境和生活方式共同作用的結果——所有這些因素共同作用,導致了疾病的發生。”《柳葉刀》雜誌上的一項研究表明,與壓力較小或沒有抑鬱史的人相比,壓力大、有抑鬱史以及其他社會心理因素的人患心臟病的風險高出2.5倍,加菲說。其他研究也發現,在遭受歧視的群體中,壓力與心臟病之間存在關聯。蘭伯特醫生補充說,並非所有壓力症狀都由心臟問題引起。壓力也會導致一些症狀,例如心跳加速,“這只是你身體在壓力過大時的正常反應”。她強調,最重要的是,任何出現新症狀或復發症狀的人都應該諮詢醫生,以確定心臟問題在多大程度上可能導致這些症狀,或者是否與心臟問題有關。3. 向你的醫療保健提供者談談你的壓力水平。任何擔心自己壓力過大的人都應該在去看家庭醫生時,或者如果有心臟科醫生的話,就去看心臟科醫生。“我經常和病人談論壓力問題,”斯帕茨醫生說。“我們想瞭解來自家庭、工作或社區的壓力對他們的影響,以及這些壓力如何影響他們的血壓、體重,並最終增加他們患心臟病的風險。”“在這些就診過程中,主動提出壓力問題非常重要,因為醫護人員可能不會總是詢問你目前的生活狀況、壓力源或壓力水平,”加菲說。“但他們可以提供一些有用的建議、資源和工具,幫助人們更好地管理壓力。”這些建議、資源和工具可能包括:增加體育鍛鍊、練習瑜伽和其他放鬆技巧;改善睡眠衛生;多花時間與他人相處;接受心理治療;尋求社會工作資源或醫療保健方面的幫助;甚至服用藥物來緩解持續的抑鬱或焦慮症狀。對於已有心臟問題的人——甚至可能曾發生過心臟病發作——研究表明,參與心臟康復計畫可以減輕壓力,並有助於緩解抑鬱和焦慮。此外,一些心臟病診所現在為有心理健康問題(可能與壓力有關)的人提供心理支援。耶魯大學醫學院目前開設了心臟和血管心理與健康診所,這是一個試點項目,患者可以在就診心臟病專家的同一診室接受心理諮詢。蘭伯特博士補充說,每個人最有效的減壓方式都不一樣。有些人覺得冥想或瑜伽有幫助;有些人則更喜歡在樹林裡散步或跑步。“關鍵是要找到能有效控制壓力的方法,”她說。 (科學家雜誌)
又一95後科學家加盟騰訊,擔任混元“主任研究員”
▎AI人才爭奪戰加劇!龐天宇,圖片來源:小紅書帳號@龐天宇在高調引入OpenAI前研究員姚順雨後,騰訊在AI人才方面又引入一位青年科學家。1月29日,原新加坡Sea AI Lab高級研究科學家龐天宇在小紅書帳號上發佈了一則招聘啟事,並官宣最近已加入混元團隊。作者今日證實,龐天宇即將入職騰訊,加盟騰訊混元多模態部Exploration Center,負責強化學習前沿演算法探索。目前未有龐天宇個人官方身份官宣消息,不過,他的小紅書帳號顯示了標籤“騰訊混元principal scientist”,“Tech Lead@Multimodal RL Team”,可以理解為是首席科學家,或者首席/主任研究員。而從發佈的招聘資訊的IP來看,目前龐天宇的工作地點在新加坡。截圖來自小紅書帳號@龐天宇龐天宇是清華大學電腦系2017級直博生,師從朱軍教授,主要研究方向為機器學習,特別是深度學習以及其魯棒性的研究,取得了一系列的研究成果。他以第一作者(含共同一作)身份在機器學習頂級會議ICML,NeurIPS,ICLR上發表多篇文章,並被多次選為Oral或Spotlight。他參與的團隊在包括NIPS 2017以及GeekPwn 2018在內的多個對抗攻防競賽中均獲得第一名。此外龐天宇多次擔任ICML,NeurIPS,ICLR,CVPR,ICCV,ECCV,TPAMI等頂級國際會議和期刊的審稿人。曾榮獲微軟學者獎學金,輝達學術先鋒獎。清華畢業後,龐在新加坡Sea AI實驗室擔任高級研究科學家。多模態是騰訊基礎模型頗為重視的領域,騰訊混元團隊研發了多種尺寸語言模型,以及圖像、視訊、3D等完整多模態生成模型和工具集外掛。混元系列大模型已在騰訊內部多個業務、外部多個行業和開源社區中被接入。截至目前,騰訊混元的圖像、視訊衍生模型數量總數達到3000個,視訊模型社區下載量超過500萬,混元3D系列模型社區下載量超過300萬。1月28日,騰訊混元團隊宣佈開源混元圖像3.0圖生圖版本(HunyuanImage 3.0-Instruct),並同步接入元寶。在最新全球權威大模型競技場LMArena的圖像編輯(Image Edit)榜單中,混元圖像3.0圖生圖進入第一梯隊。不過,騰訊在AI賽道上的影響力目前不及阿里巴巴和字節跳動。而在人才爭奪上,就在昨日,字節跳動CEO梁汝波再次表態,需要提高人才密度,需要加大激勵,讓人才願意加入字節攀高峰,也讓員工願意留在字節幹事業,確保員工薪酬競爭力和激勵回報在全球各個市場都“領先於頭部水平”。而面對外界AI焦慮,在剛剛結束的騰訊2026年員工大會上,騰訊董事會主席兼首席執行長馬化騰一開場,也希望給全員吃下“定心丸”,強調保持定力,專注自家節奏。過去一年,騰訊混元大模型經歷了“深度重構”。姚順雨作為騰訊首席AI科學家(官宣版本)加入之後,公司加快吸引人才的力度,重構研發團隊,以及在內部加快了Co-design設計,強化混元大模型和元寶的協同。馬化騰透露,騰訊混元去年在人才吸引、組織結構等方面“做了很大的改變”,吸引了更多的原生AI人才。同時,騰訊借助社交積累在AI賽道上發力。馬化騰透露,元寶即將推出命名為“元寶派”AI社交新玩法,探索AI技術在多人社交場景下的深度融合。元寶派脫胎於騰訊會議裡的AI探索和嘗試,定位是一個能讓AI與使用者群體共同娛樂、協作的“社交空間”。騰訊稱,將向元寶使用者開放QQ音樂、騰訊視訊等海量內容,使用者可以在元寶建立自己的“派”,實現和好友一起看、一起聽,還可以和元寶即時互動聊天、開啟全新的AI社交體驗。值得關注的是,馬化騰希望元寶在今年重現2015年春晚微信紅包大戰的奇襲。為此,元寶針對春節推出了10億元現金紅包激勵活動。這已經被視為今年網際網路大廠AI應用大戰的開場序幕。 (鈦媒體AGI)
科學家解密午睡“奇蹟”:小憩竟能讓大腦學得更快!
即使是短暫的午睡也能幫助大腦恢復,提高學習能力。2026年1月22日發表在《神經影像》 (NeuroImage )雜誌上的一項研究中,來自德國弗萊堡大學醫學中心、日內瓦大學醫院和日內瓦大學的研究人員發現,即使是小睡也足以重組神經細胞之間的連接,從而更有效地儲存新資訊。科學家雜誌AI繪圖  FLUX 1.1 [pro] Ultra此前人們認為,這些效應只有在睡足一整夜後才會出現。這項新研究表明,短暫的睡眠也能讓大腦得到放鬆,並使其重新進入學習狀態——這一過程對於工作負荷大的情況尤其有益。“我們的研究結果表明,即使是短暫的睡眠也能增強大腦編碼新資訊的能力,”該研究的負責人克里斯托夫·尼森教授說道。尼森教授在擔任德國弗萊堡大學醫學中心精神病學與心理治療系睡眠中心主任期間開展了這項研究。如今,他是日內瓦大學醫學院精神病學系主任醫師、睡眠醫學中心主任,同時也是該校精神病學系的教授。午睡時大腦會發生什麼變化?大腦在白天持續活躍:新的印象、想法和資訊不斷被處理,從而加強神經細胞之間的連接(突觸)。這些加強的突觸連接是學習過程的重要神經基礎。然而,它們也會導致大腦達到飽和狀態,隨著時間的推移,大腦的學習能力會逐漸下降。睡眠有助於調節這種過度活躍的狀態,同時又不丟失重要的資訊。尼森教授說:“研究表明,這種‘突觸重設’只需午睡即可發生,從而為新記憶的形成騰出空間。”“這項研究有助於我們瞭解即使是短暫的睡眠對於精神恢復的重要性,”弗萊堡大學醫學中心精神病學與心理治療系精神睡眠研究與睡眠醫學科主任凱·施皮格爾哈爾德教授說。“短暫的午睡可以幫助你思路更清晰,並讓你能夠更專注地繼續工作。”研究方法該研究調查了20名健康的年輕人,他們在兩個下午分別進行了午睡或保持清醒的狀態。午睡平均持續45分鐘。由於無法直接測量健康人體內突觸的活動,研究團隊採用了成熟的非侵入性方法,例如經顱磁刺激(TMS)和腦電圖(EEG)測量,來推斷突觸的強度和靈活性。研究結果表明,午睡後大腦突觸連接的整體強度有所降低——這表明睡眠具有恢復作用。與此同時,大腦形成新連接的能力顯著提高。因此,與同樣長時間的清醒狀態相比,午睡後的大腦更能適應學習新內容。日常益處和前景這項研究從生物學角度解釋了為什麼人們午睡後往往表現更佳。尤其是在需要高度集中精力或體力的職業或活動中——例如音樂、體育或安全關鍵領域——午睡可以幫助人們保持最佳狀態。“午睡可以維持高強度工作狀態下的表現,”尼森教授說道。然而,研究人員強調,偶爾的睡眠問題並不一定會導致表現下降。尤其是在慢性失眠症中,睡眠-覺醒調節系統基本完好;相反,焦慮和不良的睡眠-覺醒行為佔據主導地位。在這種情況下,失眠認知行為療法(CBT-I)比安眠藥更有效,因為安眠藥會擾亂大腦的自然恢復過程,並導致藥物依賴。點評這項研究為我們揭示了午睡的強大力量。原來,那怕只是短短的45分鐘小憩,也能讓大腦的神經連接得到“重設”,有效緩解學習和工作帶來的“腦力飽和”。它不僅能提升我們吸收新知識的效率,還能讓大腦從疲憊中迅速恢復,保持清晰的思路和專注力。這對於高強度用腦的現代人來說,無疑是一個簡單又高效的“超級能量補給”。下次感到疲憊時,不妨給自己安排一個高品質的午睡,讓大腦重新蓄力,以更佳狀態迎接挑戰! (科學家雜誌)
哈佛科學家揭秘:睡夠了還是累?你缺的可能不是覺,而是這7種“休息”
記錄下一整晚的睡眠似乎是個小勝利,但這並不保證我們第二天就不會仍然覺得“拖著身子走”。如果醫生已確認我們總體健康狀況良好,那麼,為什麼我們明明休息了,卻仍然活力不足、精神不振?或許我們默認“睡眠”就是我們所需要的全部“休息”。但實際上,我們可能缺乏的是其他多種形式的休息——而它們同樣對我們保持最佳身心狀態至關重要。國際知名健康專家桑德拉·道爾頓-史密斯(Dr. Saundra Dalton-Smith)在其著作(Sacred Rest)中提出,休息可分為七種類型,每一種都針對不同的“休息缺口”。科學家雜誌AI繪圖 GPT5哈佛醫學院睡眠醫學部副教授埃裡克·周(Eric Zhou)也認同:很多人把睡眠和休息視為同義,但要真正恢復精力,我們需要拓寬這種認知框架。他說,如果你已經平均每晚獲得建議的7至9小時高品質睡眠,繼續增加睡眠時間未必能解決你所困擾的問題。“我們很多人談休息時,往往只停留在身體休息這個維度,”埃裡克·周(Eric Zhou)說。“睡眠是身體休息的一部分,具有非常重要的修復功能,但睡眠並不能彌補其他維度的缺口。”恢復活力在這裡,埃裡克·周(Eric Zhou)解釋了七種休息類型,並給出相應的實踐策略:1. 身體休息感到疲憊、動作笨拙,或特別健忘?你可能需要更多身體層面的休息。“最明顯的訊號是,你感覺身體的‘油箱’空了,”周說。當然,睡眠在恢復精力方面發揮重要作用——不僅是夜間睡眠,也包括白天小睡。躺下安靜休息也算。但出人意料的是,拉伸、瑜伽、散步等溫和運動也被視為一種“主動式”身體休息,反而能提升能量水平。“解決辦法在光譜的兩端,”他說,“讓身體更活動的事情,實際上也可能讓你在體能上更有勁。”2. 心理休息如果你思緒奔湧、難以專注,可能是心理疲勞。“也許你同一句話要讀三遍,或者在工作視訊會議上無法集中注意力,”周說。心理休息的意義在於,讓大腦從持續思考、解決問題或資訊攝取中安靜下來。獲取心理休息的方法包括:睡前把待辦事項寫下來,避免它們反覆佔據你的思緒;或進行冥想。(見“冥想小貼士”。)3. 精神休息如果你感到迷茫、與外界疏離,或變得憤世嫉俗,你可能需要一次精神層面的“重啟”。精神休息並不只等同於祈禱——也可以通過親近自然或參與社區活動(例如志願服務),與比自我更宏大的事物建立連接。“把注意力放在那些能讓你更充實、更有連接感、更完整的事物上,”他說。4. 感官休息如果你容易煩躁,或感覺自己被各種刺激“燒乾了”,這往往是感官過載的提示。要重設狀態,放下電子裝置、調暗燈光,在安靜或更接近自然的環境裡停一停。“比如我們在咖啡店排隊,幾乎本能地就會掏出手機看郵件或刷社交媒體。但要意識到持續感官刺激的代價,偶爾允許自己無聊一會兒,”周說。5. 創造性休息“靈感枯竭”(例如寫作卡殼)是創造性休息不足的一個訊號,但並不限於此:無論你從事什麼工作,只要你覺得卡住、缺乏啟發,都可能需要創造性休息。補充方式包括:欣賞藝術或其他形式的美,或嘗試新鮮事物。“作為研究人員,我可以去參加學術會議,認識新朋友、交流新想法,”周說。“創造力有很多種形式。”6. 情緒休息日常中他人的需求也會消耗我們——比如撫養年幼孩子;而重大壓力事件也會如此——例如照護身患重病的親人。無論那種情況,你可能都難以坦誠表達真實情緒,而這恰恰是情緒休息的核心。要恢復精力,可以嘗試寫日記,或向信任的朋友傾訴。同時也要接受一種可能:你也許需要等到壓力源過去,才能真正獲得緩解。“解決情緒挑戰的源頭,並不總像獲得其他類型的休息那樣容易,”周說。7. 社交休息這一類型強調:在消耗性的社交與滋養性的社交之間取得平衡。如果你開始害怕社交,或即使身處人群仍感到孤獨,你很可能會從社交休息中受益。“找機會對那些你習慣性答應的事情說不,”周說,“並設法把優先順序放在有意義的關係上,而不是淺層關係。”冥想小貼士冥想——一種通過安靜心念來提昇平靜與清明的練習——可以促進多種類型的休息,包括心理休息、創造性休息、感官休息與精神休息。以下是入門方法:選擇干擾較少的空間。在觸手可及處放好靠墊等舒適物品(也可以放蠟燭等)。坐直身體。坐姿往往能兼顧專注與放鬆。擺放雙手。可將手放在膝蓋上,掌心向上或向下;也可在胸前合十。專注呼吸。覺察自然的吸氣與呼氣節律,不必刻意改變,只需觀察。固定注意力。走神很正常,只要覺察到念頭飄走,輕輕承認它,再把注意力帶回呼吸或身體感受。從小開始。每次先練2到5分鐘,然後按自己的節奏逐步增加時長。 (科學家雜誌)
向世界宣佈!由中國科學家首次證實87年前量子力學預言,意味著什麼?
2026年1月15日,國際頂級學術期刊《自然》發表了一項改寫物理學史的突破,中科院大學主導的聯合研究團隊,首次在實驗中直接觀測到中子與原子核碰撞中的米格達爾效應,這個發現不僅證實了蘇聯物理學家阿爾卡季·米格達爾1939年提出的量子力學預言,更撕開了暗物質探測的能量閾值瓶頸,為人類探索宇宙深層奧秘打開了新大門,米格達爾效應描述的是一個違背直覺的量子過程,當中性粒子比如中子撞擊原子核時,反衝的原子核會把部分能量傳遞給核外電子,讓電子脫離束縛成為米格達爾電子,這個過程能將微弱訊號轉化為可觀測的電訊號,為捕捉輕質量暗物質粒子提供了理論路徑,可自1939年預言提出後,中性粒子碰撞中的該效應始終未被直接證實,國際暗物質探測領域長期面臨理論假設缺乏實證支撐的質疑,中國科學家的突破在於攻克了兩大核心難題,一是自主研發微結構氣體探測器加像素讀出晶片組合裝置,靈敏度堪比拍攝單原子運動的照相機,二是利用緊湊型氘氘聚變反應加速器中子源,在八十一萬七千個候選事件中精準篩選出六個米格達爾事件,統計顯著性超五倍標準差,達到物理學發現的黃金標準,這一成果徹底終結了學界對該效應存在的爭議,暗物質佔宇宙總質能的27%,但其本質仍是未解之謎,當前主流探測手段依賴原子核反衝訊號,輕暗物質粒子碰撞釋放的能量遠低於現有探測器閾值,米格達爾效應的證實將探測靈敏度提升至原有水平的一百分之一,相當於在黑暗中點亮了一盞量子明燈,這一突破會直接推動歐洲核子研究中心雪球計畫等國際實驗升級,還為軸子等非弱相互作用大質量粒子類暗物質模型提供了新路徑,可能引發粒子物理學範式革命,此次成果的背後是中國基礎科研的長期積累,自主探測器技術突破了國外封鎖,緊湊型中子源裝置標誌中國可控核聚變相關技術邁入世界前列,更體現了大科學裝置加跨學科協作的創新模式優勢,從墨子號到九章再到這次突破,中國在量子科技領域建構了完整的理論實驗應用鏈條,實現了從跟跑到領跑的跨越,米格達爾效應的證實印證了量子力學對經典物理觀的顛覆性,其非區域性特性還與東方哲學天人合一的思辨產生共鳴,這一突破預示著人類認知的又一次躍遷,答案或許藏在下一組量子資料中,而中國科學家已手持鑰匙站在門前。 (科技直擊)
姚順雨:騰訊在AI時代的護城河!還是易守難攻的好平台!
12月17日,騰訊聘請了前OpenAI研究員姚順雨擔任總辦首席AI科學家,直接向總裁劉熾平匯報。很多人擔心騰訊AI掉隊了,但姚順雨其實在消息公佈之前三個月就曾經談到騰訊的護城河:微信還是一個易守難攻的好平台。這或許也是他選擇加入騰訊的重要原因之一,他甚至還聊了如果他是微信一號位會怎麼做的話題。原文很長,談的面很廣,我挑選了與騰訊等巨頭相關的內容:1、談應用公司的護城河——資料飛輪李廣密:在你看來,應用公司的資料飛輪,對他們來說重要嗎?或者說,在什麼環境下才能形成?我感覺,Chatbot產生的是偏好資料,好像沒什麼資料飛輪;Code可能有思考過程的資料,這種思考過程的資料代表一類能力,可能是有用的;像Canvas也好,Artifacts也好,可能是有思考過程的資料,這類可能有機會形成很強的資料飛輪效應。姚順雨:大多數公司還沒有形成資料飛輪;他們依賴模型變好,利用模型變好的溢出能力。如果你要有資料飛輪,首先你要能自己去訓模型,並且能通過互動有很好的reward(獎勵),使你能把好的資料和不好的資料分開。【一涵註:這就是騰訊必須自己做AI而不是依賴DeepSeek的原因。】比較成功的是Midjourney,有非常清晰的reward——人更喜歡那張圖,這個reward和應用是對齊的,reward做得更好,公司就更成功,模型也更好——一切都對齊。有了這種情況,才能自己訓練模型,做資料飛輪。這個過程必須比較非主線。因為如果很主線,我也可以通過Pre-Training或RL提升能力,靠泛化或其他方式。總的來說,大部分公司目前還沒有形成飛輪。【一涵註:比如程式設計之類的主線任務,每個巨頭公司都會自己訓練好,不是創業公司能做的。】2、超級巨頭有動力繼續推動中心化張小珺:你對未來Agent生態的構想會是什麼樣?現在有點像,當年大家都在創業做App的時候,如果再往後推演幾年,這個世界會是什麼樣?姚順雨:很難說。但肯定會有很多不同的互動方式,創造出不同的系統。OpenAI這樣的公司,會想繼續推進一個中心化的助手系統,有更多環境、更強能力,做更多事情。也會有不同的生態系統,有不同的互動方式,會訓練完全不同的模型。甚至從Pre-Training開始,所需要的能力和很多東西都不同。【一涵註:比如OpenAI正在訓練一個商業專用的模型,在判斷出使用者提問商業資訊的時候,專門用來推送廣告,並顯著標識廣告資訊,來減少使用者對主模型的信任問題。】比如,另一種互動方式可能是,我想造一個朋友。這個朋友不需要數學、物理特別強,數學太強反而不自然。它記憶不一定特別好,會犯錯,有感情,也不是特別rational(理性)。但這也是有價值的——可能有人會做這種事。這類東西很難和ChatGPT比強弱,它們是不同應用,有不同價值。也可能出現一個由Agent組成的社會。為什麼這個世界上很多人有價值?不是因為他們的數學或編碼能力強,而是因為他們擁有別人沒有的資訊。中間商本質是擁有資訊差。擁有資訊差的人會想維護自己的權利和資源。這樣的人會發明出更Multi-Agent(多智能體)或更 Distributed Network(分佈式網路)。在交易世界裡,資訊很重要,每個人只擁有資訊的一小部分,這種情況會出現新的不同形態。可能是Multi-Agent,每個人有自己的Agent,Agent之間可以與百萬甚至更多人交換資訊,達成交易或某些目的。根本上,現在非常強的巨頭和重要節點,有動力繼續推動中心化。但在中心化之外的力量,也有動力做一些非中心化的事情。這個世界可能不會是單方壓倒另一方,雙方都會有自己的力量。而這個世界智能的邊界、研究的邊界,可能不是由一家機構定義,而是由不同Super App共同定義的。【一涵註:有些公司可以用去中心化的形式行中心化之實。比如拼多多創業早期提倡分佈式人工智慧,就是讓每個人擁有一個有自己隱私資訊的Agent,保護你的私有資料,但是同時也會和其它Agent溝通來提升購物前的信任感和推薦精準性,以及做工廠定製降低價格。然而,這些資料並不真是我們私有的,比如我們想把這些資料打包帶走到其他平台,例如淘寶或者抖音,那是不可能的,因此這些平台就構成了資料的壟斷和中心化。】3、做垂直產品還是通用產品?姚順雨:iPhone或iPad是非常通用的產品形態,但它一開始,都有一些Killer App支援它有momentum(增長動能)。包括ChatGPT,包括微信,很多偉大產品都這樣。你有一個足夠通用、簡單,或第一性的互動方式,它有很多想像空間。但你去維護它,或者設計路徑的時候,你能有各種各樣的應用,使它不停地增長。【一涵註:最典型的例子是微信和抖音,公眾號、朋友圈、小程序、視訊號都是微信這個通訊產品催生的,早已和WhatsApp等單純的通訊產品不同(馬斯克都說歐美沒有,他要copy一個)。而抖音商城、汽水音樂、紅果短劇等APP都是抖音這種短影片推薦的互動方式衍生出來的。因此微信和抖音本質上都是通用產品,是會產生競爭的平台型公司,而不是單純的社交軟體和視訊軟體。現在,ChatGPT也正在試圖把自己打造成通用產品,如加入了應用程式商店。可能產生通用產品的AI是對過去的網際網路平台都有威脅的。】4、如果姚順雨是科技巨頭的CEO,會怎麼看待AI?李廣密:順雨,如果你是一個全球超大網際網路或科技公司的CEO,今天這個公司還沒有自己的模型,沒有好的研究文化,甚至沒有好的AI戰略,你作為CEO會怎麼做?姚順雨:首先,我肯定會學習,我會想弄清楚這個事情到底是什麼。如果你作為CEO不懂這個事情,所有事情會變得很難。很多時候,一個公司的bottleneck(瓶頸)就在於,CEO 對這個事理解不夠。如果你不理解,去招一些很好的人、做一些事情,你很可能被他們忽悠。所以,首先要自己學習。【一涵註:這也是為什麼不少成功的AI公司都是自己培養人才來做好,而不是靠挖人。】然後要從創造新的價值來思考問題。畢竟你不是技術專家,而是一個CEO,你有一些場景、一些資源、一些優勢。從第一性原理看,一個新的技術產生了,你要思考的是,怎麼用這些新技術結合你現在的資源去創造新的價值。當然,你可以嘗試做一個和當前業務完全不一樣、但價值非常大的事情,比如ChatGPT,但對大多數公司來說,即使很有錢、很強,也不一定make sense(合理)。所以,第一是自己要學習技術;第二是要思考怎麼創造新的價值。5、如果姚順雨是巴菲特,會怎麼投資AI行業?李廣密:如果你成為了波克夏的CEO(巴菲特的投資公司),未來要拿出500億美金allocate(分配)到AGI行業,你會怎麼allocate這筆錢?——既能體現回報,也能體現對人類的貢獻。姚順雨:這是個很好的問題。取決於你有多少精力,或者有多少資源分配顆粒度。當然現在OpenAI、Anthropic,這些模型層公司,大機率會有更大價值。還有一類很有價值的,是能積累User Context(使用者上下文),或者能建構特殊Environment(環境)的公司。最終如果AI或AGI是一個系統,它需要有Intelligence(智能),需要有Environment,還需要有User Context,或者對使用者的理解。現在有很多User Data(使用者資料)或User Context 的公司,有點像發明車之前的煤炭、煤礦,或者像發明汽車之前的石油公司。從這個角度,微信或大平台,還是一個易守難攻的好平台,它積攢大量的Context。如果Intelligence是一個可以逐漸民主化、逐漸變得便宜、逐漸普及,擁有這樣的平台,擁有這樣的Environment,擁有這樣的Context,可能會是一個很強的壁壘。它可能還是一個很好的投資。【一涵註:所以上一代的巨型網際網路公司,例如已經有不錯的模型、也有大量使用者資料,還有晶片和雲端運算的阿里,以及在全球獲得大量使用者資料的拼多多和抖音,也都是非常值得關注的投資對象。而百度這樣的公司因為移動網際網路時代APP的普遍資料孤島化(李彥宏本人講的),失去了獲取大量使用者資料的機會,因此也沒有太大價值了。】6、如果姚順雨是微信的一號位,會怎麼做?張小珺:今天順雨當了很多公司的CEO,那我再問一個:如果你是微信的一號位,你會怎麼在微信裡做Agent?姚順雨:我可能會不急,先觀望觀望。我好像沒有理由要急。我會觀察,我會學習 AI,會觀察有沒有什麼新的互動方式很有意思。但我不會急著去做很多事——我有易守難攻的地方,為什麼要急著進攻?比較危險的是一個顛覆性的創新。真正的危險,不是說一個類似於微信的東西打敗了微信,而是一個很不一樣的東西打敗了微信。就像微信打敗了QQ。當時擔心的並不是一個類似QQ的東西打敗了QQ,而是一個很不一樣的產品去打敗這個東西。需要對顛覆性創新有所警惕。但如果是這些incremental(漸進式的)創新,這種小的創新,早做晚做可能區別沒有那麼大,也不用太擔心。李廣密:所有人都說微信卡位好,但今天微信還沒有很激進地投入,如果未來Multi-Agents 、Long-Term Memory這些問題解決了,但這個Agent系統不長在微信上,是比較恐怖的。原有網路不一定有價值。姚順雨:這取決於人類的網路會變成什麼樣?你會有更多Agent朋友,還是更多人類朋友?或者你有更多Agent職業上的互動,還是有更多人類職業上的互動?微信上你既有朋友,也有基於職業的互動——比如我要買個東西,我要諮詢律師,對吧?這取決於人類的網路會變成什麼樣。但總會有一個這樣的網路,基於這個網路,肯定會需要有基礎設施,需要有平台。【一涵註:今天的AI其實會對無論是職業的互動,還是情感的互動都可能有巨大影響。比如段永平在26日早上表示:“律師這個職業會受到AI的巨大挑戰!我現在有任何合同都是讓Gemini和ChatGPT看一眼,毛病建議他都可以馬上給出來,非常厲害。”連他這樣等級的企業家都用AI來看合同了,那麼普通人就更可以用了。而情感的互動上,AI算命、心理諮詢也已經很常見,很明顯可以觀察到周圍一些人在和AI比如豆包、DeepSeek交朋友。以上互動的變化大概也是騰訊需要下重注挖姚順雨做AI的重要原因。按照姚順雨的說法,微信有不急的底氣,但會不會出現一個很不一樣的東西打敗了微信,我還是要跟大家一起持續跟蹤觀察。】 (一涵筆記)
騰訊官宣!姚順雨出任首席 AI 科學家,27 歲清華學霸掌舵騰訊 AI 下半場
「追到第一名」的劇本,騰訊可能又要演一遍,這次押注的是 AI。就在今天下午發佈的內部公告中,騰訊表示,知名 AI 研究員姚順雨 (Vinces Yao) 正式出任「CEO / 總裁辦公室」首席 AI 科學家,向騰訊總裁劉熾平匯報;同時兼任 AI Infra 部、大語言模型部負責人,向技術工程事業群總裁盧山匯報。這次任命,釋放的訊號很清晰:騰訊的 AI 正在全面提速,且是帶著「要打硬仗」的架勢。不久前,金沙江創投主管合夥人朱嘯虎在談及國內 AI 競爭格局時直言騰訊還沒真正發力。他還評價稱,騰訊往往等局面打明白後再加速追趕——從第五、第六,追到第三、第二,最後追到第一。今天,騰訊便用實際行動回應了外界的質疑。騰訊升級大模型研發架構,新成立 AI Infra 部、AI Data 部、資料計算平台部。其中,AI Infra 部將負責大模型訓練和推理平台技術能力建設,聚焦分佈式訓練、高性能推理等核心技術,為演算法研發和業務落地提供支撐。王迪繼續擔任大語言模型部副總經理,向姚順雨匯報。劉煜宏擔任 AI Data 部負責人、陳鵬擔任資料計算平台部負責人,均向公司副總裁蔣傑匯報。更關鍵的是,騰訊混元的「成績單」已足夠搶眼。過去一年,混元大模型發佈超過 30 個新模型。12 月 5 日發佈的混元 2.0,在複雜推理與文字生成場景表現國內領先。混元 3D 模型更是保持著全球領先水準,開源社區下載量超過 300 萬。組織調整與密集引才,說到底就是在為高強度的技術攻關補齊兵力、夯實底座。而姚順雨的加盟,無疑是騰訊 AI 戰略中極為重要的一步棋,也讓人不由得期待,他的到來或許會為騰訊 AI 帶來一股全新的氣象。細數姚順雨的履歷,只能用開掛來形容——合肥一中出身、NOI 銀牌得主、高考 704 分勇奪安徽理科探花,擔任過清華姚班聯席會主席,甚至還聯合創辦了清華說唱社,妥妥的全能型人才。普林斯頓電腦博士畢業後,他更是直奔 OpenAI,期間,他曾深度參與 Computer-Using Agent (CUA)、Deep Research 等重要產品。今年 5 月份,憑藉過硬的履歷,他成功入選《MIT 科技評論》「35 歲以下科技創新 35 人」中國區榜單,成為該屆最年輕入選者。圖片來自清華校友總會學術成果也相當能打,他推動了 LLM 從「對話系統」向「任務執行系統」的範式轉變。隨便拎幾篇代表作出來:ReAct (ICLR 2023):將推理與行動結合的經典框架,引用超 4300 次。Tree of Thoughts (NeurIPS 2023):大語言模型的「思維樹」問題求解方法,引用超 4000 次。Reflexion (NeurIPS 2023):引入語言反饋的自我改進智能體,引用超 2600 次。SWE-bench (ICLR 2024):評估語言模型解決真實 GitHub 問題的能力。WebShop (NeurIPS 2022):可擴展的基於語言代理的網頁互動任務。SWE-agent (NeurIPS 2024):面向自動化軟體工程的智能體-電腦介面。……Google Scholar 顯示,他的總引用次數超過 1.5 萬次,h-index 為 24,i10-index 為 29——這個資料在 27 歲這個年齡段,表現相當不俗。巧合的是,今年 5 月姚順雨在一次與張小珺、李廣密的對談中,恰好聊到了微信和 AI 的話題。當時李廣密拋出觀點:微信卡位確實好,但如果未來 Multi-Agents、Long-Term Memory 這些技術成熟了,Agent 系統卻沒長在微信上,那就「比較恐怖」了。姚順雨的回應頗為哲學:「這取決於人類的網路會變成什麼樣?你會有更多 Agent 朋友,還是更多人類朋友?」他進一步解釋,微信既承載社交關係,也承載職業互動——比如購物諮詢、法律服務等。無論人類網路如何演變,總需要基礎設施和平台支撐。面對張小珺的靈魂拷問:如果你是微信一號位,會怎麼做 Agent?姚順雨表示:「我可能會不急,先觀望觀望。」在他看來。微信已經易守難攻,為什麼要急著進攻?真正的威脅不是類似產品的競爭,而是顛覆性創新。就像當年微信打敗 QQ 那樣,危險的是「很不一樣的東西」。除了這次精彩的對談,今年 4 月份姚順雨發表的技術博文《AI 的下半場》同樣在業界引起了廣泛討論。讓AI 下半場總結:AI 正處在中場休息。幾十年來,AI 的主要精力都放在開發新的訓練方法和模型上。事實證明,這條路走得通:從在國際象棋和圍棋上擊敗世界冠軍,到在 SAT 和律師資格考試中超過大多數人類考生,再到拿下 IMO 和 IOI 金牌。寫進歷史的這些里程碑——DeepBlue、AlphaGo、GPT-4 和 o-series——背後都是 AI 方法上的根本創新:搜尋、深度強化學習、規模化訓練以及推理。隨著時間推移,效果一次次被刷新。那現在突然有什麼不同呢?三個詞:強化學習真的能用了。更準確地說,強化學習終於能夠泛化了。經歷了多次迂迴探索和里程碑的積累,我們終於找到了一套能解決各種強化學習任務的有效方法——依託語言與推理。要是你一年前對大多數 AI 研究者說:有一個通用方案能同時搞定軟體開發、創意寫作、IMO 等級的數學題、鍵鼠操作,甚至長篇問答——他們大概會笑你在「幻覺」。因為這些任務都極其困難,很多研究者整個博士階段可能只專注在其中一個方向。然而,這已經成真。那麼接下來會怎樣?AI 的下半場——從現在開始——將把重心從「解決問題」轉向「定義問題」。在這個新階段,評估的重要性會超過訓練。我們不再只是問「能不能訓練出一個模型解決 X 問題?」,而是要問「我們究竟應該讓 AI 去做什麼?又該如何衡量真正的進展?」。要想在下半場脫穎而出,我們需要及時轉變思維方式和技能組合,更接近於產品經理的思路。上半場要理解 AI 的上半場,可以看看它的「贏家」們。到目前為止,你認為最有影響力的 AI 論文有那些?我做了下 Stanford 224N 的小測,結果並不意外:Transformer、AlexNet、GPT-3 等等。這些論文的共同點是什麼?它們都提出了訓練更好模型的重大突破。同時,它們也靠在某些基準測試上取得(顯著的)提升,才得以順利發表。但還有個潛在的共性:這些「贏家」幾乎全都是訓練方法或模型,而不是基準或任務。就算是公認最有影響力的基準之一——ImageNet,它的引用量也不到 AlexNet 的三分之一。而在其他地方,方法和基準的對比更懸殊。比如,Transformer 的主要基準是 WMT'14 翻譯任務,該研討會的報告大約有 1300 次引用,而 Transformer 論文字身超過 16 萬次。這說明了上半場的遊戲規則:重點在於創造新的模型和方法,而評估和基準雖然必要,卻始終是次要的。為什麼?很大一個原因是,在 AI 的上半場,方法比任務更難,也更令人興奮。從零開始發明一種新演算法或網路結構——比如反向傳播演算法、摺積神經網路(AlexNet),或者後來 GPT-3 所用的 Transformer——需要非凡的洞察力和工程能力。相比之下,給 AI 定義任務就顯得直接得多:我們只需要把人類已經在做的事情(翻譯、圖像識別、下棋)變成基準測試就行,幾乎不需要太多新洞見或工程創新。方法的價值還在於它們往往比單個任務更通用、應用更廣。以 Transformer 為例,它不僅推動了自然語言處理(NLP),還在電腦視覺(CV)、強化學習(RL)等領域全面開花,遠遠超越了它最初驗證成果的那個小小的翻譯資料集(WMT』14)。一個偉大的新方法可以「爬」上許多不同的基準,因為它足夠簡潔和通用,所以影響往往超越單一任務。這種玩法延續了數十年,催生了改變世界的思想和突破,並通過不斷刷新的基準成績體現出來。那為什麼這個遊戲會改變呢?因為這些思想和突破的累積,已經帶來了質的飛躍——我們終於找到了可行的通用方案來解決任務。配方那麼,「配方」到底是什麼?配料其實並不意外:大規模的語言預訓練、資料和算力的擴展,以及「推理與行動」的理念。這些聽起來像是你每天在舊金山都會聽到的流行詞,但為什麼要稱它為配方呢?我們可以從強化學習(RL)的視角去理解。RL 常被認為是 AI 的「終局」——理論上它能保證贏得遊戲,而在實踐中,你也幾乎無法想像沒有 RL 的超級智能系統(比如 AlphaGo)。在 RL 中,有三個關鍵組成部分:演算法、環境和先驗知識。長期以來,RL 研究者主要聚焦在演算法本身(比如 REINFORCE、DQN、TD-learning、actor-critic、PPO、TRPO……),這是智能體如何學習的「智力核心」,而環境和先驗往往被視作固定不變或最低限度的設定。比如,Sutton 和 Barto 的經典教材幾乎完全講演算法,幾乎沒涉及環境或先驗。然而,在深度 RL 時代,研究者們逐漸發現:環境的重要性極高。一個演算法的表現往往與它所處的環境高度繫結。如果你忽略環境,就可能造出一個只在玩具問題裡「最優」的演算法。那為什麼不先想清楚:我們到底想要解決什麼樣的環境,然後再去尋找最合適的演算法?這正是 OpenAI 最初的計畫。它先推出了 Gym,把各種遊戲變成標準化的 RL 環境;接著又嘗試了 World of Bits 和 Universe 項目,試圖把網際網路或電腦本身變成一個遊戲。這聽起來很合理:一旦把所有數字世界轉化為環境,再用聰明的 RL 演算法去解決,就能得到數字版的 AGI。這是個好計畫,但沒能完全走通。OpenAI 確實取得了巨大進展,用 RL 解決了 Dota、機械手等難題。但它始終沒能真正攻克電腦操作或網頁導航的問題,而且在一個領域中訓練出來的 RL 智能體,幾乎無法遷移到另一個領域。顯然,缺了點什麼。直到 GPT-2、GPT-3 出現,人們才意識到:缺少的關鍵其實是先驗。你需要強大的語言預訓練,把常識和語言知識蒸餾進模型裡,然後再進行微調,讓它們成為能上網(WebGPT)或能聊天(ChatGPT)的智能體(並由此改變世界)。事實證明,RL 中最重要的部分可能既不是演算法,也不是環境,而是先驗知識——而且這種先驗完全可以通過與 RL 毫不相關的方法獲得。語言預訓練為對話提供了很好的先驗,但在控制電腦或玩電子遊戲時效果卻不那麼理想。為什麼?因為這些任務與網際網路文字的分佈差距更大,直接在這些領域做 SFT(監督微調)或 RL(強化學習)時,泛化能力很差。我在 2019 年就注意到了這個問題。當時 GPT-2 剛發佈,我嘗試在它的基礎上做 SFT 和 RL 來解決文字冒險遊戲——CALM 是世界上第一個基於預訓練語言模型建構的智能體。但它需要上百萬步的 RL 訓練才能「爬」過一款遊戲,而且無法遷移到新遊戲。雖然這正是 RL 的典型特徵,RL 研究者對此並不意外,但我卻覺得奇怪:因為人類可以很輕鬆地嘗試一款新遊戲,並且在零樣本情況下表現顯著更好。就在那時,我迎來了人生中的第一個「頓悟時刻」——人類之所以能泛化,是因為我們不僅能選擇「去 2 號櫃子」「用 1 號鑰匙開 3 號寶箱」「用劍殺地牢怪」,還可以選擇去思考:「地牢很危險,我需要一件武器來應對。但目前沒有現成的武器,也許需要去鎖著的箱子裡找。3 號寶箱在 2 號櫃子裡,那我應該先去櫃子 2,把它打開。」思考,或者說推理,是一種奇怪的行動。它不會直接改變外部世界,但推理的空間是開放的、組合上無限的——你可以思考一個詞、一句話、一整段話,甚至一萬個隨機單詞,而周圍的世界並不會立刻發生變化。在傳統 RL 理論中,這是個「糟糕的選擇」,會讓決策幾乎不可能。想像一下:你需要從兩個盒子裡挑一個,一個有 100 萬美元,另一個是空的。你期望值是 50 萬。現在如果我加上無限多個空盒子,你的期望值就變成了 0。但如果我們把推理加入 RL 環境的動作空間,就能利用語言預訓練提供的先驗來實現泛化,同時還能根據不同決策靈活分配推理時的計算量。這真的是一件很神奇的事。我在這裡沒法完全解釋清楚,可能需要專門寫一篇博文。你可以去讀一下 ReAct,它講述了智能體推理的最初故事,也能感受到我當時的心路。直觀地說:即便你加了無數個空盒子,但你在生活和遊戲中早已見過類似情況,所以選擇這些空盒子的經歷反而能幫助你在真正有錢的遊戲裡更好地做出選擇。抽象地說:語言是通過推理在智能體中實現泛化的。一旦我們擁有了合適的 RL 先驗(語言預訓練)和合適的 RL 環境(把語言推理作為動作),結果發現 RL 演算法本身反而成了最不重要的部分。於是才有了 o-series、R1、deep research、會用電腦的智能體,以及未來更多的成果。多麼諷刺的轉折!長期以來,RL 研究者最關心的都是演算法,而幾乎沒人注意先驗——幾乎所有 RL 實驗都是從零開始。但我們花了幾十年的迂迴才意識到,也許優先順序應該完全反過來。下半場這個「配方」正在徹底改變遊戲規則。回顧一下上半場的玩法:我們開發新的訓練方法或模型,用來在基準測試上爬坡。然後我們再設計更難的基準,繼續循環。但這種玩法正在失效,原因有二:這個配方基本上已經把「刷基準」的過程標準化、產業化了,不需要多少新的點子。隨著配方的規模化和泛化,你為某個特定任務設計的新方法,可能只能提升 5%;而下一代 o-series 模型即便沒有專門針對這個任務,也能直接提升 30%。即便我們設計出更難的基準,也會很快(而且越來越快)被這個配方解決。我的同事 Jason Wei 畫過一個很漂亮的圖,把這種趨勢表現得很清晰:那麼下半場還能玩什麼?如果新的方法已不再需要,而更難的基準也會越來越快被解決,那我們接下來該做什麼?我認為我們需要從根本上重新思考「評估」。這不僅僅是去設計新的、更難的基準,而是要徹底質疑現有的評估方式,並創造新的評估體系,從而逼迫我們去發明超越現有「配方」的新方法。這很難,因為人類有慣性,幾乎不會去懷疑最基本的假設——你習以為常地接受它們,卻沒意識到它們只是「假設」,而不是「規律」。舉個關於慣性的例子:假設你在 2021 年設計了一種基於人類考試的評估方式,這是一個極其大膽的想法。但三年後,這個方法就已經飽和了。你會怎麼做?最可能的做法就是——設計一份更難的考試。或者,假設你解決了簡單的程式設計任務,那你會怎麼做?很可能就是去找更難的程式設計任務來解,直到達到 IOI 金牌水平。這種慣性很自然,但問題在於:AI 已經在國際象棋和圍棋上擊敗了世界冠軍,在 SAT 和律師資格考試中超過了大多數人類,甚至在 IOI 和 IMO 上拿下了金牌。可世界並沒有發生太大改變——至少從經濟和 GDP 的角度來看如此。我稱之為效用問題,並認為這是 AI 最重要的問題。也許我們很快就能解決效用問題,也許不會。但無論如何,這個問題的根源可能出奇地簡單:我們的評估方式在很多基本層面上與現實世界的設定並不一致。舉兩個例子:- 在評估中,任務「應該」自動運行:通常智能體接收任務輸入,自主執行,然後得到一個獎勵。但現實中,智能體必須在任務過程中持續與人類互動——你不會只給客服發一段超長的文字,等上 10 分鐘,就指望對方給你一份完整的回覆解決所有問題。通過質疑這種評估設定,人們發明了新的基準:要麼把真實人類納入環節(如 Chatbot Arena),要麼引入使用者模擬(如 tau-bench)。- 評估「應該」是 i.i.d.(獨立同分佈) 的。如果你有一個包含 500 個任務的測試集,就會獨立運行每個任務,最後取平均得到一個總體指標。可在現實中,我們解決問題往往是順序進行的,而不是平行。比如,一個 Google 的軟體工程師(SWE)在處理 google3 的問題時,隨著她對程式碼庫越來越熟悉,效率會越來越高;但一個 SWE 智能體在同一個程式碼庫中解決了很多問題,卻無法獲得這種熟悉度。我們顯然需要長期記憶的方法(事實上已經有一些了),但學術界既沒有合適的基準來證明其必要性,也缺乏質疑 i.i.d. 假設的勇氣——而 i.i.d. 一直以來是機器學習的基礎。這些假設「一直以來」就是如此。在 AI 的上半場,基於這些假設去設計基準是沒問題的,因為智能水平還低,提升智能基本就等於提升效用。但現在,這套通用配方在這些假設下幾乎必定能奏效。所以,在下半場的新玩法是:我們開發新的評估方式或任務,以衡量真實世界的效用。我們用現有配方去解決它們,或在配方上加入新的元件,然後繼續循環。這個遊戲很難,因為它是陌生的。但它同樣令人興奮。上半場的玩家解決的是電子遊戲和考試,下半場的玩家則有機會靠建構真正有用的智能產品,打造市值數十億甚至數兆美元的公司。上半場充斥著方法和模型的漸進改進,而下半場會對它們進行一定的「篩選」。這套通用配方會輕易擊敗那些漸進式的方法,除非你能設計出新的假設,打破現有配方。那時,你才會做出真正改變遊戲的研究。 (APPSO)
合肥一中畢業的姚順雨,出任騰訊首席AI科學家
這位年僅27歲的AI界頂尖人才為合肥一中2015屆校友如今已成為中國科技巨頭AI戰略佈局的關鍵核心今天上午合肥一中官微發佈推文講述了該校傑出校友姚順雨在校時的故事姚順雨的成長軌跡堪稱“學霸範本”。初中就讀於合肥45中,高中考入合肥一中後,他便展現出過人的電腦天賦,2014年斬獲全國資訊學奧林匹克競賽(NOI)銀牌。姚順雨在合一校園(倒數第二排左五)。2015年高考,他以704分、安徽省理科第三的優異成績,考入被譽為“天才集中營”的清華大學交叉資訊研究院“姚班”,主修電腦科學,其間不僅擔任姚班聯席會主席,還聯合創辦了清華大學學生說唱社,兼具學術深度與多元才華。姚順雨在清華“姚班”。2019年,姚順雨遠赴普林斯頓大學深造,專攻自然語言處理與強化學習,2024年順利獲得電腦科學博士學位。姚順雨在芝加哥學習交流。在合肥一中學習期間,姚順雨便是大神級的存在。關於姚順雨,還發生一件有趣的事:2015年高考出分後,姚順雨還專門來找校領導,主動“懺悔”,說由於自己的低級錯誤,讓大合一錯過了一個“全省頭名”,於可愛中彰顯了他對母校的榮譽感與責任感。而在班主任杜敏老師眼裡,姚順雨是個非常有想法、做事有規劃的孩子,不僅是理科大神,而且熱愛文學、喜歡rap和籃球、舞蹈等,可以說是個全面發展的學霸。姚順雨在MIT學習交流。學術生涯中,姚順雨已創下多項重磅成果。博士期間提出的思維樹(Tree of Thoughts)框架,大幅提升了AI決策模型的複雜問題解決能力;研發的ReAct方法首次建構“推理—行動”智能體範式,成為全球語言智能體開發的主流技術;2024年博士畢業後,他直接加入OpenAI擔任研究科學家,深度參與智能體產品Operator、DeepResearch及電腦使用智能體(CUA)的核心研發,為語言智能體領域的開啟與發展奠定了基礎性貢獻。2025年5月,他以最年輕入選者身份躋身《麻省理工科技評論》“35歲以下科技創新35人”中國區名單,學術實力與創新潛力獲國際權威認可。 (安徽日報)