#人才流失
這些年輕科學家不再滿足於“追趕美國”
在很長一段時間裡,矽谷是全球AI人才的終點站。而中國曾是最大的人才輸出地,把一代又一代頂尖AI人才送往彼岸。如今,這種單向流動正在悄然轉向。Digital Science的一份報告指出,美國已經開始對中國出現AI人才淨流出的趨勢。優秀的青年學者,正在以更快的速度選擇回到中國[1]。來自史丹佛大學的另一份報告則提出,美國已經不再是AI人才的首選目的地。“美國的高校和研究機構現在更像一個人才跳板,美國提供了高水平的資源、經驗和人脈,但最終這些積累被帶回中國,成為支撐本土AI領域發展的一部分”。[2]過去十年,中國AI研究人員從不到10000人,增加到52,000人,平均每年以近30%的速度擴張。更重要的是,他們多數還不到三十五歲,卻已頻繁出現在NeurIPS、CVPR等國際頂會上。一個龐大、年輕且充滿銳氣的人才群體正在成形。“青年科學家正在成為新一輪科技發展的主角,我們要把聚光燈給到他們,提供更多的資源幫助他們,”在外灘大會的第二屆螞蟻InTech科技獎頒獎現場,螞蟻集團副總裁、首席技術官何征宇如是說。在去年螞蟻集團20周年之際,首次發起了面向學術界的螞蟻InTech科技獎,希望發掘並支援那些在中國電腦以及交叉學科領域的優秀青年學者,尤其是那些對推動關鍵技術發展具有重要貢獻的青年學者。今年的螞蟻InTech科技獎又全面升級,除了繼續遴選10位青年學者,提供20萬元/人的“科技獎”資助外,還首次增設了5萬元/人的博士生“獎學金”,提供對“青年學者-博士生”的全周期支援。本屆整體參評規模達去年3倍,海外申報者佔比超20%,其中包括牛津、耶魯、史丹佛等高校。最後的獲獎學者中,不少有海外經歷,他們帶著在頂尖實驗室錘煉出的經驗從海外歸來,把更鋒利的方法投向中國這個更複雜、更火熱的現場,去解決那些真正棘手的根本性問題,並在這裡規劃自己更長遠的藍圖。01. 無人區的探索第二屆螞蟻InTech科技獎得主、南京大學電腦學院教授王利民從蘇黎世聯邦理工學院回國之後,致力於開發一個完全由視訊大模型驅動的自動駕駛系統:車上的攝影機源源不斷輸入畫面,模型即時完成感知、預測與決策。他希望這一模式能替代傳統的模組化系統,成為車輛的大腦,從根本上提升自動駕駛的安全性。在人工智慧的諸多賽道里,視訊大模型一直是最難啃的骨頭。文字可以拆成詞,圖像是靜止的畫面,而視訊意味著連續不斷的洪流。機器要在這股洪流裡,不僅識別一個動作、一張畫面,還要理解前後關係,甚至預測接下來會發生什麼。在全球範圍內,這一方向長期缺乏成熟的框架,幾乎沒有可供借鑑的路徑。王利民和團隊選擇在無人區起跑,推出了國內首個大規模視訊理解基礎模型InternVideo。在全球AI研究的坐標系裡,InternVideo的出現意味著一個新的議題由中國學者提出並推動。“這是一個有前瞻性的選擇。”王利民回憶,當時他們在世界範圍內幾乎沒有可以借鑑的路徑,只能自己摸索著向前。也正因為如此,InternVideo才能在推出後迅速成為全球參照,被NVIDIA推出了COSMOS世界模型作為資料引擎關鍵技術使用,並被圖靈獎得主楊立昆在提出V-JEPA世界模型時多次拿來對比。在電腦視覺之外,還有一種更科幻的感知方式,第六感。不靠攝影機,而用空氣裡的無線電波看見世界,這種聽起來像古早科幻小說設想的技術,現在其實已經落地。它的大名叫做無線感知,但第二屆螞蟻InTech科技獎得主、北京航空航天大學的張扶桑教授喜歡叫它第六感,這項技術所做到的,正是調動人類五感察覺之外,WiFi、4G/5G這類本就無處不在的訊號,識別呼吸、心跳、跌倒與動作。這條路徑的優勢,在於天然的非侵擾。許多家居與養老場景,尤其是衛生間,並不適合安裝攝影機,而無線感知只需要一個嵌入路由器或浴霸的小模組,就能完成無接觸監測。如果把感知模組裝上機器人或無人機,還能實現全天候看護。家中摔倒的老人、可能被遺落在車後座的孩子,他們的安全都可以由這只看不見的手來保護。“如果為機器人配備這種感知能力,它將能夠超越人類自身的感知極限,在眾多工中提供更高效的服務,未來的應用前景極為廣闊,”張扶桑表示。然而,這一領域也面臨著巨大挑戰。無線訊號最初並非為感知而設計,其本身複雜且容易受到干擾,要從中提取出穩定、可用的規律,對精度提出了極高要求。更重要的是,無線感知作為一個研究方向,從興起到現在不過十年左右,許多基礎理論仍屬空白,需要從零開始探索。在這片“無人區”中,張扶桑提出了無線感知模型,成功量化了電磁波受人體和環境影響的機制,並解答了諸如感知極限與穩定性等一系列根本性問題。該理論被國際同行譽為“里程碑式的工作”,並被納入全球首部無線感知專著。張扶桑表示:“目前我們已經與國際頂尖團隊並跑,甚至在若干方向上實現了領先。”無線感知不僅是一項科研突破,更將成為未來通訊基礎設施的重要組成部分。6G已將“通訊感知一體化”列為核心特性,這意味著感知能力將與通訊功能一樣,成為下一代網路的基本配置。張扶桑的目標是將這一能力深度融入未來的標準體系,助力中國在全球6G競爭中佔據關鍵地位。在張扶桑眼裡,這一代青年科學家展現出持續迸發的潛力與創新活力,因此對他們給予充分的支援與激勵至關重要。“與早年條件有限的情況不同,如今的青年科學家從一開始就具備國際視野,同時充滿獨特的想像力和創造力。”這正是螞蟻InTech科技獎關注的重點。不僅僅獎勵已經完成的成果,更在意的是它們所釋放出的未來潛力。一種技術如何被應用,如何推動行業前進,如何在下一輪競爭中形成突破。這些,才是評審最看重的部分。螞蟻集團副總裁、首席技術官何征宇說,螞蟻集團非常注重多元化的青年人才生態,已經與清華大學、浙江大學十余所高校成立了聯合實驗室,與北京大學、上海交通大學開展了系統的人才培養項目,與多個學術組織連續五年推出了科研基金。這些舉措的目的只有一個——讓有志於科研的人才有更多實踐、轉化的機會,讓更多科研成果更快走向社會,服務民生。“科技的發展從來不是孤立的,相信用技術去推動應用的發展,最終實現技術普惠,為每個人帶來生活的便利,是我們不變的願景。”02. 向心力一種新的、圍繞著中國AI場景的向心力正在形成。2025年7月,中國投資和技術促進辦公室(ITPO China,隸屬聯合國工業發展組織)發佈的報告顯示,全球AI人才的格局,正在發生結構性重組。研究團隊分析了2015年至2024年間20萬名研究人員撰寫的9.6萬篇AI學術論文,並據此繪製出人才版圖。中國的AI研究人員,從2015年的不足萬人,增長到2024年的5.2萬人,年復合增速高達28.7%。這一規模已接近美國的6.3萬人。更值得注意的是,中國AI人才的增長幾乎完全由博士和博士後群體驅動,構成了一個龐大、年輕、受過高等教育的AI人才庫[3]。除了留學歸國的年輕AI學者,本土培養的力量同樣不可小覷。史丹佛大學與胡佛研究所聯合發佈的調查發現:DeepSeek的研究人員中,超過一半沒有學習和留學的經驗[4]。正因如此,Digital Science的報告做出了大膽的預言,“考慮到擁有一個年輕、充滿活力且受過高等教育、具備AI素養的勞動力群體,我們應預期中國將湧現一波與DeepSeek類似的創新浪潮[5]。”在哈佛醫學院的八年裡,張帆逐漸成為瀰散磁共振(dMRI)研究領域的關鍵人物。他研發的開源平台SlicerDMRI,已成為全球腦影像研究和臨床實踐的重要工具,國際醫學資料庫ExpertScape將他評為dMRI 領域全球前1%專家。回到電子科技大學後,他利用AI深度學習演算法,通過影像技術建構出腦神經纖維的分佈,又把原本需要1個多小時的腦神經纖維提取工作,縮短到了幾分鐘內即可完成,極大的提升了效率和精度。在臨床治療領域,該技術能夠幫助一些需要急救的病人——比如腦出血的患者——快速完成影像腦神經纖維的快速提取。對於醫療資源匱乏的地區,這項技術能夠有望幫助醫生縮短診斷時間,為搶救爭取黃金窗口期。這位第二屆螞蟻InTech科技獎得主說,“十幾年前,我讀博時出國參加會議,更多是去學習,會場上主要的聲音都來自海外學者。但現在完全不同了,很多研究是我們在引領,海外學者會主動來合作。”過去十年,中國的AI學者更多處在追隨的位置,正是他們的快速成長,讓中國AI的追趕顯得格外突出。今天,他們已經從追趕轉向自主創新,開始在部分方向上定義議題、引領合作。青年科研力量正在改變未來的走向,他們既是在縮小差距的一代,也是要去定義新議題的一代。螞蟻InTech科技獎得主、上海交通大學人工智慧學院助理教授、上海創智學院全時導師李永露用“勢能”和“動能”來形容中美AI發展的關係。他認為,北美在AI方向憑著深厚積累,具備足夠的“勢能”。但隨著更多年輕學者的成長,中國同樣展現出巨大的潛力與發展“動能”。在攻讀博士時,他觀察到實驗室裡的機器人演算法在固定場景中動作準確,但一旦換一個杯子的形狀、在地板上多一些水漬,就會立刻出錯。幾十年來,機器人始終缺乏泛化能力,它們無法像人一樣,在陌生環境中靈活應對。這種困境促使他提出一個形象的比喻:培養機器人,就像培養一個孩子。小孩先學會模仿,再通過不斷嘗試和糾正獲得新技能。為此,他和團隊建構了首個結構化人類行為知識引擎,把2000萬條人體—物體互動狀態和381種物體屬性歸納為可遷移的知識規則,為機器人“上學”提供教材。他建構的行為知識引擎,被圖靈獎得主Yoshua Bengio在多模態學習相關論文中引用。2025年,他作為獨立通訊作者獲得ICRA HRI最佳論文獎,與來自MIT、史丹佛、Google、NVIDIA的團隊同台競爭。“我們希望AI能像人一樣,從複雜物理世界中抽象出規律、價值觀甚至美學”,李永露說,“在這個過程中能留下一個里程碑,那怕只是墊腳石,也算推動了這個時代”。在螞蟻InTech科技獎的頒獎現場,身在美國的圖靈獎得主傑克•唐家拉也通過視訊告訴這些來自中國的年輕科學家,“科研之路並非一帆風順,但註定會極有收穫”,並勉勵獲獎的年輕科學家們“大膽一點,忠於本心,要相信你們的研究能夠改變世界,定義未來”。03. 在這裡,你幾乎可以買到任何零件“在中國,你幾乎能夠買到任何機器人零件,而且都比國外便宜”,李永露這樣提到回國做研究的體驗。李永露所從事的是具身智能研究,經常需要去裝配、改造機器人,此時,擁有完備的硬體產業鏈的中國就展現出了“巨大優勢”。在中國,李永露幾乎沒有體驗過為了一個零件排隊很久的情況,很多機器人研究者在國外做研究時需要等很久的昂貴零件,在國內很容易就能找到便宜的“平替”了。得益於低廉的製造成本和更易實現規模化應用的廣闊市場,“中國在產業鏈完備性以及綜合性研究落地方面具有明顯優勢”,張扶桑教授向《知識分子》表示。在無線感知這一研究領域中,國外的研發工作雖然較為深入,但主要集中在醫療領域。相比之下,中國的應用場景則更為多元。除了醫療,從提升安全性的無人駕駛技術,到可實現“出風避人”的智能空調,相關研究覆蓋廣泛。“國內相關產業不僅數量眾多,而且發展熱情高漲。”張扶桑進一步解釋道,美國在演算法等基礎技術方面依然領先,而中國憑藉豐富的行業需求,為技術提供了真實的測試環境和持續最佳化的機會,從而加速了產品的成熟與完善——這也正是他在中國從事無線感知研究過程中所切身感受到的優勢。這位年輕科學家甚至認為:“也許就像當年的電商行業,技術或許起源於歐美,但我們在及時配送的時效性、貨物的種類齊全程度上,如今已經遠遠超越了歐美。”而對於電子科技大學的年輕教授張帆而言,在中國,他體會到的巨大優勢首先來自這裡豐富的資料。張帆所從事的是數字醫學研究,回國前,他曾在哈佛醫學院工作過8年,回國後,他發現“國內的資料採集速度完全不一樣”,在哈佛醫學院的附屬醫院,對於某種特定類型的腫瘤手術,他們一年只能積累幾十個病例,但在國內,幾個醫院聯合起來,幾乎只要幾周就能達到這個資料量……張帆感嘆,中國龐大的醫院網路、海量的病人、以及極其多樣的疾病類型,為AI醫療影像和資料分析的研究建立了一個非常好的資料基礎。“正常來說,可能需要10幾年才能達到歐美目前的水平,但憑藉這些優勢,中國很有可能用5年就能達到他們同等等級的技術水平。”張帆則告訴《知識分子》,在中國做醫療AI,不僅沒有美國的繁瑣流程,還有來自國家、科研機構和企業等多方的支援和鼓勵。“我現在在研的國家級項目,既有國家自然科學基金委的,也有國家科技部的。就在最近,我們還獲批了一個校級的醫工交叉項目,是和四川省人民醫院合作的……國家層面還有專門針對AI+的政策傾向和專項支援。國務院最近發文,專門支援AI技術本身的發展以及它與其他領域的交叉融合。基金委和科技部等資助機構也都有AI相關的專項,去支援從事AI研究的學者,把技術應用到各個層面。”當然,還有來自螞蟻集團這樣的企業資助和獎勵,螞蟻的InTech科技獎20萬元的資助也許不算最多的,有時候也能成為一次關鍵實驗、一台急需裝置的轉折點。李永露想用這筆獎金購買一台機器人;而王利民改善一下自己的科研條件,暫時解決一下目前算力不足的問題;張帆更是覺得,有助於推動學術成果的落地,他整在考慮把獎金用於科研成果的實際轉化。這些鬆綁與支援的結果便是,“目前,國內一個很顯著的特點,就是我們這些做醫療AI的學者和產業界的聯絡非常緊密。現在很多實驗室裡的技術,能非常快地落地成為產品。現在去醫院,會發現很多診療系統背後都有中國公司在支撐……”張帆說。04. 長期承諾在世界科技強國中,企業成為基礎研究的重要資助者,已是大勢所趨。換言之,基礎研究不僅需要公共財政的托底,也需要來自產業與社會的長期承諾。2021年美國國家科學和工程統計中心(NCSES) 的資料顯示,當年美國聯邦政府提供了40%的基礎研究資助,而企業提供了36%,幾乎是同樣重要。相比之下,中國的格局仍然相對單一:2020年,國內92% 以上的基礎研究經費來自政府,企業的貢獻僅為4%。2018年,《國務院關於全面加強基礎研究的若干意見》就提出,要通過稅收槓桿、共建研發機構、聯合資助、慈善捐贈等方式,引導企業和社會力量加大投入[6]。自2018年開始,騰訊的科學探索獎,阿里的青橙獎等多個民間資助項目開始探索社會力量對科研的資助。這不僅是一種榮譽象徵和資金支援,更是一種對制度創新的探索。在這樣的背景下,螞蟻集團自去年開始設立InTech科技獎,它並非面向成熟的科學巨擘,而是將目光投向科研曲線尚在上升階段的青年學者。同時,獎項體系還專門設定了博士生獎學金,這意味著,它不是單點式的鼓勵,而是把青年科研人看作一個完整的生態,從博士到獨立學者都在支援鏈條之中。螞蟻InTech的科技獎完全公益化運作,面向在全球高校、科研院所及新型研發機構中全職從事電腦科學研究與實踐的中國青年學者。獎項強調三大導向:理論探索、技術突破、工程實踐,覆蓋通用人工智慧、具身智能、數字醫學、資料處理與安全隱私四大方向。企業可以通過長遠的方式參與科研,支援那些在基礎研究一線的年輕人。對處於科研黃金期的青年學者而言,這樣的鼓勵和支援往往意味著他們能更堅定地選擇一條原始創新的道路,也代表了一個更開放的舞台,讓他們的研究既能被學界認可,也能產業與社會看見。AI領域,企業支援科研的意義比其他學科更關鍵。在傳統學科裡,企業往往只能通過資助影響科研,而在AI領域,企業自身就是關鍵的科研機構。史丹佛大學2024年發佈的《人工智慧指數報告》指出,工業界正在主導AI 前沿研究。2014年前,機器學習模型的發佈主要由學術界完成。而到2023年,工業界獨立開發的模型已達到51個,而學術界只有15個。更值得注意的是,這一年共有21個重量級模型由學術界與工業界合作推出,創下歷史新高。科研與產業的邊界,正在AI這一領域被不斷打破[7]。螞蟻集團向來強調在研究上的投入。僅在2024年1月到11月,螞蟻研究團隊就在國際頂會上發表了300多篇論文,其中46%聚焦AI領域,涵蓋經濟性、可信性、效率與安全四大方向。值得注意的是,這些論文裡有35篇被收錄為Oral(現場報告),佔比約12%。科研成果的另一種衡量方式,是開源。螞蟻迄今已經累計開源2187個程式碼倉庫,貢獻超過100個社區頭部開放原始碼專案。很多成果不止停留在學術意義上,而是快速進入實際應用。比如2023年開放原始碼的DB-GPT,在一年間就獲得近14萬Star,被上百家企業整合到生產系統中,覆蓋金融、政務、網際網路等場景。同年推出的SkySense,則以20億參數成為全球規模最大、任務最全、精度最高的多模態遙感基礎模型[8]。這類成果的背後,是產業和科研雙向流動的結果。根據喬治城大學資料庫的統計,過去五年,全球3.56% 的電腦科學類論文至少有一位工業界作者。在這一比例裡,中國學者的貢獻佔23.58%,網際網路企業的科研產出質量與影響力快速提升[9]。中國的網際網路大廠,如今已成長為不容忽視的中國科研力量。而在AI 這樣一個產業和科研緊密交織的領域,企業能否以更長期的姿態支援科研,不僅決定著今天的競爭格局,也關乎未來的原始創新能否真正生長。參考文獻:[1]Digital Science. (2025, July).New report shows China dominates in AI research.[2]Hoover Institution. (2025).Deep peek: DeepSeek AI’s talent and implications for U.S. innovation.[3]The Chosun Ilbo. (2025, July 16).China’s AI talent pool surges, nearing US levels.[4]Hoover Institution. (2025).Deep peek: DeepSeek AI’s talent and implications for U.S. innovation.[5]Digital Science. (2025, July).New report shows China dominates in AI research.[6]國務院. (2018年1月31日). 《關於全面加強基礎科學研究的若干意見》.[7]Stanford University Institute for Human-Centered AI. (2024).AI index report 2024.[8]螞蟻技術ANTTECH. (2024).螞蟻集團2024科技生態白皮書| 過去這一年,螞蟻工程師平均每天發了一篇頂會論文.微信公眾號“.[9]財經網. (2024年12月30日). 《螞蟻集團發佈2024科技生態白皮書,AI專利和論文均有大幅提升. (知識分子)
GPT-5難產內幕曝光!核心團隊遭挖空,推理魔咒難破,靠輝達續命
GPT-5,曾經差點難產?這條誕生路,簡直是烈火煉真金。一邊是人才出走、小札截胡、團隊內部陷入混亂,另一邊,推理模型魔咒讓研究者苦惱不已,專案甚至一度停擺。外媒曝出這期GPT-5誕生內幕,可謂亮點滿滿,乾貨十足。就在剛剛,外媒The Information曝光了關於GPT-5的一大波最新內幕,眾多猛料來了!例如,GPT-5並未取得技術突破,不存在GPT-3到GPT-4這種等級的躍升。例如,OpenAI正面臨嚴重的資料瓶頸和技術難題。還有一個勁爆大瓜,OpenAI大波核心研究者一下子被小札撬走,直接導致了OpenAI內部的組織架構混亂!為此,研究副總裁Jerry Tworek在Slack上公開向研究主管Mark Chen抱怨,許多同事都看到了。不過,就在這麼一篇唱衰的文章發佈之際,OpenAI同時又有好消息了。近日,OpenAI又獲得了一筆巨額融資。據悉,OpenAI已提前數月籌集了83億美元資金,這就導致它的估值直接達到3,000億美元,這是今年400億美元融資計畫的一部分。參與此輪融資的,有一大波全新投資者,其中Dragoneer投資集團以28億美元領投本輪,Blackstone、TPG、Fidelity、Founders Fund、紅杉資本等跟投。不過,雖說Dragoneer是本輪融資的最大出資方,但軟銀仍是整個400億融資計畫的牽頭者。GPT-5還沒發佈,各方勢力都下場了,這不免讓人把期待值拉滿,屏息等待下周的盛況了。Orion隕落真相GPT-5沒做出來,降級成4.5了去年萬眾矚目的Orion,大家應該都還記得。The Information爆料說,在2024年下半年的大部分時間裡,OpenAI都在全力開發Orion模型,它被寄予了厚望,原計畫作為GPT-5推出。跟5月發佈的旗艦模型GPT-4o相比,Orion本該有個巨大飛躍。結果它的表現令人大失所望,最終只能被降級成GPT-4.5,在今年2月推出。默默上線後,GPT-4.5迅速淡出公眾視野。所以,Orion為何會失敗?最核心的原因就在於,團隊摸到了預訓練階段的天花板。因為高品質網路資料已經日益枯竭,訓練小模型時還有效的技巧,在大模型身上竟然就會失效。這不光導致了GPT-5的延期,也讓OpenAI的團隊內部陷入了自我懷疑。GPT-5,根本沒有GPT-3到GPT-4級的躍遷這個從神壇跌落的故事,要從去年12月說起。當時,OpenAI的研究者完成了一項內部測試,結果震驚了整個團隊。他們發現,當給一個新模型更多算力和思考時間,它就像開了掛一樣,複雜推理信手拈來,執行任務出色到驚人。然而,激動的工程師們很快就發現,這份興奮只是暫時的。當他們把這個新模型轉換為o3聊天版本時,那種驚人的效能提升就消失了。可以說,這次事件,正是OpenAI在今年大部分時間裡所面臨技術挑戰的縮影。這讓OpenAI不僅內部技術進展緩慢,大獲成功的ChatGPT業務也受到影響。GPT-5發佈前夕,各類外流和爆料已經是滿天飛。例如,它的程式設計和數學能力又有了顯著提升。另外,它在驅動AI智能體方面也優於前代模型,只需要極少人工監督,就能處理複雜任務。它能遵循極為複雜的指令,例如支援智能體何時應批准退款的規則。而在以往,模型需要學習多個棘手的「邊緣案例」,才能處理此類退款。但總的來說,這些改進根本無法與2020年GPT-3到2023年的GPT-4之間的效能飛躍相提並論。也就是說,我們需要做好對GPT-5失望的準備。不過,OpenAI模型的任何改進,即便是漸進式的,也能刺激客戶需求,以及給投資人信心。這樣才能支援OpenAI未來三年半燒掉450億的計畫,畢竟租用伺服器實在太昂貴了。高階主管為何相信GPT-8?最近曾有OpenAI高層向投資人透露:沿著目前架構,他們相信模型有朝一日會達到GPT-8的水準。CEO奧特曼也表示過,利用現有技術,OpenAI有望創造出AGI。是什麼給了他們這樣的信念?一位瞭解內情的微軟員工透露了玄機:測試GPT-5後,他們發現它在不消耗更多算力的情況下,就能產生更高品質的程式碼和文字。部分原因在於,它學會了準確判斷不同任務所需的運算資源量。內部「混亂不堪」不過OpenAI內部,可並非一片和諧。例如一些資深研究者,非常牴觸將自己的成果交給微軟,儘管這位最大股東擁有的合約權利截至2030年。雖然兩家公司財務緊密,但在具體合作條款上,卻始終爭執不休。最新資訊是,OpenAI重組營利部門後,微軟很可能在其中獲得33%的股份。而小札以天價薪資挖走的團隊,也讓OpenAI內部陷入了更大的混亂。走了這麼多人,只能緊急進行組織架構調整。上周,OpenAI的研究副總裁Jerry Tworek在Slack上向上司、研究主管Mark Chen抱怨團隊變動的事,許多同事都看到了這則訊息。當時,Tworek表示需要休假一周來重新思考,但最終並未休假。絕境中的轉機推理模型的意外崛起總之,直到今年6月,情況依然很嚴峻:在OpenAI開發的模型中,沒有一個能頂得住GPT-5的名號。好在,「推理模型」成了他們的全新突破口。23年末一項名為Q*的技術突破,能解決前所未見的數學問題,在OpenAI研究者中引發了巨大震動。基於Q*,OpenAI開發了許多推理模型,在獲得更多算力時,它們就會表現更佳——看起來,預先訓練的表現成長瓶頸,就要被克服了。去年秋天,第一個推理模型正式推出,它就是o1。24年底,OpenAI利用與o1基礎相同的GPT-4o,又推出了推理模型o3。據說,雖然師出同門,但o3的教師模型在理解科學知識方面,比o1的教師模型進步大得多。背後原因,就是OpenAI用了更多輝達晶片來開發o3的教師模型,這就讓它理解複雜概念時能力更強。還有一個原因,就是它被賦予了搜尋網路,以及從程式碼庫中提取資訊的能力。並且,它也同樣受益於強化學習。在這個過程中,人類專家在生物學、軟體工程和醫學上提出刁鑽的問題和答案,然後讓模型針對這些問題產生數千個自己的答案。隨後,OpenAI會利用那些與人類專家得出相同答案的AI生成回答(也即「合成資料」)來訓練模型。推理模型為何總翻車o3模型發佈後,一度成為全球頭條,引發病毒式討論,然而現實很快就給了當頭一棒。當o3的教師模型轉換為學生模型,變成一個可以讓人們提問的聊天版本時,它的表現顯著下降,甚至跟o1相比沒有任何差異。同樣,建立讓企業透過API購買的版本時,同樣的問題也出現了。有知情人分析,原因是這樣的:o3理解概念的方式很獨特,跟人類的溝通方式大相逕庭。因此,如果建立一個聊天版本,其實就拉低了這個原始天才級模型的智能水平,因為它被迫用人類語言,而非自己的語言去交流。這種情況下,它的推理鏈就會被迫壓縮、扭曲。甚至有開發者在偵錯時,偶爾能看到模型輸出「亂碼」般的中間語言──那可能就是它「思考」的原始型態,也就是這個天才原本的樣子。也有人認為,OpenAI沒有投入足夠精力來訓練模型在聊天場景中與人類進行有效溝通。總之,o系列模型讓ChatGPT的使用者非常困惑,因此公司決定重新回歸GPT的命名體系。「通用驗證器」好在,OpenAI還有辦法。據悉,內部正在開發一種「通用驗證器」,可以自動化地確保模型在RL過程中產生高品質的答案。本質上,這個過程是讓一個LLM承擔起檢查和評估另一個模型答案的任務,並利用各種資訊來源來對答案進行研究核實。前一陣OpenAI的模型在數學競賽中拿了金牌後,資深研究員Alexander Wei在X上表示,他們所使用的強化學習方法是「通用」的。也就是說,這個模型不僅能檢視程式設計這種標準答案清晰的內容,甚至還能判斷寫作這種主觀性很強的內容品質。這就對GPT-5助力極大!OpenAI強化學習團隊負責人Tworek最近也公開表示,自己認同這個觀點:OpenAI模型背後的密集學習系統,其實已經具備了通往AGI的潛力。目前,包括xAI和Google在內的AI大廠都已加倍押注強化學習。上周,Altman在播客節目中,描述GPT-5的能力說,它輕鬆解決了一個他根本看不懂的問題,直接讓他坐到椅子上,感到暈眩。這進一步點燃了我們對GPT-5的狂熱期待。「在幾乎所有方面,GPT-5都比我們更聰明。」究竟是什麼樣的模型,才配叫作GPT-5?好在,我們要等的時間不多了。 (新智元)
德國人才流失困境:四分之一高學歷移民或將離去
一項最新研究揭示,德國正面臨高技能移民流失的嚴峻挑戰。調查資料顯示,近四分之一(約26%)的已移居德國人士正在認真考慮永久性離開,其中更有3%(高達30萬人)已有了具體的出境計畫。這一趨勢尤其在高學歷、經濟成功且語言融合度良好的移民群體中表現突出,而他們正是德國經濟發展和專業人才儲備所急需的關鍵力量。《每日新聞》離境動因:政治、個人、稅負與行政桎梏導致這些移民考慮離開德國的原因是多方面的。受訪者普遍提及的因素包括對當前政治局勢的不滿、個人生活中的考量、日益加重的稅務負擔以及繁瑣複雜的行政流程。特別是來自歐洲國家的移民,表現出更強的回歸原籍國的意願,其中波蘭和羅馬尼亞是被提及最多的回流目的地。此外,一些非歐盟國家如土耳其和烏克蘭,也成為常見的外移目的地。對於那些不打算返回原籍國而選擇繼續移居他國的移民而言,瑞士、美國和西班牙則是他們的主要意向國。研究強調,這些離境意向並非偶然,而是由個體動機、性別、年齡、教育背景等個人特質,以及社會經濟融入程度和當地社會接納度等因素共同作用的結果。知識密集型行業面臨重壓此番人才流失危機,對德國的“知識密集型服務業”影響尤為顯著。在資訊技術、金融和保險服務等關鍵領域,有高達30%至39%的受訪移民表示,他們很可能選擇離開德國。這無疑給這些對創新和經濟增長至關重要的行業帶來了巨大壓力。值得注意的是,無論是為工作、學習還是家庭團聚而來到德國的移民,都普遍表達了上述離境原因。而對於尋求避護的人群來說,遭受不公正待遇的經歷,也成為了促使他們考慮離開的重要因素之一。大多數移民仍計畫留德儘管面臨上述挑戰,研究也指出,多數已移民至德國的人士(約57%,即570萬人)仍計畫永久性留在德國。這表明,雖然存在人才流失的風險,但德國作為移民目的地的吸引力依然存在,仍有大量移民願意在此長期發展。 (德國派)