#AI研究
10家新公司、9家獨角獸,這個新賽道憑什麼讓矽谷風投瘋狂下注?
估值百億,產品幾無,這便是當下最瘋狂的AI資本敘事。最近,前OpenAI CTO米拉·穆拉蒂創立的Thinking Machines Lab,正以高達500億美元的估值,籌劃新一輪40億至50億美元的融資。而它拿得出手的,僅是一個名為Tinker、介面尚待考證的API介面。相比傳統商業邏輯,這無異於一場豪賭:資本押注的,早已不是產品,而是人,是那串貼在創始人身上的“OpenAI開國元老”的黃金標籤。穆拉蒂的實驗室,正是席捲矽谷的neolab(新生代實驗室)風潮中最耀眼的一朵浪花。據國外知名VC menlo合夥人Deedy推文,AI領域新興的10家neolab中,9家在種子輪階段就斬獲10億美元估值。一批從OpenAI、DeepMind等巨頭出走的頂尖研究員,正以反叛者的姿態,用全新的範式重建AI研究的邏輯。他們不談營收,不論商業化,只談那些看似天方夜譚的方向:情感智能、AI社會、自動化科學家等。資本的反應則更為直接與狂熱:Humans&成立數月估值40億,SSI瞄準超智能安全估值320億,Periodic Labs一出手種子輪便是3億……這些在傳統視角下“啥也沒有”的實驗室,正以令人咋舌的估值,鯨吞著數十億美金。當最聰明的大腦決定另起爐灶,資本的選擇是不看PPT,只認履歷,用真金白銀為他們的直覺與純粹投票,賭他們能用履歷兌換一個不一樣的未來。/ 01 / 5家,拿下 25億美元當OpenAI和Anthropic的估值飆升至1830億美元量級,變得“貴得離譜”時,資本的洪流正悄然湧向一批更為神秘、精悍的新型實驗室neolab。根據The Information報導,僅五家neolab初創公司,就在過去一個月內完成或洽談了高達 25億美元 的融資。如果只看研究方向,neolab的主題幾乎毫無共識:有人在做多智能體數字社會,有人在研究情感智能,有人在做自動化科學家,有人探索身體化智能,有人在推進實驗物理材料,有人在逼近通用智能的邊界。它們共同點只有一個——創始人都是那批走出巨頭實驗室的最能打的人。這些neolab的創始人,幾乎全部從OpenAI、DeepMind、Anthropic等巨頭出走,個人財富早已達到千萬乃至億美元等級。然而,他們放棄了巨頭的穩定與高薪,選擇all in一種新的AI範式。正是這種財務自由帶來的純粹性,構成了neolab最核心的魅力。他們可以無視短期商業化壓力,專注於那些巨頭不屑或無力觸及的高風險、長周期探索。於是,我們看到了研究方向呈現出前所未有的多元化:前xAI研究員Eric Zelikman籌集10億美元打造情感型AI初創Humans&,他不追求更快的推理速度,而是讓AI理解情緒、進行價值權衡,並建立長期關係。OpenAI安全研究員Eddie Zhang創業打造“多智能體數字社會”Isara,試圖讓上千個AI智能體像真實公司一樣自主分工、協作與治理。前OpenAI首席科學家Ilya Sutskever創立SSI,將“開發可控的超智能”作為唯一使命,安全優先於一切,據傳估值已觸及320億美元。相比之下,巨頭們似乎被禁錮在大模型最佳化的單一路徑上,追求參數與算力的線性增長。而neolab則追求迭代智能,其使命不是把模型做得更大,而是去發現新的智能結構。這種純粹性也讓他們能夠保持極度小而精的團隊,將“技術複利”做到極致。當然,這也催生了“夢想驅動估值”的奇觀。這些實驗室普遍收入極低甚至為零,沒有成熟產品,卻憑藉創始人的光環效應和顛覆性願景,在早期就獲得令人瞠目的估值。最典型的案例莫過於前OpenAI CTO Mira Murati創立的Thinking Machines Lab。在僅推出一個初步的開發者工具Tinker、產品能力有待考證的情況下,其估值據傳已高達500億美元。相比巨頭,neolab的10億美元估值幾乎是白菜價,例如Murati作為OpenAI開國元老的標籤,其加成就已值百億。/ 02 / 情感智能、遊戲視訊模型……九成種子輪拿10億美元估值接下來依次介紹這些neolab。①OpenAI“開國元老”單干,做超智能保險Safe Superintelligence(SSI)由前OpenAI首席科學家Ilya Sutskever聯合Daniel Gross與Daniel Levy創立,將"開發可控的超智能"作為唯一使命,安全優先於短期商業化。團隊聚焦精銳科研與安全工程,而非消費級產品化。▲ Ilya Sutskever、Paul Christiano、aniel Kokotajlo(從左到右)披露融資規模接近/超過十億美元,並與雲基礎設施方戰略合作保障算力。技術上需解決三大核心:推進能力時確保安全邊界領先、將理論對齊工程化、在無產品壓力下維持透明治理。短期內SSI是"科研+安全驗證"的高強度實驗室。儘管目前無商用產品,但其獲得Google(TPU支援)與Nvidia投資,估值據報達320億美元等級,表明資本對“長周期、安全性極高”的AGI實驗室有信心。②前OpenAI CTO出走創業,聚焦“企業定製模型”相比Cursor的290億美金估值,Thinking Machines啥也沒有就快估值500億美元。原因在於其創始人Mira Murati給它的加成太大。這位前OpenAI CTO、臨時CEO技術背景聚焦工程研發+產品落地+AI前沿技術操盤,她於今年出走創立新公司。▲Mira Murati新公司主攻“可解釋的群體智能”與符號-機率混合架構,將大量輕量級模型組織成層級化“工作流工廠”,通過可驗證協議在金融風控、藥物發現等高風險場景,實現可審計的多智能體協同。實驗方向包括任務分解語言、跨智能體信任評分與動態合約(以弱監督獎勵流標註),安全邊界被設為首要原則。10月,Thinking Machines推出了Tinker。近期,Thinking Machines Lab在籌集40億至50億美元。此前它已籌集了20億美元資金,最近一次的估值為100億美元。③前xAI研究員籌集10億美元打造情感型AIEric Zelikman來自xAI,是行業內罕見專注“情緒、價值觀與長期關係建模”的研究者。他的方向不追求更快的推理速度或更長的上下文,而是讓AI更像人。其能處理數周乃至數月的任務,理解情緒、做價值權衡,並建立長期關係。▲Eric Zelikman由Zelikman創立的Humans&致力於打造“情感智能”AI,把傳統強化學習從分鐘級、小時級任務,延伸到用時數周甚至數月的現實任務,如長期決策、戰略規劃、陪伴式互動等。其目標是讓AI不再追求“一次答對”,而是追求“長期最優”,具備自我情緒建模與長期目標協調能力。儘管研究尚未商業化,也沒有成熟產品,Humans&仍在成立數月內與投資人洽談以40億美元估值融資10億美元。知情人士稱,Nvidia與AMD均有意投資,希望這類新實驗室成為下一代算力大戶。④前DeepMind 12年元老創業Reflection AI,逐夢超級智能Reflection AI的CEO Misha Laskin,DeepMind前研究科學家,主導了Gemini從初代到1.5的RLHF訓練體系和獎勵模型架構設計,負責模型與人類反饋的閉環最佳化。芝加哥大學理論物理博士+伯克利博士後,2017年創業做AI需求預測,25歲入選福布斯“30 Under 30”。CTO Ioannis Antonoglou是DeepMind 12年元老,AlphaGo、AlphaZero、MuZero核心架構設計者,直接參與策略搜尋與價值網路建構,推動強化學習在複雜棋類和決策任務中實現突破。兩位創始人聯手,帶領60人團隊大部分來自DeepMind、OpenAI,專注於高性能模型訓練、強化學習演算法最佳化與大模型架構設計。他們的目標是,將強化學習、獎勵建模和大規模生成模型緊密結合,首先打造自主編碼智能體,使其能夠在複雜程式設計任務中自我最佳化、規劃與執行,再逐步擴展到通用推理與跨領域問題解決。投資人直接投入1.3億美元,A輪估值5.55億美元,紅杉、輝達、LinkedIn聯合創始人Reid Hoffman等均在股東名單上。⑤You.com CEO雙線作戰,10億美元建AI實驗室前Salesforce首席科學家、You.com創始人、史丹佛NLP博士Richard Socher,正在籌建一家以他本人命名的新型研究所,目標直指“自動化AI研究”。同名研究所Richard Socher在籌備階段就計畫募資近10億美元。▲Richard SocherSocher的設想是把科研流程徹底機器化:建構一套能夠自動完成模型設計、實驗執行與迭代最佳化的閉環系統,讓AI能自主生成新想法、自我反思、自動驗證,從而顯著壓縮從概念提出到可復現結果之間的周期。這種理念瞄準的是“研究生產力的系統級解放”。短期內,Socher團隊的能力對藥物研發、材料科學、半導體等高實驗密度行業尤其具有吸引力。這一方向不是堆算力,而是重構科學家的工作方式。團隊強調三條核心路徑:1)自動化實驗設計與超參搜尋,減少人工反覆偵錯;2)強化實驗可復現性,並建構完善的閉環驗證體系;3)將“自動化研究”的產出標準化為可工程化模組,使其能真正應用在企業級場景中。⑥OpenAI和DeepMind大佬離職聯手,押注“AI做科學”Periodic Labs由前OpenAI後訓練研究副總裁Liam Fedus與前DeepMind資深研究員Ekin Dogus Cubuk創立,目標是打造“AI科學家”:不僅生成論文和預測,而是真正開啟“從模擬→設計→實驗→驗證”的全鏈路自動化科研流程。▲Ekin Dogus Cubuk(左)和William(Liam)Fedus(右)Periodic Labs首要研究方向聚焦於低能耗超導材料、新材料與催化劑等高壁壘、實驗密集型領域。其願景是讓AI不只是理論工具,而是能在實驗室裡自主提出假設、設計合成路線、執行物理實驗,並完成結果反饋,實現“真AI科學家”的閉環。據公開融資文件,Periodic Labs已完成首輪種子融資,金額約為3億美元,由風投機構Andreessen Horowitz (a16z)與Felicis Ventures領投。⑦史丹佛三教授做“身體化擴散智能”,專注長期決策Inception Labs是一家由三位史丹佛背景的頂尖學者聯合創立的新型AI公司:擴散模型和FlashAttention關鍵推動者Stefano Ermon、UCLA助理教授Aditya Grover、康奈爾大學助理教授Volodymyr Kuleshov。三人長期深耕生成模型、強化學習與科學計算,並擁有將前沿技術成功推向產業的履歷,為公司帶來罕見的“學術深度+商業落地”雙重優勢。公司聚焦“身體化智能”與“長期學習系統”,試圖突破傳統模型僅停留在文字或靜態資料中的侷限,讓AI置身真實世界,通過持續的物理互動積累經驗,形成可長期更新的策略與習慣。他們試圖打造“任務生命周期管理器”,讓智能體在數周甚至數月中依環境變化不斷迭代策略。在商業端,Inception Labs採用軟硬體一體路線,通過機器人與感測系統切入製造業和物流業這些需要長期適應、高頻執行的場景。團隊已推出Mercury系列擴散語言模型,其中Mercury Coder在程式設計任務上實現了數倍效率提升,為身體化智能提供高效推理引擎。⑧遊戲視訊專家專注於“時空推理”模型General Intuition由Pim de Witte聯合James Swingos、Ken Colton等核心成員創立。創始團隊彙集科研、技術基建及視訊處理領域專家,Pim此前執掌視訊平台Medal九年,帶領團隊積累海量遊戲視訊資料,其他成員深耕世界建模與策略學習前沿,兼具技術研發與產業落地經驗。General Intuition起源於視訊平台Medal,利用其每年數十億條遊戲視訊作為訓練集,專注於“時空推理”與環境感知基礎模型,讓智能體理解物理世界中的運動因果。2025年10月,公司獲得1.34億美元種子/早期融資,是2025年AI領域規模最大的早期融資之一。資金將用於擴展團隊、基礎設施及加速機器人/無人機原型驗證。其核心主張是,遊戲視訊提供了豐富的稀有成功/失敗鏡頭,適合訓練理解物體運動、碰撞與長期因果關係的模型。商業路徑從遊戲AI代理延伸至現實世界的感知控制,如搜救無人機、倉儲機器人。⑨金融圈名人下場做“數學超級智能”,可用於金融分析Harmonic的故事從一個金融圈明星開始:其聯合創始人Vlad Tenev,就是知名券商Robinhood的聯合創始人與前CEO。這一次,他從金融與演算法交易領域進入AI,引發了資本與媒體的廣泛關注。Harmonic是一家以“人類數學直覺”為起點的AI公司。它並不追求建立更大的模型、堆滿算力,而是重新設計數學推理系統:讓AI像人一樣抽象、驗證、反思,把複雜數學任務拆解成結構化步驟。公司已於2025年完成C輪融資,估值達約14.5億美元。Harmonic的技術路線是建構“數學層”的系統化推理引擎,與傳統大模型平行,而不是取代。他們面向的是科研、量化、工程與高複雜度任務,強調輸出必須可驗證、可審計、邏輯嚴謹。與當前主流AIagent趨勢相比,Harmonic的定位是提供底層高可靠性的“數學思維元件”。⑩OpenAI安全研究員創業“多智能體數字社會”前OpenAI安全研究員Eddie Zhang曾專注於多智能體系統的安全與協作機制研究。他認為未來智能不是一個超級大腦,而是一整個“AI社會”。於是他從最前沿的安全/協作研究中走出來,轉身搭建一個全新的“智能體社會平台”。其創業的公司Isara嘗試讓上千甚至上萬智能體自主分工、協作、達成治理共識,像一個有部門、有責任、有激勵機制的公司。它的AI智能體可以在不確定環境中自動分工、協作、分配“責任/信用”、共同完成諸如財報預測、企業盡調、法律檔案分析等複雜任務。從行業趨勢來看,Isara的產品與當前流行的“單體AI agent自動化”形成對比。它不只是為了替人做事,而是為了模擬“組織結構+社會機制+群體智能”。Neo Lab成為了這個時代的訊號。AI未來的發電機,正從資源密集但可能陷入路徑依賴的巨頭實驗室,重新回到那些手握新範式藍圖、極致專注的頂尖研究者手中。而資本所能做的,就是搶在最早期,給他們足夠的彈藥,去打開那些連巨頭都未曾設想的大門。 (矽基觀察Pro)
這個AI能救命:史丹佛發佈最新AI研究,破解肝臟移植核心難題!
每年數千例肝臟移植因捐贈者死亡時間預測不準而失敗。今天,AI給出了準確解決方案。在肝臟移植領域,器官短缺始終是制約救治效率的核心難題。而「循環死亡後器官捐贈(DCD)」,是補充器官來源的重要途徑。DCD指捐贈者在心跳、呼吸停止(循環死亡)後進行器官捐贈的模式。然而,這個補充器官來源的重要途徑卻長期受困於「無效取得」問題: 醫療機構為潛在捐獻者投入大量人力、裝置與運輸成本,卻因捐獻者未在器官耐受缺血的時間窗內死亡,最終無法獲得可用肝臟。這種資源浪費不僅加重醫療系統負擔,更延誤了終末期肝病患者的治療時機。近期,史丹佛大學聯合美國6個移植中心研發的LightGBM機器學習模型,為破解這個困局提供了新方案。該模型透過精確預測DCD捐贈者的死亡進展,顯著降低了無效獲取率,為肝臟移植領域的資源最佳化與病患救治帶來突破性價值。無效獲取的沉重代價要理解這項突破的價值,需要先理解DCD肝臟移植的特殊性。在循環死亡後器官捐獻過程中,捐獻者停止生命支援後,肝臟因供血中斷開始受損。通常超過30-60分鐘,肝臟就會喪失移植價值。這個時間窗口的嚴格限制,導致了醫療資源的巨大浪費。單次無效取得的經濟損失可達數十萬元,包括移植團隊調配、器官保存裝置偵錯、跨區域運輸等成本。更嚴重的是,這些資源的無效佔用,直接影響其他末期肝病患者的治療機會。更嚴峻的是,傳統決策方式難以規避這一風險:先前臨床主要依賴兩類方法。一是2012年開發的DCD-N評分等老舊工具,其資料樣本量小且未更新,難以適配當前臨床場景;二是外科醫生的經驗判斷,這種方式往往受個體經驗、認知偏差影響。LightGBM模型的精確預測史丹佛團隊開發的LightGBM模型,透過多維度指標整合,實現了死亡時機的精確預測。模型涵蓋了神經功能指標如瞳孔反射、角膜反射,循環與呼吸指標包括收縮壓、心率、血氧濃度,以及基礎臨床資訊如年齡、BMI和死亡機制。【不同時間點與資料集下模型效能對比熱力圖】在演算法選型上,模型選用 「輕量級梯度提升機(LightGBM)」 演算法,其優勢高度契合臨床資料特性:抗缺失性:臨床資料常有部分指標缺失(如緊急情況未檢測某一生化指標),LightGBM可原生處理缺失值,無需人工填充,避免資料失真影響預測;高擬合度:能有效捕捉變數間的非線性關係(如「低瞳孔反射+ 低血壓」的組合對死亡時機的影響),比傳統線性模型(如舊評分表)更適合複雜臨床場景;高效性:在處理高維度資料時運算速度快,可滿足臨床即時決策需求。為避免模型“紙上談兵”,團隊採用三階段流程,基於美國6家中心的2221例DCD捐獻資料開展嚴格測試:訓練階段:利用2022年12月-2023年6月的1616例回顧性資料,讓模型學習「指標組合與死亡時機」 的關聯規律;回顧性驗證:以2023年7月-8月的398例資料“復盤”,驗證模型對歷史案例的預測準確性;前瞻性驗證:在2024年3月-9月的207例即時臨床案例中測試,模擬實際應用場景下的決策效果。【回顧性驗證佇列與前瞻性驗證佇列中的模型效能及基於閾值的權衡關係】三階段驗證均顯示模型性能穩定,為臨床落地奠定基礎。臨床效果與傳統方法相比,LightGBM模型展現出明顯優勢。在預測30分鐘內死亡的精確度方面,模型的AUC值達到0.83,顯著高於DCD-N評分的0.799和科羅拉多州計算器的0.694。在醫師意見分歧較大的複雜案例中,模型精準率達到70%,而醫師判斷的精確率僅為52%。這一資料表明,AI能夠有效輔助解決臨床決策中的爭議情況。同時,該模型具有高靈活性。它能輸出0-100分的連續預測指數,醫療機構可以根據自身需求調整閾值。例如,希望進一步降低無效獲取率的機構可以提高閾值,而希望減少錯過可用器官機率的機構可以降低閾值。深遠意義:肝臟移植生態的最佳化這項技術的價值不僅體現在資料提升上,更在於其對整個肝臟移植生態的最佳化。透過減少無效獲取,醫療機構能夠大幅降低資源浪費,將更多資源投入高機率成功的捐獻案例。對於終末期肝病患者而言,這項進步意味著更多生的希望。與此同時,研究團隊也開發了配套的臨床資料擷取聊天機器人。醫生只要貼上病歷網頁文字,機器人就能自動擷取關鍵指標並轉化為結構化資料,大幅降低了人工錄入成本。透過這項技術,我們可以看到AI在醫療資源最佳化方面的巨大潛力。它不是要取代醫生,而是作為決策輔助工具,整合多維度資料,規避主觀偏差,為醫生提供更客觀的參考。隨著大語言模型技術的發展,未來可望實現即時資料收集、動態預測、決策建議的全流程自動化,進一步提升臨床效率。AI技術賦能醫療,正從理念走向現實,而每一次這樣的進步,都在為生命爭取更多可能。 (算家雲)
奧特曼和納德拉,艱難重組後首次對談:「我們是天作之合!」
【新智元導讀】奧特曼與納德拉在OpenAI重組後首次同台,除了就重組幕後進行闡釋與討論外,兩人押注從App到Agent的範式遷移與Copilot落地,力求在邁向AGI的道路上兼顧效率與公益。坐在鏡頭前,40歲的奧特曼臉上綻放出難以掩飾的微笑——這種笑容通常只在他談起剛出生的兒子時才會出現,但此刻讓他同樣欣喜的是另一個「孩子」:算力。微軟首席執行官薩蒂亞·納德拉打趣說:「每當奧特曼談起他的新生寶寶或者電腦算力時,臉上都會露出笑容。」這一幕發生在一次備受矚目的對談中。奧特曼和納德拉這兩位科技領袖再次同台,慶祝雙方在本周敲定的一項里程碑式協議——一份旨在重塑AI未來的深度合作。誰能想到,六年前一次看似大膽的押注,竟孕育出當今科技業最引人注目的聯盟之一。事情要追溯到2019年。當時的OpenAI還只是個專注於AI研究的非營利組織,急需大量資金和算力來訓練日益龐大的模型。微軟適時拋出橄欖枝:10億美元的投資和Azure雲端運算資源。這在當時是石破天驚的賭注,甚至微軟董事會內部也一度存疑。然而,納德拉慧眼識珠,他從中看到了自然語言處理技術的新曙光,延續著比爾·蓋茲當年對自然語言介面的執念。這筆投資讓OpenAI得以在深度學習方向上放手一搏。正如奧特曼後來所說:「如果沒有薩蒂亞當初的篤定,我們不可能走到今天。」六年後的今天,雙方都笑稱這段合作「沒有指令碼,全憑信念」,卻結出令人驚嘆的碩果。史無前例的結構盈利與公益的雙贏本周宣佈的新協議,標誌著微軟和OpenAI這段獨特關係進入下一個階段。擴展閱讀:奧特曼:OpenAI上市,勢在必得根據協議,OpenAI正式完成了重組:在非營利基金會之下設立OpenAI集團公共利益公司(PBC)作為營利實體。非營利的OpenAI基金會持有價值高達1300億美元的OpenAI股份,一躍成為全球規模最大的慈善基金之一。這一設計旨在解決AI發展中的核心矛盾:既需要商業資本源源不斷地投入來推動技術極限,又要確保最終成果惠及全人類而非少數人。OpenAI基金會宣佈,首批將動用250億美元資金投向兩個領域:醫療健康和AI安全韌性。這筆巨資將用於攻克疾病和診斷難題,以及應對AI發展帶來的社會挑戰(如網路安全、防範AI誤用等)。奧特曼對此充滿熱情。他指出,市場機制並不能自動驅動這些方向的研究投入,但先進AI有潛力加速生命科學突破、提升社會對風險的抵禦力,理應有人去做。他說:「如果我們能用AI發現新藥、治癒疾病,並將這些發現開放給全人類,那將是很了不起的事。」OpenAI這種創新的「雙層架構」提供了一條路徑:上層的公益基金會把控方向和大義,下層的營利公司則可以從資本市場汲取「彈藥」,全速推進AI技術研發和產品落地。連加州總檢察長辦公室在審查後都表示不反對這一架構,可見其開創性。對於微軟而言,這意味著什麼?作為OpenAI最親密的戰略夥伴和最大外部股東,微軟的回報不再只是財務投資的帳面增值。微軟目前持有OpenAI約32.5%的股份(價值約1350億美元)。這樣的持股比例如同繫結了兩家公司的命運。納德拉興奮地表示:自2019年以來,我們與OpenAI一直共享一個願景——讓AI以負責任方式發展,並讓其造福大眾。這段從研究投資起步的關係,如今已成長為業界最成功的合作夥伴關係之一。奧特曼更是直言:「我真心希望薩蒂亞能從這筆投資中賺到一兆美元!」奧特曼半開玩笑地說出這個天文數字,既是對微軟早期支援的感激,也是對OpenAI未來價值的十足信心。雲端獨家Azure成就AI新引擎此次協議還明確了雙方在產品和市場上的分工與默契。根據新約定,OpenAI當前及未來最強大的通用人工智慧(AGI)模型的API,將在未來七年內獨家部署在微軟Azure雲平台上,對外提供算力服務。如果其他大型科技公司(如Google、亞馬遜)想直接獲取OpenAI的頂尖模型能力,只能通過Azure來實現,而不能在自家雲上部署這些模型。這項獨家安排將持續到2032年,除非在此之前OpenAI率先實現了AGI並通過獨立專家委員會驗證。這樣的獨家策略,無疑讓Azure成為AI開發者的「聖地」。過去一年,無數初創公司和大型企業為了使用ChatGPT的強大能力,紛紛把業務部署到Azure上。這直接推動了微軟雲服務業務的騰飛。2025財年第一季度,微軟智能雲部門收入同比大漲27%,其中Azure貢獻突出,增速遠超主要競爭對手AWS和Google雲。更引人注目的是,微軟披露其商用雲業務手握3920億美元的未完成訂單,同比增長51%,平均合同期約兩年。這些訂單中,一大部分正是AI相關的巨額算力合約。其中就包括OpenAI與微軟簽下的2500億美元Azure預購合同。這意味著OpenAI承諾在未來數年內購買天量的Azure雲資源,以確保自己訓練和部署AI模型所需的算力無虞。如此驚人的合同數額甚至引來了華爾街分析師的疑問:一家當前營收規模遠不及此的公司,如何消化數千億的雲服務支出?畢竟有報導稱OpenAI 2023年的收入不過數十億美元量級。然而,微軟CFO艾米·胡德(Amy Hood)對此並不擔心。她在電話會上解釋說,這些大單往往會按階段交付,而且Azure靈活的「彈性叢集」可以服務於任意客戶,「GPU和CPU等硬體只有在合同實際啟動交付時才會上馬」,微軟完全有信心管理好風險。更何況,過去一年OpenAI的業績增長驚人,ChatGPT自2022年11月開放以來僅兩個月就累積1億月活躍使用者,成為史上使用者增長最快的消費級應用。巨大的使用者基礎和付費前景(例如推出每月20美元的訂閱服務)讓OpenAI的營收曲線陡然上揚。據報導,2023年底OpenAI正在二級市場以860億美元估值融資,比年初估值翻了近三倍。這無疑增強了微軟的底氣——胡德直言,若非受限於算力供應,Azure的收入本可以更高。算力爭奪戰從炙手可熱到可能過剩談到算力供應,這對搭檔不約而同流露出既興奮又無奈的神情。當主持人問及增長瓶頸時,奧特曼和納德拉異口同聲地表示:「缺算力,缺到飛起。」奧特曼感嘆道:「我們受算力不足所拖累的程度,外界難以想像。」在過去一年,OpenAI多次不得不限制新使用者的接入速度、裁剪模型上下文長度,這背後都是顯示卡和伺服器產能的約束。納德拉也透露,如果有更多GPU,微軟Azure的雲業務原本可以有更高的增長。這不是誇張。據報導,微軟上季度資本開支高達349億美元,較前一季度猛增40%,其中很大一部分砸向新建資料中心和採購輝達H100等AI晶片。即便如此,遠遠無法滿足激增的需求。胡德無奈地承認:「我們已經連續好幾個季度供不應求,本以為趕得上,結果並沒有——需求仍在不斷攀升。」微軟髮現,瓶頸不光在晶片產能,還在於電力和機架空間這些最傳統的基礎設施。納德拉打了個形象的比方:「我們在打造一個行星等級的雲和AI工廠。」這個「工廠」需要的不只是矽片,還有鋼筋水泥、電網和冷卻系統的全面配套。兩位CEO判斷,未來兩三年內AI算力仍將嚴重緊俏。正如提供晶片的黃仁勳所言,短期出現「算力過剩」的機率幾乎為零。然而,他們也都經歷過網際網路和移動浪潮的周期性起伏,對於長期供需反轉並不掉以輕心。奧特曼甚至大膽設想了一種可能性:假如某天技術突破讓模型效率提高幾個數量級,每個人都能在筆記本上跑出一個個人版「AGI」,那今日對算力不惜血本的軍備競賽將驟然變調——正如20年前網路泡沫破裂時,過度建設的光纖曾一度閒置。但他話鋒一轉,「我們寧願先為未來做好準備,而不是屆時才後悔手慢了。」因此OpenAI寧可在算力上籤下超前的大單,也不願在關鍵時刻捉襟見肘。這種進取心與對風險的冷靜認知,正是微軟與OpenAI搭檔行事的一大特點:前瞻但不冒進,樂觀且不失審慎。軟體範式的巨變從App到Agent硬體層面的風起雲湧,只是AI革命的一部分。奧特曼和納德拉都深知:AI正在重塑軟體的形態和人機互動的範式。ChatGPT橫空出世讓人們初次體驗到,與AI對話可以跳過繁瑣的應用介面,直接獲得所需的答案或方案。這被納德拉稱為UI與AI能力結合的「魔法時刻」。而隨著模型能力不斷增強,這種對話式互動正進化為更強大的Agent。它不僅能回答問題,還能「動手」執行任務,幫你寫程式碼、整理日程,甚至自主呼叫其他軟體完成一整串工作。納德拉去年曾預言,傳統商業軟體(那些「罩在資料庫上方的一層薄殼」)將隨著Agent的興起而逐漸解體。過去企業軟體往往把資料、業務邏輯和介面封裝在一個系統裡,高昂的許可費買的就是這套固定流程。但現在,一個通用Agent就能理解自然語言指令,靈活呼叫各種後台服務來完成使用者的具體需求。這等於是把軟體的「業務邏輯層」替換成了AI。此舉對SaaS行業是顛覆性的,那些功能單一且昂貴的系統,可能被多才多藝的AI助手取而代之。然而,微軟並不擔心自家Office 365等產品會被顛覆。相反,他們主動為Office注入AI「靈魂」,推出Microsoft 365 Copilot,讓Word、Excel、Outlook等應用都增添對話助手,可以根據使用者意圖起草文件、分析表格、總結郵件。每位企業使用者每月願為此支付30美元,這個數目甚至高於Office套件本身的價格,可見其價值之大。發佈僅數月,Copilot的部署勢頭之猛超出微軟歷年任何一款辦公產品。類似地,軟體開發領域的GitHub Copilot也為程式設計師賦能,AI補全程式碼的同時,程式碼產出量暴增,反過來又提升了GitHub託管服務的黏性和價值。由此可見,在納德拉看來,AI並非軟體公司的終結者,而更像是強力催化劑。那些真正高頻剛需的軟體產品(例如Office全家桶)將通過融合AI變得更不可或缺;反之,一些低頻高價、缺乏資料積累的工具型軟體,則面臨被AI重構的風險。這也解釋了為何微軟近一年馬不停蹄地把「Copilot」戰略滲透到旗下幾乎所有產品線,從Office到Windows、從安防到開發工具,就是要在AI時代率先完成自我進化。不過,在消費網際網路領域,AI帶來的變革則更具顛覆性和懸念。搜尋引擎曾是全球最賺錢的業務之一,其商業模式是在億萬次簡短關鍵詞查詢旁顯示廣告,點選率雖低但勝在體量龐大。然而,當使用者開始習慣於向ChatGPT這樣對話式AI提出複雜問題,並直接得到整合結果甚至行動方案,傳統搜尋的流量和廣告曝光無疑會被分流。微軟早早在必應搜尋中整合了ChatGPT,引入聊天和生成式回答,同時嘗試在聊天結果中嵌入廣告和商品連結。但這種新形態能否重塑網際網路的商業規則,目前仍在實驗。納德拉坦言,還需要探索Agent商業模式——或許AI助手可以根據使用者需求直接下單商品或完成服務預訂,平台從中抽取佣金等等。不管怎樣,當人們不再頻繁點開網頁而是向AI提問,廣告和電商生態勢必要隨之遷移。這對Google和微軟這樣的巨頭來說,既是挑戰也是機遇。誰能率先釐清下一代人機互動的盈利模式,誰才能在這場範式轉換中勝出。人機共創的新時代在微軟和OpenAI的合作故事裡,還有一個常被忽略卻深刻的主題:生產力與人的角色。每一次技術革命都會引發關於「機器會取代人嗎」的擔憂,但歷史往往證明,新技術最終讓蛋糕變得更大。納德拉和奧特曼都堅定地相信,AI將開啟一場生產力的大爆發。正如蒸汽機之於體力、電腦之於重複勞動,AI將解放我們的腦力,讓人類專注於更有創造性的工作。微軟自身就是最佳範例:這家擁有22萬員工的科技巨頭,過去一年幾乎零淨增員工數,卻實現了營收兩位數的增長。其中一個原因,正是員工借助內部部署的Copilot大幅提高了工作效率。微軟網路營運團隊負責人最近分享了一件事:由於AI資料中心擴張太快,她的團隊原本需要額外招募上百人才能維持全球數百條光纖線路和裝置的維運,但預算和人才市場都不允許。她靈機一動,帶領團隊開發了一系列Agent來自動處理日常維運指令碼、監控告警響應等工作,硬是靠「AI員工」完成了原本需要幾十人才能完成的任務。這樣的故事每天都在微軟和其他採用先進AI工具的企業上演著。當然,要充分釋放AI提效的紅利,組織和個人都需要經歷一個「流程再造」和學習過程。納德拉將其比作辦公室軟體普及時的一場觀念轉變:還記得幾十年前,人們從手寫傳真轉向用電子表格做財務預測的那陣陣不習慣嗎?如今我們正處在類似的關口:從零開始學著與AI協同工作。員工需要學會如何巧妙地下達指令,如何審校AI產出的內容,如何在人機配合中最大化生產力。這是一種全新的「數字素養」。納德拉預測,經過一兩年的適應,企業將迎來既增收又節支的美好局面:營收因為AI創造的新機遇而持續增長,用人需求卻不像過去那樣線性攀升,現有員工在AI加持下可以覆蓋更多業務。這將體現在宏觀經濟上,就是勞動生產率和GDP增速的提升。有樂觀的經濟學家甚至預言,美國有望在AI時代重現年均4%經濟增長的輝煌。這聽起來近乎天方夜譚,但仔細想想,人類歷史上不也多次出現過類似的「躍升」嗎?重塑美國製造業的AI浪潮這場由AI引領的科技競賽,並非虛無縹緲地發生在「雲端」。它同樣深刻地影響著現實世界的產業格局,尤其是美國久違的再工業化浪潮。美國政府近年頻頻出台政策,與日韓等國達成合作協議,引資數千億美元用於美國本土的高科技製造和基建:包括晶片工廠、新型核能、清潔能源電網等等。這些恰恰是支撐AI時代算力所必需的命脈。微軟在威斯康星州豪擲73億美元興建全球最大的資料中心園區;台積電在亞利桑那州建設先進晶圓廠,輝達作為重要生態夥伴和客戶;初創公司也在德州、北達科他州等地開設液冷資料中心、風能發電廠。可以說,AI需求正在把資本重新吸引回製造業和基建領域,為傳統工業中心注入新活力。納德拉對此深有體會。他指出,一個超大規模資料中心的拔地而起,帶動的是方方面面的就業和投資:從本地建築、鋼鐵、水泥,到長期的維護、電力供應,再到周邊社區的服務業繁榮。這和當年製造業外流、工廠倒閉形成鮮明對比。更重要的是,美國的雲端運算龍頭公司(微軟、Google、亞馬遜)不僅在國內投資,也在全球範圍內輸出先進技術和裝置,幫助各國建設數字基礎設施。這相當於美國在新一代產業革命中牢牢佔據制高點,同時加強了與盟友的科技紐帶。可以預見,在AI驅動的下一波全球產業佈局中,那些擁有強大技術生態和可靠合作夥伴關係的國家,將贏得更多話語權和發展機遇。攜手開創未來從矽谷初創到估值千億美元的行業引領者,OpenAI用了不到十年;從錯失移動網際網路到押中AI飛輪,微軟則在納德拉時代完成了華麗轉身。這兩條軌跡本不相交,卻因為2019年的那次握手緊緊纏繞在一起。在外界看來,奧特曼和納德拉的組合頗有些「亦師亦友」的意味:一位是初生牛犢、不走尋常路的AI狂熱者,另一位是久經沙場、善於商業落地的產業舵手。正是這種互補,讓微軟與OpenAI的合作迸發出驚人的能量。雙方共同開發的ChatGPT引爆了全球AI熱潮,把深度學習從實驗室帶入尋常百姓家;微軟借助OpenAI技術為自家產品注入新生命,使得幾十歲的Office煥發第二春。更難得的是,他們沒有止步於商業成功,而是試圖探索更高遠的目標:在有生之年見證AGI的誕生,並確保它造福全人類。當然,前路並非坦途。如何讓AI安全可控、如何在全球監管尚未統一的環境下快速創新,都考驗著他們的智慧。就連奧特曼本人也承認,實現AGI的技術路徑可能會有出人意料的曲折;納德拉則在推動政府制定聯邦層面的AI法規,以免各州各行其是扼殺創新。可以說,這對搭檔不僅要寫程式碼、裝伺服器,還不得不穿梭於華盛頓和布魯塞爾,參與制定「遊戲規則」。但無論挑戰多大,他們眼中的機會更大——就像奧特曼在直播中所說:「如果明天真的出現了超級人工智慧(ASI),我們依然希望微軟幫助我們把它安全地帶到每個人手中。」曾幾何時,AI領域充滿了軍備競賽般的零和思維,而微軟與OpenAI攜手證明了另一種可能:當理想主義遇上實用主義,當初創的激情聯姻產業的力量,科技創新不僅沒有被冷冰冰的算力競爭磨去溫度,反而迸發出前所未有的生命力。正如一位業界評論者所言,這場合作「既關乎利潤,更關乎人類的福祉」。在波瀾壯闊的AI時代序幕中,微軟和OpenAI用行動寫下了耐人尋味的一章。而這故事的結尾,或許將由我們這一代人共同譜寫。技術的未來終將由人性與遠見來定義。 (新智元)
OpenAI一夜間重組!奧特曼首曝內部時間表:2028年打造出自動化AI研究員!10年內實現超級智能
一夜之間,OpenAI大動作不斷。10月29日凌晨,Sam Altman 和 OpenAI 首席科學家 Jakub Pachocki共同出席了一場罕見的路線圖直播,並在直播中表示,通過持續擴展深度學習,人類將在不到十年內實現超級智能。此外他們還透露,OpenAI 內部正在朝著 2026 年 9 月實現“實習級 AI 研究助理”的目標前進,並計畫在2028 年打造出一名完全自動化的“真正的 AI 研究員”。這一野心勃勃的時間表,也恰逢OpenAI 正式完成組織結構轉型,從非營利機構轉變為“公益型公司”(Public Benefit Corporation, PBC)。這意味著 OpenAI 擺脫了非營利章程所帶來的限制,同時為其引入更多資本創造了條件。下面小編就給大家捋捋時間線,看看OpenAI究竟圍繞這個野心勃勃的目標做了那些舉動。OpenAI從非營利到公益型公司(PBC)10月28日晚,OpenAI宣佈完成資本重組,並簡化了公司結構。具體來說,OpenAI重組後,非營利主體(即原本的OpenAI Nonprofit)改名為OpenAI Foundation,繼續掌控營利實體的26%股份,目前估值約1300億美元。拿到期權的員工們和投資者則持有47%的股份。這也使得該基金會成為歷史上資源最為充足的慈善組織之一。此外,微軟也與OpenAI同步簽署新一輪長期合作協議,確認支援上述重組。同時,OpenAI已同意額外購買價值2500萬美元的微軟Azure雲服務。OpenAI 的使命「確保通用人工智慧(AGI)造福全人類」,將通過營利性機構和基金會共同推進。OpenAI 作為公司越成功,非營利機構的股權價值就越高,並利用這些股權資金支援其慈善工作。官方承諾,OpenAI Foundation會先在兩大領域上投入250億美元:健康和治癒疾病OpenAI Foundation會資助加速健康突破的工作,使每個人都能從更快的診斷、更好的治療和治癒中受益。初步計畫包括投資開源、負責任的前沿健康資料集,以及為科學家提供資金等。針對AI彈性的技術解決方案正如網際網路需要全面的網路安全生態系統,現在人工智慧也需要與之對應的AI彈性層。OpenAI Foundation也會加強在這方面的投資。以上目標,都建立在5000萬美元的“以人為本人工智慧基金”,以及非營利委員會的建議之上。10年內實現超級智能2028 年實現完全自動化 AI 研究員緊接著,在台北時間10月29日凌晨,Sam Altman 和 OpenAI 首席科學家 Jakub Pachocki 一起做了一場罕見的路線圖直播。這場直播中,OpenAI 對深度學習的未來充滿信心。他們認為,通過持續擴展深度學習,人類將在不到十年內實現超級智能。Jakub表示:“我們認為,在不到十年的時間裡,深度學習系統可能就會超越人類智能,達到超級智能(superintelligence)水平。”他們還公開了一張內部時間表:2026 年 9 月前,AI 研究實習生上線2028 年 3 月前,實現完全自動化的研究人員這個“AI研究員”並非研究人工智慧的人類,而是“一個能夠自主完成大型研究項目的系統”。所謂超級智能,指的是在眾多關鍵領域上整體智力水平超過人類的系統。同時,他們還提出了配合這一目標的全套工程路徑:基礎設施層,Altman 提出每周 1 吉瓦的算力工廠;安全機制上,Jakub 公佈價值對齊的五層結構;產品層,ChatGPT 要從對話工具進化為“AI 平台”;組織層,OpenAI 完成改組,新架構背後,是 250 億美元的新任務和微軟 1350 億美元的繫結。雖然OpenAI這次沒有發佈新模型,但可以看出其有更大的野心。Altman 說:“我們不只再靠發佈新模型來推動未來,而是要讓世界基於平台創造更多東西。”另外,小編還盤了盤直播中的其他重點資訊:1.OpenAI 正在開發個人 AGI(明年可能會推出 AI 硬體裝置)。2.OpenAI認為,深度學習可能在不到十年內將人類帶入超級智能時代。3.時間線展望:計畫在2026 年 9 月前,讓 AI 達到實習生等級的研究助理能力;到 2028 年 3 月,誕生一個真正能完成獨立科研項目的 AI 研究人員;到了 2030年代,對世界的影響將無法預測。他們對實現這一時間線抱著極其樂觀的態度,Sam表示:“未來很可能是非常光明的。”4.目前,OpenAI在資料中心上的投資已達約1.4兆美元,並計畫每周建造一座 1GW 的算力工廠——因此,之前sam提出的7兆美元晶片計畫似乎不再是遙不可及。5.OpenAI 的內部模型目前尚未遠超已發佈的版本,但他們對在2026年9月前實現重大飛躍非常樂觀,到2026年9月,我們極有可能見證模型質量的巨大飛躍。此外,預計未來數月乃至數年內還會有重大進展。6.模型的使用成本已平均下降了40倍,並且預計這一趨勢將持續下去(約每年下降40倍)。7.關於 AGI:“AGI 何時能實現?” Jakub 和 Sam 回答:這將是一個持續數年的過程,而我們正身處其中。但 Sam 特別指出了2028年這個節點,屆時科學研究將完全由 AI 自動化,AI 系統將能夠推動科學前沿的發展,這將是 AI 留給世界的遺產。8.未來幾年,人類勞動的自動化程度將顯著提高,我們可能面臨大規模失業。9.關於 GPT-6:沒有具體發佈日期,但他們希望未來能更頻繁地更新模型,模型能力在不到6個月內就會有巨大飛躍。微軟 & OpenAI 開啟新一輪合作OpenAI為了實現這一野心勃勃的目標,需要大量的合作夥伴。直播中Sam 提及了AMD、Broadcom、Google、微軟(Microsoft)、輝達(NVIDIA)、甲骨文(Oracle)、軟銀(Softbank)等眾多晶片、資料中心、能源和製造領域的合作夥伴。微軟和OpenAI的關係也值得盤一盤。最初,微軟之於 OpenAI 是對一個研究組織的投資,這一合作關係已經發展成為行業中最成功的夥伴關係之一。在這個節骨眼上,雙方也簽署了一項新協議。微軟支援 OpenAI 董事會成立公益型公司(Public Benefit Corporation, PBC)並進行資本重組(recapitalization)。在重組完成後,微軟持有的 OpenAI Group PBC 投資價值約為 1350 億美元,相當於約 27% 的股權(按轉換稀釋計算),其中包括所有持有者——員工、投資者和 OpenAI 基金會。如果不考慮 OpenAI 最近的融資輪次,微軟此前在 OpenAI 盈利實體中的持股比例為 32.5%(按轉換基準)。協議保留了雙方成功合作的關鍵要素:OpenAI 仍是微軟的前沿模型(frontier model)合作夥伴。微軟繼續擁有專屬智慧財產權(IP)權利和 Azure API 獨佔權,直至人工通用智能(AGI)出現。同時,協議還更新和新增了一些條款,以便雙方在保持合作的同時能獨立推動創新與增長。其中包括:一旦 OpenAI 宣佈 AGI 到來,該聲明將由一個獨立的專家小組進行驗證。微軟對模型和產品的 IP 權利延續至 2032 年,包括實現 AGI 後的模型,同時設有適當的安全防護措施。微軟對研究的智慧財產權(定義為用於開發模型和系統的保密方法)將繼續有效,直到專家小組驗證 AGI 到來或者直到 2030 年,以先到者為準。研究智慧財產權包括僅用於內部部署或研究的模型。此外,研究智慧財產權不包括模型架構、模型權重、推理程式碼、微調程式碼以及與資料中心硬體和軟體相關的任何智慧財產權。微軟的智慧財產權現在不包括 OpenAI 的消費硬體。OpenAI 現在可以與第三方共同開發一些產品。與第三方共同開發的 API 產品將獨佔 Azure 平台。非 API 產品可以在任何雲服務提供商上使用。微軟現在可以獨立追求 AGI,單獨或與第三方合作。如果微軟在 AGI 宣佈之前使用 OpenAI 的智慧財產權來開發 AGI,模型將受到計算閾值的限制;這些閾值遠大於當前用於訓練領先模型的系統規模。收入分成協議保持不變,直到專家小組驗證 AGI 的到來,但支付將分期進行。OpenAI 已簽約購買額外價值 2500 億美元的 Azure 服務,微軟將不再擁有 OpenAI 作為計算提供商的優先購買權。OpenAI 現在可以向美國政府的國家安全客戶提供 API 訪問,無論雲服務提供商是誰。OpenAI 現在能夠發佈符合必要能力標準的開放權重模型。進入合作的新篇章後,微軟與 OpenAI 均處於前所未有的有利位置。受此消息提振,微軟周二股價上漲近 2%。總的來說,OpenAI 正以空前的速度邁向一個大膽的目標:在未來三年內打造“AI 實習研究助理”,五年內孕育“真正的 AI 研究員”,並在十年內,迎接人類歷史上第一個超級智能系統的到來。當 AI 真正具備科研能力、能夠自主推動科學前沿時,人類可能將迎來一個前所未有的時代。你認為,AI 真的會在 2028 年成為“科研同事”嗎?歡迎在評論區聊聊你的看法。參考連結:https://openai.com/index/built-to-benefit-everyone/https://blogs.microsoft.com/blog/2025/10/28/the-next-chapter-of-the-microsoft-openai-partnership/https://x.com/OpenAI/status/1983157159853777086https://techcrunch.com/2025/10/28/sam-altman-says-openai-will-have-a-legitimate-ai-researcher-by-2028/ (51CTO技術堆疊)
OpenAI公開未來路線圖!具體到28年3月AI研究員將完全自主,奧特曼承認“關於GPT-4o我們搞砸了”
OpenAI完成史上最重要的一次組織架構調整後,緊接著開了一場直播。首次公開了內部研究目標的具體時間表,其中最引人注目的是“在2028年3月實現完全自主的AI研究員”,具體到月份。這次發佈會資訊密度非常大,連奧特曼自己都說:“鑑於這些內容的重要性,我們將以不同尋常的透明度分享我們的具體研究目標、基礎設施計畫和產品戰略。”難道重組後的OpenAI,真的重新Open了?不過也有一些事故,本來OpenAI發帖徵集大家的問題,結果抱怨GPT-4o對敏感對話強制路由機制的人太多,兩人支支吾吾面面相覷了一陣。奧特曼最終還是承認“這次我們搞砸了”。我們的目標是在保護脆弱使用者的同時給成人使用者更多自由。我們有義務保護未成年使用者,保護那些不在合理心態下的成人使用者。隨著年齡驗證的建立,我們將能夠更好地做出平衡。這不是我們最好的工作,但我們會改進。2028年讓AI自己做研究,OpenAI給出明確時間表直播一開始,奧特曼就承認自己的錯誤。過去,我們把AGI想像成”天上的神諭”,超級智能會自動為人類創造美好的事物。但現在我們意識到,真正重要的是創造工具,讓人們用這些工具創造自己的未來。這種思維轉變並非偶然,人類歷史上每一次技術革命都源於更好的工具,從石器到蒸汽機,從電腦到網際網路。OpenAI相信,AI將是下一個改變文明處理程序的工具,而他們的使命是讓這個工具儘可能強大、易用且普惠。接下來,首席科學家Jakub Pachocki公開了一份OpenAI內部的目標和路線圖。2026年9月,AI研究實習生等級。能夠通過大量計算顯著加速研究人員工作2028年3月,完全自動化的AI研究員,能夠自主完成大型研究項目在介紹研究進展時他特別強調,OpenAI相信深度學習系統距離超級智能“可能不到十年”,這裡超級智能指的是在大量關鍵領域都比人類更聰明的系統。他們對AI能力進展的量化方式是看模型能完成的任務所需的時間跨度,從最初的幾秒鐘任務,到現在的五小時任務(比如在國際數學和資訊學競賽中擊敗頂尖選手),這個時間跨度正在快速延長。想想模型目前在問題上花費的思考時間,再想想你願意在真正重要的科學突破上花費多少時間,讓模型使用整個資料中心的計算資源來思考都是可以接受的,這裡有巨大的提升空間。Pachocki還詳細介紹了一項名為“思維鏈忠實度”(Chain of Thought Faithfulness)的新技術。簡單來說,就是在訓練時故意不去監督模型的內部推理過程,讓它保持對實際想法的忠實表達。我們不引導模型思考“好的想法”,而是讓它保持對實際想法的忠實。在五層AI安全架構中,思維鏈忠實度瞄準最頂層的價值對齊。AI真正關心什麼?它能否遵守高層次的原則?面對不明確或衝突的目標時會怎麼做?它是否缺乏人性?這個問題之所以重要,是因為:當系統進行長時間思考時,我們無法為每一步都提供詳細指令當AI變得非常聰明時,可能面對人類無法完全理解的問題當AI處理超出人類能力的問題時,完整的規範變得困難甚至不可能在這些情況下必須依賴更深層的對齊,人們無法為每個細節編寫規則,必須依賴AI內在的價值觀。傳統方法在訓練期間查看並指導模型的思維過程,實際上是在教它說我們想聽的話,而不是保持對它真實思考過程的忠實。目前,這種方法已經在OpenAI內部廣泛使用,用於理解模型如何訓練、傾向如何演變。以及與外部合作研究,通過查看未受監督的思維鏈,能夠檢測到潛在的欺騙行為。不過讓AI的價值觀不與監控對抗還只是成功的一半。理想情況下還希望AI的價值觀實際上能夠幫助監控模型,這是OpenAI下一步正在大力研究的內容。新架構亮相:非營利基金會掌控一切備受關注的OpenAI重組方案終於揭曉,與原方案相比出人意料地簡潔。舊的架構包括多個相互關聯的複雜實體:新架構只剩兩層:核心是OpenAI基金會(OpenAI Foundation),這個非營利組織將完全控制下屬的公益公司OpenAI Group。基金會初始將持有公益公司約26%的股權,但如果業績優異,這個比例可以通過認股權證增加。Sam Altman希望OpenAI基金會成為史上最大的非營利組織,首個重大承諾是投入250億美元用於AI輔助疾病治療研究。除了醫療研究,基金會還將重點投入一個全新的領域——AI Resilience。OpenAI聯合創始人Wojciech Zaremba特別介紹了這個概念,它比傳統的AI安全範圍更廣。舉例來說,即使OpenAI能阻止模型用於危險用途,但如果有人使用其他模型搞事,整個社會仍需要在問題發生時有快速響應機制。Zaremba認為這就像網際網路早期的網路安全,當時人們都不敢在網上輸入信用卡號,遇到病毒還要互相打電話提醒斷網。但現在有了完整的網路安全產業鏈,人們才敢把最私密的資料和畢生積蓄放在網上。在基礎設施方面,OpenAI首次公開了他們的投資規模:目前已承諾的基礎設施建設總計超過30GW(吉瓦),總財務義務約1.4兆美元。奧特曼還透露了一個長期目標:建立一個基礎設施工廠,每周能夠創造1GW的算力,並希望將每吉瓦的成本在五年生命周期內降至200億美元左右。為了實現這個目標,OpenAI考慮投入機器人技術,用來幫助建設資料中心。為了讓大家理解這個規模,OpenAI重點介紹了他們在德克薩斯州阿比林建設的首個星際之門資料中心,在多個地點建設中,這是進展最快的。這個工地每天有數千人在施工,整個供應鏈涉及數十萬甚至上百萬人,從晶片設計、製造到組裝,再到能源供應。問答環節同樣精彩Q1:技術變得令人上癮,然而Sora模仿TikTok,ChatGPT可能會加入廣告,為什麼重複同樣的模式?奧特曼:請根據我們的行動來判斷我們。如果Sora變成讓人刷的上癮而不是被用來創作,我們會取消這個產品。我們希望不會犯前人的錯誤,但可能會犯新錯誤,需要快速演進和緊密的反饋循環。Q2:AI導致的大規模失業何時會發生?Pachocki:很多工作將在未來幾年自動化,什麼工作將取代這些工作?什麼樣的新追求值得所有人參與?”我認為會有幾個方面:能夠理解更多關於世界的東西,令人難以置信的各種新知識、新娛樂、新智能,將為人們提供相當多的意義和成就感。Q3:內部模型比公開部署的模型領先多少?Pachocki對下一代模型有很強的期望,預計未來幾個月和一年會有快速進展,但沒有隱瞞什麼極其瘋狂的東西。奧特曼補充說他們開發了很多元件,當把它們組合在一起時,才會有令人印象深刻的成果。今天我們只是有很多這樣的元件,不是坐擁未向世界展示的巨大成果,但預計一年後有機會實現AI能力的巨大飛躍。Q4:OpenAI如何能為免費版本使用者提供這麼多功能?Jakub首先從技術角度解釋了這個現象:當OpenAI開發出新一代模型(比如GPT-5)時,它代表了智能的新前沿,也就是目前AI能達到的最高水平。達到這個前沿後,很快就能找到更便宜的方法來複製這種能力。奧特曼從商業角度補充了這個討論:過去幾年,特定單位智能的價格每年下降約40倍。這裡出現了一個看似矛盾的情況,為什麼仍需要大量基礎設施?他們AI越便宜,人們越想使用,最終總的成本預計只會增加。OpenAI在此做出承諾,只要商業模式依然有效,就致力於繼續將我們能做到的最好技術放入免費層。Q5:ChatGPT是OpenAI的終極產品嗎?還是通往更偉大事物的前身?Pachocki解釋作為研究實驗室,最初並沒有打算建構聊天機器人。但他們現在已經認識到這個產品與整體使命的一致性,ChatGPT讓每個人都能使用強大的AI,不需要程式設計知識,不需要技術背景。奧特曼認為聊天介面是一個很好的介面,但不會是唯一的介面,人們使用這些系統的方式將隨時間發生巨大變化。對於五分鐘以下的任務,聊天介面表現很好,可以來回提問,逐步完善直到滿意。但對於五小時的任務就需要更豐富的介面,那五年或五個世紀的任務呢?這幾乎超出了我們的想像。奧特曼隨後描繪了他心目中最重要的演進方向:一個環境感知的、總是存在的夥伴,觀察你生活並在你需要時主動幫助你的服務。視訊回放:https://openai.com/live/?video=1131297184 (量子位)
OpenAI公佈超級智能路線圖:模型明年有望重大飛躍,2028年實現全自動AI研究員,基建投資承諾1.4兆
OpenAI設定兩個關鍵節點:2026年9月實現AI研究實習生,能夠通過消耗大量計算資源有效加速內部研究;2028年AI研究員可自主完成大型研究項目。Altman指出,到2028年科學研究將完全由AI自動化,AI系統將能夠推動科學前沿發展。截至目前OpenAI已承諾建設總計超過30GW基礎設施,對應未來數年內總計約1.4兆美元投資。Altman強調,1.4兆美元只是起點,正討論更宏大願景。預計未來六個月內模型能力將有巨大飛躍。美東時間28日周二,OpenAI宣佈公司重組完成後,CEO Sam Altman和首席科學家Jakub Pachocki通過一小時直播首次公開了實現超級智能的具體時間表。公司已承諾在資料中心基礎設施上投入約1.4兆美元,對應約30吉瓦的算力容量,並計畫建立每周新增1吉瓦算力的"基礎設施工廠"。Jakub Pachocki在直播中表示,深度學習可能在不到十年內將人類帶入超級智能時代。OpenAI設定了兩個關鍵節點:2026年9月實現AI研究實習生,能夠通過消耗大量計算資源有效加速內部研究;2028年3月實現全自動AI研究員,可自主完成大型研究項目。Sam Altman強調,為支撐這一時間表,OpenAI正從AI助手轉型為平台服務商,目標是讓外部開發者在其平台上創造的價值超過OpenAI自身創造的價值。他表示,公司最終需要達到數千億美元年收入以支撐基建投資,企業服務和消費者業務都將是重要收入來源,IPO是最可能的融資路徑。OpenAI 的內部模型目前尚未遠超已發佈的版本,但對在2026年9月前實現重大飛躍非常樂觀。預計到2026年9月,極有可能見證模型質量的巨大飛躍。此外,預計未來數月乃至數年內還會有重大進展。OpenAI並未給出發佈GPT-6的具體時間表,但表示產品發佈的節奏將不再與研究計畫嚴格繫結。例如 GPT-5 首次將推理模型作為旗艦產品推出,這本身就是一個重大的整合性工作。但可以確定,未來六個月內、甚至更早,模型能力將有巨大飛躍。此次直播圍繞研究、產品和基礎設施三大支柱展開,披露了OpenAI對AGI發展路徑、安全框架和商業模式的最新思考。公司同時公佈了新的組織架構,由非營利性質的OpenAI基金會控制公共利益公司OpenAI集團,前者初期持有後者約26%股權。超級智能時間表:從研究實習生到全自動研究員Jakub Pachocki詳細闡述了OpenAI的研究路線圖,核心聚焦於深度學習的規模化訓練。他指出,AGI這個詞可能低估了技術進步的潛在規模,OpenAI內部相信距離實現超級智能——在眾多關鍵維度上超越所有人類的系統——可能已不足十年。OpenAI使用"任務時間跨度"來衡量模型能力進展,即模型完成任務所需時間與人類專家的對比。當前一代模型的水平約為5小時,可從其在國際數學或資訊學奧林匹克競賽中與頂尖選手相媲美的表現看出。Jakub表示,這個時間跨度將繼續快速延伸,不僅源於演算法創新,也來自"上下文計算"或"測試時計算"等新維度的規模化。基於這些預期,OpenAI設定了明確的內部目標。2026年9月前,開發出能力足夠強的AI研究實習生,能夠通過消耗大量計算資源有意義地加速內部研究人員工作。更長遠的目標是在2028年3月前,開發出能夠自主完成大型研究項目的全自動AI研究員。Jakub強調,整個研究計畫圍繞一個核心展開:加速科學發現和新技術發展,這將從根本上改變人類技術進步的速度。Sam Altman在問答環節中補充,AGI的到來將是一個持續數年的過渡過程,而非單一時間點。他特別指出2028年這個節點,屆時科學研究將完全由AI自動化,AI系統將能夠推動科學前沿發展。關於內部模型進展,他表示並未雪藏某個極其強大的模型,但有許多已開發的技術元件,當這些元件組合在一起時將帶來巨大能力飛躍,預計未來六個月內模型能力將有顯著提升。五層安全框架:從價值對齊到系統性保障隨著系統能力向超級智能邁進,Jakub Pachocki提出了一個將安全問題結構化的五層框架,從模型最核心的內部因素延伸到最外部的系統保障。最核心的是價值對齊,關乎AI最根本"關心"的是什麼。Jakub解釋,當系統變得極其聰明、思考時間極長、處理的問題超越人類能力極限時,給出完全無懈可擊的指令會變得異常困難,因此必須依賴更深層次的對齊。第二層是目標對齊,關注AI如何與人互動以及遵循指令的表現。第三層是可靠性,即AI能否精準校準預測、在簡單任務上保持可靠並在困難任務上表達不確定性。第四層是對抗性魯棒性,側重於AI能否抵禦來自人類或其他AI對手的蓄意攻擊。最外層是系統性安全,包括系統安全性、AI可訪問的資料範圍、可使用的裝置等外部限制。Jakub特別介紹了一項名為"思維鏈忠實度"的研究方向。這項可解釋性技術的核心思想是,在訓練過程中刻意讓模型內部推理的某些部分不受監督,從而讓這部分推理過程能夠更忠實地反映模型真實所思所想。他表示,經驗性結果非常理想,OpenAI內部大量使用該技術來理解模型訓練過程中的演變,並與外部合作者成功用它研究模型的欺騙傾向。這項技術具有可擴展性,但也很脆弱,要求在演算法和產品設計中劃定清晰界限。例如,ChatGPT中對思維鏈進行總結的功能,就是為了避免將完整思維鏈直接暴露給使用者。Jakub解釋,如果思維鏈完全可見,它就會成為使用者體驗的一部分,久而久之就很難再對其保持無監督狀態。基建擴張計畫:向兆美元級算力投資邁進Altman以前所未有的透明度公開了OpenAI的基礎設施建設計畫。Altman周二表示,截至目前OpenAI已承諾建設總計超過30吉瓦(GW)的基礎設施,對應未來數年內總計約1.4兆美元投資。這些承諾基於OpenAI目前對收入增長和融資能力的評估。這一投資涉及眾多合作夥伴,包括AMD、博通、Google、微軟、輝達、甲骨文、軟銀等晶片、資料中心、能源和製造領域的公司。Altman強調,1.4兆美元只是起點,OpenAI正在積極討論更宏大的願景。Altman表示,OpenAI的願景是建立一個基礎設施工廠,能夠以每周1GW的速度創造算力,同時將成本大幅降低,目標是在裝置的5年生命周期內,將每GW成本降至約200億美元。他承認,實現這一願景需要海量創新、更深入的合作、巨大的收入增長,甚至需要重新調整OpenAI在機器人領域的思路,讓機器人幫助建設資料中心。Altman在問答環節中指出,要支撐1.4兆美元的投資,公司年收入最終需要達到數千億美元,"我們正處在通往這一目標的陡峭增長曲線上"。他預計企業服務將是重要收入驅動力,但也看到了從消費者獲取收入的方式,不僅限於月度付費訂閱,還包括新產品和裝置等。關於IPO計畫,Altman表示,考慮到公司巨大的資本需求和規模,IPO是最可能的路徑,但目前沒有具體計畫或時間表。"考慮到我們的資本需求以及公司規模,可以說這對我們而言是最可能的路徑,"他說。平台化轉型:從超級助手到AI雲生態Sam Altman闡述了OpenAI在產品層面的戰略演進。他表示,過去OpenAI的產品形態主要是以ChatGPT為代表的AI超級助手,現在正朝著更宏大的目標演進——成為一個平台,一個其他人可以在其上建構應用和服務的"AI雲"。Altman引用比爾·蓋茲的觀點定義平台成功:當其他人基於平台創造的價值超過平台建構者自身創造的價值時,平台就成功了。這正是OpenAI明年的目標。他表示,憑藉現有的技術、使用者基礎和框架,OpenAI能夠推動全世界在其平台上建立出驚人的新公司、服務和應用。為實現平台化轉型,Altman強調了兩個基礎原則。首先是使用者自由,如果OpenAI要成為供全世界不同人群使用的平台,就必須承認人們有截然不同的需求。雖然會有一些寬泛的邊界,但OpenAI希望使用者在使用AI時擁有大量控制權和定製化能力。他多次重申"像對待成年人一樣對待成年使用者"的原則,承諾隨著年齡驗證等機制完善,將給予成年使用者更大的自由度,尤其在創作等領域會大幅放寬限制。其次是隱私保護。Altman指出,隨著AI成為基礎平台,人們與AI的互動方式非常私密,會像對醫生、律師或配偶一樣與之交談,分享生活中最隱秘的細節,因此需要以不同於以往技術的方式思考隱私問題。在產品規劃上,OpenAI描繪了一個層級架構:底層是晶片、機架、資料中心和能源等硬體基礎;中間層在硬體之上訓練模型並建構帳戶體系;應用層推出了名為Atlas的瀏覽器,並計畫未來幾年推出硬體裝置;最令人興奮的是頂層的生態系統,人們將利用OpenAI的API、ChatGPT內的應用、企業平台和帳戶建構服務。新公司架構與基金會使命為支援上述計畫並確保服務於核心使命,OpenAI對公司架構進行了重大調整。新架構由兩部分組成:頂端是非營利性質的OpenAI基金會,擁有對公司的最終控制權,董事會隸屬於基金會;基金會之下是公共利益公司OpenAI集團。基金會將掌控OpenAI集團,初期持有其約26%股權,如果公司表現出色這一比例未來還可能增加。Altman表示,基金會的目標是成為有史以來最大的非營利組織,利用其資源追求AI帶來的最大化社會福祉。OpenAI集團將更像普通公司一樣運作,以便吸引研究所需的龐大資源,但依然受到與基金會相同的使命約束,尤其在安全問題上必須以使命為唯一準則。基金會公佈了兩個初步重點方向。首先是投入250億美元利用AI幫助治癒疾病,資金將用於生成資料、提供計算資源、資助科學家等。其次是AI韌性,這是一個比傳統AI安全更廣泛的概念。聯合創始人Wojciech Zaremba解釋,先進AI的到來必然伴隨風險和顛覆,AI韌性的目標是建立一個由眾多組織構成的生態系統共同解決這些問題。他用網路安全行業發展類比:網際網路早期人們不敢線上輸入信用卡號,而現在龐大的網路安全產業保護著關鍵基礎設施,使人們願意將最私密資料放線上上。同樣,AI領域也需要一個"AI韌性層",OpenAI基金會將幫助催生這樣一個生態系統。以生物風險為例,韌性不僅包括在模型層面阻止病毒學相關查詢,還包括建立快速響應機制,以便在問題發生時有效應對。 (invest wallstreet)
Transformer 之父「叛逃」:我已經受夠Transformer了!警告:AI研究變得越來越窄,我們需要找到新的架構
「我真的受夠了Transformer。」——這句話來自Transformer 的共同作者、Sakana AI 聯合創始人Llion Jones。在舊金山TED AI 大會上,這位被譽為“生成式AI 時代奠基人”的研究者,突然“開砲”——不僅公開批評了整個AI 行業的研究方向,還宣佈自己已經“離開Transformer”,開始尋找下一次重大突破。要知道,Transformer 正是ChatGPT、Claude、Gemini、Llama 等幾乎所有主流大模型的核心技術。而如今,它的發明人之一卻親口說:“我不幹了。”“AI 研究正在變得越來越窄”Llion Jones 是2017 年那篇改變AI 歷史的論文《Attention Is All You Need》的作者之一,也是「Transformer」這個詞的命名者。這篇論文被引用超過 10 萬次,堪稱電腦科學領域的「聖經級」成果。但在TED AI 的演講上,Jones 卻直言:“儘管現在AI 領域投入了前所未有的資金和人才,研究卻變得越來越狹窄。”他認為,這種局面不是偶然,而是被資本和競爭壓力擠壓出來的結果——投資者要求回報,研究員害怕“被抄”,於是大家都選擇安全、可發表的項目,而不是去探索真正未知的方向。結果呢?“AI 研究陷入了'剝洋蔥'式的自我複制。大家都在圍著同一個框架打轉——換個超參、堆點資料、再發一篇論文。”“我們可能又在錯過下一個突破”Jones 提出了一個形象的比喻-AI 演算法有個經典的平衡:「探索vs 利用」(exploration vs exploitation)。如果一個系統只是一味利用已有成果,而不去探索新方向,它就會陷入“局部最優”,錯過真正更好的解法。「AI 領域現在就是這樣。」Jones 說。“我們太沉迷於Transformer 的成功,以至於忘了往外看。也許下一個革命性架構,就在不遠處。”Transformer 誕生於“沒有KPI 的自由”Jones 回憶起當年在Google發明Transformer 的經歷時,語氣明顯柔和了。“那是一個非常自由、非常自然的過程——我們沒有明確的項目要求,也沒有指標壓力。只是午飯時聊出來的點子,隨手在白板上寫寫畫畫。”沒有OKR、沒有deadline,也沒有資本的緊逼。正是這種“無壓力的研究環境”,讓Transformer 這場技術革命得以誕生。而現今的AI 公司,Jones 說,即使給研究員上百萬年薪,也無法給他們真正的自由。“他們一上班就感到必須'證明自己',於是繼續追逐低風險、能發論文的方向。”Sakana AI:離開Transformer 的實驗室作為Sakana AI 的CTO,Jones 現在正嘗試「重建」那種原始的自由:以自然啟發為靈感的研究方向,極少的成果壓力,也不強迫研究者為了論文或競爭對手而忙碌。他引用工程師Brian Cheung 的一句話作為研究準則:“你應該只去做那些,如果不是你,這個世界上就不會有人去做的研究。”這家總部位於東京的AI 實驗室正在研究一種名為 「連續思考機」(Continuous Thought Machine) 的新架構——靈感來自神經同步的自然現象,它將大腦式的同步機制引入神經網絡中。一位提出這個想法的員工告訴Jones,在他以前的公司或學術機構,類似的想法會被認為是「浪費時間」。但在Sakana,Jones 給了他一周自由探索的時間——結果,這個項目最終成功入選頂級AI 學術會議 NeurIPS 的展示。Jones 甚至提出,自由比高薪更能吸引人才。“這是吸引人才的極好方式,”他這樣評價這種“探索型”研究環境,“想一想,那些聰明、有野心、真正熱愛探索的人,自然會主動尋找這樣的地方。”“這不是競爭,而是探索”最後,Jones 呼籲整個行業:“我們不是在競爭,而是在共同探索。如果大家都能多一點分享、多一點冒險,我們也許能更快走向下一個重大突破。”業界越來越多證據表明,單純擴大Transformer 模型規模 已接近極限。許多頂級研究者開始討論:或許新的架構創新,而非參數堆疊,才是邁向更強AI 的關鍵。但他也警告,這個突破可能永遠不會出現——除非我們打破現有的激勵機制:金錢、競賽、論文、排名……這些正讓研究者遠離真正的探索。作為Transformer 的共同創作者,Jones 對這個限制的洞察極具份量。他選擇“告別自己的發明”,也讓他的觀點更有說服力。“也許下一個Transformer 級的突破,就在拐角處。但也可能被忽視——因為我們都忙著改進一個我已經'厭倦'的架構。”畢竟,他是少數真正理解Transformer 從誕生到極限的人之一。如果連他都覺得該向前走——那也許真是時候了。Transformer 八位作者的去向2017 年那篇改變AI 處理程序的論文《Attention Is All You Need》,有8 位作者。八年後,他們已各自踏上完全不同的航線——Ashish Vaswani 創立了Essential AI;Noam Shazeer 離開Google創辦Character.AI,又重回Gemini 項目;Aidan Gomez 在Cohere 帶領團隊探索企業級LLM; Jakob Uszkoreit轉向生物科技AI,創辦Inceptive;繼續推動推理模型發展;Illia Polosukhin 則投身區塊鏈領域,打造NEAR Protocol;而Niki Parmar 仍保持低調,鮮少公開露面。從科學研究到創業、從語言模型到生物智能,他們幾乎代表了AI 產業的所有分支方向。這一幕像極了Transformer 自身的命運:從單一架構出發,衍生出無數變體與未來。當年那群年輕研究者改變了人工智慧的軌跡;如今,他們又在各自的探索中,追尋下一個「Attention is all you need」時刻。參考連結:https://venturebeat.com/ai/sakana-ais-cto-says-hes-absolutely-sick-of-transformers-the-tech-that-powers (51CTO技術堆疊)
清華物理傳奇Yao Shunyu,跳槽GoogleDeepMind!
【新智元導讀】清華物理系傳奇特獎得主姚順宇離職Anthropic,正式加盟GoogleDeepMind!他在Anthropic僅工作一年,離職原因中約40%與公司「價值觀」不合。他指出現階段AI研究如同17世紀熱力學探索:雖缺乏完整理論,卻充滿規律發現的契機。清華物理系傳奇特獎得主Yao Shunyu(姚順宇),官宣離職Anthropic,正式加盟GoogleDeepMind!從領英的履歷來看,他在2024畢業到加州伯克利做了幾個月博士後,2024年10月加入了Anthropic。滿打滿算,姚順宇在Anthropic只待了一年。此次離職,姚順宇在他的個人部落格(文末有全文)聲明了兩點原因,其中幾乎一半(40%)原因是因為Anthropic「價值觀」問題!眾所周知,Anthropic此前在2025年9月4日的博文裡把中國列為「adversarial nations」。此舉激起了AI領域國內外眾多反對之聲!姚順宇在部落格中也透露,即使Anthropic內部,大多數人也不同意這種說法。他認為這是離職的Anthropic的主要原因之一,其他原因涉及企業內部資訊,無法透露。順便一提,現在搞大模型的Yao Shunyu有兩位。一位就是今天的主角,本科就讀於清華大學物理系,研究方向為理論物理(包括但不限於理論凝聚態物理、理論高能物理和混沌系統)。另一位就是OpenAI的Yao Shunyu(姚順雨),目前最新動向還未「解禁」。順便說一句,這兩位大神名字都太硬了,Yao Shunyu(拼音同漢字,堯舜禹),也只有這兩位大神能壓得住了~姚順宇在最新的領英中同時更新了一篇部落格,詳細總結了這一年在AI領域的經歷。我的AI研究元年——從物理學到AI在我離開伯克利的博士後崗位、加入Anthropic 不久後,我曾計畫寫一篇短文,主要是為自己留下一份筆記,記錄我離開物理學、投身AI研究的心路歷程。然而,由於在Anthropic的工作異常緊張,我一直沒能抽出時間動筆。直到9月19日,我從Anthropic辭職,在加入GoogleDeepMind前有了一周的休息時間。我為什麼離開物理學,又為什麼選擇AI?主要原因在於,我想尋找一個對年輕人機會更多的方向。理論物理是一個絕佳的思維訓練領域:它充滿智力挑戰、博大精深,並需要運用來自數學、電腦科學(如複雜性理論)以及物理學本身等多個領域的知識。然而,這個領域多年來已缺乏新的實驗資料支撐。一個沒有實驗指引的領域,會面臨很多方面的問題。比如,我們很難客觀地評判一項理論工作的價值,也很難僅通過系統性的實驗來消除分歧、澄清困惑。於是,我將選擇範圍縮小到了AI和QC(Quantum Computing,量子計算)。儘管我相信QC在未來會變得至關重要,但我的感覺是,目前其瓶頸主要在於實驗平台。因此,我選擇了AI。有趣的是,我發現AI研究與物理學研究有如下相似之處。作為物理學家,從事AI研究是種怎樣的體驗?在某種意義上,這很像17世紀的熱力學研究。那時,人們甚至不知道「熱」究竟是什麼,事實上,當時學界依然信奉「燃素說」。但這並未阻止人們進行科學的實驗探索。例如,波義耳定律(Boyle's law)揭示了在溫度恆定時,壓力與體積之間的關係。正是通過這樣系統性地設計實驗,人們才總結出了足夠多的「定律」,並在此基礎上指導了熱機的發明與研究,最終改變了世界。在我粗淺看來,如今的大規模AI模型領域與之類似。一方面,我們仍未擁有可靠的理論或模型來描述大型神經網路的行為。另一方面,系統性的研究已開始為我們揭示許多寶貴的認知,例如Scaling Law。而進行這類系統性的研究,正成為在AI領域大規模取得持續進展的關鍵要素。為什麼選擇Anthropic,又為什麼離開?儘管我已經離開,但我依然認為Anthropic是物理學家(可能也包括其他STEM背景的博士)開啟AI研究生涯的最好去處之一。我於2024年10月1日加入Anthropic,當時我們開始為後來發佈的Claude 3.7 Sonnet進行研究。作為一名從事了多年物理研究的人,能夠親眼看到自己的研究成果迅速對前沿模型的能力產生影響,並見證人們與AI的互動方式隨著新能力的湧現而改變,這是一種無與倫比的激動人心的體驗。然而,我最終決定離開,主要出於兩個原因:1. 約40%的原因是:我強烈反對Anthropic發表的反華言論。尤其是在最近的公開聲明中,中國被稱為「敵對國家」。需要澄清的是,我相信Anthropic的大多數人並不同意這種說法,但我認為自己已無法再待下去。2. 剩下的60%則更為複雜。由於其中大部分涉及Anthropic的內部資訊,因此不便透露。是時候翻開新篇章了!與物理學相比,AI的發展速度快得驚人。回首過去一年,發生的一切都讓我感到驚訝。我非常榮幸能見證Claude從3.7迭代到4.5的過程,我個人也收穫良多。但,是時候繼續前行了。從個人發展的角度看,Anthropic是我第一份,也是唯一一份AI工作。因此,我不希望自己的經驗和認知被某一個實驗室所侷限。(尤其是在如今,核心研究團隊已不再公開發表論文的情況下。)所以Anthropic,與你共事很棒,但沒有你我會更好。我已於9月29日(2025年)加入GoogleDeepMind。 (新智元)