#大學
史丹佛HAI大重組!李飛飛昇任校長顧問
史丹佛把HAI與Data Science合併,李飛飛昇任校長顧問。這是頂級大學在AI新階段押注「組織力」的全面換擋。剛剛,史丹佛進行了一項重磅重組。5月4日,史丹佛大學宣佈:將旗下兩大AI與資料科學組織——Stanford HAI(以人為本人工智慧研究院)和Stanford Data Science(史丹佛資料科學)合併為一個統一機構,名稱保留Stanford HAI,由電腦科學家James Landay全面掌舵。而那位讓全世界記住ImageNet的女人——李飛飛,則升任校長Jonathan Levin的AI特別顧問,同時與史丹佛前校長、圖靈獎得主John Hennessy共同出任HAI顧問委員會聯席主席。HAI,2019年由李飛飛、前教務長John Etchemendy、NLP大牛Chris Manning和Landay聯合創立。7年間,它集結了超過400位跨學科學者,累計發放6000萬美元研究資助,覆蓋史丹佛全部七個學院。它做出了每年一度的AI Index報告,搞了面向國會議員的「AI訓練營」,還在基礎模型、數字經濟、環境智能等領域建立了多個研究中心。Stanford Data Science,由數學與統計學家Emmanuel Candès領銜建立,專注大規模資料處理,建造了高性能計算叢集Marlowe,並在天體物理、因果推斷、可持續發展、神經科學等領域建立了交叉研究中心。過去,兩個組織各有側重:HAI偏「人文視角+政策影響」,Data Science偏「算力基建+資料方法」。但AI發展到2026年這個節點,問題變了——無論你做天文發現、腦科學建模還是歷史文字挖掘,你都需要同時具備大規模資料能力、高性能算力和AI方法論。把兩套成員拆著跑,效率越來越低。用史丹佛校長Levin的話說,合併後的HAI將是「史丹佛AI的統一入口」。也就是說,以後史丹佛搞AI,不管那個學院、那個方向,都從這一扇門進。李飛飛角色升維作為HAI創始院長和ImageNet的締造者,李飛飛在學術界和產業界的號召力毋庸置疑。但HAI發展到今天,需要的不只是學術聲望,更需要一個能「搞工程、搞協同、搞基建」的操盤手。李飛飛昇任校長AI特別顧問,管的是全校七個學院的AI戰略,格局更大了。她自己說得很明白:AI正在改變的不只是技術,還有我們追求科學發現、學習和教育、服務社會的方式。而接棒的Landay,可能在國內知名度不如李飛飛,但在人機互動(HCI)領域,這是一位教科書級的人物。他在1990年代開發的設計工具SILK,比Figma和Canva早了二十多年;他在2000年代初做的UbiFit項目,比Fitbit和Apple Watch早了近十年。2024年,他拿到了ACM SIGCHI終身研究獎——這是人機互動領域的最高榮譽之一。更關鍵的是,Landay的核心理念和這次合併高度契合。他反覆強調的是「團隊科學(Team Science at Scale)」——不是傳統的五人小實驗室,而是20-30人的跨學科大團隊,包含教授、博士後、研究工程師、資料科學家、項目經理和設計師。這恰恰是AI研究從「個人英雄主義」走向「工業化協同」所需要的組織形態。John Hennessy——這位史丹佛前校長、圖靈獎得主、RISC架構之父、Alphabet董事長——也加入了顧問委員會。他的評價最為直接:這是史丹佛最重要的舉措。新HAI到底要幹什麼?合併後的HAI明確了三大支柱:第一,重新定義大學裡的科學發現方式。史丹佛的天文學家用機器學習搜尋系外行星,神經科學家用模型預測腦活動,歷史學家用NLP挖掘檔案——這些不再是「AI+X」的點綴,而是新的研究範式。HAI要提供算力、研究工程師和資料科學家,讓「團隊科學」真正跑起來。第二,推動教育變革。 從K-12到終身學習,AI正在改變人類學習和被評估的方式。HAI要和史丹佛學習加速器等機構合作,探索適應性輔導系統和新型教育模式。第三,研究和塑造AI的社會影響。 就業怎麼變?組織流程怎麼變?設計方法怎麼從「以使用者為中心」升級到「以社區和社會為中心」?這些問題不能只靠工程師回答。而貫穿這一切的關鍵詞是:開放。開放原始碼、開放資料、開放模型、開放課程。學術界在AI時代的價值史丹佛這次重組,釋放出一個非常清晰的訊號:大學AI競爭的下半場,拼的不再是一篇論文、一個明星教授,而是一整套系統能力——算力、資料、人才、組織力和開放研究生態。過去幾年,前沿AI研究的話語權加速向產業界集中。OpenAI、Google DeepMind、Anthropic手握最強算力和資料,學術界的聲量不斷被壓縮。史丹佛這次的動作,本質上是在回答一個存亡級問題:學術界在AI時代還有沒有不可替代的價值?答案是有的——但前提是你能提供產業界給不了的東西:透明性、可復現性、公共利益導向的長期研究,以及真正跨學科的融合視角。而這些東西,不是靠一兩個超級教授就能實現的,需要從組織架構層面去支撐。李飛飛沒有離開,她只是換了一個更高的位置去看全域。Landay沒有橫空出世,他只是終於站到了與自己三十年積累相匹配的舞台上。Hennessy沒有退休,他只是用另一種方式繼續押注史丹佛最重要的賭注。當產業界拚命卷模型、卷算力、卷融資的時候,史丹佛選擇卷「組織力」——用開放、跨學科、以人為本的方式,重新定義學術界在AI時代的角色。 (新智元)
黃仁勳史丹佛最新演講:世界被徹底重啟了,你我都在同一條起跑線上
如果你現在還在為未來感到焦慮。覺得好賽道都被佔滿了,好機會都被前輩搶光了。甚至覺得,現在的世界階層固化,普通人再也沒有翻身的機會。那麼,請你一定要認真聽聽黃仁勳在史丹佛大學剛剛說出的那段話。在那個擠滿了全球最聰明大腦的沙龍現場。老黃沒有聊那些高大上的財報資料,也沒有兜售輝達的最新晶片。他只用了一個詞,就讓在場所有快要窒息的年輕人,眼裡重新燃起了火。這個詞就是:重啟(Reset)。他說,現在的世界,不再是那個等級森嚴、前輩掌握絕對話語權的舊世界了。整個電腦工業,這個全球最大的產業,已經被AI徹底推倒,原地重啟。而因為所有行業都是建立在電腦工業之上的,這意味著——全球所有的產業,在這一刻,都被強制重啟了。看完這篇充滿力量的對談實錄,我最大的感觸是:我們可能正處於人類歷史上最公平的一個瞬間。不管你是剛畢業的大學生,還是在大廠待了十年的老兵。在這一刻,沒有人比你更有領先優勢。這篇文章,我不談枯燥的技術參數,也不販賣“馬上就要失業”的焦慮。就聊聊在這場席捲全球的“大重啟”中,老黃為我們普通人指出的那條活路,到底在那裡。01 別怕,所有人都是“第一代”在史丹佛的講台上,黃仁勳對著台下的學生說了一句極具衝擊力的話:“這是你們步入社會的最好時機,因為世界被重啟了。”這句話背後,藏著一個極其殘酷,但也極其迷人的真相。在過去的幾十年裡,我們身處的職場和商業世界,是一層層堆疊起來的金字塔。前輩們掌握著更深厚的程式碼功底、更複雜的系統架構、更龐大的行業資源以及更熟練的業務套路。你要想出頭,必須得順著人家搭好的梯子,忍辱負重地一級一級往上爬。你得拼熬夜、拼體力、拼資歷。但現在,那個梯子斷了。當大模型開始重塑軟體生成的方式,當AI開始接管基礎的邏輯推演。以前那些靠“低效經驗積累”築起的護城河,一夜之間被徹底抹平了。老黃殘忍且真實地提醒我們:現在的產業,正處於一個沒有任何人有“先發優勢”的階段。那怕是那些在傳統網際網路行業呼風喚雨了二十年的高管,在面對今天的通用人工智慧時,他們的認知也未必比一個每天泡在AI工具裡的大學生深刻。這意味著,你不再需要去苦苦追趕那些跑了三十年的前輩。因為大家面對的,都是一種全世界從未見過的、全新的技術範式。你、我、甚至那些矽谷的頂級專家,現在其實都站在同一條起跑線上。我們每一個人,都是這個新時代的“第一代”。這種“歸零”帶來的,絕不是恐慌。而是一種前所未有的自由和解脫。如果你能意識到這一點,你就會發現,那些曾經困擾你的所謂“職場天花板”、“行業壁壘”。其實早就隨著舊世界的重啟,一起灰飛煙滅了。02 別被高門檻嚇住,最好的核武器就在你手邊很多人潛意識裡覺得,AI是一門極其高深的學問。想要玩轉AI,是不是得先去啃幾本厚厚的電腦視覺教材?是不是得學懂Python,搞懂神經網路的底層演算法?老黃在現場給出了一個極其治癒,也極其顛覆的回答:AI不僅是全世界最強大的技術,它還是人類歷史上最“平民化”的技術。在以前的工業時代,如果你想掌握最先進的生產力。你必須得去大工廠、頂尖實驗室,或者花重金購買極其昂貴的專業裝置。但現在,這個被老黃稱為“核武器”等級的工具,就安靜地躺在你的瀏覽器裡。只要有網路,每個人點選一下滑鼠就能用。老黃在史丹佛極其激動地說:“它是高度個性化的,它是極其容易獲取的,任何人都可以用它來為自己的職業生涯服務。”不要再覺得技術是高高在上的了。也不要覺得非理科出身、非專業人士,就無法觸碰這個時代的核心紅利。這種史無前例的“工具可及性”意味著,技術的高牆不僅塌了,而且被徹底碾碎了。你不需要知道發動機是怎麼造出來的,你只需要學會怎麼踩油門和轉動方向盤。現在這個世界缺的,根本不是那些能在底層寫程式碼造工具的人。而是那個能把工具拿起來,去解決現實世界具體問題的人。03 現在的企業,都在瘋狂尋找“AI專家使用者”在很多人的日常焦慮裡,AI總是扮演著那個來搶飯碗的“終極反派”。大家每天都在擔心:AI今天會畫畫了,插畫師是不是完了?AI明天會寫文案了,策劃是不是該下崗了?但老黃在史丹佛,分享了他在行業最前線看到的真實景象:整個工業界、所有的頂尖企業,現在並沒有在想著怎麼大規模裁員。相反,他們正在翹首以盼,甚至可以說是極度飢渴地等著新一批人才入場。注意,他在這裡使用的一個極其精準的詞彙,不是“AI開發者(AI Developers)”。而是“AI專家使用者(Expert AI users)”。這四個字,就是普通人未來十年最值錢的個人定位。老黃提到,無論你是學行銷的、搞金融的,還是做工程、寫軟體的。公司現在最想要的,是那些能用AI重塑自己專業能力的人。比如,一個懂財務的人很多,一個懂AI的人也很多。但是一個能熟練使用AI去清洗龐大財務資料、建立自動預測模型的“AI財務專家”,鳳毛麟角。一個懂設計的畫師,和一個能用AI在半天內生成上百張草圖並進行精準渲染的“AI設計專家”,他們的產出效率是十倍甚至百倍的差距。這種需求是全方位的,也是極其迫切的。老黃非常動情地對台下的學生說:“我們這些在產業界另一頭的人,正在等待著你們。”在這一刻,你不是一個被大廠挑肥揀瘦、隨時可能被替代的弱勢群體。你是一個帶著“新式核武器”進場,去拯救那些效率低下的舊業務的支援力量。你要做的,從來不是去和AI比誰的算力強、誰的邏輯更嚴密。而是去學習如何駕馭它,讓它成為你職業生涯的超級外掛。就像老黃說的那樣,這不僅是一個機會,這簡直是一個讓人“難以置信的巨大機會”。04 在被重啟的世界裡,尋找你的“確定性”老黃的這場簡短但極其震撼的演講,其實是給所有迷茫的人指出了一條明路。在這個連矽谷大佬都在不斷推翻自己認知的時代,我們普通人該如何尋找確定性?答案是:放棄線性規劃,擁抱非線性爆發。以前我們講究職業規劃,三年做到主管,五年混到經理,十年混個總監。這種規劃的前提,是整個行業按照既定的軌道緩慢行駛。但在一個被重啟的世界裡,這種按部就班的階梯已經不存在了。你現在唯一的確定性,就是把你手裡那個叫“專業”的舊武器,裝上一個叫“AI”的新引擎。不管世界怎麼變,企業解決具體商業問題的需求不會變。人類需要被治癒、需要更高效的運轉、需要更精準的行銷,這些本質的需求永遠都在。如果你是一個懂財務、懂法律、懂設計、甚至懂心理學的普通打工人。千萬不要去焦慮自己會不會寫程式碼,能不能搞懂複雜的演算法模型。你要做的是,比全公司所有人都更早、更熟練地去使用大模型。去成為那個能用一句精準的Prompt(提示詞),讓AI幫你幹完別人三天活的人。去成為那個能在極度混亂和不確定中,快速呼叫各種AI工具拼湊出解決方案的人。那座舊世界的金字塔已經轟然倒塌,新世界的荒原剛剛展開。不要再抱怨自己沒有早點出生,錯過了房地產紅利,錯過了移動網際網路紅利。今天,就是人類歷史上絕無僅有的一次,所有人被強制拉回同一條起跑線的機會。那些曾經不可一世的巨頭和前輩,現在和你一樣,都在面對一個完全未知的考卷。既然世界已經被重啟了。既然發令槍已經打響。剩下的,就是扔掉包袱,帶上你的超級工具,拚命跑下去。 (杏仁的第二大腦)
《醫養融合成趨勢 鍾東錦邀苗栗設長照據點 馬偕醫大:可評估》在高齡化浪潮加速下,台灣已正式邁入超高齡社會,長期照護需求持續攀升,各地政府與醫療體系也積極尋求因應之道。近期馬偕醫學大學家長後援會舉辦苗栗旅遊,活動期間苗栗縣長鍾東錦出席與會,主動拋出長照發展構想,願提供土地,結合馬偕醫院及馬偕醫大資源,在苗栗打造長照養生環境。出席的馬偕醫學大學校長葉宏一表示,將研究評估可行性。一趟結合觀光與身心療癒之旅,意外成為地方與醫療體系對話長照發展的契機。此次活動由家長後援會會長許良源領軍,帶領成員前往苗栗進行三天行程,包含上山賞螢、溫泉療癒、品嚐美食與採茶體驗,並走訪全台最大宗教文化旅遊園區「姜太公中部道場客家大院」,在桐花盛開之際漫遊步道,透過自然與文化場域達到身心放鬆,呼應「五感療癒」概念。活動期間,鍾東錦縣長特別出席與會,除致贈伴手禮表達歡迎,也提出發展長照想法。他指出,苗栗擁有良好的自然環境與空氣品質,極具發展養生村與長照機構的條件,若能結合醫療資源,將有助於打造高品質的高齡照護環境。鍾東錦進一步表示,馬偕紀念醫院醫療體系完整,在台北、淡水、新竹及台東均設有醫學中心或教學醫院,並結合馬偕醫學大學與護專體系,具備發展長照產業的實力與經驗。他當場邀請馬偕團隊進駐苗栗規劃養生村與長照機構,強調縣府可提供土地並全力協助,盼透過公私協力回應高齡化挑戰。對此,馬偕醫學大學校長葉宏一表示,感謝縣府提出具體構想,未來將與馬偕醫院體系進一步評估與研究可行性,尋求符合在地需求與專業發展的合作模式。事實上,面對長照需求快速成長,馬偕體系近年已積極布局「醫養融合」模式。馬偕紀念醫院將臨床醫療延伸至長期照護端,透過長期照護管理中心、居家醫療服務及復能型社區長照機構,建構從醫院到家庭的連續性照護網絡。其中,「出院準備服務」成為關鍵節點,協助病患在離院後銜接後續照護資源,降低再入院風險。在學術端,馬偕醫學大學設立長期照護研究所,專注於老年營養、心理健康及智慧長照等領域,並與臨床實務緊密結合,培育專業人才。透過教學、研究與醫療三方整合,逐步形塑以精準健康與全人照護為核心的長照體系。整體而言,台灣長照發展已從傳統機構照護,邁向「在地老化」與「醫養整合」的新階段。苗栗縣府此次主動釋出土地與政策支持,結合馬偕體系既有資源與經驗,若能順利推動,將有望打造兼具醫療品質與生活機能的長照示範基地,也為超高齡社會下的照護模式提供新的參考方向。
北大開源統一世界模型框架:多類合成推理任務一套搞定
世界模型(World Model)是現在AI領域最受關注的研究方向之一,其核心目標在於建構能夠對真實世界進行感知、理解、互動與預測的統一智能系統。然而,在當前研究實踐中,不同任務(如互動式視訊生成、3D 場景建模、視覺-語言-動作(VLA)控制以及多模態推理)之間普遍存在介面不統一、推理流程割裂、系統耦合嚴重等問題,研究者往往需要為每類任務單獨建構推理邏輯與工程環境,導致重複開發成本高、跨任務對比困難,從而制約了世界模型的系統性發展。為應對上述挑戰,北京大學DCAI課題組聯合快手可靈團隊、上海演算法創新研究院、中關村學院等研究人員,推出了OpenWorldLib——一個統一、規範、可擴展的先進世界模型推理框架。論文對世界模型做出了明確界定:一種以感知為核心,具備互動能力與長期記憶能力,用於理解和預測複雜世界的模型或框架。在這一統一定義下,OpenWorldLib整合了多模態理解、生成與行動能力,並建構了面向開源社區的標準化介面體系,使研究者能在同一框架中進行模型復現、對比與擴展。OpenWorldLib的核心價值體現在四個方面:通過統一介面遮蔽不同模型之間的差異;通過統一推理流程降低工程複雜度;通過統一能力定義促進跨任務對齊;通過開源生態推動世界模型領域的協同發展。框架設計整體架構Pipeline作為系統的核心調度模組,負責串聯各功能元件,實現從輸入到輸出的完整推理過程。該模組不僅支援單輪推理(forward execution),還支援多輪互動(stream execution),通過自動呼叫 Memory 模組實現上下文讀取與更新,使模型在複雜任務中保持狀態一致性與長期依賴能力。OpenWorldLib的整體架構主要分為以下幾個層次:模型抽象層(Model Abstraction):對不同類型的世界模型進行統一抽象,無論視訊生成、3D 重建還是具身控制模型,均通過一致介面定義輸入、輸出與推理邏輯。使用者無需關心底層實現差異,按統一規範即可完成推理。推理引擎層(Inference Engine):內建對多種推理後端的支援,使用者可便捷地基於指令碼進行呼叫。互動管理層(Interaction Manager):針對世界模型特有的多輪互動需求(如條件視訊編輯、3D 場景逐步探索等),設計了統一的管理機制,支援狀態追蹤、條件注入和增量推理。Operator 機制Operator模組充當原始輸入(或環境訊號)與核心執行模組(Synthesis、Reasoning、Representation)之間的橋樑。世界模型需要處理來自真實世界的複雜多模態輸入——文字、圖像、連續控制動作、音訊訊號——Operator被設計用於將這些多樣化資料流進行統一標準化處理。當 Pipeline 被呼叫時,系統首先將原始輸入傳遞至 Operator 的 process() 方法。Operator承擔兩個核心功能:其一是校驗(Validation),確保輸入資料的格式、形狀與類型滿足下游模型要求;其二是預處理(Preprocessing),將原始訊號轉換為標準化的張量表示或結構化格式——例如對圖像做尺寸調整、對文字做分詞編碼、對動作空間做歸一化處理。四大核心模組Reasoning Module(推理模組):負責多模態理解與決策,包括通用推理、空間推理與音訊推理。核心作用是將感知資訊轉化為結構化語義表示,為後續生成與行動提供依據。Synthesis Module(生成模組):負責多模態內容生成,包括圖像、視訊、音訊以及動作序列。將模型內部推理結果轉化為可觀測或可執行輸出。Representation Module(表徵模組):負責建構顯式世界表示,例如 3D 場景、點雲與深度資訊,為物理一致性建模與模擬驗證提供支援。Memory Module(記憶模組):負責長期上下文管理,包括歷史資訊儲存、相關記憶檢索與狀態更新,使模型能支援多輪互動與長期依賴任務。實驗效果為了驗證框架的有效性,OpenWorldLib在多個典型世界模型任務上進行了系統評估,覆蓋視訊生成、多模態推理、3D建模與具身控制等方向,並在論文中給出了可視化結果與定性分析。互動式視訊生成在視訊生成任務中,OpenWorldLib支援導航視訊生成與互動式視訊編輯,並通過統一介面對不同方法進行評測。實驗結果表明,相較於早期方法(如 Matrix-Game 系列),新一代模型在長序列生成中顯著提升了視覺質量與物理一致性,減少了顏色漂移與結構失真等問題,同時在複雜互動條件下仍能保持穩定表現 。多模態推理能力在推理任務中,Reasoning模組能夠融合文字、圖像等多模態資訊,完成空間關係分析與複雜語義推理,並輸出具有可解釋性的結果。這一能力使模型不僅具備“生成能力”,還具備“理解與決策能力”,從而更接近真實世界中的認知過程。3D 場景生成與重建在3D任務中,OpenWorldLib通過Representation模組實現從視覺輸入到結構化三維表示的統一建模。實驗表明,雖然現有方法在大視角變化下仍存在幾何不一致問題,但整體框架能夠穩定支援多視角重建與模擬驗證,為複雜場景理解提供基礎 。Vision-Language-Action(VLA)在具身智能任務中,框架能夠將自然語言指令與視覺觀測轉化為動作序列,實現從“理解”到“行動”的閉環過程。這一能力驗證了 OpenWorldLib 在跨模態任務協同與真實世界互動中的潛力。總體而言,OpenWorldLib不僅在單任務上具備良好性能,更重要的是通過統一框架實現了跨任務能力整合與系統級協同。使用方式在具體使用過程中,OpenWorldLib支援以下幾種典型方式:單輪推理呼叫: 使用者通過Pipeline介面直接輸入多模態資料,完成一次完整推理,適用於視訊生成、推理等標準場景。多輪互動執行: 通過stream()介面,系統自動呼叫Memory模組維護歷史狀態,支援互動式視訊編輯或具身控制等複雜任務。模型擴展與接入: 框架提供統一的模組範本(Operator / Reasoning / Synthesis / Representation / Memory),開發者只需實現對應介面即可接入新模型,無需修改整體架構。開源生態與社區支援: 項目已支援視訊生成、3D建模、VLA控制與多模態推理等多類任務,提供完整文件與示例,鼓勵社區通過Issue與Pull Request參與共建。綜上,OpenWorldLib通過統一介面與模組化設計,使世界模型的使用從“複雜工程系統”轉變為“標準化工具呼叫”,不僅顯著降低了研究與開發門檻,也為未來多模態智能系統的建構提供了可復用的基礎設施。 (量子位)