#智能AI
矽谷炸鍋了! AI教母李飛飛萬字長文撕開行業“遮羞布”。
近期,一篇出自 “AI 教母” 李飛飛教授的萬字長文,在矽谷 AI 圈掀起軒然大波。作為曾掌舵史丹佛 AI 實驗室、憑 ImageNet 項目改寫深度學習視覺領域格局的華人頂尖專家,她此次的發聲格外重磅:“當下的 AI,不過是困在暗室裡的文字高手,能說會道卻脫離現實,本質上就是‘睜眼瞎說’。”一、李飛飛撕開AI“遮羞布”這番話看似犀利,卻精準點破了 AI 光鮮外表下的 “致命缺陷”。如今的大語言模型有多 “能打”?寫律詩、寫論文、聊量子物理,分分鐘模仿李白、杜甫的文風,邏輯縝密到讓人難辨真假。可一旦跳出文字的舒適區,面對真實的物理世界,AI 就立刻 “露餡”:讓它估算桌子到門的距離,全靠蒙;讓它預測杯子轉 90 度後的模樣,純屬猜;就連那些刷屏的 AI 生成視訊,仔細看全是破綻 —— 人物突然多根手指、物體莫名穿牆而過,說到底,都是 AI 不懂物理規律的必然結果。二、AI未來:不在大模型,在嬰兒本能李飛飛教授毫不避諱地指出:AI 行業已經走偏了方向。真正的突破口,從不是參數越來越龐大的語言模型,而是連嬰兒都有的 “空間智能”—— 這才是通往通用人工智慧(AGI)的唯一正道。那 “空間智能” 到底是什麼?其實就是人類理解、互動物理世界的本能。嬰兒靠抓、扔、咬,摸清物體的軟硬、輕重;你半夜摸黑起床倒水,不用開燈也能精準拿到杯子;朋友扔來鑰匙,你不用算拋物線就能穩穩接住。這些看似簡單的動作,背後藏著對空間、距離、物理規律的深層認知。更關鍵的是,人類文明的諸多重大突破,都離不開 “空間智能”:埃拉托斯特尼觀察影子長短,算出了地球周長;沃森和克里克搭 3D 模型,破解了 DNA 雙螺旋結構;建築師設計摩天大樓、科學家推演星體運動,本質上都是在運用對空間和物理規律的理解。而這些,是只會 “玩文字” 的大語言模型永遠做不到的。三、AI要“懂”世界:先建世界模型既然空間智能這麼重要,怎麼讓 AI 擁有它?李飛飛給出了核心方案:讓 AI 從 “語言模型” 轉向 “世界模型”。一個合格的世界模型,必須具備三大核心能力:首先,能生成符合物理定律的虛擬世界,不是天馬行空的虛構,而是遵循重力、摩擦力等基礎規律;其次,能整合文字、圖像、動作等多種資訊,不僅聽得懂你說的,還能看懂你做的;最後,也是最關鍵的,能精準預測互動結果 —— 比如知道推杯子會倒、扔球會落地,這才是 AI “看懂” 世界的關鍵。要做到這些,比訓練大語言模型難得多。語言是一維的、線性的,可世界是四維的 —— 三維空間加時間,還受無數物理定律約束。但一旦突破這個難關,AI 的能力將實現質的飛躍。四、空間智能AI:能幫人類做什麼?李飛飛團隊早已用實踐證明了空間智能的潛力:他們研發的 “抹布模型”,能讓電影製作人、遊戲設計師僅憑文字描述,就生成可互動的 3D 世界。不用學複雜的建模軟體,普通人也能當 “造物主”,搭建屬於自己的虛擬場景。這還只是開始。當 AI 真正擁有空間智能,生活將迎來巨變:機器人不再是笨拙的機器臂,能在模擬環境中學會上萬種技能,走進家庭做飯、照顧老人,走進醫院精準手術;教育領域,學生能 “穿越” 到古羅馬街道學歷史,“鑽進” 細胞裡看生物結構;科學探索中,AI 能模擬深海、外太空,幫人類探索無法抵達的領域。正如李飛飛所說:“AI 的終極目標從不是取代人類,而是為人類賦能。現在的大語言模型只是起點,真正的智能,是讓機器理解物理世界。”(AI行銷峰雲)
精讀筆記:李飛飛-從文字到世界:空間智能是AI的下一個前沿
李飛飛博士於 2025 年 11 月發表長文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》。這是其深耕 AI 領域 25 年的重要思考結晶。全文以圖靈 “機器能思考嗎” 這一經典問題開篇,指出當前以大語言模型為代表的 AI 雖在抽象知識處理上成績斐然,卻存在脫離現實物理世界的短板。文章系統闡釋了空間智能的定義與核心價值,將其定位為支撐人類認知、創造力與文明進步的核心能力,同時提出建構具備生成性、多模態性和互動性的 “世界模型” 是解鎖空間智能的關鍵,還勾勒出空間智能從賦能創意到革新機器人技術,再到推動科學醫療突破的應用演進路徑,為 AI 下一個十年的發展指明了方向。In 1950, when computing was little more than automated arithmetic and simple logic, Alan Turing asked a question that still reverberates today: can machines think? It took remarkable imagination to see what he saw: that intelligence might someday be built rather than born. That insight later launched a relentless scientific quest called Artificial Intelligence (AI). Twenty-five years into my own career in AI, I still find myself inspired by Turing’s vision. But how close are we? The answer isn’t simple.1950年,當電腦還僅僅停留在自動化運算和簡單邏輯運算的層面時,艾倫・圖靈提出了一個至今仍能引發廣泛共鳴的問題:機器能思考嗎?他能洞察到常人未及的可能性,這需要非凡的想像力 —— 智能或許有朝一日能夠被創造出來,而非天生就存在。這一深刻見解隨後開啟了一場名為人工智慧的不懈科學探索。在我投身人工智慧領域的第二十五個年頭,圖靈的這一願景依舊在不斷給予我啟發。但我們如今距離那個目標究竟還有多遠?答案並非簡單就能說清。以 AI 領域的源頭性問題切入,奠定了全文的思辨基調。李飛飛通過回溯圖靈的經典疑問,既致敬了人工智慧的啟蒙思想,又巧妙地引出了核心矛盾 —— 經過數十年發展,AI 仍未完全實現 “機器思考” 的終極目標。她強調智能 “可被建構” 的核心觀點,既是對後續探討空間智能 “可被研發” 的理論鋪墊,也暗示當前 AI 發展尚未觸及智能的核心本質,為後文批判大語言模型的侷限性埋下伏筆。Today, leading AI technology such as large language models (LLMs) have begun to transform how we access and work with abstract knowledge. Yet they remain wordsmiths in the dark; eloquent but inexperienced, knowledgeable but ungrounded. Spatial intelligence will transform how we create and interact with real and virtual worlds—revolutionizing storytelling, creativity, robotics, scientific discovery, and beyond. This is AI’s next frontier.如今,以大語言模型為代表的前沿人工智慧技術,已經開始改變我們獲取和運用抽象知識的方式。然而,這些模型就如同在黑暗中雕琢文字的匠人:能言善辯卻缺乏實踐經驗,學識淵博卻沒有堅實的現實根基。而空間智能將徹底改變我們創造以及與現實和虛擬世界互動的模式 —— 它會給敘事創作、創意設計、機器人技術、科學發現等諸多領域帶來革命性變革。這,正是人工智慧的下一個前沿陣地。這裡點出,當前 AI 的核心短板並拋出全文核心論點。作者用 “黑暗中的文字匠” 這一形象比喻,深刻揭露了大語言模型的致命缺陷:僅擅長文字層面的資訊處理,卻脫離對物理世界的真實感知與互動能力。同時,她明確將空間智能定義為 AI 的下一個前沿,打破了當下 AI 研發集中於文字多模態擴展的侷限,為行業指出了從 “語言理解” 向 “世界感知” 跨越的全新方向。The pursuit of visual and spatial intelligence has been the North Star guiding me since I entered the field. It’s why I spent years building ImageNet, the first large-scale visual learning and benchmarking dataset and one of three key elements enabling the birth of modern AI, along with neural network algorithms and modern compute like graphics processing units (GPUs). It’s why my academic lab at Stanford has spent the last decade combining computer vision with robotic learning.自進入人工智慧領域以來,對視覺與空間智能的探索一直是指引我前行的北極星。這也是我耗費數年時間建構 ImageNet 資料集的原因 ——該資料集是首個大規模視覺學習與基準測試資料集,與神經網路演算法以及圖形處理器這類現代計算裝置一起,共同構成了催生現代人工智慧誕生的三大核心要素。同樣出於這個初衷,我在史丹佛大學的學術實驗室,在過去十年間始終致力於將電腦視覺與機器人學習相結合的研究。該段落通過結合自身學術經歷,增強了論點的可信度與說服力。李飛飛將自己建立 ImageNet 的行為、實驗室的研究方向與空間智能探索強繫結,既體現了她對這一領域研究的連貫性與執著,也從側面印證了空間智能的重要性 —— 畢竟 ImageNet 作為現代 AI 的三大基石之一,其核心價值正是為機器提供視覺感知的基礎,而這正是空間智能的重要組成部分。這一段落也為後文介紹 World Labs 的研發目標做了背景鋪墊,展現出其研究理念的一脈相承。Generative AI models such as LLMs have moved from research labs to everyday life, becoming tools of creativity, productivity, and communication for billions of people. They have demonstrated capabilities once thought impossible, producing coherent text, mountains of code, photorealistic images, and even short video clips with ease. It’s no longer a question of whether AI will change the world. By any reasonable definition, it already has.以大語言模型為代表的生成式人工智慧模型,已經從科研實驗室走進了人們的日常生活,成為數十億人用於激發創意、提升效率與日常溝通的工具。這些模型展現出了曾經被認為難以企及的能力,能夠輕鬆生成邏輯連貫的文字、海量的程式碼、高度逼真的圖像,甚至是短影片片段。如今,問題已不再是人工智慧是否會改變世界。以任何合理的標準來衡量,它都已經做到了這一點。李飛飛在此處先客觀肯定了生成式 AI 的巨大成就,避免了因強調空間智能而全盤否定現有技術的片面性。她列舉文字、程式碼、圖像等生成能力,既符合大眾對當前 AI 的認知,也為後文轉折做了鋪墊。這種先揚後抑的表述方式,能讓讀者更易接受後續關於 AI 短板的論述 —— 承認現有技術的價值,才能更好地理解為何需要向空間智能方向突破,而非停留在現有成果上。Yet so much still lies beyond our reach. The vision of autonomous robots remains intriguing but speculative, far from the fixtures of daily life that futurists have long promised. The dream of massively accelerated research in fields like disease curation, new material discovery, and particle physics remains largely unfulfilled.然而,仍有諸多目標至今我們仍難以實現。自主機器人的願景雖然充滿吸引力,但依舊停留在推測階段,與未來學家們長期以來描繪的、成為日常生活中常見設施的場景相去甚遠。而在疾病治療、新材料研發、粒子物理等領域借助人工智慧大幅加速研究處理程序的夢想,在很大程度上也尚未實現。該段落通過列舉具體場景,具象化了當前 AI 的能力邊界。李飛飛選取自主機器人、疾病治療、新材料發現等具有高關注度的領域,這些領域的共同特點是都需要 AI 具備對物理世界的感知、推理與互動能力 —— 而這正是大語言模型所欠缺的。通過指出這些大眾與行業期待已久的目標尚未達成,有力地論證了單純依靠現有技術遠遠不夠,進一步凸顯了研發空間智能的必要性與緊迫性。Spatial intelligence is the scaffolding of human cognition. It operates when we passively observe or actively create. It drives our reasoning and planning, even on the most abstract topics. And it shapes how we interact—whether through language or action—with others and our environment.空間智能是人類認知體系的腳手架。無論我們是在被動觀察世界,還是主動創造事物,空間智能都在發揮作用。它推動著我們的推理與規劃能力,即便面對那些極為抽象的事物亦是如此。同時,它還影響著我們與他人、與周邊環境互動的方式 —— 無論這種互動是通過語言交流還是實際行動來實現。此處是對空間智能核心價值的高度凝練。李飛飛用 “認知的腳手架” 這一比喻,精準概括了空間智能的基礎性作用 —— 如同腳手架支撐建築一樣,空間智能是人類所有認知活動的底層支撐。她打破了人們對空間智能僅侷限於 “空間感知” 的淺層認知,指出其對抽象推理、人際互動等多方面的深層影響,這一界定極大地提升了空間智能的理論高度,也為後文闡述建構空間智能 AI 的多元價值提供了理論依據。Unfortunately, today’s AI does not yet think this way. Despite significant advances in recent years—multimodal LLMs trained on vast troves of multimedia data have introduced basic spatial awareness, and state-of-the-art robots can manipulate objects in highly constrained settings—AI’s spatial capabilities remain far from human levels.遺憾的是,如今的人工智慧尚未具備這樣的思考模式。儘管近年來人工智慧取得了諸多重大進展 —— 經過海量多媒體資料訓練的多模態大語言模型已經具備了基礎的空間感知能力,最先進的機器人也能夠在高度受限的環境中操控物體 —— 但人工智慧的空間智能水平與人類相比,仍存在巨大差距。作者直面當前 AI 在空間智能領域的現狀,既不否認技術進步,也不迴避核心差距。李飛飛認可多模態模型和先進機器人在空間能力上的微小突破,體現了論述的客觀性;同時明確指出這些能力與人類水平相去甚遠,形成強烈對比。這種表述既避免了對現有技術的全盤否定,又為後文提出建構 “世界模型” 來突破這一差距的解決方案做了完美鋪墊,讓後續的技術路徑建議更具針對性。Building world models that unlock spatial intelligence requires something far more ambitious than LLMs: a new kind of generative model whose ability to understand, reason about, generate, and interact with semantically, physically, geometrically, and dynamically complex worlds—virtual or real—far exceeds that of today’s LLMs.要建構能夠解鎖空間智能的世界模型,需要開展一項遠比研發大語言模型更具挑戰性的工作:我們需要打造一種全新的生成式模型。這種模型在理解、推理、生成以及與語義層面、物理層面、幾何層面和動態層面均極為複雜的世界(無論是虛擬還是現實世界)進行互動的能力,都要遠超如今的大語言模型。這裡明確給出了突破空間智能瓶頸的核心方案 —— 建構世界模型,並凸顯了該方案的挑戰性。李飛飛強調這種新模型需跨越語義、物理、幾何、動態等多個維度,這一定位精準抓住了空間智能的核心需求:機器要像人類一樣綜合多維度資訊理解世界。同時,將其與成熟的大語言模型對比,既讓讀者清晰感知到研發難度,也暗示這一突破將帶來 AI 領域的下一次質的飛躍,為全文的技術構想劃定了核心方向。 (晚筀筆記)思維導圖參考:
王興興最新發聲!這將是具身智能的“ChatGPT時刻”
“未來1至2年,誰能實現這個目標,誰將擁有全球最領先的具身智能AI模型。”11月5日,宇樹科技股份有限公司創始人、董事長王興興在第八屆虹橋國際經濟論壇“人形機器人創新發展合作”分論壇上對具身智能的“ChatGPT時刻”何時到來作出前瞻判斷。在他看來,誰能在未來一兩年內實現“在80%的陌生場景中完成80%任務”的突破,誰就是全球最領先的具身智能。“比如到明年這個時候,隨便一台人形機器人到會場,你跟它交代任務,比如說‘幫我拿一杯水’或者說給某位記者朋友拿一份東西過去,它可以直接過去把這個任務完成。這個場景完全沒有預訓練過,你給的東西它也沒有看到過。”王興興舉例說。他認為,在完全陌生場景下,機器人能達到80%左右成功率,就已經掌握突破性技術了。“目前人形機器人(包括具身智能)最關鍵的還是機器人大模型(具身智能模型)的進展速度,我覺得稍微有點慢了。”王興興表示,相對去年來說,今年深度強化學習的全身運控的進步非常明顯,但在具身大模型,“端到端能幹活“的技術進步稍微慢了一點,但總體而言其對人形機器人的前景較樂觀。王興興稱,“具身機器人目前的發展階段類似於ChatGPT發佈前的1-3年左右,大家已經發現了方向,但還沒有做成可以突破臨界點的事情。為了早日實現“ChatGPT時刻”,更應該研究模型,還是收集更多的資料?王興興表示,目前在模型結構上大家做了很多嘗試,但泛化能力不夠,還需要創新。大家也需要收集更大規模的資料、質量更好的資料。但目前,對資料的採集、對資料質量的評判還非常困難。另外,他提出,模型和資料需要相輔相成,而不是一股腦採集大量資料,或者一股腦把模型做大。目前,具身智能主流模型有VLA(視訊語言動作)+RL(強化學習)模型和基於視訊生成的世界模型。王興興表示,前者可以用模擬環境做訓練,或者用真實場景做訓練,但泛化能力相對來說不是特別夠。因此,他更喜歡基於視訊生成的世界模型。然而,王興興也認為,該模型面臨比較大的挑戰。因為基於視訊生成的世界模型對算力的需求非常大,需要的算力卡比較多,所以中小型人形機器人公司往往“跑不動”,反而是一些大型AI公司、網際網路公司視訊模型的資源更加豐富,做出該模型的機率更大。 (金融時報)
人工智能時代,世界只有第一,沒有第二
大家好,我今天交流的題目是《AI管理革命正向我們走來》。01. 20世紀的管理革命與管理困境(一)第二次工業革命推動了所有權與管理權分離的管理革命AI作為一種技術,正在驅動管理和上層建築的變革。我們知道,第一次工業革命以蒸汽機、鐵路、電報為主導,在鐵路系統中誕生了第一個現代管理系統。第二次工業革命以電力、內燃機、電話為代表,促進了製造業、運輸業、分銷和零售業,以及影視廣告娛樂等產業的繁榮。技術進步以及大規模的併購發生在美國19世紀和20世紀之交,促進了企業規模的擴張和管理複雜性的增加,進而推動了股權的分散,所有權與管理權的分離,以及職業經理階層的形成。正如錢德勒在《看得見的手》中指出,科技的進步完成了第一次管理革命。第一次管理革命的特徵就是我上述的三點:(1)股權的分散化,這是由於大規模併購所推動的;(2)所有權與管理權的分離:創業者不管是到年齡了,還是其他原因,最終要把企業的控制權——即通常所說的管理權——要交到職業經理人手上( 3 )職業經理階級(3)開始形成職業經理人。用錢德勒的話來說,美國企業在職業經理人手上獲得了長足的發展。因此,不管是錢德勒的《看得見的手》,還是格林斯潘的《繁榮與衰退》,主要兩個核心觀點:一是股權分散;二是職業經理人階級的形成。(二)第三次工業革命推動了以資訊科技為基礎的管理革命自科學管理運動以來的一百年中,企業的生產力得到了大幅提升,以電腦、互聯網和行動通訊網路為代表的第三次工業革命使得標準化、流程化、自動化大規模客製化以及資訊系統普及,實現了以資訊科技為基礎的管理革命。但我們看到一個現象:阻礙生產力提高的一般性難題在這三次工業革命中都已經被逐一克服了(所謂“一般性難題”,就是可見的這工具和方法能解決的管理問題),生產力的提升越來越集中在最深層的難題,最難啃的骨頭上。(三)產業的難題與傳統技術與管理的困境企業生產力的提升服從帕累托定理:80%的效益成長依賴20%難題的解決。1.鋼鐵業-高爐的穩定性。以寶武集團為例,煉鋼成本裡70%裡煉鐵成本,高爐不穩定是最大的問題,如能提高前端輸入參數,對輸出鐵水溫度及矽含量預測的準確性,就能提升高爐的穩定性。這是一個百年世界難題。而每噸鋼在煉鐵環境省1塊錢,光是寶武一家的產量就能省下幾億元,因為鋼產量已經是1、2億噸。2.電力產業的困擾:中低端配電網管理的複雜性。電力產業業務重點現在逐步轉向中低壓配電網的建設,由此帶來的需求變化主要表現在:(1)數位化改造設備規模大,僅國網就有470萬台區,480萬的充電樁,8000萬開關,4.3億計量表,300GW分佈式太陽能裝機量。 (2)數位化程度低,有三個老大難問題:「貴」(人工逐站運檢,1500元/站/年)、「難」(故障難查,故障位置不清楚)、「慢」(被動回應,平均30分鐘受理時間) 。 (3)新能源的爆發:太陽能和風電介入電網以後,給電網企業帶來了負載增加,不可預測,無法消納的情況。3.水泥產業的硬骨頭:熟料強度的即時精準預測。2024年4月,海螺水泥與華為礦山軍團計畫組從200個水泥生產場景中辨識出「水泥品質預測循優,水泥生產全域優化,安全生產智慧監控,皮帶機無人巡檢,智慧裝備問答」五大核心人​​工智慧場景。其中最基礎、最關鍵的場景,也是最難啃食的骨頭,就是「熟料強度品質指標的即時預測」。現有的手段和方法在解決此項難題方面已經達到了極限。4.油氣勘探產業的短板:勘探地震資料的處理和解釋。例如,把一個地塊的地震資料處理和解釋,人工需要十幾天的時間,而且嚴重依賴專家的經驗和判斷。再例如中油的FWI (全波形反演,一種高解析度地震成像技術),儘管中石油東方物探已經佔了全球石油勘探近70%的份額,但這都是石油勘探的苦活、累活、髒活,而在高解析度地震成像數據的處理和解釋上,還需依賴美國等公司的設備,與美國競爭對手存在明顯的差距,嚴重製約了企業的效益。我們幹髒活,累活,苦活,是我們的企業在國際化過程中很普遍的存在,原因是核心技術沒有突破。5.煤礦業的老大難:煤礦的痛點就是安全、減人、提效。煤礦現在下井員工的平均年齡為45歲,50歲以上不再允許下井,整個產業都面臨的問題,就是招不到礦工下井採煤。雖然現在都是用機械化採煤了,但井下作業的環境如粉塵、光線昏暗等一系列工作條件,使得年輕人不願意下井。煤礦井下主要生產業務可概括為採煤-掘進-機電-運輸-通風加排水,煤礦生產的痛點就是「減人、安全、提效」。以運輸為例,指的是主煤流透過皮帶運輸機將礦井下的煤運送到井上。作為煤礦的“大動脈”,運輸一旦出了問題就會導致整個礦井停工,因此每個礦區都配有專人專崗,保障煤流運輸系統的正常運作。類似上述的產業生產力難題已經是現有手段攻不破的難題,我之所以稱之為“硬骨頭”,也是這個道理。科學管理和持續改進經過一個世紀的發展,正面臨邊際效應遞減的困境。這恰恰是基於AI大模型聯合創新的用武之地。02. 21世紀管理的大趨勢是AI驅動的管理革命(一)AI是我們面臨的最重要的一場管理革命,也是最後一場管理革命21世紀的管理挑戰是什麼?解決類似上述提到的產業生產力的難題是21實際管理面臨的最大挑戰。現在看得越來越清楚了,解決上述難題的鑰匙是人工智慧,這是一場AI驅動的管理革命。AI也許是人類最後一個科技革命時代,AI驅動的管理也許是人類最後一場管理革命。為什麼要這麼講?我引用華為總裁任正非的話來說,黃仁勳說AI是這個時代最重要的技術,有人問我他說得對嗎?我說還會有下一個新時代嗎?下一個科技革命時代我是想像不出來了。正如穀德所說,第一台超智慧機器是人類最後一項發明,如果沒有下一個時代,如果談彎道超車?中國企業的機會在那裡呢?AI是我們面臨的最重要的一場管理革命,也是最後一場管理革命。在這場管理革命中要能跟上,不落伍,才是企業長期生存的關鍵。如果這個事情做不好,其他的都免談。(二)數位化和智慧化管理革命有兩個重要的方向第一,面向個人,即ToC領域的革命,把人的視野和智力無限擴大,把人從簡單的、重複的操作中解放出來。這種解放對​​於不同的人,就產生了不同的命運:勝任者可能處於更優越的地位,不勝任者就被大量裁撤。例如美國港口工人協會的罷工,其訴求是不在港口中採用無人AI自動化裝置,這會導致大量工人失業。華為在天津港做了一個無人的港口,不但效率提升了,品質提升了,而且節省了1200個員工。但天津港局並沒有把員工裁掉,而是把他們重新配置到顧客介面。這做了一個很好的示範,既推動了AI革命,同時又消化了AI革命所帶來的員工裁撤難題。第二, 面向產業,即ToB領域的革命,將針對解決橫亙在產業中的模糊性、不確定性難題,更深刻地改變產業的面貌。這是華為AI的重點。華為也搞ToC人工智慧,例如消費者BG,“BG”直譯是“集團”,也可以翻譯成“業務群”——因為整個企業叫集團,下面只是一個群組。在人工智慧應用領域,美國的人工智慧應用基本上就是ToC這塊很厲害,因為它的製造業已經空心化,而我們的人工智慧應用除了ToC,正是面向ToB領域。中國如果把這一仗打勝,那中國在世界上製造業的地位就不可同日而語了。因此,關鍵在於我們在關鍵技術及產品和軟體方面是不是準備好了?企業的領導人是不是下定決心「壓強投入」了?03. 華為的實踐:用燈塔照亮前進道路華為公司透過軍團等組織形式,在中國做出燈塔項目,向世界拓展,走出了一條非常富有策略性的前進道路。我舉幾個例子來說明。(一)鋼鐵業的成功合作案例華為和寶武集團合作的高爐模型,在這種大時延、高難度情況下把高爐爐溫和矽含量預測的準確率提升到92%以上,每噸鐵水節省10元以上,別小看了這10元的節省,僅寶武的產量,就能省下幾十億元。該計畫獲得國資委高價值場景認可;湘鋼、南鋼、永峰鋼鐵等都已經全面推廣複製。寶鋼高爐專家又結合與華為聯創的預測結果反過來去調整控制高爐輸入的內容。湘鋼AI大模型創新在2024年「人工智慧向善全球高峰會」上獲得國際電信聯盟全球人工智慧優秀創新案例獎。(二)電力產業的成功合作案例華為和陝西國網電力公司合作了六年,解決新能源連接到電網中以後帶來的難題。陝西國網和廣西南網都與華為軍團合作,實施配網數位化、智慧化改造,同時向業界首次發布配電網數位化評估指標標準,包括覆蓋率、線上率、完整率、成功率、辨識率、準確率。管理上有一條規則,叫「不能度量就不能管理」。所以,能夠準確且清楚地測量這個過程和結果,就能推動管理變革的改進。以陝西國網路為例,目標是打造一套可複製、可推廣、可演進的新型智慧配電網端到端解決方案,其核心是一套智慧物聯體系架構三大核心技術,包括雙模+融合終端+人工智慧,以及N個場景應用。實現配電網全要素(包括運作、故障、現損、計量、靈活異常監測、拓撲、運作、消納,以及計算等)透明化,提升供電可靠性和電網安全運行水平,支撐基層用電客戶雙滿意和國家的雙碳戰略。(三)水泥產業的成功合作案例華為在水泥產業和海螺水泥合作創新的成果非常顯著。世界水泥看中國,中國水泥看海螺,海螺是中國水泥中經濟效益、品質最好的企業,被用在國家許多重點項目。早在2024年4月,海螺水泥就與華為礦山軍團合作,從200多個水泥生產場景中辨識出「水泥品質預測尋優、水泥生產全域最佳化、安全生產智慧監控、皮帶機無人巡檢、智慧裝備問答」5大核心人工智慧場景。基於華為的數位轉型諮詢、雲端平台、盤古大模型的工具平台,推動了海螺水泥集團的智慧轉型,進一步優化了成本,發布了首個建材大模型。僅水泥窯爐優化一項,噸熟料煤耗降低了1%,水泥熟料品質預測準確度達到85%以上。由於產量大,效益非常顯著。2025年4月23日,由中國建築材料聯合會、海螺集團、華為聯合舉辦的水泥建材人工智慧大模型成果發布會,會上發布了建材的AI大模型,這是水泥建材行業全球發布的首個大模型,對行業智能化轉型具有里程碑意義。(四)油氣探勘產業的成功合作案例中石油東方物探公司透過與華為油氣軍團的合作,把一個地塊的地震資料處理和解釋從原來的需要十幾天時間,縮短到現在幾個小時就能走完,而且品質得到了專家的一致認可。再例如中油的FWI(一種高解析度的地震成像技術)效率提升了20倍,FWI的創新也是基於華為無線領域的積累,雙方聯創的結果彌補了中石油東方物探與美國競爭對手的差距。現在,此能力已融入他們自研的軟體,再配上華為的鯤鵬晶片,做成一體機,已經可以和西方廠家同台競爭了。(五)煤炭產業的成功案例仍以剛才提到的運輸環節生產過程改善為例,應用華為的視覺分析AI技術,突破了煤礦井下運輸的難題。眾所周知,AI辨識的異常樣本越多,檢測效果越好,但是煤礦井下光線暗,粉塵多,要把皮帶上的異物如錨桿、木頭、工字鋼等多種異常樣本全部收集起來難度很大,他們遇到的是煤礦業做AI設計的共性難題——缺少樣本。最後,專案團隊提出了一個新的解決方向——非正常即異常,沿著這個創新的解決方向,專案工程師們把需求和方案的設計初稿傳遞給雲EI(企業智慧)產品線,EI給他們推薦了盤古大模型技術,該技術主打的“低門檻AI開發和零樣本、小樣本優勢”,非常契合煤礦行業的井下作業場景。最終,專案實現了減少20-30%的井下作業人數、「用機器代替人」的減人目標。上述都是技術含量很高,在解決難題上有所突破、有所進展的典型案例。因此,對產業數位化、智慧化系統應用有著巨大的改造空間,當然還需要經歷很長的聯合創新過程,可能要10年、20年長期的創新過程。產業數位化、智慧化系統性的優化還是非常困難的,需要客戶夥伴和華為的持續努力,還需要很長的聯合創新過程,不是一蹴而就。華為公司從2018年起,已經陸續成立了9個產業數位化智慧化軍團,全面涵蓋油氣鋼泥冶礦、智慧化交通、數位金融、智慧電力、製造與大企業、智慧化公用事業、智慧化政務、網路服務供應商、智慧園區領域。這幾年的重點集中在大企業數位化智慧化的「燈塔」專案上,做出成功的模式,樹立產業標竿。然後與生態合作夥伴一起,將「燈塔」的成功模式向產業推廣,並逐步向國外擴展。04. AI科技驅動的管理革命的特徵第一,AI時代,數據價值發生了本質變化。AI智慧時代,AI的訓練和推理需要資料的高效使能,資料的價值發生了本質的變化,不再是冷資料、沉睡的資料。因此要求特別關注數據的質量,克服數據孤島,建立統一的數據底座。第二,AI是最後一次科技革命,也將帶來徹底的管理革命。古德認為超智慧機器可以設計出更好的機器,而人類的智慧將遠遠落後。因此,曾經的管理定義是同別人一起,或透過別人來實現組織目標的過程。而未來的管理將是與AI一起,或透過AI實現組織目標的過程。管理從定義上都會發生根本性的變化。第三,在人工智慧時代,世界只有第一,沒有第二。任總講,在人工智慧時代,世界只有第一,沒有第二。現在還在混戰的、內捲的領域,將來都會被先進企業的人工智慧橫掃。 「你們可以參考Google的人工智慧如何評估心臟健康,Google是靠千萬次、億次的機器學習才找到標準模型,並將這個心臟模型開放出來,全世界都在使用,世界上不再需要第二個模型了。在AI領域,對任何產業來說,就是突破和解決最尖端的那一點,抓住一個,紮實實實做好這一個,一旦突破,一覽眾山。AI要抓住解決產業難題的牛鼻子,不只是節省人工,關鍵在於提高競爭力。05. 巨大的機會和巨大的挑戰第一,我們在面臨巨大的機會和巨大的挑戰,AI在產業的應用是中國企業的巨大機會,也是巨大的挑戰;第二,減人不是增效的主流,要做就要做最難的。減人只不過是結果;第三,創新的本質不僅是降低成本,更是創造價值。把成本放在第一位,是一種收斂的管理;把創造價值放在第一位,才是一種開放的思考;第四,未來的競爭是生態圈的競爭。對廣大中小企業來說,要長久生存就要進入領導企業的生態圈。要是進不去領導企業的生態圈,被邊緣化,企業就不可能長久生存。AI科技與管理革命正向我們走來。星星點燈,最後點燃浩瀚的星空。謝謝大家! (華夏基石e洞察)
李飛飛 vs 施密特:超級智能,3年之內?還是遠未開始?
(沙烏地阿拉伯峰會,李飛飛vs施密特:關於超級智能的兩種未來)2025 年 10 月 29 日,沙烏地阿拉伯首都利雅德。在一場匯聚全球政商領袖的峰會上,史丹佛AI實驗室創始人李飛飛和前Google CEO 艾瑞克·施密特(Eric Schmidt)坐上了舞台中央:超級智能,真的要來了?我們來得及準備嗎?這不是泛泛而談的未來暢想,而是一場圍繞 AI 極限、財富重構、人類命運的真實交鋒。施密特給出激進判斷:超級智能可能 3 年內到來,將重新洗牌全球權力與財富。李飛飛則反問:AI連牛頓都成不了,真正的超級智能可能遠未開始。一個說 3 年,一個質疑能否實現。兩位頂級 AI 思想者給出了截然不同的答案。如果 AI 真是人類最後一項發明,你準備好了嗎?第一節|超級智能是什麼?兩人給出了截然不同的答案在這場對話的一開始,主持人問題就是:“超級智能到底是什麼意思?它什麼時候會到來?”李飛飛和施密特的回答,走向了兩個完全不同的方向。✦ 施密特的定義:超級智能,不是一個聰明的 AI,而是比地球上所有人類加在一起還要聰明的存在。他稱之為“總和等級的智慧”。人類智能你可以理解,因為我們就是人。你有想法,有朋友,會思考,也有創造力。超級智能呢?它可能知道我們所有人知道的東西,甚至更多。施密特說:“我認識一群人,住在舊金山,他們相信超級智能在未來3~4年就可能實現。”對他來說,這已經不再是會不會,而是多快。✦ 李飛飛的回應:她沒有直接否定施密特的判斷,而是把問題轉向了智能的本質:AI這個領域從一開始就是在挑戰“什麼是智能”。 我同意,有些 AI 能力已經超過人類,比如同時掌握幾十種語言,或者擁有幾乎無限的知識量。但我們還得問:它能成為牛頓嗎?它成為愛因斯坦或者畢加索嗎?兩種答案的分歧點在於:施密特看的是“能力堆積”:只要把知識堆得足夠高,智能就能超越人類;李飛飛看的是“創造力起點”:真正的智能,是在混沌中找到突破的那一刻。✦ 為什麼這場定義之爭重要?因為它決定了:我們是在製造工具,還是在創造“另一個物種”?施密特相信:技術突破很快就會跨過那條線。李飛飛提醒:別太快以為我們已經懂了智能的本身。如果我們連“超級智能到底是什麼”都還沒有共識,那我們該如何準備它的到來?這不只是學術之爭,而是關乎未來方向的根本選擇。第二節|AI能不能像牛頓一樣“發現”?第一節提出了一個問題:AI 能不能成為牛頓?現在,施密特和李飛飛要解釋:為什麼不能。施密特給出了一個技術層面的回應:假設你把 1902 年全世界能找到的科學知識,全都塞進一台電腦裡。問題是:它能發明相對論嗎?答案是不能。他解釋說,現在的 AI 在處理邏輯時,有個盲點:它不會把一個結論立刻反饋給自己,然後繼續往下推理。比如,一個數學家證明了一個定理,會立刻根據這個結果去想下一個問題。但 AI 不會。它記住了,卻不會用來連續推導。“今天的 AI,在做推理時不會像人那樣反覆思考,它只是做完就停了。”李飛飛從另一個角度補充:我們已經能讓 AI 做很多事情,但你把所有行星的運行資料喂給它,它還是沒法像牛頓那樣,自己推匯出“萬有引力”。施密特也承認這一點。也就是說:AI 擅長處理大量資料,效率很高;但它沒有“頓悟”能力,也缺少跨領域聯想的直覺。現在的 AI,大多數時候還是個超級助理:它可以整理資訊,但跳不出資訊本身。李飛飛最後強調了一點:人類最了不起的能力,是能提出別人沒問過的問題。她認為,這才是未來AI是否真正進化的關鍵。所以,如果我們要用 AI 解決未來的科學難題,就必須回答一個問題:它只能複述答案,還是能像科學家那樣,重新提問?無論是藥物設計、物理猜想,還是氣候預測,都繞不開這個問題。而從這段對話看,至少今天,它還做不到。第三節|效率會提升,財富不會共享如果 AI 真的越來越強,那下一個問題就是誰能從中受益?主持人提出了一個大膽的預設:AI 如果走向超級智能,我們會不會進入一個後稀缺社會(Post scarcity society)?就像有了Google搜尋之後,每個人都能免費獲取知識,那是不是也能人人用上 AI,享受醫療、教育、交通這些服務?聽起來很理想,對吧?但施密特卻先潑了盆冷水:“這是個非常美好的想法,但現實可能沒那麼平均。”AI 帶來的好處,可能會集中在少數人手裡。他用的是經濟學裡的說法:“網路效應”。意思是越早開始用、越有資源的一方,就越容易把優勢變成壟斷。他說:“每家使用 AI 的公司,幾乎都提升了效率。效率高了,財富就會增長。但增長的財富,是不是所有人都能分到?很可能不是。”在沙烏地阿拉伯,AI 只要把石油網路裡的調配最佳化 10%,這個國家就能節省數十億美元。又比如,在醫療和藥物開發中:AI 能加快新藥審批,降低試驗成本。做得快,做得準,企業就更賺錢。這些都是真實收益。但他緊接著說:你可以想像,這些收益只會集中在少數幾個國家、少數幾家公司,還有那些資本集中的人手裡。李飛飛也認同 AI 能提升效率,但她特別提醒:效率不等於共同繁榮。你得承認,技術本身不會主動去解決分配的問題。換句話說,AI 能把事情做得更好更快,但有錢買、會使用,才是真正的門檻。所以誰會落後?施密特點名了一個最危險的區域:非洲。他們沒有穩定政府、強大大學體系、關鍵工業結構,很多地方將難以參與這場 AI 革命。他直言:“它們已經落後很多年了,而現在,可能會被甩得更遠。”就算在歐洲,也存在問題。他說,能源貴、資金難拿,很多國家想建 AI 資料中心,卻根本負擔不起。他的建議是:不行就找合作方。比如法國就與阿布扎比合作,用別人的資源來建設 AI 能力。李飛飛也強調了同一件事:“每個國家都該投資人才、技術和教育生態,不能靠別人。”她沒有說 AI 一定讓世界變得更公平。相反,她的意思是:誰不投入,就會被落下。AI 不會自動把紅利送到你手裡。想要從中受益,就要儘早準備,國家如此,個人也如此。而不行動的,會被遠遠甩在後面。第四節|AI 到底是來幫人,還是來替人?討論完 AI 能做什麼,該問問人類還剩什麼了。樂觀的人說它能提高效率,悲觀的人擔心它會取代所有崗位。主持人把問題擺到了檯面上:如果超級智能能做所有的科學研究、經濟決策、生產設計……那人類在這個世界裡,還剩下什麼角色?✦ 施密特:人類和AI,會組成“搭檔組合”他不是那種完全樂觀的人,但他始終堅持一點:未來真正強大的,不是 AI 單打獨鬥,而是人類和 AI 的組合。他說了一個賽車例子。我們都知道,機器人能開得比人快。但為什麼 F1 比賽我們還是想看真人在開車?因為人類有不可替代的魅力,我們就是想看人做到的事。他的意思是,那怕 AI 技術全都到位,人類的好奇心、審美和創造衝動,也不會被替代。我們會想看人類在挑戰邊界,而不是機器演示流程。他甚至想像了一幅畫面:“以後可能會出現兩種比賽:一種是人類之間的,另一種是 AI 之間的。 但我們會更關注人和 AI 一起完成什麼,而不是誰贏了。”✦ 李飛飛:AI再強,也不能忘了“人的能動性”她的回應,情緒更強烈,底線更清晰:我非常擔心,在超級智能的討論中,我們會忘記人類的價值。她強調了兩個關鍵詞:尊嚴和能動性。無論技術走多遠,都必須記住,這個世界不能讓人類被邊緣化。人必須始終是中心。她說,那怕 AI 再聰明、再全面,也不能讓它替我們做選擇。兩人的分歧很清楚:施密特願意讓 AI 干更多事,但人類不會因此失去價值。李飛飛堅持:那怕 AI 做得再多,決定權也必須握在人手裡。歸根結底:誰來定義未來?是 AI,還是我們自己?第五節|李飛飛在做什麼?重建現實世界前面討論的都是超級智能會帶來什麼影響,但 AI 具體會以什麼形態進入我們的生活?這是李飛飛正在做的事。主持人問:我的14歲兒子已經把大部分時間花在虛擬遊戲裡了。等 AI 越來越強,我們是不是都要搬進虛擬世界?李飛飛給出了肯定的回答:“是的,我們未來的生活,會更像一個多元宇宙。不是離開現實,而是現實和虛擬會完全混在一起。”✦ 這不是科幻設想,而是她正在做的事World Labs,李飛飛創立的新公司,專注建構世界模型。她說:人類不光有語言能力,還有一種空間智能。我們能看懂三維世界,能想像空間、動作、因果關係。而過去的 AI 只學語言,沒辦法理解這些。於是她就幹了這件事:訓練 AI 理解空間、物理和互動,就像人一樣。現在,她的團隊的最新成果叫:RTFM。它的全稱是 Real-Time Frame Model,意思是 AI 能即時生成 3D 場景,而且還能記住它自己生成的世界是什麼樣。這不是做一段視訊,而是建構一個你可以走進去、可以互動的持久空間。✦ 那這個“世界模型”能用來幹嘛?她舉了幾個非常具體的例子:醫療手術訓練:未來醫生不一定非要在人身上練習,而是可以在AI建構的手術空間裡反覆演練教育場景:孩子可以進到AI生成的古代城市,邊學歷史邊親身體驗城市規劃:建築師可以把一整座新城區在 AI 中預演一遍,再決定要不要修換句話說:我們未來的大量工作、學習、娛樂,都會發生在這些 AI 生成的世界裡。✦ 這不是逃避現實,而是重新建構現實李飛飛認為,AI 正在從輸出文字進化到建構世界。而這個世界,不是用來看一眼的,而是用來生活的。施密特也認同這個方向。他甚至預測:“未來某一天,AI 可能會告訴我們:‘我需要更多能源,我自己來設計一種新方式。’那就是 AI 開始自己推動物理世界的轉型。”說到底,這是 AI 角色的轉變:過去,AI 是回答者;現在,AI 是建構者;未來,AI 可能會成為世界的重組者。我們正站在這個轉折點上。結語|你是觀眾,還是參與者?施密特說:超級智能可能 3 年內出現,從研究、能源到軍事、政策,都會被重寫。李飛飛說:AI 連萬有引力都推導不出來,真正的超級智能可能遠未開始。3年,還是遠未到來?這不只是時間判斷,而是關於 AI 本質、人類角色、未來主導權的根本分歧。但無論答案是什麼,有一點是確定的:不是 AI 有多強,而是人類準備得夠不夠快。現在,你得問自己:如果 AI 真的在改變一切,你是觀眾,還是參與者? (AI深度研究員)
OpenAI公佈超級智能路線圖:模型明年有望重大飛躍,2028年實現全自動AI研究員,基建投資承諾1.4兆
OpenAI設定兩個關鍵節點:2026年9月實現AI研究實習生,能夠通過消耗大量計算資源有效加速內部研究;2028年AI研究員可自主完成大型研究項目。Altman指出,到2028年科學研究將完全由AI自動化,AI系統將能夠推動科學前沿發展。截至目前OpenAI已承諾建設總計超過30GW基礎設施,對應未來數年內總計約1.4兆美元投資。Altman強調,1.4兆美元只是起點,正討論更宏大願景。預計未來六個月內模型能力將有巨大飛躍。美東時間28日周二,OpenAI宣佈公司重組完成後,CEO Sam Altman和首席科學家Jakub Pachocki通過一小時直播首次公開了實現超級智能的具體時間表。公司已承諾在資料中心基礎設施上投入約1.4兆美元,對應約30吉瓦的算力容量,並計畫建立每周新增1吉瓦算力的"基礎設施工廠"。Jakub Pachocki在直播中表示,深度學習可能在不到十年內將人類帶入超級智能時代。OpenAI設定了兩個關鍵節點:2026年9月實現AI研究實習生,能夠通過消耗大量計算資源有效加速內部研究;2028年3月實現全自動AI研究員,可自主完成大型研究項目。Sam Altman強調,為支撐這一時間表,OpenAI正從AI助手轉型為平台服務商,目標是讓外部開發者在其平台上創造的價值超過OpenAI自身創造的價值。他表示,公司最終需要達到數千億美元年收入以支撐基建投資,企業服務和消費者業務都將是重要收入來源,IPO是最可能的融資路徑。OpenAI 的內部模型目前尚未遠超已發佈的版本,但對在2026年9月前實現重大飛躍非常樂觀。預計到2026年9月,極有可能見證模型質量的巨大飛躍。此外,預計未來數月乃至數年內還會有重大進展。OpenAI並未給出發佈GPT-6的具體時間表,但表示產品發佈的節奏將不再與研究計畫嚴格繫結。例如 GPT-5 首次將推理模型作為旗艦產品推出,這本身就是一個重大的整合性工作。但可以確定,未來六個月內、甚至更早,模型能力將有巨大飛躍。此次直播圍繞研究、產品和基礎設施三大支柱展開,披露了OpenAI對AGI發展路徑、安全框架和商業模式的最新思考。公司同時公佈了新的組織架構,由非營利性質的OpenAI基金會控制公共利益公司OpenAI集團,前者初期持有後者約26%股權。超級智能時間表:從研究實習生到全自動研究員Jakub Pachocki詳細闡述了OpenAI的研究路線圖,核心聚焦於深度學習的規模化訓練。他指出,AGI這個詞可能低估了技術進步的潛在規模,OpenAI內部相信距離實現超級智能——在眾多關鍵維度上超越所有人類的系統——可能已不足十年。OpenAI使用"任務時間跨度"來衡量模型能力進展,即模型完成任務所需時間與人類專家的對比。當前一代模型的水平約為5小時,可從其在國際數學或資訊學奧林匹克競賽中與頂尖選手相媲美的表現看出。Jakub表示,這個時間跨度將繼續快速延伸,不僅源於演算法創新,也來自"上下文計算"或"測試時計算"等新維度的規模化。基於這些預期,OpenAI設定了明確的內部目標。2026年9月前,開發出能力足夠強的AI研究實習生,能夠通過消耗大量計算資源有意義地加速內部研究人員工作。更長遠的目標是在2028年3月前,開發出能夠自主完成大型研究項目的全自動AI研究員。Jakub強調,整個研究計畫圍繞一個核心展開:加速科學發現和新技術發展,這將從根本上改變人類技術進步的速度。Sam Altman在問答環節中補充,AGI的到來將是一個持續數年的過渡過程,而非單一時間點。他特別指出2028年這個節點,屆時科學研究將完全由AI自動化,AI系統將能夠推動科學前沿發展。關於內部模型進展,他表示並未雪藏某個極其強大的模型,但有許多已開發的技術元件,當這些元件組合在一起時將帶來巨大能力飛躍,預計未來六個月內模型能力將有顯著提升。五層安全框架:從價值對齊到系統性保障隨著系統能力向超級智能邁進,Jakub Pachocki提出了一個將安全問題結構化的五層框架,從模型最核心的內部因素延伸到最外部的系統保障。最核心的是價值對齊,關乎AI最根本"關心"的是什麼。Jakub解釋,當系統變得極其聰明、思考時間極長、處理的問題超越人類能力極限時,給出完全無懈可擊的指令會變得異常困難,因此必須依賴更深層次的對齊。第二層是目標對齊,關注AI如何與人互動以及遵循指令的表現。第三層是可靠性,即AI能否精準校準預測、在簡單任務上保持可靠並在困難任務上表達不確定性。第四層是對抗性魯棒性,側重於AI能否抵禦來自人類或其他AI對手的蓄意攻擊。最外層是系統性安全,包括系統安全性、AI可訪問的資料範圍、可使用的裝置等外部限制。Jakub特別介紹了一項名為"思維鏈忠實度"的研究方向。這項可解釋性技術的核心思想是,在訓練過程中刻意讓模型內部推理的某些部分不受監督,從而讓這部分推理過程能夠更忠實地反映模型真實所思所想。他表示,經驗性結果非常理想,OpenAI內部大量使用該技術來理解模型訓練過程中的演變,並與外部合作者成功用它研究模型的欺騙傾向。這項技術具有可擴展性,但也很脆弱,要求在演算法和產品設計中劃定清晰界限。例如,ChatGPT中對思維鏈進行總結的功能,就是為了避免將完整思維鏈直接暴露給使用者。Jakub解釋,如果思維鏈完全可見,它就會成為使用者體驗的一部分,久而久之就很難再對其保持無監督狀態。基建擴張計畫:向兆美元級算力投資邁進Altman以前所未有的透明度公開了OpenAI的基礎設施建設計畫。Altman周二表示,截至目前OpenAI已承諾建設總計超過30吉瓦(GW)的基礎設施,對應未來數年內總計約1.4兆美元投資。這些承諾基於OpenAI目前對收入增長和融資能力的評估。這一投資涉及眾多合作夥伴,包括AMD、博通、Google、微軟、輝達、甲骨文、軟銀等晶片、資料中心、能源和製造領域的公司。Altman強調,1.4兆美元只是起點,OpenAI正在積極討論更宏大的願景。Altman表示,OpenAI的願景是建立一個基礎設施工廠,能夠以每周1GW的速度創造算力,同時將成本大幅降低,目標是在裝置的5年生命周期內,將每GW成本降至約200億美元。他承認,實現這一願景需要海量創新、更深入的合作、巨大的收入增長,甚至需要重新調整OpenAI在機器人領域的思路,讓機器人幫助建設資料中心。Altman在問答環節中指出,要支撐1.4兆美元的投資,公司年收入最終需要達到數千億美元,"我們正處在通往這一目標的陡峭增長曲線上"。他預計企業服務將是重要收入驅動力,但也看到了從消費者獲取收入的方式,不僅限於月度付費訂閱,還包括新產品和裝置等。關於IPO計畫,Altman表示,考慮到公司巨大的資本需求和規模,IPO是最可能的路徑,但目前沒有具體計畫或時間表。"考慮到我們的資本需求以及公司規模,可以說這對我們而言是最可能的路徑,"他說。平台化轉型:從超級助手到AI雲生態Sam Altman闡述了OpenAI在產品層面的戰略演進。他表示,過去OpenAI的產品形態主要是以ChatGPT為代表的AI超級助手,現在正朝著更宏大的目標演進——成為一個平台,一個其他人可以在其上建構應用和服務的"AI雲"。Altman引用比爾·蓋茲的觀點定義平台成功:當其他人基於平台創造的價值超過平台建構者自身創造的價值時,平台就成功了。這正是OpenAI明年的目標。他表示,憑藉現有的技術、使用者基礎和框架,OpenAI能夠推動全世界在其平台上建立出驚人的新公司、服務和應用。為實現平台化轉型,Altman強調了兩個基礎原則。首先是使用者自由,如果OpenAI要成為供全世界不同人群使用的平台,就必須承認人們有截然不同的需求。雖然會有一些寬泛的邊界,但OpenAI希望使用者在使用AI時擁有大量控制權和定製化能力。他多次重申"像對待成年人一樣對待成年使用者"的原則,承諾隨著年齡驗證等機制完善,將給予成年使用者更大的自由度,尤其在創作等領域會大幅放寬限制。其次是隱私保護。Altman指出,隨著AI成為基礎平台,人們與AI的互動方式非常私密,會像對醫生、律師或配偶一樣與之交談,分享生活中最隱秘的細節,因此需要以不同於以往技術的方式思考隱私問題。在產品規劃上,OpenAI描繪了一個層級架構:底層是晶片、機架、資料中心和能源等硬體基礎;中間層在硬體之上訓練模型並建構帳戶體系;應用層推出了名為Atlas的瀏覽器,並計畫未來幾年推出硬體裝置;最令人興奮的是頂層的生態系統,人們將利用OpenAI的API、ChatGPT內的應用、企業平台和帳戶建構服務。新公司架構與基金會使命為支援上述計畫並確保服務於核心使命,OpenAI對公司架構進行了重大調整。新架構由兩部分組成:頂端是非營利性質的OpenAI基金會,擁有對公司的最終控制權,董事會隸屬於基金會;基金會之下是公共利益公司OpenAI集團。基金會將掌控OpenAI集團,初期持有其約26%股權,如果公司表現出色這一比例未來還可能增加。Altman表示,基金會的目標是成為有史以來最大的非營利組織,利用其資源追求AI帶來的最大化社會福祉。OpenAI集團將更像普通公司一樣運作,以便吸引研究所需的龐大資源,但依然受到與基金會相同的使命約束,尤其在安全問題上必須以使命為唯一準則。基金會公佈了兩個初步重點方向。首先是投入250億美元利用AI幫助治癒疾病,資金將用於生成資料、提供計算資源、資助科學家等。其次是AI韌性,這是一個比傳統AI安全更廣泛的概念。聯合創始人Wojciech Zaremba解釋,先進AI的到來必然伴隨風險和顛覆,AI韌性的目標是建立一個由眾多組織構成的生態系統共同解決這些問題。他用網路安全行業發展類比:網際網路早期人們不敢線上輸入信用卡號,而現在龐大的網路安全產業保護著關鍵基礎設施,使人們願意將最私密資料放線上上。同樣,AI領域也需要一個"AI韌性層",OpenAI基金會將幫助催生這樣一個生態系統。以生物風險為例,韌性不僅包括在模型層面阻止病毒學相關查詢,還包括建立快速響應機制,以便在問題發生時有效應對。 (invest wallstreet)
AI智能體的夢想與現實
你是否也曾幻想過,能擁有一個像鋼鐵人的“賈維斯”那樣的AI助手?它聰明、可靠,能打理工作、安排生活,甚至讀懂你的心思——動動嘴皮子,一切就已安排妥當。  這樣的場景曾只屬於科幻電影,而今天,它正以“AI智能體(AI Agent)”之名,快步走向我們的現實。科技公司紛紛投入重金,工程師們不斷突破技術邊界,AI智能體已從概念逐步落地:它們能編寫程式碼、訂餐廳、做調研,甚至替代部分人類工作。  然而,夢想的光芒之下,挑戰與疑問也從未停止:  - 當前的AI智能體,到底做到了多少?做不到的又是為什麼?  - 它真能成為每個人的全能助手,還是僅停留在“看起來很美”的階段?  - 背後的環境成本、安全風險與社會影響,我們又是否準備好了面對?  我們不僅關注AI“能做什麼”,也更關心它“該做什麼”;不僅看到進步,也直視侷限。這是一段關於技術創新、人類願景與現實約束的故事——而它,才剛剛開始。AI 智能體(AI Agent)仍是“科幻”?還沒到火候,但它們正飛速進步這一切是如何開始的這一切都始於賈維斯(J.A.R.V.I.S.)。沒錯,就是漫威電影裡的那個賈維斯。  當然,真正的起點或許並非鋼鐵人的AI助手,但這個虛構系統的確極大地推動了AI智能體(AI Agent)概念的普及。每當我採訪AI行業的從業者關於智能體技術時,他們總會以賈維斯為例,描述理想中的AI工具該有的樣子:它能在你開口之前就明白你的需求,能分析海量資料並提煉洞察,還能提供戰略建議或替你打理部分業務。雖然人們對AI智能體的精確定義仍有分歧,但其核心在於,它超越了傳統聊天機器人——這是一種能夠替你執行多步驟複雜任務的系統,無需與你反覆溝通。它會自動生成一張“待辦清單”,通過完成子任務來實現你設定的最終目標。這一幻想在許多方面已接近現實,但對普通使用者的實際用途而言,目前仍存在大量缺陷——甚至有些問題可能永遠無法解決。  “AI智能體”這一術語早已存在,但它在科技行業的走紅尤其始於2023年。那一年是AI智能體的“概念之年”:人人都在討論它,試圖理解其內涵並探索落地路徑,但成功的用例寥寥無幾。到了2024年,行業進入了“部署之年”:人們開始將程式碼真正投入實踐,檢驗其能力(而當時的答案是……效果有限,且充滿了錯誤提示)。  AI智能體的熱潮,我認為可以追溯到一個具體事件:2024年2月,金融科技公司Klarna宣佈,其基於OpenAI技術的AI助手在上線一個月後,成功完成了相當於700名全職客服的工作量,並自動化處理了公司三分之二的客服聊天。此後數月,幾乎我參與的每一場AI行業討論,都繞不開這組資料。  熱潮並未消退。隨後的幾個月裡,幾乎所有科技巨頭的CEO都在財報電話會議上反覆強調這一概念。亞馬遜、Meta、Google、微軟等眾多公司的高管開始公開表態,承諾打造實用且成功的AI智能體,並投入真金白銀將其實現。發展現狀如何最初的願景是,有朝一日,AI智能體將能包辦一切:從為你預訂行程,到生成商業演示的視覺素材。理想中的工具甚至能根據你和朋友的日程安排、飲食偏好和禁忌,找到一個合適的聚會時間和地點——然後自動預訂餐廳並為所有人建立日曆日程。  現在來聊聊“AI程式設計”這件事:多年來,AI程式設計一直是整個智能體行業的支柱。如果你問任何人,目前(而非遙遠未來)現實生活中存在那些成功、不令人反感的AI智能體應用案例,他們幾乎只能舉出AI程式設計這唯一一個具體的例子。許多工程師都在用AI智能體輔助程式設計,而且普遍認為它們確實做得不錯。事實上,在微軟和Google,高達30%的程式碼現已由AI智能體編寫。對於OpenAI和Anthropic這樣資金消耗巨大的初創企業而言,面向企業客戶的AI程式設計工具更是它們最重要的收入來源之一。  因此直到最近,AI程式設計仍是AI智能體在現實中最主要的應用場景。但這顯然並未惠及普通消費者。別忘了,最初的願景始終是打造一個面向“普通人”的全能型AI智能體。我們尚未完全實現這一目標——但到了2025年,我們比以往任何時候都更接近它。  去年十月,Anthropic率先推出了“電腦使用(Computer Use)”功能,使Claude能夠像人類一樣操作電腦:瀏覽網頁、執行搜尋、訪問不同平台並代替使用者完成複雜任務。業界普遍認為這是一次技術飛躍,但實際評測發現,其表現仍遠未達到理想狀態。時間跳到2025年1月,OpenAI發佈了同類產品Operator,並將其宣傳為一款能填表、買菜、訂行程甚至製作表情包的工具。然而實際使用中,許多使用者反饋該工具運行緩慢、漏洞頻出且效率不穩定。但這無疑仍是重要的一步。緊接著二月,OpenAI又推出了“深度研究(Deep Research)”,這款智能體工具能為使用者編譯任何主題的長篇研究報告,進一步推動了技術發展。有人調侃這些報告只是“篇幅驚人而非內容出色”,但也有不少人對其能力深感震撼。到了七月,OpenAI將“深度研究”和Operator整合為一款產品:ChatGPT智能體(ChatGPT Agent)。它比之前大多數面向消費者的AI智能體工具更強嗎?毫無疑問。但它在實際應用中是否依然難稱完美?同樣毫無疑問。未來之路在何方要實現理想中AI智能體的願景,仍有很長的路要走;但從技術角度看,我們已站在了離夢想最近的起點。正因如此,科技公司正持續加大投入,通過增強算力、研發和人才儲備,全力推進智能體AI的發展。Google最近就聘用了Windsurf公司的CEO、聯合創始人及部分研發團隊成員,專門助力其AI智能體項目的推進。而Anthropic、OpenAI等企業也正你追我趕,一步步為智能體增加新功能,爭相將產品交到普通使用者手中(例如,Anthropic剛剛發佈了Claude的Chrome擴展程序,使其可在瀏覽器中直接操作)。  接下來,我們很可能會看到AI程式設計能力持續提升(遺憾的是,這可能將替代許多初級軟體工程師的崗位)。面向消費者的智能體產品也會逐步改進——過程或許緩慢,但趨勢確定。同時,企業和政府場景中的智能體應用將日益增多,尤其是在Anthropic、OpenAI和xAI等公司近幾個月相繼推出面向政府的AI平台之後。  總體來看,隨著AI智能體競爭加劇(以及熱度持續攀升),我們可以預期會出現更多試錯、起落、併購與整合。在這個過程中,我們都需要反覆思考一個問題:我們究竟希望概念中的“AI智能體”能為我們做什麼?是只替代繁瑣的事務性工作,還是連更具人情味的個人事務也交給它——比如幫你寫婚禮祝酒詞,或為送花附上一段溫馨留言?而在處理流程性任務與私人化事務之間,它們目前的表現又如何?(最後一個問題的答案是:現在還遠遠不夠好。)還有一點不容忽視除了AI(尤其是為智能體提供支援的大模型)所帶來的驚人環境代價之外,還有一個我們無法迴避的“房間裡的大象”。那就是:“能為你做任何事的更智能AI”未必總是好事——尤其當有人想用它來做壞事的時候,比如製造化學、生物、放射性和核武器(CBRN)。頂尖AI公司都表示,它們對此類風險越來越擔憂(當然,這種擔憂尚未讓它們停下發展的腳步)。  再來談談監管問題。許多人對AI可能帶來的影響心存恐懼,但大多數人並未充分意識到,這些“極度樂於助人、力求討好使用者”的AI智能體若落入惡意行為者手中(無論是國內還是國外),會帶來怎樣的潛在危險(例如“情緒駭客”、浪漫騙局等等)。AI公司聲稱,憑藉自願實施的安全防護措施,它們已領先於風險。但更多人認為,這個問題可能需要外部力量的徹底審視與監管。 (WhaleThinking)
《掌握AI未來趨勢:輔大與人力銀行聯合發布AI人才需求調查報告》輔仁大學人工智慧發展中心於2025年5月12日舉辦「AI人才培訓與應用案例策略研討會」,會中與1111人力銀行共同發布「AI人才需求調查」,揭示台灣產業界對AI人才布局與前景,同時呼應即將於5月20日登場的台北國際電腦展「AI Next」主軸。調查結果顯示,79.78%受訪企業已導入AI技術,將近4成企業認為AI顯著提升營運效率,帶來競爭優勢。然而,多數企業仍面臨人才痛點,包括「無明確的AI人才職能標準」(13.32%)和「難以找到具備實作經驗的AI人才」(13.28%),成為企業數位轉型的主要障礙。在AI人才需求方面,企業最急需的三種人才類型為:AI基礎架構與運維人才(37.24%)、AI資安倫理與治理人才(33.15%)及AI商業與戰略人才(30.89%)。關鍵技能則以Python/R程式開發能力(43.45%)為首,其次為資料工程(27.43%)和AI模型部署(26.5%)。輔仁大學人工智慧發展中心主任謝邦昌教授表示,AI人才已成為推動組織創新與提升競爭力的致勝關鍵,「得人才者得天下」。數位發展部國家資通安全研究院創院院長何全德強調,AI技術的普及必須以安全與法治為基礎。台灣微軟總經理陳守正則指出,企業需要的是能夠整合領域知識、優化業務流程並推動數位轉型的跨領域專業人才。為解決產業AI人才缺口,輔大人工智慧發展中心將建立系統化的人才培訓體系,推動AI素養教育擴展至各領域,並持續與產業夥伴合作,深化產官學合作,建立AI人才培訓認證制度,確保台灣AI人才能與國際接軌,協助台灣掌握數位轉型契機。