#AlphaGo
Google財報告訴你AI是不是真未來?
本文繼續聊AI類股美股的另一個大牛——Google。聊輝達的時候,微哥說過,這一輪AI大爆發,首先的爆點是大語言模型,而大語言模型的爆發靠的是三要素,一個是神經網路演算法,一個是巨量的網際網路資料,一個是算力爆發。這三要素中的算力爆發的最大貢獻者,是輝達。三要素中的神經網路演算法,我們知道是被譽為AI之父的辛頓提出來的,也拿了圖靈和諾貝爾獎,而大模型之所以成功,還有Google演算法團隊的重要貢獻。為什麼這麼說呢?這一點微哥還是有點發言權的。因為微哥在工作中會用到很多人工智慧演算法,所以也會瞭解學習這些演算法發展的歷程極其對應的文章。雖然辛頓最早提出了神經網路演算法,但是目前大模型用的模型演算法架構,相比較辛頓提出來的那個版本,那已經升級改造了不知道多少個版本了。在這一過程中,目前大語言模型用到的最核心的Transformer架構,就是Google的研發人員提出來的。第一個大語言模型Bert,也是Google做出來的。第一個把圖像用於Transformer架構,從而使得大語言模型變成現在的多模態大模型,也是Google提出來的。所以從這裡可以看出來,Google對於大模型的誕生和發展,起到了很重要的工程作用。雖然第一個大語言模型ChatGPT是Open AI做出來的,但是業內人士都知道,Open AI的很多AI人才,都是從Google挖過去的。而且Google在大模型上的能力,很快就通過Gemini 3追了上來。這還是源自於Google在AI領域長期的資源投入,特別是人才的投入,使得其在AI領域的積累,很快就得到了體現。這也叫厚積薄發。比如大家熟知的Google做的AlphaGo擊敗了世界圍棋冠軍李世石。精準預測蛋白質結構,解決生物學50年難題的AlphaFold,還讓Goolge Deepmind老大哈薩比斯拿到了諾貝爾。這些工作,都可以體現出Google的AI能力,是全球首屈一指的。所以這也是這一輪AI革命到來,包括巴菲特、段永平、李錄、但斌、邱國鷺等投資大佬們紛紛加倉Google的一個很重要的原因。Google確實是一家對利潤之上還有追求的高科技公司,我們都知道,他是一家做搜尋發家的公司,當然現在的業務基本盤也仍然是搜尋。但是他還做了很多其它的工作,除了前面說的AI,我們現在所有非蘋果手機用的作業系統Android,也是出自於Google的免費開源。之前輝達文章說了,輝達AI產業鏈中上游賣基礎設施的。中下游無論行不行,都要買輝達的基礎設施。而Google是既處於AI產業鏈的上游,也處於產業鏈的中游,當然也有產品涉及到下游的。上游是因為Google雲,因為Google雲是給所有AI應用提供算力服務的。當然Google也要買輝達的裝置,但是資料中心的建立,是由Google這類雲廠商去做的。未來使用者買的token(AI算力的最基本單位),都是雲廠商提供的。除了買輝達的晶片,Google也在自己做,比如TPU就是非常有名。當然TPU當下主要是自用。中游就不用說了,Gemini這個大模型也是讓Google能夠後來居上,甚至略超ChatGPT的產品。當然大模型的版本也在不斷迭代和競爭之中,鹿死誰手,還未可知。但是大機率是有Google的一席之地的。下游比如Google眼鏡之類的智能硬體,當然這一塊還不怎麼賺錢啊。但是未來可能會大爆發。輝達的業績已經充分體現了AI類股,至少上游基礎設施建設上是沒有泡沫的,是有業績支撐的。那麼本文我們看看Google,作為AI類股應用最最重要的領導者,AI在Google2025年財報中有那些體現?是不是真的有泡沫呢?整體業績出色2026年2月,Google母公司Alphabet發佈2025年第四季度及全年財報,這份年報是Google生成式AI全面商業化元年裡,科技巨頭交出的最具代表性的答卷之一。Google第四季度,營收1138.28億美元,同比增長18%;淨利潤(非GAAP和GAAP一致)344.55億美元,同比增長30%。全面超出華爾街預期。全年營收首次突破4000億美元大關,達到了4028.36億美元,同比增長15%;淨利潤(非GAAP)達1402.8億美元,同比增長35%。GAAP淨利潤為1321.70億美元,低於非GAAP淨利潤,核心差異來自:剔除了歐盟反壟斷35億美元一次性罰款、Waymo自動駕駛業務21億美元一次性員工股權激勵費用、併購相關無形資產攤銷等非經營性、非經常性支出。分季度來看,公司營收增速逐季加速,Q1-Q4營收分別為902億美元、964億美元、1023億美元、1138.28億美元,同比增漲14%、15%、16%和18%。這個資料增速雖不如輝達那般炸裂,但也是很漂亮的,特別是那麼大體量,還能有這麼快的增速,而且淨利潤增速遠超營收增長。盈利增速遠超營收增速,核心源於兩方面:一是AI技術落地帶來的廣告變現效率提升,二是規模化效應下成本控製成效顯著,公司全年營運利潤率穩定在32%的行業高位。回顧過去5年,Google的營收是一直增長的,淨利潤除了2022年下滑之外,其餘年份都是增長的,且增速還不低。5年時間,營收增長1.6倍,淨利潤增長1.8倍,這麼大的體量,這個增速,還是非常可觀的。大象仍然在飛舞。所以千萬不要覺得,一個公司體量太大,就沒有增長空間了,其實不然,一定要認真去研究。就像邱國鷺說的,價值投資,不要去追星星,而是找月亮。大公司,各方面都很強的時候,即護城河足夠深的時候,往往還會有一定的成長空間,在便宜的時候介入,是很不錯的投資機會。Google2025年這份財務資料證明,Google並未因AI的巨額投入陷入“增收不增利”的困境,反而實現了技術投入與商業回報的正向循環。此外,2025年公司全年經營活動現金流淨額達1640億美元,自由現金流725.5億美元,期末現金及短期投資規模超1800億美元,無短期有息債務壓力,為AI技術研發、基礎設施投入提供了充足的安全墊。尤為值得關注的是Google的資本開支,2025年Google全年資本開支達914.47億美元,同比增長77%;2026年資本開支預計將達到1750-1850億美元,同比接近翻倍,其中60%將投向伺服器(含TPU晶片),40%用於資料中心及網路裝置建設,重點支撐AI基礎設施擴張與雲業務全球佈局。這就是輝達業績巨好的原因之一,雲廠商在瘋狂的砸錢搞AI,建資料中心。這麼巨額的資本開支,是非常罕見的。相當於把一年的淨利潤全部砸向AI,還把去年的資本積累也砸進去,可見科技巨頭們是多麼看好AI啊。所以AI在Google身上目前看來除了砸的錢多之外,業績上還是有幫助的,所以所謂泡沫,沒什麼好擔心。畢竟AI革命才剛剛開始,未來的想像空間確實非常大。AI技術從概念落地為核心增長動力,Google雲完成規模化盈利的關鍵跨越,同時公司以翻倍的資本開支計畫,宣告了All in AI的長期戰略決心。分業務看Google的業務主要包括Google服務、Google雲和其它的前沿業務,絕對核心就是Google服務,包括Google搜尋及其他廣告業務、YouTube生態。(一)Google服務:絕對核心壓艙石,AI啟動傳統業務新活力Google服務類股2025年全年營收約3370億美元,佔公司總營收的83.6%,營業利潤約1280億美元,佔總營業利潤的99.2%,始終是公司的現金牛核心。該類股的增長核心源於AI對傳統業務的深度改造,打破了市場對 “搜尋廣告進入成熟期” 的悲觀預期。細分業務中,Google搜尋及其他廣告業務是核心中的核心,全年營收2245.3億美元,同比增長13.3%。第四季度營收630.73億美元,同比增長17%,增速較上年顯著加快。增長的核心驅動力是Gemini大模型對搜尋體驗的全面重構,AI概覽與AI 對話模式顯著拉長了使用者會話時長,AI模式下的使用者查詢時長達到傳統搜尋的3倍。美國市場日均AI模式人均查詢量自發佈以來實現翻倍,極大地拓展了廣告庫存的展示機會,同時AI驅動的推薦演算法顯著提升了廣告轉化率,吸引了零售、旅遊等垂類廣告主的強勁投放。YouTube生態實現里程碑式突破,2025年全年廣告+訂閱總收入突破600億美元,第四季度廣告營收113.83億美元,同比增長9%,付費訂閱使用者總量達3.25億。其中,YouTube Premium、NFL賽事版權訂閱帶動訂閱業務高速增長,Shorts短影片的流量規模與單小時變現效率持續提升,形成了“廣告+訂閱”的雙輪驅動模式,成為Google服務類股的第二增長極。此外,Google訂閱、平台及裝置業務全年同比增長17%,Google One雲端儲存、硬體生態的協同效應持續增強,使用者付費粘性穩步提升。(二)Google云:爆發式增長領跑,AI驅動規模化盈利拐點確立Google雲是2025年年報中最亮眼的類股,徹底完成了從“虧損燒錢”到“規模化盈利+高增速增長”的轉型,成為公司最核心的增長引擎。全年Google雲營收608億美元,同比增長36%,第四季度營收176.64億美元,同比激增48%,增速遠超公司整體業務水平。特別是盈利端,Google雲全年營業利潤139億美元,同比大幅增長128%,全年營業利潤率升至24%,第四季度單季營業利潤率突破30%,較上年同期提升超12個百分點,規模化盈利的拐點完全確立。增長的核心驅動力完全來自AI,第四季度基於Google雲生成式AI模型的產品收入同比增長近400%,Gemini企業版解決方案、AI基礎設施服務的企業需求爆發。全年超10億美元的大額交易數量超過此前三年的總和,截至年末未履行訂單規模達2400億美元。目前已有超12萬家企業使用Gemini模型,全球前20大SaaS公司中95%都在使用Google雲的AI服務,Google雲憑AI差異化優勢,正在持續縮小與AWS、微軟Azure的市場份額差距。全球雲市場市佔率如下表,Google雲雖然排名第三,與前兩名有差距,但是增速最快。這裡就可以真正看出來AI是在實實際際的在為公司雲業務創造價值。此外,插個題外話,阿里雲其實雖然是國內老大,但是相比較前面三位大咖,還是很小的。(三)其它的前沿業務:前沿探索持續投入,商業化處理程序緩慢以Waymo自動駕駛為核心的Other Bets類股(還有生命科學Verily、量子計算、智慧城市等前沿領域),2025年全年營收3.7億美元,同比下降8%,依然處於長期投入、商業化緩慢的階段。Waymo作為全球自動駕駛行業的領軍者,2025年實現了規模化擴張,已在美國6個城市落地自動駕駛出行服務,周均載客量超40萬人次,2026年計畫登陸倫敦、東京等海外市場,開啟全球化商業化處理程序。該類股是Google佈局未來的核心抓手,在量子計算、AI醫療、機器人等前沿領域的持續投入,為公司長期增長儲備了第二增長曲線,也延續了Google“登月文化”的創新基因。潛在風險這份年報既展現了Google在AI時代的強大競爭力,也暴露了其面臨的四大核心風險。其一,全球監管與反壟斷風險持續高企,作為全球搜尋、廣告與Android生態的絕對龍頭,Google在歐盟、美國、印度等市場持續面臨反壟斷調查,若未來出現巨額罰款、強制業務分拆等不利裁決,將直接衝擊其核心商業模式。其二,行業競爭持續加劇,在AI大模型領域仍面臨OpenAI、Meta的激烈競爭,搜尋業務面臨微軟Bing+ChatGPT的持續挑戰,雲業務市場份額仍顯著落後於AWS與Azure,巨頭間的AI軍備競賽將持續推高投入成本。其三,巨額資本開支的回報不確定性,2026年近1800億美元的資本支出已超過2025年全年經營性現金流,若AI商業化進度慢於預期,將顯著壓制公司利潤率與自由現金流水平。其四,業務結構單一風險仍未完全化解,2025年廣告收入佔公司總營收的比例仍超73%,宏觀經濟波動對廣告主預算的影響,也會給公司業績帶來不確定性。總結整體而言,2025年是Google從“全球搜尋巨頭”向“AI全端科技巨頭(“模型-基礎設施-產品-商業化”)”轉型的關鍵一年,這份年報證明了Google不僅擁有AI時代的核心技術能力,更具備將技術轉化為商業回報的成熟體系。同時以超預期的資本開支計畫,宣告了其在AI時代的長期競爭決心。儘管面臨監管、競爭與投入回報的多重挑戰,但憑藉深厚的技術積累、龐大的現金流儲備與全場景的產品生態,Google依然是AI時代最具競爭力的科技巨頭之一。後續業績核心,將取決於AI技術的迭代速度與商業化落地的最終效率。對於Google,微哥也會持續保持關注和分享。這些巨頭們財報後的資料,對於我們看AI發展會起到非常非常重要的作用,而不是盲從。 (微微價值投資)
AlphaGo勝局十年後:AI正在重塑職業棋手的思維方式
在首爾東部寧靜的弘益洞小巷深處,有一棟貼著褪色石磚的建築,門牌上寫著“韓國棋院"——這是韓國職業圍棋的管理機構。圍棋是一項古老的運動,在韓國有著神聖的地位。然而走進這棟樓,昔日棋手將手伸入木碗取子時發出的細微聲響,如今已被滑鼠點選聲所取代:棋手們弓身坐在顯示器前,在 AI 程序中復盤對局;另一些人圍坐在棋盤旁,爭論下一步最優落點,而教練則告知他們的選擇與 AI 的建議相差多少;還有人默默坐著,看 AI 程序與 AI 程序對弈。十年前,Google DeepMind 的 AI 程序 AlphaGo 擊敗韓國棋手李世石(Lee Sedol),震驚世界。此後數年,AI 徹底顛覆了這項運動,推翻了數百年來關於最優落子的原則,並引入了全新的思路。棋手們如今訓練的目標,是儘可能地複製 AI 的落子,而非創造自己的風格,那怕他們對機器的思維邏輯仍感到茫然。(來源:麻省理工科技評論)今天,不借助 AI,棋手幾乎不可能在職業舞台上立足。有人說這項技術耗盡了圍棋的創造力,也有人認為人類的創造空間依然存在;與此同時,AI 正在推動訓練資源的民主化,越來越多的女棋手因此得以躋身高段行列。對於世界頂尖棋手申真諝(Shin Jin-seo)而言,AI 是一位不可或缺的訓練夥伴。每天清晨,他坐在電腦前打開 KataGo。他因落子風格與 AI 高度契合而被冠以“申真智能”的外號,他追蹤那個代表程序最優建議的藍色光點,在數字棋盤上不斷調整棋子位置,試圖理解機器的思考邏輯。“我一直在思考 AI 為什麼會選擇這步棋,”他說。備戰對局時,申真諝將大部分清醒時間都花在研讀 KataGo 上。“這幾乎像一種修行,”他說。2022 年韓國棋院聯賽的一項研究顯示,申真諝的落子與 AI 建議的吻合度達 37.5%,遠高於研究中所有棋手的平均水平 28.5%。“我的棋風變了很多,”申真諝說,“因為我必須在一定程度上遵從 AI 的指引。”韓國棋院表示,已主動聯絡 Google DeepMind,希望促成申真諝與 AlphaGo 之間的對局,以紀念 AlphaGo 擊敗李世石十周年。Google DeepMind 發言人表示,公司目前暫無相關資訊可以披露。但若新的對局成真,在更先進 AI 程序上磨礪多年的申真諝對獲勝持樂觀態度。“AlphaGo 當時仍有一些弱點,我認為針對這些弱點可以擊敗它,”他說。規則圍棋是一種抽象策略棋類遊戲,起源於 2500 多年前的中國。兩位棋手輪流在 19×19 的棋盤上落下黑白棋子,通過包圍對手的棋子來佔領領地。這是一場令人歎為觀止的數學複雜遊戲。棋盤可能的局面數約為 10 的 170 次方,遠超宇宙中的原子數量。如果說國際象棋是一場戰鬥,圍棋便是一場戰爭:你在一角窒息對手的同時,還要在另一角抵禦入侵。為訓練 AI 下圍棋,海量人類棋局資料被輸入模擬人腦神經元網路的計算系統神經網路。AlphaGo 在擊敗李世石後被命名為 AlphaGo Lee,訓練封包含 3000 萬步棋局,並通過與自身進行數百萬次對弈加以精進。2017 年,其繼任者 AlphaGo Zero 從零開始學習圍棋,不研究任何人類棋局,僅依據規則與自身對弈,純靠自我博弈發展出落子策略。這種白板式學習方式不受人類知識侷限,被證明更為強大。訓練三天後,AlphaGo Zero 以 100 比 0 完勝 AlphaGo Lee。Google DeepMind 同年宣佈 AlphaGo 退役。隨後,一批受 AlphaGo Zero 啟發的開源模型相繼湧現。今天,KataGo 是韓國職業圍棋棋手使用最為廣泛的程序。它比 AlphaGo 更快、更精準,不僅能預測勝負,還能在任意時刻預測棋盤每個點位的歸屬。AlphaGo Zero 通過分析棋盤的局部小塊來拼湊出對整體的理解,而 KataGo 則學會了讀懂整張棋盤,對長遠戰略形成了更強的判斷力。它不僅學會了如何贏棋,更學會了如何最大化得分。這款軟體從根本上改變了人們的下棋方式。數百年來,職業棋手應對圍棋天文數字般複雜局面的方式,是發展出一套替代純粹計算的啟髮式原則:精妙的佈局策略為空白棋盤建立抽象秩序,早早搶佔角落被視為劃不來的交換,每一代棋手都在積累新的原則,充實這門學問的體系。然而,“AI 改變了一切,”韓國圍棋解說員朴正相(Park Jeong-sang)說,“曾經被視為常識的基本下法如今幾乎銷聲匿跡,而過去從未有過的技術則大行其道。”變化最為顯著的是佈局。圍棋從空白棋盤開始,前 50 手曾是抽象思考與創造力的畫布,棋手在其中刻下各自的個性與棋道哲學。李世石以充滿挑釁的落子風格著稱,擅長製造混亂;曾在 2017 年負於 AlphaGo Master 的中國棋手柯潔,則以靈動想像力令人眼花繚亂。如今,棋手們記憶的是同一套由 AI 建議的高效、精算型佈局套路。棋局的重心已轉移到中盤,在那裡,純粹的計算能力比創造力更為重要。AI 訓練導致了棋風的同質化。柯潔曾感嘆,看著同樣的佈局套路被無休止地重複,令人疲憊。“我和場下的觀眾感受完全一樣,看著很累,很痛苦,”他 2021 年在接受中國媒體採訪時說。每當有棋手突破慣例、落出出人意料的棋,觀眾便歡呼雀躍,但這樣的時刻已越來越少。2023 年的一項研究顯示,頂尖圍棋棋手超過三分之一的落子與 AI 建議相同。許多棋手表示,每局棋的前 50 手往往與 AI 的建議如出一轍。“圍棋已經變成了一項智力競技運動,”在 2016 年負於 AlphaGo 三年後退役的李世石說,“在 AI 出現之前,我們追求的是更高的東西。我是把圍棋當作一門藝術來學的,”他說,“但如果你的落子來自抄答案,那就不再是藝術了。”一些棋手說,下圍棋不再是開拓新領域,而是遵從一個超人神諭的指令。“我曾經通過推動圍棋技術的進步、呈現新的範式來激勵棋迷,”李世石說,“我下棋的理由已經消失了。”棋思留守賽場的棋手們正在嘗試重建自己的技藝,但很難辨清新的原則究竟是什麼。金彩瑛(Kim Chae-young)是世界頂尖女棋手之一,恬靜沉穩,從職業棋手父親那裡習得了這門技藝。然而當 AI 開始重塑圍棋,她發現自己不得不從頭來過。“我需要時間去拋棄自己以前學到的一切,”金彩瑛在與我共享螢幕、用游標指著 KataGo 建議的藍色點位時說,“多年來積累的直覺,原來是錯的。”她湊近顯示器,螢幕上顯示著每一步棋的勝率,沒有任何解釋。即便是金彩瑛、申真諝這樣的頂尖棋手,也無法理解 AI 的所有落子。“它好像是在用更高維度的方式思考,”她說。當她試圖向 AI 學習時,她補充道,“與其說是理性地推敲每一步棋,不如說是在培養一種直覺。”研究人員正努力破譯棋類 AI 程序中編碼的超人知識,以便人類也能從中學習。2024 年,Google DeepMind 的研究人員從 AlphaZero(AlphaGo Zero 的通用版本,同樣能夠下國際象棋)中提取出新的象棋概念,並通過象棋題將其傳授給國際象棋大師。棋手們迄今從 AI 系統中汲取的圍棋概念,“很可能只是你潛在可以學到的一小部分,”豐田工業大學芝加哥分校電腦科學家尼古拉斯·托姆林(Nicholas Tomlin)說,他是一項探究 AlphaGo Zero 中圍棋概念編碼的研究的共同作者。然而提取這些經驗依然困難重重。“頂尖棋手至今仍未能歸納出 AI 落子背後的一般性原則,”明知大學圍棋教授南志賢(Nam Chi-hyung)說。儘管棋手可以模仿 AI 的落子,但由於其推理過程如同黑箱,他們尚未從中提煉出圍棋新的範式。圍棋或許正處於一種認識論上的迷途之中。即便 AI 是一位深不可測的導師,它也是一位公平的導師。AI 極大地提升了女棋手的訓練條件,而這一群體長期以來在圍棋界處於弱勢地位。南志賢表示,數十年來,圍棋訓練意味著在頂尖男棋手門下學藝,最具競爭力的對局也集中在女棋手難以涉足的男性圈子裡。“女棋手從未有過那樣的歷練機會,”她說,“但現在她們可以跟 AI 學習,訓練環境大為改善。”從更宏觀的角度來看,AI 通過幫助所有棋手打磨佈局套路,縮小了棋手之間的差距。近年來,女棋手的排名持續攀升。2022 年,時任世界女子第一人的崔精(Choi Jeong)成為首位晉級國際大賽決賽的女棋手。她以凶悍好鬥的棋風被稱為“女子力士”,在決賽中迎戰申真諝,最終落敗,但這場對決為圍棋界女棋手開創了先例。2024 年,金彩瑛因在韓國圍棋聯賽後季賽奪冠而登上新聞頭條,她是那屆賽事中唯一的女棋手。AI 訓練賦予了金彩瑛全新的自信。用 AI 分析男棋手的對局,打破了他們看似無懈可擊的光環。“以前,我無法判斷頂尖男棋手的實力究竟有多強,他們感覺無堅不摧。現在,我知道他們也會犯錯,他們的落子並非總是妙手,”她說,“AI 打破了心理上的壁壘。”身份儘管 AI 在圍棋上的造詣已遠超任何棋手,棋迷們依然更願意觀看人與人之間的對局。“AI 程序之間的對弈,對棋迷來說並不好看,”解說員朴正相說,這類對局過於複雜,棋迷難以跟上,而且太過完美,缺乏緊張感。棋手可以複製 AI 的佈局套路,但到了中盤,棋盤演變出多到無法全部記憶的可能性,便需要依靠自己的判斷。棋迷樂於看到棋手犯錯、逆境翻盤,在棋盤上每一顆棋子裡流露個性。申真諝的棋風強硬好鬥,卻帶著一種機械般的沉著;金彩瑛則善於在最混亂的局面中遊刃有餘。“圍棋裡,每一步都是你自己的選擇,對手也用自己的選擇來回應,”27 歲的圍棋愛好者和業餘棋手金大熙(Kim Dae-hui)說,“看著這個過程展開,很有意思。”有金大熙這樣的棋迷在看,申真諝從自己的棋局中找到了意義。“我能下出一種只有人類才能講述的故事,”他說。退役後,李世石尋找一份能發揮人類優勢的新工作,開始製作桌游、巡迴演講,並在大學教學生下棋。“我在尋找一個我能享受、能擅長的新領域,”他說。然而近來,他對自己離開的那項運動重燃了希望。“下出一局完美棋局,是每一位圍棋棋手的夢想,”那是一局技藝精湛、沒有失誤、勢均力敵的棋手廝殺至刀刃邊緣的對局。“這就像一個海市蜃樓,”李世石笑著說,“也許 AI 能幫我們下出那樣一局完美的棋。”申真諝希望自己能做到這一點。對申真諝來說,AI 是老師、是夥伴、也是引路的北極星。“我或許是當今最強的人類棋手之一,但有 AI 在,我不能自滿,”他說,“AI 給了我繼續進步的理由。” (麻省理工科技評論APP)
10年頑疾ChatGPT一眼識破!AlphaGo時刻震撼全球醫療界
【新智元導讀】十多年,患者求醫無果、束手無策,但將所有病史輸入ChatGPT,病因竟被一眼識破:基因突變!微軟、OpenAI等巨頭的醫療AI已悄然登場,精準率超越專業醫生!未來的醫療,或將徹底改寫!AI又一次震撼醫療圈!一名患者被莫名病症折磨十多年,數十位醫生無解。直到他把報告輸入ChatGPT——AI一語中的:MTHFR A1298C基因突變!在Reddit上,這則消息傳瘋了!⚠️注意:在採納ChatGPT建議前,該患者和主治醫生多次溝通、反覆確認。請一定結合專業醫生意見,切勿完全依賴AI作為醫療依據。十多年來,患者一直被各種莫名其妙的症狀困擾。脊柱MRI、CT、抽血……能查的都查了,還是一頭霧水。後來,他還做了功能醫學檢測,意外發現他有一種純合子突變:MTHFR基因A1298C突變。這是一種常見的亞甲基四氫葉酸還原酶MTHFR基因變異,而最常見的變異被稱為MTHFR C677T。每個人都有兩份MTHFR基因,分別來自母親和父親。上圖展示了MTHFR C677T可能的基因型。而MTHFR A1298C發生在MTHFR基因的第1298位。這種突變在美國人群中影響7-12%他還見過神經科醫生,檢查過是不是多發性硬化(Multiple sclerosis,MS)。直到他把這些年所有的檢查報告和病史輸入ChatGPT。神了。發生了驚人一幕:ChatGPT發現,雖然血清維生素B12水平正常,但卻與持續性的神經痛和慢性疲乏矛盾。這種反常,指向了一種長期被忽視的可能——甲基化阻滯(methylation block)。幾個月後,患者的刺痛感減輕了,大腦霧氣消散了。主任內科醫生審查了治療報告,震驚地發現,基因變異正是全部症狀的病因!AI工程師、即時追蹤AGI進展的Rohan Paul,聽聞此消息,大受鼓舞。他認為:「現在時機已成熟,醫療AI模型給出的第二診療意見應該成為醫療實踐規範。」相關推文,也被OpenAI總裁轉載。前Forbes撰稿人、作家Derick David則表示這是醫療界的「AlphaGo」時刻:在疾病診斷上,AI現已比人類強。AI醫療奇蹟,正在一幕幕上演類似的例子太多了!Reddit網友crasstyfartman的妹妹被ChatGPT診斷出一種罕見的遺傳性血液疾病——在此之前,她花了十多年時間看醫生和自然療法師,都被告訴那只是心理問題。他們甚至在她提出做檢測時翻白眼🙄。她堅持要求檢測。結果ChatGPT是對的。向醫生抱怨了22年,最後網友buyableblah靠ChatGPT協助才得出診斷。我也是這樣做的,只不過是針對子宮內膜異位症(endometriosis)。終於做了超聲檢查,發現了一個6釐米的子宮內膜異位囊腫(稱為子宮內膜瘤,endometrioma),現在已經長到7.3釐米,我打算今年晚些時候切除。甚至網友用ChatGPT拯救了被獸醫「誤判死刑」寵物狗。Reddit網友sometimelater0212則表達了對醫療體系的強烈不滿:我把ChatGPT提供的發現拿去給醫生看,他們卻全都嗤之以鼻,要麼說:「從沒聽說過類似的診斷建議」,要麼就說「別信ChatGPT」。這種傲慢真是讓人煩透了。但不止OpenAI,微軟、Google、IBM等早已佈局醫療AI。在微軟的消費級AI產品中,每天就有超過5000萬次與健康相關的使用情境。從使用者首次查詢膝蓋疼痛,到深夜緊急搜尋附近診所,搜尋引擎和AI助手正逐漸成為醫療服務的第一道防線。就在上周,微軟發布了MAI-DxO。而這個AI系統表現遠超醫生。研究人員以《新英格蘭醫學雜誌》(New England Journal of Medicine)每周發佈的真實病例記錄作為基準測試。結果顯示,在診斷NEJM病例時,Microsoft的AI診斷編排器(Microsoft AI Diagnostic Orchestrator,MAI-DxO)的精準率高達85%,這一比例是實驗中經驗豐富的人類醫生的四倍多。而且,MAI-DxO還比人類醫生的成本低。微軟:通向醫療ASI之路NEJM每周會發表「馬薩諸塞總醫院病例記錄」,詳細記錄了患者的整個診療過程。這類病例通常診斷難度極高,往往需要多位專家和一系列檢測手段,才能做出最終判斷。NEJM:《新英格蘭醫學雜誌》New England Journal of Medicine,是全球最權威的醫學期刊之一那麼,AI在這些複雜病例中表現如何?為探究這一問題,從NEJM案例中,微軟的研究團隊設計出一套互動式診斷挑戰——稱為「順序診斷基準」(Sequential Diagnosis Benchmark,SD Bench)。304個NEJM案例被轉化為逐步進行的診療模擬:像在真實環境中一樣,讓AI模型或人類醫生可以逐步提問、安排檢測、獲取結果,並即時更新診斷思路,最終給出結論。最後的結論將與NEJM給出的標準答案進行對比。每一次檢測請求都會產生虛擬費用,用以模擬真實醫療資源消耗。據此,研究人員從兩個關鍵角度評估了模型:診斷的精準性和資源的使用效率。圖1:AI智能體推理並解決順序診斷問題的示意輸入初始病例資訊,如:29歲女性,因喉嚨痛、咽旁腫脹及出血入院,使用抗菌治療後症狀未改善。依照「順序診斷」流程,AI開始進行推理:(1)患者回顧病情(2)接下來,AI開始問診,範圍涵蓋:  既往病史、用藥史、惡性腫瘤跡象、病毒感染史、牙科史、出血傾向、常規實驗(如血常規、凝血)和影像檢查(如頸部MRI)等。(3)虛擬醫生專家組內部討論(4)逐項檢查,更新診斷(5)AI系統得出診斷結論(6)與NEJM權威診斷結果對比,專家評審意見下面的視訊,項目負責人介紹了基本的流程。邁向準確診斷研究人員對目前最具代表性的生成式AI(Generative AI)模型進行了全面評估,覆蓋了304個《新英格蘭醫學雜誌》(NEJM)的真實病例。參與評測的基礎模型包括GPT、Llama、Claude、Gemini、Grok和DeepSeek等。除了對這些模型進行基準性能測試,研究人員還設計了MicrosoftAI診斷編排器(MAI-DxO)——模擬由多名虛擬醫生組成的協作小組,通過多樣化的診斷思路共同應對複雜病例的系統。圖5:MAI-DxO編排系統概覽與單一模型相比,編排器不僅更善於整合不同來源的資料,還能在醫療環境變化時提供更高的安全性、透明度與適應能力。這種不依賴於特定模型的架構(model-agnostic)也提升了系統的可審計性和韌性,這兩者對於高風險、快速演進的臨床場景而言至關重要。評測結果顯示,MAI-DxO顯著提升了所有模型的診斷表現。其中表現最優的是MAI-DxO與OpenAI的o3模型組合,其在NEJM案例中的診斷精準率達到85.5%。作為對比,實驗中也評估了21位來自美英的執業醫生,他們擁有5到20年的臨床經驗。在相同任務中,他們完成的案例平均精準率僅為20%。MAI-DxO具有可配置性,可以設定成本上限,從而在診斷過程中探索「成本與價值」的權衡。若不加限制,AI可能會傾向於開出所有可能的檢查項目,而不顧費用、患者感受或診療延誤。研究發現,MAI-DxO不僅比醫生和單一模型更準確,其總體檢測成本也更低。在「診斷精準率」與「平均檢測成本」兩個維度上,下面的散點圖對比了不同AI模型。圖中MAI-DxO曲線位於表現最優的左上區域,紅色叉號則代表人類醫生的平均水平。AI+醫生:告別看病貴的第一步醫生通常在專業知識的廣度或深度之間作出選擇。比如,全科醫生需面對不同年齡層和系統的廣泛問題,而專科醫生則專注於某一病種或系統。然而,NEJM案例的複雜程度遠超單一醫生所能全面覆蓋。而AI不受這一限制,能夠兼顧廣度與深度。而且在多個方面,AI的臨床推理能力已超越人類醫生。這種能力有望徹底改變醫療模式——不僅可賦能患者自行處理常規健康問題,也可為醫生提供決策支援。目前,美國醫療支出佔GDP的近20%,其中高達1/4屬於無效支出。AI有望成為遏制這一浪費的關鍵力量。這不是取代醫生,而是開啟一種全新的醫療共治模式:AI+醫生,共同診斷。 (新智元)
史詩時刻! AlphaGo神之一手突現,GoogleAI顛覆科學研究極限?
太瘋狂了,AlphaGo的「第37步」時刻,已經來臨。 Google的AlphaEvolve,讓我們從此進入AI創造科學的時代,人類科學研究將徹底顛覆!背後的研究者也首次接受採訪,揭露研究過程中的一些驚人細節。這周,GoogleDeepMind丟出了重磅炸彈-AlphaEvolve。但許多人,彷彿還未意識到這個AI的意義。可以這麼說,AlphaEvolve,就是數學界AlphaGo的「第37步」時刻,堪稱瘋狂。Google的這個AI,取得了人類未曾發現的數學成果。例如,它改進了改進了4x4矩陣乘法,將運算次數從49次減少到48次,這是自1969年Strassen演算法提出以來,56年內的突破!另外,它還推進了六邊形填充問題的研究,找到了在更大六邊形內排列11個和12個六邊形的更優解法,超越了人類的解決方案(在停滯16年之後)!甚至,它一舉改進了困擾數學家300多年的「接吻數問題」。而這一切,都是靠AI自我進化、訓練自己所使用的LLM而得到的。透過自我對弈,它擁有了超人的編碼能力,甚至讓人預言—十年內,程式設計將迎來自己的AlphaGo時刻。而且,跟AlphaGo的「第37步」不同,AlphaEvolve展現出AI自主優化演算法的能力,或將徹底改變晶片設計與資料中心效率。GoogleCEO Pichai,對「AI訓練AI」進行了生動的解釋:由Gemini驅動的編碼agent,優化了Gemini的訓練,形成了一個資料飛輪跟以往成果不同的是,GoogleDeepMind這次直接弄出一個通用武器。從此,AI不僅能解決問題,還能發現新的前沿領域。這代表著,人類集體智慧發生了一次真正的飛躍!接下來的劇本,或許就是AI橫掃各大科學難題,直接顛覆人類科學研究。GoogleDeepMind引領全人類未來GoogleDeepMind,一直在AI改造世界這個方向引領著前線。可以說,在將近30年裡,他們都在指引人類文明的方向。AlphaGo透過學習人類對弈,甚至自我對弈,擊敗了人類冠軍李世石。AlphaZero通過自我對弈,學會圍棋、國際象棋和日本將棋,被稱為一種人類從未見過的智慧。AlphaFold預測了數百萬種從未經過實驗測量的蛋白質三維結構。AlphaDev則發現了更快的排序演算法。AlphaTensor用於進行科學發現,將尋找更快矩陣乘法演算法的問題建構成一個遊戲,並實現了重大突破。FunSearch則將我們帶到更遠,透過程式碼演化,利用LLM尋找新的數學解決方案。GoogleDeepMind的下一個Alpha,更是令人無比期待。OpenAI研究員Jason Wei就表示,AlphaEvolve對於像我這樣的強化學習鐵桿粉絲來說,確實令人不安所以,這次打造出AlphaEvolve的團隊,究竟有那些人物,經歷了那些探索?就在最近,Youtube上的人氣大V「Machine Learning Street Talk”,就提前獲取了GoogleDeepMind的這篇論文,並採訪了這項工作的研究者。半個世紀矩陣乘法突破,研究者當場驚呆在電腦科學領域,幾乎沒有問題能像矩陣乘法一樣基礎。半個多世紀以來,此領域的一個特定基準,一直被認為難以突破。因為最優演算法的搜尋空間極為龐大,使得窮舉在實務上幾乎不可能,即使對相對較小的矩陣也是如此。1969年,Strassen透過發現一種演算法,徹底改變了這個領域。此演算法僅需七次標量乘法,即可乘以兩個二乘二矩陣。而就在今天,這紀錄被Alpha Evolve打破了!而它能做到一點,連GoogleDeepMind的研究者都沒想到。對於通常情況下的矩陣,仍然沒有比使用四十九次乘法進行兩次Strassen更好的辦法。開始,研究者也壓根沒有期待,它能找到比四十九次更好的結果,因為他們已經用AlphaTensor嘗試了很長時間了。所以,他們只是出於完整性試了一下,因為想在論文中展示這個表格而已。結果,出乎所有人意料,一個更快的演算法,居然被它發現了!這次,演算法使用了48次,而不是49次乘法,徹底打破紀錄。當看到一位同事發消息通知這一結果時,研究者表示自己簡直不敢相信。反複檢查三次後,他們終於確認——AI不斷增強的能力,可以產生全新的、可證明精準的演算法,從而推動科學的邊界!跟第一個版本有何差別?根據論文,AlphaEvolve是一種進化編程智能體,顯著提升了預訓練LLM在復雜任務上的能力。要知道,先前團隊曾有第一篇論文,講的是FunSearch,原理與之非常相似。所以,二者的區別在那裡呢?研究者介紹說,FunSearch只是在搜尋一個單一的函數,但AlphaEvolve,本質上可以作用於整個程式碼庫。它會在程式碼庫中你標記的區域中進行搜尋,甚至優化這些函數之間的互動。Google昂貴的服務器,不用閒置了所以,AlphaEvolve有沒有可能進化出一個方法,來優化Google的計算基礎設施呢?出於嘗試,Google工程師將一個候選方案放進這個AI,令人驚喜的是,它果然進化出了一個更聰明的啟髮式方法!現在,這個方法已經被運用於優化Google內部的計算基礎設施了。要知道,在Google龐大的資料中心,高效率安排計算任務是一項非常複雜的操作。如果操作不當,昂貴的伺服器就會閒置。而現在結果正式,這個全新方法利用了Google服務器群計算資源的0.7%,對於Google來說,這是一項巨大的節省。盜夢空間成真?甚至,在另一個自我改進的實例中,它甚至找到了加速Gemini模型訓練的方法,這,就為AlphaEvolve本身提供了動力。這個實例之所以如此有趣,是因為它不僅產生瞭解決方案,還產生了產生這些方案的程式。也就是說,Alpha Evolve就像《盜夢空間》一樣。甚至研究者表示,在檢查程式碼時,他不僅想到,這看起來完全就是一種數學洞察,或者一種數學假設!事實也證明了,它們確實對改進結果的非常關鍵。而Alpha Evolve另外一個有趣的點,就是它仍然非常依賴「人類參與其中」。過程中,人類負責識別那些內容是有趣的,找到那些有明確評估標準的問題,將候選解決方案納入循環中。然後,Alpha Evolve就會遍歷這個可能性的錐體,在過程中不斷跳躍,將這個循環繼續下去。所以,Alpha Evolve也預示了一種AI的未來──人類和AI之間,有著強大的協作循環。曾經有一個「死掉的互聯網」的理論,指的是在未來,網上大部分內容都將由AI生成,而且非常表面化、非常膚淺。而此時,就需要人類來指導AI、改進結果,進行迭代。而讓Alpha Evolve如此酷炫且強大的,也正是人與機器之間的這種互動。AlphaEvolve,為何如此適合科學發現在訪談中,主持人向研究者提問:究竟是什麼促使你們走上了進化演算法的道路呢?研究者回答說,這就跟科學發現的過程一樣,是非常自然的選擇。進化演算法能為探索過程帶來多樣性,確保你不會在早期就鎖定在某種特定方法上,因為這種方法有可能是次優解。最終,我們仍然需要不斷探索所有的可能性,尤其是在想要做出新的科學發現時。言簡意賅地說,AlphaEvolve就是一個進化演算法,對於系統給出程式碼片段,我們都可以自動測試它好不好,有多好。一方面,它可以把你限制在你可以解決的問題集上,另一方面,它涵蓋的問題範圍又非常廣泛。LLM會為你提出各種想法,透過這個評估器,我們就可以篩選出真正重要的、能做出改變的想法。最有潛力的代碼,將被識別出來,然後專注於改進這些部分。接下來,採訪者就提出了一個重要的問題:我們什麼時候才知道,這個過程要結束?例如,可能我們覺得該終止了,但如果再多等五分鐘,就會得到一個近乎完美的演算法。研究者解答了他的疑惑。從理論上講,的確永遠無法確定如何讓演算法運作更久,以及會得到什麼結果。但在實踐中,這並未造成任何問題。例如可以這樣設定問題:我正在嘗試解決這個數學中的開放性問題,尋找能取得進展的搜尋演算法,但我希望10分鐘內就能取得進展。也就是說,其實我們只探索了能在10分鐘內做出進展的演算法空間。當然的確存在這種可能性:如果運行更長時間,說不定還會有表現更好的演算法。這個可能性永遠無法消除。那一刻,AI發生了想像力驚人的跳躍主持人問道:你可以舉出一些系統做出真正有想像力的跳躍的例子嗎?研究者表示,一個具體的例子,A​​lphaEvolve如何發現矩陣乘法演算法的。實際上,他們只是讓它設計了一個基於梯度的搜尋演算法,也也就是一個能找出來的演算法的演算法,或是元演算法。第一個搜尋演算法,是從一個非常簡單的程式碼框架開始的。研究者並未給它任何東西,只告訴它「用梯度」,然後,它就寫出了這些複雜的損失函數和更新函數,而且以完全出人意料的方式引入了隨機性。就在那一刻,研究者驚呼:太厲害了!當然,這種程式碼也有可能是人類寫的,但他們真的會想到要寫出這段特定程式碼嗎?那一刻,他彷彿頓悟了──AlphaEvolve所做的,是一些類似人類的事情,但又顯然不是人類會嘗試的東西。人類具體是怎樣指導AI的呢?研究者提及了一個實驗,在這個實驗中,他們請幾個人花了30分鍾思考這個問題,記下筆記,然後指導系統完成整個過程。可以理解為,AI榨出了這個想法的全部精華,瞭解它的本質,於是引導LLM得出了這樣的目標,同時做了很多優化。聽起來,這就是智慧的本質──嘗試很多事情,總有一件會成功。最震撼之處:改變世界,就在當下研究者表示,在以往,通常我們很難開發出某種科學研究工具,直接、立刻應用到現實世界的挑戰,並產生巨大影響。而AlphaEvolve的意義就在於,在開箱時就能同時在數學和科學問題上做出新發現,甚至還能發現可以直接部署到Google核心計算架構中的演算法。這,是他們以前從未經歷過的事。AI奇點,或許已經到來了。 (新智元)
大模型下半場:7個趨勢判斷
推理模型能力的持續提升,推動大模型迎來“可用”到“好用”的拐點。推理強化和應用拓展啟動了大模型下半場的新賽程。個人智能體潛力初步顯現,行業應用漸次走深,開源開放日益成為大模型的核心競爭力組成。大算力、多模態、強推理、廣開源、准資料、智能體、深應用等,成為當前發展的重要趨勢。一、大力出奇蹟的算力投入模式尚未見頂DeepSeek以557萬美金的低成本訓練,給全球帶來很大震動。但這並未顛覆大模型需要大算力的底層邏輯,實際上,該模型單次訓練成本相當於國外同類模型成本的八分之一左右,尚未有數量級的差別,其意義是以更集約化的方式復現已有模型效果的工程創新。此前網路熱炒的中美大模型訓練成本的懸殊對比,其實是拿美國千億美金等級的資料中心建設、晶片購買、網路搭建、科學家薪酬等總支出,來對比DeepSeek的單次訓練成本,裹挾了較大的誇張和情緒因素。用更大算力去探索大模型的能力上限,仍是行業共識。預計今年上半年國外將推出GPT-5、Llama 4等級大模型。美國大算力叢集建設如火如荼,馬斯克的xAI已建成全球規模最大的20萬張H100算力叢集,並在此基礎上訓練出Grok3大模型。Google今年預計投入750億美元,同比增長43%,大部分用於算力中心建設;Meta預計投入為600-650億美元,同比增長53%-66%;亞馬遜預計為1000億美元,同比增長超20%。此外,日本軟銀集團、OpenAI和美國甲骨文公司三家企業聯合開啟星際之門計畫,將在未來4年投資5000億美元,在美國建設超大型算力基礎設施。這些將推動大模型在預訓練方面的更多突破,加上現在流行的強化學習等後訓練增強,大模型能力的躍升可能會進一步加快。有不少大佬預測,AGI的實現可能就在最近的兩到三年。高端晶片供給仍是中國下一代大模型的卡脖子問題,可能再次面臨訓練晶片供應不足的風險。雖然去年以來,中國AI高端晶片企業數量和能力均有提升,華為、燧原科技、摩爾執行緒、海光、壁仞等多家企業已設計出對標輝達A100單卡性能的國產晶片,但由於台積電暫停7nm產能供應及HBM禁令等限制,國產高端晶片的製造仍面臨挑戰。二、慢思考和多模態成標配,多領域將迎來AlphaGo時刻包含了強化學習等在內的後訓練過程,把預訓練積累的模型潛力發揮了出來,模型慢思考帶來了推理能力的大幅提升。受DeepSeek效應刺激,國內外大模型公司正加速推出下一代大模型,如OpenAI的基礎大模型GPT-4.5,推理模型o3;Anthropic整合了深度思考和快速輸出的混合推理模型Claude 3.7;Google相繼發佈 Gemini 2.0和更強大的推理模型Gemini 2.5 Pro,以及xAI的Grok 3。國內騰訊混元發佈了可以秒回的強推理模型T1,將快慢思考相結合,並首次將混合Mamba架構無損應用於超大型推理模型,顯著降低了訓推成本。DeepSeek更新了一版名為DeepSeek-V3-0324的模型,在數學、程式碼類相關評測集上取得了超過 GPT-4.5 的得分成績。多模態是人類世界的本來樣貌,大模型的發展趨勢一定是走向多模態,從單一的文字、圖像、視訊、3D,向聲、光、電,甚至分子、原子等各類模態擴展,達成對真實世界的理解和生成,原生多模態是未來方向。近期發佈的GoogleGemini 2.0 Flash可實現一句話編輯圖片,堪比專業Photoshop軟體的編輯效果; GPT4o最新推出的風格化文生圖能力火爆全網。騰訊剛開放原始碼的混元3D模型,同時支援文生3D和圖生3D,可一鍵換皮膚、一鍵變動畫,一鍵生成3D遊戲視訊。隨著模型能力的躍遷,可以預見,更多領域將迎來“AlphaGo時刻”,即大模型在各領域的能力超過該行業90%以上,甚至最高水平的人。OpenAI的o1在在美國數學邀請賽拿到接近滿分成績,在物理、 生物和化學問題的基準測試上超越了博士水平的精準率。Anthropic 首席執行官Dario近日預言 ,未來3-6 個月 AI 將能夠編寫 90% 的程式碼。三、模型開源和開放協議成為新競爭力組成之前行業爭執不下的開源與閉源之辨,倒向了開放原始碼的一邊。DeepSeek的火爆,一定程度上得益於開源,其採取的MIT License協議支援完全開源,不限制商用,也無需申請,讓全球開發者都有機會上手使用和評測,依靠口碑效應快速形成了全球影響力。原來堅定走閉源路線的OpenAI也被迫考慮開源,奧特曼近日公開表示,之前選取的閉源策略可能站在了歷史錯誤的一邊,同時還在社交平台公開徵集開源方案,未來要做端側的開源大模型和o3 mini等級的開源模型。國外Meta,國內騰訊、阿里、智譜等企業很早就開啟了開源戰略。如,混元文生圖模型是業內首個中文原生的DiT架構文生圖開源模型;文生視訊大模型是當前最大的視訊開源模型,且全面開源,包含模型權重、推理程式碼、模型演算法等完整模型。國外Hunging Face等社區也成為全球大模型開發者活躍的重要平台,在Hunging Face上彙集了152萬款開源大模型,33.7萬個開放資料集。同樣重要的還有大模型的開放協議,可以類比為網際網路興起時的HTTP協議,HTTP讓各類網頁都能以統一的格式展現在瀏覽器中,方便使用者獲取資訊。大模型的資料通訊開放協議則可以讓大模型更方便地呼叫各種工具,從而自主完成各類任務。如,近期火爆的MCP(模型上下文協議)是Anthropic於去年11月發佈的一個模型資料通訊協議,成為連通大模型和各類工具之間的橋樑。四、“後真相”時代,打造可信大模型迫在眉睫技術對知識資訊的影響,第一次從傳播和互動環節向前延伸到生產環節。大模型知識輸出的精準度、專業度,即大模型的“可信度”,正在成為人工智慧的核心競爭指標。大模型帶來資訊極大豐富的同時,內容中所包含的幻覺等噪聲問題也困擾著使用者。《哥倫比亞新聞評論》研究發現,美國用於新聞搜尋的生成式人工智慧模型存在嚴重的精準性問題。研究人員測試了8種具備即時搜尋功能的AI搜尋工具,發現有60%以上的新聞來源查詢錯誤。大模型的幻覺問題,是伴隨人工智慧底層技術路徑與生俱來的,和創新能力是一體兩面的,難以僅僅依靠技術徹底解決。引入權威的圖書、雜誌、新聞資訊、論文等優質內容資料,並打造新的、“可信”的知識共識機制和供應體系,是大模型未來在生產、生活應用領域產生更大價值的關鍵所在。OpenAI與新聞集團去年簽署了為期5年的合同,獲得了訪問該集團旗下媒體歷史內容的授權,包括《華爾街日報》《巴倫周刊》《泰晤士報》《每日電訊報》等主串流媒體,以增強大模型回答內容的可信度。騰訊混元正在與大百科出版社、人民衛生出版社、上海辭海出版社、化工出版社等優秀的傳統出版機構開展合作,支援其推出圖書智能體,探索基於搜尋增強技術的可信大模型合作模式。如,在元寶APP應用廣場中,人衛智能體可以為使用者提供心腦血管等特定醫學知識領域的權威解答,同時提供相關書籍原文的引用,並可以引流到電子書閱讀平台,跳轉到實體書購買頁面。既能實現類似腳註尾注、文獻索引等傳統知識溯源機制的遷移,確保輸出知識的共識性、精準性,也將為出版機構和大模型平台帶來可持續共贏的模式。未來,誰能夠接入更多可信的資料來源,建構起可信的評價和共識機制,誰就能在人機內容共創的時代獲得領先優勢。五、個人應用在智能+網際網路邏輯下有望開啟馬太效應GPT-4.5,DeepSeek V3、騰訊Turbo S等基礎大模型,OpenAI o3、DeepSeek R1、騰訊T1等推理模型的陸續發佈,標誌著基礎大模型進化到了好用的階段,推動個人應用迎來發展新起點。過去個人應用之所以不夠豐富,核心是由於基礎大模型的能力所限,在複雜問題分析、多模態生成和理解等領域的效果還不盡如人意,使用者使用大模型時驚喜不足。而且個人應用的資料,更多是使用偏好資料,並不能反哺基礎大模型智能的提升,因此過去花錢買流量和使用者的應用也沒能構築護城河,使用者替換應用的成本較低,粘性不足。在當前基礎大模型能力相對成熟的背景下,過去移動網際網路賴以成功的平台效應有望再次發揮作用。更多使用者使用AI應用,可以沉澱更多的優質共享知識、積累更多的使用者反饋和社互動動等,從而讓應用得以持續最佳化,並吸引更多的使用者使用,形成良性的正循環。以騰訊元寶為例,採取DeepSeek+混元雙模型引擎驅動的戰略後,使用者數直線上升, 今年2月至3月DAU(日活)增長超20倍。中國應用領先的優勢有望進一步發揮,提效類的生產力工具日益強大,殺時間的陪伴類和文娛類應用體驗不斷最佳化。根據a16z投資機構3月發佈的全球Top 50生成式AI應用報告,中國公司的應用有11款上榜,而去年8月僅有3款產品上榜,增速明顯。AI新搜尋、文生圖/視訊工具和角色扮演應用是排名前三的熱點方向。但同時,個人應用創新仍然面臨“苦澀的教訓”( The bitter lesson) ,即人們反覆嘗試用工程手段提升性能,最終卻總是被簡單堆算力的方式超越。大模型能力的不斷提升,會“吃掉”不少應用創新的功能,特別是工作流類的應用,更容易被大模型的新能力取代。如何在應用中加深護城河,需要更多第一性原理的思考,從而嵌入使用者決策鏈條的關鍵節點去提升價值,增加使用者的情感性認同,並通過生態協同,提升自身的不可替代性。可以說,技術迭代是矛,場景滲透是盾,生態協同是土壤,個人應用有時候要跑得快一點等大模型能力的提升,有時候又要慢一點思考大模型的演進路徑,去建構技術+場景+生態協同的“動態能力組合”。六、個人AI應用的終點是超級智能助理基礎大模型能力的升級,帶來應用深度的能力解鎖。第一波以ChatGPT為代表的大模型擅長對話,催生了AI新搜尋Perplexity等應用。第二波以Claude 3.5 Sonnet為代表的大模型擅長程式設計,推動了估值百億美金的Cursor和當紅程式設計明星Devin等的火爆。第三波以Open AI o1為代表的大模型擅長深度推理,讓Agent應用成為可能。特別是隨著多模態、強化學習技術持續突破,模型的效果大幅提升、成本不斷降低,可以預見,智能體應用將加速滲透到更多垂直領域,開啟人機協作新紀元。智能體新時代正在走來。近期國內Manus應用的火爆,讓業界對AI智能體的未來給予更多期待。無獨有偶,OpenAI的自主電腦使用智能體Operator和深度研究智能體Deep Research已開啟商業化試水,從實驗室走向大眾市場。據外媒報導,OpenAl計畫以每月2000美元的價格向“高收入知識工作者”出售低端代理;中端代理每月收1萬美元,用於軟體開發;而高端代理作為博士級研究代理,每月收費 2萬美元。據Gartner 預測,到2028年,33% 的企業軟體應用將包含代理式人工智慧,而2024年這一數字不到1%,且至少15%的日常工作決策將通過人工智慧代理自主做出。人工智慧代理市場將顯著增長,從 2024年的51億美元增長到2030年的471億美元。Agent應用的深入,將推動Token消耗量呈百倍甚至更高量級的增長,由此帶來推理算力需求的更大爆發,並超過訓練算力需求。為提升能效比和降低成本,Google、亞馬遜、Meta、OpenAI等大型雲端運算和大模型廠商均加速佈局定製化ASIC,ASIC正逐步發展成為輝達GPU之外的重要新技術路線。摩根士丹利預計,AI ASIC市場規模將從2024年的120億美元增長至2027年的300億美元,複合增長率達34%。與此同時,Agent的廣泛使用將要求模型能處理更大規模的上下文,對模型基礎能力的提升也帶來更大挑戰。七、智力即服務是行業落地的終極方向以雲的方式,讓智能變成一種千行百業可按需呼叫的服務,將最終形成智力即服務(Intelligence as Service)的新形態。過去衡量經濟發展和數位化水平,會看用電量、用雲量,以後我們衡量智能的水平,可能要去看“用詞量”(Token)。DeepSeek等大模型的火熱,帶來了模型效果的全面升級,激發了中國各行業擁抱大模型的新熱潮。但當前,中美企業的生成式AI應用程度存在一定差距,中國企業應用大多處於試驗階段,離規模化使用還有距離。而美國企業應用更加廣泛和深入,2024年美國企業全面實施生成式AI的比例達24%,明顯高於中國的19%。美國政府和企業普遍採用公有雲部署AI,支援AI快速迭代,超過70%的組織使用雲端AI。受此推動,美國大公司最新一季度的雲端運算收入高速增長,如微軟達到409億美元,同比增長21%;亞馬遜為287.86億美元,同比增長19%‌;Google119.6億美元,同比增長30%。高性價比正在推動行業應用走深。自ChatGPT發佈兩年多來,大模型性能持續提升,推理成本顯著下降,如GPT-4o的API呼叫價格為每百萬輸出tokens 20美元,相比發佈時下降了三分之二。當前國內DeepSeek V3的每百萬Token 8元,混元多模態大模型TurboS每百萬Token低至2元。在模型能力效果大幅提升的同時,還為各行業大範圍部署提供了很高的性價比。近兩個月來,行業大模型落地成效顯著,已有政務、金融、醫療、教育、傳媒、文旅等30多個行業落地,大幅提升效率的同時,也在重構原有流程。包括深圳寶安政務、深圳醫保、上海徐匯城運中心、深圳大學、瑞金醫院、上海醫藥、重慶農商行、榮耀等公司都積極部署並探索大模型應用。以深圳寶安政務大模型應用為例,已覆蓋民生訴求、企業服務、政務辦公、社會治理等31個業務場景,覆蓋全區14個領域、20個行業近3萬餘條政府服務知識,整合了60多種模型能力,並可結合業務場景需要快速部署新的智能應用。行業應用中,優質資料是提效護城河。行業大模型比以往任何時候都更需要行業和企業內的優質資料,因為行業應用需要更準確、專業的知識,且對幻覺零容忍。在資料治理上的投入將獲得事半功倍的效果。而這往往需要很大的投入,也被經常認為是苦活兒和累活兒,是行業落地中最容易被忽視的部分。未來,大模型不僅在各行業縱深發展,更將通過跨領域協同、中小企業普惠、社會系統重塑等路徑,實現深度應用的立體化演進:從“場景適配”到“價值創造”,大模型從效率工具升級為業務增長引擎;從“資訊孤島”到“生態融合” ,跨領域資料的協同推動應用邊界擴展;從“企業級應用”到“社會系統重構” ,技術滲透進入深水區,引發企業和社會組織模式、就業和分配結構、社會倫理規範等全方位變革。 (騰訊研究院)