#AlphaGo
FORTUNE雜誌─DeepMind創始人的豪賭:攻克一切疾病
八歲那年,德米斯·哈薩比斯只能依稀瞥見星辰。德米斯·哈薩比斯坐在位於倫敦大學學院天文台的弗萊望遠鏡前。圖片來源:Jillian Edelstein for Fortune這個天賦驚人的孩子成長於20世紀80年代的北倫敦,父母是頗具波西米亞氣質的文藝青年。透過城市朦朧的光靄,哈薩比斯偶爾能夠辨認出一個星座——獵戶座。它得名於希臘神話中那位驍勇的獵人,千百年來一直是水手與農夫的星空路標。四十年後的今天,獵戶座依然是他最愛的星群。這份眷戀,部分源於其與不朽傳說的連結:早在古埃及時期,人們就已經將這片星空奉若神明。“首先,從地球仰望星空,我們看到的星辰圖案其實具有某種隨機性。”哈薩比斯說道,“其次,以獵戶座腰帶上的三顆星為例,它們只是恰好構成特定幾何關係的恆星,之所以產生意義,完全是因為我們在用人類的意識解讀這些恆星。”我與哈薩比斯的會面地點,距離他成長的地方不遠,就在倫敦大學學院天文台的旁邊,矗立在那裡的望遠鏡已逾百年,至今仍然昂首指向蒼穹。這樣的場所恰好適合談論“浩瀚”:不止是星辰的浩渺無垠,更是人類心智的遼闊深邃。在此地對話,還有另外一層深意:哈薩比斯正是那位以人類意識探索資料海洋的先鋒。身為DeepMind聯合創始人,他被譽為當代最重要的人工智慧研究者與企業家之一。這家開創性的人工智慧實驗室於2014年被Google收購。2016年,DeepMind研發的AlphaGo擊敗全球頭號圍棋高手,造就人工智慧發展史上的里程碑事件——要知道,圍棋可是世界上最複雜的雙人策略博弈之一。如今,作為Google核心人工智慧業務的掌舵者,哈薩比斯正在引領這艘科技巨輪依託Gemini 3模型的優勢在激烈的競爭中破浪前行。但他迄今為止最深遠的貢獻,或許是AlphaFold 2的突破。這款由DeepMind於2020年發佈的人工智慧系統,可以根據DNA序列精準預測蛋白質的三維結構。AlphaFold 2堪稱一項劃時代的科學壯舉,為人類深入理解乃至最終攻克帕金森病、肌營養不良症及某些癌症等疾病打開了全新可能,這些疾病的根源均與蛋白質的錯誤折疊或功能失常密切相關。憑藉這一開創性成果,哈薩比斯與DeepMind的科學家約翰·江珀共同摘得2024年諾貝爾化學獎桂冠;同年,哈薩比斯獲授爵士勳銜。在哈薩比斯看來,過往的一切皆彼此相連。自幼對星空的痴迷,如同一道隱線,引領他探索人工智慧,在看似無序的世界中尋找規律與意義。“夜空是一道始終凝視我們的永恆謎題。”他說,“它時刻提醒著我們,世間還有更宏大的命題需要思考,正是這片無垠將我引入‘浩瀚’之境。在那裡,你必須從海量的資料中捕捉規律,或在無窮的可能性裡,覓得關鍵的一步。”近年來,哈薩比斯將他每周100小時工作時間中的相當一部分,傾注於破解世界級模式識別難題——藥物發現。2021年,在Google母公司Alphabet的支援下,他創立了Isomorphic Labs。這家基於人工智慧的藥物設計公司,致力於為一些最“不可成藥”的疾病開發突破性療法。該公司的宣言樹立了一個近乎壯烈的宏大目標:要“攻克一切疾病”。自創立以來,Isomorphic Labs一直低調前行,至今未將任何藥物推進至決定性的臨床試驗階段。但近期的動向表明,這一里程碑已經不再遙遠。支持者認為,一旦投入實戰,其技術路徑將展現獨特優勢。近日,這家新創企業首次向《財富》雜誌敞開大門;記者與多位公司高管與科學家悉心探討的議題,堪稱人工智慧領域最大機遇與挑戰。“一家傳統的生物科技公司窮盡整個生命周期,或許只能推出一兩種新藥。”哈薩比斯指出,“而我們正試圖建構一套完整的系統、流程和技術體系,目標是每年開發數十種藥物。聽起來有些不可思議,但我相信,在未來的10年到20年內,如果能夠建立起一套猶如從乾草堆中尋針的流程,終將找到攻克所有疾病的路徑。”藥物發現,實則更像是在廣袤的艾奧瓦州尋覓一根針:這是一個將具有潛在治療價值的化合物置於無限生物學變數中測試的征程,挫折接連不斷,失敗率之高近乎令人絕望。儘管AlphaFold僅僅觸及這個宏大處理程序的一隅,它卻為打破既有困境帶來了希望。AlphaFold證明,人工智慧有望將動輒數年的生物醫學探索壓縮至分秒之間。基於此,哈薩比斯的構想清晰而深刻:若能以AlphaFold為基石,建構一個完整的藥物設計引擎,未來將會怎樣?這家應運而生的企業志在挑戰眾多同行折戟的領域,其突圍之道在於聚焦結構解析:通過人工智慧對藥物與靶點的相互作用進行分子層面的精準預測,從而大幅削減藥物發現臨床前階段慣有的漫長試錯過程。自獨立營運以來,Isomorphic Labs最初被歸為Alphabet“其他押注”類股,獲得資金支援。2025年3月,公司又完成了6億美元的A輪融資,由約書亞·庫什納的Thrive Capital領投,Google風投繼續跟投。這場豪賭的願景是:假以時日,人類將憑藉技術驅動的新型流程,設計出能夠治癒癌症、阿爾茨海默病等頑疾的藥物,並使這些如今看似如魔法般精密的工藝,最終成為行業標準。“如今,沒有人會考慮手工設計飛機,也不會有人願意乘坐手工設計的飛機。”Thrive Capital的合夥人文斯·漢克斯表示,“但現有的所有藥物依然是以這種方式設計的。展望未來,藥物研發應該像目前設計飛機那樣,依託強大的軟體、智能系統和模擬模擬來進行。”Isomorphic Labs的300餘名科研人員正在朝著這一目標全力進發,而哈薩比斯正是他們的領航員。極端渺茫的勝算可成藥化合物的潛在數量高達約1060種,規模遠超可觀測宇宙中的星辰。而這還僅僅涵蓋類藥小分子,實際數值可能更為龐大。識別出那些組合能夠抑制腫瘤或矯正危險突變,正是哈薩比斯和同行希望借助人工智慧破解的難題。縱觀人類歷史,藥物始終寥寥無幾,其中許多甚至源於偶然,如青黴素的發現源於黴菌污染。直到20世紀60年代,隨著早期抗癌藥與心血管藥物的出現,藥物發現處理程序才逐漸加速。但幾乎在整個20世紀,科學家們仍然依靠近乎蠻力的試錯與緩慢迭代的技術,在浩渺的化學宇宙中艱難探索。無數化學家終其一生埋頭於沸騰的漿液、重複的實驗、一次次推倒重來,卻大多以失敗告終。即便是在今天,每20位從事藥物發現的化學家中,通常僅有一人可以在職業生涯中成功推動一款新藥上市。“我們需要將各種不同的參數融合到一個分子中,使其完美匹配特定病症。”Isomorphic Labs的首席科學官邁爾斯·康格里夫解釋道,“有時你可能找到理想的靶點,合成了高活性化合物,初期效果顯著,其他方面卻不盡如人意,最終走入死胡同。這有點像打地鼠遊戲,一個問題解決了,另一個又冒出來。”康格里夫是行業內的佼佼者,他已經助力三款抗癌藥物成功上市,其中包括諾華與Astex Pharmaceuticals聯合開發的乳腺癌治療藥物瑞波西利。放眼整個行業,即使僅將一款藥物推進至臨床試驗階段,也經常被視為重大突破。但他指出,即使進入臨床試驗,失敗率依然高達90%。諾華的生物醫學研究總裁菲奧娜·馬歇爾對此深表贊同:“找到完美分子的機率微乎其微。”正是這種極低的成功機率,凸顯了AlphaFold 2的價值,也幫助Isomorphic Labs匯聚眾多頂尖人才。計算生物學總監梅麗莎·戴維斯坦言,她正是因為對AlphaFold技術的拓展應用深感著迷而加入團隊的。“過去,科研人員可能只為結晶一個膜蛋白窮盡職業生涯。”戴維斯指出,“但如今,任何科學家都可以輕鬆生成一個蛋白質結構。”其他高管與哈薩比斯的合作淵源則更為深厚。目前,Isomorphic Labs約11%的員工來自DeepMind,包括現任總裁馬克斯·賈德伯格。他此前在DeepMind工作七年,其間主導開發了AlphaStar,這是首個在電子遊戲《星海爭霸II》中擊敗人類職業選手的人工智慧系統。“每當聽說有藥物化學家終其一生都未能成功研發出一款新藥,總是令人深感敬畏。”賈德伯格感慨萬千。“這與我在人工智慧領域的經歷截然不同——在那裡,你必須每六個月就突破世界頂級水平,否則就會被淘汰。”他補充道,“當理論照進現實,面對實實在在的科學流程與動手操作的實驗工作,那種敬畏感會變得無比真切。”鑑於哈薩比斯密集的行程,他在Isomorphic Labs的時間非常有限,因此招攬頂尖人才成為他的要務之一。他每周僅有一天(通常是周二)會前往這家新創企業的辦公室,與高管團隊會面,並為公司的技術方向確定優先事項。哈薩比斯特別看重人才的創造力,他曾經笑言,自己熱衷於管理那些“需要精心呵護的天才”。哈薩比斯指出,“任何專業科學家在技術層面都已經極為出色,但能否提出具有創造性的新思路,或精準地提出關鍵問題?這其實更為困難。尋找答案的過程,本質上是尋找正確問題的過程。”結構優先賈德伯格解釋道,Isomorphic Labs提出的“結構優先”方法,更注重模型的泛化能力,而非針對特定問題的專門化設計。這家新創企業正在致力於繪製人體內愈加複雜的生物星圖,從而更精準地預測任意化合物對多種疾病及其他生物過程可能產生的影響。首席技術官謝爾蓋·亞克寧指出,這旨在實現一種過去難以想像的精準度,猶如將火箭降落在人類永遠無法直接觀測的月球背面。其核心技術是一個由多個專有模型建構而成的藥物設計引擎。該引擎不僅包含升級版蛋白質預測模型,還整合了針對多肽、分子膠及抗體的專項模型。引擎的資料基礎融合了全球蛋白質資料庫、英國生物銀行、商業授權資料、內部生成資料集,以及合作夥伴提供的專有資訊。在投身藥物研發之前,馬克斯·賈德伯格曾經在DeepMind主導開發了人工智慧系統AlphaStar——這是首個在電子遊戲《星海爭霸II》中擊敗人類職業選手的人工智慧系統。圖片來源:BARRY CRASKE/COURTESY OF ISOMORPHIC亞克寧坦言,這項任務在某種程度上就是從現有資料中挖掘更深層的洞見——過去已經有許多研究者嘗試過這樣做,但大多無果而終。“然而,令人驚嘆的是,只要掌握恰當的技術,我們就能建構出這些令人震撼的系統。”他補充道。Isomorphic Labs沒有透露其短期內的主攻疾病領域——這種保密做法在製藥行業實屬常態,但在科技行業卻略顯反常。該公司稱,與禮來(Eli Lilly)、諾華等製藥巨頭達成的合作,正是其發展勢頭向好的有力佐證。(與諾華的合作已經於2025年進一步拓展。)然而在多次訪談中,多位高管表示公司的核心戰略是攻克“不可成藥”靶點。這一在藥物研發領域被廣泛使用的術語有著相對具體的含義,即針對胰腺癌、肺癌和結直腸癌中尤為常見的特定蛋白突變,以及在多種癌症中廣泛存在的轉錄因子展開研究。迄今為止,這些癌症依然對現有療法表現出較強的耐藥性,但它們很可能正是Isomorphic Labs決心突破的關鍵難題。節省五年,甚至更多藥物發現與人工智慧領域同樣遵循嚴酷的經濟規律。將一款新藥推向市場,通常需要投入超過20億美元,歷經十年乃至更長時間從發現走向臨床試驗,最終卻仍然要面對高達90%的失敗率。在人工智慧領域,算力瓶頸始終是難以迴避的挑戰;而在這一點上,背靠Alphabet的Isomorphic Labs獲得了雄厚的資金支援。Isomorphic Labs所處的賽道競爭同樣已經達到白熱化:要成為首家將人工智慧驅動藥物推向市場的新創企業,這份壓力可謂千鈞之重。其競爭對手如英矽智能目前已經有數款藥物在中國進入臨床試驗階段。Isomorphic Labs雖然沒有透露進入臨床試驗的具體時間表,但一個顯示正在接近該目標的訊號是:公司於2025年6月聘用精準腫瘤學專家本·沃爾夫擔任首席醫療官。他正在波士頓組建團隊。“要讓這一切成為現實,我需要一款具備卓越藥學特性的超級藥物,它能夠讓我直接而明確地驗證療效。”沃爾夫說道。目前,這家新創企業的人員配備與戰略方向依然主要專注於藥物發現階段,尚未擴展至臨床試驗或商業化領域。賈德伯格清楚地認識到其中的機遇與侷限。他表示:“至少在中期內,生物學中仍然會存在人類無法完全理解的部分。”他進一步指出,公司的目標是“建立科學嚴謹的流程體系,讓這一過程不再像魔術般玄奧難測,而更像是布設捕鼠器——以此精準鎖定我們想要達成的效應。”諾華的馬歇爾認為,人工智慧有望將藥物研發與臨床試驗周期縮短50%,降至五年左右。在她看來,研發時長的縮減很大程度上得益於藥物發現環節的最佳化升級。“但要進一步大幅壓縮時間難度很大,因為涉及人體生物學反應和安全性的關鍵驗證,依然需要通過臨床試驗來完成。”醫學界普遍認為,過去十年來,人工智慧藥物發現領域始終是承諾多於成效,而Isomorphic Labs如今許下的承諾則更為宏大。當我向哈薩比斯提及這一觀點時,他闡述了自己的核心理念:“攻克疾病”的願景,遠比“一勞永逸地根除病痛”更具廣度與現實可行性。他之所以刻意迴避“治癒”一詞,原因正在於此。他表示,我們固然無法保證人類不再患病,卻能夠依託先進的人工智慧與技術平台,建立一套系統化、可複製、可規模化的流程,在需求出現時,及時發現、設計並最佳化藥物或治療方案。“我們將逐步建構對生物學的基礎性認知。”哈薩比斯說道,“但願未來可以建立出類似虛擬細胞的模型,精準預測特定干預措施將引發怎樣的生物學變化。”他認為這一目標可能會在十年內實現,而這就引出下一個問題:“個性化治療能夠深入到什麼程度?不妨試想一下,你走進一家藥房,就可以為自身的特定病症做一次表型分析。如此一來,你便能夠精準掌握自身獨有的病情特徵。”這或將成為疾病治療領域的重大突破。哈薩比斯相信,對宇宙的思考,可以幫助理解存在於人體內的生物宇宙。畢竟,“isomorphic” (同構)一詞所指的,正是那些表象不同但結構相似的存在。與哈薩比斯交談後,我走向倫敦大學學院天文台那架建於1862年的弗萊望遠鏡。透過目鏡,我看到了土星。一束光從那顆行星傳到地球大約需要95分鐘。如此清晰地目睹這般遙遠的天體,讓人感到一種超現實的震撼。“宇宙的構造似乎就是為了迎接科學的探索。”哈薩比斯曾經這樣說道,“我甚至覺得,宇宙渴望被人類理解。不然科學方法何以如此奏效,又如此具有可重複性?暫且拋開人工智慧不談。電腦為何能夠正常運轉?說到底,它們不過是由沙粒、金屬和游離的電子拼湊而成的物件。可偏偏就是這些東西,催生出了不可思議的奇蹟。”(財富FORTUNE)
“人機大戰”十年:從焦慮AI,到焦慮跟不上AI
“當AI從奇觀變成基礎設施之後,批判和反思的空間反而收縮了。2016年,AI是一個外在的‘他者’,作為人類的對手引發公共討論;今天,人們害怕的是自己的不足,怕自己跟不上AI的節奏。焦慮的對象從機器轉向了自身。”“技術以什麼方式部署、應用在什麼場景、由誰來監管,這些都不是註定的,都是可以被討論和塑造的。問題在於,進行這種討論需要空間,而當下‘趕緊學AI否則就被淘汰’的敘事恰恰在壓縮這個空間。”▲2016年韓國首爾圍棋人機大戰,李世石1-4不敵AlphaGo 圖/視覺中國2026年是“人機大戰”十周年。2016年3月,全球超過兩億人線上觀看了AlphaGo(Google旗下DeepMind開發的人工智慧圍棋軟體)與李世石九段的“人機五番棋大戰”。AlphaGo以4比1的總比分擊敗李世石,震驚了世界。那場人機較量也是人工智慧在沉寂多年後重新掀動公共想像的開始。十年後的同一天,李世石再次回到那個賽場。對面不再是AlphaGo,而是一款韓國初創公司開發的AI系統。這一次,他與AI對話,而非對弈。這十年,李世石從“神之一手”的創造者,到宣佈退役時說“AI讓圍棋不再是藝術”,再到如今主動參與策劃圍棋應用、與AI協作探索——他的個人軌跡,恰如圍棋社群與AI共存的縮影。青年學者賀久恆自小學習圍棋。2016年的“人機大戰”激發了他重拾圍棋的興趣,他的棋力也快速升至國內業餘5段、野狐7D。對圍棋社群和人機關係的關注,讓他確定以此作為自己的博士論文研究方向。博士畢業於康奈爾大學科學技術學系、現為上海紐約大學博士後研究員的賀久恆,以圍棋社群為田野,完成了博士論文《圍棋社群與AlphaGo:一項人機相遇的民族志研究》。他訪談了44位受訪者,除了包括古力九段在內的28位職業棋手,還有圍棋AI工程師、高水平業餘棋手、圍棋老師、圍棋比賽組織者。這些豐富的樣本共同呈現了一個行業、社群在面對AI衝擊前後的完整圖景。▲2023年,賀久恆在美國分享自己的博士論文研究成果 圖/受訪者提供“圍棋世界的改變有AlphaGo這個標誌性事件,全世界都看到了那個瞬間。”賀久恆說。而這種斷裂,在2022年年底ChatGPT3.5橫空出世後,正在全社會範圍內以更隱蔽、更分散的方式重演。在邊界模糊、評價標準不統一的領域,AI的滲透更像是緩慢的滲水,而不是決堤。“沒有一個單一的時刻讓所有人同時意識到‘AI已經超過我們了’。寫作領域不會有一個‘AlphaGo時刻’,教育領域也不會有。這也意味著這些領域的掙扎可能會更漫長、更隱蔽,也更難被外界看到。”賀久恆和其他STS(Science and Technology Studies,科學技術學)學者的田野調查證明,“AI並不是均等地改變所有人,它在加劇已有的不平等。誰能成功重新定位自己,誰只能被動承受,很大程度上取決於你在變局到來之前就已經擁有的資源、地位和社會關係。這一點放在圍棋界成立,放到更大的社會圖景中恐怕也一樣成立。”“AI是不可阻擋的趨勢”這句話在今天似乎已經不是一個需要論證的命題,而是所有討論的前提。賀久恆說,這個判斷本身其實就是一種“技術決定論”——好像技術發展的方向是註定的,人只能順從。“一旦你接受了這個前提,所有對話就只能圍繞‘怎麼適應AI’展開,而‘要不要發展AI’‘能不能放慢速度’‘某些領域是否應該限制AI的介入’就變成了幼稚的、落後的、不值得討論的問題。”“STS這個學科幾十年來一直在做的事情,就是把這些被自然化的前提重新變成可以追問的問題。技術的發展方向從來不是註定的,它是被選擇的:被資本選擇、被政策選擇、被特定的利益結構選擇。既然是選擇,就可以被追問、被討論、被改變。”賀久恆感嘆AI技術的發展速度突破了既往討論和管控的框架設計:“技術以什麼方式部署、應用在什麼場景、由誰來監管,這些都不是註定的,都是可以被討論和塑造的。問題在於,進行這種討論需要空間。”賀久恆希望能將學者們被攔在學術期刊付費牆後面的觀察與思考,以更大聲量向社會傳播:“當前AI的公共敘事很大程度上由科技公司主導。真正需要的是讓更多不同立場的人擁有對技術的解釋權。社會學家、哲學家、人類學家的角色,是幫助把這些分散的、日常的聲音連接起來,賦予它們理論的力量和公共的能見度,讓它們不至於被技術樂觀主義的敘事輕易消解。”▲賀久恆 圖/受訪者提供AI從奇觀到日常,焦慮的對象從機器轉向了自身南方人物周刊:十年前AI戰勝人類棋手的時候,還有不少類似於機器是否會對人類構成威脅的討論,那個時候AI更像一個對手。但當ChatGPT橫空出世,AI技術有了一個超級應用,一個“明星產品”,人們從最開始的嘲弄,轉變為愛上這個工具,更關心它好不好用,甚至拿它當朋友、諮詢師。AI安全和社會衝擊的議題,越來越侷限於少數技術專家和社會學者,這裡面是否有出乎你意料的地方?這個演變路徑在技術對社會的形塑中是普遍性的嗎?賀久恆:說實話,這個演變方向並不讓我意外,但速度超出了我的預期。從STS的角度來看,新技術進入公眾視野通常會經歷一個從“奇觀”到“日常”的過程。2016年AlphaGo挑戰李世石,那是一個精心策劃的媒體事件,全球兩億多人線上觀看,它以一種戲劇化的方式把AI推到公眾面前。那時候人們討論的是很宏大的問題:機器會不會超越人類、AI是不是一種威脅。但這種討論之所以可能,恰恰是因為AI當時還是一個“奇觀”,是一個可以被圍觀、被審視的對象,大家可以站在外面去評判它。ChatGPT的出現改變了這個格局。它的特殊性在於,從奇觀到日常的轉化速度空前地快,滲透的領域空前地廣。圍棋AI再強大,它隻影響圍棋這一個社群。但大語言模型幾乎同時進入了寫作、程式設計、教育、醫療、法律等所有領域。當一個技術變成你每天都在用的工具,你就很難再站在外部去質疑它了。我想指出的是,你提到人們“愛上了這個工具”,這個說法值得推敲。表面上看,大家確實從恐懼變成了擁抱,但我認為這不是焦慮的消失,而是焦慮的內化。今天很多人拚命學AI工具、刷AI課程,本質上是一種FOMO(錯失恐懼症),害怕被時代拋下、害怕在職場中被取代。2016年人們害怕的是一個外在的“他者”,AI作為對手;今天人們害怕的是自己的不足,怕自己跟不上AI的節奏。焦慮的對象從機器轉向了自身。▲2025年10月15日,在北京市海淀區第四實驗小學《多彩的活動》主題語文公開課上,老師借助AI評改指導學生 圖/新華社南方人物周刊:你的博士論文是關於AI對圍棋社群的改變和影響,在你對職業棋手群體的大量訪問和田野調查中,有類似的改變軌跡嗎?賀久恆:我在圍棋社群的田野調查中非常清楚地觀察到了這個過程。AlphaGo之後,職業棋手們很快就開始用AI輔助訓練、用AI做比賽解說。這看起來是主動的擁抱,但背後是非常現實的生存壓力:如果你不研究AI推薦的下法,你在比賽中就會落後;如果你不會借助AI做解說,你的位置就可能被別人取代。棋手們並不是真的“愛上”了AI,而是清楚地意識到,不學會與AI共處,就會失去自己的職業合法性。圍棋社群其實是整個社會面對AI的一個微縮預演。我們今天在各行各業看到的焦慮、適應和轉型,圍棋界在2016年之後就已經經歷過。真正值得關注的是,當AI從奇觀變成基礎設施之後,批判和反思的空間反而收縮了。你沒有餘裕去思考AI到底好不好,因為你忙著追趕。“要不要用AI”不再是一個問題,“你會不會用AI”才是。這本身就是一種深層的社會衝擊,只不過它不再以公共辯論的形式出現,而是以每個人內心的焦慮來呈現。▲2026年3月9日,韓國首爾,圍棋棋手李世石(右)演示AI初創企業Enhance開發的AI圍棋模型 圖/視覺中國南方人物周刊:李世石十年後重新回到當年比賽的地方,為一個AI智能體做推廣,他從那麼深的痛苦中也恢復了過來,接受AI作為探索圍棋的“協作夥伴”。圍棋社群其實幾乎沒有什麼掙扎,就迅速接受了AI對其秩序的改變,因為這個群體是爭勝的,“弱肉強食”的。三年前ChatGPT剛出來,還算不上一個好用的工具。那時候我們有一次深度交談,你說,在其他競爭性沒有那麼強的領域,人類的行業秩序可能沒有那麼容易被AI改變,你現在怎麼看?賀久恆:首先我想稍微修正一下這個前提。從外部看,圍棋社群好像很快就接受了AI,沒什麼掙扎。但我做了一年的田野調查,觀察到的實際情況要複雜得多。AlphaGo贏了之後,圍棋界經歷了非常劇烈的震盪。舉一個具體的例子:AlphaGo第二局下出了一步棋叫“Move 37”,當時整個圍棋界都震驚了,很多職業棋手覺得這是一步超越人類理解的“神之一手”,賦予它近乎神話般的意義。但後來隨著更多AI系統出現,大家發現這步棋其實在統計上並不特殊,也並不是什麼神來之筆。這個從神話化到祛魅的過程本身就是一種掙扎,它意味著職業棋手需要不斷重新校準自己的判斷框架。再比如AI普及之後,圍棋界出現了大量的作弊爭議。因為人的下法與AI的下法越來越像,你很難判斷一個人是真的下得好還是偷偷在用AI。這種信任危機對圍棋社群的衝擊是非常深的。還有職業棋手的角色轉型,他們過去是圍棋知識的最高權威,現在要學會去做AI輸出的“翻譯者”和“解讀者”,這個轉變也不是一帆風順的。李世石本人的經歷恰恰說明了這一點。他花了將近十年,才從那場比賽的衝擊中走出來,走到今天能夠接受AI作為協作夥伴的位置。如果“接受”真的那麼容易,就不需要十年。圍棋社群看起來適應得快,核心原因不是因為他們沒有掙扎,而是因為圍棋這個領域有一個非常特殊的性質:規則邊界清晰,勝負標準明確。AI比你強就是比你強,沒有太多可以爭辯的空間。結果上你不得不接受,即使情感上、認知上、制度上的調適是漫長的。▲2026年3月17日,在湖南湘江新區雷鋒小學體育課上,老師通過平板電腦監測學生的心率 圖/新華社至於我三年前的那個判斷,現在看來需要修正,但也沒有完全錯。需要修正的部分是,我當時低估了大語言模型(LLM)的滲透力。LLM的特殊之處在於,它不需要通過打敗你來改變你。圍棋AI改變圍棋界,靠的是在競技層面碾壓人類,這需要一個很強的競爭邏輯。但GPT改變寫作、教育、翻譯這些領域,靠的不是“比你寫得好”,而是“夠好了而且特別快”。它繞過了競爭這個變數,直接從效率和實用性的層面嵌入了日常工作。所以,即使在競爭性不那麼強的領域,改變也在深刻地發生。沒有完全錯的部分是,改變的方式確實不同。圍棋的改變是斷裂式的——有一個明確的“之前”和“之後”。圍棋界有AlphaGo這個標誌性事件,全世界都看到了那個瞬間。但在邊界模糊、評價標準不統一的領域,AI的滲透更像是緩慢的滲水,而不是決堤。沒有一個單一的時刻讓所有人同時意識到“AI已經超過我們了”。寫作領域不會有一個“AlphaGo時刻”,教育領域也不會有。這也意味著這些領域的掙扎可能會更漫長、更隱蔽,也更難被外界看到。圍棋的痛苦是集中的、劇烈的、有明確事件標記的,而其他領域的痛苦可能是緩慢的、瀰散的,甚至難以命名的。那一種更深重,其實很難說。▲2026年3月21日,美國舊金山,人們參加“停止AI競賽”抗議活動,呼籲主要人工智慧公司暫停前沿AI系統的開發 圖/Petr Salba南方人物周刊:技術與資本的高度結合,科技大佬們的競爭雄心是否使得普羅大眾更加容易成為時代的“人質”,被裹挾著前往新的應用場景?關於AI將要大面積取代人類工作的分析文章很多,並且已經快速變成現實。但人們除了被動接受,似乎沒有什麼更好的辦法,我們都很像超市的收銀員,一邊積極教授顧客學會掃碼自助付費,一邊等著被機器替代。賀久恆:這個收銀員的比喻非常生動。我想從兩個方面來回應:一方面承認這背後確實存在真實的權力不對稱,另一方面指出這個比喻可能遮蔽了一些更複雜的東西。先說權力不對稱的部分。技術的推進從來不是純粹的技術邏輯在驅動,而是資本和制度力量介入的結果。AlphaGo的挑戰賽就是一個很好的例子——那不是一場自然發生的比賽,而是DeepMind和Google精心策劃的媒體事件,目的是向全世界展示它們的AI能力。今天大語言模型的推廣也是一樣的,大量的資本投入、媒體敘事和平台策略在共同塑造著一種“你必須擁抱AI”的氛圍。我們前面討論的FOMO,那種焦慮感不全是自然產生的,在相當程度上它是被製造出來的。當科技公司和媒體不斷告訴你“不用AI就會被淘汰”的時候,你很難不焦慮。從這個意義上說,“人質”這個說法有它合理的部分。但我不太同意“除了被動接受沒有更好的辦法”這個判斷。這個判斷本身其實就是一種“技術決定論”——好像技術發展的方向是註定的,人只能順從。STS這個學科幾十年來一直在做的一件事,就是打破這種“沒有別的辦法”的敘述。技術以什麼方式部署、應用在什麼場景、由誰來監管,這些都不是註定的,都是可以被討論和塑造的。問題在於,進行這種討論需要空間,而當下“趕緊學AI否則就被淘汰”的敘事恰恰在壓縮這個空間。你忙著追趕的時候,就沒有餘裕去問“真的一定要這樣嗎”。回到我的圍棋研究,我觀察到的情況比“收銀員”的比喻要複雜。職業棋手面對AI的時候,並不是坐在那裡等著被替代。他們主動地重新定義了自己的角色——從圍棋知識的最高權威,變成了AI輸出的翻譯者、解讀者、教育者。他們在一個被極大壓縮的空間裡,進行了創造性的談判與適應。這裡有一個很重要的限定,我不想把這說成一個“人類終將適應”的勵志故事,因為在圍棋社群內部,適應的能力是高度不平等的。能夠成功轉型的往往是頭部棋手——世界冠軍等級的選手,他們有名氣,有社會資本,可以成為AI時代的解說明星或教育者。但大量中低段位的職業棋手,他們原本就處在這個職業體系的邊緣,AI的到來讓他們的處境更加艱難。對這些棋手來說,他們的經歷可能確實更接近那個收銀員的比喻。這不是一個“樂觀還是悲觀”的問題,而是一個分化的問題。面對同樣的技術衝擊,不同位置的人擁有的重新談判的空間是極不平等的。AI並不是均等地改變所有人,它在加劇已有的不平等。誰能成功重新定位自己,誰只能被動承受,很大程度上取決於你在變局到來之前就已經擁有的資源、地位和社會關係。這一點放在圍棋界成立,放到更大的社會圖景中恐怕也一樣成立。▲2017年5月26日,2017年烏鎮圍棋峰會人機大戰團隊賽,五位圍棋國手聯手仍不敵AlphaGo 圖/視覺中國那些力量讓AI瘋狂加速南方人物周刊:如同DeepMind創始人哈薩比斯所說,他和科學家朋友的AI夢想發展進步如此神速,他原本應該十分開心,但是他心中也有很多的擔心,因為“事情發展得如此瘋狂,如此倉促”。AI競爭不會停步,國家競爭更使得AI的發展遠遠超出科學研究所能控制的節奏。AI安全作為一個公共必需品“懸停”在空中,這種現象歷史上是否常見?賀久恆:這種現像在歷史上不僅常見,甚至可以說是一種規律。技術治理領域有一個經典的概念叫科林格里奇困境(Collingridge dilemma,一種關於技術治理的兩難),是1980年提出的,核心意思非常簡單:當一項技術還在早期、容易管控的時候,你看不清它的影響,所以沒有動力去管;而當影響已經清楚了,技術已經深度嵌入社會,你又管不動了。管得動的時候看不清,看得清的時候管不動。核能、基因工程、社交媒體,幾乎所有重大技術都經歷過這個循環。所以AI安全作為公共必需品“懸停”在空中,從歷史的角度看並不是例外。但AI安全的“懸停”有幾個特殊性值得關注。第一是速度。哈薩比斯自己說“事情發展得如此瘋狂”,這不是修辭。核能從理論到應用,發展了幾十年,基因編輯從CRISPR技術出現到引發廣泛的倫理恐慌也有一段緩衝期。這些緩衝期雖然不夠長,但至少給了社會一些反應時間——學術界可以展開研究,公眾可以形成意見,立法機構可以開始討論。但大語言模型從實驗室產品到全民應用只用了幾個月,所有傳統的治理機制——立法、監管、行業自律——都是為更慢的節奏設計的,根本來不及響應。安全議題不是沒有人想接住,而是現有的制度工具跟不上這個速度。第二是國家競爭的維度。這一點非常關鍵。冷戰時期的核技術治理之所以最終建立了一套框架——雖然不完美,部分原因是雙方都有動機避免互相毀滅,恐怖平衡反而催生了軍控協議。但AI競爭的邏輯不同,它更像是一場誰都不敢先停下來的“軍備競賽”——每個國家、每個公司都在說:“我也擔心安全,但如果我放慢速度,對手就會超過我。”哈薩比斯的矛盾心態恰恰體現了這種結構性困境:個人層面的擔憂和系統層面的激勵方向是錯位的。你是一個真誠地關心AI安全的科學家,同時也是一個不得不參與競速的公司領導者。這兩者之間的張力不是靠個人道德可以解決的,它是一個結構性的問題。第三,我想稍微推進一下你用的“懸停”這個意象。說AI安全“懸停在空中”,好像暗示它是一個等待降落的東西,只要條件成熟,安全框架就會自然到位。更準確的說法可能是,安全議題不是在“懸停”,而是被多方力量托舉在那個位置,阻止它降落。資本不希望安全框架限制創新速度,國家競爭不允許任何一方單方面減速,而公眾的FOMO——我們前面討論過的——又在消解批判和反思的空間。這三股力量合在一起,讓安全議題始終停留在“大家都覺得重要但沒有人真正落實”的狀態。▲2026年3月6日,人們在深圳騰訊大廈北廣場排隊等待安裝“龍蝦”(OpenClaw)。4月1日,OpenClaw發佈消息稱,國內社交平台QQ實現原生接入;同日,國家智慧財產權局發佈風險提示,OpenClaw等智能體工具易引發嚴重安全風險 圖/新華社南方人物周刊:圈內人其實也有疑問:“我們一定要發展AI嗎?人類做得很好的事情,非要AI來取代嗎?”這個階段讓AI討論重回公共輿論場,有能力瞭解和參與其中的社會學家和哲學家發出更大的聲音特別重要。面對複雜的局面,我們如何打破技術的解釋壟斷和商業的焦點轉移,以及媒體和社會關注的“預警疲勞”,讓AI安全和倫理的討論在公共輿論中始終保持熱度,並且有一個適當的公共討論空間?賀久恆:“我們一定要發展AI嗎?人類做得很好的事情,非要AI來取代嗎?”我覺得這個問題非常重要,但它在公共空間中幾乎不會被認真討論。不是因為它不重要,而是因為它在當前的話語結構中被預設為一個不可問的問題。“AI是不可阻擋的趨勢”這句話在今天已經不是一個需要論證的命題,而是一個討論的前提。一旦你接受了這個前提,所有對話就只能圍繞“怎麼適應AI”展開,而“要不要發展AI”“能不能放慢速度”“某些領域是否應該限制AI的介入”就變成了幼稚的、落後的、不值得討論的問題。STS這個學科幾十年來一直在做的事情,就是把這些被自然化的前提重新變成可以追問的問題。技術的發展方向從來不是註定的,它是被選擇的:被資本選擇、被政策選擇、被特定的利益結構選擇。既然是選擇,就可以被追問、被討論、被改變。▲2025年9月5日,2025世界智能產業博覽會在重慶開幕,中國移動展台的AI+智慧酒店機器人在為觀眾調製咖啡 圖/新華社關於技術的解釋壟斷,當前AI的公共敘事很大程度上由科技公司主導。我在論文中詳細分析過,AlphaGo挑戰賽本身就是DeepMind和Google精心策劃的媒體事件:選擇什麼樣的對手、怎麼做直播、賽後怎麼發佈論文和紀錄片,這些都是敘事的建構。今天大語言模型的推廣也是一樣的,科技公司不僅在建造技術,更在定義我們理解技術的方式。打破這種壟斷,需要的不是讓所有人都去“懂技術”。這又回到了上一個問題講的“AI素養”的陷阱。真正需要的是讓更多不同立場的人擁有對技術的解釋權。圍棋棋手、教師、律師、工人,他們對AI的感受和判斷,包括職業棋手表達出來的職業意義感和價值感的喪失,包括亞特蘭大培訓課上那個工人說的“感覺像胡蘿蔔吊在前面”,這些都是關於AI的有效知識,不比工程師的知識低一等。社會學家、哲學家、人類學家的角色,是幫助把這些分散的、日常的聲音連接起來,賦予它們理論的力量和公共的能見度,讓它們不至於被技術樂觀主義的敘事輕易消解。我想誠實地說,學者在這方面能做的事情是有限的,而且學術界自身的結構也在制約這種介入。“有能力瞭解和參與其中的社會學家和哲學家的聲音特別重要”,我完全同意。但現實是,當前的學術獎勵系統並不鼓勵學者做這樣的公共介入。學術界評價一個學者,看的是你發了多少篇論文、發在什麼等級的期刊上、拿了多少引用。寫一篇面向公眾的文章、接受一次媒體採訪、參與一場政策討論,在學術評價體系中幾乎沒有價值,甚至可能被視為“不務正業”。這就造成了一個矛盾:社會最需要學者發聲的時候,恰恰是學術體制最不鼓勵學者發聲的時候。很多學者不是不關心AI安全和倫理,而是他們在職業生存的壓力下,不得不把精力集中在學術圈內部的產出上。而且,AI也加速了學術內部產出的競爭。還有一個更深的矛盾——好的社會研究需要時間。比如我的論文做了一年的田野調查,最近資料與社會研究所(Data & Society Research Institute)發佈了一份報告叫“(404) Job Not Found”,研究的是亞特蘭大的非洲裔工人在AI時代面臨的就業困境,研究者Akanegbu在亞特蘭大做了六個月的民族志。但AI的發展速度和公共討論的節奏要求你現在就給出判斷、現在就提供答案。學術研究的節奏與公共對話的節奏是錯位的。所以經常出現的情況是:在公共討論中發聲的,要麼是科技公司的人,因為他們有動力也有資源來塑造敘事;要麼是對技術細節並不瞭解的泛評論者。而真正在做深入研究的學者,他們的聲音要麼滯後、要麼被鎖在付費期刊的防火牆後面,無法進入公共空間。所以要讓AI安全和倫理的討論在公共空間中保持熱度,光呼籲學者發聲是不夠的,還需要改變讓學者能夠發聲的條件。包括學術評價體系對公共參與的認可、研究資助對快速響應研究的支援,以及媒體和學術界之間更有效的對接機制。這不是學者個人的責任問題,這本身也是一個結構性的問題。▲2025年7月2日,浙江東陽,學員獨立駕駛裝有AI教學系統的AI智能教練車進行科目二練習,駕校教練通過即時監控關注AI智能教練車行駛情況,並可隨時與學員語音交流 圖/新華社社會技術想像不是中性的,有它的代價承擔者南方人物周刊:三年前,我們談到棋手與AI的“雙向奔赴”,本質上還是棋手群體承擔了巨大的壓力,他們在巨大的知識混亂面前,用從小養成的堅韌和勤奮,快速掌握和消化AI所創造的圍棋知識,這對人類社會也是一個預演。如果全社會AI化,局面可能還要慘烈。賀久恆:你說得對,棋手群體確實承受了巨大的壓力,他們的堅韌和勤奮是真實的。但我想補充一些從田野調查中看到的更深層的東西。首先,棋手們面對的不僅僅是“需要學習更多的知識”。在AlphaGo之前,圍棋知識是一套有美學標準、有師承譜系、有直覺判斷的完整體系。一步棋好不好,職業棋手是用幾十年積累的感覺來判斷的。但AI帶來的知識是完全不同的——沒有解釋、沒有理由,只有一個勝率數字。棋手們真正面對的衝擊不是“有更多東西要學”,而是“我過去理解知識的整個方式可能需要被重新校準”。這種認識論層面的震盪,比單純的技能更新要深重得多。用我論文裡的話說,“這是一種知識體系的去穩定化,不只是知識內容的更新。”圍棋社群之所以看起來適應得相對好,有兩個很重要的條件。一個是圍棋有極其清晰的反饋機制——你學了AI推薦的下法,去比賽,贏了就說明學對了,輸了就繼續調整,這個反饋回路是即時的、明確的。另一個是圍棋的遊戲規則本身沒有變,棋盤還是19×19,“贏”的定義沒有改變,變的是策略和知識,但競技的框架是穩定的。推到全社會,這兩個條件都不具備。在大多數職業領域,“你有沒有成功適應AI”根本沒有清晰的答案。一個律師用了AI輔助寫文書,他的工作質量提高了還是降低了?一個教師用了AI備課,學生學得更好還是更差了?反饋是模糊的、滯後的、充滿噪音的。AI在很多行業改變的不只是“怎麼做”,還有“做什麼”,甚至“這個崗位還需不需要存在”。圍棋棋手至少不需要擔心“圍棋”這個東西會消失,但很多職業的從業者面對的恰恰是這種存在性的威脅。所以你說“局面可能還要慘烈”,從這個意義上說,是有根據的。我最想強調的一點是:圍棋的經驗告訴我們,最終決定適應結果的不是個人的勤奮和堅韌,而是制度安排和社會支援。圍棋界之所以還能運轉,不只是因為棋手們努力,更因為賽事體系還在、圍棋協會還在運作、線上平台提供了新的生態位、觀眾還願意看人類棋手比賽。如果這些制度性支撐不存在,個人再堅韌也無處施展。▲2026年3月1日,一名務工人員在位於福州市達明美食街的智慧就業艙內體驗。艙內智慧系統可根據求職者簡歷,提供解讀求職需求、精準匹配崗位、AI模擬面試、求職進度跟蹤等服務 圖/新華社資料與社會研究所那份研究亞特蘭大非洲裔工人就業困境的報告,提供了一個非常有說服力的案例來說明這一點。亞特蘭大有大量的數字技能培訓項目,鼓勵工人去“upskill”和“reskill”,就是咱們說的提升技能——學AI、學程式設計、考證書。這些項目的邏輯與圍棋社群裡“趕緊學AI否則就落後”的邏輯是一樣的,都是把適應的責任放到個人身上。報告發現,很多工人根本無法參加這些培訓,不是因為他們不想學,而是因為培訓時間與工作時間衝突、沒有人幫忙帶孩子、拿不到足夠的生活補貼。一個課程免費,但你上課期間不能工作、不能掙錢,這對很多人來說就是參加不了。報告裡有一個受訪者說得很直接:課程固然免費,“但你也掙不到錢,你的帳單還在那裡。”更深層的問題是,即便這些工人完成了培訓、拿到了證書,也不一定能找到穩定的工作。僱主可能還是偏好四年制大學學歷,AI相關崗位的定義本身就是模糊的——連什麼算“AI素養”都沒有統一標準。報告用了一個很精準的概念叫“strategic abstraction”,意思是戰略性模糊:告訴你要學AI、要跟上時代,但從來不告訴你具體學什麼、學到什麼程度才夠,這個模糊本身就是一種權力的運作。圍棋社群內部的不平等已經很明顯了,但圍棋畢竟是一個小社群,大家彼此認識,資源雖然有限但相對集中。推到全社會,當數以百萬計的人被告知“你要學AI”,而制度支撐跟不上的時候,結果就是:有資源的人適應得很好,沒有資源的人不僅沒有得到幫助,反而還要承受“你為什麼不學AI”的道德壓力。這其實就是把結構性的問題轉嫁為個人的責任。所以,僅僅告訴每個人“你要堅韌、你要勤奮、你要學習AI”是遠遠不夠的。如果社會不提供相應的制度性支援,個人的勤奮只會變成另一種形式的自我消耗。▲2025年7月6日,浙江省金華市金華之光文化廣場科技館內,小朋友與智慧型手機器狗互動 圖/新華社南方人物周刊:三年前,你給我講了一個詞——Sociotechnical Imaginaries(社會技術想像)。過去十年,是否也可以理解為關於這種技術想像的一個驗證過程?在AI帶來第四次工業革命,AGI(通用人工智慧)將讓人類社會進入“智慧量產”的想像背後,會否是巨大的社會代價和複雜的社會後果?賀久恆:2016年AlphaGo時期,AI的社會技術想像是相對聚焦的:“AI可以在特定領域超越人類最強大腦。”這個想像通過挑戰賽被戲劇化地呈現了,而且它有一個非常重要的特徵:它是被精心建構的。前面提過,AlphaGo挑戰賽不是一場自然發生的比賽,而是DeepMind和Google精心策劃的一場展示。選擇誰做對手、比賽在那裡舉行、怎麼做直播和媒體傳播,所有這些決定都在塑造公眾對AI的想像。所以,“AI超越人類”這個想像不是技術發展的自然結果,它是被特定的行動者有意識地生產出來的。到了ChatGPT時代,想像急劇膨脹。從“AI可以下圍棋”變成了“AI可以做一切”,從narrow AI(狹義人工智慧)變成了AGI的宏大敘事,從“機器在特定領域很強”變成了“智慧量產”和“第四次工業革命”。想像的規模和野心完全不同了。而且建構這些想像的行動者也更多了,不只是一家公司,而是OpenAI、Google、Meta等企業及各國政府,在競爭中共同推高了想像的天花板。每一個行動者都有動機把AI的未來描述得儘可能宏大,因為宏大的想像能吸引資本、影響政策、爭奪話語權。Jasanoff(社會技術想像的提出者)的框架最有力的地方在於它提醒我們:每一種社會技術想像都有它的受益者,也有它的代價承擔者。想像不是中性的,它是有選擇性的。“AI帶來第四次工業革命”這個想像呈現的是技術進步、效率提升、人類能力的擴展,但它系統性地遮蔽了一個問題:代價是什麼樣、代價由誰來承擔?圍棋界承擔了“AI超越人類智慧”這個想像的代價,職業棋手的權威被動搖、公平競技的規則被侵蝕、一個有兩千多年傳統的知識體系需要在幾年之內重新校準。柯潔說“感覺過去二十多年的付出毫無意義”,這就是被想像敘事遮蔽的那一面。▲2017年烏鎮圍棋峰會,柯潔0比3不敵AlphaGo 圖/視覺中國南方人物周刊:你在博士後階段開始了提示詞工程師的社會研究,有什麼洞見?賀久恆:做完圍棋AI的博士論文之後,我一直在思考一個問題:我在圍棋社群中觀察到的那些動態事情是不是正在其他領域以更大的規模發生?圍棋是一個AI衝擊既有專業社群的案例,但ChatGPT時代還出現了一個圍棋時代沒有的現象:AI不僅在改變舊的職業,還在催生全新的職業。其中最引人注目的就是“prompt engineer”,提示詞工程師。這個職業特別吸引我,因為它處在一個非常有趣的位置。圍棋棋手是被AI挑戰的一方,他們需要重新定義自己與AI的關係。而prompt engineer是一個因AI而誕生的角色:他們的工作就是與AI對話,讓AI按照人類的意圖來工作。在某種意義上,圍棋棋手和prompt engineer面對的是同一個問題的兩面:在人類與AI之間,誰在掌控?掌控意味著什麼?掌控的權威從何而來?我現在在做兩個相互關聯的研究。第一個從話語分析的角度,研究人們是如何理解和想像“prompting(訓練語言模型來完成特定任務的方法)”這個行為的。我發現存在三種競爭性的隱喻。一種是“工程”隱喻:把與AI對話理解為一種技術最佳化問題,強調可控性、可靠性、標準化,這背後是一種技術樂觀主義。第二種是“魔法”隱喻:把AI看作一個神秘的、不可完全理解的存在,prompting就像是唸咒語或者“低語”,強調的是AI的不透明性。第三種是“手藝”隱喻:把prompting理解為一種需要經驗積累和直覺判斷的實踐技能,類似於木匠與材料之間的關係。這三種隱喻不只是修辭上的差異,它們決定了非常實際的問題:誰有權與機器對話、誰為AI的輸出負責,以及AI勞動的未來被想像為一個科學學科、一門神秘藝術還是一種技能行當。第二個研究更加經驗性。我收集了在LinkedIn(領英,職業社交網站)上發佈的prompt engineer招聘廣告,做了系統的話語分析。這個研究有幾個發現我覺得對公眾來說會特別有意思。第一個發現是這個職業內部驚人的分化。同一個“prompt engineer”的頭銜下,薪酬差距有著天壤之別。在光譜的一端,AI巨頭公司招的prompt engineer年薪可以到40萬美元,工作內容是設計AI的核心行為規則。在光譜的另一端,資料標註平台也在招“prompt engineer”,時薪只有15美元,工作內容是反覆給AI的回答打分、排序,本質上是資料標註的零工勞動。第二個發現是“工程”這個詞本身就在做政治工作。當企業把與AI對話的行為稱為“工程”,它同時在做好幾件事:對外,它讓AI的不確定性看起來是可控的,客戶和監管者可以放心——“我們有工程師在管理這件事”;對內,它讓勞動重組看起來是技術進步,把原來的文案寫作、行政助理、內容編輯的工作重新包裝成“AI驅動的工程崗位”,實際上是在提高產出要求、壓縮人力成本,但這些變化被“工程”的光環掩蓋了,顯得像是創新而不是裁員。第三個發現,也是我個人覺得最有傳播力的一個觀點:prompt engineer這個職業很可能會走上與20世紀打字員相同的命運。打字員這個職業消失了,不是因為打字技能過時了,恰恰相反,打字變成了所有辦公室工作者都必須會的基本技能,它太普遍了,所以不再需要一個專門的從業者來做這件事。▲2025年10月14日,浙江義烏,兩名外籍客商在義烏全球數貿中心體驗AI翻譯互動屏 圖/新華社Prompt engineering現在被當作一種專門的技術能力,但隨著AI工具變得越來越易用,與AI對話會變成每個知識工作者的日常操作,就像今天沒有人會把“會用滑鼠”當作一項專業技能一樣。到那時候,“prompt engineer”這個獨立的職業頭銜就會消失。不是因為這個技能不重要了,而是因為它變成了空氣一樣的存在。從圍棋到prompt engineering,我一直在關注的核心問題其實沒有變:在AI時代,什麼算專業知識?誰有權定義它?這些定義的背後有著怎樣的權力安排?圍棋給了我一個已經走過一個完整周期的案例,而prompt engineering讓我看到同樣的動態正在即時展開,只不過規模更大、速度更快、涉及的利益更複雜。 (南方人物周刊)
Google財報告訴你AI是不是真未來?
本文繼續聊AI類股美股的另一個大牛——Google。聊輝達的時候,微哥說過,這一輪AI大爆發,首先的爆點是大語言模型,而大語言模型的爆發靠的是三要素,一個是神經網路演算法,一個是巨量的網際網路資料,一個是算力爆發。這三要素中的算力爆發的最大貢獻者,是輝達。三要素中的神經網路演算法,我們知道是被譽為AI之父的辛頓提出來的,也拿了圖靈和諾貝爾獎,而大模型之所以成功,還有Google演算法團隊的重要貢獻。為什麼這麼說呢?這一點微哥還是有點發言權的。因為微哥在工作中會用到很多人工智慧演算法,所以也會瞭解學習這些演算法發展的歷程極其對應的文章。雖然辛頓最早提出了神經網路演算法,但是目前大模型用的模型演算法架構,相比較辛頓提出來的那個版本,那已經升級改造了不知道多少個版本了。在這一過程中,目前大語言模型用到的最核心的Transformer架構,就是Google的研發人員提出來的。第一個大語言模型Bert,也是Google做出來的。第一個把圖像用於Transformer架構,從而使得大語言模型變成現在的多模態大模型,也是Google提出來的。所以從這裡可以看出來,Google對於大模型的誕生和發展,起到了很重要的工程作用。雖然第一個大語言模型ChatGPT是Open AI做出來的,但是業內人士都知道,Open AI的很多AI人才,都是從Google挖過去的。而且Google在大模型上的能力,很快就通過Gemini 3追了上來。這還是源自於Google在AI領域長期的資源投入,特別是人才的投入,使得其在AI領域的積累,很快就得到了體現。這也叫厚積薄發。比如大家熟知的Google做的AlphaGo擊敗了世界圍棋冠軍李世石。精準預測蛋白質結構,解決生物學50年難題的AlphaFold,還讓Goolge Deepmind老大哈薩比斯拿到了諾貝爾。這些工作,都可以體現出Google的AI能力,是全球首屈一指的。所以這也是這一輪AI革命到來,包括巴菲特、段永平、李錄、但斌、邱國鷺等投資大佬們紛紛加倉Google的一個很重要的原因。Google確實是一家對利潤之上還有追求的高科技公司,我們都知道,他是一家做搜尋發家的公司,當然現在的業務基本盤也仍然是搜尋。但是他還做了很多其它的工作,除了前面說的AI,我們現在所有非蘋果手機用的作業系統Android,也是出自於Google的免費開源。之前輝達文章說了,輝達AI產業鏈中上游賣基礎設施的。中下游無論行不行,都要買輝達的基礎設施。而Google是既處於AI產業鏈的上游,也處於產業鏈的中游,當然也有產品涉及到下游的。上游是因為Google雲,因為Google雲是給所有AI應用提供算力服務的。當然Google也要買輝達的裝置,但是資料中心的建立,是由Google這類雲廠商去做的。未來使用者買的token(AI算力的最基本單位),都是雲廠商提供的。除了買輝達的晶片,Google也在自己做,比如TPU就是非常有名。當然TPU當下主要是自用。中游就不用說了,Gemini這個大模型也是讓Google能夠後來居上,甚至略超ChatGPT的產品。當然大模型的版本也在不斷迭代和競爭之中,鹿死誰手,還未可知。但是大機率是有Google的一席之地的。下游比如Google眼鏡之類的智能硬體,當然這一塊還不怎麼賺錢啊。但是未來可能會大爆發。輝達的業績已經充分體現了AI類股,至少上游基礎設施建設上是沒有泡沫的,是有業績支撐的。那麼本文我們看看Google,作為AI類股應用最最重要的領導者,AI在Google2025年財報中有那些體現?是不是真的有泡沫呢?整體業績出色2026年2月,Google母公司Alphabet發佈2025年第四季度及全年財報,這份年報是Google生成式AI全面商業化元年裡,科技巨頭交出的最具代表性的答卷之一。Google第四季度,營收1138.28億美元,同比增長18%;淨利潤(非GAAP和GAAP一致)344.55億美元,同比增長30%。全面超出華爾街預期。全年營收首次突破4000億美元大關,達到了4028.36億美元,同比增長15%;淨利潤(非GAAP)達1402.8億美元,同比增長35%。GAAP淨利潤為1321.70億美元,低於非GAAP淨利潤,核心差異來自:剔除了歐盟反壟斷35億美元一次性罰款、Waymo自動駕駛業務21億美元一次性員工股權激勵費用、併購相關無形資產攤銷等非經營性、非經常性支出。分季度來看,公司營收增速逐季加速,Q1-Q4營收分別為902億美元、964億美元、1023億美元、1138.28億美元,同比增漲14%、15%、16%和18%。這個資料增速雖不如輝達那般炸裂,但也是很漂亮的,特別是那麼大體量,還能有這麼快的增速,而且淨利潤增速遠超營收增長。盈利增速遠超營收增速,核心源於兩方面:一是AI技術落地帶來的廣告變現效率提升,二是規模化效應下成本控製成效顯著,公司全年營運利潤率穩定在32%的行業高位。回顧過去5年,Google的營收是一直增長的,淨利潤除了2022年下滑之外,其餘年份都是增長的,且增速還不低。5年時間,營收增長1.6倍,淨利潤增長1.8倍,這麼大的體量,這個增速,還是非常可觀的。大象仍然在飛舞。所以千萬不要覺得,一個公司體量太大,就沒有增長空間了,其實不然,一定要認真去研究。就像邱國鷺說的,價值投資,不要去追星星,而是找月亮。大公司,各方面都很強的時候,即護城河足夠深的時候,往往還會有一定的成長空間,在便宜的時候介入,是很不錯的投資機會。Google2025年這份財務資料證明,Google並未因AI的巨額投入陷入“增收不增利”的困境,反而實現了技術投入與商業回報的正向循環。此外,2025年公司全年經營活動現金流淨額達1640億美元,自由現金流725.5億美元,期末現金及短期投資規模超1800億美元,無短期有息債務壓力,為AI技術研發、基礎設施投入提供了充足的安全墊。尤為值得關注的是Google的資本開支,2025年Google全年資本開支達914.47億美元,同比增長77%;2026年資本開支預計將達到1750-1850億美元,同比接近翻倍,其中60%將投向伺服器(含TPU晶片),40%用於資料中心及網路裝置建設,重點支撐AI基礎設施擴張與雲業務全球佈局。這就是輝達業績巨好的原因之一,雲廠商在瘋狂的砸錢搞AI,建資料中心。這麼巨額的資本開支,是非常罕見的。相當於把一年的淨利潤全部砸向AI,還把去年的資本積累也砸進去,可見科技巨頭們是多麼看好AI啊。所以AI在Google身上目前看來除了砸的錢多之外,業績上還是有幫助的,所以所謂泡沫,沒什麼好擔心。畢竟AI革命才剛剛開始,未來的想像空間確實非常大。AI技術從概念落地為核心增長動力,Google雲完成規模化盈利的關鍵跨越,同時公司以翻倍的資本開支計畫,宣告了All in AI的長期戰略決心。分業務看Google的業務主要包括Google服務、Google雲和其它的前沿業務,絕對核心就是Google服務,包括Google搜尋及其他廣告業務、YouTube生態。(一)Google服務:絕對核心壓艙石,AI啟動傳統業務新活力Google服務類股2025年全年營收約3370億美元,佔公司總營收的83.6%,營業利潤約1280億美元,佔總營業利潤的99.2%,始終是公司的現金牛核心。該類股的增長核心源於AI對傳統業務的深度改造,打破了市場對 “搜尋廣告進入成熟期” 的悲觀預期。細分業務中,Google搜尋及其他廣告業務是核心中的核心,全年營收2245.3億美元,同比增長13.3%。第四季度營收630.73億美元,同比增長17%,增速較上年顯著加快。增長的核心驅動力是Gemini大模型對搜尋體驗的全面重構,AI概覽與AI 對話模式顯著拉長了使用者會話時長,AI模式下的使用者查詢時長達到傳統搜尋的3倍。美國市場日均AI模式人均查詢量自發佈以來實現翻倍,極大地拓展了廣告庫存的展示機會,同時AI驅動的推薦演算法顯著提升了廣告轉化率,吸引了零售、旅遊等垂類廣告主的強勁投放。YouTube生態實現里程碑式突破,2025年全年廣告+訂閱總收入突破600億美元,第四季度廣告營收113.83億美元,同比增長9%,付費訂閱使用者總量達3.25億。其中,YouTube Premium、NFL賽事版權訂閱帶動訂閱業務高速增長,Shorts短影片的流量規模與單小時變現效率持續提升,形成了“廣告+訂閱”的雙輪驅動模式,成為Google服務類股的第二增長極。此外,Google訂閱、平台及裝置業務全年同比增長17%,Google One雲端儲存、硬體生態的協同效應持續增強,使用者付費粘性穩步提升。(二)Google云:爆發式增長領跑,AI驅動規模化盈利拐點確立Google雲是2025年年報中最亮眼的類股,徹底完成了從“虧損燒錢”到“規模化盈利+高增速增長”的轉型,成為公司最核心的增長引擎。全年Google雲營收608億美元,同比增長36%,第四季度營收176.64億美元,同比激增48%,增速遠超公司整體業務水平。特別是盈利端,Google雲全年營業利潤139億美元,同比大幅增長128%,全年營業利潤率升至24%,第四季度單季營業利潤率突破30%,較上年同期提升超12個百分點,規模化盈利的拐點完全確立。增長的核心驅動力完全來自AI,第四季度基於Google雲生成式AI模型的產品收入同比增長近400%,Gemini企業版解決方案、AI基礎設施服務的企業需求爆發。全年超10億美元的大額交易數量超過此前三年的總和,截至年末未履行訂單規模達2400億美元。目前已有超12萬家企業使用Gemini模型,全球前20大SaaS公司中95%都在使用Google雲的AI服務,Google雲憑AI差異化優勢,正在持續縮小與AWS、微軟Azure的市場份額差距。全球雲市場市佔率如下表,Google雲雖然排名第三,與前兩名有差距,但是增速最快。這裡就可以真正看出來AI是在實實際際的在為公司雲業務創造價值。此外,插個題外話,阿里雲其實雖然是國內老大,但是相比較前面三位大咖,還是很小的。(三)其它的前沿業務:前沿探索持續投入,商業化處理程序緩慢以Waymo自動駕駛為核心的Other Bets類股(還有生命科學Verily、量子計算、智慧城市等前沿領域),2025年全年營收3.7億美元,同比下降8%,依然處於長期投入、商業化緩慢的階段。Waymo作為全球自動駕駛行業的領軍者,2025年實現了規模化擴張,已在美國6個城市落地自動駕駛出行服務,周均載客量超40萬人次,2026年計畫登陸倫敦、東京等海外市場,開啟全球化商業化處理程序。該類股是Google佈局未來的核心抓手,在量子計算、AI醫療、機器人等前沿領域的持續投入,為公司長期增長儲備了第二增長曲線,也延續了Google“登月文化”的創新基因。潛在風險這份年報既展現了Google在AI時代的強大競爭力,也暴露了其面臨的四大核心風險。其一,全球監管與反壟斷風險持續高企,作為全球搜尋、廣告與Android生態的絕對龍頭,Google在歐盟、美國、印度等市場持續面臨反壟斷調查,若未來出現巨額罰款、強制業務分拆等不利裁決,將直接衝擊其核心商業模式。其二,行業競爭持續加劇,在AI大模型領域仍面臨OpenAI、Meta的激烈競爭,搜尋業務面臨微軟Bing+ChatGPT的持續挑戰,雲業務市場份額仍顯著落後於AWS與Azure,巨頭間的AI軍備競賽將持續推高投入成本。其三,巨額資本開支的回報不確定性,2026年近1800億美元的資本支出已超過2025年全年經營性現金流,若AI商業化進度慢於預期,將顯著壓制公司利潤率與自由現金流水平。其四,業務結構單一風險仍未完全化解,2025年廣告收入佔公司總營收的比例仍超73%,宏觀經濟波動對廣告主預算的影響,也會給公司業績帶來不確定性。總結整體而言,2025年是Google從“全球搜尋巨頭”向“AI全端科技巨頭(“模型-基礎設施-產品-商業化”)”轉型的關鍵一年,這份年報證明了Google不僅擁有AI時代的核心技術能力,更具備將技術轉化為商業回報的成熟體系。同時以超預期的資本開支計畫,宣告了其在AI時代的長期競爭決心。儘管面臨監管、競爭與投入回報的多重挑戰,但憑藉深厚的技術積累、龐大的現金流儲備與全場景的產品生態,Google依然是AI時代最具競爭力的科技巨頭之一。後續業績核心,將取決於AI技術的迭代速度與商業化落地的最終效率。對於Google,微哥也會持續保持關注和分享。這些巨頭們財報後的資料,對於我們看AI發展會起到非常非常重要的作用,而不是盲從。 (微微價值投資)
AlphaGo勝局十年後:AI正在重塑職業棋手的思維方式
在首爾東部寧靜的弘益洞小巷深處,有一棟貼著褪色石磚的建築,門牌上寫著“韓國棋院"——這是韓國職業圍棋的管理機構。圍棋是一項古老的運動,在韓國有著神聖的地位。然而走進這棟樓,昔日棋手將手伸入木碗取子時發出的細微聲響,如今已被滑鼠點選聲所取代:棋手們弓身坐在顯示器前,在 AI 程序中復盤對局;另一些人圍坐在棋盤旁,爭論下一步最優落點,而教練則告知他們的選擇與 AI 的建議相差多少;還有人默默坐著,看 AI 程序與 AI 程序對弈。十年前,Google DeepMind 的 AI 程序 AlphaGo 擊敗韓國棋手李世石(Lee Sedol),震驚世界。此後數年,AI 徹底顛覆了這項運動,推翻了數百年來關於最優落子的原則,並引入了全新的思路。棋手們如今訓練的目標,是儘可能地複製 AI 的落子,而非創造自己的風格,那怕他們對機器的思維邏輯仍感到茫然。(來源:麻省理工科技評論)今天,不借助 AI,棋手幾乎不可能在職業舞台上立足。有人說這項技術耗盡了圍棋的創造力,也有人認為人類的創造空間依然存在;與此同時,AI 正在推動訓練資源的民主化,越來越多的女棋手因此得以躋身高段行列。對於世界頂尖棋手申真諝(Shin Jin-seo)而言,AI 是一位不可或缺的訓練夥伴。每天清晨,他坐在電腦前打開 KataGo。他因落子風格與 AI 高度契合而被冠以“申真智能”的外號,他追蹤那個代表程序最優建議的藍色光點,在數字棋盤上不斷調整棋子位置,試圖理解機器的思考邏輯。“我一直在思考 AI 為什麼會選擇這步棋,”他說。備戰對局時,申真諝將大部分清醒時間都花在研讀 KataGo 上。“這幾乎像一種修行,”他說。2022 年韓國棋院聯賽的一項研究顯示,申真諝的落子與 AI 建議的吻合度達 37.5%,遠高於研究中所有棋手的平均水平 28.5%。“我的棋風變了很多,”申真諝說,“因為我必須在一定程度上遵從 AI 的指引。”韓國棋院表示,已主動聯絡 Google DeepMind,希望促成申真諝與 AlphaGo 之間的對局,以紀念 AlphaGo 擊敗李世石十周年。Google DeepMind 發言人表示,公司目前暫無相關資訊可以披露。但若新的對局成真,在更先進 AI 程序上磨礪多年的申真諝對獲勝持樂觀態度。“AlphaGo 當時仍有一些弱點,我認為針對這些弱點可以擊敗它,”他說。規則圍棋是一種抽象策略棋類遊戲,起源於 2500 多年前的中國。兩位棋手輪流在 19×19 的棋盤上落下黑白棋子,通過包圍對手的棋子來佔領領地。這是一場令人歎為觀止的數學複雜遊戲。棋盤可能的局面數約為 10 的 170 次方,遠超宇宙中的原子數量。如果說國際象棋是一場戰鬥,圍棋便是一場戰爭:你在一角窒息對手的同時,還要在另一角抵禦入侵。為訓練 AI 下圍棋,海量人類棋局資料被輸入模擬人腦神經元網路的計算系統神經網路。AlphaGo 在擊敗李世石後被命名為 AlphaGo Lee,訓練封包含 3000 萬步棋局,並通過與自身進行數百萬次對弈加以精進。2017 年,其繼任者 AlphaGo Zero 從零開始學習圍棋,不研究任何人類棋局,僅依據規則與自身對弈,純靠自我博弈發展出落子策略。這種白板式學習方式不受人類知識侷限,被證明更為強大。訓練三天後,AlphaGo Zero 以 100 比 0 完勝 AlphaGo Lee。Google DeepMind 同年宣佈 AlphaGo 退役。隨後,一批受 AlphaGo Zero 啟發的開源模型相繼湧現。今天,KataGo 是韓國職業圍棋棋手使用最為廣泛的程序。它比 AlphaGo 更快、更精準,不僅能預測勝負,還能在任意時刻預測棋盤每個點位的歸屬。AlphaGo Zero 通過分析棋盤的局部小塊來拼湊出對整體的理解,而 KataGo 則學會了讀懂整張棋盤,對長遠戰略形成了更強的判斷力。它不僅學會了如何贏棋,更學會了如何最大化得分。這款軟體從根本上改變了人們的下棋方式。數百年來,職業棋手應對圍棋天文數字般複雜局面的方式,是發展出一套替代純粹計算的啟髮式原則:精妙的佈局策略為空白棋盤建立抽象秩序,早早搶佔角落被視為劃不來的交換,每一代棋手都在積累新的原則,充實這門學問的體系。然而,“AI 改變了一切,”韓國圍棋解說員朴正相(Park Jeong-sang)說,“曾經被視為常識的基本下法如今幾乎銷聲匿跡,而過去從未有過的技術則大行其道。”變化最為顯著的是佈局。圍棋從空白棋盤開始,前 50 手曾是抽象思考與創造力的畫布,棋手在其中刻下各自的個性與棋道哲學。李世石以充滿挑釁的落子風格著稱,擅長製造混亂;曾在 2017 年負於 AlphaGo Master 的中國棋手柯潔,則以靈動想像力令人眼花繚亂。如今,棋手們記憶的是同一套由 AI 建議的高效、精算型佈局套路。棋局的重心已轉移到中盤,在那裡,純粹的計算能力比創造力更為重要。AI 訓練導致了棋風的同質化。柯潔曾感嘆,看著同樣的佈局套路被無休止地重複,令人疲憊。“我和場下的觀眾感受完全一樣,看著很累,很痛苦,”他 2021 年在接受中國媒體採訪時說。每當有棋手突破慣例、落出出人意料的棋,觀眾便歡呼雀躍,但這樣的時刻已越來越少。2023 年的一項研究顯示,頂尖圍棋棋手超過三分之一的落子與 AI 建議相同。許多棋手表示,每局棋的前 50 手往往與 AI 的建議如出一轍。“圍棋已經變成了一項智力競技運動,”在 2016 年負於 AlphaGo 三年後退役的李世石說,“在 AI 出現之前,我們追求的是更高的東西。我是把圍棋當作一門藝術來學的,”他說,“但如果你的落子來自抄答案,那就不再是藝術了。”一些棋手說,下圍棋不再是開拓新領域,而是遵從一個超人神諭的指令。“我曾經通過推動圍棋技術的進步、呈現新的範式來激勵棋迷,”李世石說,“我下棋的理由已經消失了。”棋思留守賽場的棋手們正在嘗試重建自己的技藝,但很難辨清新的原則究竟是什麼。金彩瑛(Kim Chae-young)是世界頂尖女棋手之一,恬靜沉穩,從職業棋手父親那裡習得了這門技藝。然而當 AI 開始重塑圍棋,她發現自己不得不從頭來過。“我需要時間去拋棄自己以前學到的一切,”金彩瑛在與我共享螢幕、用游標指著 KataGo 建議的藍色點位時說,“多年來積累的直覺,原來是錯的。”她湊近顯示器,螢幕上顯示著每一步棋的勝率,沒有任何解釋。即便是金彩瑛、申真諝這樣的頂尖棋手,也無法理解 AI 的所有落子。“它好像是在用更高維度的方式思考,”她說。當她試圖向 AI 學習時,她補充道,“與其說是理性地推敲每一步棋,不如說是在培養一種直覺。”研究人員正努力破譯棋類 AI 程序中編碼的超人知識,以便人類也能從中學習。2024 年,Google DeepMind 的研究人員從 AlphaZero(AlphaGo Zero 的通用版本,同樣能夠下國際象棋)中提取出新的象棋概念,並通過象棋題將其傳授給國際象棋大師。棋手們迄今從 AI 系統中汲取的圍棋概念,“很可能只是你潛在可以學到的一小部分,”豐田工業大學芝加哥分校電腦科學家尼古拉斯·托姆林(Nicholas Tomlin)說,他是一項探究 AlphaGo Zero 中圍棋概念編碼的研究的共同作者。然而提取這些經驗依然困難重重。“頂尖棋手至今仍未能歸納出 AI 落子背後的一般性原則,”明知大學圍棋教授南志賢(Nam Chi-hyung)說。儘管棋手可以模仿 AI 的落子,但由於其推理過程如同黑箱,他們尚未從中提煉出圍棋新的範式。圍棋或許正處於一種認識論上的迷途之中。即便 AI 是一位深不可測的導師,它也是一位公平的導師。AI 極大地提升了女棋手的訓練條件,而這一群體長期以來在圍棋界處於弱勢地位。南志賢表示,數十年來,圍棋訓練意味著在頂尖男棋手門下學藝,最具競爭力的對局也集中在女棋手難以涉足的男性圈子裡。“女棋手從未有過那樣的歷練機會,”她說,“但現在她們可以跟 AI 學習,訓練環境大為改善。”從更宏觀的角度來看,AI 通過幫助所有棋手打磨佈局套路,縮小了棋手之間的差距。近年來,女棋手的排名持續攀升。2022 年,時任世界女子第一人的崔精(Choi Jeong)成為首位晉級國際大賽決賽的女棋手。她以凶悍好鬥的棋風被稱為“女子力士”,在決賽中迎戰申真諝,最終落敗,但這場對決為圍棋界女棋手開創了先例。2024 年,金彩瑛因在韓國圍棋聯賽後季賽奪冠而登上新聞頭條,她是那屆賽事中唯一的女棋手。AI 訓練賦予了金彩瑛全新的自信。用 AI 分析男棋手的對局,打破了他們看似無懈可擊的光環。“以前,我無法判斷頂尖男棋手的實力究竟有多強,他們感覺無堅不摧。現在,我知道他們也會犯錯,他們的落子並非總是妙手,”她說,“AI 打破了心理上的壁壘。”身份儘管 AI 在圍棋上的造詣已遠超任何棋手,棋迷們依然更願意觀看人與人之間的對局。“AI 程序之間的對弈,對棋迷來說並不好看,”解說員朴正相說,這類對局過於複雜,棋迷難以跟上,而且太過完美,缺乏緊張感。棋手可以複製 AI 的佈局套路,但到了中盤,棋盤演變出多到無法全部記憶的可能性,便需要依靠自己的判斷。棋迷樂於看到棋手犯錯、逆境翻盤,在棋盤上每一顆棋子裡流露個性。申真諝的棋風強硬好鬥,卻帶著一種機械般的沉著;金彩瑛則善於在最混亂的局面中遊刃有餘。“圍棋裡,每一步都是你自己的選擇,對手也用自己的選擇來回應,”27 歲的圍棋愛好者和業餘棋手金大熙(Kim Dae-hui)說,“看著這個過程展開,很有意思。”有金大熙這樣的棋迷在看,申真諝從自己的棋局中找到了意義。“我能下出一種只有人類才能講述的故事,”他說。退役後,李世石尋找一份能發揮人類優勢的新工作,開始製作桌游、巡迴演講,並在大學教學生下棋。“我在尋找一個我能享受、能擅長的新領域,”他說。然而近來,他對自己離開的那項運動重燃了希望。“下出一局完美棋局,是每一位圍棋棋手的夢想,”那是一局技藝精湛、沒有失誤、勢均力敵的棋手廝殺至刀刃邊緣的對局。“這就像一個海市蜃樓,”李世石笑著說,“也許 AI 能幫我們下出那樣一局完美的棋。”申真諝希望自己能做到這一點。對申真諝來說,AI 是老師、是夥伴、也是引路的北極星。“我或許是當今最強的人類棋手之一,但有 AI 在,我不能自滿,”他說,“AI 給了我繼續進步的理由。” (麻省理工科技評論APP)
10年頑疾ChatGPT一眼識破!AlphaGo時刻震撼全球醫療界
【新智元導讀】十多年,患者求醫無果、束手無策,但將所有病史輸入ChatGPT,病因竟被一眼識破:基因突變!微軟、OpenAI等巨頭的醫療AI已悄然登場,精準率超越專業醫生!未來的醫療,或將徹底改寫!AI又一次震撼醫療圈!一名患者被莫名病症折磨十多年,數十位醫生無解。直到他把報告輸入ChatGPT——AI一語中的:MTHFR A1298C基因突變!在Reddit上,這則消息傳瘋了!⚠️注意:在採納ChatGPT建議前,該患者和主治醫生多次溝通、反覆確認。請一定結合專業醫生意見,切勿完全依賴AI作為醫療依據。十多年來,患者一直被各種莫名其妙的症狀困擾。脊柱MRI、CT、抽血……能查的都查了,還是一頭霧水。後來,他還做了功能醫學檢測,意外發現他有一種純合子突變:MTHFR基因A1298C突變。這是一種常見的亞甲基四氫葉酸還原酶MTHFR基因變異,而最常見的變異被稱為MTHFR C677T。每個人都有兩份MTHFR基因,分別來自母親和父親。上圖展示了MTHFR C677T可能的基因型。而MTHFR A1298C發生在MTHFR基因的第1298位。這種突變在美國人群中影響7-12%他還見過神經科醫生,檢查過是不是多發性硬化(Multiple sclerosis,MS)。直到他把這些年所有的檢查報告和病史輸入ChatGPT。神了。發生了驚人一幕:ChatGPT發現,雖然血清維生素B12水平正常,但卻與持續性的神經痛和慢性疲乏矛盾。這種反常,指向了一種長期被忽視的可能——甲基化阻滯(methylation block)。幾個月後,患者的刺痛感減輕了,大腦霧氣消散了。主任內科醫生審查了治療報告,震驚地發現,基因變異正是全部症狀的病因!AI工程師、即時追蹤AGI進展的Rohan Paul,聽聞此消息,大受鼓舞。他認為:「現在時機已成熟,醫療AI模型給出的第二診療意見應該成為醫療實踐規範。」相關推文,也被OpenAI總裁轉載。前Forbes撰稿人、作家Derick David則表示這是醫療界的「AlphaGo」時刻:在疾病診斷上,AI現已比人類強。AI醫療奇蹟,正在一幕幕上演類似的例子太多了!Reddit網友crasstyfartman的妹妹被ChatGPT診斷出一種罕見的遺傳性血液疾病——在此之前,她花了十多年時間看醫生和自然療法師,都被告訴那只是心理問題。他們甚至在她提出做檢測時翻白眼🙄。她堅持要求檢測。結果ChatGPT是對的。向醫生抱怨了22年,最後網友buyableblah靠ChatGPT協助才得出診斷。我也是這樣做的,只不過是針對子宮內膜異位症(endometriosis)。終於做了超聲檢查,發現了一個6釐米的子宮內膜異位囊腫(稱為子宮內膜瘤,endometrioma),現在已經長到7.3釐米,我打算今年晚些時候切除。甚至網友用ChatGPT拯救了被獸醫「誤判死刑」寵物狗。Reddit網友sometimelater0212則表達了對醫療體系的強烈不滿:我把ChatGPT提供的發現拿去給醫生看,他們卻全都嗤之以鼻,要麼說:「從沒聽說過類似的診斷建議」,要麼就說「別信ChatGPT」。這種傲慢真是讓人煩透了。但不止OpenAI,微軟、Google、IBM等早已佈局醫療AI。在微軟的消費級AI產品中,每天就有超過5000萬次與健康相關的使用情境。從使用者首次查詢膝蓋疼痛,到深夜緊急搜尋附近診所,搜尋引擎和AI助手正逐漸成為醫療服務的第一道防線。就在上周,微軟發布了MAI-DxO。而這個AI系統表現遠超醫生。研究人員以《新英格蘭醫學雜誌》(New England Journal of Medicine)每周發佈的真實病例記錄作為基準測試。結果顯示,在診斷NEJM病例時,Microsoft的AI診斷編排器(Microsoft AI Diagnostic Orchestrator,MAI-DxO)的精準率高達85%,這一比例是實驗中經驗豐富的人類醫生的四倍多。而且,MAI-DxO還比人類醫生的成本低。微軟:通向醫療ASI之路NEJM每周會發表「馬薩諸塞總醫院病例記錄」,詳細記錄了患者的整個診療過程。這類病例通常診斷難度極高,往往需要多位專家和一系列檢測手段,才能做出最終判斷。NEJM:《新英格蘭醫學雜誌》New England Journal of Medicine,是全球最權威的醫學期刊之一那麼,AI在這些複雜病例中表現如何?為探究這一問題,從NEJM案例中,微軟的研究團隊設計出一套互動式診斷挑戰——稱為「順序診斷基準」(Sequential Diagnosis Benchmark,SD Bench)。304個NEJM案例被轉化為逐步進行的診療模擬:像在真實環境中一樣,讓AI模型或人類醫生可以逐步提問、安排檢測、獲取結果,並即時更新診斷思路,最終給出結論。最後的結論將與NEJM給出的標準答案進行對比。每一次檢測請求都會產生虛擬費用,用以模擬真實醫療資源消耗。據此,研究人員從兩個關鍵角度評估了模型:診斷的精準性和資源的使用效率。圖1:AI智能體推理並解決順序診斷問題的示意輸入初始病例資訊,如:29歲女性,因喉嚨痛、咽旁腫脹及出血入院,使用抗菌治療後症狀未改善。依照「順序診斷」流程,AI開始進行推理:(1)患者回顧病情(2)接下來,AI開始問診,範圍涵蓋:  既往病史、用藥史、惡性腫瘤跡象、病毒感染史、牙科史、出血傾向、常規實驗(如血常規、凝血)和影像檢查(如頸部MRI)等。(3)虛擬醫生專家組內部討論(4)逐項檢查,更新診斷(5)AI系統得出診斷結論(6)與NEJM權威診斷結果對比,專家評審意見下面的視訊,項目負責人介紹了基本的流程。邁向準確診斷研究人員對目前最具代表性的生成式AI(Generative AI)模型進行了全面評估,覆蓋了304個《新英格蘭醫學雜誌》(NEJM)的真實病例。參與評測的基礎模型包括GPT、Llama、Claude、Gemini、Grok和DeepSeek等。除了對這些模型進行基準性能測試,研究人員還設計了MicrosoftAI診斷編排器(MAI-DxO)——模擬由多名虛擬醫生組成的協作小組,通過多樣化的診斷思路共同應對複雜病例的系統。圖5:MAI-DxO編排系統概覽與單一模型相比,編排器不僅更善於整合不同來源的資料,還能在醫療環境變化時提供更高的安全性、透明度與適應能力。這種不依賴於特定模型的架構(model-agnostic)也提升了系統的可審計性和韌性,這兩者對於高風險、快速演進的臨床場景而言至關重要。評測結果顯示,MAI-DxO顯著提升了所有模型的診斷表現。其中表現最優的是MAI-DxO與OpenAI的o3模型組合,其在NEJM案例中的診斷精準率達到85.5%。作為對比,實驗中也評估了21位來自美英的執業醫生,他們擁有5到20年的臨床經驗。在相同任務中,他們完成的案例平均精準率僅為20%。MAI-DxO具有可配置性,可以設定成本上限,從而在診斷過程中探索「成本與價值」的權衡。若不加限制,AI可能會傾向於開出所有可能的檢查項目,而不顧費用、患者感受或診療延誤。研究發現,MAI-DxO不僅比醫生和單一模型更準確,其總體檢測成本也更低。在「診斷精準率」與「平均檢測成本」兩個維度上,下面的散點圖對比了不同AI模型。圖中MAI-DxO曲線位於表現最優的左上區域,紅色叉號則代表人類醫生的平均水平。AI+醫生:告別看病貴的第一步醫生通常在專業知識的廣度或深度之間作出選擇。比如,全科醫生需面對不同年齡層和系統的廣泛問題,而專科醫生則專注於某一病種或系統。然而,NEJM案例的複雜程度遠超單一醫生所能全面覆蓋。而AI不受這一限制,能夠兼顧廣度與深度。而且在多個方面,AI的臨床推理能力已超越人類醫生。這種能力有望徹底改變醫療模式——不僅可賦能患者自行處理常規健康問題,也可為醫生提供決策支援。目前,美國醫療支出佔GDP的近20%,其中高達1/4屬於無效支出。AI有望成為遏制這一浪費的關鍵力量。這不是取代醫生,而是開啟一種全新的醫療共治模式:AI+醫生,共同診斷。 (新智元)
史詩時刻! AlphaGo神之一手突現,GoogleAI顛覆科學研究極限?
太瘋狂了,AlphaGo的「第37步」時刻,已經來臨。 Google的AlphaEvolve,讓我們從此進入AI創造科學的時代,人類科學研究將徹底顛覆!背後的研究者也首次接受採訪,揭露研究過程中的一些驚人細節。這周,GoogleDeepMind丟出了重磅炸彈-AlphaEvolve。但許多人,彷彿還未意識到這個AI的意義。可以這麼說,AlphaEvolve,就是數學界AlphaGo的「第37步」時刻,堪稱瘋狂。Google的這個AI,取得了人類未曾發現的數學成果。例如,它改進了改進了4x4矩陣乘法,將運算次數從49次減少到48次,這是自1969年Strassen演算法提出以來,56年內的突破!另外,它還推進了六邊形填充問題的研究,找到了在更大六邊形內排列11個和12個六邊形的更優解法,超越了人類的解決方案(在停滯16年之後)!甚至,它一舉改進了困擾數學家300多年的「接吻數問題」。而這一切,都是靠AI自我進化、訓練自己所使用的LLM而得到的。透過自我對弈,它擁有了超人的編碼能力,甚至讓人預言—十年內,程式設計將迎來自己的AlphaGo時刻。而且,跟AlphaGo的「第37步」不同,AlphaEvolve展現出AI自主優化演算法的能力,或將徹底改變晶片設計與資料中心效率。GoogleCEO Pichai,對「AI訓練AI」進行了生動的解釋:由Gemini驅動的編碼agent,優化了Gemini的訓練,形成了一個資料飛輪跟以往成果不同的是,GoogleDeepMind這次直接弄出一個通用武器。從此,AI不僅能解決問題,還能發現新的前沿領域。這代表著,人類集體智慧發生了一次真正的飛躍!接下來的劇本,或許就是AI橫掃各大科學難題,直接顛覆人類科學研究。GoogleDeepMind引領全人類未來GoogleDeepMind,一直在AI改造世界這個方向引領著前線。可以說,在將近30年裡,他們都在指引人類文明的方向。AlphaGo透過學習人類對弈,甚至自我對弈,擊敗了人類冠軍李世石。AlphaZero通過自我對弈,學會圍棋、國際象棋和日本將棋,被稱為一種人類從未見過的智慧。AlphaFold預測了數百萬種從未經過實驗測量的蛋白質三維結構。AlphaDev則發現了更快的排序演算法。AlphaTensor用於進行科學發現,將尋找更快矩陣乘法演算法的問題建構成一個遊戲,並實現了重大突破。FunSearch則將我們帶到更遠,透過程式碼演化,利用LLM尋找新的數學解決方案。GoogleDeepMind的下一個Alpha,更是令人無比期待。OpenAI研究員Jason Wei就表示,AlphaEvolve對於像我這樣的強化學習鐵桿粉絲來說,確實令人不安所以,這次打造出AlphaEvolve的團隊,究竟有那些人物,經歷了那些探索?就在最近,Youtube上的人氣大V「Machine Learning Street Talk”,就提前獲取了GoogleDeepMind的這篇論文,並採訪了這項工作的研究者。半個世紀矩陣乘法突破,研究者當場驚呆在電腦科學領域,幾乎沒有問題能像矩陣乘法一樣基礎。半個多世紀以來,此領域的一個特定基準,一直被認為難以突破。因為最優演算法的搜尋空間極為龐大,使得窮舉在實務上幾乎不可能,即使對相對較小的矩陣也是如此。1969年,Strassen透過發現一種演算法,徹底改變了這個領域。此演算法僅需七次標量乘法,即可乘以兩個二乘二矩陣。而就在今天,這紀錄被Alpha Evolve打破了!而它能做到一點,連GoogleDeepMind的研究者都沒想到。對於通常情況下的矩陣,仍然沒有比使用四十九次乘法進行兩次Strassen更好的辦法。開始,研究者也壓根沒有期待,它能找到比四十九次更好的結果,因為他們已經用AlphaTensor嘗試了很長時間了。所以,他們只是出於完整性試了一下,因為想在論文中展示這個表格而已。結果,出乎所有人意料,一個更快的演算法,居然被它發現了!這次,演算法使用了48次,而不是49次乘法,徹底打破紀錄。當看到一位同事發消息通知這一結果時,研究者表示自己簡直不敢相信。反複檢查三次後,他們終於確認——AI不斷增強的能力,可以產生全新的、可證明精準的演算法,從而推動科學的邊界!跟第一個版本有何差別?根據論文,AlphaEvolve是一種進化編程智能體,顯著提升了預訓練LLM在復雜任務上的能力。要知道,先前團隊曾有第一篇論文,講的是FunSearch,原理與之非常相似。所以,二者的區別在那裡呢?研究者介紹說,FunSearch只是在搜尋一個單一的函數,但AlphaEvolve,本質上可以作用於整個程式碼庫。它會在程式碼庫中你標記的區域中進行搜尋,甚至優化這些函數之間的互動。Google昂貴的服務器,不用閒置了所以,AlphaEvolve有沒有可能進化出一個方法,來優化Google的計算基礎設施呢?出於嘗試,Google工程師將一個候選方案放進這個AI,令人驚喜的是,它果然進化出了一個更聰明的啟髮式方法!現在,這個方法已經被運用於優化Google內部的計算基礎設施了。要知道,在Google龐大的資料中心,高效率安排計算任務是一項非常複雜的操作。如果操作不當,昂貴的伺服器就會閒置。而現在結果正式,這個全新方法利用了Google服務器群計算資源的0.7%,對於Google來說,這是一項巨大的節省。盜夢空間成真?甚至,在另一個自我改進的實例中,它甚至找到了加速Gemini模型訓練的方法,這,就為AlphaEvolve本身提供了動力。這個實例之所以如此有趣,是因為它不僅產生瞭解決方案,還產生了產生這些方案的程式。也就是說,Alpha Evolve就像《盜夢空間》一樣。甚至研究者表示,在檢查程式碼時,他不僅想到,這看起來完全就是一種數學洞察,或者一種數學假設!事實也證明了,它們確實對改進結果的非常關鍵。而Alpha Evolve另外一個有趣的點,就是它仍然非常依賴「人類參與其中」。過程中,人類負責識別那些內容是有趣的,找到那些有明確評估標準的問題,將候選解決方案納入循環中。然後,Alpha Evolve就會遍歷這個可能性的錐體,在過程中不斷跳躍,將這個循環繼續下去。所以,Alpha Evolve也預示了一種AI的未來──人類和AI之間,有著強大的協作循環。曾經有一個「死掉的互聯網」的理論,指的是在未來,網上大部分內容都將由AI生成,而且非常表面化、非常膚淺。而此時,就需要人類來指導AI、改進結果,進行迭代。而讓Alpha Evolve如此酷炫且強大的,也正是人與機器之間的這種互動。AlphaEvolve,為何如此適合科學發現在訪談中,主持人向研究者提問:究竟是什麼促使你們走上了進化演算法的道路呢?研究者回答說,這就跟科學發現的過程一樣,是非常自然的選擇。進化演算法能為探索過程帶來多樣性,確保你不會在早期就鎖定在某種特定方法上,因為這種方法有可能是次優解。最終,我們仍然需要不斷探索所有的可能性,尤其是在想要做出新的科學發現時。言簡意賅地說,AlphaEvolve就是一個進化演算法,對於系統給出程式碼片段,我們都可以自動測試它好不好,有多好。一方面,它可以把你限制在你可以解決的問題集上,另一方面,它涵蓋的問題範圍又非常廣泛。LLM會為你提出各種想法,透過這個評估器,我們就可以篩選出真正重要的、能做出改變的想法。最有潛力的代碼,將被識別出來,然後專注於改進這些部分。接下來,採訪者就提出了一個重要的問題:我們什麼時候才知道,這個過程要結束?例如,可能我們覺得該終止了,但如果再多等五分鐘,就會得到一個近乎完美的演算法。研究者解答了他的疑惑。從理論上講,的確永遠無法確定如何讓演算法運作更久,以及會得到什麼結果。但在實踐中,這並未造成任何問題。例如可以這樣設定問題:我正在嘗試解決這個數學中的開放性問題,尋找能取得進展的搜尋演算法,但我希望10分鐘內就能取得進展。也就是說,其實我們只探索了能在10分鐘內做出進展的演算法空間。當然的確存在這種可能性:如果運行更長時間,說不定還會有表現更好的演算法。這個可能性永遠無法消除。那一刻,AI發生了想像力驚人的跳躍主持人問道:你可以舉出一些系統做出真正有想像力的跳躍的例子嗎?研究者表示,一個具體的例子,A​​lphaEvolve如何發現矩陣乘法演算法的。實際上,他們只是讓它設計了一個基於梯度的搜尋演算法,也也就是一個能找出來的演算法的演算法,或是元演算法。第一個搜尋演算法,是從一個非常簡單的程式碼框架開始的。研究者並未給它任何東西,只告訴它「用梯度」,然後,它就寫出了這些複雜的損失函數和更新函數,而且以完全出人意料的方式引入了隨機性。就在那一刻,研究者驚呼:太厲害了!當然,這種程式碼也有可能是人類寫的,但他們真的會想到要寫出這段特定程式碼嗎?那一刻,他彷彿頓悟了──AlphaEvolve所做的,是一些類似人類的事情,但又顯然不是人類會嘗試的東西。人類具體是怎樣指導AI的呢?研究者提及了一個實驗,在這個實驗中,他們請幾個人花了30分鍾思考這個問題,記下筆記,然後指導系統完成整個過程。可以理解為,AI榨出了這個想法的全部精華,瞭解它的本質,於是引導LLM得出了這樣的目標,同時做了很多優化。聽起來,這就是智慧的本質──嘗試很多事情,總有一件會成功。最震撼之處:改變世界,就在當下研究者表示,在以往,通常我們很難開發出某種科學研究工具,直接、立刻應用到現實世界的挑戰,並產生巨大影響。而AlphaEvolve的意義就在於,在開箱時就能同時在數學和科學問題上做出新發現,甚至還能發現可以直接部署到Google核心計算架構中的演算法。這,是他們以前從未經歷過的事。AI奇點,或許已經到來了。 (新智元)
大模型下半場:7個趨勢判斷
推理模型能力的持續提升,推動大模型迎來“可用”到“好用”的拐點。推理強化和應用拓展啟動了大模型下半場的新賽程。個人智能體潛力初步顯現,行業應用漸次走深,開源開放日益成為大模型的核心競爭力組成。大算力、多模態、強推理、廣開源、准資料、智能體、深應用等,成為當前發展的重要趨勢。一、大力出奇蹟的算力投入模式尚未見頂DeepSeek以557萬美金的低成本訓練,給全球帶來很大震動。但這並未顛覆大模型需要大算力的底層邏輯,實際上,該模型單次訓練成本相當於國外同類模型成本的八分之一左右,尚未有數量級的差別,其意義是以更集約化的方式復現已有模型效果的工程創新。此前網路熱炒的中美大模型訓練成本的懸殊對比,其實是拿美國千億美金等級的資料中心建設、晶片購買、網路搭建、科學家薪酬等總支出,來對比DeepSeek的單次訓練成本,裹挾了較大的誇張和情緒因素。用更大算力去探索大模型的能力上限,仍是行業共識。預計今年上半年國外將推出GPT-5、Llama 4等級大模型。美國大算力叢集建設如火如荼,馬斯克的xAI已建成全球規模最大的20萬張H100算力叢集,並在此基礎上訓練出Grok3大模型。Google今年預計投入750億美元,同比增長43%,大部分用於算力中心建設;Meta預計投入為600-650億美元,同比增長53%-66%;亞馬遜預計為1000億美元,同比增長超20%。此外,日本軟銀集團、OpenAI和美國甲骨文公司三家企業聯合開啟星際之門計畫,將在未來4年投資5000億美元,在美國建設超大型算力基礎設施。這些將推動大模型在預訓練方面的更多突破,加上現在流行的強化學習等後訓練增強,大模型能力的躍升可能會進一步加快。有不少大佬預測,AGI的實現可能就在最近的兩到三年。高端晶片供給仍是中國下一代大模型的卡脖子問題,可能再次面臨訓練晶片供應不足的風險。雖然去年以來,中國AI高端晶片企業數量和能力均有提升,華為、燧原科技、摩爾執行緒、海光、壁仞等多家企業已設計出對標輝達A100單卡性能的國產晶片,但由於台積電暫停7nm產能供應及HBM禁令等限制,國產高端晶片的製造仍面臨挑戰。二、慢思考和多模態成標配,多領域將迎來AlphaGo時刻包含了強化學習等在內的後訓練過程,把預訓練積累的模型潛力發揮了出來,模型慢思考帶來了推理能力的大幅提升。受DeepSeek效應刺激,國內外大模型公司正加速推出下一代大模型,如OpenAI的基礎大模型GPT-4.5,推理模型o3;Anthropic整合了深度思考和快速輸出的混合推理模型Claude 3.7;Google相繼發佈 Gemini 2.0和更強大的推理模型Gemini 2.5 Pro,以及xAI的Grok 3。國內騰訊混元發佈了可以秒回的強推理模型T1,將快慢思考相結合,並首次將混合Mamba架構無損應用於超大型推理模型,顯著降低了訓推成本。DeepSeek更新了一版名為DeepSeek-V3-0324的模型,在數學、程式碼類相關評測集上取得了超過 GPT-4.5 的得分成績。多模態是人類世界的本來樣貌,大模型的發展趨勢一定是走向多模態,從單一的文字、圖像、視訊、3D,向聲、光、電,甚至分子、原子等各類模態擴展,達成對真實世界的理解和生成,原生多模態是未來方向。近期發佈的GoogleGemini 2.0 Flash可實現一句話編輯圖片,堪比專業Photoshop軟體的編輯效果; GPT4o最新推出的風格化文生圖能力火爆全網。騰訊剛開放原始碼的混元3D模型,同時支援文生3D和圖生3D,可一鍵換皮膚、一鍵變動畫,一鍵生成3D遊戲視訊。隨著模型能力的躍遷,可以預見,更多領域將迎來“AlphaGo時刻”,即大模型在各領域的能力超過該行業90%以上,甚至最高水平的人。OpenAI的o1在在美國數學邀請賽拿到接近滿分成績,在物理、 生物和化學問題的基準測試上超越了博士水平的精準率。Anthropic 首席執行官Dario近日預言 ,未來3-6 個月 AI 將能夠編寫 90% 的程式碼。三、模型開源和開放協議成為新競爭力組成之前行業爭執不下的開源與閉源之辨,倒向了開放原始碼的一邊。DeepSeek的火爆,一定程度上得益於開源,其採取的MIT License協議支援完全開源,不限制商用,也無需申請,讓全球開發者都有機會上手使用和評測,依靠口碑效應快速形成了全球影響力。原來堅定走閉源路線的OpenAI也被迫考慮開源,奧特曼近日公開表示,之前選取的閉源策略可能站在了歷史錯誤的一邊,同時還在社交平台公開徵集開源方案,未來要做端側的開源大模型和o3 mini等級的開源模型。國外Meta,國內騰訊、阿里、智譜等企業很早就開啟了開源戰略。如,混元文生圖模型是業內首個中文原生的DiT架構文生圖開源模型;文生視訊大模型是當前最大的視訊開源模型,且全面開源,包含模型權重、推理程式碼、模型演算法等完整模型。國外Hunging Face等社區也成為全球大模型開發者活躍的重要平台,在Hunging Face上彙集了152萬款開源大模型,33.7萬個開放資料集。同樣重要的還有大模型的開放協議,可以類比為網際網路興起時的HTTP協議,HTTP讓各類網頁都能以統一的格式展現在瀏覽器中,方便使用者獲取資訊。大模型的資料通訊開放協議則可以讓大模型更方便地呼叫各種工具,從而自主完成各類任務。如,近期火爆的MCP(模型上下文協議)是Anthropic於去年11月發佈的一個模型資料通訊協議,成為連通大模型和各類工具之間的橋樑。四、“後真相”時代,打造可信大模型迫在眉睫技術對知識資訊的影響,第一次從傳播和互動環節向前延伸到生產環節。大模型知識輸出的精準度、專業度,即大模型的“可信度”,正在成為人工智慧的核心競爭指標。大模型帶來資訊極大豐富的同時,內容中所包含的幻覺等噪聲問題也困擾著使用者。《哥倫比亞新聞評論》研究發現,美國用於新聞搜尋的生成式人工智慧模型存在嚴重的精準性問題。研究人員測試了8種具備即時搜尋功能的AI搜尋工具,發現有60%以上的新聞來源查詢錯誤。大模型的幻覺問題,是伴隨人工智慧底層技術路徑與生俱來的,和創新能力是一體兩面的,難以僅僅依靠技術徹底解決。引入權威的圖書、雜誌、新聞資訊、論文等優質內容資料,並打造新的、“可信”的知識共識機制和供應體系,是大模型未來在生產、生活應用領域產生更大價值的關鍵所在。OpenAI與新聞集團去年簽署了為期5年的合同,獲得了訪問該集團旗下媒體歷史內容的授權,包括《華爾街日報》《巴倫周刊》《泰晤士報》《每日電訊報》等主串流媒體,以增強大模型回答內容的可信度。騰訊混元正在與大百科出版社、人民衛生出版社、上海辭海出版社、化工出版社等優秀的傳統出版機構開展合作,支援其推出圖書智能體,探索基於搜尋增強技術的可信大模型合作模式。如,在元寶APP應用廣場中,人衛智能體可以為使用者提供心腦血管等特定醫學知識領域的權威解答,同時提供相關書籍原文的引用,並可以引流到電子書閱讀平台,跳轉到實體書購買頁面。既能實現類似腳註尾注、文獻索引等傳統知識溯源機制的遷移,確保輸出知識的共識性、精準性,也將為出版機構和大模型平台帶來可持續共贏的模式。未來,誰能夠接入更多可信的資料來源,建構起可信的評價和共識機制,誰就能在人機內容共創的時代獲得領先優勢。五、個人應用在智能+網際網路邏輯下有望開啟馬太效應GPT-4.5,DeepSeek V3、騰訊Turbo S等基礎大模型,OpenAI o3、DeepSeek R1、騰訊T1等推理模型的陸續發佈,標誌著基礎大模型進化到了好用的階段,推動個人應用迎來發展新起點。過去個人應用之所以不夠豐富,核心是由於基礎大模型的能力所限,在複雜問題分析、多模態生成和理解等領域的效果還不盡如人意,使用者使用大模型時驚喜不足。而且個人應用的資料,更多是使用偏好資料,並不能反哺基礎大模型智能的提升,因此過去花錢買流量和使用者的應用也沒能構築護城河,使用者替換應用的成本較低,粘性不足。在當前基礎大模型能力相對成熟的背景下,過去移動網際網路賴以成功的平台效應有望再次發揮作用。更多使用者使用AI應用,可以沉澱更多的優質共享知識、積累更多的使用者反饋和社互動動等,從而讓應用得以持續最佳化,並吸引更多的使用者使用,形成良性的正循環。以騰訊元寶為例,採取DeepSeek+混元雙模型引擎驅動的戰略後,使用者數直線上升, 今年2月至3月DAU(日活)增長超20倍。中國應用領先的優勢有望進一步發揮,提效類的生產力工具日益強大,殺時間的陪伴類和文娛類應用體驗不斷最佳化。根據a16z投資機構3月發佈的全球Top 50生成式AI應用報告,中國公司的應用有11款上榜,而去年8月僅有3款產品上榜,增速明顯。AI新搜尋、文生圖/視訊工具和角色扮演應用是排名前三的熱點方向。但同時,個人應用創新仍然面臨“苦澀的教訓”( The bitter lesson) ,即人們反覆嘗試用工程手段提升性能,最終卻總是被簡單堆算力的方式超越。大模型能力的不斷提升,會“吃掉”不少應用創新的功能,特別是工作流類的應用,更容易被大模型的新能力取代。如何在應用中加深護城河,需要更多第一性原理的思考,從而嵌入使用者決策鏈條的關鍵節點去提升價值,增加使用者的情感性認同,並通過生態協同,提升自身的不可替代性。可以說,技術迭代是矛,場景滲透是盾,生態協同是土壤,個人應用有時候要跑得快一點等大模型能力的提升,有時候又要慢一點思考大模型的演進路徑,去建構技術+場景+生態協同的“動態能力組合”。六、個人AI應用的終點是超級智能助理基礎大模型能力的升級,帶來應用深度的能力解鎖。第一波以ChatGPT為代表的大模型擅長對話,催生了AI新搜尋Perplexity等應用。第二波以Claude 3.5 Sonnet為代表的大模型擅長程式設計,推動了估值百億美金的Cursor和當紅程式設計明星Devin等的火爆。第三波以Open AI o1為代表的大模型擅長深度推理,讓Agent應用成為可能。特別是隨著多模態、強化學習技術持續突破,模型的效果大幅提升、成本不斷降低,可以預見,智能體應用將加速滲透到更多垂直領域,開啟人機協作新紀元。智能體新時代正在走來。近期國內Manus應用的火爆,讓業界對AI智能體的未來給予更多期待。無獨有偶,OpenAI的自主電腦使用智能體Operator和深度研究智能體Deep Research已開啟商業化試水,從實驗室走向大眾市場。據外媒報導,OpenAl計畫以每月2000美元的價格向“高收入知識工作者”出售低端代理;中端代理每月收1萬美元,用於軟體開發;而高端代理作為博士級研究代理,每月收費 2萬美元。據Gartner 預測,到2028年,33% 的企業軟體應用將包含代理式人工智慧,而2024年這一數字不到1%,且至少15%的日常工作決策將通過人工智慧代理自主做出。人工智慧代理市場將顯著增長,從 2024年的51億美元增長到2030年的471億美元。Agent應用的深入,將推動Token消耗量呈百倍甚至更高量級的增長,由此帶來推理算力需求的更大爆發,並超過訓練算力需求。為提升能效比和降低成本,Google、亞馬遜、Meta、OpenAI等大型雲端運算和大模型廠商均加速佈局定製化ASIC,ASIC正逐步發展成為輝達GPU之外的重要新技術路線。摩根士丹利預計,AI ASIC市場規模將從2024年的120億美元增長至2027年的300億美元,複合增長率達34%。與此同時,Agent的廣泛使用將要求模型能處理更大規模的上下文,對模型基礎能力的提升也帶來更大挑戰。七、智力即服務是行業落地的終極方向以雲的方式,讓智能變成一種千行百業可按需呼叫的服務,將最終形成智力即服務(Intelligence as Service)的新形態。過去衡量經濟發展和數位化水平,會看用電量、用雲量,以後我們衡量智能的水平,可能要去看“用詞量”(Token)。DeepSeek等大模型的火熱,帶來了模型效果的全面升級,激發了中國各行業擁抱大模型的新熱潮。但當前,中美企業的生成式AI應用程度存在一定差距,中國企業應用大多處於試驗階段,離規模化使用還有距離。而美國企業應用更加廣泛和深入,2024年美國企業全面實施生成式AI的比例達24%,明顯高於中國的19%。美國政府和企業普遍採用公有雲部署AI,支援AI快速迭代,超過70%的組織使用雲端AI。受此推動,美國大公司最新一季度的雲端運算收入高速增長,如微軟達到409億美元,同比增長21%;亞馬遜為287.86億美元,同比增長19%‌;Google119.6億美元,同比增長30%。高性價比正在推動行業應用走深。自ChatGPT發佈兩年多來,大模型性能持續提升,推理成本顯著下降,如GPT-4o的API呼叫價格為每百萬輸出tokens 20美元,相比發佈時下降了三分之二。當前國內DeepSeek V3的每百萬Token 8元,混元多模態大模型TurboS每百萬Token低至2元。在模型能力效果大幅提升的同時,還為各行業大範圍部署提供了很高的性價比。近兩個月來,行業大模型落地成效顯著,已有政務、金融、醫療、教育、傳媒、文旅等30多個行業落地,大幅提升效率的同時,也在重構原有流程。包括深圳寶安政務、深圳醫保、上海徐匯城運中心、深圳大學、瑞金醫院、上海醫藥、重慶農商行、榮耀等公司都積極部署並探索大模型應用。以深圳寶安政務大模型應用為例,已覆蓋民生訴求、企業服務、政務辦公、社會治理等31個業務場景,覆蓋全區14個領域、20個行業近3萬餘條政府服務知識,整合了60多種模型能力,並可結合業務場景需要快速部署新的智能應用。行業應用中,優質資料是提效護城河。行業大模型比以往任何時候都更需要行業和企業內的優質資料,因為行業應用需要更準確、專業的知識,且對幻覺零容忍。在資料治理上的投入將獲得事半功倍的效果。而這往往需要很大的投入,也被經常認為是苦活兒和累活兒,是行業落地中最容易被忽視的部分。未來,大模型不僅在各行業縱深發展,更將通過跨領域協同、中小企業普惠、社會系統重塑等路徑,實現深度應用的立體化演進:從“場景適配”到“價值創造”,大模型從效率工具升級為業務增長引擎;從“資訊孤島”到“生態融合” ,跨領域資料的協同推動應用邊界擴展;從“企業級應用”到“社會系統重構” ,技術滲透進入深水區,引發企業和社會組織模式、就業和分配結構、社會倫理規範等全方位變革。 (騰訊研究院)