#AI健康
螞蟻阿福、OpenAI,AI健康是不是好賽道?
前段時間,螞蟻阿福大規模宣傳的時候,我其實有點不理解。不是這個業務不行,而是國內也沒有對手,如此規模的宣傳,是否有必要。都沒有假想敵,演練什麼呢。結果,沒幾天,OpenAI也在ChatGPT裡增加了健康模式(Health),Google也要再次發力健康(Google對於健康一直唸唸不忘)。那麼,AI+健康,是不是好方向?有那些機遇和難點?1、AI健康的to BAI在to B領域的應用,已經相對成熟了。用AI看影像,效率高、精準率高;用AI做藥物研發、發現新藥物,也已經是熱門應用。GoogleAlphaFold也越來越出色。所以,to B的應用是毋庸置疑的。接下來主要聊聊to C。2、AI健康 to C 的機遇傳統醫療面臨著“不可能三角”:低成本、高品質(專家水平)、高可及性(隨時隨地)。AI 健康會帶來一些改變。A、專家預診比如之前我治療幽門螺桿菌,第一次沒經驗,花了兩百多掛了專家號,排隊了兩個小時,結果進去一分多鐘就結束了。出了診室才想起來,為什麼不多問問專家。而如果有了AI健康,那麼就可以在就診之前,先多瞭解一些。也許就知道其實不用掛專家號,大家的方法都差不多。從這個角度看,AI 健康,其實是給普通人多一些預診資訊,不至於一頭霧水、或者遇到一些專業名詞也沒時間搞清楚。一定程度解決醫療資源的錯配問題,讓輕症不出門,重症不耽誤。當然,這一點,和傳統搜尋差不多。但是,因為阿福等產品,用了更專業的資料庫,所以效果會更好一些。而且多模態技術,支援看圖、看片、語音輸入等方式,使用便捷性也更高。另外,有些醫生,也可以基於大模型結合自己的資料,訓練更專業領域的大模型,讓患者先和模型交流,節省一些預診精力。所以,整體來說,解決了 成本+質量+高可及性的預診。但是,對於需要實際診療的資源而言,影響不大。B、個性化健康管理這一點才是AI 健康最有機會和想像空間的。畢竟,健康和醫療還不太一樣。健康是一個長期關注、維護的,而不是像疾病一樣“出事兒才想到”。市面也有不少手環之類,但傳統的健康建議是通用的(“多喝水”、“少熬夜”、“沒睡好”),用處不大(就像睡沒睡好自己還能不知道嗎)。所以,健康對於C端使用者而言,會有兩個痛點:一是個性、精準;二是隱私(比如有些狀況,甚至也不願意讓醫生知道,而希望自己能解決)。而AI則有機會給出個性化建議。比如,它不再說“少吃糖”,而是說:“根據你剛才吃的那個甜甜圈和你現在的血糖反應,建議你立刻快走15分鐘。不再是通用的健身教練,而是根據你昨晚的睡眠質量,動態調整今天的訓練強度。對於模型廠商而言,痛點是資料。如何採集到使用者真實的資料。所以,僅有一個應用,是不夠的。還需要有硬體端能夠採集到即時的、真正的資料。這也是Google為什麼一直希望做出可穿戴裝置、記錄使用者健康資料的原因。以我自己為例,如果能早一點知道腰部壓力已經很大了,早點有對應的措施,也許就不會等到腰間盤突出了才想起來鍛鍊。從應用場景而言,健康經營,一直是個好方向,但未必是一個好的商業賽道。3、AI 健康的問題A、核心壁壘在沒有AI之前,我一般會下載默沙東健康詞典,有時候會對應看看問題。大部分健康醫療問題,都是有標準化資料的。從這個角度而言,如果資料庫不是排他、獨享的,那麼其他模型要追趕並不難。也就意味著,從能力角度,壁壘不高。B、如何從諮詢預診跨越到診斷大模型是機率預測,也就意味著幻覺,是一個數學問題,幾乎無法避免。如果使用者因為聽從了AI的建議,而遭受健康損傷,該如何界定責任?所以,大部分C端應用也只能做健康諮詢,不敢也不能介入醫療診斷。而如果不介入醫療診斷,也就意味著,還是不能解決醫療最核心的痛點。C、商業化難點中美健康管理是有一定差異的。美國醫療費用的高昂,導致健康管理也具備一定的商業化基礎。使用者願意付費來管理健康,避免疾病的重大支出。而國內,健康管理的意識、付費的意願,相對都比較低。所以,付費難度較大。D、使用頻率如果是疾病預診、諮詢,對於單個使用者而言,其實是一個很低頻的應用工具。低頻,也就意味著商業化方式更少了。健康管理是一個高頻場景,但缺少硬體介入、缺少日常更新的資料,也會導致成為一個低頻的場景。E、使用者獲得感知道不等於做到。即使一位真實醫生告訴你,要減肥、要鍛鍊某個部位,使用者未必都會聽。更何況是一個AI。也許過不了一周,使用者就會關掉AI的每日提醒、互動。所以,如何設計產品,讓使用者真的願意用、願意聽,更加核心。整體而言,面向C端的AI健康/醫療,在國內,依然是叫好不叫座。其公益性的社會意義也許更大。比如,可以幫助三四線的醫生,作為他們的助理,來看病,提高醫生的知識儲備、以及工作效率。對於產品而言,能在細分領域,獲得使用者認可、也讓使用者有獲得感,也許比通用型,更有效。 (董指導研究)
抱歉了GPT-5,這次是中國AI「上岸」了
【新智元導讀】基層醫生的AI好助手來了!中國國產AI,更懂中國醫生。從去年開始,「醫療AI(medical AI)」與「健康AI(AI for healthcare)」從星星之火,迅速燎原。在Google趨勢裡,這類關鍵詞在最近幾個月都呈現明顯抬升:但對大多數中國醫生——尤其是基層醫生——這些熱鬧始終顯得有些遙遠。僅糖尿病患者,中國就有2.33億人,遠超現有醫療資源的承載能力。更別說基層醫生每天面對的是混雜的真實世界:心血管、呼吸、消化等各種疾病交織出現;一旦遇上少見症狀或複雜共病,往往會感到吃力,甚至陷入“想得不全、顧得不夠”的困境。因此真正的問題,從來不是「AI看起來有多厲害」——而是能不能安全有效地在臨床落地?能不能真正提升醫生的判斷力和決策力?AI+醫療,被放在了國家檔案的「C位」11月4日,國家衛健委正式發佈《關於促進和規範人工智慧+醫療衛生應用發展的實施意見》,其中重點提到:「建立基層醫生智能輔助診療應用」「加強居民慢性病規範管理服務」這意味著什麼?「AI+醫療」已不再是AI產業界的技術炫技,而是提升到了國家層面的衛生健康行業發展高度。而「AI+醫療」的落地重點,在基層。誰能抓住這波醫療AI版的「農村包圍城市」,誰就能在下一波AI浪潮中笑到最後。多位長期深耕基層培訓教育的主委們很快達成共識:能真正幫到中國基層醫生的AI,關鍵在2件事:1)診中:輔助臨床決策,要安全、有效;2)診後:支撐患者隨訪,要規範、可持續。而,這也是「未來醫生AI工作室」的初心。中國AI vs 美國AI 只有它是「安全+有效」的雙料冠軍AI能寫會畫,甚至拿下奧數金牌,但「術業有專攻」——通用的AI難以救死扶傷。解放軍總醫院第六醫學中心(海軍總醫院)內分泌科主任醫師、全科教研室主任郭啟煜,就曾遇到:一些患者自行使用AI尋找大量資訊後,提供給醫生,但這些資訊往往互相矛盾,甚至與最新的醫療指南和共識相悖。他認為,AI落地醫療有2大關鍵:有效性和安全性。有效性, 指的是真能幫上忙,能提供有用的建議和資訊。安全性, 則是必須堅守的底線,AI醫療產品提供的建議必須基於權威資料。但要測試醫療AI的「安全性」和「有效性」,並不簡單。好在今年7月,來自26個科室的32位一線專家們聯手,來了場全球頂尖大模型的「擂台賽」。這項測評已於7月正式公開發佈,並接受學術同行評議。arxiv連結:https://arxiv.org/abs/2507.23486他們從真實病歷中抽絲剝繭,整理出2069道開放式問題,圍繞「安全性/有效性」,模擬真實場景,搭建了一套系統性的臨床評估標準。在此標準上,測評了當時最前沿的6個大模型:OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B以及「未來醫生AI工作室」背後的醫學大模型MedGPT。結果呢?六個大語言模型的基準測試顯示總體表現不錯(總分均值57.2%,安全性54.7%,有效性62.3%)。但在醫療最看重的「安全」上,卻拉開了明顯差距:當涉及危重症識別、藥物衝突等複雜問題時,多款通用大模型的得分明顯下滑當涉及嬰兒、兒童、免疫低下等特殊人群時,有的模型表現很不穩定,有時很好,有時很危險而在同一套標準下,專業醫療大模型MedGPT則表現出顯著特徵:「安全性」、「有效性」雙高!得分分別達到0.912、0.861,拿下雙冠軍,總分更是領先第二名15.3%。總體得分、安全性、有效性,MedGPT(綠色)均領先此外,在這場比拚中,MedGPT還表現出幾個突出特徵:安全性得分,比模型平均值高出近70%(0.912 vs 0.547);在複雜人群中,表現依然穩健,沒有「翻車」;測評中,唯一一款做到了「既穩定安全,又穩定有效」的AI。復盤時,北京大學第三醫院運動醫學科江東教授表示臨床不只是看答對多少,更要看答錯多少。從那一刻起,這個以MedGPT為底座的「未來醫生AI工作室」,底層基因已經註定:不是做看起來「樣樣通的AI」,而是做臨床上「最安全、最可靠的AI夥伴」。當技術回歸臨床,誰更像專家?答案已經揭曉。就在最近,中⼭⼤學附屬第⼀醫院泌尿男科主任鄧春華教授聯合中國多位權威專家,設計並開展了一場高度模擬真實臨床流程的實戰盲測。評測方法核心直接、客觀:1、選題:從真實臨床工作中,抽取出一批複雜、存在爭議且資訊不完全的典型病例。2、答題:同一道題,分別交由三位「參賽者」獨立作答:GPT-5OpenEvidence未來醫生AI工作室·臨床決策AI助手3、測評:由臨床專家團盲審三份AI生成的答案,並嚴格依據以下8個核心維度進行打分:多病共存與藥物序貫最佳化時間窗決策與風險取捨不確定性推理與檢查價值用藥相互作用與復合毒性圍術期協同決策ICU多目標最佳化檢驗與影像閉環連續照護與復發預防結果中國AI——全線完勝:圖源:https://ai.doctorwork.com/comparison這場評測的意義,遠不止於一次分數的比拚。結果所呈現的,已經不再是模型的紙面能力,而是——是否能在真實醫療環境中做出可靠的臨床決策。這背後,正是「未來醫生AI工作室·臨床決策AI助手」的差異化技術路線:通用大模型的強項在於文字生成,本質是模式匹配與記憶;而臨床決策AI助手,則是先建構系統性的醫學認知框架,再在其上強化「臨床推理+安全控制」,最終再落到產品層應用。這也解釋了,為什麼在臨床診斷這種高風險、強推理的場景裡,中國的醫療AI能夠取得領先——關鍵不在簡單看誰的參數更大,而在於誰更接近醫生真實的思考方式和工作方式。臨床智能參謀 幫醫生想得全,判得準面對複雜病例,醫生最擔心的從來不只是「已知風險」,更是那些隱藏在資訊缺口、經驗不足和病例多樣性背後的知識盲區與思維侷限。缺資訊、缺經驗、病例雜——幾乎是所有基層醫生的共同現實。「未來醫生AI工作室·臨床決策AI助手」想解決的,正是這一臨床痛點。它不是一個更大的「知識庫」,而是為每位醫生打造的「醫療版賈維斯」:不僅能調動高等級循證證據,更能以專業方式協同思考——核心是一套由安全與循證驅動的臨床決策引擎。鄧春華教授在使用未來醫生AI工作室·臨床決策AI助手進行決策輔助 (圖片已獲得教授本人授權)在日常診療裡,醫生可以用口語化的方式輸入病情,系統不會急於下結論,而是先完成三件更重要的事:提取證據:從高等級循證證據中抓出關鍵點;預警風險:提示藥物相互作用、特殊人群禁忌等潛在風險;標識缺口:指出病史、體檢或檢查的缺失環節,並附帶安全提示。當然,最終的所有決策權,始終牢牢掌握在醫生手中。醫生依然是做決定的那個人,只是不再需要一個人扛下所有不確定性。能看得更全、想得更深,不至於錯過任何「可能改變結局」的疑點。多位一線醫生的反饋也印證了這一點:「好用、循證清晰。」「像有個隨時在旁邊可以討論的專家。」而這一切的背後,是「未來醫生AI工作室·臨床決策AI助手」提供的確定性支援——讓每位基層醫生在面對複雜病情時,都能更有把握地做出判斷。跨越診室圍牆 把醫院級照護延伸到日常掛號、看病、診斷、開藥,只是醫療的起點。真正決定療效的「大考」,往往發生在患者走出診室之後。隨訪一旦缺位,不只是管理脫節,更會造成療效遞減與醫患信任的損耗:患者聯絡不上、該複查沒複查,甚至出現「危險訊號」,也沒人第一時間看到。那麼,如何為院外治療裝上一道「安全而有效的護欄」?郭啟煜在使用未來醫生AI工作室·患者隨訪AI助手管理患者 (圖片已獲得教授本人授權)這正是未來醫生AI工作室「患者隨訪AI助手」的價值所在——把原本孤立的診療節點,延展為一個可持續的管理閉環。通過人機協同,它正在重塑院外關懷的範式,補齊門診“最後一公里”的三大核心短板:管理可達性:通過數位化隨訪,突破時空限制,將專業照護延伸到患者的真實日常。治療依從性:借助個性化提醒與互動指導,提高患者執行度,讓方案落到實處。干預精準性:基於臨床指南與個體資料,為不同患者匹配差異化的管理路徑。值得強調的是,「未來醫生AI工作室·患者隨訪AI助手」從架構設計起,就堅持一個原則——AI輔助,醫生決策。無論系統多智能、響應多及時,所有涉及醫療行為的最終裁定權,始終在醫生手中。一旦觸及藥物調整、嚴重症狀等關鍵節點,AI不會越界「替你決定」,而是立即發出明確預警,把關鍵決策點完整呈交給醫生,由醫生最終判斷。為什麼主委們說 這是「基層+AI」的最佳實踐?把以上幾個關鍵拼圖拼起來,就會發現一條非常清晰的邏輯鏈:政策明確方向:國家已將「AI+基層醫療」列為重點任務,既要求提升基層醫生的診療能力,也強調對居民慢病的規範化管理。專家形成共識:多位專家態度一致——真正能落到臨床的AI,必須同時做到安全有效,並保持人機協同的工作方式。技術經受驗證:多模型、多專科的大規模評測顯示,MedGPT在「安全性」和「有效性」兩項核心指標上均領先國際主流大模型;在真實病歷的同題測試中,「未來醫生AI工作室」也較GPT-5、OpenEvidence更符合臨床實際需求。產品真正落地:「未來醫生AI工作室」落在了基層最缺的2大場景——診中決策輔助與診後隨訪管理,並收到了一線醫生的持續積極反饋。正因如此,多位主委給出了高度一致的評價:這是目前最接近「基層+AI」最佳實踐的路徑。鄧春華教授的總結很形象:「通過『未來醫生AI工作室』,基層醫生能真正站在巨人的肩膀上,加速成長。」這或許就是技術最好的落地方式——不是替代,而是賦能。AI+醫療的終局:醫生主導,AI賦能每次聊到AI,總有人問:「醫生會被替代嗎?」在臨床一線,這個問題本身就是個誤解。一位三甲主任說得很透:「AI再強,也開不出帶著溫度的處方。」醫生的價值,在於判斷、取捨、溝通與責任;AI的價值,在於不疲倦、可追溯、能持續學習、能迅速覆蓋最新指南。所以未來不是替代,而是協同。真正需要追問的是:什麼樣的醫療AI,才配進入臨床?答案有3點:1、安全、有效。這是所有臨床應用必須先跨過的底線,也是醫生願意信任的前提。2、臨床實戰,是唯一的檢驗標準。在真實病例的對決中,一款中國團隊打造的產品——未來醫生AI工作室,在關鍵指標上優於GPT-5和OpenEvidence。它專注做三件事:讓醫生把病例看得更全;把風險提前亮出來;讓患者的管理不中斷、更長期。3、技術的盡頭,是回到人的需求。即便未來AI能提供更全面的解決方案,它依然無法替代“溫度”——那份對病情的揣摩,對患者的理解,對風險的承擔。醫療的答案,從未改變:醫生負責判斷與關懷,AI負責效率與知識。當二者真正協同,優質醫療才會變得更可及、更可靠、更可持續。真正有價值的醫療AI,從來不是取代醫生的力量,而是托舉醫生的力量。 (新智元)
螞蟻集團調整組織架構
11月7日,介面新聞獲悉,螞蟻集團CEO韓歆毅發佈全員信,宣佈升級組織架構,原“數字醫療健康事業部”正式升級為“健康事業群”,並將加速推動醫療健康業務成為戰略支柱類股。圖片來源:介面圖庫韓歆毅在信中提到,自6月推出獨立App後,AI健康管家AQ使用者正快速增長,已成為中國首個月活突破千萬的行業AI應用,並升至中國AI原生應用榜第7位。此外,螞蟻醫療大模型在HealthBench、MedBench等國內外多個權威醫療評測中達到領先水平,在醫學視覺和報告解析等領域也刷新行業基準。他還宣佈了一項新的高管任命,即日起,由張俊傑(偉鶴)擔任事業群總裁,並向韓歆毅匯報。張俊傑早在2014年便加入螞蟻,是支付寶醫療業務的首批員工之一,參與主導了線上掛號繳費、電子醫保碼、健康管家AQ等多項核心業務。這是螞蟻集團近年來頗為關鍵的一次組織架構升級。調整後,除螞蟻國際、螞蟻數字科技、OceanBase保持獨立公司營運外,支付寶事業群、數字支付事業群、財富保險事業群、信貸事業群與新成立的健康事業群,共同構成螞蟻5大核心業務類股。重投大健康領域,也意味著螞蟻完成了對生活服務、金融服務、健康服務三領域的AI戰略佈局。公開資料顯示,螞蟻對醫療健康領域的投入可追溯到11年前。2014年,該平台實現中國第一筆線上掛號繳費,2019 年又推出中國首張電子醫保碼,去年又收購了國內最大的線上問診平台好大夫線上、試運行AI健康管家AQ等。到目前為止,醫保商保支付、數位化就醫、AI醫療健康成為螞蟻健康的三大核心業務。據螞蟻方面公佈的資料,螞蟻健康平台累計服務使用者近9億。螞蟻集團上一次重大組織架構調整還是在去年12月。當時宣佈的架構調整中,螞蟻集團新成立數字支付事業群和支付寶事業群兩大事業群。數字支付事業群和支付寶事業群建立輪值總裁製,輪值總裁任期六個月,首任輪值總裁任期自本通知發佈起至2025年6月30日。任命勤一擔任首任數字支付事業群輪值總裁,任命溥天擔任首任支付寶事業群輪值總裁。同月,時任螞蟻集團董事長兼CEO井賢棟通過全員信宣佈,螞蟻集團總裁韓歆毅將從2025年3月1日起正式接任螞蟻集團CEO一職,全面負責螞蟻的各項業務及日常管理工作,向井賢棟及董事會匯報。未來井賢棟將專注於董事長工作,並全力支援好韓歆毅和管理團隊。根據阿里披露的2025財年財報,螞蟻集團2024年實現淨利潤383.27億元,同比增長61%,為母公司貢獻了126.48億元投資收益,佔阿里整體淨利潤的30.42%。隨著醫療健康業務成為戰略支柱類股,螞蟻集團的營收結構以及對阿里的利潤貢獻能力預計會發生一定變化。 (介面新聞)以下為全員信全文:各位螞蟻同學:向大家同步兩個新進展:自6月推出獨立app後,AI健康管家AQ使用者正快速增長,已成為中國首個月活突破千萬的行業AI專業級應用,並升至中國AI原生應用榜第7位;螞蟻醫療大模型在HealthBench、MedBench等國內外多個權威醫療評測中達到行業領先水平,在醫學視覺和報告解析等領域也刷新行業基準。在AI時代,螞蟻聚焦應用,錨定生活服務、金融服務、醫療健康服務三大服務業。為加速螞蟻在醫療健康領域的發展,使其盡快成為螞蟻的戰略支柱類股,我代表公司管理層宣佈以下組織決定和任命:即日起,「螞蟻數字醫療健康事業部」升級為「螞蟻健康事業群」,任命張俊傑(偉鶴)擔任事業群總裁併向我匯報。過去11年,從第一筆手機掛號繳費,到醫保碼服務超8億使用者,螞蟻始終堅持以技術驅動解決社會問題的初心。面向未來,AI為破解社會醫療健康痛點提供了關鍵路徑,我們也將篤定方向、全力以赴。我們一起努力,讓看病更簡單、生活更健康! 螞蟻集團CEO 韓歆毅 2025年11月7日