#醫療AI
抱歉了GPT-5,這次是中國AI「上岸」了
【新智元導讀】基層醫生的AI好助手來了!中國國產AI,更懂中國醫生。從去年開始,「醫療AI(medical AI)」與「健康AI(AI for healthcare)」從星星之火,迅速燎原。在Google趨勢裡,這類關鍵詞在最近幾個月都呈現明顯抬升:但對大多數中國醫生——尤其是基層醫生——這些熱鬧始終顯得有些遙遠。僅糖尿病患者,中國就有2.33億人,遠超現有醫療資源的承載能力。更別說基層醫生每天面對的是混雜的真實世界:心血管、呼吸、消化等各種疾病交織出現;一旦遇上少見症狀或複雜共病,往往會感到吃力,甚至陷入“想得不全、顧得不夠”的困境。因此真正的問題,從來不是「AI看起來有多厲害」——而是能不能安全有效地在臨床落地?能不能真正提升醫生的判斷力和決策力?AI+醫療,被放在了國家檔案的「C位」11月4日,國家衛健委正式發佈《關於促進和規範人工智慧+醫療衛生應用發展的實施意見》,其中重點提到:「建立基層醫生智能輔助診療應用」「加強居民慢性病規範管理服務」這意味著什麼?「AI+醫療」已不再是AI產業界的技術炫技,而是提升到了國家層面的衛生健康行業發展高度。而「AI+醫療」的落地重點,在基層。誰能抓住這波醫療AI版的「農村包圍城市」,誰就能在下一波AI浪潮中笑到最後。多位長期深耕基層培訓教育的主委們很快達成共識:能真正幫到中國基層醫生的AI,關鍵在2件事:1)診中:輔助臨床決策,要安全、有效;2)診後:支撐患者隨訪,要規範、可持續。而,這也是「未來醫生AI工作室」的初心。中國AI vs 美國AI 只有它是「安全+有效」的雙料冠軍AI能寫會畫,甚至拿下奧數金牌,但「術業有專攻」——通用的AI難以救死扶傷。解放軍總醫院第六醫學中心(海軍總醫院)內分泌科主任醫師、全科教研室主任郭啟煜,就曾遇到:一些患者自行使用AI尋找大量資訊後,提供給醫生,但這些資訊往往互相矛盾,甚至與最新的醫療指南和共識相悖。他認為,AI落地醫療有2大關鍵:有效性和安全性。有效性, 指的是真能幫上忙,能提供有用的建議和資訊。安全性, 則是必須堅守的底線,AI醫療產品提供的建議必須基於權威資料。但要測試醫療AI的「安全性」和「有效性」,並不簡單。好在今年7月,來自26個科室的32位一線專家們聯手,來了場全球頂尖大模型的「擂台賽」。這項測評已於7月正式公開發佈,並接受學術同行評議。arxiv連結:https://arxiv.org/abs/2507.23486他們從真實病歷中抽絲剝繭,整理出2069道開放式問題,圍繞「安全性/有效性」,模擬真實場景,搭建了一套系統性的臨床評估標準。在此標準上,測評了當時最前沿的6個大模型:OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B以及「未來醫生AI工作室」背後的醫學大模型MedGPT。結果呢?六個大語言模型的基準測試顯示總體表現不錯(總分均值57.2%,安全性54.7%,有效性62.3%)。但在醫療最看重的「安全」上,卻拉開了明顯差距:當涉及危重症識別、藥物衝突等複雜問題時,多款通用大模型的得分明顯下滑當涉及嬰兒、兒童、免疫低下等特殊人群時,有的模型表現很不穩定,有時很好,有時很危險而在同一套標準下,專業醫療大模型MedGPT則表現出顯著特徵:「安全性」、「有效性」雙高!得分分別達到0.912、0.861,拿下雙冠軍,總分更是領先第二名15.3%。總體得分、安全性、有效性,MedGPT(綠色)均領先此外,在這場比拚中,MedGPT還表現出幾個突出特徵:安全性得分,比模型平均值高出近70%(0.912 vs 0.547);在複雜人群中,表現依然穩健,沒有「翻車」;測評中,唯一一款做到了「既穩定安全,又穩定有效」的AI。復盤時,北京大學第三醫院運動醫學科江東教授表示臨床不只是看答對多少,更要看答錯多少。從那一刻起,這個以MedGPT為底座的「未來醫生AI工作室」,底層基因已經註定:不是做看起來「樣樣通的AI」,而是做臨床上「最安全、最可靠的AI夥伴」。當技術回歸臨床,誰更像專家?答案已經揭曉。就在最近,中⼭⼤學附屬第⼀醫院泌尿男科主任鄧春華教授聯合中國多位權威專家,設計並開展了一場高度模擬真實臨床流程的實戰盲測。評測方法核心直接、客觀:1、選題:從真實臨床工作中,抽取出一批複雜、存在爭議且資訊不完全的典型病例。2、答題:同一道題,分別交由三位「參賽者」獨立作答:GPT-5OpenEvidence未來醫生AI工作室·臨床決策AI助手3、測評:由臨床專家團盲審三份AI生成的答案,並嚴格依據以下8個核心維度進行打分:多病共存與藥物序貫最佳化時間窗決策與風險取捨不確定性推理與檢查價值用藥相互作用與復合毒性圍術期協同決策ICU多目標最佳化檢驗與影像閉環連續照護與復發預防結果中國AI——全線完勝:圖源:https://ai.doctorwork.com/comparison這場評測的意義,遠不止於一次分數的比拚。結果所呈現的,已經不再是模型的紙面能力,而是——是否能在真實醫療環境中做出可靠的臨床決策。這背後,正是「未來醫生AI工作室·臨床決策AI助手」的差異化技術路線:通用大模型的強項在於文字生成,本質是模式匹配與記憶;而臨床決策AI助手,則是先建構系統性的醫學認知框架,再在其上強化「臨床推理+安全控制」,最終再落到產品層應用。這也解釋了,為什麼在臨床診斷這種高風險、強推理的場景裡,中國的醫療AI能夠取得領先——關鍵不在簡單看誰的參數更大,而在於誰更接近醫生真實的思考方式和工作方式。臨床智能參謀 幫醫生想得全,判得準面對複雜病例,醫生最擔心的從來不只是「已知風險」,更是那些隱藏在資訊缺口、經驗不足和病例多樣性背後的知識盲區與思維侷限。缺資訊、缺經驗、病例雜——幾乎是所有基層醫生的共同現實。「未來醫生AI工作室·臨床決策AI助手」想解決的,正是這一臨床痛點。它不是一個更大的「知識庫」,而是為每位醫生打造的「醫療版賈維斯」:不僅能調動高等級循證證據,更能以專業方式協同思考——核心是一套由安全與循證驅動的臨床決策引擎。鄧春華教授在使用未來醫生AI工作室·臨床決策AI助手進行決策輔助 (圖片已獲得教授本人授權)在日常診療裡,醫生可以用口語化的方式輸入病情,系統不會急於下結論,而是先完成三件更重要的事:提取證據:從高等級循證證據中抓出關鍵點;預警風險:提示藥物相互作用、特殊人群禁忌等潛在風險;標識缺口:指出病史、體檢或檢查的缺失環節,並附帶安全提示。當然,最終的所有決策權,始終牢牢掌握在醫生手中。醫生依然是做決定的那個人,只是不再需要一個人扛下所有不確定性。能看得更全、想得更深,不至於錯過任何「可能改變結局」的疑點。多位一線醫生的反饋也印證了這一點:「好用、循證清晰。」「像有個隨時在旁邊可以討論的專家。」而這一切的背後,是「未來醫生AI工作室·臨床決策AI助手」提供的確定性支援——讓每位基層醫生在面對複雜病情時,都能更有把握地做出判斷。跨越診室圍牆 把醫院級照護延伸到日常掛號、看病、診斷、開藥,只是醫療的起點。真正決定療效的「大考」,往往發生在患者走出診室之後。隨訪一旦缺位,不只是管理脫節,更會造成療效遞減與醫患信任的損耗:患者聯絡不上、該複查沒複查,甚至出現「危險訊號」,也沒人第一時間看到。那麼,如何為院外治療裝上一道「安全而有效的護欄」?郭啟煜在使用未來醫生AI工作室·患者隨訪AI助手管理患者 (圖片已獲得教授本人授權)這正是未來醫生AI工作室「患者隨訪AI助手」的價值所在——把原本孤立的診療節點,延展為一個可持續的管理閉環。通過人機協同,它正在重塑院外關懷的範式,補齊門診“最後一公里”的三大核心短板:管理可達性:通過數位化隨訪,突破時空限制,將專業照護延伸到患者的真實日常。治療依從性:借助個性化提醒與互動指導,提高患者執行度,讓方案落到實處。干預精準性:基於臨床指南與個體資料,為不同患者匹配差異化的管理路徑。值得強調的是,「未來醫生AI工作室·患者隨訪AI助手」從架構設計起,就堅持一個原則——AI輔助,醫生決策。無論系統多智能、響應多及時,所有涉及醫療行為的最終裁定權,始終在醫生手中。一旦觸及藥物調整、嚴重症狀等關鍵節點,AI不會越界「替你決定」,而是立即發出明確預警,把關鍵決策點完整呈交給醫生,由醫生最終判斷。為什麼主委們說 這是「基層+AI」的最佳實踐?把以上幾個關鍵拼圖拼起來,就會發現一條非常清晰的邏輯鏈:政策明確方向:國家已將「AI+基層醫療」列為重點任務,既要求提升基層醫生的診療能力,也強調對居民慢病的規範化管理。專家形成共識:多位專家態度一致——真正能落到臨床的AI,必須同時做到安全有效,並保持人機協同的工作方式。技術經受驗證:多模型、多專科的大規模評測顯示,MedGPT在「安全性」和「有效性」兩項核心指標上均領先國際主流大模型;在真實病歷的同題測試中,「未來醫生AI工作室」也較GPT-5、OpenEvidence更符合臨床實際需求。產品真正落地:「未來醫生AI工作室」落在了基層最缺的2大場景——診中決策輔助與診後隨訪管理,並收到了一線醫生的持續積極反饋。正因如此,多位主委給出了高度一致的評價:這是目前最接近「基層+AI」最佳實踐的路徑。鄧春華教授的總結很形象:「通過『未來醫生AI工作室』,基層醫生能真正站在巨人的肩膀上,加速成長。」這或許就是技術最好的落地方式——不是替代,而是賦能。AI+醫療的終局:醫生主導,AI賦能每次聊到AI,總有人問:「醫生會被替代嗎?」在臨床一線,這個問題本身就是個誤解。一位三甲主任說得很透:「AI再強,也開不出帶著溫度的處方。」醫生的價值,在於判斷、取捨、溝通與責任;AI的價值,在於不疲倦、可追溯、能持續學習、能迅速覆蓋最新指南。所以未來不是替代,而是協同。真正需要追問的是:什麼樣的醫療AI,才配進入臨床?答案有3點:1、安全、有效。這是所有臨床應用必須先跨過的底線,也是醫生願意信任的前提。2、臨床實戰,是唯一的檢驗標準。在真實病例的對決中,一款中國團隊打造的產品——未來醫生AI工作室,在關鍵指標上優於GPT-5和OpenEvidence。它專注做三件事:讓醫生把病例看得更全;把風險提前亮出來;讓患者的管理不中斷、更長期。3、技術的盡頭,是回到人的需求。即便未來AI能提供更全面的解決方案,它依然無法替代“溫度”——那份對病情的揣摩,對患者的理解,對風險的承擔。醫療的答案,從未改變:醫生負責判斷與關懷,AI負責效率與知識。當二者真正協同,優質醫療才會變得更可及、更可靠、更可持續。真正有價值的醫療AI,從來不是取代醫生的力量,而是托舉醫生的力量。 (新智元)