【新智元導讀】基層醫生的AI好助手來了!中國國產AI,更懂中國醫生。
從去年開始,「醫療AI(medical AI)」與「健康AI(AI for healthcare)」從星星之火,迅速燎原。
在Google趨勢裡,這類關鍵詞在最近幾個月都呈現明顯抬升:
但對大多數中國醫生——尤其是基層醫生——這些熱鬧始終顯得有些遙遠。
僅糖尿病患者,中國就有2.33億人,遠超現有醫療資源的承載能力。
更別說基層醫生每天面對的是混雜的真實世界:心血管、呼吸、消化等各種疾病交織出現;一旦遇上少見症狀或複雜共病,往往會感到吃力,甚至陷入“想得不全、顧得不夠”的困境。
因此真正的問題,從來不是「AI看起來有多厲害」——而是能不能安全有效地在臨床落地?能不能真正提升醫生的判斷力和決策力?
11月4日,國家衛健委正式發佈《關於促進和規範人工智慧+醫療衛生應用發展的實施意見》,其中重點提到:
這意味著什麼?
「AI+醫療」已不再是AI產業界的技術炫技,而是提升到了國家層面的衛生健康行業發展高度。而「AI+醫療」的落地重點,在基層。
誰能抓住這波醫療AI版的「農村包圍城市」,誰就能在下一波AI浪潮中笑到最後。
多位長期深耕基層培訓教育的主委們很快達成共識:能真正幫到中國基層醫生的AI,關鍵在2件事:
1)診中:輔助臨床決策,要安全、有效;
2)診後:支撐患者隨訪,要規範、可持續。
而,這也是「未來醫生AI工作室」的初心。
AI能寫會畫,甚至拿下奧數金牌,但「術業有專攻」——通用的AI難以救死扶傷。
解放軍總醫院第六醫學中心(海軍總醫院)內分泌科主任醫師、全科教研室主任郭啟煜,就曾遇到:
一些患者自行使用AI尋找大量資訊後,提供給醫生,但這些資訊往往互相矛盾,甚至與最新的醫療指南和共識相悖。
他認為,AI落地醫療有2大關鍵:有效性和安全性。
有效性, 指的是真能幫上忙,能提供有用的建議和資訊。
安全性, 則是必須堅守的底線,AI醫療產品提供的建議必須基於權威資料。
但要測試醫療AI的「安全性」和「有效性」,並不簡單。
好在今年7月,來自26個科室的32位一線專家們聯手,來了場全球頂尖大模型的「擂台賽」。這項測評已於7月正式公開發佈,並接受學術同行評議。
他們從真實病歷中抽絲剝繭,整理出2069道開放式問題,圍繞「安全性/有效性」,模擬真實場景,搭建了一套系統性的臨床評估標準。
在此標準上,測評了當時最前沿的6個大模型:OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B以及「未來醫生AI工作室」背後的醫學大模型MedGPT。
結果呢?
六個大語言模型的基準測試顯示總體表現不錯(總分均值57.2%,安全性54.7%,有效性62.3%)。但在醫療最看重的「安全」上,卻拉開了明顯差距:
而在同一套標準下,專業醫療大模型MedGPT則表現出顯著特徵:「安全性」、「有效性」雙高!得分分別達到0.912、0.861,拿下雙冠軍,總分更是領先第二名15.3%。
總體得分、安全性、有效性,MedGPT(綠色)均領先
此外,在這場比拚中,MedGPT還表現出幾個突出特徵:
復盤時,北京大學第三醫院運動醫學科江東教授表示
臨床不只是看答對多少,更要看答錯多少。
從那一刻起,這個以MedGPT為底座的「未來醫生AI工作室」,底層基因已經註定:不是做看起來「樣樣通的AI」,而是做臨床上「最安全、最可靠的AI夥伴」。
答案已經揭曉。
就在最近,中⼭⼤學附屬第⼀醫院泌尿男科主任鄧春華教授聯合中國多位權威專家,設計並開展了一場高度模擬真實臨床流程的實戰盲測。
評測方法核心直接、客觀:
1、選題:從真實臨床工作中,抽取出一批複雜、存在爭議且資訊不完全的典型病例。
2、答題:同一道題,分別交由三位「參賽者」獨立作答:
3、測評:由臨床專家團盲審三份AI生成的答案,並嚴格依據以下8個核心維度進行打分:
結果中國AI——全線完勝:
這場評測的意義,遠不止於一次分數的比拚。
結果所呈現的,已經不再是模型的紙面能力,而是——是否能在真實醫療環境中做出可靠的臨床決策。
這背後,正是「未來醫生AI工作室·臨床決策AI助手」的差異化技術路線:
這也解釋了,為什麼在臨床診斷這種高風險、強推理的場景裡,中國的醫療AI能夠取得領先——
關鍵不在簡單看誰的參數更大,而在於誰更接近醫生真實的思考方式和工作方式。
面對複雜病例,醫生最擔心的從來不只是「已知風險」,更是那些隱藏在資訊缺口、經驗不足和病例多樣性背後的知識盲區與思維侷限。
缺資訊、缺經驗、病例雜——幾乎是所有基層醫生的共同現實。
「未來醫生AI工作室·臨床決策AI助手」想解決的,正是這一臨床痛點。
它不是一個更大的「知識庫」,而是為每位醫生打造的「醫療版賈維斯」:不僅能調動高等級循證證據,更能以專業方式協同思考——核心是一套由安全與循證驅動的臨床決策引擎。
在日常診療裡,醫生可以用口語化的方式輸入病情,系統不會急於下結論,而是先完成三件更重要的事:
當然,最終的所有決策權,始終牢牢掌握在醫生手中。
醫生依然是做決定的那個人,只是不再需要一個人扛下所有不確定性。能看得更全、想得更深,不至於錯過任何「可能改變結局」的疑點。
多位一線醫生的反饋也印證了這一點:
「好用、循證清晰。」
「像有個隨時在旁邊可以討論的專家。」
而這一切的背後,是「未來醫生AI工作室·臨床決策AI助手」提供的確定性支援——讓每位基層醫生在面對複雜病情時,都能更有把握地做出判斷。
掛號、看病、診斷、開藥,只是醫療的起點。
真正決定療效的「大考」,往往發生在患者走出診室之後。
隨訪一旦缺位,不只是管理脫節,更會造成療效遞減與醫患信任的損耗:患者聯絡不上、該複查沒複查,甚至出現「危險訊號」,也沒人第一時間看到。
那麼,如何為院外治療裝上一道「安全而有效的護欄」?
這正是未來醫生AI工作室「患者隨訪AI助手」的價值所在——
把原本孤立的診療節點,延展為一個可持續的管理閉環。通過人機協同,它正在重塑院外關懷的範式,補齊門診“最後一公里”的三大核心短板:
值得強調的是,「未來醫生AI工作室·患者隨訪AI助手」從架構設計起,就堅持一個原則——
AI輔助,醫生決策。
無論系統多智能、響應多及時,所有涉及醫療行為的最終裁定權,始終在醫生手中。
一旦觸及藥物調整、嚴重症狀等關鍵節點,AI不會越界「替你決定」,而是立即發出明確預警,把關鍵決策點完整呈交給醫生,由醫生最終判斷。
把以上幾個關鍵拼圖拼起來,就會發現一條非常清晰的邏輯鏈:
正因如此,多位主委給出了高度一致的評價:這是目前最接近「基層+AI」最佳實踐的路徑。
鄧春華教授的總結很形象:「通過『未來醫生AI工作室』,基層醫生能真正站在巨人的肩膀上,加速成長。」
這或許就是技術最好的落地方式——不是替代,而是賦能。
每次聊到AI,總有人問:「醫生會被替代嗎?」
在臨床一線,這個問題本身就是個誤解。
一位三甲主任說得很透:「AI再強,也開不出帶著溫度的處方。」
真正需要追問的是:什麼樣的醫療AI,才配進入臨床?
答案有3點:
1、安全、有效。這是所有臨床應用必須先跨過的底線,也是醫生願意信任的前提。
2、臨床實戰,是唯一的檢驗標準。
在真實病例的對決中,一款中國團隊打造的產品——未來醫生AI工作室,在關鍵指標上優於GPT-5和OpenEvidence。它專注做三件事:
3、技術的盡頭,是回到人的需求。
即便未來AI能提供更全面的解決方案,它依然無法替代“溫度”——那份對病情的揣摩,對患者的理解,對風險的承擔。
醫療的答案,從未改變:醫生負責判斷與關懷,AI負責效率與知識。當二者真正協同,優質醫療才會變得更可及、更可靠、更可持續。
真正有價值的醫療AI,從來不是取代醫生的力量,而是托舉醫生的力量。 (新智元)