#醫療AI
剛剛,中國AI打破醫療天花板!杭州團隊再放大招,頂尖“三甲醫生”人人可用!
2026年開年,全球AI巨頭集體將目光投向醫療健康。1月份,OpenAI祭出了旗下首款AI醫療產品ChatGPT Health,向C端使用者發力。Anthropic則以Claude for Healthcare強勢回應,瞄準整個醫療系統。更不用提以OpenEvidence、Abridge為代表的一批AI醫療獨角獸,不斷挑戰著市場的神經。當大模型轉向醫療垂直領域進行深耕,一場圍繞臨床價值的產業競賽全面打響。可就在這場兆級狂飆裡,一個刺耳的質疑浮出水面:模型越大,流量越多,不一定越好。更可能的是:噪音更大、思維鏈更亂、幻覺更猛。而對於醫療健康而言,任何一次幻覺,都可能造成不可挽回的後果。因此,近期國家多部門密集出台相關政策,為醫療AI發展劃定方向、築牢保障。國務院“人工智慧+”行動方案強調風險研判與確保發展安全、可靠、可控等治理方向;衛健委等部門“人工智慧+醫療衛生”實施意見強調“安全可控、規範應用、保障服務安全”,並明確“賦能而不替代”的監管定位;真正決定醫療AI勝負的,不是更多的曝光度,而是能讓模型更可信、更可控、更負責任。而就在這個節點,智診科技以一場為期4天的發佈會,提供了絕佳案例。去年,這家來自杭州的醫療AI黑馬,率先提出“專家數字分身”、“深度慢思考”等核心功能,並行布了全科醫學基座大模型WiseDiag、好伴AI等一系列成果,獲得了行業的矚目。而今年,智診科技帶來全方位升級,再次以極致的技術創新與產品打磨,引領醫療AI的變革。這並不是一次常規更新,而是一場讓AI有「記憶、時間感、證據鏈」的深層革命。從智能記憶中樞、多模態醫療大模型、到醫療端到端智能體、AI家庭醫生,再到B端能力開放,智診重新定義了AI重塑醫療的想像空間。帶來的真正變化在於:當患者描述症狀時,AI不再給予給出結論,而是像一位經驗豐富的私人醫生一樣,能夠記得你的家族病史,理解檢驗單、醫學影像等資訊,並不斷思考、層層追問,直到給出有完整證據鏈的專業判斷。智診科技讓醫療AI回歸臨床本質,用紮實創新與負責精神,給出了行業最需要的樣本。全方位升級讓醫療AI可信、可控、負責任發佈會前三天,智診科技用三重技術突破重新定義醫療AI。先給AI裝“記性”,再給AI安“眼睛”,最後教AI練“手腳”,每一步升級都直指臨床痛點。Wise MemOS 2.0:從 “查筆記”到“長腦子”,讓AI更可信過去AI的記憶,就像帶了外掛的筆記本:每當遇到問題,AI 都要去海量的資料庫裡翻找匹配的資訊。這種路徑缺乏連續記憶能力,既做不到跨時間推理,難以真正理解健康資料背後的邏輯關聯,可信度天然受限。而智診科技的Wise MemOS 2.0走出了一條完全不同的道路。它將記憶直接內化於模型本身,模擬人類大腦“記憶固化”的自然過程。這讓AI徹底告別了單純的資訊檢索,真正擁有了屬於自己的持續記憶,實現了跨任務、跨時間、能進化的記憶能力。在衡量AI 記憶能力的國際權威記憶評測體系Locomo中,Wise MemOS 2.0 得分達到95.8%,較上一代的64.33%實現了質的飛躍。更穩定的記憶能力,讓Wise MemOS 2.0更像一位值得信賴的私人醫生,不僅記得你過往的體檢報告,還能盯著指標變化曲線,提前預警潛在問題。下面是一個讓人遺憾的真實病例。一位58歲的患者由於症狀隱蔽,2020年初診為帕金森,直到今年才確診為多系統萎縮症(MSA),被延誤5年,錯過最佳治療期。究其原因,外接筆記本式的傳統AI只能單個識別症狀,但是卻無法建立時間因果聯絡。相比之下,Wise MemOS 2.0 的思考過程,完全模擬了頂尖醫生的臨床思維:精準識別“單側起病” 核心特徵;聯動時間線,發現“早期伴自主神經症狀” 的異常;自動降低帕金森機率,提示MSA可能;明確指出:症狀演進與典型帕金森不符,需重新評估。它還能回溯歷史資料,點破關鍵疑點:“MSA 早期可有一過性左旋多巴反應,不能據此排除。”既不誤診常見病,也不放過罕見高危訊號,真正做到值得信賴。從“機械檢索” 到 “主動認知”,Wise MemOS 2.0不再是一本只會羅列知識的醫療百科,而是站在你生命時間軸上,持續守護、高度可信的健康管家。未來,它會住進你的手機、手錶,持續記錄健康軌跡,敏銳預警風險變化,比任何人都瞭解你的身體。WiseDiag V2:從“讀文字”到“辨全貌”,讓AI更可控醫療的本質是對多源健康訊號的綜合解讀,一張影像、一份化驗單、一張體徵照片,都是疾病的關鍵線索,容不得半點誤判。WiseDiag V2的突破,絕非簡單增加圖像輸入功能,而是在底層實現了視覺特徵與醫學知識的精準對齊,讓 AI 真正學會像醫生一樣 “看懂” 疾病全貌。醫療訓練資料從V1 版本的 450 億 Token 躍升至 800 億 Token,覆蓋更完整的疾病譜,為多模態理解築牢知識根基,從根源上控制幻覺率。它徹底告別了“先識圖轉文字、再理解文字” 的傳統邏輯,實現了真正的 “圖文同構”。這意味著WiseDiag V2看到的每一張圖片,都能直接對應為大腦中的醫學知識,理解更直接、判斷更精準、輸出更可控。為了讓模型掌握核心推理邏輯,智診科技聯合50餘位三甲醫院專家,對 3 萬餘例真實病歷進行深度拆解。讓模型學到的不只是答案,更是醫生的循證推理路徑,讓AI診斷全程有證據、可解釋、可追溯。在多項權威醫學評測中,WiseDiagV2憑藉實力霸榜:MedBench:69.8 分,位居榜首MedQA: 93.6 分,對標人類執業醫師水平的測試中表現優異vl-health:在醫學影像專項評測中取得 69.2分,遠超GPT-5.1HealthBench:在難度極高的真實臨床模擬評測中取得67.2分,全球領先。過硬的分數背後,是更少幻覺、更強可控、更高一致性的真實力。實際臨床場景中,WiseDiag V2 徹底解決傳統模型結論不一、判斷混亂的問題。例如,一位年輕女性出現橫跨鼻樑的蝶形紅斑。部分模型多次測試結論不一致,甚至直接提示“無法識別”,給患者帶來更多困惑。WiseDiagV2 ,精準識別出“蝶形紅斑”這一專業體徵,還指向系統性紅斑狼瘡(SLE)的可能性,並提供鑑別診斷思路與後續問詢建議。又比如下面這個案例,是一個剛滿月寶寶的胸部X光片、足部外觀照片、血常規化驗單。普通模型如同盲人摸象,各看各的、互相矛盾:盯著化驗單說“肺炎”,看足部照片猜 “骨折 / 畸形”,資訊衝突、診斷失控。WiseDiag V2則像資深醫師一樣,整合全貌、統一推理,成功診斷出罕見的 VACTERL 聯合征,實現多模態資訊的可控融合與精準判斷。從單一圖像的精準識別到多源資料的綜合研判,WiseDiag V2真正實現 “看懂疾病、理清邏輯、杜絕幻覺、輸出可控”。WiseResearch:從“張嘴答”到“踏實做”,讓AI更負責在真正的臨床場景中,醫生遇到拿不準的指標,不會立馬下結論。真正靠譜的做法是翻指南、查文獻、找專家覆核,這種猶豫和求證,正是對生命負責的表現。但許多醫療AI恰恰相反,它們太自信了,不願意停下來求證,幻覺率很高。而智診科技打造的WiseResearch,則是懂克制、會查證、守底線的醫療智能體。它不追求“說的漂亮”,只追求結論安全,像一位嚴謹負責的醫生,遇到問題主動查證、補齊證據鏈、反覆校驗,用專業與審慎,替代魯莽與敷衍。WiseResearch 的核心底氣,來自智診專家工具箱(MCP)裡的三大核心工具,每一個都精準解決臨床痛點:MedOCR:醫學資訊抽取近100%零失誤面對帶上下箭頭的生化檢測單、滿是勾選框的體檢問卷,DeepSeek、Miner U甚至GPT-5都出現了箭頭漏認、選項勾錯,甚至憑空幻覺出不存在的內容。而MedOCR 完美還原了所有數值、單位、箭頭和勾選狀態,實現零失誤識別,精準抓取核心資訊,為診斷打下堅實基礎。MedDB:醫學知識庫可信度更高傳統通用知識庫就是“資訊大雜燴”,資料龐雜且沒有時效性,AI很容易給出錯誤、過時的結論。MedDB 則完全不同,它收錄了超40萬條經專家人工稽核的醫學條目,覆蓋1.2萬種疾病,每條知識都明確標註了證據等級、適用範圍和時效性,還會定期更新迭代。確保AI說的每一句話,都不偏離權威醫學共識。MedSearch:專業搜尋 “同步全球前沿”臨床醫學日新月異,普通搜尋引擎搜“多發性骨髓瘤最新指南”,出來的不是幾年前的舊文章,就是非官方解讀,時效性和權威性都沒保障。MedSearch 始終與全球頂尖醫療標準保持同步,避免因資訊滯後影響診療決策。正是有了智診專家工具箱(MCP)這一堅實支撐,WiseResearch 才能跳出傳統AI的侷限,真正復刻醫生的嚴謹診療思路,將 “負責任” 的理念融入每一步操作。發佈會上,團隊上傳了一張極其複雜的化驗單,讓WiseResearch 進行初步診斷,它的表現完全復刻了專家的診療思路:第一步,精準提取。模型先判斷這是多項目聯合檢驗單,果斷呼叫MedOCR,快速提取出所有指標資料,沒有遺漏任何關鍵資訊;第二步,多次查證。發現“甲狀腺球蛋白抗體異常升高” 和 “血清輕鏈比值偏低” 兩個疑點後,它沒有草率下結論,而是反覆呼叫MedDB核對醫學共識,用 MedSearch 檢索最新指南,交叉驗證資訊;第三步,循證結論。最終,WiseResearch 明確診斷為 “自身免疫性甲狀腺炎”,並給出貼心建議;更關鍵的是,每一條建議後面都附上了指南出處,做到有據可查、可追溯,對患者負責。這到底是個例還是普遍能力?權威榜單給出了答案。在臨床Agent測試榜單AgentClinic-MedQA 上,WiseResearch 拿到了64.8分,比人類醫生的平均分高出10分;在醫學專家問答推理榜單 MedXpertQA 上,它也超過了 GPT-5-high、DeepSeek等主流模型。這多出來的分數,是對患者負責的絕對執行力。人類醫生可能因疲勞而跳過步驟,但WiseResearch不會,不管是第 1 個病人還是第100個病人,它都會嚴格執行 “檢索-核對-校驗” 的標準動作,不省略任何一步。WiseResearch不止是智能工具,更是醫療場景裡更審慎、更可信、更負責任的夥伴。從記住健康軌跡,到看懂多元資訊,再到踏實解決問題,這三重升級不僅是技術的跨越,更讓醫療AI從實驗室走向臨床一線、走進尋常百姓家。讓頂尖醫療AI全民可用共建醫療新基建技術的終點,是生活的起點。在發佈會的第四天,智診科技將上述技術突破,融合到人人可用的「好伴AI」之中,並搭建了⼀整套已經可⽤、可接⼊的「醫療能⼒底座」。好伴AI:把“三甲專家”裝進每個人的手機去年,智診科技推出網頁版和APP版好伴AI,拉近了普通人與頂級醫療AI的距離。今年好伴AI微信小程序的上線,再一次打破了門檻,無需下載APP、無需複雜註冊,微信內即可一鍵呼叫。報告解讀、拍照識熱量、專家問答、健康檔案,這些核心功能一個都不少,全部免費開放。過去一年,智診還和全國2000多位醫生一起,將他們的臨床經驗、科普文章、授課內容全部沉澱,建構起龐大的 “AI專家分身” 網路。這意味著好伴AI 不只是 “像醫生”,而是還原真實醫生,讓健康諮詢更精準、更貼心。例如,使用者說“肚子疼”,AI不會直接羅列疾病,而是追問“是刺痛還是隱痛?上腹部還是下腹部?持續多久了?”,補全醫生最想知道但使用者想不到的關鍵資訊,避免漏診誤判。此外,好伴AI支援“隨心拍”,將醫療級視覺理解融入日常。比如拍醫學報告,好伴AI支援全場景醫學材料精準識別,並可以結合你的熬夜習慣、既往病史等個體化差異,告訴你那些指標是"假陽性",那些是"真風險"。圍繞“報告解讀、各種拍、專家問答、家庭健康群”四大核心入口,結合“會追問、懂趨勢、有記憶”的核心優勢,好伴AI讓每個人都能輕鬆管理自己和家人的健康。B端能力開放:從“技術輸出”到“生態共建”除了C端產品,智診科技更將一整套能力底座開放給行業,向醫院、健康科技公司等夥伴提供三層能力。Model as a Service(MaaS):開放全能多模態大模型WiseDiag V2的核心能力,適合擁有研發能力的醫療資訊化廠商、科研機構,快速搭建自有醫療AI產品。Agent as a Service(AaaS):將WiseResearch中的成熟智能體直接輸出,網際網路醫院、體檢中心無需重訓模型,降低技術應用門檻。Solution as a Service(SaaS):為醫院提供“數字醫生分身繫統”,快速克隆本院專家的診療風格和專業能力,部署在醫院公眾號或小程序;為科研機構提供全院級科研輔助平台。目前,智診科技已深度合作300余家頂級三甲醫院,讓浙江省腫瘤醫院、浙二醫院等機構的專家資源通過AI分身觸達更多患者;“報告解讀能力”已成為數百家網際網路醫院的標配外掛。“如果AI不能被用起來,那所有模型都只是論文。”智診科技通過建構“技術→產品→生態”的完整閉環,推動AI醫療從實驗室走進千家萬戶,成為新時代醫療基礎設施的核心力量。深耕醫療AI自主創新推動中國「健康自由」在AI浪潮席捲全球的今天,醫療健康正成為最具顛覆潛力的應用領域。然而,狂飆突進之下,醫療AI的安全性、可靠性等隱患日益凸顯,幻覺問題依然嚴重。不僅如此,隨著國際科技競爭日益加劇,“自主創新”成為時代命題,中國醫療AI亦需要自己的「破局者」。在此背景下,智診科技立足中國醫療實際,深耕本土需求,堅持走「更可信、更可控、更負責任」的醫療AI創新之路。Wise MemOS 2.0 以高准記憶築牢可信根基,WiseDiag V2 以多模態能力規範可控診療,WiseResearch 以循證工作流踐行負責任初心,重新定義醫療AI的價值邊界。如今,普通人在家即可享受三甲級健康守護,企業可低成本擁有頂尖AI 能力,智診科技正加速推動中國“健康自由” 變為現實。可以期待,本土醫療AI將在自主創新的道路上越走越遠,為全民健康保駕護航。 (智藥局)
AI Agent+醫療,七大公司!
AI Agent,即AI智能體,是一種能夠感知環境、自主決策並執行動作的智能實體。理想狀態下,人類只需進行預先設定目標並進行監督,AI Agent便可以全權自主完成具體任務。具體到醫療領域,AI Agent將覆蓋“預防-診斷-治療-康復”全流程,其核心價值在於融合多模態資料、最佳化決策效率並保障安全。近日,知名技術研究機構AIMultiple評選出全球七家典型醫療AI Agent公司。AIMultiple成立於2017年,致力於通過資料,幫助企業研究、篩選和評估前沿技術解決方案,為超過半數的《財富》500 強企業提供決策依據。智藥局已對這七家入選企業進行了整理彙總,以供行業參考。Sully.ai公司提供了一種覆蓋患者接診、編碼、計費和分診的智能體架構,專注於模組化的人工智慧代理(AI Agents),可自動完成病歷文件記錄、患者接診、預約安排及各類行政事務。核心功能包括:語音轉操作:通過語音識別技術,將醫生口述內容直接轉化為電子病歷(EMR)中的具體操作。符合 HIPAA 規範:確保所有資料處理與傳輸均滿足美國健康保險流通與責任法案(HIPAA)的合規要求。多語言支援:支援19種語言,滿足多元化語言環境下的使用需求。CityHealth將 Sully.ai 的AI醫療平台直接整合到其電子病歷系統(EMR)中,顯著減少了醫護人員在患者照護相關文書工作上所花費的時間。成效顯著:每位臨床醫生每天平均節省約3小時的病歷記錄時間 ,每位患者的營運操作量減少50%.Beam AI公司提供了一套面向醫療管理的多智能體系統,可自動化處理電子病歷管理、醫療帳單、合規事務、患者預約安排等任務。Avi Medical與 Beam AI 合作,部署了支援多語言的 AI 智能體。這些智能體能夠通過 API 訪問外部資料,從資料庫中檢索相關資訊,以回答覆雜的客戶諮詢。得益於此能力,AI 智能體成功處理了大量重複性、常規性的諮詢請求。成效顯著:80%的患者諮詢實現自動化處理,中位響應時間縮短了90% ,淨推薦值(NPS)提升了 10%。Innovaccer公司提供了一套專注於價值導向醫療(value-based care)和營運的 AI 智能體解決方案,其智能體主要用於輔助臨床決策,而非用於診斷。位於印第安納州的多專科醫生網路Franciscan Alliance 採用了 Innovaccer 的平台,以自動化其編碼流程。成效顯著:需人工處理的患者病例數量從約2600例減少至約1600例。Notable Health公司利用AI智能體自動化處理各類行政事務,包括患者登記、預約安排、轉診、護理授權和編碼等,並與電子健康記錄系統(EHR)無縫整合。北堪薩斯城醫院(NKCH)此前在患者簽到和登記環節效率低下。為此,醫院與Notable 合作,將疫苗預約等多項行政流程自動化。成效顯著:患者簽到時間減少超過90%,從原來的 4 分鐘縮短至僅10 秒;患者預登記比例從40% 提升至 80%。Hippocratic AI是一家專注於醫療健康領域的人工智慧公司,開發了首個專用於非診斷類(如患者互動、隨訪、保險協調等)及面向患者的臨床任務的大語言模型。該公司近期完成了一輪1.41 億美元的融資,估值達 16.4 億美元。WellSpan Health 與 Hippocratic AI 合作,推出了一款生成式 AI 醫療智能體,專門處理患者互動電話。該智能體可主動聯絡講英語和西班牙語的患者,回應其健康需求,並協助安排篩查預約。成效顯著:該系統已幫助WellSpan Health 成功聯絡超過 100 名患者,顯著提升了他們獲得關鍵癌症篩查服務的機會。Amelia AI公司的智能體能夠引導患者完成整個診療旅程,包括預約掛號、解答患者疑問,並提供富有同理心的對話式回應。Aveanna採用 Amelia AI 智能體,通過Workday系統和移動應用程式處理員工重複性的互動請求。該智能體現在可自動完成密碼重設、使用者身份驗證及其他人力資源相關任務。成效顯著:AI智能體每天處理超過 560 次員工對話;95% 的員工請求通過Workday聊天窗口得到解決。Cognigy公司開發的智能體是專為醫療健康領域打造的對話式AI助手,可協助處理保險理賠、處方續藥以及術後護理指導等任務。Cognigy開箱即用地支援 30 多種語音和數字管道,涵蓋 iMessage、WhatsApp、Twitter 等主流平台。Personify Pulse採用了 Cognigy 的解決方案,並將其與 Zendesk LiveChat 整合,以高效響應客戶諮詢。成效顯著:Cognigy的 AI 智能體在無需人工介入的情況下,獨立處理了 40% 的客戶諮詢。 (智藥局)
抱歉了GPT-5,這次是中國AI「上岸」了
【新智元導讀】基層醫生的AI好助手來了!中國國產AI,更懂中國醫生。從去年開始,「醫療AI(medical AI)」與「健康AI(AI for healthcare)」從星星之火,迅速燎原。在Google趨勢裡,這類關鍵詞在最近幾個月都呈現明顯抬升:但對大多數中國醫生——尤其是基層醫生——這些熱鬧始終顯得有些遙遠。僅糖尿病患者,中國就有2.33億人,遠超現有醫療資源的承載能力。更別說基層醫生每天面對的是混雜的真實世界:心血管、呼吸、消化等各種疾病交織出現;一旦遇上少見症狀或複雜共病,往往會感到吃力,甚至陷入“想得不全、顧得不夠”的困境。因此真正的問題,從來不是「AI看起來有多厲害」——而是能不能安全有效地在臨床落地?能不能真正提升醫生的判斷力和決策力?AI+醫療,被放在了國家檔案的「C位」11月4日,國家衛健委正式發佈《關於促進和規範人工智慧+醫療衛生應用發展的實施意見》,其中重點提到:「建立基層醫生智能輔助診療應用」「加強居民慢性病規範管理服務」這意味著什麼?「AI+醫療」已不再是AI產業界的技術炫技,而是提升到了國家層面的衛生健康行業發展高度。而「AI+醫療」的落地重點,在基層。誰能抓住這波醫療AI版的「農村包圍城市」,誰就能在下一波AI浪潮中笑到最後。多位長期深耕基層培訓教育的主委們很快達成共識:能真正幫到中國基層醫生的AI,關鍵在2件事:1)診中:輔助臨床決策,要安全、有效;2)診後:支撐患者隨訪,要規範、可持續。而,這也是「未來醫生AI工作室」的初心。中國AI vs 美國AI 只有它是「安全+有效」的雙料冠軍AI能寫會畫,甚至拿下奧數金牌,但「術業有專攻」——通用的AI難以救死扶傷。解放軍總醫院第六醫學中心(海軍總醫院)內分泌科主任醫師、全科教研室主任郭啟煜,就曾遇到:一些患者自行使用AI尋找大量資訊後,提供給醫生,但這些資訊往往互相矛盾,甚至與最新的醫療指南和共識相悖。他認為,AI落地醫療有2大關鍵:有效性和安全性。有效性, 指的是真能幫上忙,能提供有用的建議和資訊。安全性, 則是必須堅守的底線,AI醫療產品提供的建議必須基於權威資料。但要測試醫療AI的「安全性」和「有效性」,並不簡單。好在今年7月,來自26個科室的32位一線專家們聯手,來了場全球頂尖大模型的「擂台賽」。這項測評已於7月正式公開發佈,並接受學術同行評議。arxiv連結:https://arxiv.org/abs/2507.23486他們從真實病歷中抽絲剝繭,整理出2069道開放式問題,圍繞「安全性/有效性」,模擬真實場景,搭建了一套系統性的臨床評估標準。在此標準上,測評了當時最前沿的6個大模型:OpenAI-o3、DeepSeek-R1、Gemini-2.5-Pro、Claude-3.7-Sonnet、Qwen3-235B以及「未來醫生AI工作室」背後的醫學大模型MedGPT。結果呢?六個大語言模型的基準測試顯示總體表現不錯(總分均值57.2%,安全性54.7%,有效性62.3%)。但在醫療最看重的「安全」上,卻拉開了明顯差距:當涉及危重症識別、藥物衝突等複雜問題時,多款通用大模型的得分明顯下滑當涉及嬰兒、兒童、免疫低下等特殊人群時,有的模型表現很不穩定,有時很好,有時很危險而在同一套標準下,專業醫療大模型MedGPT則表現出顯著特徵:「安全性」、「有效性」雙高!得分分別達到0.912、0.861,拿下雙冠軍,總分更是領先第二名15.3%。總體得分、安全性、有效性,MedGPT(綠色)均領先此外,在這場比拚中,MedGPT還表現出幾個突出特徵:安全性得分,比模型平均值高出近70%(0.912 vs 0.547);在複雜人群中,表現依然穩健,沒有「翻車」;測評中,唯一一款做到了「既穩定安全,又穩定有效」的AI。復盤時,北京大學第三醫院運動醫學科江東教授表示臨床不只是看答對多少,更要看答錯多少。從那一刻起,這個以MedGPT為底座的「未來醫生AI工作室」,底層基因已經註定:不是做看起來「樣樣通的AI」,而是做臨床上「最安全、最可靠的AI夥伴」。當技術回歸臨床,誰更像專家?答案已經揭曉。就在最近,中⼭⼤學附屬第⼀醫院泌尿男科主任鄧春華教授聯合中國多位權威專家,設計並開展了一場高度模擬真實臨床流程的實戰盲測。評測方法核心直接、客觀:1、選題:從真實臨床工作中,抽取出一批複雜、存在爭議且資訊不完全的典型病例。2、答題:同一道題,分別交由三位「參賽者」獨立作答:GPT-5OpenEvidence未來醫生AI工作室·臨床決策AI助手3、測評:由臨床專家團盲審三份AI生成的答案,並嚴格依據以下8個核心維度進行打分:多病共存與藥物序貫最佳化時間窗決策與風險取捨不確定性推理與檢查價值用藥相互作用與復合毒性圍術期協同決策ICU多目標最佳化檢驗與影像閉環連續照護與復發預防結果中國AI——全線完勝:圖源:https://ai.doctorwork.com/comparison這場評測的意義,遠不止於一次分數的比拚。結果所呈現的,已經不再是模型的紙面能力,而是——是否能在真實醫療環境中做出可靠的臨床決策。這背後,正是「未來醫生AI工作室·臨床決策AI助手」的差異化技術路線:通用大模型的強項在於文字生成,本質是模式匹配與記憶;而臨床決策AI助手,則是先建構系統性的醫學認知框架,再在其上強化「臨床推理+安全控制」,最終再落到產品層應用。這也解釋了,為什麼在臨床診斷這種高風險、強推理的場景裡,中國的醫療AI能夠取得領先——關鍵不在簡單看誰的參數更大,而在於誰更接近醫生真實的思考方式和工作方式。臨床智能參謀 幫醫生想得全,判得準面對複雜病例,醫生最擔心的從來不只是「已知風險」,更是那些隱藏在資訊缺口、經驗不足和病例多樣性背後的知識盲區與思維侷限。缺資訊、缺經驗、病例雜——幾乎是所有基層醫生的共同現實。「未來醫生AI工作室·臨床決策AI助手」想解決的,正是這一臨床痛點。它不是一個更大的「知識庫」,而是為每位醫生打造的「醫療版賈維斯」:不僅能調動高等級循證證據,更能以專業方式協同思考——核心是一套由安全與循證驅動的臨床決策引擎。鄧春華教授在使用未來醫生AI工作室·臨床決策AI助手進行決策輔助 (圖片已獲得教授本人授權)在日常診療裡,醫生可以用口語化的方式輸入病情,系統不會急於下結論,而是先完成三件更重要的事:提取證據:從高等級循證證據中抓出關鍵點;預警風險:提示藥物相互作用、特殊人群禁忌等潛在風險;標識缺口:指出病史、體檢或檢查的缺失環節,並附帶安全提示。當然,最終的所有決策權,始終牢牢掌握在醫生手中。醫生依然是做決定的那個人,只是不再需要一個人扛下所有不確定性。能看得更全、想得更深,不至於錯過任何「可能改變結局」的疑點。多位一線醫生的反饋也印證了這一點:「好用、循證清晰。」「像有個隨時在旁邊可以討論的專家。」而這一切的背後,是「未來醫生AI工作室·臨床決策AI助手」提供的確定性支援——讓每位基層醫生在面對複雜病情時,都能更有把握地做出判斷。跨越診室圍牆 把醫院級照護延伸到日常掛號、看病、診斷、開藥,只是醫療的起點。真正決定療效的「大考」,往往發生在患者走出診室之後。隨訪一旦缺位,不只是管理脫節,更會造成療效遞減與醫患信任的損耗:患者聯絡不上、該複查沒複查,甚至出現「危險訊號」,也沒人第一時間看到。那麼,如何為院外治療裝上一道「安全而有效的護欄」?郭啟煜在使用未來醫生AI工作室·患者隨訪AI助手管理患者 (圖片已獲得教授本人授權)這正是未來醫生AI工作室「患者隨訪AI助手」的價值所在——把原本孤立的診療節點,延展為一個可持續的管理閉環。通過人機協同,它正在重塑院外關懷的範式,補齊門診“最後一公里”的三大核心短板:管理可達性:通過數位化隨訪,突破時空限制,將專業照護延伸到患者的真實日常。治療依從性:借助個性化提醒與互動指導,提高患者執行度,讓方案落到實處。干預精準性:基於臨床指南與個體資料,為不同患者匹配差異化的管理路徑。值得強調的是,「未來醫生AI工作室·患者隨訪AI助手」從架構設計起,就堅持一個原則——AI輔助,醫生決策。無論系統多智能、響應多及時,所有涉及醫療行為的最終裁定權,始終在醫生手中。一旦觸及藥物調整、嚴重症狀等關鍵節點,AI不會越界「替你決定」,而是立即發出明確預警,把關鍵決策點完整呈交給醫生,由醫生最終判斷。為什麼主委們說 這是「基層+AI」的最佳實踐?把以上幾個關鍵拼圖拼起來,就會發現一條非常清晰的邏輯鏈:政策明確方向:國家已將「AI+基層醫療」列為重點任務,既要求提升基層醫生的診療能力,也強調對居民慢病的規範化管理。專家形成共識:多位專家態度一致——真正能落到臨床的AI,必須同時做到安全有效,並保持人機協同的工作方式。技術經受驗證:多模型、多專科的大規模評測顯示,MedGPT在「安全性」和「有效性」兩項核心指標上均領先國際主流大模型;在真實病歷的同題測試中,「未來醫生AI工作室」也較GPT-5、OpenEvidence更符合臨床實際需求。產品真正落地:「未來醫生AI工作室」落在了基層最缺的2大場景——診中決策輔助與診後隨訪管理,並收到了一線醫生的持續積極反饋。正因如此,多位主委給出了高度一致的評價:這是目前最接近「基層+AI」最佳實踐的路徑。鄧春華教授的總結很形象:「通過『未來醫生AI工作室』,基層醫生能真正站在巨人的肩膀上,加速成長。」這或許就是技術最好的落地方式——不是替代,而是賦能。AI+醫療的終局:醫生主導,AI賦能每次聊到AI,總有人問:「醫生會被替代嗎?」在臨床一線,這個問題本身就是個誤解。一位三甲主任說得很透:「AI再強,也開不出帶著溫度的處方。」醫生的價值,在於判斷、取捨、溝通與責任;AI的價值,在於不疲倦、可追溯、能持續學習、能迅速覆蓋最新指南。所以未來不是替代,而是協同。真正需要追問的是:什麼樣的醫療AI,才配進入臨床?答案有3點:1、安全、有效。這是所有臨床應用必須先跨過的底線,也是醫生願意信任的前提。2、臨床實戰,是唯一的檢驗標準。在真實病例的對決中,一款中國團隊打造的產品——未來醫生AI工作室,在關鍵指標上優於GPT-5和OpenEvidence。它專注做三件事:讓醫生把病例看得更全;把風險提前亮出來;讓患者的管理不中斷、更長期。3、技術的盡頭,是回到人的需求。即便未來AI能提供更全面的解決方案,它依然無法替代“溫度”——那份對病情的揣摩,對患者的理解,對風險的承擔。醫療的答案,從未改變:醫生負責判斷與關懷,AI負責效率與知識。當二者真正協同,優質醫療才會變得更可及、更可靠、更可持續。真正有價值的醫療AI,從來不是取代醫生的力量,而是托舉醫生的力量。 (新智元)