杭州再出黑馬，全球領先醫療AI大模型誕生！ 24h三甲醫學專家搬進口袋

2025/02/15

•

5天發佈5項領先，從此，人人都有了口袋裡的健康專家－好伴AI。

在醫療領域，我們許多人的痛點就在於，80%的優質醫生都集中在一線城市。同時，最近中美網友小紅書對帳的事，再一次揭露了國外醫療程序的繁瑣和不夠人性。

而好伴AI的使命，就是讓每個人無論身在何處，都能擁有口袋裡的健康專家！對使用者，它的口袋裡的健康諮詢專家；對醫生，它是專業知識和經驗的應用和傳播者。

接下來，就讓我們詳細領略智診科技的五天發表會內容，感受一下這款AI將如何變革我們的智慧健康醫學新時代。

簡短目錄如下——

Day 1：無限記憶
Day 2：全科醫療基座&深度推理
Day 3：分身有術
Day 4：精準解讀
Day 5：好伴AI，觸手可及

Day 1：讓AI擁有無限記憶，事無鉅細地瞭解我們、懂得我們、關心我們

第一天，智診科技透過WiseDiag-Z1讓AI擁有了無限記憶，具體來說，是一種即插即用的記憶力機制。

從腦科學的角度來說，記憶始於神經元之間的訊號傳遞。不過，人類的碳基記憶不是完美的，許多記憶會模糊消失。而研究者希望，能賦予AI一個全新的記憶系統，克服碳基記憶的弊端。

智診AI系統最基礎的特性，就是支援多國語言，尤其支援中文。而這個系統模擬了人類記憶的特性，能夠自動擷取、儲存三種不同的記憶資訊。

具體來說，包括完整對話內容、以天為單位的記憶總結，和事件層級記憶。這樣，在醫療問診的多輪長對話中，它就能方便使用者取得所需資訊。

同時，為了讓大模型不搞錯模糊代指的記憶，研究者特別發展了基於端到端的多輪多路情境查詢能力，從而幫助AI理解複雜的多輪對話。

另外，研究者也發展了一個AI的模糊記憶查詢功能，這就可以透過模糊的內容聯想（時間或地點）來查詢記憶。

例如在下面這個demo中，研究者問：前天和你說的關於買咖啡的事，你還記得不？但這件事其實這件事是昨天聊的，不要緊，系統還是查出來了所需資訊。

或者，我們可以讓AI幫忙回想一下，我有個夢裡有森林和美麗的顏色，那是什麼樣的夢？可以看到，即使使用者記不清細節，好伴AI依然可以根據模糊表述查到精準記憶。

想像一下，為了在醫院看病時，AI醫師分身能事無鉅細地瞭解我們的生活習慣、醫療記錄，像老朋友一樣懂我們，關心我們的身體，這也太令人期待了！

Day 2：全科醫療基座& 深度推理，懂醫還會聊

第二天，全學科醫學基座大模型WiseDiag首次亮相，同時，醫學版o1推理模型也來了。

作為醫學基座大模型，WiseDiag採用了最新一代大模型架構，共有730億參數，具備了強大醫學知識處理能力。

它在超3兆token的專業級優質醫學資料中完成了訓練。

其中包括，大量權威醫學教材、最新臨床指南，以及海量高水平醫學研究論文。

預訓練之後，WiseDiag也用到了SFT督導微調、PPO直接偏好最佳化的訓練方法，以及受邀的臨床專家深度參與訓練過程。

透過精心設計的訓練，新模型不僅掌握了豐富的醫學知識，更具備了類醫師的臨床思維能力，能夠為醫療決策提供專業、可靠的智慧支援。

在專業能力方面，WiseDiag在中文醫學大模型權威基準CMB和Medbench中，分別拿下了98.39和92.9的成績。

尤其是，在CMB上，分數幾乎接近滿分，愈加證明其對醫學知識掌握到位。

在通用能力方面，WiseDiag也在中文基礎模型評估C-Eval和極具挑戰性的大規模多工理解評測MMLU-Pro中，取得了媲美國內外頂尖模型的表現。

WiseDiag在通用和專業基準上優異表現，恰恰印證了智診的初衷——打造一個既懂醫，又會和人溝通的AI助手。

當然，考試測試是一方面，更重要的是它能夠在實際應用場景中，並真正幫助醫生和病人。

深度思考版本Z1

醫學領域，也有其o1版推理模型。

基於WiseDiag，團隊打造的深度思考版本－Z1在這次發表會中，首次亮相。

對於一位經驗豐富的醫生來說，在遇到疑難病例時，他會不斷深入分析，反覆推敲論證，並根據新的發現及時調整思路。

這個過程，如果是被AI實現了呢？

透過採用多層次推理擴展機制，Z1能夠像專家醫師一樣，進行深入細緻的分析思考和反覆權衡，直到找到最優解。

這項突破，讓WiseDiag不再停留在簡單的「尋找規則配方」層面，而是真正具備了專業的臨床思考能力。

在實際應用中，Z1已展現了令人矚目的深度思考能力。

接下來不如看個栗子，打開好伴AI，我們將疑難雜症的一個病例發給它，讓AI幫我們做出診斷。

在經過深思熟慮之後，好伴AI基於所給的資訊，精準地指出了這個病症——龐貝病。

要知道，這是一個全球罕見的遺傳代謝疾病，全球發生率1/30萬。不僅如此，它還是症狀「偽裝者」，若能早期識別對治療影響極大。

但對醫生而言，得出診斷都是一種挑戰。

如果AI能對類似罕見疾病早期預見，將會帶來極大的醫療價值。

可以看到，好伴AI不僅給了最終的診斷，也給了完整鑑別診斷思路。這種診斷模式與臨床醫師的思維高度吻合，能真正協助醫師的日常診療工作。

當然了，AI提供的只是一個高敏預警，承擔的角色是輔助診斷/決策，並不能取代真正的醫生。

若真懷疑是罕見疾病，患者應儘早面診專業醫師，需結合病史、身體檢查、影像學結果、多項實驗室檢查來做綜合判斷。

不論Wisediag，還是Wisediag-Z1，它們都是全學科醫學大模型。

有了這樣強大的基座大模型，我們就能打造出一個專屬的專業級健康專家助理。

Day 3：AI醫學專家分身有術，7x24為你診療

第三天，研究者也帶來了醫學領域的AI智能體－醫學專家分身繫統。

醫少患多，這種不平衡的醫療資源，造成了各大醫院專家每天被上百位病患「圍追堵截」的現況。

特別是，知名專家的號幾乎「一票難求」。

這時，如果每個醫生能夠有一個「分身」，可以7x24小時對全國患者做出回應，對醫生和患者來說都是福音。

這不僅讓更多人能享受優質醫療資源，還能大幅節省就醫成本和時間，讓看病變得更加便捷高效，讓高水準健康醫療資源實現普惠。

對準媽媽來說，最常見的問題是──剖腹產和自然產側切，那一種方式對身體傷害較大？

王權利是浙二醫院產科權威專家，在好伴AI中，就有一個AI版的王權利主任。

接下來，就把這個問題交給這位AI專家，在經過60多秒思考，參考12篇權威資料後，它給出了非常詳實的解讀。

它的回覆專業性強且富有人文關懷，既講清了順產和剖腹產的醫學利弊，又很好地安撫了準媽媽的心理需求。

而且，為了說明問題，AI也引用了WHO的權威資料，並給予溫馨提示。

王權利專家現場評論道，「它用『內傷』和『外傷』這個比喻很形像地解釋了剖腹產和順產的區別。其中，『出血1000ml的定義』這個細節和我在抖音影片中的描述一致，體現了較強的專業性和實用性」。

他也表示，「這個AI分身已經達到自己80%的功力，未來經過改善，可能會達到90%以上」。

專家AI分身能夠實現，背後的門道是什麼？

那便是，醫學編碼模型Med-Embedding+醫學知識庫+網路搜尋。

在如此專業的領域中，AI能準確理解各種複雜的醫學術語，前提是其向量化，Med-Embedding的效用就在這裡。

每一個醫學文字都可以轉化成一個「向量」，就像擁有一個獨特的地理座標。

舉個栗子，病人提出一個問題，「醫生，我最近皮膚發黃，尿色變深，還總是肚子疼，感覺特別沒精神，這是怎麼回事」？

Med-Embedding可以精準將這段描述，轉化為1794維度的「醫學座標」。

普通的編碼模型很難區分「發燒38度三天」和「反覆低熱」的區別，因其座標分佈比較近。但對醫生來說，資訊重點是完全不同的。

Med-Embedding卻能夠捕捉到醫學臨床意義的細微差別，從而精準把這兩個訊息座標隔開，從而區分出它們的醫學關係。

在MedicalQARetrieval等多個醫學回想評測集中，Med-Embedding也拿下了不錯的成績。

王權利主任的AI分身是在WiseDiag基礎上，透過醫學編碼模型，學習了其發表的40+篇論文，以及影片平台上近400個影片後打造的。

就比如，他的個人習慣用語、打比方，甚至是一些碎碎念，AI分身可是學的有模有樣。

它學會了王權利在每日查房時必問的那句話－－「昨晚睡夠8小時了嗎」？

此外，AI能有理有據，全憑智診擁有自主可控的醫學網路搜尋、醫學全科知識庫和專家個人化知識庫。

其中，醫學全科知識庫包含40萬多條持續更新的醫學知識；專家個人化知識庫則收錄了每位專家獨特的臨床經驗和專業見解。

未來，這些知識還會持續更新和維護，以確保資訊時效性和準確性。

為了確保可靠性和透明度，在AI回答中列出了詳細參考鏈接，確保資訊可追溯

最值得一提的是，智診也將專家經驗做成了「數位外掛」，融合了頂尖專家的經驗和診療思路。

如演示所示，專家分身不僅保留了好伴AI的優勢，甚至能模擬專家特有的臨床思維模式，提供更精準的建議。

從此刻起，任何一個人打開好伴APP，找到「產科王利權」專家分身，即可獲得──

3秒生成個人化產檢計畫、1分鐘解讀唐篩報告、24小時線上的「懷孕守護者」。

現今，國家正對「分級診療」「網路+醫療」大力扶持，優化醫療資源組態，解決群眾「看病難、看病貴」的問題。

在這樣的背景下，口袋醫生的出現就十分應景了。它緩解了基層醫療機構的壓力，提高了民眾的自我健康管理，也能輔助醫療專業人員。

可以說，它的出現與政策的方向是完全一致的。

Day 4+5：好伴AI精準解讀醫學報告，像醫生一樣給予診斷

第四天和第五天，研究者將上述技術凝練成了觸手可及的產品－「好伴AI」。

第一款專注於全人類健康生活、醫療諮詢的智慧助理軟體，誕生

上面說到，很多時候專家號一票難求，但有了好伴AI這個醫學專業領域的聊天機器人，我們的這些難題就可以迎刃而解一大部分！

這是因為，它能夠讀懂複雜的醫學報告，能夠像醫生一樣給予詳細的分析、診療和判斷。

在首頁，我們可以使用檢測單解讀、身體檢查報告解讀、全科醫學諮詢、專家分身諮詢等核心功能。

或者，直接輸入語音或文字，跟AI健康管家「好小夥伴」發起對話。

我相信很多人都有這樣的經驗：在醫院拿到檢測報告單後一籌莫展，看不懂複雜的醫學用語，也不理解異常的數值或結果。

這時，我們就可以使用好伴AI的檢測單解讀功能。

將血氣報告拍照上傳好伴AI後，它便開始了詳盡的分析，並給出了輔助診斷結果和依據：高度懷疑是DKA，即糖尿病酮症酸中毒，建議患者去做尿酮體檢測和尿常規，需要立即就醫。

可以看到，整個分析過程邏輯縝密，並且明確地對患者強調了緊急性。

這個真實病例的就診檔案中還有兩份檢查單，正是尿液常規和糖尿病酮症的指標；可以證明AI醫師推薦的檢查項目的正確性

另外，我們也可以上傳自己的體檢報告，它會給我們一份專家級的解讀報告。整個體檢報告智慧諮詢功能，非常準確、科學、個人化。

在填寫完一份問卷後，好伴AI就會進行綜合分析，並給予一份「健康諮詢報告」。

首先，是結合了使用者生活習慣和同年齡層人口數據的健康得分，可以反映使用者當前的身體狀況。

然後，它還給出了詳細的健康狀況綜述，指出體檢報告上的異常，給予分析和應對方式。

而報告最核心、最詳細的部分，就是健康風險解讀。包括對異常指標可能原因的分析、對健康的影響、此次檢測的限制、後續處理建議和異常項的精準認知。

值得一提的是，這些都是由WiseDiag模型結合醫學知識庫和網路搜尋得出的。

智診AI的研究者表示，這是自己在國內外見過的最詳細、最看得懂的體檢報告解讀了。

而以下這個專家分身功能，是研究者基於智診醫療大模型，融合多位三甲醫院專家的診療經驗和知識打造出來的。可以說，每位醫生分身，背後都有真實的知名專家。

例如，我們試試這個問題：孩子忽然發燒39度兩天了，身上有紅疹，可能是什麼病？

可以看得到，國內外常見的通用AI，一般只會建議退燒藥，但好伴AI會提示－－「警惕川崎病，建議立即就醫並檢查C反應蛋白」。

這完全就是一般家長很難想到的專家級建議！

因為川崎病是小兒發燒合併皮疹、黏膜變化的一種疾病，有「發熱、結膜充血、口唇/舌頭紅、四肢末端改變」等典型臨床表現，需要儘早診治，AI醫師的這個診斷，就顯得非常及時了。

AI醫師做出警示後，家長可以盡快就診，排除其他發燒病因，而不要過度慌亂，或只依賴網路諮詢。

再例如下面這個真實案例：患有癲癇的孕婦，未補充葉酸，正在服用拉莫三嗪，胎兒能要嗎？

產科主任AI分身直接重點：孩子能要！它也乾脆俐落給出行動清單──產檢、補葉酸、停中藥。

同時，它也用「一起努力」給病人穩定情緒，讓醫囑變成了貼心的叮嚀。

值得注意的是，懷孕期間癲癇用藥需謹慎，拉莫三嗪是較常見的安全性相對較高的抗癲癇藥，但具體方案仍需產科和神經內科醫生聯合評估。

目前，AI只是提供了常規指導，對於實際患者來講，還需要個體化與產科大夫溝通，及時做血藥濃度監測、胎兒畸形篩檢等。

或許會有讀者有疑慮：AI醫師究竟靠不靠譜呢？

為此，智診AI請到了十位醫學專家，對包括WiseDiag在內的四個平台提供的服務診斷結果打分，可以看到WiseDiag被公認為TOP 1。

對於體檢報告的解讀，十位專家也給了評分，WiseDiag依然明顯處於領先水準。

曾有報告稱，在國內，80%的優質醫療資源集中在一些主要城市中，而好伴AI的出現，可以讓患者無論身在何處，都能在口袋裡擁有一位健康專家。

同時，每位專家也能同時服務成千上萬位患者。

這，便是醫療普惠的意義。

當然了，AI的角色並非完全取代臨床醫生，而是作為極具前景的輔助決策工具。

因此，它必須在合規框架、倫理與安全性驗證下，才能讓更多病人放心受益。

雖然AI可以「看懂檢測報告」「協助做罕見疾病診斷」，但在實際臨床使用中，醫師通常需要結合病史、身體檢查、影像學結果、多項實驗室檢查來做綜合判斷。

因此，AI系統目前主要的角色是「輔助診斷/輔診決策」，在臨床上應與專業醫師的面診相結合，而並不是完全替代醫生。

智診API開放平台發布，開發者也能用

令人興奮的是，智診API開放平台也同時發布了！

從此，開發者也能參與這場醫療AI革命。

針對不同場景需求，智診打造了3款同系列模型。

WiseDiag-Z1，是標準版的全科醫學通用大語言模型，基於技術底層開發，適用於大多數健康諮詢場景。

在此基礎上，智診也打造了深度推理強化版Z1 Thinking。它能模仿頂尖醫師的思考過程，適合多步驟複雜場景健康諮詢，如針對疑難症的診斷、多階段治療方案的輔助設計等。

而Z1 Lite，是希望更快更經濟得到答案的使用者的最佳選擇。它更具性價比，在維持大部分核心效能的情況下，能幫助一般使用者低成本獲得服務。

此外，智診也提供了幾個高附加價值的特色工具，如智診Med-Embedding（醫學向量化模型），矽基永久記憶資料庫，高性能醫學OCR工具（Med-OCR）等。

為了協助開發者，智診AI為每個新帳號都提供10美元免費額度。

深度思考，重建醫療AI新典範

過去一年，人們都在講應用落地，而醫療AI是大模型落地最佳場景之一。

連更5天發表會，從無限記憶、深度推理模型、到專家分身繫統、口袋助手，再到API開放，智診開啟了AI重塑醫療的全新旅程。

前段時間，世界經濟論壇公佈的報告中，預測了全球有80億AI醫生的願景。

AI已成為醫療產業變革的主要力量，預計2024-2032年將以43%的速度成長，屆時AI醫療市場規模將達到4,910億美元。

另有德勤統計，到2030年，全球醫護人員缺口預計達1,000萬，這個數字意味著醫療不公平現況依舊存在。

在國外，GoogleDeepMind團隊曾特別製作了AI醫療大模型Med-PaLM，拿下92.6%高分水準媲美臨床醫師。

除了Google之外，還有IBM醫療大模型Watson、史丹佛基礎模型研究中心的BioMedLM（PubMedGPT）等等。

反觀國內，有專攻醫療領域百川智能，還有訊飛星火醫療大模型等頭部科技公司，均在此領域有所深耕。

能夠做出醫療領域的「推理模型」，智診還是國內首次。

與傳統大模型相比，深度思考推理模型能夠模擬醫師的臨床思考過程，從症狀診斷到邏輯推導，這正是醫療決策中的關鍵環節。

另一方面，推理模型另一個重要特點便在於其「可解釋性」。

在醫療決策中，理解診療背後的原因至關重要。

一般來說，AI給予建議的推理過程，需要與臨床醫師的邏輯相符。否則，若AI出現幻覺，可能會帶來嚴重的醫療事故。

WiseDiag-Z1能清楚展示診斷的每一步推理過程，不僅有助於醫師驗證AI的判斷，也能幫助病人更能理解自己的病情。

不僅如此，智診AI在上線時，已與多位臨床專家展開合作，並進行了反覆驗證。

同時，它也會不斷自主收集和修正“錯誤case”，逐步迭代，盡最大程度減少誤診漏診的隱患。

而在醫療資料快速累積的今天，具備推理能力的醫療模型，也具備了持續學習和能力演化的潛力。

透過不斷吸收新的醫學研究成果、臨床經驗，它們可以始終站在醫學前沿，為醫生患者提供最新、最準確的診療建議。

隨著醫療資源分佈資源不均問題日益突出，推理模型的價值更加凸顯。

它可以作為基層醫療機構的得力助手，幫助提升診療效率和精準性，讓每個人都能享受高治療醫療服務。

這也是為什麼世界經濟論壇，會提出80億AI醫師的願景。

放眼未來，推理模型必將成為重塑醫療服務的核心力量。下一步，最重要就是讓WiseDiag走向落地。

接下來，智診將會打通產學研究結合的路線，不僅要與醫院、保險機構合作，還要與科研院校共研計畫。

另外，好伴AI將對所有人開放，同時智診API開放平台將交到每一份同行者手中。

讓醫療資源實現真正的普惠化，才是AI醫療最有價值的意義。

可以期待，WiseDiag和好伴AI將贏得大眾和醫療行業人士的認可，智診的技術將點亮全社會。（新智元）

科技