杭州再出黑馬,全球領先醫療AI大模型誕生! 24h三甲醫學專家搬進口袋


5天發佈5項領先,從此,人人都有了口袋裡的健康專家-好伴AI。

在醫療領域,我們許多人的痛點就在於,80%的優質醫生都集中在一線城市。同時,最近中美網友小紅書對帳的事,再一次揭露了國外醫療程序的繁瑣和不夠人性。

而好伴AI的使命,就是讓每個人無論身在何處,都能擁有口袋裡的健康專家!對使用者,它的口袋裡的健康諮詢專家;對醫生,它是專業知識和經驗的應用和傳播者。

接下來,就讓我們詳細領略智診科技的五天發表會內容,感受一下這款AI將如何變革我們的智慧健康醫學新時代。

簡短目錄如下——

  • Day 1:無限記憶
  • Day 2:全科醫療基座&深度推理
  • Day 3:分身有術
  • Day 4:精準解讀
  • Day 5:好伴AI,觸手可及

Day 1:讓AI擁有無限記憶,事無鉅細地瞭解我們、懂得我們、關心我們

第一天,智診科技透過WiseDiag-Z1讓AI擁有了無限記憶,具體來說,是一種即插即用的記憶力機制。

從腦科學的角度來說,記憶始於神經元之間的訊號傳遞。不過,人類的碳基記憶不是完美的,許多記憶會模糊消失。而研究者希望,能賦予AI一個全新的記憶系統,克服碳基記憶的弊端。

智診AI系統最基礎的特性,就是支援多國語言,尤其支援中文。而這個系統模擬了人類記憶的特性,能夠自動擷取、儲存三種不同的記憶資訊。

具體來說,包括完整對話內容、以天為單位的記憶總結,和事件層級記憶。這樣,在醫療問診的多輪長對話中,它就能方便使用者取得所需資訊。

同時,為了讓大模型不搞錯模糊代指的記憶,研究者特別發展了基於端到端的多輪多路情境查詢能力,從而幫助AI理解複雜的多輪對話。

另外,研究者也發展了一個AI的模糊記憶查詢功能,這就可以透過模糊的內容聯想(時間或地點)來查詢記憶。

例如在下面這個demo中,研究者問:前天和你說的關於買咖啡的事,你還記得不?但這件事其實這件事是昨天聊的,不要緊,系統還是查出來了所需資訊。

或者,我們可以讓AI幫忙回想一下,我有個夢裡有森林和美麗的顏色,那是什麼樣的夢?可以看到,即使使用者記不清細節,好伴AI依然可以根據模糊表述查到精準記憶。

想像一下,為了在醫院看病時,AI醫師分身能事無鉅細地瞭解我們的生活習慣、醫療記錄,像老朋友一樣懂我們,關心我們的身體,這也太令人期待了!

Day 2:全科醫療基座& 深度推理,懂醫還會聊

第二天,全學科醫學基座大模型WiseDiag首次亮相,同時,醫學版o1推理模型也來了。

作為醫學基座大模型,WiseDiag採用了最新一代大模型架構,共有730億參數,具備了強大醫學知識處理能力。

它在超3兆token的專業級優質醫學資料中完成了訓練。

其中包括,大量權威醫學教材、最新臨床指南,以及海量高水平醫學研究論文。

預訓練之後,WiseDiag也用到了SFT督導微調、PPO直接偏好最佳化的訓練方法,以及受邀的臨床專家深度參與訓練過程。

透過精心設計的訓練,新模型不僅掌握了豐富的醫學知識,更具備了類醫師的臨床思維能力,能夠為醫療決策提供專業、可靠的智慧支援。

在專業能力方面,WiseDiag在中文醫學大模型權威基準CMB和Medbench中,分別拿下了98.39和92.9的成績。

尤其是,在CMB上,分數幾乎接近滿分,愈加證明其對醫學知識掌握到位。

在通用能力方面,WiseDiag也在中文基礎模型評估C-Eval和極具挑戰性的大規模多工理解評測MMLU-Pro中,取得了媲美國內外頂尖模型的表現。

WiseDiag在通用和專業基準上優異表現,恰恰印證了智診的初衷——打造一個既懂醫,又會和人溝通的AI助手。

當然,考試測試是一方面,更重要的是它能夠在實際應用場景中,並真正幫助醫生和病人。

深度思考版本Z1

醫學領域,也有其o1版推理模型。

基於WiseDiag,團隊打造的深度思考版本-Z1在這次發表會中,首次亮相。

對於一位經驗豐富的醫生來說,在遇到疑難病例時,他會不斷深入分析,反覆推敲論證,並根據新的發現及時調整思路。

這個過程,如果是被AI實現了呢?

透過採用多層次推理擴展機制,Z1能夠像專家醫師一樣,進行深入細緻的分析思考和反覆權衡,直到找到最優解。

這項突破,讓WiseDiag不再停留在簡單的「尋找規則配方」層面,而是真正具備了專業的臨床思考能力。

在實際應用中,Z1已展現了令人矚目的深度思考能力。

接下來不如看個栗子,打開好伴AI,我們將疑難雜症的一個病例發給它,讓AI幫我們做出診斷。

在經過深思熟慮之後,好伴AI基於所給的資訊,精準地指出了這個病症——龐貝病。

要知道,這是一個全球罕見的遺傳代謝疾病,全球發生率1/30萬。不僅如此,它還是症狀「偽裝者」,若能早期識別對治療影響極大。

但對醫生而言,得出診斷都是一種挑戰。

如果AI能對類似罕見疾病早期預見,將會帶來極大的醫療價值。

可以看到,好伴AI不僅給了最終的診斷,也給了完整鑑別診斷思路。這種診斷模式與臨床醫師的思維高度吻合,能真正協助醫師的日常診療工作。

當然了,AI提供的只是一個高敏預警,承擔的角色是輔助診斷/決策,並不能取代真正的醫生。

若真懷疑是罕見疾病,患者應儘早面診專業醫師,需結合病史、身體檢查、影像學結果、多項實驗室檢查來做綜合判斷。

不論Wisediag,還是Wisediag-Z1,它們都是全學科醫學大模型。

有了這樣強大的基座大模型,我們就能打造出一個專屬的專業級健康專家助理。

Day 3:AI醫學專家分身有術,7x24為你診療

第三天,研究者也帶來了醫學領域的AI智能體-醫學專家分身繫統。

醫少患多,這種不平衡的醫療資源,造成了各大醫院專家每天被上百位病患「圍追堵截」的現況。

特別是,知名專家的號幾乎「一票難求」。

這時,如果每個醫生能夠有一個「分身」,可以7x24小時對全國患者做出回應,對醫生和患者來說都是福音。

這不僅讓更多人能享受優質醫療資源,還能大幅節省就醫成本和時間,讓看病變得更加便捷高效,讓高水準健康醫療資源實現普惠。

對準媽媽來說,最常見的問題是──剖腹產和自然產側切,那一種方式對身體傷害較大?

王權利是浙二醫院產科權威專家,在好伴AI中,就有一個AI版的王權利主任。

接下來,就把這個問題交給這位AI專家,在經過60多秒思考,參考12篇權威資料後,它給出了非常詳實的解讀。

它的回覆專業性強且富有人文關懷,既講清了順產和剖腹產的醫學利弊,又很好地安撫了準媽媽的心理需求。

而且, 為了說明問題,AI也引用了WHO的權威資料,並給予溫馨提示。

王權利專家現場評論道,「它用『內傷』和『外傷』這個比喻很形像地解釋了剖腹產和順產的區別。其中,『出血1000ml的定義』這個細節和我在抖音影片中的描述一致,體現了較強的專業性和實用性」。

他也表示,「這個AI分身已經達到自己80%的功力,未來經過改善,可能會達到90%以上」。

專家AI分身能夠實現,背後的門道是什麼?

那便是,醫學編碼模型Med-Embedding+醫學知識庫+網路搜尋。

在如此專業的領域中,AI能準確理解各種複雜的醫學術語,前提是其向量化,Med-Embedding的效用就在這裡。

每一個醫學文字都可以轉化成一個​​「向量」,就像擁有一個獨特的地理座標。

舉個栗子,病人提出一個問題,「醫生,我最近皮膚發黃,尿色變深,還總是肚子疼,感覺特別沒精神,這是怎麼回事」?

Med-Embedding可以精準將這段描述,轉化為1794維度的「醫學座標」。

普通的編碼模型很難區分「發燒38度三天」和「反覆低熱」的區別,因其座標分佈比較近。但對醫生來說,資訊重點是完全不同的。

Med-Embedding卻能夠捕捉到醫學臨床意義的細微差別,從而精準把這兩個訊息座標隔開,從而區分出它們的醫學關係。

在MedicalQARetrieval等多個醫學回想評測集中,Med-Embedding也拿下了不錯的成績。

王權利主任的AI分身是在WiseDiag基礎上,透過醫學編碼模型,學習了其發表的40+篇論文,以及影片平台上近400個影片後打造的。

就比如,他的個人習慣用語、打比方,甚至是一些碎碎念,AI分身可是學的有模有樣。

它學會了王權利在每日查房時必問的那句話--「昨晚睡夠8小時了嗎」?

此外,AI能有理有據,全憑智診擁有自主可控的醫學網路搜尋、醫學全科知識庫和專家個人化知識庫。

其中,醫學全科知識庫包含40萬多條持續更新的醫學知識;專家個人化知識庫則收錄了每位專家獨特的臨床經驗和專業見解。

未來,這些知識還會持續更新和維護,以確保資訊時效性和準確性。

為了確保可靠性和透明度,在AI回答中列出了詳細參考鏈接,確保資訊可追溯

最值得一提的是,智診也將專家經驗做成了「數位外掛」,融合了頂尖專家的經驗和診療思路。

如演示所示,專家分身不僅保留了好伴AI的優勢,甚至能模擬專家特有的臨床思維模式,提供更精準的建議。

從此刻起,任何一個人打開好伴APP,找到「產科王利權」專家分身,即可獲得──

3秒生成個人化產檢計畫、1分鐘解讀唐篩報告、24小時線上的「懷孕守護者」。

現今,國家正對「分級診療」「網路+醫療」大力扶持,優化醫療資源組態,解決群眾「看病難、看病貴」的問題。

在這樣的背景下,口袋醫生的出現就十分應景了。它緩解了基層醫療機構的壓力,提高了民眾的自我健康管理,也能輔助醫療專業人員。

可以說,它的出現與政策的方向是完全一致的。

Day 4+5:好伴AI精準解讀醫學報告,像醫生一樣給予診斷

第四天和第五天,研究者將上述技術凝練成了觸手可及的產品-「好伴AI」。

第一款專注於全人類健康生活、醫療諮詢的智慧助理軟體,誕生

上面說到,很多時候專家號一票難求,但有了好伴AI這個醫學專業領域的聊天機器人,我們的這些難題就可以迎刃而解一大部分!

這是因為,它能夠讀懂複雜的醫學報告,能夠像醫生一樣給予詳細的分析、診療和判斷。

在首頁,我們可以使用檢測單解讀、身體檢查報告解讀、全科醫學諮詢、專家分身諮詢等核心功能。

或者,直接輸入語音或文字,跟AI健康管家「好小夥伴」發起對話。

我相信很多人都有這樣的經驗:在醫院拿到檢測報告單後一籌莫展,看不懂複雜的醫學用語,也不理解異常的數值或結果。

這時,我們就可以使用好伴AI的檢測單解讀功能。

將血氣報告拍照上傳好伴AI後,它便開始了詳盡的分析,並給出了輔助診斷結果和依據:高度懷疑是DKA,即糖尿病酮症酸中毒,建議患者去做尿酮體檢測和尿常規,需要立即就醫。

可以看到,整個分析過程邏輯縝密,並且明確地對患者強調了緊急性。

這個真實病例的就診檔案中還有兩份檢查單,正是尿液常規和糖尿病酮症的指標;可以證明AI醫師推薦的檢查項目的正確性

另外,我們也可以上傳自己的體檢報告,它會給我們一份專家級的解讀報告。整個體檢報告智慧諮詢功能,非常準確、科學、個人化。

在填寫完一份問卷後,好伴AI就會進行綜合分析,並給予一份「健康諮詢報告」。

首先,是結合了使用者生活習慣和同年齡層人口數據的健康得分,可以反映使用者當前的身體狀況。

然後,它還給出了詳細的健康狀況綜述,指出體檢報告上的異常,給予分析和應對方式。

而報告最核心、最詳細的部分,就是健康風險解讀。包括對異常指標可能原因的分析、對健康的影響、此次檢測的限制、後續處理建議和異常項的精準認知。

值得一提的是,這些都是由WiseDiag模型結合醫學知識庫和網路搜尋得出的。

智診AI的研究者表示,這是自己在國內外見過的最詳細、最看得懂的體檢報告解讀了。

而以下這個專家分身功能,是研究者基於智診醫療大模型,融合多位三甲醫院專家的診療經驗和知識打造出來的。可以說,每位醫生分身,背後都有真實的知名專家。

例如,我們試試這個問題:孩子忽然發燒39度兩天了,身上有紅疹,可能是什麼病?

可以看得到,國內外常見的通用AI,一般只會建議退燒藥,但好伴AI會提示--「警惕川崎病,建議立即就醫並檢查C反應蛋白」。

這完全就是一般家長很難想到的專家級建議!

因為川崎病是小兒發燒合併皮疹、黏膜變化的一種疾病,有「發熱、結膜充血、口唇/舌頭紅、四肢末端改變」等典型臨床表現,需要儘早診治,AI醫師的這個診斷,就顯得非常及時了。

AI醫師做出警示後,家長可以盡快就診,排除其他發燒病因,而不要過度慌亂,或只依賴網路諮詢。

再例如下面這個真實案例:患有癲癇的孕婦,未補充葉酸,正在服用拉莫三嗪,胎兒能要嗎?

產科主任AI分身直接重點:孩子能要!它也乾脆俐落給出行動清單──產檢、補葉酸、停中藥。

同時,它也用「一起努力」給病人穩定情緒,讓醫囑變成了貼心的叮嚀。

值得注意的是,懷孕期間癲癇用藥需謹慎,拉莫三嗪是較常見的安全性相對較高的抗癲癇藥,但具體方案仍需產科和神經內科醫生聯合評估。

目前,AI只是提供了常規指導,對於實際患者來講,還需要個體化與產科大夫溝通,及時做血藥濃度監測、胎兒畸形篩檢等。

或許會有讀者有疑慮:AI醫師究竟靠不靠譜呢?

為此,智診AI請到了十位醫學專家,對包括WiseDiag在內的四個平台提供的服務診斷結果打分,可以看到WiseDiag被公認為TOP 1。

對於體檢報告的解讀,十位專家也給了評分,WiseDiag依然明顯處於領先水準。

曾有報告稱,在國內,80%的優質醫療資源集中在一些主要城市中,而好伴AI的出現,可以讓患者無論身在何處,都能在口袋裡擁有一位健康專家。

同時,每位專家也能同時服務成千上萬位患者。

這,便是醫療普惠的意義。

當然了,AI的角色並非完全取代臨床醫生,而是作為極具前景的輔助決策工具。

因此,它必須在合規框架、倫理與安全性驗證下,才能讓更多病人放心受益。

雖然AI可以「看懂檢測報告」「協助做罕見疾病診斷」,但在實際臨床使用中,醫師通常需要結合病史、身體檢查、影像學結果、多項實驗室檢查來做綜合判斷。

因此,AI系統目前主要的角色是「輔助診斷/輔診決策」,在臨床上應與專業醫師的面診相結合,而並不是完全替代醫生。

智診API開放平台發布,開發者也能用

令人興奮的是,智診API開放平台也同時發布了!

從此,開發者也能參與這場醫療AI革命。

針對不同場景需求,智診打造了3款同系列模型。

WiseDiag-Z1,是標準版的全科醫學通用大語言模型,基於技術底層開發,適用於大多數健康諮詢場景。

在此基礎上,智診也打造了深度推理強化版Z1 Thinking。它能模仿頂尖醫師的思考過程,適合多步驟複雜場景健康諮詢,如針對疑難症的診斷、多階段治療方案的輔助設計等。

而Z1 Lite,是希望更快更經濟得到答案的使用者的最佳選擇。它更具性價比,在維持大部分核心效能的情況下,能幫助一般使用者低成本獲得服務。

此外,智診也提供了幾個高附加價值的特色工具,如智診Med-Embedding(醫學向量化模型),矽基永久記憶資料庫,高性能醫學OCR工具(Med-OCR)等。

為了協助開發者,智診AI為每個新帳號都提供10美元免費額度。

深度思考,重建醫療AI新典範

過去一年,人們都在講應用落地,而醫療AI是大模型落地最佳場景之一。

連更5天發表會,從無限記憶、深度推理模型、到專家分身繫統、口袋助手,再到API開放,智診開啟了AI重塑醫療的全新旅程。

前段時間,世界經濟論壇公佈的報告中,預測了全球有80億AI醫生的願景。

AI已成為醫療產業變革的主要力量,預計2024-2032年將以43%的速度成長,屆時AI醫療市場規模將達到4,910億美元。

另有德勤統計,到2030年,全球醫護人員缺口預計達1,000萬,這個數字意味著醫療不公平現況依舊存在。

在國外,GoogleDeepMind團隊曾特別製作了AI醫療大模型Med-PaLM,拿下92.6%高分水準媲美臨床醫師。

除了Google之外,還有IBM醫療大模型Watson、史丹佛基礎模型研究中心的BioMedLM(PubMedGPT)等等。

反觀國內,有專攻醫療領域百川智能,還有訊飛星火醫療大模型等頭部科技公司,均在此領域有所深耕。

能夠做出醫療領域的「推理模型」,智診還是國內首次。

與傳統大模型相比,深度思考推理模型能夠模擬醫師的臨床思考過程,從症狀診斷到邏輯推導,這正是醫療決策中的關鍵環節。

另一方面,推理模型另一個重要特點便在於其「可解釋性」。

在醫療決策中,理解診療背後的原因至關重要。

一般來說,AI給予建議的推理過程,需要與臨床醫師的邏輯相符。否則,若AI出現幻覺,可能會帶來嚴重的醫療事故。

WiseDiag-Z1能清楚展示診斷的每一步推理過程,不僅有助於醫師驗證AI的判斷,也能幫助病人更能理解自己的病情。

不僅如此,智診AI在上線時,已與多位臨床專家展開合作,並進行了反覆驗證。

同時,它也會不斷自主收集和修正“錯誤case”,逐步迭代,盡最大程度減少誤診漏診的隱患。

而在醫療資料快速累積的今天,具備推理能力的醫療模型,也具備了持續學習和能力演化的潛力。

透過不斷吸收新的醫學研究成果、臨床經驗,它們可以始終站在醫學前沿,為醫生患者提供最新、最準確的診療建議。

隨著醫療資源分佈資源不均問題日益突出,推理模型的價值更加凸顯。

它可以作為基層醫療機構的得力助手,幫助提升診療效率和精準性,讓每個人都能享受高治療醫療服務。

這也是為什麼世界經濟論壇,會提出80億AI醫師的願景。

放眼未來,推理模型必將成為重塑醫療服務的核心力量。下一步,最重要就是讓WiseDiag走向落地。

接下來,智診將會打通產學研究結合的路線,不僅要與醫院、保險機構合作,還要與科研院校共研計畫。

另外,好伴AI將對所有人開放,同時智診API開放平台將交到每一份同行者手中。

讓醫療資源實現真正的普惠化,才是AI醫療最有價值的意義。

可以期待,WiseDiag和好伴AI將贏得大眾和醫療行業人士的認可,智診的技術將點亮全社會。 (新智元)