全球醫療榜第一，中國AI殺瘋了！醫療AI邁入Harness時代

2026/05/07

•

火爆全網的Harness架構，終於在最難的醫療圈落地了！從單次問診到全天候賽博名醫盯盤，大健康賽道徹底變天。

2026年，AI工程圈最火的一個詞，叫Harness。

今年2月，HashiCorp聯創Mitchell Hashimoto在部落格中率先命名了這個概念。

幾天後，OpenAI發佈了一份震動行業的實驗報告：

3名工程師，5個月，0手寫程式碼，純靠Codex Agent生成了100萬行生產級程式碼。

緊接著，Martin Fowler撰寫深度長文，Anthropic發佈長時運行Agent的Harness設計指南。

一夜之間，Harness成了AI工程化最核心的話題。

但當所有討論都集中在程式碼生成和通用場景時，一個更尖銳的問題始終懸而未決：

在醫療這個鏈路最長、風險最高、合規最嚴的行業裡，Harness到底怎麼落？

一家中國公司，給出了自己的答案。

就在最近，智診科技正式發佈了WiseClaw 2.0，一套面向醫療健康行業的Agent OS平台。

底層延續OpenClaw在連接與調度上的能力，上層將Harness的核心理念做成了系統預設值。

它給整個醫療AI行業拋出了一個問題：當Agent開始進入真實業務，平台到底該長什麼樣？

醫療AI走到2026年，真正的門檻在那裡？

過去幾年，醫療AI最被熱議的能力是「回答」。

能解讀體檢報告，能做健康諮詢，能生成初步建議——這些確實讓人眼前一亮。

但當AI真正推到醫療機構、體檢中心、保險公司、健康管理企業和養老服務體系面前時，一組更硬的問題浮出了水面：

AI能持續跑多久？上線三個月後還穩不穩？
一條健康建議出了問題，能查到它引用了什麼指南、呼叫了什麼工具、用的是那個版本的知識庫嗎？
關鍵節點的高風險輸出，有人兜底嗎？
使用者的健康管理能跨月、跨年持續發生，還是每次都從頭開始？

這些問題，一個比一個現實。

把視角拉回到具體的業務場景，這件事會更直觀。

一家慢病管理公司需要的，不是一個聊天機器人。他們要的是一套能持續讀取裝置資料、識別指標異常、發起分級提醒、記錄干預軌跡、必要時無縫拉人接管的系統。

光靠幾段漂亮的AI回答，撐不起這種業務。

一家體檢機構面對的，也遠不止報告解讀——把檢前問詢、套餐推薦、檢中提醒、檢後解讀、歷年趨勢對比串成一條服務鏈，讓使用者每年回來時都能感到「這家機構記得我」，這才是真正的服務壁壘。

藥企、特醫食品企業、保險機構、養老平台看重的，也絕非某個單點AI功能。

他們要的是更長的使用者生命周期、更高頻的服務觸點、更穩的轉化效率。

說到底，醫療AI走到今天，門檻已經清清楚楚落在四個地方：

長時程：服務以月、以年為單位，一輪問答撐不起這類業務；
可追溯：建議從那來、調了什麼工具、用了那個知識版本，事後都要查得清；
可執行：光生成文字沒用，必須接裝置、接系統、接流程；
可治理：權限、脫敏、評測、審批、審計，一個都繞不過去。

Harness走熱，本質上就是這四個門檻在行業裡的集中對應。

當整個行業從「AI有沒有用」轉向「AI能不能長期、穩定、合規地用」，平台型玩家的價值，就開始迅速抬升。

拆解WiseClaw，把Agent放進生產系統

WiseClaw的底層能力，來自OpenClaw與Harness的協同。

一句話概括它們的分工：OpenClaw讓Agent「接得上、調得動、能執行」；Harness讓Agent「跑得穩、管得住、追得回」。

這套雙引擎底座讓WiseClaw成為醫療場景所需要的那種平台：可控、可追溯、可長期交付的運行系統。

健康檔案驅動：讓服務擁有「長期記憶」

醫療服務最怕每次都從頭開始。

剛做完體檢，下次再來系統像第一次見面。上周做完慢病隨訪，下周再聊前面的背景全丟。剛記錄過飲食偏好和風險因素，下一輪服務又要重新問一遍。

這種體驗，放在醫療場景裡幾乎是致命的。

WiseClaw把健康檔案作為長期服務的核心基礎。

對檢驗值、體檢資料、用藥史、診斷結論等客觀資訊，系統採用確定性、受控的方式讀寫，保障資訊精準可靠。

對使用者依從性、溝通偏好、生活習慣等服務資訊，系統結構化沉澱，並在後續服務中持續更新。

對平台來說，這是一套長期健康檔案。

對使用者來說，感受到的只有八個字：「系統終於記得我了」。

三層流水線：把醫療風險控制在流程裡

醫療場景很少存在「一步到位」的任務。

硬把所有任務塞給一個Agent，表面看省事，實際上最容易在關鍵節點失控。

WiseClaw將Agent的工作過程拆成三層清晰鏈路：

Triage分診識別，負責識別使用者意圖、服務場景和風險等級；

Clinical臨床執行，在受控的資料、知識和工具範圍內生成候選方案；

Evaluator校驗攔截，通過確定性規則、醫學紅線和業務門禁對輸出進行把關。

關鍵節點還可以隨時插入人工覆核和審批，讓高風險動作始終處在可控範圍內。

這套設計帶來的價值非常現實：企業可以把風險真正收進流程裡，減少對單次模型輸出的依賴，也讓AI上線從「試試看」走向「敢用、可管」。

心跳引擎：從被動問答走向持續運行

醫療和健康管理服務最需要的，恰恰是主動提醒、持續跟進和長期干預。

很多風險要提前發現，很多服務節點要主動觸發，很多管理動作要跨時間持續執行。

只靠使用者主動提問，服務深度很難做出來。

WiseClaw通過「心跳引擎」，讓系統從會話驅動升級為時間、事件和資料共同驅動。

使用者指標異常時系統主動觸發提醒，複查時間臨近時服務流程自動喚醒，慢病指標連續波動時平台發起風險提示，使用者長期未完成健康任務時系統進行干預觸達。

對企業來說，這意味著更低的邊際成本、更長的服務鏈路，以及更穩定的營運抓手。

醫療Agent由此從「等使用者來問」，走向真正持續運行的健康服務系統。

全鏈路可觀測：讓每一次服務都可追溯

在醫療行業，答得像不像專家只是起點。

更關鍵的問題永遠是：這條建議依據什麼給出？引用了那條指南？用了那個版本的知識？有沒有低置信度提示？事後能不能回放？

WiseClaw將對話、工具呼叫、知識引用、版本資訊、流程節點、風險判斷等資訊結構化記錄，形成完整Trace。

企業可以通過運行看板、風險審批、人機協同門禁、審計回放等能力，對Agent的運行過程進行管理。

這個動作看起來像是「多展示一點資訊」，本質上是在補醫療AI最缺的那塊底座：可信。

五個「試金石場景」WiseClaw到底能不能打？

醫療AI能否成立，最終要看它能否在真實場景中產生價值。

值得注意的是，WiseClaw這次重點發力的，是使用者感知更強、服務周期更長、商業空間更大的院外高頻場景——

體檢、健康硬體、慢病營養、家庭醫生、保險養老。

這些場景共同指向一個趨勢：醫療服務正在從低頻、單點、人工驅動，走向持續、主動、智能化營運。

場景一：名醫AI「分身術」

使用者最樸素的需求往往也最難滿足：能不能隨時問？能不能有人持續跟進？能不能得到一個瞭解自己情況的健康建議？

然而，優質醫生資源天然稀缺，線下的單次問診難以實現長效閉環。

WiseClaw支援名醫AI分身和數字家庭醫生，可以把專家診療邏輯、健康檔案、長期記憶和多終端互動結合起來，讓使用者在H5、小程序、App等入口獲得連續的諮詢和隨訪服務，有記憶，有邏輯，有溫度。

在使用者側，我們獲得了一位「隨叫隨到」的專屬醫生。

在機構側，則實現了高品質服務的高效複製，大幅強化了使用者忠誠度。

場景二：讓體檢報告「活」起來

每年體檢後，大量使用者都會遇到同一個問題：報告很厚，指標很多，真正能說清「這意味著什麼、接下來該怎麼做、去年和今年有什麼變化」的服務並不多。

WiseClaw可以把檢前問詢、檢中提醒、檢後解讀、歷年趨勢對比、風險提示串成一條服務鏈，形成全鏈條的健康追蹤。

從此，使用者可以看懂數字背後的意義，獲得明確的行動指引。

而體檢機構的角色由此從報告交付方，轉向持續理解使用者健康變化的服務入口。

業務邏輯就從「賣單次套餐」，轉型為「賣長期關係」，挖掘存量價值。

場景三：智能手環終於有了「讀心術」

智能硬體市場已經「卷」到了盡頭，裝置不缺，缺的是深度分析。

市面上的血壓、血糖、睡眠監測裝置多如牛毛，但大多隻能展示冷冰冰的曲線，使用者看到的仍然只是一串數字、一張曲線圖。

WiseClaw作為多源資料路由器，能將不同裝置的孤立資料編織成完整的「健康上下文」。它結合使用者檔案，將數字轉化為人性化的對話式解讀與異常警示。

對使用者來說，冰冷數字延展為連續解釋和風險提示；對企業來說，拿到的是圍繞裝置持續延展的長周期健康服務關係。

場景四：糖尿病患者的「AI管家」

慢病管理與飲食干預是極其瑣碎的長跑，是使用者每天都能感受到的健康服務，零散的食譜推薦和產品推銷往往效果寥寥。

但現實裡，碎片化建議滿天飛，真正長期、個性化、可信的指導一直稀缺。

WiseClaw把飲食識別、疾病背景、健康檔案、使用者偏好和後續產品服務串成完整鏈路。

這樣，使用者可以獲得與生活習慣深度契合的個性化指導。

企業可以把特醫營養產品和慢病管理服務結合起來，從一次性推薦商品，走向持續干預使用者的日常健康行為。

院外服務一旦進入長期陪伴邏輯，商業模型也會跟著變厚。

場景五：給銀髮家庭裝一個「健康中台」

保險和養老賽道長期面臨一個共性難題：觸點太少，往往只有在續費或出險時才產生聯絡。

尤其在銀髮人群和家庭照護場景裡，需求往往是高頻的——老人需要日常健康提醒、慢病趨勢觀察、用藥和複查提示；子女需要知道老人狀態是否穩定。

WiseClaw可以承接數字家庭醫生、適老化健康陪伴、風險預警和長期健康管理等場景。

一旦跑起來，機構和使用者之間的關係就會徹底不同。

老人和家庭感受到的是更持續、更有溫度的服務；保險和養老機構拿到的，是更長的生命周期和更強的業務黏性。

三重護城河，定義醫療Agent最佳實踐

WiseClaw之所以能走到這一步，背後是智診科技在醫療AI賽道的長期積累。

底層模型：MedBench、HealthBench、DoctorBench三榜領跑

醫療Agent的天花板，首先由底層模型決定。

WiseClaw以智診科技自研的千億級WiseDiag醫療多模態大模型為核心基座，可綜合理解體檢報告、檢驗指標、醫學影像、體徵照片等多源健康資訊，支撐複雜醫療推理與健康管理任務。

在多項權威醫學評測中，WiseDiag表現持續領先，在MedBench和HealthBench位居第一。

最近發佈的全球醫學AI排行榜DoctorBench，WiseDiag-v2榮登榜首，超越Google Gemini和OpenAI GPT-5.4。

這個底座，決定了WiseClaw輸出的醫學深度和專業上限。

中層能力：SKILL模組像樂高一樣拼裝

WiseClaw將體檢報告解讀、慢病隨訪、營養干預、異常指標提醒、健康問答、風險分流、複查提醒等能力沉澱為可裝配、可復用的SKILL模組。

企業可以根據自身業務場景快速組合呼叫，無需從零設計流程或重複開發基礎能力。

同時，這些SKILL可以內建審批、脫敏、證據鏈、醫學紅線和風控策略，讓交付更標準、更可控。

上層治理：Harness讓系統「自帶合規基因」

Harness架構讓WiseClaw具備面向真實業務長期運行的系統能力。四組關鍵詞概括了它的治理能力邊界：

權限管理、資料脫敏、邊界控制、門禁審批，讓企業敢上線；

證據鏈、Trace、回放、審計，讓企業能交代；

健康檔案、狀態管理、心跳引擎，讓企業用得久；

運行監控、風險看板、人機協同，讓企業管得住。

當模型、SKILL和Harness三層能力協同起來，WiseClaw就具備了醫療Agent規模化落地所需的關鍵條件。

從產品到生態

一個平台型產品能走多遠，除了看技術深度，還要看它的產業根基和資源儲備。

目前，智診科技已與全國300+頂級三甲醫院、500+頭部醫療健康企業達成深度合作。

業務場景縱深覆蓋醫療機構、保康養結合、智能硬體、傳統醫藥、金融服務及健康零售等全產業鏈。

憑藉從「院內院外聯動」到「全鏈路AI支撐」，再到「個性化健康管理」的閉環能力，WiseClaw正在真實業務沃土中加速進化，實現規模化交付與生態化擴張。

與此同時，資本市場也給出了明確訊號。

近日，智診科技宣佈完成6500萬元天使輪融資。由杭州千遇智匯、無錫元啟聯合領投，華睿投資、上海珺灝筠、嘉興青於藍新聚能及多位投資方跟投。

這筆資金將主要用於WiseDiag醫療多模態大模型能力提升、WiseClaw醫療Agent OS生態建設、企業級場景解決方案深化，以及好伴AI使用者增長與商業化落地。

從客戶驗證到資本支援，智診科技獲得的不只是資金補充，更是面向醫療AI長期落地的產業協同能力。

對WiseClaw而言，這意味著其平台化能力正在從產品發佈，走向更多醫療大健康場景中的規模化驗證與交付。

輪到系統說話了

未來，模型能力還會繼續提升。

但對醫療行業來說，真正決定AI落地深度的，大機率會越來越集中在另一側：

誰能讓AI穩定運行，誰能把風險邊界收緊，誰能把呼叫軌跡留下來，誰能把服務真正跑進業務鏈路。

Harness走熱，表面上是一個概念升溫，本質上是行業把標準抬高了。

從這個意義上看，WiseClaw提供的已經超出了一組產品能力的範圍，它更像是一個正在成形的行業樣本。

它給整個醫療健康產業拋出的，是一個很具體的問題：當Agent開始進入真實場景，平台到底該長什麼樣？

WiseClaw，正在把這個答案一點一點寫出來。

未來，智診科技將依託WiseClaw平台，繼續攜手藥械企業、險企、體檢機構、智能硬體、公衛體系與營養健康品牌等大健康生態夥伴，把Agent OS做成泛健康行業的「新型生產基礎設施」。 (新智元)

科技