全球醫療榜第一,中國AI殺瘋了!醫療AI邁入Harness時代

火爆全網的Harness架構,終於在最難的醫療圈落地了!從單次問診到全天候賽博名醫盯盤,大健康賽道徹底變天。

2026年,AI工程圈最火的一個詞,叫Harness

今年2月,HashiCorp聯創Mitchell Hashimoto在部落格中率先命名了這個概念。

幾天後,OpenAI發佈了一份震動行業的實驗報告:

3名工程師,5個月,0手寫程式碼,純靠Codex Agent生成了100萬行生產級程式碼。

緊接著,Martin Fowler撰寫深度長文,Anthropic發佈長時運行Agent的Harness設計指南。

一夜之間,Harness成了AI工程化最核心的話題。

但當所有討論都集中在程式碼生成和通用場景時,一個更尖銳的問題始終懸而未決:

在醫療這個鏈路最長、風險最高、合規最嚴的行業裡,Harness到底怎麼落?

一家中國公司,給出了自己的答案。

就在最近,智診科技正式發佈了WiseClaw 2.0,一套面向醫療健康行業的Agent OS平台

試用通道:https://s.wisediag.com/dwpl2b1r

底層延續OpenClaw在連接與調度上的能力,上層將Harness的核心理念做成了系統預設值。

它給整個醫療AI行業拋出了一個問題:當Agent開始進入真實業務,平台到底該長什麼樣?

醫療AI走到2026年,真正的門檻在那裡?

過去幾年,醫療AI最被熱議的能力是「回答」。

能解讀體檢報告,能做健康諮詢,能生成初步建議——這些確實讓人眼前一亮。

但當AI真正推到醫療機構、體檢中心、保險公司、健康管理企業和養老服務體系面前時,一組更硬的問題浮出了水面:

  • AI能持續跑多久?上線三個月後還穩不穩?
  • 一條健康建議出了問題,能查到它引用了什麼指南、呼叫了什麼工具、用的是那個版本的知識庫嗎?
  • 關鍵節點的高風險輸出,有人兜底嗎?
  • 使用者的健康管理能跨月、跨年持續發生,還是每次都從頭開始?

這些問題,一個比一個現實。

把視角拉回到具體的業務場景,這件事會更直觀。

一家慢病管理公司需要的,不是一個聊天機器人。他們要的是一套能持續讀取裝置資料、識別指標異常、發起分級提醒、記錄干預軌跡、必要時無縫拉人接管的系統。

光靠幾段漂亮的AI回答,撐不起這種業務。

一家體檢機構面對的,也遠不止報告解讀——把檢前問詢、套餐推薦、檢中提醒、檢後解讀、歷年趨勢對比串成一條服務鏈,讓使用者每年回來時都能感到「這家機構記得我」,這才是真正的服務壁壘。

藥企、特醫食品企業、保險機構、養老平台看重的,也絕非某個單點AI功能。

他們要的是更長的使用者生命周期、更高頻的服務觸點、更穩的轉化效率。

說到底,醫療AI走到今天,門檻已經清清楚楚落在四個地方:

  • 長時程: 服務以月、以年為單位,一輪問答撐不起這類業務;
  • 可追溯: 建議從那來、調了什麼工具、用了那個知識版本,事後都要查得清;
  • 可執行: 光生成文字沒用,必須接裝置、接系統、接流程;
  • 可治理: 權限、脫敏、評測、審批、審計,一個都繞不過去。

Harness走熱,本質上就是這四個門檻在行業裡的集中對應。

當整個行業從「AI有沒有用」轉向「AI能不能長期、穩定、合規地用」,平台型玩家的價值,就開始迅速抬升。

拆解WiseClaw,把Agent放進生產系統

WiseClaw的底層能力,來自OpenClaw與Harness的協同。

一句話概括它們的分工:OpenClaw讓Agent「接得上、調得動、能執行」;Harness讓Agent「跑得穩、管得住、追得回」

這套雙引擎底座讓WiseClaw成為醫療場景所需要的那種平台:可控、可追溯、可長期交付的運行系統。

健康檔案驅動:讓服務擁有「長期記憶」

醫療服務最怕每次都從頭開始。

剛做完體檢,下次再來系統像第一次見面。上周做完慢病隨訪,下周再聊前面的背景全丟。剛記錄過飲食偏好和風險因素,下一輪服務又要重新問一遍。

這種體驗,放在醫療場景裡幾乎是致命的。

WiseClaw把健康檔案作為長期服務的核心基礎。

對檢驗值、體檢資料、用藥史、診斷結論等客觀資訊,系統採用確定性、受控的方式讀寫,保障資訊精準可靠。

對使用者依從性、溝通偏好、生活習慣等服務資訊,系統結構化沉澱,並在後續服務中持續更新。

對平台來說,這是一套長期健康檔案。

對使用者來說,感受到的只有八個字:「系統終於記得我了」。

三層流水線:把醫療風險控制在流程裡

醫療場景很少存在「一步到位」的任務。

硬把所有任務塞給一個Agent,表面看省事,實際上最容易在關鍵節點失控。

WiseClaw將Agent的工作過程拆成三層清晰鏈路:

Triage分診識別,負責識別使用者意圖、服務場景和風險等級;

Clinical臨床執行,在受控的資料、知識和工具範圍內生成候選方案;

Evaluator校驗攔截,通過確定性規則、醫學紅線和業務門禁對輸出進行把關。

關鍵節點還可以隨時插入人工覆核和審批,讓高風險動作始終處在可控範圍內。

這套設計帶來的價值非常現實:企業可以把風險真正收進流程裡,減少對單次模型輸出的依賴,也讓AI上線從「試試看」走向「敢用、可管」。

心跳引擎:從被動問答走向持續運行

醫療和健康管理服務最需要的,恰恰是主動提醒、持續跟進和長期干預。

很多風險要提前發現,很多服務節點要主動觸發,很多管理動作要跨時間持續執行。

只靠使用者主動提問,服務深度很難做出來。

WiseClaw通過「心跳引擎」,讓系統從會話驅動升級為時間、事件和資料共同驅動。

使用者指標異常時系統主動觸發提醒,複查時間臨近時服務流程自動喚醒,慢病指標連續波動時平台發起風險提示,使用者長期未完成健康任務時系統進行干預觸達。

對企業來說,這意味著更低的邊際成本、更長的服務鏈路,以及更穩定的營運抓手。

醫療Agent由此從「等使用者來問」,走向真正持續運行的健康服務系統。

全鏈路可觀測:讓每一次服務都可追溯

在醫療行業,答得像不像專家只是起點。

更關鍵的問題永遠是:這條建議依據什麼給出?引用了那條指南?用了那個版本的知識?有沒有低置信度提示?事後能不能回放?

WiseClaw將對話、工具呼叫、知識引用、版本資訊、流程節點、風險判斷等資訊結構化記錄,形成完整Trace。

企業可以通過運行看板、風險審批、人機協同門禁、審計回放等能力,對Agent的運行過程進行管理。

這個動作看起來像是「多展示一點資訊」,本質上是在補醫療AI最缺的那塊底座:可信。

五個「試金石場景」WiseClaw到底能不能打?

醫療AI能否成立,最終要看它能否在真實場景中產生價值。

值得注意的是,WiseClaw這次重點發力的,是使用者感知更強、服務周期更長、商業空間更大的院外高頻場景——

體檢、健康硬體、慢病營養、家庭醫生、保險養老。

這些場景共同指向一個趨勢:醫療服務正在從低頻、單點、人工驅動,走向持續、主動、智能化營運。

場景一:名醫AI「分身術」

使用者最樸素的需求往往也最難滿足:能不能隨時問?能不能有人持續跟進?能不能得到一個瞭解自己情況的健康建議?

然而,優質醫生資源天然稀缺,線下的單次問診難以實現長效閉環。

WiseClaw支援名醫AI分身和數字家庭醫生,可以把專家診療邏輯、健康檔案、長期記憶和多終端互動結合起來,讓使用者在H5、小程序、App等入口獲得連續的諮詢和隨訪服務,有記憶,有邏輯,有溫度。

在使用者側,我們獲得了一位「隨叫隨到」的專屬醫生。

在機構側,則實現了高品質服務的高效複製,大幅強化了使用者忠誠度。

場景二:讓體檢報告「活」起來

每年體檢後,大量使用者都會遇到同一個問題:報告很厚,指標很多,真正能說清「這意味著什麼、接下來該怎麼做、去年和今年有什麼變化」的服務並不多。

WiseClaw可以把檢前問詢、檢中提醒、檢後解讀、歷年趨勢對比、風險提示串成一條服務鏈,形成全鏈條的健康追蹤。

從此,使用者可以看懂數字背後的意義,獲得明確的行動指引。

而體檢機構的角色由此從報告交付方,轉向持續理解使用者健康變化的服務入口。

業務邏輯就從「賣單次套餐」,轉型為「賣長期關係」,挖掘存量價值。

場景三:智能手環終於有了「讀心術」

智能硬體市場已經「卷」到了盡頭,裝置不缺,缺的是深度分析。

市面上的血壓、血糖、睡眠監測裝置多如牛毛,但大多隻能展示冷冰冰的曲線,使用者看到的仍然只是一串數字、一張曲線圖。

WiseClaw作為多源資料路由器,能將不同裝置的孤立資料編織成完整的「健康上下文」。它結合使用者檔案,將數字轉化為人性化的對話式解讀與異常警示。

對使用者來說,冰冷數字延展為連續解釋和風險提示;對企業來說,拿到的是圍繞裝置持續延展的長周期健康服務關係。

場景四:糖尿病患者的「AI管家」

慢病管理與飲食干預是極其瑣碎的長跑,是使用者每天都能感受到的健康服務,零散的食譜推薦和產品推銷往往效果寥寥。

但現實裡,碎片化建議滿天飛,真正長期、個性化、可信的指導一直稀缺。

WiseClaw把飲食識別、疾病背景、健康檔案、使用者偏好和後續產品服務串成完整鏈路。

這樣,使用者可以獲得與生活習慣深度契合的個性化指導。

企業可以把特醫營養產品和慢病管理服務結合起來,從一次性推薦商品,走向持續干預使用者的日常健康行為。

院外服務一旦進入長期陪伴邏輯,商業模型也會跟著變厚。

場景五:給銀髮家庭裝一個「健康中台」

保險和養老賽道長期面臨一個共性難題:觸點太少,往往只有在續費或出險時才產生聯絡。

尤其在銀髮人群和家庭照護場景裡,需求往往是高頻的——老人需要日常健康提醒、慢病趨勢觀察、用藥和複查提示;子女需要知道老人狀態是否穩定。

WiseClaw可以承接數字家庭醫生、適老化健康陪伴、風險預警和長期健康管理等場景。

一旦跑起來,機構和使用者之間的關係就會徹底不同。

老人和家庭感受到的是更持續、更有溫度的服務;保險和養老機構拿到的,是更長的生命周期和更強的業務黏性。

三重護城河,定義醫療Agent最佳實踐

WiseClaw之所以能走到這一步,背後是智診科技在醫療AI賽道的長期積累。

底層模型:MedBench、HealthBench、DoctorBench三榜領跑

醫療Agent的天花板,首先由底層模型決定。

WiseClaw以智診科技自研的千億級WiseDiag醫療多模態大模型為核心基座,可綜合理解體檢報告、檢驗指標、醫學影像、體徵照片等多源健康資訊,支撐複雜醫療推理與健康管理任務。

在多項權威醫學評測中,WiseDiag表現持續領先,在MedBench和HealthBench位居第一。

最近發佈的全球醫學AI排行榜DoctorBench,WiseDiag-v2榮登榜首,超越Google Gemini和OpenAI GPT-5.4。

這個底座,決定了WiseClaw輸出的醫學深度和專業上限。

中層能力:SKILL模組像樂高一樣拼裝

WiseClaw將體檢報告解讀、慢病隨訪、營養干預、異常指標提醒、健康問答、風險分流、複查提醒等能力沉澱為可裝配、可復用的SKILL模組。

企業可以根據自身業務場景快速組合呼叫,無需從零設計流程或重複開發基礎能力。

同時,這些SKILL可以內建審批、脫敏、證據鏈、醫學紅線和風控策略,讓交付更標準、更可控。

上層治理:Harness讓系統「自帶合規基因」

Harness架構讓WiseClaw具備面向真實業務長期運行的系統能力。四組關鍵詞概括了它的治理能力邊界:

權限管理、資料脫敏、邊界控制、門禁審批,讓企業敢上線;

證據鏈、Trace、回放、審計,讓企業能交代;

健康檔案、狀態管理、心跳引擎,讓企業用得久;

運行監控、風險看板、人機協同,讓企業管得住。

當模型、SKILL和Harness三層能力協同起來,WiseClaw就具備了醫療Agent規模化落地所需的關鍵條件。

從產品到生態

一個平台型產品能走多遠,除了看技術深度,還要看它的產業根基和資源儲備。

目前,智診科技已與全國300+頂級三甲醫院、500+頭部醫療健康企業達成深度合作。

業務場景縱深覆蓋醫療機構、保康養結合、智能硬體、傳統醫藥、金融服務及健康零售等全產業鏈。

憑藉從「院內院外聯動」到「全鏈路AI支撐」,再到「個性化健康管理」的閉環能力,WiseClaw正在真實業務沃土中加速進化,實現規模化交付與生態化擴張。

與此同時,資本市場也給出了明確訊號。

近日,智診科技宣佈完成6500萬元天使輪融資。由杭州千遇智匯、無錫元啟聯合領投,華睿投資、上海珺灝筠、嘉興青於藍新聚能及多位投資方跟投。

這筆資金將主要用於WiseDiag醫療多模態大模型能力提升、WiseClaw醫療Agent OS生態建設、企業級場景解決方案深化,以及好伴AI使用者增長與商業化落地。

從客戶驗證到資本支援,智診科技獲得的不只是資金補充,更是面向醫療AI長期落地的產業協同能力。

對WiseClaw而言,這意味著其平台化能力正在從產品發佈,走向更多醫療大健康場景中的規模化驗證與交付。

輪到系統說話了

未來,模型能力還會繼續提升。

但對醫療行業來說,真正決定AI落地深度的,大機率會越來越集中在另一側:

誰能讓AI穩定運行,誰能把風險邊界收緊,誰能把呼叫軌跡留下來,誰能把服務真正跑進業務鏈路。

Harness走熱,表面上是一個概念升溫,本質上是行業把標準抬高了。

從這個意義上看,WiseClaw提供的已經超出了一組產品能力的範圍,它更像是一個正在成形的行業樣本。

它給整個醫療健康產業拋出的,是一個很具體的問題:當Agent開始進入真實場景,平台到底該長什麼樣?

WiseClaw,正在把這個答案一點一點寫出來。

未來,智診科技將依託WiseClaw平台,繼續攜手藥械企業、險企、體檢機構、智能硬體、公衛體系與營養健康品牌等大健康生態夥伴,把Agent OS做成泛健康行業的「新型生產基礎設施」。 (新智元)