罕見疾病診斷一直是醫學界的難題。傳統方法存在檢測流程複雜、報告解讀困難等問題,約半數患者因缺乏明確病因治療而受阻。近日,《Nature Genetics》期刊上發布了一項名為「Proteome-wide model for human disease genetics」的研究,哈佛醫學院和巴塞隆納基因組調控中心(CRG)的研究人員開發出一款名為popEVE的AI蛋白質模型。此模型是結合演化資訊和人類群體數據的深度生成模型,能在全蛋白質體範圍內評估變異的有害程度。有望徹底改變遺傳疾病的診斷方式。為驗證模型效能,團隊分析了超過3.1萬個患有嚴重發展障礙的兒童家庭遺傳數據。在98%的病例中,popEVE將共同突變標記為最具破壞性的變異,其表現優於GoogleDeepMind團隊AlphaMissense在內的同類工具。同時,popEVE也發現了123個先前被認為與發育障礙無關的基因,其中104個僅在個別病例中出現。能判斷「嚴重程度」 無需父母數據早在2021年,該團隊就發表了變異效應進化模型EVE,當時該模型就能將人類疾病基因中的突變分類為良性或有害,但其分數無法直接在基因間進行比較,並確定那種對健康影響最為嚴重。而新推出的popEVE在大型語言蛋白質模型實現提升的基礎上,結合了來自英國生物樣本庫內的海量人類數據,實現了AI輔助罕見疾病診斷的全新突破。在測試中,此模型不僅能區分致病變異和良性變異,還能辨識出健康對照組,平均精確度比次優模型(AlphaMissense)提升3.2%。且此模型能僅憑兒童基因組辨識可能的因果變異,無需父母資料。popEVE最大的突破,還是實現了對「嚴重程度」的判斷。popEVE的範例輸出。左側和中間面板顯示了圖表和清單格式的變異分數,從最可能致病的深紫色到最不可能的黃色。右側面板描繪了帶有變體分數的蛋白質晶體結構。圖片來源:Marks實驗室在臨床情況下,一些蛋白的功能受損可能在晚年產生適度影響,而另一些蛋白的破壞在兒童期可能致命。這兩種情況都可以被視為“致病”,但在試圖找出嚴重疾病的遺傳原因時,模型必須能夠區分這兩種情況。力壓DeepMind 不只罕見疾病診斷2023年,開發出AlphaFold的GoogleDeepMind團隊開發了一款名為AlphaMissense的模型,作為AlphaFold的改良衍生工具,實現對錯義突變的致病性預測。該模型以接近89%的準確率一鳴驚人,推開了AI模型輔助診斷遺傳疾病的大門。然而,開發了popEVE的哈佛團隊認為,雖然AlphaMissense在蛋白質穩定性方面準確,但缺乏診斷所需的臨床校準。統計分析顯示,AlphaMissense預測平均每個人會有五種「致病」變異,而popEVE預測不到一種。這種差異在臨床環境中至關重要,因為過度預測可能導致誤診和不必要的焦慮。儘管性能有所提升,popEVE仍是一個研究工具尚未獲得FDA批准作為獨立診斷設備使用,目前已開源且可以透過線上入口網站直接存取使用。線上入口網站:https://pop.evemodel.org/開源連結:https://github.com/debbiemarkslab/popEVE據悉,該模型未來的應用不僅限於診斷,還將擴展到藥物發現,因為該模型能夠精確定位蛋白質結構中的特定致病機制。(智藥局)