完全由AI研發的藥物馬上將要上市了?!
由AI製藥公司Insilico Medicine開發的治療肺部纖維化的藥物TNIK已進入第二期臨床試驗。
研究團隊的在Nature子刊上發表了最新的研究成果。
論文地址:https://www.nature.com/articles/s41587-024-02143-0#Sec14
論文介紹了名為INS018_055的藥物研發的整個歷程。這是Insilico Medicine的利用他們開發的AI平台PHARMA.AI發現的一種候選藥物,用於應對一種罕見,但是能夠引發肺部纖維化,致死率很高的疾病。
這個研發過程開創了生成式人工智慧在藥物發現領域的先例。
該藥物是世界首個利用生物AI發現標靶並確定優先次序,同時利用化學AI生成分子的藥物。
而發現這種藥物的平台Pharma.AI,包含了多個數百萬個資料樣本上訓練出來的多個AI模型,用於完成一系列任務。
其中一個PandaOmics 可以快速識別對疾病療效起重要作用的靶點,並確定其優先順序。
另一個工具是Chemistry42引擎,它利用深度學習技術,可以快速設計出針對PandaOmics所識別的蛋白質的新的潛在藥物化合物。
傳統的藥物開發通常是一條「非常漫長但也非常危險的道路」,需要數十年的臨床前細胞、組織、動物模型和人體臨床試驗,耗資數十億美元,失敗率超過90%。
根據Insilico估算,如果採用傳統的藥物發現方法,和INS018_055相似的新藥需要花費4億多美元,時間可能長達6年。
但利用生成式AI,該公司僅用兩年半的時間就完成了臨床試驗的第一階段,而成本僅為原來的1/3。
AI藥物平台開發新藥,效率提升3倍
特發性肺纖維化(IPF)是一種侵襲性間質性肺病,死亡率高。
而目前和IPF的潛在藥物標靶未能轉化為臨床層面的有效療法。
研究人員採用預測性人工智慧(AI)方法,將TRAF2-與NCK相互作用激酶(TNIK)確定為抗纖維化標靶。
再進一步利用人工智慧驅動的方法,產生了一種小分子TNIK抑制劑INS018_055,它透過口服、吸入或局部給藥,在體內不同器官中表現出理想的類藥物特性和抗纖維化活性。
而INS018_055除具有抗纖維化特性外,還具有抗發炎作用,已在多項體內研究中得到驗證。
一項隨機、雙盲、安慰劑對照的I 期臨床試驗(NCT05154240)驗證了INS018_055的安全性、耐受性和藥物動力學,78名健康人參加了該試驗。
在中國進行的另一項I 期臨床試驗(CTR20221542)也證明了該藥物具有可比較的安全性和藥物動力學特徵。
從目標發現到臨床前候選藥物提名,整個流程在大約18個月內完成,展示了生成式人工智慧驅動藥物發現的能力。
治療標靶的確定是包括纖維化在內的所有疾病的藥物研發過程中至關重要的一步。在藥物開發的早期階段選擇錯誤的標靶可能會導致藥物發現項目成本高昂,並且往往在多年後的二期試驗中以失敗告終。
因此,大型製藥公司可能會表現出規避風險的態度,從而降低對有潛在價值的標靶和治療策略進行投資的意願。
儘管開發精確的數據驅動藥物標靶發現方法對臨床試驗的成功有著至關重要的影響,但這項任務仍存在公認的局限性,例如數據複雜性和批量效應。
最近,人工智慧驅動的方法已在胚胎-胎兒轉化7 和肌肉老化方面證明了發現候選標靶的有效性。
應用於多組學資料的高階通路分析和人工智慧演算法即使在先前證據稀少的情況下也能發現標靶和生物標記。
IPF是一種逐漸進展且通常致死的疾病,組織學特徵為纖維母細胞增生和大量細胞外基質沉積。
IPF 最常見於60歲以上的患者,據報道,其在美國的估計發生率為每10萬人年6.8例。
由於發病率不斷上升,治療IPF患者的費用對醫療系統造成了沉重負擔,並成為全球日益嚴重的公共衛生問題。
在未經治療的患者中,IPF 的臨床病程極不穩定,中位存活期為2到3年。
研發流程
研究人員的人工智慧生成平台發現TNIK抑制是一種有效的抗纖維化策略,並協助開發了一種高度特異性的TNIK抑制劑INS018_055。
在這裡,使用PandaOmics 這一商用靶點發現平台,利用包括生成預訓練轉換器在內的多種人工智慧引擎,進行纖維化的靶點識別。
研究人員將從IPF 患者組織樣本中提取的多組學資料集清單作為計算管道的基礎(圖1a,步驟1)。
這個流程結合了幾種不同但互補的計算方法,所有方法的輸出結果(按最有希望的靶點排序的基因列表)都相似,但輸入資料不同。
除多組學資料集外,研究人員還採用了依賴生物網路分析和科學文獻文本資料的方法(圖1a,步驟2),並對節點度偏差進行了控制。
這些資料類型有助於將從omics中推斷出的目標假設與先前的證據(包括臨床試驗、出版物和撥款申請)結合。
文字資料具有時間性,使PandaOmics 不僅能捕捉趨勢,甚至還能預測未來(圖1a,步驟3)。
與Open Targets43 或NewDrugTargets44 等其他標靶發現方法不同,研究人員的方法是為搜尋多種疾病和老化的標靶而設計並經過驗證的。
因此,研究人員開發了一種時間機器方法,利用某個時間點之前發布的資料訓練計算模型,並透過模型預測該時間點之後製藥業關注的目標的能力來驗證模型輸出結果。
研究人員應用了幾種不同的人工智慧驅動的標靶發現概念,包括異質圖上的隨機漫步和負矩陣因式分解(補充影片1)。
研究人員的平台在綜合應用分數構成和過濾器(包括蛋白質家族等疾病診斷特性、小分子或治療性抗體的可及性、新穎性和晶體結構可用性等)後產生了一份目標排序清單。
為了產生纖維化的目標假設,研究人員對纖維化相關數據集採用了「蛋白質和受體激酶」方案。
它包括反映疾病機製網絡成分的分數,以及基於轉錄因子富集的因果推論(補充資料1)。在下游處理步驟中啟用了蛋白質類別(僅限蛋白質和受體激酶)、新穎性和小分子藥物篩選器(圖1a,步驟4)。
使用「蛋白和受體激酶」方法,TNIK被確定為五大候選靶點中的第一位,其網絡鄰域、因果推斷、通路、相互作用組群落、表達、異質圖步行和矩陣因式分解得分值相對較高(圖1a,步驟5,圖1b)。
TNIK 與纖維化驅動路徑相關,包括WNT45,46、TGF-β46,47、Hippo(是相關蛋白(YAP)-具有PDZ 結合基調(TAZ)的轉錄輔激活因子)、JNK和核因子(NF)- κB訊號轉導。
不過,TNIK尚未作為IPF的治療標靶進行研究,因此被人工智慧演算法選中。
雖然酪胺酸激酶抑制劑如寧替尼、伊馬替尼和尼洛替尼已在IPF 中進行了測試,但絲胺酸-蘇胺酸激酶(如TNIK)在IPF中的作用在很大程度上仍未探討(圖1c)。
由於纖維化可影響任何器官,並且是工業化國家高達45% 的死亡原因51,研究人員假設抑制TNIK 可為多種可能與纖維化有關的病理提供治療益處。
與此假設一致的是,TNIK 被獨立預測為與多種衰老特徵相關的疾病靶點15,並且是衰老和/或高脂飲食餵養小鼠的脂質代謝調節劑52。這些發現支持了研究人員人工智慧驅動管道的假設。
接下來,研究人員對PandaOmics 分數進行了透明度分析。
交互組群落透明度顯示,TNIK抑制與多個已知對纖維化進展很重要的生物過程有關,如局部黏附訊號傳導、肌成纖維細胞分化和間質細胞遷移(擴展資料圖2a)。
因果推理透明度顯示,TNIK 與TGFB1、FGR、FLT1、KDR 等IPF 相關基因密切相關(下圖2b)。
最後,利用人工智慧驅動的新通路重建工具,研究人員發現TNIK 活化了先前描述的與IPF 相關的通路。這些基因集受到下游轉錄因子的調控,包括TCF-LEF、SMAD、NF-κB 和TEAD 家族(下圖2c)。
研究人員合成了這種化合物,並在多種鼠類和大鼠纖維化模型中證明了它的選擇性抗纖維化活性。
研究人員報告的I期臨床試驗數據強調了研究人員的小分子抑制劑的安全性和耐受性。從目標發現到臨床前候選化合物提名,這項綜合方法在大約18個月的時間內完成,展示了研究人員的生成式人工智慧驅動藥物發現管道的能力。
為了鑑定TNIK抑制劑,研究人員利用了現有的TNIK激酶結構域晶體結構56 和Chemistry42 基於結構的藥物設計AI 工作流程(圖1a,步驟6)。
由於使用ATP競爭者是標靶激酶的成熟策略,研究人員選擇ATP 結合位點作為化合物生成的口袋。
人工智慧驅動的平台被配置為產生能與TNIK 鉸鏈區的Cys108-NH 形成氫鍵的小分子結構。
除了活性位點外,瞄準保留較少的鄰近異生口袋(如靠近守門殘基的疏水後腔)也能使先導化合物獲得更好的選擇性。
因此,研究人員採用了一個額外的疏水藥理點,優先考慮具有疏水功能的結構,以深入佔據由Met105、Leu73、Leu103、Ala52 和Val104 形成的後腔。
根據合成的易得性、新穎性和藥物化學特性篩選出的化合物被合成出來,並使用放射性酶測定法進行測試(圖1a,步驟7)。
第一輪篩選發現了一系列具有納摩爾級結合親和力的TNIK抑制劑。
然而,主要先導化合物的體外吸收、分佈、代謝和排泄分析表明,它們在人類和小鼠肝臟微粒體中的清除率很高,細胞色素p450(CYP)抑製作用的半最大抑制濃度(IC50)小於10 µM,動力學溶解度小於2 µM。
先導物優化階段優先考慮改善這類化合物的吸收、分佈、代謝和排泄情況,最終產生了INS018_055(WO2022179528A1)。
INS018_055 的羧基氧與鉸鏈區內的Cys108-NH 形成氫橋(圖2a)。
醯胺NH與近端咪唑中的氮之間的氫鍵作用穩定了平面構象。
此外,此咪唑的NH可以與守門員Met105的側鏈形成氫鍵,因為NH與硫之間的距離約為3.2 Å,適合形成氫鍵。
第二個咪唑將對氟苯基投射到後袋,將異丙基投射到Asn158 和Gln157。對氟苯基不僅被適當地容納在後腔中,而且還與Met105 的CSC 共面(從S 到環的最近C 的距離為3.8 Å)。
先前已報導了兩種早期TNIK 抑制劑NCB-0846 和4-甲氧基-3-(2-(3-甲氧基-4-嗎啉基苯基氨基)吡啶-4-基)苯腈(化合物9)與目標複合物的X 射線結構。
這些化合物與ATP 結合位點結合,並透過兩個氫鍵與鉸鏈區Cys108 的骨架相互作用(圖2a,b)。晶體結構顯示,守門員Met105 的側鏈覆蓋了後袋入口,因此這些化合物不包含能夠轉移該殘基的功能。
與NCB-0846不同的是,化合物9的氰基透過靠近空腔的水分子與Phe172 的骨架相互作用,並與Met105 接觸。
相較之下,INS018_055 被預測會深入佔據後袋,在已知的TNIK 抑制劑中形成一種獨特的相互作用。為了評估INS018_055 的結合親和力,研究人員進行了表面等離子共振試驗。與其他兩種已知的TNIK 抑制劑相比,INS018_055 顯示出了強大的親和力(Kd 值為4.32 nM)。
接下來,研究人員使用KinaseProfiler面板來評估μM INS018_055的激酶選擇性。
蛋白激酶(不包括ATM 和DNA-PK)的活性以輻射測量的形式進行評估,而脂質激酶以及ATM、DNA-PK 和ATR-ATRIP(共濟失調毛細血管擴張症突變和Rad3 相關;ATR-互作蛋白)則以均勻時間分辨螢光法進行評估。
隨後,進一步評估了42個熱門激酶,以確定INS018_055的IC50。
研究人員的劑量依賴性研究顯示,TNIK是受抑製作用最強的靶點,其IC50為31nM。
值得注意的是,大多數在納摩爾(<1 μM)濃度的INS018_055中達到IC50的激酶已被報告用於調節纖維化驅動過程,如ALK4、TGFBR1和DDR1。
這些結果表明,研究人員的先導化合物在納摩爾濃度下對抑制TNIK具有選擇性,並對靶向纖維化相關激酶具有更廣泛的親和力。
一項已發表的使用50個激酶面板對NCB-0846進行的選擇性檢測顯示,有8個激酶的IC50 小於100 nM56。
INS018_055 可抑制其中6種激酶,其IC50值大大高於此濃度。
雖然很難直接比較不同研究得出的數據(儘管兩種檢測方法都使用ATP 濃度的Km值),但這些觀察結果表明INS018_055具有更高的選擇性(至少在已報導的激酶中是如此),這與其不同的結合模式(尤其是佔據TNIK 後袋)有關。
研究人員在健康參與者中進行了0期單微劑量研究(ACTRN12621001541897),以評估INS018_055的藥物動力學(PK),結果顯示靜脈注射100微克的耐受性良好。
隨後,研究人員啟動了一項隨機、雙盲、安慰劑對照的I 期臨床試驗(NCT05154240),在78 名健康志願者中評估INS018_055 的安全性和耐受性(首要目標)以及PK(次要目標)。
試驗的A部分是單次遞增劑量給藥(SAD)研究,40 名參與者按3:1 的比例隨機分配,在第1 天按順序劑量(10、30、60、90、120 毫克)接受INS018_055或安慰劑。
為了在飲食影響的背景下評估安全性和耐受性,在接受90 毫克治療的組群中,重複了標準高脂餐的安全性和PK評估。
B部分是多劑量遞增給藥(MAD)研究,24位健康參與者以3:1的比例隨機分配,每天依序劑量(30、60、120毫克)服用INS015_055或安慰劑,連續服用7天。
在SAD試驗中,空腹個體的INS018_055血漿濃度隨時間的變化曲線顯示,在快速吸收階段,INS018_055濃度達到峰值,達到最大濃度所需的中位數時間(Tmax)值為服藥後1.00至1.53h,隨後以多相方式下降,幾何平均消除半衰期(t1/2)值為7.42至9.74h。
在所有劑量中,INS018_055的水平直到72小時的最後一個採樣點仍可檢測到,但接受30毫克劑量的組群除外,而INS018_055在服藥後48小時仍可檢測到。
整體而言,INS018_055的幾何平均峰值(Cmax)和總暴露量(曲線下面積(AUC)0-t)以及跨時間的總暴露量(從零到無窮大的AUC(AUC0-inf))隨劑量成比例增加(補充資料9),但90毫克劑量的Cmax除外,與60毫克劑量的Cmax相似。
與空腹情況(中位數Tmax為1.01小時)相比,服用90毫克的組群中,進食情況下INS018_055的血漿吸收率較低(中位數Tmax為3.00小時)。
在進食條件下,總幾何Cmax和平均AUC值(Cmax 為169 奈克/毫升-1,AUC0-t 和AUC0-inf為1390和1400小時×奈克/毫升-1)低於空腹條件下(Cmax為270奈克/毫升-1,AUC0-t和AUC0-inf為1620和1630小時×奈克/毫升-1)。(新智元)
參考資料:
https://www.nature.com/articles/s41587-024-02143-0#Sec14