隨著ChatGPT和Gemini等語言模型在矽谷開創了人工智慧的新時代,世界上最強大的科技公司正將目光投向藥物發現和數位生物學。
今年1月,在舊金山舉行的摩根大通醫療保健大會(今年最大的醫療科技盛會)上,輝達公司首席執行官黃仁勳(Jensen Huang)掃視了一下台下的觀眾,承認自己正身處不熟悉的領地。
「你們不是我最常見的聽眾。」在與藥物研發公司Recursion(輝達去年向這家公司投資了5000萬美元)的爐邊談話中,他對一屋子的健康和生物技術專家說。
的確,這些觀眾可能不是他的核心受眾,但他希望這種情況會有所改變。在演講中,黃仁勳一遍又一遍地將數位生物學吹捧為科技領域的「下一個驚人革命」。隨著人工智慧熱潮席捲矽谷,輝達的業務規模已超過每年600億美元,並在去年夏天成為為數不多的市值達萬億美元的公司之一。現在,它在健康和生物技術領域看到了更多推動成長的機會。
輝達醫療保健副總裁金伯利•鮑威爾(Kimberly Powell)在接受《福布斯》採訪時表示:「我們已經被宣佈為輝達下一個數十億美元的業務。」她說,公司的目標是為更多的生物科技公司提供晶片、雲端基礎設施和其他工具。
當生物科技迎來人工智慧革命
現在,像OpenAI的ChatGPT和谷歌DeepMind的Gemini這樣的大型語言模型已經成為生成式人工智慧的主流,一些世界上最強大的科技公司正把生物技術視為人工智慧的下一個前沿——在這個在前沿,人工智慧不會根據提示生成有趣的詩歌,而產生下一個拯救生命的藥物。
憑藉其強大的GPU晶片,輝達可以說是人工智慧革命的中堅力量,但該公司創投部門過去兩年的大部分投資都在藥物研發上。在DeepMind,Google人工智慧實驗室的AlphaFold模型(預測蛋白質結構的突破性工具)在過去一年裡被學術研究人員用於開發一種「分子」注射器,可以將藥物直接注射到細胞中,並用於研究對農藥依賴程度較低的作物。整個科技產業都對生物技術感興趣:微軟(Microsoft)、亞馬遜(Amazon),甚至Salesforce都有蛋白質設計專案。
雖然在藥物發現中使用人工智慧並不是一個新趨勢——DeepMind在2018年就首次推出AlphaFold——但DeepMind和輝達的高層都告訴《富比士》,這是一個突破性的時刻,這要歸功於三件事的共同作用:現在可用的大量訓練資料、運算資源的爆炸性成長和人工智慧演算法的進步。鮑威爾說:“這三種要素是第一次同時出現。這在五年前是不可能的。”
人工智慧之所以在生物技術領域有著巨大的潛力,正是因為該領域的複雜性——就拿AlphaFold所針對的問題來說吧。蛋白質是人體的基本構成元素,管理著人體各種各樣的功能。所有這些功能都依賴蛋白質的三維形狀。每種蛋白質都是由一系列氨基酸組成的,這些氨基酸和外部環境之間的相互作用決定了蛋白質的「折疊」方式,而這些折疊方式又決定了它的最終形狀。生技公司對能夠根據胺基酸序列預測蛋白質的形狀非常感興趣,因為它們可以利用這些洞察來設計從新藥到改良作物再到可生物降解塑膠的一切產品。
而這正是深度學習的用武之地:在數億種不同的蛋白質序列及其底層結構上訓練人工智慧模型,幫助這些模型揭示生物學中的規律,而不一定需要進行真正的分子動力學模擬所需的昂貴計算。要完全模擬蛋白質需要非常強大的算力資源,以至於一些機構專門設計和建造了超級電腦來處理這類問題,例如匹茲堡超級計算中心的Anton 2。
人工智慧藥物研發熱潮來臨
科技巨頭加速佈局蛋白質折疊研究
同時,藥物發現技術的繁榮也不完全是來自人工智慧科技巨頭。 Pitchbook的數據顯示,自2021年以來,全球已經有281筆針對人工智慧藥物研發新創公司的創投交易,投資總額為77億美元。最大的峰值出現在2021年,當時達成了105筆交易,高於前一年的65筆,到2023年逐漸減少到67筆。在本月稍早發布的一份報告中,這家分析公司指出,人們對「早期公司將人工智慧整合到藥物發現和開發中」仍然抱有強烈的熱情。華盛頓大學蛋白質設計研究所(Institute for Protein Design)所長戴維‧貝克(David Baker)表示,生成式人工智慧的興起也引發了人們對這一領域越來越大的興趣。
「過去,它還是一種瘋狂、邊緣的事物,非常脫離主流。」貝克說。現在,「每個人都在談論它。」貝克還透露,自2012年蛋白質設計研究所成立以來,已經有20多家新創公司從該計畫中脫胎而出,其中10家是近年來(2021年以後)成立的,包括為再生醫學和癌症治療開發奈米材料的Archon Biosciences公司,以及為纖維化疾病開發治療方法的Lila公司。
在DeepMind,直到新冠疫情爆發,研究人員才真正意識到他們研究的重要性。他們花了將近5年的時間來發展AlphaFold,而正當他們為第二代模型重新訓練時,整個世界因為新冠病毒而開始居家避難。 「這確實讓人們意識到這個問題的重要性,」DeepMind的科學副總裁什米特·科利(Pushmeet Kohli)在接受《福布斯》採訪時表示。
科利笑著回憶道,DeepMind重新訓練的結果是AlphaFold 2,這是一個突破性的模型,可以非常準確地預測蛋白質結構,以至於全球蛋白質折疊研究競賽CASP的組織者給DeepMind發了電子郵件,詢問該公司是否以某種方式進行了作弊。
這項工作是如此有希望,以至於聯合創始人德米斯·哈薩比斯(Demis Hassabis)在2021年基於AlphaFold的突破在Alphabet成立了一家獨立的公司。這家名為Isomorphic Labs的新創公司專注於藥物研發,由哈薩比斯親自掌舵。就在今年,Isomorphic Labs與禮來公司(Lilly)和諾華公司(Novartis)簽署了研究協議,如果協議中的所有里程碑都能實現,那麼總價值將接近30億美元——這還不包括這些合作關係帶來的潛在藥品銷售的豐厚版稅。
2022年,輝達推出了BioNeMo,這是一個生成式人工智慧平台,可幫助開發人員加速訓練、部署和擴展用於藥物發現的大型語言模式。在該晶片製造商的創投部門Nventures總共完成的19筆交易中,有7筆涉及人工智慧藥物研發新創公司,包括Genesis Therapeutics、Terray和Generate Biomedicines,是所有投資類別中數量最多的一個。
「電腦輔助設計產業創造了第一家價值2兆美元的晶片公司,」鮑威爾說,他指的是輝達和它在過去一年裡的快速成長。 “既然這樣,為什麼電腦輔助藥物研發行業不能建立下一個萬億美元的製藥公司呢?”她補充說,“這就是為什麼我們要以現在的方式進行投資的原因。”
同時,其他幾家科技巨頭也都有自己的蛋白質折疊研究。去年,Salesforce推出了蛋白質生成人工智慧模型ProGen,微軟發布了類似的開源模型EvoDiff。亞馬遜也為其AWS機器學習平台SageMaker發布了蛋白質折疊工具。 《富比士》今年1月報道稱,就連TikTok的母公司位元組跳動似乎也在招募科學和藥物設計團隊。
人工智慧藥物研發道阻且長
然而,儘管人工智慧藥物研發前景光明,備受關注,但也遭遇了一些挫折。讓藥物通過臨床試驗仍需要數年時間,儘管到目前為止,FDA已經批准了100多種使用人工智慧或機器學習進行開發的新藥候選藥物的臨床試驗,但任何新藥要想進入市場,可能還需要數年時間。
還有一些情況下,與藥物發現相關的困難導致某些大型科技公司放棄了這項研究。去年8月,Facebook的母公司Meta關閉了蛋白質折疊團隊。根據《富比士》去年報道,該部門的研究人員後來來自立門戶,成立了一家名為EvolutionaryScale的公司。 Meta拒絕就關閉該項目的原因發表評論。
科技公司需要關注的一個重要瓶頸是擁有足夠的培訓數據。像GPT這樣的新基礎模型依賴強化學習,這是一種演算法可以透過反覆試驗來處理未標記資訊的方法。合成生物學公司Ginkgo Bioworks的人工智慧主管 Anna Marie Wagner )告訴《富比士》,這使得他們更依賴高品質的數據。
去年夏天,她的公司與Google雲端達成了為期五年的策略合作夥伴關係,將其人工智慧專業知識與Ginkgo在自動化實驗室中快速產生生物數據的能力結合起來,然後這些數據可以立即作為新的訓練資料輸入人工智慧模型。她說,這種結合有助於更好地優化發現過程。
此外,她說,Ginkgo能夠快速驗證模型預測。與直覺相反的是,這使得人工智慧模型有時會產生“幻覺”(也就是對提問生成錯誤或有誤導性的結果)的現象成為了它的“一個特徵,而不是缺陷”,因為它可以帶來科學家可能無法想像的有趣發現。 “我們希望這個模型能想出一些瘋狂的東西,因為這正是我們開始看到數量級改進的地方。”
科利則對數據問題給出了更直言不諱的評論:「垃圾進,垃圾出。」儘管如此,隨著業界努力解決這些問題,他已經看到了人工智慧對生物研究的影響。他說:“當我去參加會議時,我看到了生物學家以前和現在的工作方式發生的變化,這真是一個驚人的轉變。”(Forbes 福布斯)
本文譯自
https://www.forbes.com/sites/richardnieva/2024/03/13/why-nvidia-google-and-microsoft-are-betting-billions-on-biotechs-ai-future/?sh=1542034a20a5