大模型炒熱AI制藥賽道，生物醫(yī)藥GPT能否打破“10年10億美元”困境？

作者：上觀新聞來源：頭條號 96605/14

作為高投入高風險的創(chuàng)新行業(yè)，生物醫(yī)藥行業(yè)一直面臨著“雙10困境”：一款新藥的研發(fā)至少需要花費10億美元、10年投入。伴隨著AI大模型引領的創(chuàng)新浪潮席卷全球，生物醫(yī)藥產業(yè)正在面臨新一輪的機遇期。一家初創(chuàng)企業(yè)借助大模型的算力，在短短兩年內找到合

標簽：

作為高投入高風險的創(chuàng)新行業(yè)，生物醫(yī)藥行業(yè)一直面臨著“雙10困境”：一款新藥的研發(fā)至少需要花費10億美元、10年投入。伴隨著AI大模型引領的創(chuàng)新浪潮席卷全球，生物醫(yī)藥產業(yè)正在面臨新一輪的機遇期。一家初創(chuàng)企業(yè)借助大模型的算力，在短短兩年內找到合適的抗癌苗頭化合物，AI大模型能否真的改變生物醫(yī)藥的“雙10困境”？

AI輔助尋找抗癌苗頭化合物

“經過AI生物大模型的虛擬篩選，從780萬個分子庫中最終找到6個潛在活性分子，效率相較于以往的人工篩選提升了成千上萬倍?！焙贾萘⒌掳倏松镝t(yī)藥科技有限責任公司負責人王紫壹告訴記者，生物醫(yī)藥行業(yè)有一個“雙10魔咒”，一款新藥的研發(fā)至少需要花費10億美元和耗時10年投入，這是一家初創(chuàng)公司幾乎難以承擔的成本，如今憑借AI大模型的能力，生物技術團隊也能實現彎道超車。

乳腺癌是全球女性發(fā)病率最高的惡性腫瘤，去年我國乳腺癌發(fā)病人數超過42萬，CDK4/6抑制劑是該領域最為暢銷的藥物，有機構預測全球總的CDK4/6抑制劑市場將在2029年超過200億美元，占乳腺癌藥物銷售市場份額的42%。目前已經上市的CDK4/6抑制劑有4個，在研的更是多達幾十個。立德百克自主研發(fā)的PPI檢測技術，可以對蛋白質之間的相互作用進行快速的“濕”實驗（生理學試驗方法）驗證，建立了專門針對CDK4/6-CCND蛋白-蛋白相互作用的藥物篩選技術和活性檢測技術平臺，但是如何找到苗頭化合物分子卻犯了難。

“市面上的化合物商品庫中有上千萬種化合物，篩選工程耗時耗力，恰好生物計算大模型能彌補這一短板?！蓖ㄟ^引入百度飛槳螺旋槳的文心生物計算大模型技術，王紫壹團隊的“干”實驗（計算機模擬試驗方法）能力得到極大的提升，通過虛擬篩選，從780萬個分子中得到了模型打分比較高的110個分子，并采購了其中的40個進行檢測，最后發(fā)現有6個高潛力的分子，其中3個化合物能夠同時打斷CDK4/6-CCND蛋白-蛋白相互作用，還有3個化合物能夠打斷CDK4-CCND蛋白-蛋白相互作用。目前，雙方正在對這些化合物進行更進一步的分析研究，也為下一步的結構優(yōu)化提供數據準備。

記者獲悉，去年5月百度對外發(fā)布了文心生物計算大模型，并將生物領域研究對象的特性融入模型，構建面向化合物分子、蛋白分子、基因組學信息的生物計算領域預訓練大模型。目前正式對外發(fā)布的文心生物計算大模型，包括化合物通用表征模型HelixGEM和HelixGEM-2、蛋白結構分析模型HelixFold、以及單序列蛋白表征模型HelixFold-Single。

國產生物大模型進入爆發(fā)期

當下，隨著通用大模型的走紅，生物醫(yī)藥等垂直領域大模型正逐漸浮出水面。不少研報指出，AI制藥行業(yè)經歷了算法迭代、算力提升及海量實驗數據的堆砌，隨著AlphaFold2、ChatGPT等創(chuàng)新產品的出現，行業(yè)有望迎來高速發(fā)展的成長初期。

AI大模型如何提高新藥研發(fā)的效率，之江實驗室圖計算中心副主任陳紅陽有一個非常形象的比喻：靶點發(fā)現是藥物研發(fā)過程中的關鍵環(huán)節(jié)，其中靶點是藥物在體內的作用結合位點，藥物好比一把“鑰匙”，靶點就是與之匹配的“鎖”。基于大量的醫(yī)學材料和生化數據，生物計算大模型能發(fā)掘潛在的藥物靶點，甚至預測靶點與潛在藥物之間的相互作用，提高藥物研發(fā)成功率。

國外的研究報告顯示，AI可以將新藥研發(fā)的成功率提高16.7%，AI輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費用，并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時間成本。根據英偉達公開資料，使用AI技術可使藥物早期發(fā)現所需時間縮短至三分之一，成本節(jié)省至兩百分之一。

生物制藥和轉化醫(yī)學作為AI的重點賽道之一，涉及藥物設計、篩選、優(yōu)化、驗證等多個環(huán)節(jié)，需要處理大量的復雜數據和知識，也吸引了更多的競爭者。

早在2020年，在第14屆國際蛋白質結構預測競賽上，DeepMind研發(fā)的AlphaFold2成功根據基因序列預測了生命基本分子——蛋白質的三維結構，取得了中位分數為92.4的好成績，比第二名高25分，被中國科學院院士施一公評價為“人工智能對科學領域最大的一次貢獻”。

隨后國內AI生物大模型逐漸開始發(fā)力，清華智能產業(yè)研究院日前開源了輕量版BioMedGPT1.6B，這是一個參數為16億的生物醫(yī)藥領域輕量級科研版基礎模型，具有跨模態(tài)與知識融合的特點，可以處理藥物性質預測、自然語言類、跨模態(tài)等多種任務。

近日，上海人工智能研究院執(zhí)行院長宋海濤表示，計劃在生物制藥、轉化醫(yī)學等領域，利用國產化訓練框架推出國產大模型，打造具有自主知識產權和核心競爭力的人工智能技術。

中銀證券研報中表示，AI醫(yī)療市場呈高增長態(tài)勢，市場規(guī)模在2025年有望達385億元，2020—2025年復合年均增長率達46%，其中AI制藥是AI醫(yī)療領域的重要一環(huán)。

AI介入新藥研發(fā)仍存挑戰(zhàn)

目前，AI技術在生物醫(yī)藥產業(yè)的核心優(yōu)勢在于提升效率，但在落地過程中仍遇到了一些挑戰(zhàn)。

百度智能云相關人士認為，藥物研發(fā)真實的高精度實驗數據獲取成本極高，且有實驗的批次效應問題，公開的數據庫有大量的無標注數據，如何利用好大量無標注數據和少量高精度數據，這就對模型構建提出了較高的要求。其次，生物領域的任務繁多且復雜，比如ADMET成藥性預測任務，常用屬性指標多達幾十項，想要一個模型對幾十項指標都預測準確，這對技術的泛化性和可遷移能力也有較高的要求。

同時，生物領域有其獨特的領域特性，比如對同分異構體的理解、研究對象需要建模三維結構等，對算法研發(fā)人員提出了更高的要求。特別是像DeepMind團隊所開發(fā)的Alphafold2之類計算量巨大的復雜的神經網絡模型，更需要有強大的算力和框架技術的支持。

陳紅陽也有類似觀點，分子生成任務需要通過引入領域知識、結合強化學習和“濕”實驗等來驗證生成分子的有效性，而大模型在訓練過程缺少領域知識，無法保證其可信性。模型訓練部署以及相關“濕”實驗的成本高企，藥物研發(fā)依然面臨流程長投入大的問題。

欄目主編：李曄題圖來源：上觀題圖圖片編輯：朱瓅

來源：作者：查睿

免責聲明：本網轉載合作媒體、機構或其他網站的公開信息，并不意味著贊同其觀點或證實其內容的真實性，信息僅供參考，不作為交易和服務的根據。轉載文章版權歸原作者所有，如有侵權或其它問題請及時告之，本網將及時修改或刪除。凡以任何方式登錄本網站或直接、間接使用本網站資料者，視為自愿接受本網站聲明的約束。聯系電話 010-57193596，謝謝。

久草久草欧美看看日毛片|亚洲色情电影在线观看|中国一极毛片爱爱欧美一区|国产精品丝袜美腿|干人人操人人干人人|av黄色无码亚洲v视频|全国一级黄片在哪里看|国产精品av影院|特级一级黄色视频|亚洲黄色导航网站在线观看

首頁

資訊

財中號

品牌

專題

投資學院

發(fā)布文章

APP下載

熱點

國資

產業(yè)

券商

基金

金融

上市公司

財富

專題

大模型炒熱AI制藥賽道，生物醫(yī)藥GPT能否打破“10年10億美元”困境？

世界各國擁有的生物醫(yī)藥制造企業(yè)巨頭（美國，德國，英國，法國）

首頁

資訊

財中號

品牌

專題

投資學院

發(fā)布文章

APP下載

大模型炒熱AI制藥賽道，生物醫(yī)藥GPT能否打破“10年10億美元”困境？

您可能感興趣的文章

大模型炒熱AI制藥賽道，生物醫(yī)藥GPT能否打破“10年10億美元”困境？