久草久草欧美看看日毛片|亚洲色情电影在线观看|中国一极毛片爱爱欧美一区|国产精品丝袜美腿|干人人操人人干人人|av黄色无码亚洲v视频|全国一级黄片在哪里看|国产精品av影院|特级一级黄色视频|亚洲黄色导航网站在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 產(chǎn)業(yè) ? 生物醫(yī)藥 ? 正文

大模型炒熱AI制藥賽道,生物醫(yī)藥GPT能否打破“10年10億美元”困境?

作者:上觀新聞 來(lái)源: 頭條號(hào) 95805/14

作為高投入高風(fēng)險(xiǎn)的創(chuàng)新行業(yè),生物醫(yī)藥行業(yè)一直面臨著“雙10困境”:一款新藥的研發(fā)至少需要花費(fèi)10億美元、10年投入。伴隨著AI大模型引領(lǐng)的創(chuàng)新浪潮席卷全球,生物醫(yī)藥產(chǎn)業(yè)正在面臨新一輪的機(jī)遇期。一家初創(chuàng)企業(yè)借助大模型的算力,在短短兩年內(nèi)找到合

標(biāo)簽:

作為高投入高風(fēng)險(xiǎn)的創(chuàng)新行業(yè),生物醫(yī)藥行業(yè)一直面臨著“雙10困境”:一款新藥的研發(fā)至少需要花費(fèi)10億美元、10年投入。伴隨著AI大模型引領(lǐng)的創(chuàng)新浪潮席卷全球,生物醫(yī)藥產(chǎn)業(yè)正在面臨新一輪的機(jī)遇期。一家初創(chuàng)企業(yè)借助大模型的算力,在短短兩年內(nèi)找到合適的抗癌苗頭化合物,AI大模型能否真的改變生物醫(yī)藥的“雙10困境”?

AI輔助尋找抗癌苗頭化合物

“經(jīng)過(guò)AI生物大模型的虛擬篩選,從780萬(wàn)個(gè)分子庫(kù)中最終找到6個(gè)潛在活性分子,效率相較于以往的人工篩選提升了成千上萬(wàn)倍。”杭州立德百克生物醫(yī)藥科技有限責(zé)任公司負(fù)責(zé)人王紫壹告訴記者,生物醫(yī)藥行業(yè)有一個(gè)“雙10魔咒”,一款新藥的研發(fā)至少需要花費(fèi)10億美元和耗時(shí)10年投入,這是一家初創(chuàng)公司幾乎難以承擔(dān)的成本,如今憑借AI大模型的能力,生物技術(shù)團(tuán)隊(duì)也能實(shí)現(xiàn)彎道超車。

乳腺癌是全球女性發(fā)病率最高的惡性腫瘤,去年我國(guó)乳腺癌發(fā)病人數(shù)超過(guò)42萬(wàn),CDK4/6抑制劑是該領(lǐng)域最為暢銷的藥物,有機(jī)構(gòu)預(yù)測(cè)全球總的CDK4/6抑制劑市場(chǎng)將在2029年超過(guò)200億美元,占乳腺癌藥物銷售市場(chǎng)份額的42%。目前已經(jīng)上市的CDK4/6抑制劑有4個(gè),在研的更是多達(dá)幾十個(gè)。立德百克自主研發(fā)的PPI檢測(cè)技術(shù),可以對(duì)蛋白質(zhì)之間的相互作用進(jìn)行快速的“濕”實(shí)驗(yàn)(生理學(xué)試驗(yàn)方法)驗(yàn)證,建立了專門針對(duì)CDK4/6-CCND蛋白-蛋白相互作用的藥物篩選技術(shù)和活性檢測(cè)技術(shù)平臺(tái),但是如何找到苗頭化合物分子卻犯了難。

“市面上的化合物商品庫(kù)中有上千萬(wàn)種化合物,篩選工程耗時(shí)耗力,恰好生物計(jì)算大模型能彌補(bǔ)這一短板?!蓖ㄟ^(guò)引入百度飛槳螺旋槳的文心生物計(jì)算大模型技術(shù),王紫壹團(tuán)隊(duì)的“干”實(shí)驗(yàn)(計(jì)算機(jī)模擬試驗(yàn)方法)能力得到極大的提升,通過(guò)虛擬篩選,從780萬(wàn)個(gè)分子中得到了模型打分比較高的110個(gè)分子,并采購(gòu)了其中的40個(gè)進(jìn)行檢測(cè),最后發(fā)現(xiàn)有6個(gè)高潛力的分子,其中3個(gè)化合物能夠同時(shí)打斷CDK4/6-CCND蛋白-蛋白相互作用,還有3個(gè)化合物能夠打斷CDK4-CCND蛋白-蛋白相互作用。目前,雙方正在對(duì)這些化合物進(jìn)行更進(jìn)一步的分析研究,也為下一步的結(jié)構(gòu)優(yōu)化提供數(shù)據(jù)準(zhǔn)備。

記者獲悉,去年5月百度對(duì)外發(fā)布了文心生物計(jì)算大模型,并將生物領(lǐng)域研究對(duì)象的特性融入模型,構(gòu)建面向化合物分子、蛋白分子、基因組學(xué)信息的生物計(jì)算領(lǐng)域預(yù)訓(xùn)練大模型。目前正式對(duì)外發(fā)布的文心生物計(jì)算大模型,包括化合物通用表征模型HelixGEM和HelixGEM-2、蛋白結(jié)構(gòu)分析模型HelixFold、以及單序列蛋白表征模型HelixFold-Single。

國(guó)產(chǎn)生物大模型進(jìn)入爆發(fā)期

當(dāng)下,隨著通用大模型的走紅,生物醫(yī)藥等垂直領(lǐng)域大模型正逐漸浮出水面。不少研報(bào)指出,AI制藥行業(yè)經(jīng)歷了算法迭代、算力提升及海量實(shí)驗(yàn)數(shù)據(jù)的堆砌,隨著AlphaFold2、ChatGPT等創(chuàng)新產(chǎn)品的出現(xiàn),行業(yè)有望迎來(lái)高速發(fā)展的成長(zhǎng)初期。

AI大模型如何提高新藥研發(fā)的效率,之江實(shí)驗(yàn)室圖計(jì)算中心副主任陳紅陽(yáng)有一個(gè)非常形象的比喻:靶點(diǎn)發(fā)現(xiàn)是藥物研發(fā)過(guò)程中的關(guān)鍵環(huán)節(jié),其中靶點(diǎn)是藥物在體內(nèi)的作用結(jié)合位點(diǎn),藥物好比一把“鑰匙”,靶點(diǎn)就是與之匹配的“鎖”。基于大量的醫(yī)學(xué)材料和生化數(shù)據(jù),生物計(jì)算大模型能發(fā)掘潛在的藥物靶點(diǎn),甚至預(yù)測(cè)靶點(diǎn)與潛在藥物之間的相互作用,提高藥物研發(fā)成功率。

國(guó)外的研究報(bào)告顯示,AI可以將新藥研發(fā)的成功率提高16.7%,AI輔助藥物研發(fā)每年能節(jié)約540億美元的研發(fā)費(fèi)用,并在研發(fā)主要環(huán)節(jié)節(jié)約40%至60%的時(shí)間成本。根據(jù)英偉達(dá)公開(kāi)資料,使用AI技術(shù)可使藥物早期發(fā)現(xiàn)所需時(shí)間縮短至三分之一,成本節(jié)省至兩百分之一。

生物制藥和轉(zhuǎn)化醫(yī)學(xué)作為AI的重點(diǎn)賽道之一,涉及藥物設(shè)計(jì)、篩選、優(yōu)化、驗(yàn)證等多個(gè)環(huán)節(jié),需要處理大量的復(fù)雜數(shù)據(jù)和知識(shí),也吸引了更多的競(jìng)爭(zhēng)者。

早在2020年,在第14屆國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽上,DeepMind研發(fā)的AlphaFold2成功根據(jù)基因序列預(yù)測(cè)了生命基本分子——蛋白質(zhì)的三維結(jié)構(gòu),取得了中位分?jǐn)?shù)為92.4的好成績(jī),比第二名高25分,被中國(guó)科學(xué)院院士施一公評(píng)價(jià)為“人工智能對(duì)科學(xué)領(lǐng)域最大的一次貢獻(xiàn)”。

隨后國(guó)內(nèi)AI生物大模型逐漸開(kāi)始發(fā)力,清華智能產(chǎn)業(yè)研究院日前開(kāi)源了輕量版BioMedGPT1.6B,這是一個(gè)參數(shù)為16億的生物醫(yī)藥領(lǐng)域輕量級(jí)科研版基礎(chǔ)模型,具有跨模態(tài)與知識(shí)融合的特點(diǎn),可以處理藥物性質(zhì)預(yù)測(cè)、自然語(yǔ)言類、跨模態(tài)等多種任務(wù)。

近日,上海人工智能研究院執(zhí)行院長(zhǎng)宋海濤表示,計(jì)劃在生物制藥、轉(zhuǎn)化醫(yī)學(xué)等領(lǐng)域,利用國(guó)產(chǎn)化訓(xùn)練框架推出國(guó)產(chǎn)大模型,打造具有自主知識(shí)產(chǎn)權(quán)和核心競(jìng)爭(zhēng)力的人工智能技術(shù)。

中銀證券研報(bào)中表示,AI醫(yī)療市場(chǎng)呈高增長(zhǎng)態(tài)勢(shì),市場(chǎng)規(guī)模在2025年有望達(dá)385億元,2020—2025年復(fù)合年均增長(zhǎng)率達(dá)46%,其中AI制藥是AI醫(yī)療領(lǐng)域的重要一環(huán)。

AI介入新藥研發(fā)仍存挑戰(zhàn)

目前,AI技術(shù)在生物醫(yī)藥產(chǎn)業(yè)的核心優(yōu)勢(shì)在于提升效率,但在落地過(guò)程中仍遇到了一些挑戰(zhàn)。

百度智能云相關(guān)人士認(rèn)為,藥物研發(fā)真實(shí)的高精度實(shí)驗(yàn)數(shù)據(jù)獲取成本極高,且有實(shí)驗(yàn)的批次效應(yīng)問(wèn)題,公開(kāi)的數(shù)據(jù)庫(kù)有大量的無(wú)標(biāo)注數(shù)據(jù),如何利用好大量無(wú)標(biāo)注數(shù)據(jù)和少量高精度數(shù)據(jù),這就對(duì)模型構(gòu)建提出了較高的要求。其次,生物領(lǐng)域的任務(wù)繁多且復(fù)雜,比如ADMET成藥性預(yù)測(cè)任務(wù),常用屬性指標(biāo)多達(dá)幾十項(xiàng),想要一個(gè)模型對(duì)幾十項(xiàng)指標(biāo)都預(yù)測(cè)準(zhǔn)確,這對(duì)技術(shù)的泛化性和可遷移能力也有較高的要求。

同時(shí),生物領(lǐng)域有其獨(dú)特的領(lǐng)域特性,比如對(duì)同分異構(gòu)體的理解、研究對(duì)象需要建模三維結(jié)構(gòu)等,對(duì)算法研發(fā)人員提出了更高的要求。特別是像DeepMind團(tuán)隊(duì)所開(kāi)發(fā)的Alphafold2之類計(jì)算量巨大的復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,更需要有強(qiáng)大的算力和框架技術(shù)的支持。

陳紅陽(yáng)也有類似觀點(diǎn),分子生成任務(wù)需要通過(guò)引入領(lǐng)域知識(shí)、結(jié)合強(qiáng)化學(xué)習(xí)和“濕”實(shí)驗(yàn)等來(lái)驗(yàn)證生成分子的有效性,而大模型在訓(xùn)練過(guò)程缺少領(lǐng)域知識(shí),無(wú)法保證其可信性。模型訓(xùn)練部署以及相關(guān)“濕”實(shí)驗(yàn)的成本高企,藥物研發(fā)依然面臨流程長(zhǎng)投入大的問(wèn)題。

欄目主編:李曄 題圖來(lái)源:上觀題圖 圖片編輯:朱瓅

來(lái)源:作者:查睿

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載合作媒體、機(jī)構(gòu)或其他網(wǎng)站的公開(kāi)信息,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,信息僅供參考,不作為交易和服務(wù)的根據(jù)。轉(zhuǎn)載文章版權(quán)歸原作者所有,如有侵權(quán)或其它問(wèn)題請(qǐng)及時(shí)告之,本網(wǎng)將及時(shí)修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。聯(lián)系電話 010-57193596,謝謝。

財(cái)中網(wǎng)合作