人工智能在新藥研發(fā)中的應(yīng)用_第1頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用_第2頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用_第3頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用_第4頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1 1 3 4 5 6 8 9 10 15 16 17 18 19 20 22 22 23 25 32 34 1新藥研發(fā)存在周期長(zhǎng)、費(fèi)用高和成功率低等特點(diǎn),人工智能作為藥物研發(fā)領(lǐng)域的一個(gè)熱點(diǎn)方向,已被應(yīng)用到藥物研發(fā)的各個(gè)階段,醫(yī)藥領(lǐng)域?qū)θ斯ぶ悄芗夹g(shù)越來(lái)越重視,目前人工智能技術(shù)在藥物研發(fā)中的應(yīng)用主要表現(xiàn)為七個(gè)場(chǎng)景,分別是:靶點(diǎn)藥物研發(fā)、候選藥物挖掘、化合物篩選、預(yù)測(cè)ADMET性質(zhì)、藥物晶型預(yù)測(cè)、輔助病理生物學(xué)研究和發(fā)掘藥物新適應(yīng)癥,人工智能可以直接為新藥的研發(fā)做出貢獻(xiàn),AI+藥物研發(fā)與傳統(tǒng)模式相比,時(shí)間和成本優(yōu)勢(shì)明顯。AI+藥物研發(fā)的結(jié)合必然是未來(lái)制藥行業(yè)的發(fā)展趨勢(shì),對(duì)醫(yī)藥領(lǐng)域進(jìn)行一場(chǎng)巨大的革命,讓醫(yī)藥行業(yè)迎來(lái)新時(shí),隨著新冠疫情的爆發(fā),那么,什么是人工智能?為什么要將人工智能技術(shù)和藥物研發(fā)結(jié)合?中國(guó)在人工智能藥物方面取得了什么進(jìn)展?在當(dāng)前全球形勢(shì)和開(kāi)放新格局下,國(guó)際頂級(jí)醫(yī)療公司如何利用人工智能技術(shù)生成更的是計(jì)算機(jī)系統(tǒng)從輸入或過(guò)去的數(shù)據(jù)中學(xué)習(xí)的能力,術(shù)語(yǔ)“人工智能”通常用于機(jī)器在學(xué)習(xí)和解決問(wèn)題過(guò)程中模仿與人腦相關(guān)的認(rèn)知行為。機(jī)器學(xué)習(xí)(MachineLearning,ML)可描述為“AI的應(yīng)時(shí)也可稱為“AI的子集”。ML將數(shù)據(jù)與樸素貝葉斯、決策樹(shù)2(DecisionTree,DT)、隱HMM)等算法一起輸入機(jī)器,使其在不顯式編程的情況下進(jìn)行學(xué)習(xí)。絡(luò)(ArtificialNeuralNetwork,ANN)時(shí),首次提出了“深度學(xué)習(xí)根據(jù)《人工智能:現(xiàn)代方法》中的討論,人工智能有七種分類),感知、機(jī)器學(xué)習(xí)、機(jī)器人:運(yùn)動(dòng)和操縱,以及自然語(yǔ)言處理。機(jī)器學(xué)習(xí)進(jìn)一步分為三個(gè)重要子集:監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和深度學(xué)習(xí);而自然語(yǔ)言處理被分為五個(gè)主要子集,包括分類、機(jī)器翻譯、問(wèn)答、3大數(shù)據(jù)可以定義為過(guò)于龐大和錯(cuò)綜復(fù)雜的數(shù)據(jù)集,無(wú)法使用傳統(tǒng)的數(shù)據(jù)分析軟件、工具和技術(shù)進(jìn)行分析。大數(shù)據(jù)的三個(gè)主要特征是體積、速度和多樣性,其中體積代表產(chǎn)生的大量數(shù)據(jù),速度代表這些數(shù)據(jù)被再現(xiàn)的速率,多樣性代表數(shù)據(jù)集中存在的異質(zhì)性。隨著微陣列、轉(zhuǎn)錄組測(cè)序技術(shù)(RibonucleicAcidSequencing,RNA-seq)和高通量測(cè)序(High-ThroughputSequencing,HTS)技術(shù)的出現(xiàn),每天都會(huì)產(chǎn)生過(guò)多的生物醫(yī)學(xué)數(shù)據(jù),當(dāng)代藥物發(fā)現(xiàn)也因此進(jìn)入了大與疾病病理生理學(xué)有關(guān)的適當(dāng)靶點(diǎn)(如基因、蛋白質(zhì)然后找到可以干擾這些靶點(diǎn)的藥物或類藥物分子。如今我們可以搜索一系列生物醫(yī)學(xué)數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn),如國(guó)家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)的基因表達(dá)綜合(GeneExpressionOmnibus,GEO)數(shù)據(jù)集、癌癥基因組圖譜(TheCancer據(jù)庫(kù),對(duì)其進(jìn)行數(shù)據(jù)挖掘可以幫助識(shí)別不同疾病的靶點(diǎn)。此外,人技術(shù)可用,這些技術(shù)可以幫助提取這些大型生物醫(yī)學(xué)數(shù)據(jù)集中存在的有用特征、模式和結(jié)構(gòu)。如Han等人[1]利用大數(shù)據(jù)和人工智能在4在確定和驗(yàn)證了合適的靶點(diǎn)之后,下一步是尋找合適的藥物或類藥物分子,這些分子可以與靶點(diǎn)相互作用并引起所需的反應(yīng)。在大數(shù)據(jù)時(shí)代,通過(guò)支配海量的大型化學(xué)數(shù)據(jù)庫(kù),協(xié)助尋找針對(duì)特定含各種化學(xué)結(jié)構(gòu)的數(shù)據(jù),包括它們的生物、物理、化學(xué)和毒性特性;ChEMBL包含許多具有類似藥物特性的生物活性化合物的數(shù)據(jù),還包含有關(guān)這些化合物的吸收、分布、代謝和排泄(Absorption,們的靶相互作用的信息;其他的化學(xué)數(shù)據(jù)庫(kù)還包括DrugBank、隨著技術(shù)的進(jìn)步和高性能計(jì)算機(jī)的發(fā)展,在計(jì)算機(jī)輔助藥物設(shè)一系列人工智能算法。在過(guò)去的二十年里,發(fā)展了許多用于計(jì)算新5的藥物發(fā)現(xiàn)與人工智能藥物設(shè)計(jì)相結(jié)合,提供了一個(gè)很好的研究平臺(tái)。此外,世界各地的系統(tǒng)生物學(xué)和化學(xué)科學(xué)家與計(jì)算科學(xué)家經(jīng)過(guò)二、人工智能在藥物發(fā)現(xiàn)與研發(fā)中的應(yīng)用技術(shù)和方法流程在新藥研發(fā)過(guò)程中,常遇到的瓶頸問(wèn)題有:①尋找合適的、具有生物活性的藥物分子;②藥物分子難以通過(guò)第二階段臨床試驗(yàn)和其他監(jiān)管批準(zhǔn)。利用基于人工智能的工具和技術(shù),提升藥物研發(fā)的效率,解決上述所面臨的藥物研發(fā)問(wèn)題。為此,下面將詳細(xì)介紹人它們具有跨越細(xì)胞屏障的能力并可以到達(dá)所需的靶點(diǎn),因此越來(lái)越多地被用于治療。深度學(xué)習(xí)于肽合成與小分子設(shè)計(jì)的應(yīng)用概念圖如6神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)驅(qū)動(dòng)的工具,可以根據(jù)脫氧核糖核酸(DeoxyriboNucleicAcid,DNA)序列數(shù)據(jù)預(yù)測(cè)短AMP。通過(guò)利用該平臺(tái),研究人員從一種存在于胃腸道的真菌病分子量非常低的分子,就像肽一樣,利用人工智能也可以用來(lái)探索(/insilicome),分子庫(kù)(DNA-EncodedsmallmoleculeLibraries,DEL)數(shù)據(jù)與圖卷積神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等ML模型相結(jié)合,以發(fā)現(xiàn)新的類似藥物的小分子。另外,Xing等人[5]集成了XGBoost、支持向量機(jī)和深度神7人工智能和最大似然算法在藥物發(fā)現(xiàn)和開(kāi)發(fā)中的重要成果之一是預(yù)測(cè)和估計(jì)疾病網(wǎng)絡(luò)、藥物—藥物相互作用和藥物—靶點(diǎn)關(guān)系的 常用中草藥的靶點(diǎn),然后使用DisGeNET數(shù)據(jù)庫(kù)將這些靶標(biāo)與不同的在藥物化學(xué)中,多重藥理學(xué)是指在與疾病相關(guān)的藥物靶標(biāo)生物網(wǎng)絡(luò)中設(shè)計(jì)能夠與多個(gè)靶點(diǎn)相互作用的單一藥物分子。它適合于為復(fù)雜疾病,如癌癥、神經(jīng)退行性疾?。∟eurodegenerativeDiseases,NDDS)、糖尿病和心力衰竭等設(shè)計(jì)治療劑。由于強(qiáng)大的挖掘能力和數(shù)據(jù)分析能力,基于ML的方法具有分析牽連分子網(wǎng)絡(luò)的潛力,大大8白質(zhì)序列信息來(lái)預(yù)測(cè)蛋白質(zhì)—蛋白質(zhì)相互作用,提供準(zhǔn)確且快速的機(jī)器和統(tǒng)計(jì)學(xué)習(xí)方法,如K—最近鄰、樸素貝葉斯、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)和隨機(jī)森林,用于預(yù)測(cè)PPI中的障礙。過(guò)程相似性數(shù)據(jù)訓(xùn)練貝葉斯網(wǎng)絡(luò),并獲取精確和準(zhǔn)確的PPI預(yù)測(cè)結(jié)9合物的有效方法。作為高通量篩選的重要工具,它也帶來(lái)了成本高、活性化合物組成的過(guò)濾訓(xùn)練集。這些訓(xùn)練數(shù)據(jù)用于使用監(jiān)督學(xué)習(xí)技術(shù)訓(xùn)練模型。然后對(duì)訓(xùn)練的模型進(jìn)行驗(yàn)證,如果它足夠精確,則將該模型用于新的數(shù)據(jù)集,以針對(duì)目標(biāo)篩選具有所需活性的化合物。一般來(lái)說(shuō)VS分兩種(如圖2-5所示),基于結(jié)構(gòu)的VS(StructuralBasedVirtualScreening,SBVS)和基于配體的VS(LigandBasedVirtualScreening,LBVS)。其中,分子對(duì)接是配體的親和力,如支持向量機(jī)、卷積神經(jīng)網(wǎng)絡(luò)和淺層神經(jīng)網(wǎng)絡(luò)。類似的,LBVS也開(kāi)發(fā)了不同的算法和工具,如SwissSimilarity[9]、在新藥研發(fā)中,先導(dǎo)化合物的篩選是至關(guān)重要的,人工智能在識(shí)別新的和潛在的先導(dǎo)化合物方面發(fā)揮著巨大的作用。在化學(xué)空間臨床和臨床前研究、體內(nèi)分析和微陣列分析。利用機(jī)器學(xué)習(xí)模型,圖2-6基于AI和ML的藥物重定位方法,包括基于網(wǎng)絡(luò)新型冠狀病毒肺炎(COVID-19)是由嚴(yán)重急性呼吸綜合征冠疫情爆發(fā)以來(lái),眾多研究人員在使用計(jì)算方法來(lái)鑒定用于治療網(wǎng)絡(luò)的算法,基于表達(dá)的算法和分子對(duì)接模擬算法(圖2-6和表2-/Mural通過(guò)虛擬藥物篩選識(shí)別和排序無(wú)MT-DTI篩選潛在的抗病毒藥物無(wú)具有結(jié)合親和力的藥物-靶標(biāo)無(wú)/Chen多理變分圖自編碼器對(duì)藥物的/yejinjkim/dr通過(guò)醫(yī)學(xué)知識(shí)圖譜發(fā)現(xiàn)候選藥物/Fan/Fan通過(guò)藥物功效篩選鑒定和排序/Baraba無(wú)轉(zhuǎn)錄組、蛋白質(zhì)組、結(jié)構(gòu)數(shù)據(jù)/uhlerlab/具有多頭注意力機(jī)制受新化學(xué)物質(zhì)干擾的基因表達(dá)/pth1993序列同一性和結(jié)構(gòu)相似性分無(wú)無(wú)端到端的深度神經(jīng)網(wǎng)蛋白質(zhì)配體相互作用概率預(yù)/ekraka/SSt基于各種結(jié)合能函數(shù)的排序,無(wú)①基于網(wǎng)絡(luò)的算法:藥物重定位的經(jīng)典方法是將基于網(wǎng)絡(luò)的算法[27,28]應(yīng)用于包含不同類型醫(yī)學(xué)實(shí)體(如疾病、藥物和蛋白質(zhì))之間關(guān)系的知識(shí)圖譜,以識(shí)別相關(guān)的宿主蛋白靶標(biāo)或宿主相互作用組的區(qū)域。病毒—宿主網(wǎng)絡(luò)基于這樣的假設(shè),即屬于復(fù)合物或信號(hào)通路的人類蛋白質(zhì)最接近病毒蛋白質(zhì)的人類相互作用物,并且是潛在的良好抑制目標(biāo)。Law等人[13]利用一種特殊的網(wǎng)絡(luò)標(biāo)方法相結(jié)合,對(duì)病毒—宿主相互作用組進(jìn)行識(shí)別,以識(shí)別額外的者(Receiver-Operator)特征曲線下的面積達(dá)到0.76。此外,所提出法表明,應(yīng)用于COVID-19藥物重定位研究的基于網(wǎng)絡(luò)的策略可以通過(guò)整合多種類型的模塊,包括病毒—宿主相互作用、蛋白質(zhì)—蛋白質(zhì)相互作用組網(wǎng)絡(luò)和藥物靶點(diǎn)來(lái)識(shí)別有效的可用藥物和藥物目標(biāo)物的一種方法是觀察疾病狀態(tài)下防御基因表達(dá)的變化,其可用作有效的疾病描述符或定量表型,同時(shí)可用于驅(qū)動(dòng)相反方向的基因表達(dá)以揭示天然產(chǎn)物或FDA批準(zhǔn)藥物的功效。實(shí)驗(yàn)結(jié)果表明,甘草素(Liquiritin)通過(guò)模仿I型干擾素發(fā)揮抗病毒作用,可作為治療③分子對(duì)接模擬算法:最近,分子對(duì)接模擬的顯著改進(jìn)[30]以及[24]充分利用了數(shù)學(xué)姿勢(shì)(MathPose)和卷積神經(jīng)網(wǎng)絡(luò)(MathDL)來(lái)預(yù)測(cè)SARS-CoV-23CL蛋白酶的空間結(jié)構(gòu)和蛋白質(zhì)—配體結(jié)合親和力。MathPose對(duì)接選定的已知復(fù)合物,生成的誘餌復(fù)合物被送入MathDL進(jìn)行藥物性質(zhì)評(píng)估。根據(jù)預(yù)測(cè)的結(jié)合親和力,作者向治療藥物研發(fā)過(guò)程。通常,計(jì)算式藥物研發(fā)系統(tǒng)由三個(gè)單元的知識(shí)[34],Zhavoronkov等人[35]提出了一種生成化學(xué)管道來(lái)設(shè)計(jì)編碼器、生成對(duì)抗網(wǎng)絡(luò)、遺傳算法和語(yǔ)言模型來(lái)研究藥物的化學(xué)性質(zhì),產(chǎn)生了幾種新的藥物化合物以供進(jìn)一步開(kāi)發(fā)。通過(guò)結(jié)合蒙特卡空間并同時(shí)提高替代分子模型準(zhǔn)確性的搜索和優(yōu)化策略顯著加快了圖2-7基于AI和ML方法的藥利用目標(biāo)蛋白的晶體和同源模型無(wú)抗病毒藥物采集、化學(xué)規(guī)則拆分結(jié)構(gòu)、片段采集、具有醫(yī)學(xué)化學(xué)/tbwxmu/通過(guò)基于結(jié)構(gòu)的虛擬篩選識(shí)別潛無(wú)和有效的多屬性控制采樣方案生無(wú)無(wú)定向消息傳遞神經(jīng)網(wǎng)絡(luò)結(jié)合遷移學(xué)習(xí)/pkuwang蒙特卡洛樹(shù)搜索算法和多任務(wù)神經(jīng)網(wǎng)通過(guò)迭代搜索和再訓(xùn)練策略發(fā)現(xiàn)無(wú)在藥物設(shè)計(jì)和開(kāi)發(fā)中,研究化學(xué)結(jié)構(gòu)和理化性質(zhì)與生物活性之間的關(guān)系是至關(guān)重要的。定量構(gòu)效關(guān)系(QuantitativeStructure-ActivityRelationship,QSAR)建模是一種計(jì)算方法,通過(guò)它可以在化學(xué)結(jié)構(gòu)和生物活性之間建立定量的數(shù)學(xué)模型。傳統(tǒng)QSAR模型大臺(tái)(https://www.vega-qsar.eu/)、QSAR-Co[42]、Transformer-CNN[43]和Chemception(https://github.建模提供了一條新的途徑。在藥物設(shè)計(jì)和發(fā)現(xiàn)中,藥物重新定位是指對(duì)已經(jīng)針對(duì)一種疾病情況開(kāi)發(fā)的藥物進(jìn)行調(diào)查,并針對(duì)其他疾病和算法的出現(xiàn)為該領(lǐng)域研究提供了平臺(tái),如DrugNet,DRIMC(/linwang1982/DRIMC)和DRRS[44]等。特別是最近,新冠肺炎成為一種全球性的流行病,世界各地的研究人員開(kāi)始尋找有前途的治療劑。在這方面,Hooshmand等人[45]基于神經(jīng)網(wǎng)絡(luò)藥物毒性是指化學(xué)分子由于化合物的作用方式或新陳代謝方式分子與靶點(diǎn)結(jié)合和未結(jié)合時(shí)的效應(yīng),以及體內(nèi)安全性分析。已經(jīng)開(kāi)床試驗(yàn)中毒性概率的預(yù)測(cè)和分類。例如,Robledo-Cadena等人[48]使細(xì)胞的療效的影響,并確定了2,576種小分子的新適應(yīng)癥,結(jié)合了眾所周知,每一種化合物都與溶解度、分配系數(shù)、電離度、滲透系數(shù)等物理化學(xué)性質(zhì)有關(guān),這可能會(huì)阻礙化合物的藥代動(dòng)力學(xué)特性和藥物靶向結(jié)合效率。因此,在設(shè)計(jì)新的藥物分子時(shí),必須考慮化合物的物理化學(xué)性質(zhì)。為此,已經(jīng)開(kāi)發(fā)了不同的基于人工智能的),此外,藥物分子的治療活性取決于其與受體或靶點(diǎn)的結(jié)合效率,因此,預(yù)測(cè)化學(xué)分子與治療靶點(diǎn)的結(jié)合親和力對(duì)于藥物的發(fā)現(xiàn)和開(kāi)發(fā)至關(guān)重要。人工智能算法的最新進(jìn)展增強(qiáng)了該過(guò)程,使用相似性特征已經(jīng)開(kāi)發(fā)了幾個(gè)基于網(wǎng)絡(luò)的工具,如ChemMapper和相似集合方法。此外,還構(gòu)建了基于ML和DL的藥物靶標(biāo)親和力識(shí)別模型[49],給病人任何不適當(dāng)劑量的藥物都可能導(dǎo)致不良和致命的副作用,多年來(lái),確定能夠以最小毒副作用達(dá)到預(yù)期效果的藥物的最佳劑量人[50]開(kāi)發(fā)了一個(gè)基于人工智能的平臺(tái),稱為AI-抗逆轉(zhuǎn)錄病毒療法治療艾滋病毒的最佳劑量和藥物組合。AI-PRS是一種神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的方法,它通過(guò)拋物線響應(yīng)曲線(ParabolicResponseCurve,PRC)將藥物組合和劑量與療效聯(lián)系起來(lái)。在他們?cè)鰪?qiáng)回歸樹(shù)、多元自適應(yīng)回歸樣條等ML技術(shù)來(lái)確定免疫抑制藥物最近研究已經(jīng)開(kāi)發(fā)了多種在線工具來(lái)分析藥物釋放,以及選定常用的是基于化學(xué)特征的藥效團(tuán)評(píng)價(jià)。為了研究基于配體的化學(xué)性人工智能研究人員可以確定用于與疾病相關(guān)的特定靶點(diǎn)的生物活性例如,Wu等人利用集成DL和RF的方法設(shè)計(jì)了WDL-RF(/WDL習(xí)方法pairwiseMKL(/aalto-ics-kepaco)[55],并用由于數(shù)據(jù)量巨大,并且需要自動(dòng)抽象特征學(xué)習(xí),人工智能在疫疾病疫苗的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)模型主要集中在人工神經(jīng)網(wǎng)絡(luò)、梯度提升決策樹(shù)和深度神經(jīng)網(wǎng)絡(luò)等預(yù)測(cè)算法模型中[56]。Fast等人[57]使用兩種名為MARIA和NetMHCPan4的人工神經(jīng)網(wǎng)絡(luò)算法來(lái)識(shí)別基于病毒蛋白抗原呈遞和抗體結(jié)無(wú)無(wú)無(wú)可應(yīng)對(duì)病毒變異的多表位疫苗的此外,Prachar等人[59]提出通過(guò)前饋神經(jīng)網(wǎng)絡(luò),確定了174個(gè)具有較高的預(yù)測(cè)結(jié)合分?jǐn)?shù)。重要的是,作者評(píng)估了目前識(shí)別SARS-基于此,該研究中經(jīng)驗(yàn)證的結(jié)合或非結(jié)合肽被用于進(jìn)一步開(kāi)發(fā)COVID-19的疫苗和治療。Yang等人[60]還提出了一種基網(wǎng)絡(luò)的方法,名為DeepVacPred,用于預(yù)測(cè)和設(shè)計(jì)多表位疫苗。在過(guò)去的幾年里,制藥行業(yè)的數(shù)據(jù)數(shù)字化有了很大的增長(zhǎng)。然而,數(shù)字化帶來(lái)的挑戰(zhàn)是如何應(yīng)用這些數(shù)據(jù)來(lái)解決復(fù)雜的臨床問(wèn)題。這激發(fā)了人工智能的使用,因?yàn)樗梢酝ㄟ^(guò)增強(qiáng)的自動(dòng)化處理大量數(shù)據(jù)。人工智能是一個(gè)以技術(shù)為基礎(chǔ)的系統(tǒng),包括各種先進(jìn)的工具和網(wǎng)絡(luò),可以模仿人類的智能。人工智能利用能夠解釋和學(xué)習(xí)輸入數(shù)據(jù)的系統(tǒng)和軟件,為實(shí)現(xiàn)特定的目標(biāo)做出獨(dú)立的決定。人工智能三、人工智能在制藥行業(yè)的應(yīng)用現(xiàn)狀藥物發(fā)現(xiàn)是一個(gè)眾所周知的漫長(zhǎng)、復(fù)雜和昂貴的過(guò)程,需要世界上最聰明的人共同努力。隨著每一篇新的研究論文的發(fā)表和每一種新化合物的測(cè)試,理解人類生理和分子機(jī)制的復(fù)雜性不斷增加。隨著世界在試圖適應(yīng)和抵御冠狀病毒方面面臨新的挑戰(zhàn),人工智能最近對(duì)藥物開(kāi)發(fā)人工智能的大量投資意味著這些初創(chuàng)公司擁有開(kāi)發(fā)技術(shù)的人力和資源。與醫(yī)療成像領(lǐng)域的人工智能相比,總投資了基于人工智能的新藥研發(fā)所需要的條件及關(guān)鍵性技術(shù)競(jìng)爭(zhēng)點(diǎn)。這人工智能成為國(guó)際競(jìng)爭(zhēng)的新焦點(diǎn)。人工智能是引領(lǐng)未來(lái)的戰(zhàn)略性技術(shù),世界主要發(fā)達(dá)國(guó)家把發(fā)展人工智能作為提升國(guó)家競(jìng)爭(zhēng)力、維護(hù)國(guó)家安全的重大戰(zhàn)略,加緊出臺(tái)規(guī)劃和政策,圍繞核心技術(shù)、頂尖人才、標(biāo)準(zhǔn)規(guī)范等強(qiáng)化部署,力圖在新一輪國(guó)際科技競(jìng)爭(zhēng)中掌握主導(dǎo)權(quán)。針對(duì)基于人工智能的新藥研發(fā),企業(yè)必須把人工智能發(fā)展放在企業(yè)戰(zhàn)略層面系統(tǒng)布局,打造競(jìng)爭(zhēng)新優(yōu)勢(shì)、開(kāi)拓市場(chǎng)新空間。①數(shù)據(jù)質(zhì)量:構(gòu)建有效且可解釋的藥物發(fā)現(xiàn)模型的方法之一是使用與藥物相關(guān)的實(shí)體來(lái)構(gòu)建神經(jīng)網(wǎng)絡(luò)模型。然而,這樣的算法具有固有的局限性。例如,為了定義和獲得更大范圍的藥物—靶點(diǎn)相互作用數(shù)據(jù),設(shè)置了較低的親和力閾值,這可能會(huì)導(dǎo)致預(yù)測(cè)性能出現(xiàn)偏差。此外,大多數(shù)研究都沒(méi)有評(píng)估藥物—靶點(diǎn)相互作用可能是②算法設(shè)計(jì):大多數(shù)研究中使用的低水平窮舉對(duì)接算法在尋找具有局部最小值的受體—配體相互作用時(shí)遇到困難,導(dǎo)致高度的親和力可變性。此外,對(duì)接算法的高計(jì)算負(fù)擔(dān)限制了其在大型化合物庫(kù)中的應(yīng)用。此外,對(duì)接算法在許多情況下使用不同的評(píng)估評(píng)分標(biāo)準(zhǔn)生成不同的候選集。因此,對(duì)接算法的選擇、算法結(jié)構(gòu)的設(shè)計(jì)和③臨床試驗(yàn):藥物或疫苗開(kāi)發(fā)與臨床應(yīng)用的計(jì)算工作之間的轉(zhuǎn)化差距是計(jì)算生物學(xué)和醫(yī)學(xué)領(lǐng)域的一個(gè)主要且被廣泛認(rèn)可的瓶頸。許多預(yù)測(cè)的藥物和疫苗尚未進(jìn)入臨床試驗(yàn)。盡管如此,由于難以確④硬件設(shè)施:在人工智能領(lǐng)域進(jìn)行高額投資,但僅靠人工智能技術(shù)是遠(yuǎn)遠(yuǎn)不夠的,還需要相配套的硬件來(lái)支撐高性能算法,同時(shí)不占用太多空間和消耗過(guò)多電力,以適應(yīng)臨床實(shí)際應(yīng)用。在人工智能核心硬件方面,根據(jù)應(yīng)用領(lǐng)域不同,可以將智能芯片分為云端人工智能芯片、邊緣人工智能芯片、新型人工智能芯片3類。在云端,定制人工智能芯片使用專用架構(gòu)實(shí)現(xiàn)了比同期中央處理器(Central一席之地,具有支持大規(guī)模并行、推理延時(shí)低、可變精度等特點(diǎn)。在邊緣計(jì)算領(lǐng)域,智能手機(jī)是目前應(yīng)用最為廣泛的邊緣計(jì)算設(shè)備,藥物研發(fā)是未來(lái)邊緣人工智能計(jì)算的最重要應(yīng)用之一,為此,推理計(jì)算能力、功耗和成本是應(yīng)用于邊緣設(shè)備人工智能芯片關(guān)注的主要因素。目前,云端和邊緣設(shè)備在各種人工智能應(yīng)用中通常是配合工作的,隨著邊緣設(shè)備能力不斷增強(qiáng),越來(lái)越多的計(jì)算工作負(fù)載將在邊緣設(shè)備上執(zhí)行。新型人工智能芯片主要包括神經(jīng)形態(tài)芯片、近內(nèi)總括而言,本報(bào)告預(yù)計(jì)未來(lái)用于藥物和疫苗開(kāi)發(fā)的先進(jìn)AI/ML方法將在輸出生成、多維數(shù)據(jù)集成、算法結(jié)構(gòu)部署和工作機(jī)制解釋抗網(wǎng)絡(luò)(GenerativeAdversarialNetworks,GANs)的出現(xiàn)促使該行業(yè)利用該技術(shù)探索化學(xué)分子的生成;同時(shí),圖像處理、語(yǔ)音識(shí)別等域發(fā)展的起步階段。第一批成長(zhǎng)中的AI藥企(包括Exscientia、InsilicoMedicine、晶泰科技等)大多誕生于這段時(shí)間,并陸續(xù)完成期,AI制藥企業(yè)資金和新藥研發(fā)實(shí)力不足,同時(shí)也需要進(jìn)行大量的整個(gè)行業(yè)經(jīng)歷了緩慢發(fā)展的過(guò)渡期。雖然人工智能在新藥研發(fā)的某些環(huán)節(jié)可以加速和提高效率,但其整體優(yōu)勢(shì)并不明顯。在這階段,提高新藥研發(fā)某個(gè)點(diǎn)或環(huán)節(jié)的效率,而是追求更端到端的解決方案等,開(kāi)始獲得臨床候選分子的驗(yàn)證結(jié)果。越來(lái)越多的人開(kāi)始相信借國(guó)別英國(guó)位主要以人工智能技術(shù),借助深度學(xué)習(xí)和知識(shí)圖譜,提取出能夠推動(dòng)藥物研發(fā)的知識(shí)和新的可以被驗(yàn)證的假說(shuō),從而加速藥物研發(fā)的過(guò)程。并通過(guò)知識(shí)網(wǎng)絡(luò)圖譜分析與識(shí)別,篩選出巴瑞替尼(Baricitinib)對(duì)治療新冠肺炎英國(guó)供商,主要業(yè)務(wù)是利用已開(kāi)發(fā)的人工智能平臺(tái)進(jìn)行自動(dòng)化藥物的研發(fā)指導(dǎo),利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)方法,自動(dòng)設(shè)計(jì)出上百萬(wàn)種與特定靶標(biāo)相關(guān)的小分子化合物,縮短新藥研發(fā)美國(guó)測(cè)建立了第一個(gè)基于結(jié)構(gòu)的藥物設(shè)計(jì)的深層神經(jīng)網(wǎng)絡(luò),幫助研究人員應(yīng)對(duì)慢性疾病、癌癥、突發(fā)性硬化、糖尿病、埃博拉、瘧疾、耐抗生素細(xì)菌等問(wèn)題。其卷積神經(jīng)網(wǎng)絡(luò)具有自主學(xué)習(xí)空間,能夠通過(guò)化學(xué)特性預(yù)測(cè)那些藥物分子式可能是有效的,并避免毒性問(wèn)美國(guó)構(gòu)建其機(jī)器學(xué)習(xí)藥物發(fā)現(xiàn)平臺(tái),同時(shí)提供旨能力。此外,該公司將繼續(xù)推進(jìn)臨床前和臨床資產(chǎn)管線,包括腦海綿狀血管畸形和神經(jīng)床前和臨床化合物的獨(dú)特適應(yīng)癥的評(píng)估,并在6種以上的疾病中發(fā)現(xiàn)了新的候選治療藥中國(guó)在其自主研發(fā)的人工智能平臺(tái)的支持下,英矽智能已在前沿領(lǐng)域布局了快速增長(zhǎng)的療法組合。其內(nèi)部在研項(xiàng)目中有7個(gè)項(xiàng)目進(jìn)入成致死”抗腫瘤療法。此外,英矽智能內(nèi)部在研項(xiàng)目中進(jìn)展最快的抗纖維化項(xiàng)目也已成功完成了0期微劑量組試驗(yàn),目前正在健康志中國(guó)位與英偉達(dá)密切合作,將高性能計(jì)算技術(shù)整合域領(lǐng)先的GPU產(chǎn)品和技術(shù),包括NVIDIAAutodock-GPU等套件,加速藥物發(fā)現(xiàn)的進(jìn)程,降低研發(fā)成本,提升藥物開(kāi)發(fā)的效率,助力銳格醫(yī)藥研發(fā)出更多、更好的潛在首創(chuàng)中國(guó)大分子藥物開(kāi)發(fā)平臺(tái),提升大分子藥物研發(fā)的質(zhì)量與效率。信華生物目前聚焦腫瘤免疫治療等領(lǐng)域內(nèi)未滿足的醫(yī)療需求,多個(gè)項(xiàng)目中國(guó)將英矽智能端到端人工智能驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái),與復(fù)星醫(yī)藥強(qiáng)大的臨床開(kāi)發(fā)和商業(yè)推廣能力相結(jié)合,發(fā)現(xiàn)和開(kāi)發(fā)創(chuàng)新藥物和療法的組合,并獲得英矽智能人工智能平臺(tái)Pandaomics和Chemistry42的公司內(nèi)部人工智能驅(qū)動(dòng)的藥物發(fā)現(xiàn)和開(kāi)發(fā)工中國(guó)中國(guó)工程院院士丁健領(lǐng)銜,建立了以“生物標(biāo)志物指導(dǎo)下的”精準(zhǔn)醫(yī)療平臺(tái);專注于抗腫瘤創(chuàng)新藥物發(fā)現(xiàn)、開(kāi)發(fā)、生產(chǎn)及商業(yè)化的中國(guó)學(xué)利用AI快速識(shí)別處理繁多結(jié)構(gòu)化的研發(fā)數(shù)據(jù),結(jié)合醫(yī)藥研發(fā)專家的領(lǐng)域知識(shí),構(gòu)建了億級(jí)別的超高通量分子篩選系統(tǒng)、多維度分子生成系統(tǒng)和基于映射數(shù)據(jù)庫(kù)的分子優(yōu)化系中國(guó)與輝瑞制藥簽訂戰(zhàn)略研發(fā)合作,融合量子物理與人工智能,建立小分子藥物模擬算法平臺(tái),提高算法的精確度和適用廣泛度,驅(qū)動(dòng)中國(guó)開(kāi)發(fā)新一代人工智能技術(shù),賦能大分子藥物流程,從而極大程度上提高新藥研發(fā)速度和創(chuàng)新支持環(huán)境為這些科創(chuàng)企業(yè)帶來(lái)了非常有利的機(jī)遇。從創(chuàng)業(yè)團(tuán)隊(duì)/organization/exscientia/company_fin有新投資者IntermountainVentures、明尼蘇達(dá)大學(xué)(UniversityofMinnesota)、德克薩斯理工大學(xué)(/organization/insilico-medicine/company_finan月,晶泰科技完成3.188億美元C輪融資,由晨興資本、軟銀愿景如上海海和藥物研究開(kāi)發(fā)股份有限公司等的創(chuàng)立,并以企業(yè)研發(fā)持續(xù)開(kāi)展。相對(duì)而言,我國(guó)該領(lǐng)域的研發(fā)跟隨國(guó)際,在新冠疫情之后研究團(tuán)隊(duì)開(kāi)始增加,并注重成果轉(zhuǎn)化的同步進(jìn)行?;谥袊?guó)國(guó)內(nèi)院校學(xué)者的調(diào)研及文獻(xiàn)報(bào)道,本報(bào)告檢索到國(guó)內(nèi)學(xué)者的研究現(xiàn)狀,如中科院上海藥【肽合成與小分子設(shè)計(jì)】通過(guò)計(jì)算信息科學(xué)等多學(xué)科交叉,利用深度神經(jīng)網(wǎng)絡(luò)開(kāi)展(DrugSpaceX)有杰出貢獻(xiàn),同時(shí)還聯(lián)合華為云發(fā)布了基于ModelArts平臺(tái)的藥物中科院微生物【理化性質(zhì)和生物活性的預(yù)測(cè)】長(zhǎng)期專注微生物組的生物信息學(xué)方法和應(yīng)用研究?,F(xiàn)階段在機(jī)器學(xué)習(xí)、人工智能與微生物組結(jié)合的領(lǐng)域有多個(gè)前沿項(xiàng)目。通過(guò)利用深度學(xué)習(xí)算法,構(gòu)建了構(gòu)建了從人類腸道微生物組挖掘潛在新型抗菌肽的模型,預(yù)測(cè)中科院深圳先【定量構(gòu)效關(guān)系建模與藥物再利用】主要藥物設(shè)計(jì),基于人工智能的藥物篩選平臺(tái),疾病模型的建立,原生態(tài)細(xì)胞膜環(huán)境【蛋白質(zhì)折疊和蛋白質(zhì)相互作用的預(yù)測(cè)】發(fā)展針對(duì)生物和化學(xué)體系的理論與計(jì)算方法,特別是基于統(tǒng)計(jì)力學(xué)和機(jī)器學(xué)習(xí)的計(jì)算方法與軟件的開(kāi)發(fā),染色質(zhì)三維結(jié)、生AlphaFold2算法的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)推理工【肽合成與小分子設(shè)計(jì)】主要方向?yàn)榛谥卮蠹膊〉脑瓌?chuàng)小分子藥物發(fā)現(xiàn),以及人工智能的藥物分子設(shè)計(jì)及應(yīng)用研究。團(tuán)隊(duì)轉(zhuǎn)讓給上海復(fù)星醫(yī)藥產(chǎn)業(yè)有限公司,2019清華大學(xué),彭【蛋白質(zhì)折疊和蛋白質(zhì)相互作用的預(yù)測(cè)】主要研究領(lǐng)域?yàn)樯镄畔W(xué)、化學(xué)信息學(xué)人工智能技術(shù)融合生物醫(yī)藥產(chǎn)業(yè)正迎來(lái)新的發(fā)展階段,機(jī)遇和挑戰(zhàn)并存。傳統(tǒng)生物醫(yī)藥行業(yè)利用高通量篩選方式進(jìn)行目標(biāo)化合物的篩選,人力、時(shí)間和試錯(cuò)成本均很高。大數(shù)據(jù)時(shí)代下,人工智能平臺(tái)開(kāi)發(fā)的虛擬計(jì)算能基于基因和疾病的關(guān)聯(lián)機(jī)制建立數(shù)據(jù)模型,高效尋找新藥靶點(diǎn),設(shè)計(jì)和合成有生物活性的分子,預(yù)測(cè)藥物發(fā)現(xiàn)和開(kāi)發(fā)過(guò)程中的藥效、藥代、毒性、穩(wěn)定性等,大幅度降低研發(fā)成盡管取得了巨大的成功,但仍然存在許多挑戰(zhàn),其中有兩個(gè)最重要的問(wèn)題:首先,標(biāo)記不能是二元的,因?yàn)樗幬镌谏锵到y(tǒng)中的作用是復(fù)雜的;其次,雖然數(shù)據(jù)庫(kù)擁有海量信息,但藥物發(fā)現(xiàn)中可用的高質(zhì)量數(shù)據(jù)并不多。因此,需要一個(gè)不僅能提供數(shù)據(jù)數(shù)量而且能提供質(zhì)量的平臺(tái)。盡管將人工智能工具融入藥物發(fā)現(xiàn)過(guò)程中存在一些不可避免的障礙,還有大量的工作要做,但毫無(wú)疑問(wèn),在不久是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、是由大量處理單元互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng)。它是在現(xiàn)代神經(jīng)科學(xué)研究成果的基礎(chǔ)上提出的,試圖通過(guò)模擬大腦是應(yīng)用量子力學(xué)、分子動(dòng)力學(xué)、構(gòu)效關(guān)系等基礎(chǔ)理論數(shù)據(jù)研究是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度是學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過(guò)程中獲得的信息對(duì)諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識(shí)別文字、是專門研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。蛋白質(zhì)—蛋白質(zhì)相互作用(Protein-ProteinInter是在兩個(gè)或多個(gè)蛋白質(zhì)分子之間建立的高特異性物理接觸,這是由包括靜電力、氫鍵和疏水效應(yīng)在內(nèi)的相互作用引導(dǎo)的生化事件定量構(gòu)效關(guān)系(QuantitativeStructure-ActivityRelationship,是一種借助分子的理化性質(zhì)參數(shù)或結(jié)構(gòu)參數(shù),以數(shù)學(xué)和統(tǒng)計(jì)學(xué)手段定量研究有機(jī)小分子與生物大分子相互作用、有機(jī)小分子在生identifyingdrivergenesincancersequencingstudies[J].NuclcAcid2019(8):e45-e45.PeptidesPredictionwithDeepLearning[rapididentificationofpotentDDR1kinaseinhibitors[J].NatureBiotechnology,2019,37(9):1038-10encodedlibraries:Anewparadigmforhit-finding[J].arXInhibitorsforAntirheumatoidArthritisTargetsBasedonArtifiIntelligence[J].ACSC[7]Zhu-Hong,You,Ying-Ke,etal.Predictionoffromaminoacidsequenceswithensprincipalcomponentanalysis[J].BMCBopinionondrugdiscovery,England:2020,15(10):1165-118toUltraHighThroughputLigand-BasedVirtualScrChemicalInformation&Modeling,2016:1399-1404.large-scaleprospectivevirtualscreeningusingultrafastshaperecognitiontechniques[J].NucleicAcidsResearch,2016(W1):W436-bindingmodepredictionandvirtualscreeningusingknownprotein-ligandinteractions[J].Bioinformatics,2019,35(19):3836-3838.[13]LawJN,NTasnina,KshirsagarM,etal.Identifyinghumaninteractorsoflabelpropagation[J].arXivpreprintarXiv:2006.0196Coronavirus2019-nCov.[J].Interdisciplinasciences,2020,12(3):368-376.drugsthatmayactonthenovelcoronavirus(2019-nCoV),LigandPredictionFrameworkforCOVID-1Model[J].CognitiveComputation,2021(4):1-13.TherapeuticsforCOVID-19usingDeepLearning[J].JournalofProteomeResearch,2020,19(11):4624-4636.usingGraphNeuralNetworkwithGenediscoveredapotentialtherapeuticNationalAcademyofSciencesoftheUnitedStatesofAmerica,liquiritininhibitsSARS-CoV-2bymimicking[23]Pham,Thai-HoangCOVID-19drugrepurposing[J].Naturemachineintelligence,2021,3(3):2r2019-nCoV[J].bioRxiv,ColdSpringHaDrugs-InDepthDrugDatabaseScreeningUsingDeepNeuralNetworkFrameworkSSnet,ClassicalVirtualScreeningandDocking.2020,22rCOVID-19:Rapidpredictionofcommerciallyavailabledrugsthroughmachinelearninganddocking[J].PLoSONE,ridentifyingthetranscriptformation.[J].Moleculartherapy.Nucleicacids,2021,23:347-354.RelationshipbyReconstructingGene-LevelComputationalandstructuralbiotechnologyjournal,2019,17:195-205.CompoundsasH1RandCL1RInhibitorsandItsAntiallergicEfficaMolecularDockingApproach[J].ComputationalandMathematicalMethodsinMedicine,2021,2021(1):1modelforidentifyingneuroBriefingsinbioinformatics,England:2021,22(6).bidirectionalencoderrepresentationsfrforimprovingthepredictionofbitterpeptides[J].Bioinformatics,2021.forimprovingthepredictionofIL-6inducingpeptides[JBioinformatics,2021(6):6.molecularlifescie[35]ZhavoronkovA,AladinskiyNovoMolecularDesignTargetingCOVID-19[J].ACSOmega,InhibitorsofSARS-CoV-2MainProteaseCompounds.[J].Molecularinformatics,2020,39(8):e2000028.preprintarXiv:2004.01215,2020.entitiesforSARS-CoV-2usingartificialintelligence[J].FutureMeChemistry,2021(2):575-585.screenpotentialantivibioinformatics,OxfordUniversityPress,2021.SourceSoftwareforDevelopingRobustClassification-BasedQSARModelModeling,2019,59(6):2538-2544.Rmodelingandinterpretation[J]Low-RankMatrixApproximationandBioinformatics(11):1904-1912.learning-baseddrugrepurposingapproachfortreatmentofCOVID-19MolecularDiversity,2020:3:1717-1730.[46]Mayr,Andreas,etal.DeepTox:toxicitypredictionusingdeeplearning[JSuccessesandFailuresofClinicalTrials[J].frameworktodiscovernewindicationsforsmallmolComputationalBiologyApproachforProtein–LigandBindingAffinityPrediction[J].MolecularInformatics,2020,40(5):200[50]HarnessingArtificialIntelligencetooptimizeLong-TermMaintenanceDosingforAntiretroviral-NaiveAdultswithHIV-1Infection[J].AdvancedtoPredictTacrolimusStableDoseinRenalTransplantRecipReports,2017,7:42192.[52]HuYH,TaiCT,TsaiCF,HuangMW.ImprovementofAdeqDosage:AnApplicationofMachineLearningApproach.[J].Journalofhealthcareengineering,2018,2018:3948245.InitialDoseSettingsofVancomycinUsingMachineLearning[J].Biological&PharmaceuticalBulletin,2020,43(1):188-bioactivitiesofligandmoleculesactingwithGprotein-couplcombiningweighteddeeplearningandrandomforest[J].Bioinformatics,2018,2(13):13.bioactivityprediction.[J].Bioinformatics,2018,34(13):i509-i518.FM-DNNLearning[J].CurrentBioinformatics,2020,15(1):68-76.BioRxiv,ColdSpringHvalidationof174COVID-19vaccine

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論