




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、計(jì)算機(jī)化學(xué)前沿課題簡(jiǎn)介 中國科學(xué)院長(zhǎng)春應(yīng)用化學(xué)研究所 許祿,一. 計(jì)算機(jī)輔助分子設(shè)計(jì) I. 構(gòu)效關(guān)系(QSAR/QSPR)研究 II. 全新藥物設(shè)計(jì) III.組合化學(xué)與藥物設(shè)計(jì) 二. 有機(jī)化合物結(jié)構(gòu)解析 專家系統(tǒng) 三. 計(jì)算機(jī)輔助合成 四. 新的化學(xué)計(jì)量學(xué)方法,一.計(jì)算機(jī)輔助分子設(shè)計(jì) (Computer-aided molecular design),I. 構(gòu)效關(guān)系研究 (Quantitative Structure-Activity/Property Relationship study, QSAR/QSPR) 基本假設(shè): 化合物的結(jié)構(gòu)與其活性/性質(zhì)是 相關(guān)的; 化合物的結(jié)構(gòu)與其活性/性質(zhì)不
2、 是一一對(duì)應(yīng)的.,分子結(jié)構(gòu)圖,活性/性質(zhì),結(jié)構(gòu)特征,統(tǒng)計(jì)函數(shù)或模式識(shí)別,數(shù)學(xué)模型,結(jié)構(gòu)特征,統(tǒng)計(jì)函數(shù)或 模式識(shí)別,?,Y = f(x1,x2,xm) 式中: Y為活性/性質(zhì); x1,x2,xm為結(jié)構(gòu)特征。,體重 f(身高) 體重:y 身高:x 體重 f(身高,腰圍) 體重:y 身高:x1,腰圍:x2,結(jié)構(gòu)圖輸入,特征計(jì)算 (得到自變量),特征分析 (自變量選擇),3D結(jié)構(gòu)模型的建立,數(shù)學(xué)模型建立及預(yù)測(cè),如:y: 正烷烴分子的沸點(diǎn);x:分子中碳原子的數(shù)目,特征的主要類型: (1)拓?fù)漕悈?shù):如圖論指數(shù) (即拓?fù)渲笖?shù)),結(jié)構(gòu)片斷等; (2)幾何類參數(shù):如鍵長(zhǎng),鍵角, 二面角等; (3)電子類參:如
3、,量化參數(shù)等; (4)物理化學(xué)類參數(shù):如疏水性參 數(shù),超熱力學(xué)參數(shù)等。,二維構(gòu)效關(guān)系研究 (2D QSAR/QSPR) 不主要運(yùn)用3D結(jié)構(gòu)特征,在本研究工作中,苯胺類化合物的生物毒性是該化合物對(duì)小鼠的口服毒性半致死量LD50,即引起半數(shù)受試小鼠死亡所需的苯胺化合物的劑量。實(shí)驗(yàn)數(shù)據(jù)來源于美國國家職業(yè)安全與衛(wèi)生所編制發(fā)行的RTECS(Registory of Toxic Effects of Chemical Substances)。 苯胺類化合物 的母體結(jié)構(gòu)為: * Xu Lu et al., Science in China (Series B), 2000, 43, 129-136,苯胺類化
4、合物的結(jié)構(gòu)及其生物毒性,Table 1 Substituted amino-benzens and their toxicity No.R1R2R3R4R5 -log(LD50) -log(LD50) diff. (obs)(cal) 1MeHHHH-2.826-2.8540.028 2HMeHHH-2.653-2.6970.044 3HHMeHH-2.817-2.778-0.039 4EtHHHH-3.100-3.084-0.016 5isopropHHHH-3.072-3.067-0.005 6MeMeHHH-2.970-2.9800.010 7MeHMeHH-3.113-3.097-0.
5、016 8MeHHMeH-2.924-2.919-0.005 9MeHHHMe-2.924-2.917-0.007 10HMeMeHH-2.909-2.9150.006 11HMeHMeH-2.849-2.834-0.015 12MeHHHEt-3.072-3.1060.034 13EtHHHEt-3.255-3.2760.021 14MeHMeHMe-2.871-2.9030.032,15HCF3HHH-2.681-2.6850.004 16HClHHH-2.408-2.4190.011 17HHClHH-2.491-2.5010.010 18HClClHH-2.812-2.767-0.04
6、5 19MeClHHH-2.759-2.694-0.065 20MeHHClH-2.667-2.6690.002 21ClHMeHH-2.565-2.5800.015 22HHFHH-2.620-2.6340.014 23HHBrHH-2.659-2.657-0.002 24HNO2HHH-2.728-2.687-0.041 25HHNO2HH-2.875-2.8750.000 26MeHHNO2H-2.759-2.7600.001 27NO2HClHH-2.602-2.6050.003 28HNO2ClHH-2.602-2.601-0.001 29NO2HNO2HH-2.621-2.6340
7、.013,1. Calculation of descriptors Quantum-chemical parameters: 7; Molecular connectivity indices mxt: 11; Topological indices Ami: 3 Indicative variable I: 1 Total: 22 e.g., Hform, -Ehomo, , - Elumo, mxt, Ami. * Yu-Xin Zhou, Lu Xu et al.,Chem. Intell. Lab. Syst., 1999, 45, 95-100,1. Calculation of
8、Descriptors,2. Selection of Descriptors (1)經(jīng)典方法 向前法 向后法 逐步回歸法 (2)主成分分析 (3)正交變換 (4)Leaps-and-Bounds Regression (5)模擬退火法 (6)遺傳算法 (7)人工神經(jīng)網(wǎng)絡(luò)法 * Xu Lu et al., Anal. Chim. Acta,2001, 446, 477-483,Leaps-and-Bounds Regression _ No Descriptor R F S - 1 1 0.084 4.6 0.14 2 1,7 0.831 5.6 0.13 3 1,2,7 0.833 18.9
9、 0.12 4 1,2,3,7 0.868 18.4 0.11 5 1,2,3,5,7 0.901 19.8 0.097 6 1,2,3,5,6,7 0.913 12.5 0.098 7 1,2,3,5,6,7,8 0.913 15.1 0.096 _,數(shù)學(xué)方法的選擇 (1)多元回歸分析 (2)人工神經(jīng)網(wǎng)絡(luò)方法 (3)CoMFA方法,The rule: n/m5 n: number of samples; m: number of variables. -log(LD50) = -0.760 - 1.744*10-3Ef - 5.452*10-2EL - 1.295*10-2Am3 + 1.5
10、56*10-3Ep -1.171*10-3Ee R = 0.901, F = 19.8, S = 0.097, n = 29 where Ef : heat of formation; EL : LUMO ; Am3: topological index; Ep : repulse energy; Ee : electronic energy.,3. Multiple Regression,4. Artificial Neural Network,Algorithm: BFGS quasi-Newton method Architecture: 6: 3: 1 Results: (Regres
11、sion) R = 0.967 (R = 0.901) F = 386.6 (F = 19.8 ) S = 0.053 (S = 0.097) These are much better than those obtained by multiple regression analysis.,三維構(gòu)效關(guān)系研究 (3D QSAR/QSPR) 80年代出現(xiàn)了多種3D-QSAR方法,但目前最重要最為廣泛應(yīng)用的是CoMFA (Comparative Molecular Field Analysis)方法。 Cramer III R D et al., J. Am. Soc.,1998,110,5959
12、-5967),CoMFA方法1988-1998 發(fā)表文章情況為: 1988-1992 80 1993-1997 287 1998 97,其應(yīng)用包括: Various 3D-QSAR applications Interaction energy fields Nonlinearity Superposition Conformational analysis Molecular similarity PLS algorithms Neural networks Molecular diversity,在3D QSAR 研究中 CoMFA的單獨(dú)應(yīng)用 已用于多類化合物。這些化合 物主要分為: (1
13、)藥物 (2)環(huán)境中的有害有機(jī)化合物 (3)其他,(1) 苯甲酰胺類化合物的結(jié)構(gòu)/活 性的QSAR研究 吳亞平,許祿等,高等學(xué)校化學(xué)學(xué)報(bào),1998, 19, 694 Yu-Xin Zhou, Lu Xu et al., Chemom. Intell. Lab. System.,1999, 45, 95,苯甲酰胺類化合物的母體結(jié)構(gòu)為:,The compounds and their activities,A. 多元回歸分析 特征的提取 電子特征:主要為量化參數(shù) 拓?fù)涮卣鳎悍肿舆B接性指數(shù)mxt: 0 xp, 1xp, 2xp,6xpc (共18個(gè)) 特征的選擇 初選后剩6個(gè):0 xp, 4xp,
14、5xp, 6xp, 4xch,6xch,Results with Leaps-and- Bounds regression analysis _ NoVariable RF _ 15 0.863061.78 23, 5 0.875132.71 32, 3, 5 0.886523.25 42, 3, 5, 6 0.889917.12 52, 3, 4, 5, 6 0.890613.04 61, 2, 3, 4, 5, 6 0.890610.23 _, 回歸結(jié)果 經(jīng)驗(yàn)規(guī)則: n/m 5 logRI = 3.002 +0.8909 4xp - 1.3465 5xp -13.9234 6xch R =
15、 0.8865, F = 23.24, S = 0.572,B. CoMFA方法 化合物的重疊 模板化合物:1(抗炎活性最大) 重疊原子: 8、9和16 使重疊后的均方根 偏差為最小。, 探針: H+ 空間網(wǎng)格大小: 對(duì)于x, y, z三坐標(biāo)均為 從-1.3nm到 1.9nm, 結(jié)果的比較,3D QSAR CoMFA: R = 0.993 S.D. = 0.128,2D QSAR 多元回歸分析: R = 0.887 S.D. = 0.572,No logIR(cal) logIR(obs) Err,觀測(cè)值、計(jì)算值及差值,三維空間立體能輪廓圖和靜電能輪廓圖,(2) 新型抗艾滋病藥物吡喃酮類化合物
16、的三維定量構(gòu)效關(guān)系研究 (a)母體結(jié)構(gòu),19個(gè)吡喃酮類化合物的結(jié)構(gòu)及活性,(b)實(shí)驗(yàn)條件 模板化合物:15 網(wǎng)格大小: x: -1.7-1.0 (nm) y: -1.9-0.5 (nm) z: -1.9-1.0 (nm) 探針:sp3 C+,(c)結(jié)果 R = 0.984 F = 103 S = 0.011 立體能/靜電能 = 0.852/0.148,立體能和靜電能輪廓圖,立體能輪廓圖,靜電能輪廓圖,2. CoMFA與其它方法 的結(jié)合 我們發(fā)現(xiàn): CoMFA方法對(duì)某些類化合物的適應(yīng)性較 差,但與其它方法相結(jié)合,或者說將其他 參數(shù)引入CoMFA的數(shù)學(xué)模型,則可使結(jié)果 大為改進(jìn)。,29個(gè)苯胺類化合
17、物的結(jié)構(gòu)及其生物毒性 毒性:對(duì)小鼠的口服毒性半致死量LD50, 苯胺類化合物 的母體結(jié)構(gòu)為: * Xu Lu et al., Science in China (Series B), 2000, 43, 129-136,Substituted amino-benzens and their toxicity No.R1R2R3R4R5 -log(LD50) -log(LD50) diff. (obs)(cal) 1MeHHHH-2.826-2.8540.028 2HMeHHH-2.653-2.6970.044 3HHMeHH-2.817-2.778-0.039 4EtHHHH-3.100-3.
18、084-0.016 5isopropHHHH-3.072-3.067-0.005 6MeMeHHH-2.970-2.9800.010 7MeHMeHH-3.113-3.097-0.016 8MeHHMeH-2.924-2.919-0.005 9MeHHHMe-2.924-2.917-0.007 10HMeMeHH-2.909-2.9150.006 11HMeHMeH-2.849-2.834-0.015 12MeHHHEt-3.072-3.1060.034 13EtHHHEt-3.255-3.2760.021 14MeHMeHMe-2.871-2.9030.032,15HCF3HHH-2.681
19、-2.6850.004 16HClHHH-2.408-2.4190.011 17HHClHH-2.491-2.5010.010 18HClClHH-2.812-2.767-0.045 19MeClHHH-2.759-2.694-0.065 20MeHHClH-2.667-2.6690.002 21ClHMeHH-2.565-2.5800.015 22HHFHH-2.620-2.6340.014 23HHBrHH-2.659-2.657-0.002 24HNO2HHH-2.728-2.687-0.041 25HHNO2HH-2.875-2.8750.000 26MeHHNO2H-2.759-2.
20、7600.001 27NO2HClHH-2.602-2.6050.003 28HNO2ClHH-2.602-2.601-0.001 29NO2HNO2HH-2.621-2.6340.013,The rule: n/m5 . -log(LD50) = -0.760 - 1.744*10-3Ef - 5.452*10-2EL - 1.295*10-2Am3 + 1.556*10-3Ep -1.171*10-3Ee R = 0.901, F = 19.8, S = 0.097, n = 29 where Ef : heat of formation; EL : LUMO ; Am3: topolog
21、ical index; Ep : repulse energy; Ee : electronic energy.,(1) Multiple Regression,(2) Artificial Neural Network,Algorithm: BFGS quasi-Newton method Architecture: 6: 3: 1 Results: (Regression) R = 0.967 (R = 0.901) F = 386.6 (F = 19.8 ) S = 0.053 (S = 0.097) These are much better than those obtained b
22、y multiple regression analysis.,(3) 3D-QSAR Studies,(1) Method: CoMFA (2) Basic assumption: Stereo field (Es) Electrostatic field (Ee) Hydrophobicity (logP) (3) Results: Es+Ee: R: 0.85; Rcv: 0.64 Es+Ee+logP: R: 0.85; Rcv: 0.64 Es+Ee+Ef: R:0.975; Rcv: 0.88 * 許祿,吳亞平等,中國科學(xué)(B輯),2000,30,1-7,Fig.1 Orthogo
23、nal views of compound 16 embedded in contour maps derived from the stereo CoMFA model,Fig.2 Front views of compound 16 embedded incontour maps derived from the electrostatic CoMFA model,(3) 3D-QSAR Studies,(1) Method: CoMFA (2) Basic assumption: Stereo field (Es) Electrostatic field (Ee) Hydrophobic
24、ity (logP) (3) Results: Es+Ee: R: 0.85; Rcv: 0.64 Es+Ee+logP: R: 0.85; Rcv: 0.64 Es+Ee+Ef: R:0.975; Rcv: 0.88 * 許祿,吳亞平等,中國科學(xué)(B輯),2000,30,1-7,(4)上述結(jié)果所揭示的規(guī)律和啟示:,規(guī)律:該類化合物與生物大分子作時(shí),不僅取決于立體能、靜電能,而且還取決于分子的生成熱。結(jié)果表明,生成熱越小,毒性越小。 啟示:對(duì)化合物的結(jié)構(gòu)只要能夠進(jìn)行有效的描述,就能夠得到好的預(yù)測(cè)結(jié)果。,3. 在SYBYL/BASE基礎(chǔ)上 的其他方法研究,在3D QSAR研究中,絕大部分方法的首
25、先要求是化合物應(yīng)為最優(yōu)構(gòu)像。Tripos公司的Sybyl的Base系統(tǒng)為該類研究提供了有效的手段。,(1)在三維直角坐標(biāo) 系統(tǒng)中分子的位 點(diǎn)編碼法 設(shè)想將一分子置于 帶有網(wǎng)格的三維空間,圖3 在三維直角坐標(biāo)系 統(tǒng)中的甲苯分子,圖4 分子投影示意圖,化合物: 29個(gè)苯胺類化合物, 許祿,楊嘉安,吳亞平,中國科學(xué),B輯, 2003, 33, 261-267,(a) 最小二乘結(jié)果 -logLD50 = -2.580 - 6.846x10-4Ef - 3.648x10-2EL- 5.906x10-3Am3 + 2.177x10-2Pyz -2.525x10-2Pxz R = 0.951, F = 43
26、, S= 0.06, n =29 結(jié)果比較: 變量-Ef,EL,Am3,Ee,Ep : R = 0.901 變量-Ef,EL,Am3,Pyz,Pxz: R = 0.951,(b) 人工神經(jīng)網(wǎng)結(jié)果 算法: BFGS 贗-牛頓法 網(wǎng)絡(luò)結(jié)構(gòu): 5: 2: 1 結(jié)果: R = 0.993; F = 1868; S = 0.023 結(jié)果比較: 變量-Ef, EL, Am3, Ee, Ep : R=0.967 變量-Ef, EL, Am3, Pyz, Pxz: R=0.993, 只要能對(duì)分子的結(jié)構(gòu)進(jìn)行有效的描述,就能夠構(gòu) 造出好的數(shù)學(xué)模型; 除了空間能、靜電能、生成熱,苯胺類化合物 的毒性還非常決定于分子
27、在三維空間的投影面 積。這可能是該參數(shù)在客觀上較好地反映了化 合物與生物大分子的“空穴”擬合得好壞程度; Am3反映的是分子的大小和形狀,這又一次說明, 分子的形狀是制約苯胺類化合物毒性的重要因 素。,(c) 幾點(diǎn)結(jié)論,(2) 廣義二面角法 (a)方法 廣義二面角:若有四結(jié)點(diǎn)a、b、c 和d,假設(shè),二結(jié)點(diǎn)相連為“B”,不相 連為“N”,則 BBB-一般意義下二面角 BNB、NBN等-廣義二面角 張慶友,許祿,高等學(xué)?;瘜W(xué)學(xué)報(bào), 2002,23,1052,(b) 化合物 34個(gè)HEPT( 1-(2-Hydroxyethoxy)methyl-6-(phenylthio) thymine)類化合物,
28、(c)新變量的衍生,BNB或NBN(原變量),相似度矩陣,相似度系數(shù)(新變量),(d)相似度計(jì)算 設(shè)化合物分別為A和B,其屬性(即BNB或NBN)分別為xA和xB,則塔尼莫特系數(shù)計(jì)算公式如下:,SAB= (xAxB)/( xAxB),Results of Leaps-and-Bounds regression analysis (BNB) No Variable R S F 115 -0. 6179 1. 1119. 77 226, 33 0. 7910 0. 8825. 90 32, 26, 33 0. 8194 0. 8420. 43 42, 15, 26, 33 0. 8613 0. 7
29、520. 83 52, 15, 16, 26, 33 0. 8889 0. 6921. 09 62, 15, 16, 26, 29, 330. 9093 0. 6421.49 71, 2, 7, 12, 16, 19, 24, 0. 9260 0. 5922.36 82,15,16,25,26,29,32,330. 9398 0. 5523.64 ,(e)回歸分析結(jié)果 BNB: PI50=5.072-0.0264S2-0.0786S15+0.0561S16 +0.0355S26+0.0199S29+0.0373S33 R=0.9093 S=0.64F=21.49 N=34 NBN: PI50=
30、6.068-0.0279S2+0.0495S4-0.0233S7 -0.0522S15+0.0283S26+0.0322S33 R=0.9038 S=0.66 F =20.08 N=34,(f)人工神經(jīng)網(wǎng)結(jié)果,BNB: R = 0.9805, F = 795.6, RMS = 0.27 NBN: R = 0.9549, F = 331.2, RMS = 0.41,一. 計(jì)算機(jī)輔助分子設(shè)計(jì) I. 構(gòu)效關(guān)系(QSAR/QSPR)研究 II. 全新藥物設(shè)計(jì) III.組合化學(xué)與藥物設(shè)計(jì) 二. 有機(jī)化合物結(jié)構(gòu)解析 專家系統(tǒng) 三. 計(jì)算機(jī)輔助合成 四. 新的化學(xué)計(jì)量學(xué)方法,II. 全新藥物設(shè)計(jì) de no
31、vo drug design de novo ligand design de novo inhibitor design,全新藥物設(shè)計(jì),1.活性位點(diǎn) 分析法,2.整體 分子法,3.連接法,位點(diǎn) 連接法,碎片 連接法,連續(xù) 連接法,隨機(jī) 連接法,1.活性位點(diǎn)分析法 該種方法可用來探測(cè)哪些原子或基團(tuán)與生物大分子的活性(結(jié)合)部位有較好的作用。作為探針可能是一些簡(jiǎn)單的分子或碎片,如水或苯環(huán),運(yùn)用它們可以找到活性部位中的可能結(jié)合部位。,全新藥物設(shè)計(jì),1.活性位點(diǎn) 分析法,2.整體 分子法,3.連接法,位點(diǎn) 連接法,碎片 連接法,連續(xù) 連接法,隨機(jī) 連接法,2. 整體分子法 該種方法主要用于分子的對(duì)接
32、.分子的對(duì)接就是將整個(gè)三維數(shù)據(jù)庫中的有機(jī)分子契合到受體生物大分子的活性部位上,看小分子的形狀是否與生物大分子的形狀相匹配,并根據(jù)判別函數(shù)對(duì)分子打分以篩選先導(dǎo)化合物。,全新藥物設(shè)計(jì),1.活性位點(diǎn) 分析法,2.整體 分子法,3.連接法,(1)位點(diǎn) 連接法,(2)碎片 連接法,(3)連續(xù) 連接法,(4)隨機(jī) 連接法,3. 連接法,(1) 位點(diǎn)連接法 位點(diǎn):受體活性部位空間的一個(gè)點(diǎn),在此點(diǎn)能設(shè)置一個(gè)或幾個(gè)與受體原子有良好作用的匹配原子。如在丙氨酸的側(cè)鏈周圍,可以設(shè)置一些疏水性的位點(diǎn)。如果位點(diǎn)上已經(jīng)設(shè)置了合適的配體原子,則稱這一位點(diǎn)被滿足。,圖中: 黑點(diǎn): 疏水性 基團(tuán) 線: 氫鍵,全新藥物設(shè)計(jì),1.活
33、性位點(diǎn) 分析法,2.整體 分子法,3.連接法,(1)位點(diǎn) 連接法,(2)碎片 連接法,(3)連續(xù) 連接法,(4)隨機(jī) 連接法,(2) 碎片連接法 將與受體活性位點(diǎn)有較好作用的基團(tuán)用分子連接基團(tuán)(linker)連接起來。基本思想是:與受體活性部位有較好作用的基團(tuán)連接后仍有較好作用。,SAR-by-NMR: 將小分子與蛋白質(zhì)組成混合溶液,然后用2D-NMR方法測(cè)定小分子與蛋白質(zhì)的親和性,碎片連接法的基本實(shí)施過 程與SAR-by-NMR相似 碎片連接法:用計(jì)算機(jī)軟件篩 選分子碎片或數(shù)據(jù) 庫中的分子 SAR-by-NMR:用核磁共振方 法篩選分子碎片,碎片連接法的軟件 CAVEAT HOOK SPLI
34、CE NEWLEAD PROLIGAND ELANA CAVEAT,設(shè)計(jì)與受體有良好作用的骨架,然后在骨架上連接不同的碎片。,全新藥物設(shè)計(jì),1.活性位點(diǎn) 分析法,2.整體 分子法,3.連接法,(1)位點(diǎn) 連接法,(2)碎片 連接法,(3)連續(xù) 連接法,(4)隨機(jī) 連接法,(3) 連續(xù)構(gòu)造法 基本思想:配體分子可以根據(jù)受體的結(jié)構(gòu)逐步構(gòu)造出來,全新藥物設(shè)計(jì),1.活性位點(diǎn) 分析法,2.整體 分子法,3.連接法,(1)位點(diǎn) 連接法,(2)碎片 連接法,(3)連續(xù) 連接法,(4)隨機(jī) 連接法,(4)隨機(jī)連接法 CONCEPTS CONCERTS DLD MCDNLG RECEPTOR,一. 計(jì)算機(jī)輔助分
35、子設(shè)計(jì) I. 構(gòu)效關(guān)系(QSAR/QSPR)研究 II. 全新藥物設(shè)計(jì) III.組合化學(xué)與藥物設(shè)計(jì) 二. 有機(jī)化合物結(jié)構(gòu)解析 專家系統(tǒng) 三. 計(jì)算機(jī)輔助合成 四. 新的化學(xué)計(jì)量學(xué)方法,III. 組合化學(xué)與藥物設(shè)計(jì) (combinatorial chemistry) 利用一些基本的小分子如氨基酸、單核苷酸、單糖等,通過化學(xué)或生物合成的方法,系統(tǒng)地反復(fù)以共價(jià)鍵裝配成不同的組合,建立具有多樣性的數(shù)據(jù)庫。然后,用靈敏、快速生物學(xué)檢測(cè)方法,篩選最具潛力的化合物或化合物群,測(cè)定其結(jié)構(gòu),合成,并評(píng)價(jià)其藥理活性。,用于構(gòu)建組合化學(xué)庫的常用單元結(jié)構(gòu),一. 計(jì)算機(jī)輔助分子設(shè)計(jì) I. 構(gòu)效關(guān)系(QSAR/QSPR)
36、研究 II. 全新藥物設(shè)計(jì) III.組合化學(xué)與藥物設(shè)計(jì) 二. 有機(jī)化合物結(jié)構(gòu)解析 專家系統(tǒng) 三. 計(jì)算機(jī)輔助合成 四. 新的化學(xué)計(jì)量學(xué)方法,二.有機(jī)化合物結(jié)構(gòu)解析專家系統(tǒng)研究 ESESOC(Expert System for Elucidation of Structures of Organic Compounds),(1)人工智能:博弈、定理證明、語音識(shí)別、專 家系統(tǒng) (2)專家系統(tǒng):在專家知識(shí)的基礎(chǔ)上,模擬專家 演繹推理的過程,得到專家水平的應(yīng)答。,1. 結(jié)構(gòu)解析專家系統(tǒng)的簡(jiǎn)單回顧 自1987年起, 至今已十余年,前后5次得到國家基金的資助(目前實(shí)施的為第五個(gè)基金),取得良好的結(jié)果. 該
37、工作的幾個(gè)主要階段為: (1) 含有C, H, O有機(jī)化合物解析專家系統(tǒng)的研究; (2) 含有多種雜原子有機(jī)化合物結(jié)構(gòu)解析專家系統(tǒng)的研究; (3) 在結(jié)構(gòu)解析專家系統(tǒng)研究中多維核磁譜的約束; (4) 結(jié)構(gòu)解析專家系統(tǒng)中空間異構(gòu)體生成算法的研究.,2. 結(jié)構(gòu)解析專家系統(tǒng)框圖,MS, NMR, IR, 分子式,結(jié)構(gòu)片斷集,結(jié)構(gòu)產(chǎn)生器,結(jié)構(gòu)的驗(yàn)證,結(jié)構(gòu)的輸出,約束,約束,對(duì)結(jié)構(gòu)產(chǎn)生器的要求是: (1) 對(duì)結(jié)構(gòu)異構(gòu)的產(chǎn)生是窮舉的; (2) 對(duì)結(jié)構(gòu)異構(gòu)的產(chǎn)生是無冗余的; (3)對(duì)結(jié)構(gòu)異構(gòu)的產(chǎn)生是高效的.,高效性的重要性 (1) 異構(gòu)體的數(shù)目非常龐大, 如C6H6的異構(gòu)體數(shù) 目是217個(gè), C20H42的
38、異構(gòu)體數(shù)目366319個(gè); (2) 無效的數(shù)量非常大, 如2個(gè)CH3-, 18個(gè)-CH2-, 對(duì)接生成20鏈烷烴. 為了窮舉性則要考慮所有 組合, 而由產(chǎn)生2*18!無效組合, 若在一般 計(jì)算機(jī)上運(yùn)行, 則機(jī)器由安裝到報(bào)廢也無法 完成.,結(jié)構(gòu)解析專家系統(tǒng)的研究狀況 該類研究開始于60年代,世界上有眾多的實(shí)驗(yàn)室從事有關(guān)方面的工作,已開展的研究是非常廣泛的,完成的課題是非常大量的.但是,直到現(xiàn)在,卓有成效的,可以實(shí)際運(yùn)行的系統(tǒng)并不多,問題的關(guān)鍵在于沒有設(shè)計(jì)出高效的結(jié)構(gòu)產(chǎn)生器.,3. 關(guān)于結(jié)構(gòu)產(chǎn)生器我們所取得的突破 (1) 結(jié)構(gòu)產(chǎn)生器的高效性. 我們?cè)?jīng)和世界著名系統(tǒng)CHEMICS(日本)在同一臺(tái)機(jī)
39、器(Micro VAX II)上生成C8, 其結(jié)果是CHEMICS系統(tǒng)用去20個(gè)小時(shí),而我們的系統(tǒng)僅用去20分鐘.CHEMICS主要建造人船津公人教授非常驚訝,連連稱贊我們的系統(tǒng)是世界水平的.,窮舉生成分子式為C8異構(gòu)體,即含n個(gè)均為4價(jià)的碳原子的所有異構(gòu)體,在這些異構(gòu)體的生成過程中,無效組合量非常大,因而是檢驗(yàn)結(jié)構(gòu)自動(dòng)生成算法效率的極具挑戰(zhàn)性的測(cè)試。目前在PC/486微機(jī)上窮舉生成C8僅需要量幾分鐘。,(2) 結(jié)構(gòu)產(chǎn)生器的窮舉性和無冗余性 由圖論理論,烷烴系列CNH2N+2,醇、醚系列CNH2N+2O及 醛、酮系列CNH2NO等各類化合物的異構(gòu)體數(shù)目可應(yīng)用 Polya定理計(jì)算出來.我們的系統(tǒng)
40、對(duì)這些分子式的生成 結(jié)果均與理論結(jié)果相一致. DENDRAL系統(tǒng)的結(jié)構(gòu)生成算法經(jīng)數(shù)學(xué)證明了是正確的, 其結(jié)果已被很多系統(tǒng)引為窮舉和非冗余的佐證.我們 的系統(tǒng)就如下系列分子式與DENDRAL系統(tǒng)生成結(jié)果進(jìn) 行了比較,其結(jié)果完全相一致. C5HN,n=12,10,8,6,4,2,0系列,如C5H6有40個(gè)異構(gòu)體; C6HN,n=14,12,10,8,6,4,2,0系列,如C6H6有217個(gè)異 構(gòu)體.,(3)高選擇性拓?fù)渲笖?shù)所取得的突破 高選擇性拓?fù)渲笖?shù)研究的意義: 可以用于大型數(shù)據(jù)文 件的管理及密碼的產(chǎn)生;人們?cè)?圖從理論上證明有一個(gè) 拓?fù)涞牟蛔兞靠梢晕ㄒ坏乇碚魉械幕衔铩?由于高效結(jié)構(gòu)生成器的
41、研制成功,使得高選擇性拓?fù)渲?數(shù)的研究成為可能.新近我們所提出的拓?fù)渲笖?shù)EAID在 選擇性方面在目前國內(nèi)外已有的拓?fù)渲笖?shù)中是最高的。 它的選擇性不僅表現(xiàn)在烷烴類,而且表現(xiàn)在對(duì)于含雜原 子、含多重鍵的復(fù)雜化合物類。這是迄今世界上尚沒有 別的實(shí)驗(yàn)室能夠做得到的。,4.空間異構(gòu)體產(chǎn)生器取得了良好的進(jìn)展 (1)目前世界上具有空間異構(gòu)體生成 的結(jié)構(gòu)解析系統(tǒng) DENDRAL系統(tǒng)(美國,斯坦福大學(xué)) CASE系統(tǒng)(美國,亞利桑那大學(xué)) CHEMICS系統(tǒng)(日本,豐橋技科大) ESESOC系統(tǒng)(中國,長(zhǎng)春應(yīng)化所) CAMGEC(智利) STREC(俄羅斯),立體中心的判定,(2) 空間異構(gòu)體生成的框圖,拓?fù)涞?/p>
42、價(jià)性判定,自同構(gòu)群求取,構(gòu)型自同構(gòu)群,空間立體異構(gòu) 體等價(jià)類分析,最終的立體異構(gòu)體,環(huán)約束,二維結(jié)構(gòu)異構(gòu)體,(3)同構(gòu)與自同構(gòu) G(1)和G(2)是同構(gòu),G(1)和G(3)是自同構(gòu),因?yàn)镚(1)和G(2)中盡管結(jié)構(gòu)相同,但是標(biāo)號(hào)(結(jié)點(diǎn))間的連接關(guān)系不同,而G(1)和G(3)間連接關(guān)系相同,即G(1)和G(3)可以互相通過一個(gè)旋轉(zhuǎn)(變換)得到. 在下圖中(p(i)為不同的標(biāo)注).,G(1) G(2) G(3),P(1)=(1 2 3 4 5 6 7 8 ) P(2)=(1 2 4 3 5 6 7 8) P(3)=(4 1 2 3 8 5 6 7),所有滿足自同構(gòu)的置換組成一個(gè)群,這個(gè)群就是自同構(gòu)
43、群.,(4)拓?fù)涞葍r(jià)性,G(1) G(2) G(3),拓?fù)涞葍r(jià)的前提是二結(jié)構(gòu)為自同構(gòu),即鄰接關(guān)系相同. 同時(shí), 圖中對(duì)應(yīng)結(jié)點(diǎn)的化學(xué)環(huán)境亦應(yīng)相同. 如,G(1)與G(3)為自同構(gòu),二圖中由于結(jié)點(diǎn)1, 2, 3和4所處化學(xué)環(huán)境相同,所以這4個(gè)結(jié)點(diǎn)為拓?fù)涞葍r(jià);同樣, 5, 6, 7,和8為拓?fù)涞葍r(jià).,(5)自同構(gòu)群的生成方法 自同構(gòu)群的生成是立體異構(gòu)體窮舉生成過程中最耗時(shí)的步驟. 傳統(tǒng)方法: 量子化學(xué)方法 本系統(tǒng): 圖論方法+拓?fù)涞葍r(jià)性算法(本實(shí)驗(yàn)室所 建議) 對(duì)于確認(rèn)立體中心, 拓?fù)涞葍r(jià)性算法非常重要, 因?yàn)?對(duì)于碳來說, 其相連的4個(gè)結(jié)點(diǎn)完全不等價(jià)的情況很少, 而大多數(shù)情況下需根據(jù)拓?fù)涞葍r(jià)性來判
44、斷。實(shí)驗(yàn)證明, 本實(shí)驗(yàn)室所建議的拓?fù)涞葍r(jià)算法非常行之有效。,(6)ESESOC系統(tǒng)已可窮舉地、無冗余地和高效地生成空間異構(gòu)體 目前我們的系統(tǒng)不僅對(duì)于由不對(duì)稱碳所引起的點(diǎn)不對(duì)稱、碳-碳雙鍵引起的幾何異構(gòu)、以及由累烯鍵等引起的軸不對(duì)稱均能窮舉生成其立體異構(gòu)體,同時(shí)我們的系統(tǒng)還能夠?qū)τ诘?、磷、硫以及硅所引起的點(diǎn)不對(duì)稱、軸不對(duì)稱及幾何異構(gòu)窮舉地、無冗余地和高效地進(jìn)行立體異構(gòu)體的生成。 已經(jīng)表明,由ESESOC所得結(jié)果與理論計(jì)算結(jié)果完全相一致。,(7)生成實(shí)例 如六氯環(huán)己烷對(duì)是一稱性比較高的化合物,本系統(tǒng)得到了它的9個(gè)立體異構(gòu)體,并且能夠識(shí)別其中2個(gè)為對(duì)映體,7個(gè)為非對(duì)映體,與實(shí)際完全相符合。,一. 計(jì)
45、算機(jī)輔助分子設(shè)計(jì) I. 構(gòu)效關(guān)系(QSAR/QSPR)研究 II. 全新藥物設(shè)計(jì) III.組合化學(xué)與藥物設(shè)計(jì) 二. 有機(jī)化合物結(jié)構(gòu)解析 專家系統(tǒng) 三. 計(jì)算機(jī)輔助合成 四. 新的化學(xué)計(jì)量學(xué)方法,計(jì)算機(jī)輔助合成設(shè)計(jì) 1. 類型 計(jì)算機(jī)輔助合成設(shè)計(jì)始于60年代, 多部分集中于發(fā)達(dá)國家, 如美國. 幾十年來已經(jīng)發(fā)展起來許許多多的系統(tǒng), 并在藥物工業(yè)、材料工業(yè)中發(fā)揮越來越重要的作用. 已有的系統(tǒng)可分為兩大類: (1) 經(jīng)驗(yàn)型 反應(yīng)數(shù)據(jù)庫 知識(shí)庫(反應(yīng)規(guī)則庫) 推理機(jī)(邏輯推理部分) (2)理論型,2. 逆向推理,正向反應(yīng): 反 應(yīng) 逆向反應(yīng): 轉(zhuǎn)換 逆向推理所得 結(jié)果: 前體,2. 逆向推理,正向反應(yīng): 反 應(yīng) 逆向反應(yīng): 轉(zhuǎn)換 逆向推理所得 結(jié)果: 前體,3. 主要的系統(tǒng) OCSS(Organic Development of Computer-Aided Synthesis Design) E.J.Corey, W.T.Wipke(美國) LHASA(Logic and Heuristics Applied to Synthetic Analysis) E.J.Corey, W.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 音樂說課課件資源獲取
- 油田開發(fā)項(xiàng)目經(jīng)濟(jì)效益和社會(huì)效益分析報(bào)告
- xx片區(qū)城鄉(xiāng)供水一體化項(xiàng)目數(shù)字化方案(參考模板)
- 鄉(xiāng)村治理結(jié)構(gòu)優(yōu)化實(shí)施方案
- 2025年油氣鉆采服務(wù)項(xiàng)目建議書
- 挖掘優(yōu)勢(shì)-樹立科學(xué)就業(yè)觀
- 2025年房地產(chǎn)市場(chǎng)區(qū)域分化與產(chǎn)業(yè)升級(jí)關(guān)系及投資策略分析報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)數(shù)據(jù)清洗算法在工業(yè)物聯(lián)網(wǎng)中的應(yīng)用場(chǎng)景對(duì)比報(bào)告
- 探討游戲化教學(xué)法在幼兒教育中的應(yīng)用研究
- 醫(yī)療器械注冊(cè)審批制度改革背景下2025年行業(yè)競(jìng)爭(zhēng)格局與市場(chǎng)趨勢(shì)分析
- 2025年食品檢驗(yàn)員考試試卷及答案
- 四川省德陽市2025年七年級(jí)下學(xué)期語文期末試卷及答案
- 黎族文化課件
- 中華人民共和國民營(yíng)經(jīng)濟(jì)促進(jìn)法
- 色彩的魅力:藝術(shù)、科學(xué)與設(shè)計(jì)的交融
- 2025廣州市荔灣區(qū)輔警考試試卷真題
- 一季度安委會(huì)匯報(bào)材料
- 貴州省遵義市2024年八年級(jí)《數(shù)學(xué)》上學(xué)期期末試題與參考答案
- 產(chǎn)品質(zhì)量問題追溯制度
- TACE圍手術(shù)期的護(hù)理
- GB/T 320-2025工業(yè)用合成鹽酸
評(píng)論
0/150
提交評(píng)論