實(shí)驗(yàn)四蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示_第1頁(yè)
實(shí)驗(yàn)四蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示_第2頁(yè)
實(shí)驗(yàn)四蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示_第3頁(yè)
實(shí)驗(yàn)四蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示_第4頁(yè)
實(shí)驗(yàn)四蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)四:蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示,杜 娟 ,基因與蛋白質(zhì)組學(xué)數(shù)據(jù)分析,實(shí)驗(yàn)項(xiàng)目四:蛋白質(zhì)序列、結(jié)構(gòu)的獲取和顯示 一、 實(shí)驗(yàn)?zāi)康暮鸵螅?掌握蛋白質(zhì)序列數(shù)據(jù)庫(kù)Uniprot的查詢方法及格式特點(diǎn) 掌握蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB的及格式特點(diǎn) 掌握蛋白質(zhì)結(jié)構(gòu)顯示軟件Pymol的使用,2,UniProt:Universal Protein Resource 收錄蛋白質(zhì)序列目錄最廣泛、功能注釋最全面的數(shù)據(jù)庫(kù); 包含三個(gè)子庫(kù): UniProtKB(UniProt Knowledgebase) UniRef(UniProt Reference Clusters) UniParc(Uniprot Archive

2、),一 UniProt數(shù)據(jù)庫(kù),3,1. 簡(jiǎn)介,2. 數(shù)據(jù)來(lái)源,4,European Bioinformatics Institute (EMBL-EBI),SIB Swiss Institute of Bioinformatics,Protein Information Resource (PIR),Swiss-Prot and TrEMBL,Protein Sequence Database (PIR-PSD),5,UniProt的網(wǎng)址: /,3.數(shù)據(jù)查詢 Uniprot檢索號(hào),包括6個(gè)字符串,可由大寫字母AZ和數(shù)字09組合而成。 也可以用關(guān)鍵詞檢索

3、,檢索演示,例1:查詢草履蟲細(xì)胞周期蛋白依賴的蛋白激酶(CDK2)的結(jié)構(gòu)數(shù)據(jù) (1)登陸Uniprot網(wǎng)站 / (2)在搜索欄選中“Protein knowledgebase(UniProtKB)” ,在文本框中輸入“Paramecium tetraurelia CDK2”,單擊Site Search按鈕,出現(xiàn)結(jié)果。,8,9,10,11,12,13,與其他數(shù)據(jù)庫(kù)的鏈接,14,4. UniProt數(shù)據(jù)格式,ID Q9XYV1_PARTE Unreviewed; 301 AA. AC Q9XYV1; DT 01-NOV-1999, integrated i

4、nto UniProtKB/TrEMBL. DT 01-NOV-1999, sequence version 1. DT 21-MAR-2012, entry version 71. DE SubName: Full=Cyclin-dependent protein kinase Cdk2; GN Name=CDK2; OS Paramecium tetraurelia. OC Eukaryota; Alveolata; Ciliophora; Intramacronucleata; OC Oligohymenophorea; Peniculida; Parameciidae; Paramec

5、ium. OX NCBI_TaxID=5888;,頭部區(qū),15,引文區(qū),RN 1 RP NUCLEOTIDE SEQUENCE. RC STRAIN=51S; RX MEDLINE=99448661; PubMed=10519216; RX DOI=10.1111/j.1550-7408.1999.tb06065.x; RA Zhang H., Berger J.D.; RT A novel member of the cyclin-dependent kinase family in Paramecium RT tetraurelia.; RL J. Eukaryot. Microbiol.

6、 46:482-491(1999). 評(píng)論區(qū) CC - CC Copyrighted by the UniProt Consortium, see /terms CC Distributed under the Creative Commons Attribution-NoDerivs License CC -,16,相關(guān)文獻(xiàn)編號(hào)或遞交序列的注冊(cè)信息,序列注釋信息,交叉引用數(shù)據(jù)庫(kù)區(qū),DR EMBL; AF126147; AAD34354.1; -; Genomic_DNA. DR HSSP; P24941; 1OIQ. DR ProteinModelP

7、ortal; Q9XYV1; -. DR GO; GO:0005524; F:ATP binding; IEA:UniProtKB-KW. DR GO; GO:0004674; F:protein serine/threonine kinase activity; IEA:InterPro. DR InterPro; IPR011009; Kinase-like_dom. DR InterPro; IPR000719; Prot_kinase_cat_dom. DR InterPro; IPR017441; Protein_kinase_ATP_BS. DR InterPro; IPR0022

8、90; Ser/Thr_dual-sp_kinase_dom. DR InterPro; IPR008271; Ser/Thr_kinase_AS. DR Pfam; PF00069; Pkinase; 1. DR SMART; SM00220; S_TKc; 1. DR SUPFAM; SSF56112; Kinase_like; 1. DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1. DR PROSITE; PS50011; PROTEIN_KINASE_DOM; 1. DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1

9、.,17,序列區(qū),KW ATP-binding; Cyclin; Kinase; Nucleotide-binding; Transferase. SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAF

10、GLP LKTYTHEVIT LWYRAPEILL GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN N /,18,與序列相關(guān)的關(guān)鍵詞,氨基酸統(tǒng)計(jì)數(shù),DNA代碼,氨基酸代碼,19,20,FASTA文件格式,21,在Uniprot中查詢擬南芥的光敏色素phyE編碼蛋白的詳細(xì)信息,閱讀序列格式的解釋,列出共包含哪幾個(gè)部分?標(biāo)出頭部區(qū)主要字段的含義。 在Uniprot中查詢(1)擬南芥油菜

11、素內(nèi)酯受體gibberellin receptor GID1C 、 (2)水稻獨(dú)角金內(nèi)酯水解酶strigolactone hydrolase D14的蛋白質(zhì)序列,這兩個(gè)蛋白包含多少個(gè)氨基酸?寫出它們所對(duì)應(yīng)的mRNA檢索號(hào)(類似于這樣的格式N*_*)、GeneID號(hào)。,作 業(yè),二 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù),PDB Protein DataBank,美國(guó)Brookhaven國(guó)家實(shí)驗(yàn)室管理生物大分子三維空間結(jié)構(gòu)原子坐標(biāo)數(shù)據(jù)庫(kù) /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了從PDB獲取的實(shí)驗(yàn)確定的生

12、物高聚物結(jié)構(gòu)分子模型數(shù)據(jù)庫(kù) 。,PDB數(shù)據(jù)庫(kù)( protein data bank ),1. 簡(jiǎn)介 美國(guó)Brookhaven實(shí)驗(yàn)室1971年建立的大分子結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB 蛋白質(zhì)晶體結(jié)構(gòu)資料數(shù)據(jù)庫(kù) (Protein Data Bank)。 PDB數(shù)據(jù)庫(kù)的維護(hù)由結(jié)構(gòu)生物信息學(xué)研究合作組織(Research Collaboration for Structural Bioinformatics, RCSB)負(fù)責(zé)。,2.數(shù)據(jù)來(lái)源 通過實(shí)驗(yàn)(X射線晶體衍射,核磁共振,電子顯微鏡方法等)測(cè)定的生物大分子的三維結(jié)構(gòu)。 主要是蛋白質(zhì)的三維結(jié)構(gòu),還包括核酸、糖類、蛋白質(zhì)與核酸復(fù)合物的三維結(jié)構(gòu)。,3.數(shù)據(jù)統(tǒng)計(jì) 截

13、止2013年11月,PDB數(shù)據(jù)庫(kù)已含有95644 個(gè)結(jié)構(gòu)數(shù)據(jù),其中約92.5%是蛋白質(zhì)的結(jié)構(gòu)。,4.數(shù)據(jù)查詢 PDB中的記錄有唯一的PDB-ID,包括4個(gè)字符串,可由大寫字母AZ和數(shù)字09組合而成。 PDB和它的鏡像站點(diǎn)提供每個(gè)PDB記錄的查詢,可按一些專門的查詢項(xiàng)目(如提交數(shù)據(jù)、作者姓名、結(jié)構(gòu)表達(dá))進(jìn)行檢索。,檢索演示,例1:查詢?nèi)祟悳I液載脂蛋白的結(jié)構(gòu)數(shù)據(jù) (1)登陸PDB網(wǎng)站 /pdb/ (2)在上方的搜索欄選中“Everything” ,在文本框中輸入“HUMAN TEAR LIPOCALIN”,單擊Site Search按鈕,出現(xiàn)結(jié)果。,第一步: 輸

14、入關(guān)鍵字“HUMAN TEAR LIPOCALIN” 也可輸入ID號(hào),第二步: 選擇人類淚液載脂蛋白1XKI,數(shù)據(jù)查看:,(3)分別單擊標(biāo)簽3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry觀察數(shù)據(jù)信息。 (4)回到Summary標(biāo)簽,在右側(cè)的Biological Assembly區(qū)域可以觀察蛋白的三維結(jié)構(gòu)。 (5)單擊右側(cè)目錄中的Download Files下載不同格式和內(nèi)容的文件;或下載FASTA序列文件;也可下載PDB文件(1XKI.

15、pdb)。,第三步:觀察數(shù)據(jù)信息 1XKI,第四步: 1XKI結(jié)構(gòu)展示圖,下載PDB結(jié)構(gòu)文件,5.數(shù)據(jù)結(jié)構(gòu),PDB中對(duì)于每一個(gè)結(jié)構(gòu)記錄,包含名稱、參考文獻(xiàn)、序列、一級(jí)結(jié)構(gòu)、二級(jí)結(jié)構(gòu)和原子坐標(biāo)等信息。 每條記錄有兩種序列信息,一種是顯式序列信息(explicit sequence),一種是隱式序列信息(implicit sequence)。,在PDB文件中,以關(guān)鍵字SEQRES作為顯式序列標(biāo)記,以該關(guān)鍵字打頭的每一行都是關(guān)于序列的信息;PDB的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個(gè)原子的名稱和原子的三維坐標(biāo)。,PDB文本文件, 用寫字板打開,標(biāo)題部分,分子類別轉(zhuǎn)運(yùn)蛋白,該文件的公布日期,該化合物的p

16、db代碼,該化合物的來(lái)源,結(jié)構(gòu)測(cè)定者名字,REMARK是此pdb文件的參考書目、最大分辨率、注解等,一級(jí)結(jié)構(gòu),雜因子,二級(jí)結(jié)構(gòu),連接注釋,晶胞特征及坐標(biāo)變換,連通性部分,坐標(biāo)部分,1-6 “ATOM 或 HETATM”,7-11 原子序列號(hào),13-16 原子名稱,18-20 殘基名,22 鏈標(biāo)識(shí)符,23-26 殘基序列號(hào),31-38 X坐標(biāo),39-46 Y坐標(biāo),47-54 Z坐標(biāo),55-60 位置,61-66 溫度因子,79-80 原子帶的電荷,77-78 元素符號(hào),三 結(jié)構(gòu)顯示軟件-PyMOL簡(jiǎn)介,/,All指所有的對(duì)象,3ODU指剛才打開的文件,(se

17、le)是選擇的對(duì)象 按鈕A:代表對(duì)這個(gè)對(duì)象的各種action, S:顯示這個(gè)對(duì)象的某種樣式, H:隱藏某種樣式, L:顯示某種label, C:顯示的顏色,點(diǎn)擊all中的H,選擇everything,隱藏所有 點(diǎn)擊3ODU中的S,選擇cartoon,以cartoon形式顯示蛋白質(zhì) 點(diǎn)擊3ODU 中的C , 選擇by ss , 以二級(jí)結(jié)構(gòu)分配顏色, 選擇 點(diǎn)擊右下角的S,窗口上面出現(xiàn)蛋白質(zhì)氨基酸序列,找到1164位ITD,是配體,點(diǎn)擊選擇ITD ,此時(shí)sele中就包含ITD這個(gè)殘基,點(diǎn)擊(sele)行的A,選擇rename selection,窗口中出現(xiàn),更改sele為IDT,點(diǎn)擊(IDT)行的S選擇sticks,點(diǎn)擊C,選擇by element,選擇,調(diào)整窗口使此分子清楚顯示。,IDT行點(diǎn)擊A 選擇find,選擇polar contacts,再根據(jù)需要選擇,這里選擇to other atoms in object ,分子顯示窗口中出現(xiàn)幾個(gè)黃色的虛線,這就是氫鍵的對(duì)象,點(diǎn)擊這一行的C,選擇red,把氫鍵顯示為紅色。,接著再顯示跟IDT形成氫鍵的殘基,點(diǎn)擊3ODU行的S,選擇lines,顯示出所有殘基的側(cè)鏈,使用鼠標(biāo)轉(zhuǎn)動(dòng)蛋白質(zhì)尋找與 IDT以紅色虛線相連的殘基,分別點(diǎn)擊選擇這些殘基。注意此時(shí) selecting 要是 residures,55,在P

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論