




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、11基因組學研究基因組學研究功能基因分析功能基因分析現(xiàn)代生物學實驗技術現(xiàn)代生物學實驗技術2要求:要求:掌握常用的序列比對工具掌握常用的序列比對工具能構建進化樹能構建進化樹能夠預測蛋白質(zhì)的二級結構、疏水區(qū)、跨膜區(qū)等能夠預測蛋白質(zhì)的二級結構、疏水區(qū)、跨膜區(qū)等能夠進行簡單的同源建模分析能夠進行簡單的同源建模分析1.了解了解KEGG數(shù)據(jù)庫的檢索數(shù)據(jù)庫的檢索3序列比對序列比對BLASTBLAST應用應用4 4 同源性同源性(homology)(homology): 指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具有共指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具有共同祖先的結論,屬于同祖先的結論,屬于質(zhì)的判斷
2、質(zhì)的判斷。 A A和和B B的關系上,是同源序的關系上,是同源序列,或者非同源序列兩種關系。而說列,或者非同源序列兩種關系。而說A A和和B B的同源性為的同源性為8080都是不科學的。都是不科學的。相似性相似性(similarity)(similarity): 是指一種直接的是指一種直接的數(shù)量關系數(shù)量關系,如部分相同或相似的百分比或,如部分相同或相似的百分比或其它一些合適的度量。比如說,其它一些合適的度量。比如說,A A序列和序列和B B序列的相似性是序列的相似性是8080,或者,或者4/54/5。生物序列的同源性生物序列的同源性序列間相似性越高,它們是同源序列的可能性就更高序列間相似性越高
3、,它們是同源序列的可能性就更高5BlastBlast程序評價序列相似性的兩個數(shù)據(jù)程序評價序列相似性的兩個數(shù)據(jù)ScoreScore:使用打分矩陣對匹配的片段進行打分,這是對各對氨基酸殘:使用打分矩陣對匹配的片段進行打分,這是對各對氨基酸殘基(或堿基)打分求和的結果,一般來說,基(或堿基)打分求和的結果,一般來說,匹配片段越長、匹配片段越長、 相似性相似性越高越高, ,則則ScoreScore值越大值越大。E valueE value: :在相同長度的情況下,兩個氨基酸殘基(或堿基)在相同長度的情況下,兩個氨基酸殘基(或堿基)隨機排列隨機排列的序列的序列進行打分,得到上述進行打分,得到上述Scor
4、eScore值的概率的大小。值的概率的大小。E E值越小表示隨機值越小表示隨機情況下得到該情況下得到該ScoreScore值的可能性越低。值的可能性越低。我們在獲得一個我們在獲得一個BlastBlast結果時需要看這兩個指標。結果時需要看這兩個指標。 如果如果BlastBlast獲得的目標序列的獲得的目標序列的ScoreScore值越高并且值越高并且E-valueE-value越低表明結果越越低表明結果越可信可信,反之越不可信,反之越不可信. .6主要的主要的BLASTBLAST程序(功能)程序(功能)程序名程序名查詢序列查詢序列數(shù)據(jù)庫數(shù)據(jù)庫搜索方法搜索方法BlastnBlastn核酸核酸核酸
5、核酸在核酸數(shù)據(jù)庫中比對核酸序列在核酸數(shù)據(jù)庫中比對核酸序列BlastpBlastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)在蛋白質(zhì)數(shù)據(jù)庫中比對蛋白質(zhì)序列在蛋白質(zhì)數(shù)據(jù)庫中比對蛋白質(zhì)序列BlastxBlastx核酸核酸蛋白質(zhì)蛋白質(zhì)在蛋白質(zhì)數(shù)據(jù)庫中比對待檢的核酸序在蛋白質(zhì)數(shù)據(jù)庫中比對待檢的核酸序列(用所有列(用所有6 6種可讀框翻譯)種可讀框翻譯)TblastnTblastn蛋白質(zhì)蛋白質(zhì)核酸核酸在核酸數(shù)據(jù)庫(用所有在核酸數(shù)據(jù)庫(用所有6 6種可讀框翻種可讀框翻譯)中比對待檢的蛋白質(zhì)序列譯)中比對待檢的蛋白質(zhì)序列TBlastxTBlastx核酸核酸核酸核酸在核酸數(shù)據(jù)庫(用所有在核酸數(shù)據(jù)庫(用所有6 6種可讀框翻種可讀框
6、翻譯)中比對待檢的核酸序列(也譯)中比對待檢的核酸序列(也用所有用所有6 6種可讀框翻譯)種可讀框翻譯)71.登陸登陸blast主頁主頁/BLAST/組裝的基因組序列庫基本blast特定的BLAST所有的BLAST基因數(shù)據(jù)庫88核酸數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對蛋白質(zhì)序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列核酸數(shù)據(jù)庫中比對蛋白質(zhì)序列9Fasta格式文件1010 什么是什么是fasta格式?怎么建立?格式?怎么建立? 新建一個新建一個txt文本文件,命名如文本文件,命名如: bph.txt Fasta的格式:的格式: 序
7、列名稱序列名稱序列序列1112121.序列信息部分填入查詢(query)的序列序列范圍(默認全部)選擇搜索數(shù)據(jù)庫如果接受其他參數(shù)默認設置,點擊開始搜索1313去冗余GenBank編碼序列PDB + SwissProt + PIR + PRF14常用的檢索數(shù)據(jù)庫14Pdb擁有三維空間結構的原子坐標的氨基酸序列庫擁有三維空間結構的原子坐標的氨基酸序列庫Nr GenBank 蛋白數(shù)據(jù)庫蛋白數(shù)據(jù)庫ESTExpressed sequence tags,表達序列標簽數(shù)據(jù)庫,表達序列標簽數(shù)據(jù)庫STSsequence tagged sites,序列標簽位點數(shù)據(jù)庫,序列標簽位點數(shù)據(jù)庫Htgshigh throu
8、ghput genomic sequences,高通量基因組序列,高通量基因組序列GSSgenome survey sequences,基因組測定序列,基因組測定序列Yeast酵母基因組中基因編碼的全套蛋白質(zhì)酵母基因組中基因編碼的全套蛋白質(zhì)E.coli大腸桿菌基因組中基因編碼的全套蛋白質(zhì)大腸桿菌基因組中基因編碼的全套蛋白質(zhì)Mito脊椎動物線粒體的全基因組序列脊椎動物線粒體的全基因組序列Alu搜集了靈長類動物的搜集了靈長類動物的Alu重復序列重復序列Swissprot蛋白質(zhì)數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫15以下列蛋白序列為例,進行BLAST搜索: P1MSDNGPQSNQRSAPRITFGGPTDSTDNN
9、QNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPS
10、GTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA16171818基因名基因名來源物種來源物種一致程度,一致程度,登錄號登錄號19所選序列下載序列20Cluster比對21Clustalx的工作界面(多序列比對模式多序列比對模式)2222Clustal的工作原理ClustalClustal輸入多個序列輸入多個序列快速的序列兩兩比對,計算序列間的快速的序列兩兩比對,計算序列間的距離,獲得一個距離矩陣。距離,獲得一個距離矩陣。鄰接法鄰接法(NJ)(NJ)構建一個
11、樹構建一個樹根據(jù)進化樹,漸進比對多個序列。根據(jù)進化樹,漸進比對多個序列。2323ClustalxClustalx的輸出結果的輸出結果 .aln.aln格式文件格式文件 這個文件是默認輸出,可以轉換成各種格式,而且很多這個文件是默認輸出,可以轉換成各種格式,而且很多軟件都支持這種格式。軟件都支持這種格式。 .dnd.dnd格式文件格式文件 引導樹。就是根據(jù)兩兩序列相似值構建的一個指導后面引導樹。就是根據(jù)兩兩序列相似值構建的一個指導后面多重聯(lián)配的啟發(fā)樹多重聯(lián)配的啟發(fā)樹 不能做進化分析。進化分析要考慮的所有同源位點的一不能做進化分析。進化分析要考慮的所有同源位點的一個綜合效應,因此應該用個綜合效應,
12、因此應該用.aln.aln格式文件專門做進化分析。格式文件專門做進化分析。2424多序列比對實例多序列比對實例輸入文件的格式輸入文件的格式(fasta)(fasta):KCC2_YEASTKCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTN NYIFGRTLGAGSFGVVRQARKLSTNDMK_HUMANDMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK. DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK.KPRO_MAIZEKPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKK
13、LEN TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLENDAF1_CAEELDAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALDQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD1CSN1CSN HYKVGRRIGEGSFGVIFEGTNLLNN HYKVGRRIGEGSFGVIFEGTNLLNN不留空格不留空格25第一步:輸入序列文件。第一步:輸入序列文件。262728建議用建議用treeview 打開打開outtree,然后可以編輯,然后可以編輯2930建樹軟件建樹軟件-mega-mega31MEGA5MEGA5
14、可以識別可以識別fastafasta格式文件格式文件將將17-RNASE1.fasta.txt17-RNASE1.fasta.txt重命名為重命名為17-RNASE1.fasta17-RNASE1.fasta建樹軟件建樹軟件-mega3233ClustalW參數(shù)設置參數(shù)設置34多序列聯(lián)配后結果多序列聯(lián)配后結果35以以.meg格式保格式保存結果存結果36回到回到MEGA主窗口主窗口打開所保存的文件(打開所保存的文件(.meg)37點擊按鈕打開文件窗口點擊按鈕打開文件窗口38顯示保守位點顯示保守位點 顯示變異位點顯示變異位點39回到回到MEGA主窗口構建進化樹主窗口構建進化樹當前打開的文件當前打開
15、的文件選擇鄰接法建樹選擇鄰接法建樹40選擇選擇Bootstrap檢檢驗驗4142蛋白質(zhì)二級結構預測蛋白質(zhì)二級結構預測43蛋白質(zhì)結構為什么如此重要的?蛋白質(zhì)結構為什么如此重要的? 氨基酸序列只有折疊成特定的空間結構才具有相應的活性和相應的生物學功能DNA 序列蛋白質(zhì)序列蛋白質(zhì)結構轉錄&翻譯折疊44為什么要研究蛋白質(zhì)結構為什么要研究蛋白質(zhì)結構? ? 生物體中許多重要的功能由蛋白質(zhì)完成 分析蛋白質(zhì)結構、功能及其關系是蛋白質(zhì)組計劃中的一個重要組成部分 分析蛋白質(zhì)結構有助于藥物設計研究 有助于了解蛋白質(zhì)相互作用,這對于生物學、醫(yī)學和藥學都是非常重要45蛋白質(zhì)二級結構蛋白質(zhì)二級結構 -helix (30-
16、35%)-螺旋螺旋 -sheet / -strand (20-25%)-折疊折疊 Coil (40-50%) 無規(guī)則卷曲無規(guī)則卷曲 Loop 環(huán)環(huán) -turn -轉角轉角4646蛋白質(zhì)蛋白質(zhì)3D 結構結構47http:/pbio.dundee.ac.uk/www-jpred/48JPred預測結果螺旋折疊49二級結構預測網(wǎng)站二級結構預測網(wǎng)站 PHD /predictprotein/ JPRED http:/pbio.dundee.ac.uk/www-jpred/ PSIPRED http:/bioinf.cs.ucl.ac.uk/psi
17、pred/ NNPREDICT /nomi/nnpredict.html Chou and Fassman /fasta_www/chofas.htm5051部分預測工具部分預測工具 Compute pI/Mw(ExPASy) 計算蛋白序列的等電點和分子量 TGREASE 計算蛋白質(zhì)序列疏水性工具 TMHMM 蛋白質(zhì)跨膜區(qū)預測 More /tools/52/compute_pi/等電點,分子量預等電點,分
18、子量預測工具測工具5354/protscale/55TGREASE疏水性參數(shù)疏水性參數(shù) 高正值的氨基酸具有更大的疏水性而低負值的氨基酸具有更強的親水性5657蛋白質(zhì)跨膜區(qū)預測蛋白質(zhì)跨膜區(qū)預測(TMHMM)http:/www.cbs.dtu.dk/services/TMHMM/585960信號肽分析61SignalP軟件2.0版(http:/www.cbs.dtu.dk/services/SignalP-2.0/)對信號肽分析。62信號肽的作用一般是幫助蛋白質(zhì)穿膜用的信號肽的作用一般是幫助蛋白質(zhì)穿膜用的,跟蛋白質(zhì)的細胞跟蛋白質(zhì)的細胞定位有關系。定位有關系。
19、63同源建模蛋白質(zhì)三維結構預測蛋白質(zhì)三維結構預測64 3D預測是可能的,因為:序列信息決定三級結構序列相似性 (30%)傾向于結構相似性 3D預測是必須的,因為:DNA 序列 蛋白質(zhì)序列 空間結構656667蛋白質(zhì)結構預測方法:同源建模法(Comparative homology modeling)依據(jù)蛋白序列與已經(jīng)結構蛋白比對信息構建3D模型折疊識別法(Threading fold recognition)尋找與未知蛋白最合適的模板,進行序列與結構比對,最終建立結構模型從頭預測法(Ab initio/de novo methods)根據(jù)序列本身來從頭預測蛋白質(zhì)結構68同源建?;驹恚?1、
20、一個蛋白質(zhì)的結構由其氨基酸序列唯一的決定。由一級結構,在理論上,足以獲取其二級、三級結構。 2、三級結構的保守型遠遠大于一級結構的保守型。應用限制:模板蛋白和目標蛋白的序列一致性需要大于30%69SWISS-MODEL SWISS-MODEL: 網(wǎng)址/ 非專業(yè)人士應用最為廣泛的一個在線建模服務器。 特點:簡單、自動化、對學術團隊免費。Automated mode:自動模式,可以稱為是最傻瓜的方式提交自己的氨基酸序列+郵箱即可適用:一致性較高時7071郵箱郵箱模型命名模型命名氨基酸序列氨基酸序列7273KEGG數(shù)據(jù)庫74http:/www.g
21、enome.jp/kegg/75特點 KEGGKEGG是一個整合了是一個整合了基因組基因組、化學化學和和系統(tǒng)功能系統(tǒng)功能信息的數(shù)據(jù)信息的數(shù)據(jù)庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關聯(lián)起來是級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關聯(lián)起來是KEGGKEGG數(shù)據(jù)庫的特色之一。數(shù)據(jù)庫的特色之一。 人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計算的形式捕捉和組織實驗得到的知識而形成的系統(tǒng)功能知算的形式捕捉和組織實驗得到的知識而形成的系統(tǒng)功能知識庫。它是一個識庫。它是一個生物系統(tǒng)的計算機模擬生物系統(tǒng)的計算機模擬。 與其他數(shù)據(jù)庫相比,與其他數(shù)據(jù)庫相比,KEGG KEGG 的一個顯著特點就是具有的一個顯著特點就是具有強大強大的圖形功能的圖形功能,它利
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 倉庫機械租賃合同范本
- 凍肉投放合同范本
- 加工制作合同范本門窗
- 產(chǎn)品推廣居間合同范本
- 加盟合同范本奶茶
- 健身收購合同范本
- 出租黃色圍擋合同范例
- 中國國家展覽中心合同范例
- 住宅租賃房屋合同范例
- 2024年溫州鹿城農(nóng)商銀行招聘筆試真題
- (2025)輔警招聘公安基礎知識必刷題庫及參考答案
- 門診診所運行管理制度
- 2025年大模型應用落地白皮書:企業(yè)AI轉型行動指南
- 體育館施工圖設計合同
- 2025年中國文玩電商行業(yè)發(fā)展現(xiàn)狀調(diào)查、競爭格局分析及未來前景預測報告
- 2025年臨床醫(yī)師定期考核試題中醫(yī)知識復習題庫及答案(200題)
- 《小紅帽》繪本故事-課件
- 寒假日常生活勞動清單及評價表
- 專題06 現(xiàn)代文閱讀(原卷版)2015-2024單招考試語文(四川真題)
- 校園超市招商政策
- 《數(shù)據(jù)采集技術》課件-網(wǎng)絡爬蟲
評論
0/150
提交評論