基因組研究功能基因分析_第1頁
基因組研究功能基因分析_第2頁
基因組研究功能基因分析_第3頁
基因組研究功能基因分析_第4頁
基因組研究功能基因分析_第5頁
已閱讀5頁,還剩77頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

11梅艷珍南京師范大學生命科學學院基因組學研究——功能基因分析現(xiàn)代生物學實驗技術(shù)本文檔共82頁;當前第1頁;編輯于星期六\2點32分2要求:掌握常用的序列比對工具能構(gòu)建進化樹能夠預測蛋白質(zhì)的二級結(jié)構(gòu)、疏水區(qū)、跨膜區(qū)等能夠進行簡單的同源建模分析了解KEGG數(shù)據(jù)庫的檢索本文檔共82頁;當前第2頁;編輯于星期六\2點32分3序列比對——BLAST應用本文檔共82頁;當前第3頁;編輯于星期六\2點32分4

同源性(homology):指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具有共同祖先的結(jié)論,屬于質(zhì)的判斷。A和B的關(guān)系上,是同源序列,或者非同源序列兩種關(guān)系。而說A和B的同源性為80%都是不科學的。相似性(similarity):是指一種直接的數(shù)量關(guān)系,如部分相同或相似的百分比或其它一些合適的度量。比如說,A序列和B序列的相似性是80%,或者4/5。生物序列的同源性序列間相似性越高,它們是同源序列的可能性就更高本文檔共82頁;當前第4頁;編輯于星期六\2點32分5Blast程序評價序列相似性的兩個數(shù)據(jù)Score:使用打分矩陣對匹配的片段進行打分,這是對各對氨基酸殘基(或堿基)打分求和的結(jié)果,一般來說,匹配片段越長、相似性越高,則Score值越大。Evalue:在相同長度的情況下,兩個氨基酸殘基(或堿基)隨機排列的序列進行打分,得到上述Score值的概率的大小。E值越小表示隨機情況下得到該Score值的可能性越低。我們在獲得一個Blast結(jié)果時需要看這兩個指標。如果Blast獲得的目標序列的Score值越高并且E-value越低表明結(jié)果越可信,反之越不可信.本文檔共82頁;當前第5頁;編輯于星期六\2點32分6主要的BLAST程序(功能)本文檔共82頁;當前第6頁;編輯于星期六\2點32分71.登陸blast主頁組裝的基因組序列庫基本blast特定的BLAST所有的BLAST基因數(shù)據(jù)庫本文檔共82頁;當前第7頁;編輯于星期六\2點32分88核酸數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對蛋白質(zhì)序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列核酸數(shù)據(jù)庫中比對蛋白質(zhì)序列本文檔共82頁;當前第8頁;編輯于星期六\2點32分9Fasta格式文件本文檔共82頁;當前第9頁;編輯于星期六\2點32分1010什么是fasta格式?怎么建立?新建一個txt文本文件,命名如:bph.txtFasta的格式:>序列名稱序列本文檔共82頁;當前第10頁;編輯于星期六\2點32分11本文檔共82頁;當前第11頁;編輯于星期六\2點32分12121.序列信息部分填入查詢(query)的序列序列范圍(默認全部)選擇搜索數(shù)據(jù)庫如果接受其他參數(shù)默認設(shè)置,點擊開始搜索本文檔共82頁;當前第12頁;編輯于星期六\2點32分1313去冗余GenBank編碼序列PDB+SwissProt+PIR+PRF本文檔共82頁;當前第13頁;編輯于星期六\2點32分14

常用的檢索數(shù)據(jù)庫

14本文檔共82頁;當前第14頁;編輯于星期六\2點32分15以下列蛋白序列為例,進行BLAST搜索:>P1MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA本文檔共82頁;當前第15頁;編輯于星期六\2點32分16本文檔共82頁;當前第16頁;編輯于星期六\2點32分17本文檔共82頁;當前第17頁;編輯于星期六\2點32分1818基因名來源物種一致程度,登錄號本文檔共82頁;當前第18頁;編輯于星期六\2點32分19所選序列下載序列本文檔共82頁;當前第19頁;編輯于星期六\2點32分20Cluster比對本文檔共82頁;當前第20頁;編輯于星期六\2點32分21Clustalx的工作界面

(多序列比對模式)本文檔共82頁;當前第21頁;編輯于星期六\2點32分22Clustal的工作原理Clustal輸入多個序列快速的序列兩兩比對,計算序列間的距離,獲得一個距離矩陣。鄰接法(NJ)構(gòu)建一個樹根據(jù)進化樹,漸進比對多個序列。本文檔共82頁;當前第22頁;編輯于星期六\2點32分23Clustalx的輸出結(jié)果.aln格式文件這個文件是默認輸出,可以轉(zhuǎn)換成各種格式,而且很多軟件都支持這種格式。.dnd格式文件引導樹。就是根據(jù)兩兩序列相似值構(gòu)建的一個指導后面多重聯(lián)配的啟發(fā)樹不能做進化分析。進化分析要考慮的所有同源位點的一個綜合效應,因此應該用.aln格式文件專門做進化分析。本文檔共82頁;當前第23頁;編輯于星期六\2點32分24多序列比對實例輸入文件的格式(fasta):>KCC2_YEASTNYIFGRTLGAGSFGVVRQARKLSTN……>DMK_HUMANDFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK…….>KPRO_MAIZETRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN……>DAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD……>1CSNHYKVGRRIGEGSFGVIFEGTNLLNN……不留空格本文檔共82頁;當前第24頁;編輯于星期六\2點32分25第一步:輸入序列文件。本文檔共82頁;當前第25頁;編輯于星期六\2點32分26本文檔共82頁;當前第26頁;編輯于星期六\2點32分27本文檔共82頁;當前第27頁;編輯于星期六\2點32分28建議用treeview打開outtree,然后可以編輯本文檔共82頁;當前第28頁;編輯于星期六\2點32分29本文檔共82頁;當前第29頁;編輯于星期六\2點32分30建樹軟件-mega本文檔共82頁;當前第30頁;編輯于星期六\2點32分31MEGA5可以識別fasta格式文件將重命名為17-RNASE1.fasta建樹軟件-mega本文檔共82頁;當前第31頁;編輯于星期六\2點32分32本文檔共82頁;當前第32頁;編輯于星期六\2點32分33ClustalW參數(shù)設(shè)置本文檔共82頁;當前第33頁;編輯于星期六\2點32分34多序列聯(lián)配后結(jié)果本文檔共82頁;當前第34頁;編輯于星期六\2點32分35以.meg格式保存結(jié)果本文檔共82頁;當前第35頁;編輯于星期六\2點32分36回到MEGA主窗口打開所保存的文件(.meg)本文檔共82頁;當前第36頁;編輯于星期六\2點32分37點擊按鈕打開文件窗口本文檔共82頁;當前第37頁;編輯于星期六\2點32分38顯示保守位點顯示變異位點本文檔共82頁;當前第38頁;編輯于星期六\2點32分39回到MEGA主窗口構(gòu)建進化樹當前打開的文件選擇鄰接法建樹本文檔共82頁;當前第39頁;編輯于星期六\2點32分40選擇Bootstrap檢驗本文檔共82頁;當前第40頁;編輯于星期六\2點32分41本文檔共82頁;當前第41頁;編輯于星期六\2點32分42蛋白質(zhì)二級結(jié)構(gòu)預測本文檔共82頁;當前第42頁;編輯于星期六\2點32分43蛋白質(zhì)結(jié)構(gòu)為什么如此重要的?氨基酸序列只有折疊成特定的空間結(jié)構(gòu)才具有相應的活性和相應的生物學功能DNA序列蛋白質(zhì)序列蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)錄&翻譯折疊本文檔共82頁;當前第43頁;編輯于星期六\2點32分44為什么要研究蛋白質(zhì)結(jié)構(gòu)?生物體中許多重要的功能由蛋白質(zhì)完成分析蛋白質(zhì)結(jié)構(gòu)、功能及其關(guān)系是蛋白質(zhì)組計劃中的一個重要組成部分分析蛋白質(zhì)結(jié)構(gòu)有助于藥物設(shè)計研究有助于了解蛋白質(zhì)相互作用,這對于生物學、醫(yī)學和藥學都是非常重要本文檔共82頁;當前第44頁;編輯于星期六\2點32分45蛋白質(zhì)二級結(jié)構(gòu)α-helix(30-35%)

α-螺旋β-sheet/β-strand(20-25%)

β-折疊Coil(40-50%)無規(guī)則卷曲Loop環(huán)β-turnβ-轉(zhuǎn)角本文檔共82頁;當前第45頁;編輯于星期六\2點32分4646蛋白質(zhì)3D結(jié)構(gòu)α螺旋Β折疊環(huán)或轉(zhuǎn)角轉(zhuǎn)角或卷曲本文檔共82頁;當前第46頁;編輯于星期六\2點32分47本文檔共82頁;當前第47頁;編輯于星期六\2點32分48JPred預測結(jié)果α螺旋β折疊本文檔共82頁;當前第48頁;編輯于星期六\2點32分49二級結(jié)構(gòu)預測網(wǎng)站PHDJPREDpbio.dundee.ac.uk/~www-jpred/PSIPREDNNPREDICT/~nomi/nnpredict.htmlChouandFassman本文檔共82頁;當前第49頁;編輯于星期六\2點32分50預測蛋白質(zhì)的理化性質(zhì)本文檔共82頁;當前第50頁;編輯于星期六\2點32分51部分預測工具ComputepI/Mw(ExPASy)計算蛋白序列的等電點和分子量TGREASE計算蛋白質(zhì)序列疏水性工具TMHMM蛋白質(zhì)跨膜區(qū)預測More…本文檔共82頁;當前第51頁;編輯于星期六\2點32分52等電點,分子量預測工具本文檔共82頁;當前第52頁;編輯于星期六\2點32分53本文檔共82頁;當前第53頁;編輯于星期六\2點32分54本文檔共82頁;當前第54頁;編輯于星期六\2點32分55TGREASE疏水性參數(shù)高正值的氨基酸具有更大的疏水性而低負值的氨基酸具有更強的親水性本文檔共82頁;當前第55頁;編輯于星期六\2點32分56本文檔共82頁;當前第56頁;編輯于星期六\2點32分57蛋白質(zhì)跨膜區(qū)預測(TMHMM)本文檔共82頁;當前第57頁;編輯于星期六\2點32分58本文檔共82頁;當前第58頁;編輯于星期六\2點32分59本文檔共82頁;當前第59頁;編輯于星期六\2點32分60信號肽分析本文檔共82頁;當前第60頁;編輯于星期六\2點32分61SignalP軟件2.0版()對信號肽分析。本文檔共82頁;當前第61頁;編輯于星期六\2點32分62信號肽的作用一般是幫助蛋白質(zhì)穿膜用的,跟蛋白質(zhì)的細胞定位有關(guān)系。本文檔共82頁;當前第62頁;編輯于星期六\2點32分63同源建模蛋白質(zhì)三維結(jié)構(gòu)預測本文檔共82頁;當前第63頁;編輯于星期六\2點32分643D預測是可能的,因為:序列信息決定三級結(jié)構(gòu)序列相似性(>30%)傾向于結(jié)構(gòu)相似性3D預測是必須的,因為:DNA序列蛋白質(zhì)序列空間結(jié)構(gòu)本文檔共82頁;當前第64頁;編輯于星期六\2點32分65本文檔共82頁;當前第65頁;編輯于星期六\2點32分66本文檔共82頁;當前第66頁;編輯于星期六\2點32分67蛋白質(zhì)結(jié)構(gòu)預測方法:同源建模法(Comparativehomologymodeling)依據(jù)蛋白序列與已經(jīng)結(jié)構(gòu)蛋白比對信息構(gòu)建3D模型折疊識別法(Threadingfoldrecognition)尋找與未知蛋白最合適的模板,進行序列與結(jié)構(gòu)比對,最終建立結(jié)構(gòu)模型從頭預測法(Abinitio/denovomethods)根據(jù)序列本身來從頭預測蛋白質(zhì)結(jié)構(gòu)本文檔共82頁;當前第67頁;編輯于星期六\2點32分68同源建?;驹恚?、一個蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。由一級結(jié)構(gòu),在理論上,足以獲取其二級、三級結(jié)構(gòu)。2、三級結(jié)構(gòu)的保守型遠遠大于一級結(jié)構(gòu)的保守型。應用限制:模板蛋白和目標蛋白的序列一致性需要大于30%本文檔共82頁;當前第68頁;編輯于星期六\2點32分69SWISS-MODELSWISS-MODEL:網(wǎng)址非專業(yè)人士應用最為廣泛的一個在線建模服務器。特點:簡單、自動化、對學術(shù)團隊免費。Automatedmode:自動模式,可以稱為是最傻瓜的方式提交自己的氨基酸序列+郵箱即可適用:一致性較高時本文檔共82頁;當前第69頁;編輯于星期六\2點32分70本文檔共82頁;當前第70頁;編輯于星期六\2點32分71郵箱模型命名氨基酸序列本文檔共82頁;當前第71頁;編輯于星期六\2點32分72本文檔共82頁;當前第72頁;編輯于星期六\2點32分73KEGG數(shù)據(jù)庫本文檔共82頁;當前第73頁;編輯于星期六\2點32分74本文檔共82頁;當前第74頁;編輯于星期六\2點32分75特點KEGG是一個整合了基因組、化學和系統(tǒng)功能信息的數(shù)據(jù)庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來是KEGG數(shù)據(jù)庫的特色之一。人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計算的形式捕捉和組織實驗得到的知識而形成的系統(tǒng)功能知識庫。它是一個生物系統(tǒng)的計算機模擬。與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論