生物信息學題庫_第1頁
生物信息學題庫_第2頁
生物信息學題庫_第3頁
生物信息學題庫_第4頁
生物信息學題庫_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

C值真核生物基因組大小同屋中的復雜性相關性很小Feng-Doolittle假定最近序列空隙應該保留HIV用于指導開發(fā)針對保守蛋白的疫苗 PAM25080%Refseq源于GenBank,提供非冗余序列信息比較從E搜索結果應該相當成百端粒中從頭以上單基在普通人群較少見,并且發(fā)生時間較早蛋白1-5%第一ФX174各種50%根據對于每一個給定的蛋白質,其分子進化的速率在所有的進化分支上大致是恒定根據假陽性率太高,許多不是外顯子的序列部分被錯誤指定構建多序列比對錯誤基于字母特征的算法沒有定義分支序列的中間數據矩陣假設BLOSUM45和PAM250 普通10確定Unigene人類1% 人類3000人類基因密度相對較高如果6如果PubMed天冬N/W/Y 為什使用了全局比對系統(tǒng)樹的拓撲結構和分支長度細菌DNA的基因含量、組成結構很不一樣下列半胱氨酸下列胞內細菌下列全局比對比對整體序列下列最大似然法(ML)下面dbEST下面OMIM要在blastx要證獲取以上一個200000一個蛋白質序列一個可能以下NM_15392與PAM它是基于遠相關蛋白的局部多序列比對直系不同物種中具有共同祖先的同源序列是指生物種族的進化歷史,亦即生物體在整個進化譜在研究\o"生物"生物進化和系統(tǒng)分類中,常用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣關系,這種樹狀分支的圖形成為系統(tǒng)發(fā)育樹(phylogenetictree)。生物信息學的大體定義是什么?其發(fā)展歷程如何?利用應用數學、信息學、統(tǒng)計學和計算機科學的方法研究生物學的問題。目前的生物信息學基本上只是分子生物學與信息技術(尤其是互聯網技術)的結合體。生物信息學的研究材料和結果就是各種各樣的生物學數據,其研究工具是計算機,研究方法包括對生物學數據的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。目前主要的研究方向有:序列比對、基因識別、基因重組、蛋白質結構預測、基因表達、蛋白質反應的預測,以及建立進化模型。發(fā)展歷程:20世紀50年代,生物信息學開始孕育20世紀60年代,生物分子信息在概念上將計算生物學和計算機科學聯系起來20世紀70年代,生物信息學的真正開端④20世紀70年代到80年代初期,出現了一系列著名的序列比較方法和生物信息分析方法⑤20世紀80年代以后,出現一批生物信息服務機構和生物信息數據庫

⑥20世紀90年代后,HGP促進生物信息學的迅速發(fā)展請論述生物信息學的研究內容有哪些?生物分子數據的收集與管理:①基因組數據庫(EMBL、GenBank、DDBJ)②蛋白質序列數據庫(SWTSS-PROT、PIR)③蛋白質結構數據庫(PDB)數據庫搜索及序列比較搜索同源序列在一定程度上就是通過序列比較尋找相似序列

①序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應等同或者置換關系進行對比排列,其結果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述。②多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質之間的進化關系?;蚪M序列分析:①遺傳語言分析——天書②基因組結構分析③基因識別④基因功能注釋⑤基因調控信息分析⑥基因組比較基因表達數據的分析與處理:基因表達數據分析是目前生物信息學研究的熱點和重點。

目前對基因表達數據的處理主要是進行聚類分析,將表達模式相似的基因聚為一類,在此基礎上尋找相關基因,分析基因的功能。

所用方法主要有:①相關分析方法②模式識別技術中的層次式聚類方法③人工智能中的自組織映射神經網絡④主元分析方法5)蛋白質結構預測。蛋白質的生物功能由蛋白質的結構所決定,蛋白質結構預測成為了解蛋白質功能的重要途徑。

蛋白質結構預測分為:

(1)二級結構預測:在一定程度上二級結構的預測可以歸結為模式識別問題

在二級結構預測方面主要方法有:

立體化學方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學方法、人工神經網絡方法

預測準確率超過70%的第一個軟件是基于神經網絡的PHD系統(tǒng)(2)空間結構預測在空間結構預測方面,比較成功的理論方法是同源模型法

該方法的依據是:相似序列的蛋白質傾向于折疊成相似的三維空間結構,運用同源模型方法可以完成所有蛋白質10-30%的空間結構預測工作請敘述構建系統(tǒng)進化樹的一般步驟。構建系統(tǒng)發(fā)生樹的5個步驟:[1]序列選擇:從那些可以輸出FASTA格式的數據庫中選擇[2]多序列比對[3]替代模型的選擇[4]生成樹:方式:distance-based;character-based:maximumparsimony;character-andmodel-based:maximumlikelihood;character-andmodel-based:Bayesian基于距離的樹生成軟件:MEGA和PAUPMEGA應用算法:UPGMA,基于距離的算法。[5]結果評估:原則(一致性、效率、和魯棒性);檢測方法:最為常見的方法是引導檢測的分析方法引導檢測法:簡單地講就是把序列的位點都重排,重排后的序列再用相同的辦法構樹,如果原來樹的分枝在重排后構的樹中也出現了,就給這個分枝打上一分,如果沒出現就給0分,這樣經過你給定的repetitions次(至少1000次)重排構樹打分后,每個分枝就都得出分值,計算機會給你換算成bootstrap值。重排的序列有很多組合,值越小說明分枝的可信度越低,最好根據數據的情況選用不同的構樹方法和模型.歸納前面所講,下面幾點可以幫助我們解釋進化樹:(1)從根節(jié)點到任何一個節(jié)點的惟一路徑和方向代表了進化時間;(2)根是樹中所有物種的共同祖先;(3)根節(jié)點上的物種我們認為比樹中其他所有的物種分化更早。如果無法確定根節(jié)點的物種,就使用無根樹進行分析。NCBI的Entrez檢索包含了哪些方面的信息。Entrez是NCBI為用戶提供整合的訪問序列、定位、分類及結構數據的搜索和檢索的系統(tǒng),是一個用以整合NCBI數據庫中信息的搜尋和檢索的工具,包括核酸序列、蛋白質序列、蛋白質三維結構、基因組圖譜和通過PubMed檢索的MEDLINE。其中,Entrez可以整合檢索的序列數據庫包括GenBank、EMBI—DDBJ、RefSeq、PIR-International、PRF、Swiss—Prot和PDB等。Entrez有兩個顯著的特點:第一是對每個數據庫中的記錄都預先做相似性比較,產生一個列表,包括序列、結構和MEDLINE文獻記錄等信息;第二是對某個數據庫的記錄與其他數據庫的相關記錄做了鏈接,使對不同數據庫的訪問得以整合。所以Entrez是通過相近性和硬連接來提供集成的信息檢索。Entrez可以用很廣泛的文本方式搜索,比如作者名字、雜志名字、基因或蛋白名、物種、單一的檢索號(如:accessionnumber、序列ID、PubMedID、MEDLNEUID)和其他的術語,因此,Entrez是一個強大的檢索相關序列、結構和參考文獻的信息檢索工具。BLAST系列軟件分別用哪些數據搜索何種數據庫?真核基因結構注釋包括哪些內容?相關的軟件所依據的理論基礎是什么?GENSCAN是美國麻省理工大學的ChrisBurge于1997年開發(fā)成功的人類(或脊椎動物)基因預測軟件,它根據基因的整體結構進行基因預測,不依賴于已有的蛋白庫,是一種"從頭預測"軟件;用于ORF識別。通過對特征序列(GT-AG)的分析進行直接的預測基因預測軟件(NetGene2),內含子/外顯子剪切位點識別。與相應的基因組序列比對,分析比對片段的分布位置(Spidey),用于mRNA剪切位點識別。選擇性剪切數據庫:ProSplicer。啟動子結合位點分析:Cister。限制性酶切位點分析:NEBcutter。密碼子使用偏好性分析:CodonW。請概述基因組注釋的大體流程。(1)基因組注釋(Genomeannotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點。基因組注釋的研究內容包括基因識別和基因功能注釋兩個方面?;蜃R別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預測新基因,現階段主要是3種方法的結合:(1)分析mRNA和EST數據以直接得到結果;(2)通過相似性比對從已知基因和蛋白質序列得到間接證據;(3)基于各種統(tǒng)計模型和算法從頭預測。對預測出的基因進行高通量功能注釋可以借助于以下方法,利用已知功能基因的注釋信息為新基因注釋:(1)序列數據庫相似性搜索;(2)序列模體(Motif)搜索;(3)直系同源序列聚類分析(Clusteroforthologousgroup,COG).(2)基因組注釋系統(tǒng)是MGAP的核心,整合了許多常用的基因識別和蛋白質功能預測軟件,包括GeneMarks、IPRsearch、BLASTPGP和FASTA3等,以及多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論