生物信息學(xué)期末考試答案[8頁]_第1頁
生物信息學(xué)期末考試答案[8頁]_第2頁
生物信息學(xué)期末考試答案[8頁]_第3頁
生物信息學(xué)期末考試答案[8頁]_第4頁
生物信息學(xué)期末考試答案[8頁]_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、名詞Bioinformatics:生物信息學(xué)是一門綜合運(yùn)用生物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計(jì)算機(jī)科學(xué)等諸多學(xué)科的理論方法,以互聯(lián)網(wǎng)為媒介、數(shù)據(jù)庫為載體、利用數(shù)學(xué)和計(jì)算機(jī)科學(xué)對(duì)生物學(xué)數(shù)據(jù)進(jìn)行儲(chǔ)存、檢索和處理分析,并進(jìn)一步挖掘和解讀生物學(xué)數(shù)據(jù)。Consensus sequence:共有序列決定啟動(dòng)序列的轉(zhuǎn)錄活性大小。各種原核啟動(dòng)序列特定區(qū)域內(nèi)(通常在轉(zhuǎn)錄起始點(diǎn)上游-10及-35區(qū)域)存在共有序列,是在兩個(gè)或多個(gè)同源序列的每一個(gè)位置上多數(shù)出現(xiàn)的核苷酸或氨基酸組成的序列。Data mining:數(shù)據(jù)挖掘數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性的信息的過程。數(shù)據(jù)挖掘通常是利

2、用計(jì)算方法分析生物數(shù)據(jù),即根據(jù)核酸序列預(yù)測(cè)蛋白質(zhì)序列、結(jié)構(gòu)、功能的算法等,實(shí)現(xiàn)對(duì)現(xiàn)有數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行發(fā)掘。EST:(Expressed Sequence Tag)表達(dá)序列標(biāo)簽是某個(gè)基因cDNA克隆測(cè)序所得的部分序列片段,長度大約為200600bp。Similarity:相似性是直接的連續(xù)的數(shù)量關(guān)系,是指序列比對(duì)過程中用來描述檢測(cè)序列和目標(biāo)序列之間相同DNA堿基或氨基酸殘基順序所占比例的高低。Homology:同源性是兩個(gè)對(duì)象間的肯定或者否定的關(guān)系。如兩個(gè)基因在進(jìn)化上是否曾具有共同祖先。從足夠的相似性能夠判定二者之間的同源性。Alignment:比對(duì)從核酸以及氨基酸的層次去分析序列的相同點(diǎn)和不

3、同點(diǎn),以期能夠推測(cè)它們的結(jié)構(gòu)、功能以及進(jìn)化上的聯(lián)系?;蚴侵笧榇_定兩個(gè)或多個(gè)序列之間的相似性以至于同源性,而將它們按照一定的規(guī)律排列。BLOSUM:模塊替換矩陣是指在對(duì)蛋白質(zhì)數(shù)據(jù)庫搜索時(shí),采用不同的相似性分?jǐn)?shù)矩陣進(jìn)行檢索的相似性矩陣。以序列片段為基礎(chǔ),從蛋白質(zhì)模塊數(shù)據(jù)庫BLOCKS中找出一組替換矩陣,用于解決序列的遠(yuǎn)距離相關(guān)。在構(gòu)建矩陣過程中,通過設(shè)置最小相同殘基數(shù)百分比將序列片段整合在一起,以避免由于同一個(gè)殘基對(duì)被重復(fù)計(jì)數(shù)而引入的任何潛在的偏差。在每一片段中,計(jì)算出每個(gè)殘基位置的平均貢獻(xiàn),使得整個(gè)片段可以有效地被看作為單一序列。通過設(shè)置不同的百分比,產(chǎn)生了不同矩陣。PAM(Point Acce

4、pted Mutation):突變數(shù)據(jù)矩陣PAM即可接受點(diǎn)突變指1個(gè)PAM表示100個(gè)殘基中發(fā)生一個(gè)殘基突變概率的進(jìn)化距離。在序列比對(duì)中,能夠反映一個(gè)氨基酸發(fā)生改變的概率與兩個(gè)氨基酸隨機(jī)出現(xiàn)的概率的比值的矩陣。Contig:疊連群是指一組相互兩兩頭尾拼接的可裝配成長片段的DNA序列克隆群,也指彼此間可通過重疊序列而連接成連續(xù)的、擴(kuò)展的、不間斷的DNA序列的交疊片段產(chǎn)物。通過比對(duì)不同的序列,我們能夠發(fā)現(xiàn)片段的順序,并且contigs能被添加、刪除、重排列來形成新的序列。Phylogenetic tree:系統(tǒng)發(fā)生樹又稱為演化樹(evolutionary tree)是表明被認(rèn)為具有共同祖先的各物種

5、間演化關(guān)系的樹,是一種親緣分支分類方法。在樹中,每個(gè)節(jié)點(diǎn)代表其各分支的最近共同祖先,而節(jié)點(diǎn)間的線段長度對(duì)應(yīng)演化距離(如估計(jì)的演化時(shí)間)。它用來表示系統(tǒng)發(fā)生研究的結(jié)果,用它描述物種之間的進(jìn)化關(guān)系。In Silico Cloning:電子克隆是近年來發(fā)展起來的一門基于表達(dá)序列標(biāo)簽(ESTs)的快速克隆基因的新技術(shù),其利用種子序列從EST及UniGene數(shù)據(jù)庫中搜索相似性序列,進(jìn)行拼裝、檢索、分析等,以此獲得目標(biāo)基因的全長cDNA,在此基礎(chǔ)上也能夠?qū)崿F(xiàn)基因作圖定位。二、問題思考1、生物信息學(xué)這門學(xué)科是如何發(fā)展起來的?答:生物學(xué)數(shù)據(jù)爆炸式增長 生物大分子數(shù)據(jù)庫相繼建立 生物技術(shù)與計(jì)算機(jī)技術(shù)并行飛速發(fā)展

6、 Internet的廣泛應(yīng)用 人類基因組計(jì)劃(HGP)的推動(dòng) 生物信息學(xué)的產(chǎn)生是生命科學(xué)發(fā)展的必然。2、舉例說明生物信息學(xué)的主要應(yīng)用?答: a. 獲取各種生物的全基因組及其他數(shù)據(jù);b. 新基因發(fā)現(xiàn);c. 單核苷酸多態(tài)性分析;d. 基因組中非編碼區(qū)域的結(jié)構(gòu)與功能;e. 從基因組水平研究生物進(jìn)化及其他遺傳語言的可能;f. 全基因組的比較研究;g. 基因功能預(yù)測(cè);h. 遺傳疾病的研究以及關(guān)鍵基因鑒定;i. 蛋白質(zhì)組學(xué)研究;j. 新藥設(shè)計(jì)和定向化酶;k. 生物芯片.3、 為什么說生物信息學(xué)是大規(guī)模研究生命科學(xué)的利器?答:生物信息學(xué)主要是一門研究生物學(xué)系統(tǒng)和生物學(xué)過程中信息流的綜合系統(tǒng)學(xué)科,是綜合運(yùn)用生

7、物學(xué)、數(shù)學(xué)、物理學(xué)、信息科學(xué)以及計(jì)算機(jī)科學(xué)等諸多學(xué)科的理論方法,以互聯(lián)網(wǎng)為媒介、數(shù)據(jù)庫為載體、利用數(shù)學(xué)和計(jì)算機(jī)科學(xué)對(duì)生物學(xué)數(shù)據(jù)進(jìn)行儲(chǔ)存、檢索和處理分析,并進(jìn)一步挖掘和解讀生物學(xué)數(shù)據(jù)。目前,其核心是基因組信息學(xué),包括基因組信息的獲取、處理、存儲(chǔ)、分配和解讀。還包括:蛋白質(zhì)空間結(jié)構(gòu)模擬、預(yù)測(cè)和藥物分子設(shè)計(jì);軟件開發(fā)和方法學(xué)研究。未來,生物信息學(xué)將進(jìn)一步揭示生命系統(tǒng)的復(fù)雜性、遺傳語言、基因表達(dá)譜、基因組、蛋白質(zhì)組、代謝組、細(xì)胞信號(hào)組、系統(tǒng)生物學(xué)等等。因此,生物信息學(xué)是大規(guī)模研究生命科學(xué)的利器。4、 生物信息學(xué)涉及的生物大分子信息有哪些?答:涉及的有:1)核算序列DNA包括:基因組序列、基因序列、cD

8、NA、EST、堿基修飾、DNA功能模塊/位點(diǎn)(如啟動(dòng)子、剪接體、表達(dá)調(diào)控位點(diǎn)等)。2)蛋白質(zhì)Protein包括:氨基酸組成、氨基酸序列、理化性質(zhì)、原子坐標(biāo)、二級(jí)結(jié)構(gòu)、模體、結(jié)構(gòu)域、功能域/位點(diǎn)、3D結(jié)構(gòu)。5、 在大分子序列分析中,為何局部比對(duì)比全局比對(duì)更有意義?答:全局比對(duì)(global alignment)指全長序列比對(duì),用于相似性很高的序列間的分析。局部比對(duì)(local alignment)指生物分子序列常常是局部具有較高的相似性,呈板塊分布。此法用于整體相似性較低的序列分析,靈敏度高。原因:1)全局比對(duì)是沿整個(gè)長度實(shí)現(xiàn)序列之間匹配的最大化,嘗試對(duì)齊整個(gè)序列。而局部比對(duì)是對(duì)動(dòng)態(tài)規(guī)劃算法的修

9、改,是給兩個(gè)序列之間得分最高的地方進(jìn)行匹配,集中在尋找相似度高的序列的延伸。因此相比而言,在序列分析中將未知序列同已知序列進(jìn)行相似性比較,局部比對(duì)的準(zhǔn)確性比全局比對(duì)更高。因?yàn)橐獙?shí)現(xiàn)整個(gè)序列長度的相似性匹配,比起局部匹配分析帶來的誤差更大;2)另外,與局部序列比對(duì)算法相比,全序列比對(duì)算法會(huì)導(dǎo)致一些局部序列相似性較高而全序列相似性很小,因?yàn)槿蛄械钠骄?yīng)而將兩者的相似性漏檢。一般對(duì)于2個(gè)未知關(guān)系的序列,使用局部序列比對(duì)工具要比用全序列比對(duì)工具好。而對(duì)于一個(gè)較長的序列和一個(gè)較短的序列的比對(duì),也應(yīng)該使用局部序列比對(duì)工具。3)再則全局比對(duì)的最高分是最后一個(gè),而局部比對(duì)的任何一個(gè)地方都可能是最高分,即任

10、何地方都可以是對(duì)位起始點(diǎn),可見局部比對(duì)操作更為靈敏。4)應(yīng)用范圍上,全局比對(duì)僅適用于相似性很高的序列間分析,而局部比對(duì)一般用于相似性較低的序列分析,但是也可以用于高相似性序列分析,這樣的分析結(jié)果會(huì)更加精準(zhǔn)。所以局部比對(duì)比全局比對(duì)更加有意義。6、 在大分子序列分析中,為何蛋白質(zhì)的取代矩陣比核酸的取代矩陣更復(fù)雜?答:取代矩陣(substitution matrix)的規(guī)則是“獎(jiǎng)勵(lì)匹配位點(diǎn),罰扣不匹配位點(diǎn)”,故又稱為計(jì)分矩陣(scoring matrix)。核算序列分析利用堿基取代矩陣,通過相似性比對(duì)匹配與否進(jìn)行打分,便可以分析出其大致的堿基組成,特異位點(diǎn)等。而蛋白質(zhì)序列利用其氨基酸殘基取代矩陣分析

11、,由于蛋白質(zhì)的序列組成復(fù)制,而且蛋白質(zhì)的功能是通過其三維高級(jí)結(jié)構(gòu)來執(zhí)行的,該結(jié)構(gòu)又不一定處于靜態(tài),在行使功能的過程中,一般會(huì)發(fā)生相應(yīng)的改變,所以氨基酸殘基的進(jìn)化取代不能簡單地表述各種殘基在結(jié)構(gòu)和功能上的關(guān)系,所以要對(duì)蛋白質(zhì)序列進(jìn)一步的分析就需要更加復(fù)雜的取代矩陣。7、多重比對(duì)的用途?BLAST的用途? 答:多重比對(duì)的用途主要用于:1) 系統(tǒng)演化分析,解釋物種之間的進(jìn)化關(guān)系;2) 基因預(yù)測(cè);3) 蛋白質(zhì)結(jié)構(gòu)域的三級(jí)結(jié)構(gòu)與二級(jí)結(jié)構(gòu),甚至是個(gè)別的氨基酸或核苷酸;4) 研究一個(gè)家族中的相關(guān)蛋白質(zhì)序列中的保守區(qū)域,進(jìn)而分析蛋白質(zhì)的結(jié)構(gòu)和功能。BLAST是現(xiàn)在應(yīng)用最廣泛的序列相似性搜索工具,主要用于:1)

12、 新DNA序列的發(fā)現(xiàn)、定位與分析、結(jié)構(gòu)和功能預(yù)測(cè);2) ESTs的分析;3) 尋找分析遠(yuǎn)源關(guān)系的蛋白質(zhì)序列;4) 實(shí)驗(yàn)設(shè)計(jì)如PCR Primer,Mutagenesis Studies,構(gòu)建Profile(-譜)等;5) 揭示相似性和同源性,發(fā)現(xiàn)系統(tǒng)發(fā)育的信息;6) 尋找數(shù)據(jù)庫中沒有標(biāo)注的編碼區(qū)、發(fā)現(xiàn)保守區(qū)域、特定序列框等重要信息。8、 聚類分析的策略?答:聚類分析(cluster analysis)是一組將研究對(duì)象分為相對(duì)同質(zhì)的群組(clusters)的統(tǒng)計(jì)分析技術(shù)。其策略方法為:先將多個(gè)序列兩兩比對(duì)構(gòu)建距離矩陣,反應(yīng)序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計(jì)算產(chǎn)生系統(tǒng)進(jìn)化指導(dǎo)樹,對(duì)關(guān)系密切的序列

13、進(jìn)行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對(duì),直到所有序列都被加入為止。第一步:點(diǎn)擊FileLoad Sequences輸入序列文件。第二步:點(diǎn)擊Alignment設(shè)定比對(duì)的一些參數(shù)。第三步:點(diǎn)擊AlignmentDo Complete Alignment開始序列比對(duì)。第四步:點(diǎn)擊FileSave Sequence as.比對(duì)完成,選擇保存結(jié)果文件的格式。9、 電子克隆比傳統(tǒng)的實(shí)驗(yàn)克隆有何優(yōu)勢(shì)?為何能實(shí)現(xiàn)電子克???答:電子克隆利用種子序列從EST及UniGene數(shù)據(jù)庫中搜索相似性序列,進(jìn)行拼裝、檢索、分析等,以此獲得目標(biāo)基因的全長cDNA,在此基礎(chǔ)上也能夠?qū)崿F(xiàn)基因

14、作圖定位。其相比實(shí)驗(yàn)克隆所具有的優(yōu)勢(shì)有:1) 實(shí)驗(yàn)進(jìn)程短、快捷、設(shè)備簡單;2) 成本低、得率高、針對(duì)性強(qiáng)等;3) 對(duì)操作人員技術(shù)要求不高;4) 另外運(yùn)用電子克隆的方法延伸得到的cDNA幾乎囊括了所有疑似為目的基因的cDNA序列。能實(shí)現(xiàn)電子克隆是因?yàn)椋篍ST數(shù)據(jù)庫的不斷完善,使得電子克隆策略已成為克隆新基因的重要方法。從GenBank的核酸(nr)數(shù)據(jù)庫中檢索已測(cè)序列生物的目的基因,獲得目的基因cDNA序列,以該序列為模板對(duì)另一種未測(cè)序列生物EST數(shù)據(jù)庫進(jìn)行BLAST檢索,獲得與之部分同源的EST群,從中選取一條EST作為種子序列BLAST檢索該生物的EST數(shù)據(jù)庫,將檢出與種子序列同源性較高或有

15、部分重疊的EST序列拼接組裝為重疊群(contig),再以此重疊群序列重復(fù)以上BLAST檢索過程,反復(fù)進(jìn)行EST重疊群序列的拼接和比對(duì),直至檢出所有的重疊EST或重疊群不能繼續(xù)延伸,最終獲得未測(cè)序列生物基因的cDNA全序列。10、 蛋白質(zhì)分子結(jié)構(gòu)的層次?相應(yīng)的分析工具?答:蛋白質(zhì)一級(jí)結(jié)構(gòu)分析:1) ProtParam:蛋白質(zhì)理化參數(shù)檢索;2) ProtScale:蛋白質(zhì)親疏水性分析;3) coiled-coil 卷曲螺旋預(yù)測(cè)。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè):二級(jí)結(jié)構(gòu)指helix,sheet,無規(guī)則卷曲(coil),motif等組件。預(yù)測(cè)方法:1) 神經(jīng)網(wǎng)絡(luò)、遺傳算法、機(jī)器學(xué)習(xí)等;2) 與已知二級(jí)模板建立序

16、列譜矩陣(profile matrix)、PSIBLASTP;3) 與同源蛋白多重比對(duì)。模式和序列譜分析:EBI:InterProScan 整合出的部分?jǐn)?shù)據(jù)庫有:Proside 蛋白質(zhì)結(jié)構(gòu)域、家族和功能位點(diǎn);Pfam 蛋白質(zhì)家族比對(duì);TMHMM 跨膜區(qū)預(yù)測(cè)。蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè):實(shí)驗(yàn)測(cè)定方法:X-ray、NMR、Cryo-EM;理論預(yù)測(cè)方法:同源建模、折疊識(shí)別、從頭計(jì)算。3、 綜合分析1、 DNA序列的鑒定策略答:鑒定三步驟:1) 找到序列中的非編碼區(qū)編碼區(qū)與非編碼區(qū)顯著不同,重復(fù)序列和低復(fù)雜序列排除基因的可能性,首先屏蔽掉。屏蔽重復(fù)序列的分析程序有:RepeatMasker, XBLAST,

17、CENSOR等。此外,確定待檢序列是否真實(shí)(載體污染,宿主序列污染,純度因素等),載體序列污染分析程序有:NCBI / VecScreen;EMBL / Blast2 EVEC。2) 找基因根據(jù)基因特征信號(hào),如保守序列(啟動(dòng)子,CpG島)、起始和終止密碼子、polyA,堿基頻率,密碼子偏好,EST。原核生物采用可讀框ORF檢測(cè)基因非常有效。CpG島的預(yù)測(cè)工具:EMBL-EBIK的在線工具CpGPlot;轉(zhuǎn)錄終止信號(hào)的預(yù)測(cè)方式:真核生物基因末端有終止子信號(hào),在mRNA終止密碼子下游具有polyA加尾信號(hào)AATAAA,可用于基因終止位點(diǎn)的預(yù)測(cè)。在線預(yù)測(cè)工具:POLYAH;啟動(dòng)子預(yù)測(cè)分析工具:TRE

18、S、Neural network、Dragon promoter finder、PromoterScan;可讀框ORF=起始密碼子ATG終止密碼子TGA或TAG或TAA。開放讀框的識(shí)別分析程序有:ORF Finder (NCBI), GenScan, GenomeScan。采用mRNA序列預(yù)測(cè)基因:以公共數(shù)據(jù)庫獲得mRNA /cDNA,從基因組序列預(yù)測(cè)基因,在線預(yù)測(cè)工具(NCBI) Spidey。3) 鑒定找到的基因建立基因模型以便核對(duì),同源性搜索增加可信度2、 蛋白質(zhì)結(jié)構(gòu)分析和預(yù)測(cè)的策略答:策略為:1) 在數(shù)據(jù)庫中搜尋與蛋白質(zhì)序列相似的模板;2) 查詢序列和已知三維結(jié)構(gòu)的蛋白質(zhì)序列的相似性比

19、對(duì);3) 如果符合相似則直接進(jìn)行結(jié)構(gòu)比較建模;4) 如果不相似則先進(jìn)行蛋白質(zhì)家族、功能域、聚類分析,再與已知的蛋白質(zhì)結(jié)構(gòu)比對(duì),有關(guān)系的才進(jìn)行比較建模;5) 若還是不相關(guān),則對(duì)蛋白質(zhì)序列進(jìn)行結(jié)構(gòu)分析,對(duì)可以預(yù)想出其結(jié)構(gòu)的蛋白質(zhì)預(yù)測(cè)其三維結(jié)構(gòu),對(duì)無法預(yù)想出結(jié)構(gòu)的蛋白質(zhì)在實(shí)驗(yàn)室中進(jìn)行進(jìn)一步結(jié)構(gòu)分析。知識(shí)點(diǎn)生物信息學(xué)研究的基本方法生物學(xué)數(shù)據(jù)庫的建立生物學(xué)數(shù)據(jù)的檢索生物學(xué)數(shù)據(jù)的處理生物學(xué)數(shù)據(jù)的利用生物信息數(shù)據(jù)的存儲(chǔ)格式一般由兩/三部分組成:紀(jì)錄信息、特性注釋、序列本身FASTA格式(序列最簡單注釋)序列文件的第一行是由大于符號(hào)()打頭的任意文字說明,主要為標(biāo)記序列用。從第二行開始是序列本身,標(biāo)準(zhǔn)核苷酸符

20、號(hào)或氨基酸單字母符號(hào)。通常核苷酸符號(hào)大小寫均可,而氨基酸一般用大寫字母。文件中和每一行都不要超過80個(gè)字符(通常60個(gè)字符)。GenBank和EMBL數(shù)據(jù)庫基本數(shù)據(jù)的格式序列名稱、長度、日期序列說明、編號(hào)、版本號(hào)物種來源、學(xué)名、分類學(xué)位置相關(guān)文獻(xiàn)作者、題目、刊物、日期序列特征表堿基組成序列本身(每行60個(gè)堿基)PDB格式記錄除了原子坐標(biāo)外,還包括物種來源、化合物名稱、結(jié)構(gòu)遞交以及有關(guān)文獻(xiàn)等基本注釋信息。此外,還給出分辨率、結(jié)構(gòu)因子、溫度系數(shù)、蛋白質(zhì)主鏈數(shù)目、配體分子式、金屬離子、二級(jí)結(jié)構(gòu)信息、二硫鍵位置等和結(jié)構(gòu)有關(guān)的數(shù)據(jù)。蛋白質(zhì)序列的格式FASTA、序列文件格式、PDB數(shù)據(jù)格式一次數(shù)據(jù)庫直接來

21、源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類、整理和注釋。一級(jí)核酸數(shù)據(jù)庫:GenBank數(shù)據(jù)庫、EMBL數(shù)據(jù)庫、DDBJ數(shù)據(jù)庫一級(jí)蛋白質(zhì)序列數(shù)據(jù)庫:SWISS-PROT庫、PIR庫一級(jí)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:PDB數(shù)據(jù)庫二次數(shù)據(jù)庫在一級(jí)數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)、文獻(xiàn)數(shù)據(jù)和理論分析的基礎(chǔ)上,針對(duì)不同的研究內(nèi)容和需要,對(duì)生物學(xué)知識(shí)和信息的進(jìn)一步整理得到的數(shù)據(jù)庫。人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點(diǎn)庫、TRANSFAC、蛋白質(zhì)序列功能位點(diǎn)數(shù)據(jù)庫Prosite等。蛋白質(zhì)數(shù)據(jù)庫序列數(shù)據(jù)庫(序列及其注釋):SWISS-PROT、PIR (protein information resource)、NCBI(其功能和應(yīng)

22、用范圍快速拓展)模體和結(jié)構(gòu)域數(shù)據(jù)庫(結(jié)構(gòu)域、功能域):PROSITE、Pfam (protein families database of alignments and HMMs)結(jié)構(gòu)數(shù)據(jù)庫:PDB (protein databank)蛋白質(zhì)分類數(shù)據(jù)庫:SCOP、CATH、FSSPPDB是目前最主要的收集生物大分子(蛋白質(zhì)、核酸和糖,以及病毒)三維結(jié)構(gòu)的數(shù)據(jù)庫,是通過X射線單晶衍射、核磁共振、電子衍射等實(shí)驗(yàn)手段確定的蛋白質(zhì)、多糖、核酸、病毒等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)庫。NCBI數(shù)據(jù)庫檢索系統(tǒng)EntrezEntrez是NCBI開發(fā)的基于WWW的數(shù)據(jù)庫檢索工具,它可以用來搜索20多個(gè)集成在NCBI

23、中的數(shù)據(jù)庫信息。數(shù)據(jù)庫搜索:BLAST & FASTA多序列比對(duì)工具Clustal W:對(duì)DNA和蛋白質(zhì)進(jìn)行多序列聯(lián)配并且生成親緣樹的工具。EMBL:提供在線的基于萬維網(wǎng)界面的ClustalW服務(wù):對(duì)Clustal W的結(jié)果進(jìn)行觀察的程序?yàn)椋簄jplotWIN95, treeview, 等構(gòu)建進(jìn)化樹-基于大分子序列進(jìn)化分子系統(tǒng)發(fā)育:DNA在進(jìn)化過程中積累突變,從而導(dǎo)致不同株系后代的DNA、RNA和蛋白質(zhì)的分支。這個(gè)原則被用于進(jìn)化樹的構(gòu)建。進(jìn)化樹構(gòu)建的基本步驟1、多序列比對(duì)(自動(dòng)或手動(dòng)):用Clustal,有些軟件已整合上Clustal, 如MEGA。2、確定建樹方法(取代模型):距離(UPGMA, NJ, ME)、最大節(jié)約(MP)、最大似然(ML),3、建樹;4、進(jìn)化樹評(píng)估。電子克隆7.1 利用UniGene數(shù)據(jù)庫進(jìn)行序列電子延伸7.2 從數(shù)據(jù)庫中獲取cDNA全長序列7.3 序列拼接本地拼接軟件Windows:Sequencher, DNAstar, Unix: CAP3, Phrap, TIGR Assembler, Velvet, 在線服務(wù):CAP3 網(wǎng)址7.4 基因的電子表達(dá)譜分析7.5 核酸序列的電子基因定位分析蛋白質(zhì)序列的獲取直接測(cè)序:Edman,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論