




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一 、簡答。(本題滿分70分)1、簡述生物信息學(xué)產(chǎn)生的歷史必然性,以及生物信息學(xué)的主要研究內(nèi)容?(本小題滿分20分)答:生物信息學(xué)的產(chǎn)生,是生物科學(xué)與計算機技術(shù)的結(jié)合。20世紀(jì)后期,生物科學(xué)技術(shù)迅猛發(fā)展,無論從數(shù)量上還是從質(zhì)量上都極大地豐富了生物科學(xué)的數(shù)據(jù)資源。數(shù)據(jù)資源的急劇膨脹迫使人們尋求一種強有力的工具去組織這些數(shù)據(jù),以利于儲存、加工和進(jìn)一步利用。而海量的生物學(xué)數(shù)據(jù)中必然蘊含著重要的生物學(xué)規(guī)律,這些規(guī)律將是解釋生命之謎的關(guān)鍵,人們同樣需要一種強有力的工具來協(xié)助人腦完成對這些數(shù)據(jù)的分析工作。另一方面,以數(shù)據(jù)分析、處理為本質(zhì)的計算機科學(xué)技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展?并日益滲透到生物科學(xué)的各個領(lǐng)域。于
2、是,一門嶄新的、擁有巨大發(fā)展?jié)摿Φ男聦W(xué)科生物信息學(xué)悄然興起。 生物信息學(xué)的誕生及其重要性早在1956年,在美國田納西州蓋特林堡召開的首次“生物學(xué)中的信息理論研討會”上,便產(chǎn)生了生物信息學(xué)的概念。但是,就生物信息學(xué)的發(fā)展而言,它還是一門相當(dāng)年輕的學(xué)科。直到20世紀(jì)8090年代,伴隨著計算機科學(xué)技術(shù)的進(jìn)步,生物信息學(xué)才獲得突破性進(jìn)展。1987年,林華安博士正式把這一學(xué)科命名為“生物信息學(xué)”(Bioinformatics)。此后,其內(nèi)涵隨著研究的深入和現(xiàn)實需要的變化而幾經(jīng)更迭。1995年,在美國人類基因組計劃第一個五年總結(jié)報告中,給出了一個較為完整的生物信息學(xué)定義:生物信息學(xué)是一門交叉科學(xué),它包含了
3、生物信息的獲取、加工、存儲、分配、分析、解釋等在內(nèi)的所有方面,它綜合運用數(shù)學(xué)、計算機科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。生物信息學(xué)不僅是一門新學(xué)科,更是一種重要的研究開發(fā)工具。從科學(xué)的角度來講,生物信息學(xué)是一門研究生物和生物相關(guān)系統(tǒng)中信息內(nèi)容與信息流向的綜合系統(tǒng)科學(xué)。只有通過生物信息學(xué)的計算處理,人們才能從眾多分散的生物學(xué)觀測數(shù)據(jù)中獲得對生命運行機制的系統(tǒng)理解。從工具的角度來講,生物信息學(xué)幾乎是今后所有生物(醫(yī)藥)研究開發(fā)所必需的工具。只有根據(jù)生物信息學(xué)對大量數(shù)據(jù)資料進(jìn)行分析后,人們才能選擇該領(lǐng)域正確的研發(fā)方向。生物信息學(xué)不僅具有重大的科學(xué)意義,而且具有巨大的經(jīng)濟(jì)效
4、益。它的許多研究成果可以較快地產(chǎn)業(yè)化,成為價值很高的產(chǎn)品。 生物信息學(xué)的研究內(nèi)容生物信息學(xué)的研究內(nèi)容是伴隨著基因組研究而發(fā)展的。廣義地說,生物信息學(xué)從事對基因組研究相關(guān)生物信息的獲取、加工、存儲、分配、分析和解釋。這個定義的含義是雙重的:一是對海量數(shù)據(jù)的收集、整理與服務(wù),即管理好這些數(shù)據(jù);二是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。具體地說,生物信息學(xué)是把基因組DNA(脫氧核糖核酸)序列信息分析作為源頭,找到基因組序列中代表蛋白質(zhì)和RNA(核糖核酸)基因的編碼區(qū)。同時,闡明基因組中大量存在的非編碼區(qū)的信息實質(zhì),破譯隱藏在DNA序列中的遺傳語言規(guī)律。在此基礎(chǔ)上,歸納、整理與基因組遺傳信息釋放及其調(diào)
5、控相關(guān)的轉(zhuǎn)錄譜和蛋白質(zhì)譜的數(shù)據(jù),從而認(rèn)識代謝、發(fā)育、分化、進(jìn)化的規(guī)律。縱觀當(dāng)今生物信息學(xué)界的現(xiàn)狀可以發(fā)現(xiàn),大部分研究人員都把注意力集中在基因組、蛋白質(zhì)組、蛋白質(zhì)結(jié)構(gòu)以及與此密切相關(guān)的藥物設(shè)計上。1 基因組基因組研究的首要目標(biāo)是獲得人的整套遺傳密碼。人的遺傳密碼有32億個堿基,而現(xiàn)在的DNA測序儀每個反應(yīng)只能讀取幾百到上千個堿基。這樣,要得到人的全部遺傳密碼,首先要把人的基因組打碎,測完一個個小段的序列后再把它們重新拼接起來。而基因組大規(guī)模測序的每一個環(huán)節(jié),都同信息分析緊密相關(guān),每一步都緊密依賴于生物信息學(xué)的軟件和數(shù)據(jù)庫。2 蛋白質(zhì)組基因組對生命體的整體控制必須通過它所表達(dá)的全部蛋白質(zhì)來執(zhí)行。由
6、于基因芯片技術(shù)只能反映從基因組到RNA的轉(zhuǎn)錄水平上的表達(dá)情況,而從RNA到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,這樣,僅憑基因芯片技術(shù)人們還不能最終掌握生物功能的具體執(zhí)行者蛋白質(zhì)的整體表達(dá)狀況。因此,近年在發(fā)展基因芯片的同時,人們還發(fā)展了一套研究基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況的技術(shù)蛋白質(zhì)組研究技術(shù),包括二維凝膠電泳技術(shù)和質(zhì)譜測序技術(shù)。然而,最重要的是如何運用生物信息學(xué)的方法去分析獲得的海量數(shù)據(jù),從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分子機制。3 蛋白質(zhì)結(jié)構(gòu)及新藥設(shè)計基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來。要了解它們的功能,只有氨基酸序列是遠(yuǎn)遠(yuǎn)不夠的。得到這些新蛋白的完整、精確和動態(tài)的三維
7、結(jié)構(gòu),是擺在人們面前的緊迫任務(wù)。近年,隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得了精確的測定。根據(jù)生物大分子結(jié)構(gòu)的知識,有針對性地設(shè)計藥物成為熱點。生物信息學(xué)的研究不僅可以提供生物大分子空間結(jié)構(gòu)的信息,還能提供電子結(jié)構(gòu)的信息,如能級、表面電荷分布、分子軌道相互作用以及動力學(xué)行為的信息。但是,生物信息學(xué)的任務(wù)遠(yuǎn)不止于此,最重要的是如何運用數(shù)理理論成果,對生物體進(jìn)行完整系統(tǒng)的數(shù)理模型描述,以便使人類能夠從一個更明確的角度、以一種更易于操作的方式,來認(rèn)識和控制自身以及其他生命體。2、通過一個具體實例分析,說明利用生物信息學(xué)進(jìn)行DNA序列分析鑒定的策略(本小題滿分20分)答
8、:(1)慢性粒細(xì)胞性白血病WT1基因WT1基因是人體內(nèi)一個復(fù)雜的基因,它在一些惡性腫瘤患者體內(nèi)呈現(xiàn)有規(guī)律的表達(dá),這使它一直成為多年來研究的熱點.WT1在人類多數(shù)急性白血病(AL)細(xì)胞異常地高表達(dá),而在正常人的骨髓則無表達(dá)或極微量表達(dá)。.(2)在NCBI上查詢WT1基因,如下圖。(3)在“Top Organisms(Tree)”里選擇“Homo sapiens”,如下圖所示。選擇后的結(jié)果:(4)選擇第8條記錄結(jié)果并打開,結(jié)果如下圖。(5)用RepeatMasker分析和屏蔽重復(fù)序列,結(jié)果沒有重復(fù)序列,如下圖所示。(6)通過NCBI / VecScreen在線分析載體污染,結(jié)果為“No signi
9、ficant similarity found”,說明無載體污染詳細(xì)步驟:將序列貼入,并點擊【Run VecScreen】按鈕,結(jié)果如下。點擊 【View report 】按鈕,結(jié)果如下。“No significant similarity found”,說明無載體污染(7)通過“NCBI / ORF Finder”在線分析得開放閱讀框如下圖所示:(網(wǎng)址)單擊OrfFind按鈕,得到如下結(jié)果:(8)采用BDGP:Neural Network Promoter Prediction來預(yù)測該序列的啟動子,可通過Home(BDGP) Software Tools(Analysis Tools) Pr
10、omoter Prediction程序進(jìn)入該網(wǎng)站。該網(wǎng)站能預(yù)測人和果蠅的啟動子,預(yù)測結(jié)果如下:(網(wǎng)址)3、通過一個具體的實例分析,說明利用生物信息學(xué)進(jìn)行蛋白質(zhì)結(jié)構(gòu)研究的策略,要求最終得到蛋白質(zhì)3D建模結(jié)果(本小題滿分30分)。答:1982年P(guān)rusiner(布魯西納)從倉鼠中分離出了一種蛋白質(zhì)因子,它具有感染性,是綿羊瘙癢病和庫魯癥等致命疾病的致病因子。后來的研究發(fā)現(xiàn),在神經(jīng)突觸膜上有一種穿膜糖蛋白,肽鏈中富含螺旋,它是Prnp基因的正常表達(dá)產(chǎn)物,是prion的前身物。prion肽鏈中富含折疊,是致病因子,具有感染性。組成prion的物質(zhì)是不含核酸的蛋白質(zhì),這種蛋白質(zhì)稱為prion蛋白質(zhì)(pr
11、ion protein)。本題以prion蛋白質(zhì)為例,利用生物信息學(xué)進(jìn)行蛋白質(zhì)結(jié)構(gòu)研究。(1)利用BioEdit軟件分析Prion的氨基酸組成:Sequence Protein Amino Acid Composition,結(jié)果如下。Protein: Prion ProteinLength = 253 amino acidsMolecular Weight = 27627.84 DaltonsAmino Acid Number Mol% Ala A 10 3.95 Cys C 4 1.58 Asp D 6 2.37 Glu E 9 3.56 Phe F 7 2.77 Gly G 45 17.7
12、9 His H 10 3.95 Ile I 9 3.56 Lys K 10 3.95 Leu L 12 4.74 Met M 11 4.35 Asn N 12 4.74 Pro P 17 6.72 Gln Q 15 5.93 Arg R 11 4.35 Ser S 15 5.93 Thr T 13 5.14 Val V 15 5.93 Trp W 9 3.56 Tyr Y 13 5.14(2)利用BioEdit軟件分析Prion的親水性(hydrophilicity)、疏水性(Hydrophobicity)情況:Sequence Protein Kyte & Doolittle Scale M
13、ean Hydrophobicity Profile,結(jié)果如下:(3)NCBI Blast bBlast(蛋白對蛋白的)可分別得該Prion的保守結(jié)構(gòu)域,如下圖:(4)利用“Motif Scan”網(wǎng)站對Prion蛋白質(zhì)進(jìn)行motif結(jié)構(gòu)分析,分析結(jié)果如下圖所示,其中,Summary一欄是該蛋白列所包含的全部motif,而Match Details一欄則是對所有這些motif的評分,即符合程度分析:(網(wǎng)址gi-bin/PFSCAN)(5)利用“Prosite”網(wǎng)站對Prion蛋白質(zhì)進(jìn)行motif結(jié)構(gòu)分析,分析結(jié)果如下圖所示(網(wǎng)站y.ch/prosite/):(6)利用PredictProtein
14、網(wǎng)站對人Prion Protien序列的二級結(jié)構(gòu)預(yù)測,結(jié)果如下。(要先Register,再sign in,中間等待時間長,網(wǎng)址/)結(jié)果如下:(7)利用Swiss-Model網(wǎng)站對Prion蛋白進(jìn)行高級結(jié)構(gòu)預(yù)測和同源建模:ModelingmyWorkplaceAutomated Mode,只有兩種結(jié)果,如下,使用rasmol軟件能使蛋白空間結(jié)構(gòu)可視化。二 、以一個基因或者酶蛋白,查詢10個物種以上此基因或者酶蛋白的序列,用本地軟件做系統(tǒng)樹分析,并簡單點評你的結(jié)果。(本題滿分30分)答:在這里仍以Prion蛋白為例做系統(tǒng)樹分析,步驟如下:(1)從NCBI查
15、詢Prion蛋白序列,下載其中12個物種的,以“fasta格式”格式保存;(2)對下載的每個序列用記事本打開,檢查序列的格式是否統(tǒng)一,并復(fù)制、粘貼到其中任意一個文件里;(3)在MEGA界面中,選擇Alignment Alignment Explorer/CLUSTAL,出現(xiàn)下面的對話框:單擊“OK”,出現(xiàn)如下選擇框,在此我選擇“Create a new alignment”。 單擊“OK”,出現(xiàn)如下選擇框:單擊“NO”即可。(4)在M4界面中,單擊Date Open Retrieve Sequences from File ,選擇已保存的FASTA格式文件;(4)在M4界面中,雙擊文件名可以進(jìn)
16、行修改,然后右鍵菜單點擊刪除Clustal X中附帶 “”的行,然后點擊Ctrl+A選中所有序列,依次點擊AlignmentAlign by ClustalW出現(xiàn)的界面點擊 OK;(5)在M4界面中,選擇Data Expert Alignment MEGAFormat(保存該文件并命名),即把FASTA格式文件轉(zhuǎn)化為MEGA格式文件;(6)關(guān)閉M4界面,出現(xiàn)界面Open The Data File in MEGA 點擊YES 出現(xiàn)一個新界面,在MEGA4界面中,選擇Phlogeny Construct Phlogeny 選擇(NJ、ME、MP、UPGMA)等進(jìn)化樹結(jié)構(gòu)類型Compute,即可得到進(jìn)化樹;(7)在MEGA4界面中,選擇Phlogeny Bootstrap Test of Phylogeny 選擇進(jìn)化樹結(jié)構(gòu)類型(NJ、ME、MP、UPGMA) Compute,即可得到進(jìn)化樹;(8)在有進(jìn)化樹的M4界面選擇Image Copy to Clipboard 直接粘貼到Word文檔。圖1:原始進(jìn)化樹圖2:Bootst
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年云南省科技廳下屬事業(yè)單位真題
- 新型通信系統(tǒng)設(shè)計考試題目及答案
- 公益組織會計的工作計劃
- 2024年延安市人民醫(yī)院招聘筆試真題
- 2024年湖南省科學(xué)技術(shù)廳下屬事業(yè)單位真題
- 2024年湖北省鄉(xiāng)村振興局下屬事業(yè)單位真題
- 成功的蜂巢軟件設(shè)計師考試的試題及答案
- 如何提升品牌員工的認(rèn)同感計劃
- 2024年南寧上林縣三里鎮(zhèn)招聘筆試真題
- 2024年馬鞍山經(jīng)開區(qū)城管局招聘筆試真題
- 肖申克的救贖-讀書感悟
- 神經(jīng)病學(xué)課件:進(jìn)行性肌營養(yǎng)不良癥完整版
- 理正抗滑樁設(shè)計說明書模板
- 醫(yī)學(xué)康復(fù)學(xué)課件:平衡功能障礙評定與康復(fù)
- 工程索賠與反索賠
- 教育學(xué)心理學(xué)考試題
- 2022年桂林市小升初英語考試試題及答案解析
- LY/T 3073-2018古樹名木管護(hù)技術(shù)規(guī)程
- GB/T 34132-2017智能變電站智能終端裝置通用技術(shù)條件
- 2022年云南省初中學(xué)業(yè)水平考試道德與法治試題(解析版)
- 09S304 衛(wèi)生設(shè)備安裝圖集
評論
0/150
提交評論