生物信息學(xué)學(xué)習(xí)心得

上傳人：s*** IP屬地：天津上傳時(shí)間：2023-05-23 格式：DOCX 頁(yè)數(shù)：19 大?。?2.48KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)學(xué)習(xí)心得第一篇：生物信息學(xué)生物信息學(xué)是上世紀(jì)90年代初人類基因組計(jì)劃(hgp)依賴，隨著基因組學(xué)、蛋白組學(xué)等新興學(xué)科的建立，逐漸發(fā)展起來(lái)的生物學(xué)、數(shù)學(xué)和計(jì)算機(jī)信息科學(xué)的一門交叉應(yīng)用學(xué)科。目前生物信息學(xué)的研究領(lǐng)域主要包括基于生物序列數(shù)據(jù)的整理和注釋、生物信息挖掘工具開發(fā)及利用這些工具揭示生物學(xué)基礎(chǔ)理論知識(shí)等領(lǐng)域。生物信息學(xué)作為新型交叉應(yīng)用學(xué)科，可以依托本校已有的計(jì)算機(jī)科學(xué)、信息學(xué)、生物學(xué)和數(shù)學(xué)等學(xué)科優(yōu)勢(shì)，充分展現(xiàn)投入少、見(jiàn)效快、起點(diǎn)高的特色，推動(dòng)學(xué)校學(xué)科建設(shè)和本科教學(xué)水平。本實(shí)驗(yàn)指導(dǎo)書中的8個(gè)實(shí)驗(yàn)均設(shè)計(jì)為綜合性開發(fā)實(shí)驗(yàn)，面向生物信息學(xué)院全體本科學(xué)生和研究生，以及全校對(duì)生物信息學(xué)感興趣的其他專業(yè)學(xué)生開放。生物信息學(xué)實(shí)驗(yàn)室將提供系統(tǒng)的保障，包括采用mail服務(wù)器和linux帳號(hào)管理等進(jìn)行實(shí)驗(yàn)過(guò)程管理和支持。限選《生物信息學(xué)及實(shí)驗(yàn)》的生物技術(shù)專業(yè)本科生至少選擇其中5個(gè)實(shí)驗(yàn)，并不少于8個(gè)學(xué)時(shí)，即為課程要求的0.5個(gè)學(xué)分。其他選修者按照課時(shí)和學(xué)校相關(guān)規(guī)定計(jì)算創(chuàng)新學(xué)分。實(shí)驗(yàn)一熟悉生物信息學(xué)站及其數(shù)據(jù)的生物學(xué)意義實(shí)驗(yàn)?zāi)康模号囵B(yǎng)學(xué)生利用互聯(lián)資源獲取生物信息學(xué)研究前沿和相關(guān)數(shù)據(jù)的能力，熟悉生物信息學(xué)相關(guān)的一些重要國(guó)內(nèi)外站，及其核酸序列、蛋白質(zhì)序列及代謝途徑等功能相關(guān)數(shù)據(jù)庫(kù)，學(xué)會(huì)下載生物相關(guān)的信息數(shù)據(jù)，了解不同的數(shù)據(jù)件格式和其中重要的生物學(xué)意義。實(shí)驗(yàn)原理：利用互聯(lián)資源檢索相關(guān)的國(guó)內(nèi)外生物信息學(xué)相關(guān)站，如：ncbi、sanger、tigr、kegg、swissport、ensemble、中科院北京基因組研究所、北大生物信息學(xué)中心等，下載其中相關(guān)的數(shù)據(jù)，如fasta、genbank格式的核算和蛋白質(zhì)序列、pathway等數(shù)據(jù)，理解其重要的生物學(xué)意義。實(shí)驗(yàn)內(nèi)容：瀏覽和搜索至少10個(gè)國(guó)外和至少5個(gè)國(guó)內(nèi)生物信息學(xué)相關(guān)站，并描述站特征；下載各站的代表性數(shù)據(jù)各10條（組）以上，并說(shuō)明其生物學(xué)意義；討論各站適合做何種生物信息學(xué)研究的平臺(tái)，并設(shè)計(jì)一個(gè)研究設(shè)想。實(shí)驗(yàn)報(bào)告：各站址及特征描述；代表性數(shù)據(jù)的下載和生物學(xué)意義的描述；討論：這些生物信息學(xué)相關(guān)站的信息資源，可以被那些生物信息學(xué)研究所利用。參考書目：《生物信息學(xué)概論》羅靜初等譯，北京大學(xué)出版社，2014；《生物信息學(xué)手冊(cè)》郝柏林等著，上海科技出版社，2014；《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》胡松年等著，浙江大學(xué)出版社，2014。實(shí)驗(yàn)二利用blast進(jìn)行序列比對(duì)實(shí)驗(yàn)?zāi)康模毫私鈈last及其子程序的原理和基本參數(shù)，熟練地應(yīng)用絡(luò)平臺(tái)和linux計(jì)算平臺(tái)進(jìn)行本地blast序列比對(duì)，熟悉blast結(jié)果的格式和內(nèi)容并能描述其主要意義，同時(shí)比較上平臺(tái)和本地平臺(tái)的優(yōu)缺點(diǎn)。實(shí)驗(yàn)原理：利用實(shí)驗(yàn)一下載的核算和蛋白質(zhì)序列，提交到ncbi或者其他擁有blast運(yùn)算平臺(tái)的頁(yè)上，觀察其基本參數(shù)設(shè)定庫(kù)件類型，并得到計(jì)算結(jié)果；同時(shí)在本地服務(wù)器上學(xué)會(huì)用formatdb格式化庫(kù)件，并輸入blast命令進(jìn)行計(jì)算，獲得結(jié)果件。實(shí)驗(yàn)內(nèi)容：向上blast服務(wù)器提交序列，得到匹配結(jié)果；本地使用blast，格式化庫(kù)件，輸入命令行得到匹配結(jié)果；對(duì)結(jié)果件進(jìn)行簡(jiǎn)要描述，闡述生物學(xué)意義。實(shí)驗(yàn)報(bào)告：闡述blast原理和比對(duì)步驟；不同類型blast的結(jié)果及其說(shuō)明；討論：不同平臺(tái)運(yùn)行blast的需求比較。參考書目：《生物信息學(xué)概論》羅靜初等譯，北京大學(xué)出版社，2014；《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》胡松年等著，浙江大學(xué)出版社，2014；。實(shí)驗(yàn)三利用clustalx(w)進(jìn)行多序列聯(lián)配實(shí)驗(yàn)?zāi)康模赫莆沼胏lustalx(w)工具及其基本參數(shù)，對(duì)具有一定同源性和相似性的核酸與蛋白質(zhì)序列進(jìn)行聯(lián)配和聚類分析，由此對(duì)這些物種的親緣關(guān)系進(jìn)行判斷，并且對(duì)這些序列在分子進(jìn)化過(guò)程中的保守性做出估計(jì)。實(shí)驗(yàn)原理：首先對(duì)于輸入的每一條序列，兩兩之間進(jìn)行聯(lián)配，總共進(jìn)行n*(n-1)/2次聯(lián)配，這一步通過(guò)一種快速的近似算法實(shí)現(xiàn)，其得分用來(lái)計(jì)算指導(dǎo)樹，系統(tǒng)樹圖能用于指導(dǎo)后面進(jìn)行的多序列聯(lián)配的過(guò)程。系統(tǒng)樹圖是通過(guò)upgma方法計(jì)算的。在系統(tǒng)樹圖繪制完以后，輸入的所有序列按照得分高低被分成n-1個(gè)組，然后再對(duì)組與組之間進(jìn)行聯(lián)配，這一步用myers和miller算法實(shí)現(xiàn)。實(shí)驗(yàn)內(nèi)容：明確軟件所支持的輸入件格式，搜集整理出合適的數(shù)據(jù)；在windows環(huán)境運(yùn)行clustalx，在linux環(huán)境運(yùn)行clustalw；實(shí)驗(yàn)結(jié)果及分析，用treev32或njplotwin95生成nj聚類圖。實(shí)驗(yàn)報(bào)告：整理的符合clustal的序列數(shù)據(jù)；提交數(shù)據(jù)頁(yè)記錄和各步驟記錄；提供聚類圖和多序列聯(lián)配圖，并說(shuō)明意義。參考書目：《生物信息學(xué)概論》羅靜初等譯，北京大學(xué)出版社，2014；《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》胡松年等著，浙江大學(xué)出版社，2014。實(shí)驗(yàn)四ests分析實(shí)驗(yàn)?zāi)康模菏煜な褂靡幌盗猩镄畔W(xué)分析工具對(duì)測(cè)序得到ests序列數(shù)據(jù)進(jìn)行聚類處理，由此對(duì)獲得表達(dá)基因的豐度等相關(guān)信息，并且對(duì)這些表達(dá)基因進(jìn)行功能的初步詮釋，為后續(xù)實(shí)驗(yàn)通過(guò)設(shè)計(jì)race引物獲得全長(zhǎng)基因，以及進(jìn)一步的功能注釋和代謝途徑分析做準(zhǔn)備。實(shí)驗(yàn)原理：首先用crossmatch程序去除ests原始序列中的載體成分和引物成分，然后用phrap生成congtig和singlet，用blast程序進(jìn)一步將有同源性的contig和singlet進(jìn)行功能聚類，最后通過(guò)blast對(duì)聚類獲得的cluster進(jìn)行功能注釋。在實(shí)驗(yàn)過(guò)程中將用到一些本實(shí)驗(yàn)室寫的perl程序用于連接各數(shù)據(jù)庫(kù)和工具軟件。實(shí)驗(yàn)內(nèi)容：運(yùn)行codoncodealigner程序，并用它建立工程件，導(dǎo)入例子件夾里面的數(shù)據(jù)；練習(xí)對(duì)序列的各種查看方式。使用codoncodealigner程序里的clipends,trimvector,assemble等功能，完成序列的剪切、去雜質(zhì)、組裝。實(shí)驗(yàn)報(bào)告：實(shí)驗(yàn)各步驟記錄和中間結(jié)果件；舉例簡(jiǎn)要說(shuō)明結(jié)果件中數(shù)據(jù)的生物學(xué)意義。參考書目：《生物信息學(xué)概論》羅靜初等譯，北京大學(xué)出版社，2014；《基因表達(dá)序列標(biāo)簽（est）數(shù)據(jù)分析手冊(cè)》胡松年等著，浙江大學(xué)出版社，2014。實(shí)驗(yàn)五利用primerpremier5.0設(shè)計(jì)race引物實(shí)驗(yàn)?zāi)康模菏煜cr引物設(shè)計(jì)工具primerpremier5.0的一些基本功能，能夠根據(jù)實(shí)驗(yàn)需要選擇相應(yīng)的引物設(shè)計(jì)方法設(shè)計(jì)pcr引物。實(shí)驗(yàn)原理：pcr實(shí)驗(yàn)是當(dāng)代分子生物學(xué)的基本實(shí)驗(yàn)之一，由于目標(biāo)序列和實(shí)驗(yàn)?zāi)康牡牟煌鄳?yīng)設(shè)計(jì)引物的要求也不一樣。本實(shí)驗(yàn)延續(xù)ests分析結(jié)果，對(duì)于其中需要獲得全長(zhǎng)的基因進(jìn)行race引物的設(shè)計(jì)，及5’和3’race引物，配合接頭序列設(shè)計(jì)單向引物，并模擬練習(xí)通過(guò)連接獲得全長(zhǎng)的基因cds序列。最后設(shè)計(jì)已知全長(zhǎng)基因序列的pcr擴(kuò)增引物。實(shí)驗(yàn)內(nèi)容：從站下載并安裝primerpremier5.0；從genbank中任意獲取一個(gè)dna序列，設(shè)計(jì)出該序列的合適引物；實(shí)驗(yàn)報(bào)告：實(shí)驗(yàn)各步驟使用的數(shù)據(jù)、運(yùn)算平臺(tái)、結(jié)果件記錄；比較不同引物設(shè)計(jì)平臺(tái)和不同pcr實(shí)驗(yàn)的差別；參考書目：《生物信息學(xué)概論》羅靜初等譯，北京大學(xué)出版社，2014；《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》胡松年等著，浙江大學(xué)出版社，2014;。實(shí)驗(yàn)八perl程序的安裝、編寫、調(diào)試實(shí)驗(yàn)?zāi)康模号囵B(yǎng)學(xué)生能在windows和linux兩種平臺(tái)安裝perl解釋器、編寫perl程序以及debug和運(yùn)行的能力，熟悉perl語(yǔ)言基本語(yǔ)法，學(xué)會(huì)熟練編寫和運(yùn)用perl程序進(jìn)行基礎(chǔ)生物信息學(xué)研究。實(shí)驗(yàn)原理：perl語(yǔ)言是一門通用的腳本語(yǔ)言，具有強(qiáng)大的字符串處理功能，是生物信息學(xué)研究的強(qiáng)大幫手，學(xué)會(huì)了perl語(yǔ)言，就能方便地處理生物信息學(xué)研究中遇到的各種字符串本，促進(jìn)研究的快速進(jìn)行。實(shí)驗(yàn)內(nèi)容：下載perl程序在windows和linux下的安裝包并進(jìn)行安裝；編寫簡(jiǎn)單的perl程序，并學(xué)會(huì)debug；編寫具有簡(jiǎn)單功能的堿基處理perl程序。實(shí)驗(yàn)報(bào)告：perl解釋器安裝方法；perl解釋器debug方法；討論：perl語(yǔ)言在生物信息學(xué)研究中所起到的積極作用。參考書目：《perl編程24學(xué)時(shí)教程》(美)皮爾斯著王建華等譯，機(jī)械工業(yè)出版社，2014；《生物信息學(xué)手冊(cè)》郝柏林等著，上海科技出版社，2014；《生物信息學(xué)實(shí)驗(yàn)指導(dǎo)》胡松年等著，浙江大學(xué)出版社，2014第二篇：生物信息學(xué)生物信息學(xué)(bioinformatics)是在生命科學(xué)的研究中，以計(jì)算機(jī)為工具對(duì)生物信息進(jìn)行儲(chǔ)存、檢索和分析的科學(xué)。它是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一，同時(shí)也將是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。其研究重點(diǎn)主要體現(xiàn)在基因組學(xué)(genomics)和蛋白質(zhì)組學(xué)(proteomics)兩方面，具體說(shuō)就是從核酸和蛋白質(zhì)序列出發(fā)，分析序列中表達(dá)的結(jié)構(gòu)功能的生物信息。具體而言，生物信息學(xué)作為一門新的學(xué)科領(lǐng)域，它是把基因組dna序列信息分析作為源頭，在獲得蛋白質(zhì)編碼區(qū)的信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè)，然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計(jì)?；蚪M信息學(xué)，蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計(jì)構(gòu)成了生物信息學(xué)的3個(gè)重要組成部分。從生物信息學(xué)研究的具體內(nèi)容上看，生物信息學(xué)應(yīng)包括這3個(gè)主要部分：（1）新算法和統(tǒng)計(jì)學(xué)方法研究；（2）各類數(shù)據(jù)的分析和解釋；（3）研制有效利用和管理數(shù)據(jù)新工具。生物信息學(xué)是一門利用計(jì)算機(jī)技術(shù)研究生物系統(tǒng)之規(guī)律的學(xué)科。目前的生物信息學(xué)基本上只是分子生物學(xué)與信息技術(shù)（尤其是因特技術(shù)）的結(jié)合體。生物信息學(xué)的研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù)，其研究工具是計(jì)算機(jī)，研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索（收集和篩選）、處理（編輯、整理、管理和顯示）及利用（計(jì)算、模擬）。1990年代以來(lái)，伴隨著各種基因組測(cè)序計(jì)劃的展開和分子結(jié)構(gòu)測(cè)定技術(shù)的突破和internet的普及，數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫(kù)如雨后春筍般迅速出現(xiàn)和成長(zhǎng)。對(duì)生物信息學(xué)者提出了嚴(yán)峻的挑戰(zhàn)：數(shù)以億計(jì)的acgt序列中包涵著什么信息？基因組中的這些信息怎樣控制有機(jī)體的發(fā)育？基因組本身又是怎樣進(jìn)化的？生物信息學(xué)的另一個(gè)挑戰(zhàn)是從蛋白質(zhì)的氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。這個(gè)難題已困擾理論生物學(xué)家達(dá)半個(gè)多世紀(jì)，如今找到問(wèn)題答案要求正變得日益迫切。諾貝爾獎(jiǎng)獲得者w.gilbert在1991年曾經(jīng)指出：“傳統(tǒng)生物學(xué)解決問(wèn)題的方式是實(shí)驗(yàn)的。現(xiàn)在，基于全部基因都將知曉，并以電子可操作的方式駐留在數(shù)據(jù)庫(kù)中，新的生物學(xué)研究模式的出發(fā)點(diǎn)應(yīng)是理論的。一個(gè)科學(xué)家將從理論推測(cè)出發(fā)，然后再回到實(shí)驗(yàn)中去，追蹤或驗(yàn)證這些理論假設(shè)”。生物信息學(xué)的主要研究方向：基因組學(xué)-蛋白質(zhì)組學(xué)-系統(tǒng)生物學(xué)-比較基因組學(xué)，1989年在美國(guó)舉辦生物化學(xué)系統(tǒng)論與生物數(shù)學(xué)的計(jì)算機(jī)模型國(guó)際會(huì)議，生物信息學(xué)發(fā)展到了計(jì)算生物學(xué)、計(jì)算系統(tǒng)生物學(xué)的時(shí)代。姑且不去引用生物信息學(xué)冗長(zhǎng)的定義，以通俗的語(yǔ)言闡述其核心應(yīng)用即是：隨著包括人類基因組計(jì)劃在內(nèi)的生物基因組測(cè)序工程的里程碑式的進(jìn)展，由此產(chǎn)生的包括生物體生老病死的生物數(shù)據(jù)以前所未有的速度遞增，目前已達(dá)到每14個(gè)月翻一番的速度。同時(shí)隨著互聯(lián)的普及，數(shù)以百計(jì)的生物學(xué)數(shù)據(jù)庫(kù)如雨后春筍般迅速出現(xiàn)和成長(zhǎng)。然而這些僅僅是原始生物信息的獲取，是生物信息學(xué)產(chǎn)業(yè)發(fā)展的初組階段，這一階段的生物信息學(xué)企業(yè)大都以出售生物數(shù)據(jù)庫(kù)為生。以人類基因組測(cè)序而聞名的塞萊拉公司即是這一階段的成功代表。原始的生物信息資源挖掘出來(lái)后，生命科學(xué)工作者面臨著嚴(yán)峻的挑戰(zhàn)：數(shù)以億計(jì)的acgt序列中包涵著什么信息？基因組中的這些信息怎樣控制有機(jī)體的發(fā)育？基因組本身又是怎樣進(jìn)化的？生物信息學(xué)產(chǎn)業(yè)的高級(jí)階段體現(xiàn)于此，人類從此進(jìn)入了以生物信息學(xué)為中心的后基因組時(shí)代。結(jié)合生物信息學(xué)的新藥創(chuàng)新工程即是這一階段的典型應(yīng)用。第三篇：生物信息學(xué)剛剛接觸生物信息的時(shí)候，大家都比較迷茫，我覺(jué)得它是一個(gè)交叉學(xué)科，要想學(xué)得有一定的毅力。我的導(dǎo)師要求我至少作到以下幾個(gè)方面：1，數(shù)學(xué)基礎(chǔ)要點(diǎn)。線代，高數(shù)，統(tǒng)計(jì)等。2，計(jì)算機(jī)知識(shí)。windows,linux,unix系統(tǒng)等，各種常用生物軟件的使用?？梢宰约赫襾?lái)一個(gè)個(gè)試。matlab里面有的關(guān)于生物方面的工具包也很多的。生物知識(shí)，不用說(shuō)的。其他：如果要深入的話，最會(huì)編程。什么java，perl，等。我是剛開始學(xué)。大家多指教。導(dǎo)師推薦了幾本書：《生物信息學(xué)概論》“introductiontobioinformatics"（英）tkattwood,djparry-smith著羅靜初等譯北京大學(xué)出版社2014年4月第一版本書從生物信息學(xué)的研究對(duì)象、意義出發(fā)，介紹生物信息學(xué)研究的基本方法和常用工具。主要介紹的是核酸和蛋白質(zhì)序列的計(jì)算機(jī)分析方法，探討利用現(xiàn)有的計(jì)算機(jī)程序，從現(xiàn)有的數(shù)據(jù)庫(kù)中能夠獲取什么、不能夠獲取什么。全書共分十章：1.概論，2.信息絡(luò)，3.蛋白質(zhì)信息資源，4.基因組信息資源，5.dna序列分析，6.雙序列比對(duì)，7.多序列比對(duì)，8.二次數(shù)據(jù)庫(kù)搜索，9.數(shù)據(jù)庫(kù)搜索實(shí)例，10.序列分析軟件包。每章末尾均提供了進(jìn)一步閱讀指南和有關(guān)的址。這本書的一大特色在于豐富的例子和圖表，使讀者可以很直觀的了解和掌握書中的內(nèi)容。此外，書的末尾還附有與生物信息學(xué)相關(guān)的詞匯表?？偟恼f(shuō)來(lái)，這本書實(shí)用性強(qiáng)，可以作為高等院校生物信息學(xué)教材，也可以作為生命科學(xué)和生物技術(shù)各領(lǐng)域分子生物學(xué)研究和開發(fā)工作者的生物信息學(xué)參考書?！渡镄畔W(xué)手冊(cè)》郝柏林張淑譽(yù)編著上?？茖W(xué)技術(shù)出版社2014年10月第一版一本手冊(cè)式的生物信息學(xué)書籍。除了介紹了生物信息學(xué)，還包括了計(jì)算機(jī)及計(jì)算機(jī)絡(luò)（這一部分提供了一些址）和分子生物學(xué)的知識(shí)。更為重要的是，該書的主要部分?quot;生物信息數(shù)據(jù)庫(kù)"和"服務(wù)、軟件和算法"部分，提供了大量的址。幾乎是每一個(gè)條目下面都有不少址。這本書將絡(luò)上的生物信息學(xué)資源進(jìn)行了索引式的介紹，并作了必要的說(shuō)明。書中列舉了近千條址和引，基本涵蓋了生物學(xué)研究的各個(gè)方面，堪稱生物信息的汪洋大海中的導(dǎo)航圖。對(duì)生物信息學(xué)的服務(wù)、軟件和算法，本書也作了較全面的描述。本書可供廣大生命科學(xué)工作者以及由物理學(xué)、數(shù)學(xué)和計(jì)算機(jī)學(xué)轉(zhuǎn)入生命科學(xué)領(lǐng)域的研究教學(xué)人員參閱（上面可以查到很多址）?！渡镄畔W(xué)》趙國(guó)屏等編著科學(xué)出版社2014年4月第一版本書是"863"生物高科技叢書之一。它比較全面地介紹了生物信息學(xué)的若干個(gè)主要分支，并特別介紹了與人類基因組研究相關(guān)的生物信息學(xué)的一些較新成果；著重介紹了數(shù)據(jù)庫(kù)和數(shù)據(jù)庫(kù)的查詢、序列的同源比較及其在生物進(jìn)化研究中的應(yīng)用；以生物芯片中的生物信息學(xué)問(wèn)題為例，介紹與基因表達(dá)相關(guān)的生物信息學(xué)問(wèn)題；還介紹了蛋白質(zhì)結(jié)構(gòu)研究中的生物信息學(xué)問(wèn)題，以及與分子設(shè)計(jì)和藥物設(shè)計(jì)相關(guān)的生物信息學(xué)技術(shù)。本書可供生物信息學(xué)專業(yè)和生命科學(xué)相關(guān)專業(yè)的本科生、研究生和教學(xué)科研人員閱讀學(xué)習(xí)，也可供相關(guān)專業(yè)的科技和應(yīng)用機(jī)構(gòu)的科研、管理和決策人員參考。注意，本書有很大篇幅是講基因芯片和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的?！渡镄畔W(xué)--基因和蛋白質(zhì)分析的實(shí)用指南》"bioinformatics--apracticalguidetotheanalysisofgenesandproteins"andreasd.baxevanisb.f.francisouellette著李衍達(dá)孫之榮等譯清華大學(xué)出版社2014年8月第一版這本書由前衛(wèi)計(jì)算生物學(xué)家撰寫，貫穿了已有的工具和數(shù)據(jù)庫(kù)，包括應(yīng)用軟件、因特資源、向數(shù)據(jù)庫(kù)提交dna序列以及進(jìn)行序列分析和利用核酸序列與蛋白質(zhì)序列進(jìn)行預(yù)測(cè)的的方法。以下是該書的：1.因特與生物學(xué)家，2.genebank序列數(shù)據(jù)庫(kù)，結(jié)構(gòu)數(shù)據(jù)庫(kù)，4.應(yīng)用gcg進(jìn)行序列分析，5.生物數(shù)據(jù)庫(kù)的信息檢索，6.ncbi數(shù)據(jù)模型，7.序列比對(duì)和數(shù)據(jù)庫(kù)搜索，8.多序列比對(duì)和實(shí)際應(yīng)用，9.系統(tǒng)發(fā)育分析，10.利用核酸序列的預(yù)測(cè)方法，11.利用蛋白質(zhì)序列的預(yù)測(cè)方法，12.鼠類和人類公用物理圖譜數(shù)據(jù)庫(kù)漫游，13.acedb:基因組信息數(shù)據(jù)庫(kù)，14.提交dna序列數(shù)據(jù)庫(kù)。本書有很多實(shí)際的序列和序列分析的例子。這本書適合高等院校的師生和從事生物工程研究的科技工作者閱讀。在第14章提及的通訊資源：互聯(lián)和通信地址；電話和傳真號(hào)碼ddbj/embl和genbank的一般聯(lián)系信息以及提交dna序列到這些數(shù)據(jù)庫(kù)的入口。ddbj（信息生物學(xué)中心，nig）地址：ddbj，1111yata，mishima，shiznoka411，japan傳真：81-559-81-6849e-mail提交：*****更新：*****信息：*****互聯(lián)主頁(yè)：webin：genbank（國(guó)家生物技術(shù)信息中心，nih）地址：genbanknationalcenterforbiotechnologyinformation,nationtionallibraryofmedicine,nationalinstitutesofhealth,building38a,room8n805,bethesdamd*****電話：301-496-2475傳真：301-480-9241e-mail提交：*****est/gss/sts*****更新：*****信息：*****互聯(lián)主頁(yè)：bankit:在dna序列數(shù)據(jù)庫(kù)中使用的遺傳密碼：ddbj/embl/genbank特征表檔可用binedpowerofbiology,mathematics,andcomputers)o現(xiàn)代生物信息學(xué)是采用計(jì)算機(jī)技術(shù)和信息論方法研究蛋白質(zhì)及核酸序列等各種生物信息的采集、儲(chǔ)存、傳遞、檢索、分析和解讀的科學(xué)，是現(xiàn)代生命科學(xué)與信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、物理學(xué)和化學(xué)等學(xué)科相互滲透而形成的交叉學(xué)科。在這短短的一學(xué)期課中，在老師的帶領(lǐng)下，我們學(xué)到了很多關(guān)于生物信息學(xué)的知識(shí)，其中給我印象最深的有序列比對(duì)、蛋白質(zhì)結(jié)構(gòu)分析、核酸序列分析、數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)檢索等內(nèi)容。比如，序列比對(duì)，它的基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。從生物學(xué)角度來(lái)看，它包含很多意義；如從相互重疊的序列片段中重構(gòu)dna的完整序列等。老師主要給我們介紹了blast比對(duì)。再如，對(duì)蛋白質(zhì)的分析。比如我們實(shí)驗(yàn)測(cè)定了一條蛋白質(zhì)序列或者從dna序列翻譯得來(lái)一條蛋白質(zhì)序列，我們要借助生物信息方法來(lái)對(duì)它進(jìn)行基本性質(zhì)及結(jié)構(gòu)分析。其中基本性質(zhì)包括它的分子量、氨基酸數(shù)目、排列順序、等電點(diǎn)分析等。結(jié)構(gòu)分析包括跨膜螺旋分析等。要運(yùn)用的工具是protparamtool和tmhmm。對(duì)于這兩個(gè)工具我都進(jìn)行了實(shí)際操作練習(xí)，我覺(jué)得這對(duì)我們以后的理論學(xué)習(xí)和實(shí)驗(yàn)分析都非常重要?，F(xiàn)代生物信息學(xué)的主要研究領(lǐng)域及其進(jìn)展1、基因組學(xué)和蛋白組學(xué)研究基因組和蛋白組研究是生物信息學(xué)的主要內(nèi)容.同樣，生物信息學(xué)是基因組和蛋白組研究中必不可少的工具?；蚪M學(xué)(genomics)和蛋白組學(xué)(proteomics)的實(shí)質(zhì)就是分析和解讀核酸和蛋白質(zhì)序列中所表達(dá)的結(jié)構(gòu)與功能的生物信息.這方面的研究已成為生物信息學(xué)的主要研究?jī)?nèi)容之一.一種生物的全部遺傳構(gòu)成被稱為該種生物的基因組.有關(guān)基因組的研究稱為基因組學(xué).其中，序列基因組學(xué)(sequencegenomics)主要研究測(cè)序和核苷酸序列；結(jié)構(gòu)基因組學(xué)(structuralgenomics)著重于遺傳圖譜、物理圖譜和測(cè)序等方面的研究；功能基因組學(xué)(functionalgenomics)則研究以轉(zhuǎn)錄圖為基礎(chǔ)的基因組表達(dá)圖譜；比較基因組學(xué)(comparativege2nomics)的研究?jī)?nèi)容包括對(duì)不同進(jìn)化階段基因組的比較和不同種群和群體基因組的比較。蛋白組和蛋白組學(xué)的概念是隨基因組和基因組學(xué)的出現(xiàn)而出現(xiàn)的.蛋白組(proteme)的概念是由于基因表達(dá)水平并不能代表細(xì)胞中活性蛋白質(zhì)的數(shù)量，基因組序列并不能描述活性蛋白質(zhì)所必需的翻譯后修飾和反映蛋白質(zhì)種類和含量的動(dòng)態(tài)變化過(guò)程而提出的.在一定條件下某一基因組蛋白質(zhì)表達(dá)的數(shù)量類型稱為蛋白組，代表這一有機(jī)體全部蛋白質(zhì)組成及其作用方式.有關(guān)蛋白組的研究稱為蛋白組學(xué).其中，蛋白組的研究技術(shù)與方法、雙向凝膠電泳圖譜以及對(duì)不同條件下蛋白組變化的比較分析是蛋白組學(xué)的主要研究?jī)?nèi)容。生物信息學(xué)在基因組和蛋白組研究中所起的作用主要有（1）基因組信息結(jié)構(gòu)的計(jì)算分析.即對(duì)基因組數(shù)據(jù)進(jìn)行大規(guī)模并行計(jì)算并預(yù)測(cè)各種新基因和功能位點(diǎn)，研究大量非編碼區(qū)序列的信息結(jié)構(gòu)和可能的生物學(xué)意義。（2）模式生物全基因組信息結(jié)構(gòu)的比較研究.即對(duì)已完成全基因組測(cè)序的各種模式生物的基因組信息結(jié)構(gòu)進(jìn)行比較分析，包括同源序列的搜索比較和指導(dǎo)基因克隆.（3）功能基因組的相關(guān)信息分析，包括對(duì)基因表達(dá)圖譜及其相關(guān)算法和軟件的研究，與功能基因組信息相關(guān)的核酸、蛋白質(zhì)的空間結(jié)構(gòu)的預(yù)測(cè)模擬以及蛋白質(zhì)的功能預(yù)測(cè)。2、生物信息數(shù)據(jù)庫(kù)復(fù)雜的生物和生物界和日新月異的生命科學(xué)研究產(chǎn)出的大量的生物學(xué)信息，對(duì)這些信息的儲(chǔ)存、檢索、比較分析必須借助于計(jì)算機(jī)數(shù)據(jù)庫(kù)技術(shù)，包括各類生物學(xué)信息數(shù)據(jù)庫(kù)的建立與維護(hù)、數(shù)據(jù)的添加與注釋、更新與查詢、數(shù)據(jù)庫(kù)資料的絡(luò)化等研究?jī)?nèi)容?，F(xiàn)有的數(shù)據(jù)庫(kù)有：核酸序列數(shù)據(jù)庫(kù)（genbank、embl、ddbj）、基因組數(shù)據(jù)庫(kù)、基因圖譜數(shù)據(jù)庫(kù)、蛋白質(zhì)序列數(shù)據(jù)庫(kù)（swtss-prot、pir）和蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)（interpro）等。隨著生命科學(xué)的不斷發(fā)展，數(shù)據(jù)庫(kù)種類不斷增加、結(jié)構(gòu)日益復(fù)雜、使用也越來(lái)越方便。生物信息學(xué)作為一門新興學(xué)科已經(jīng)成為生命科學(xué)研究中必不可少的研究手段本對(duì)數(shù)據(jù)庫(kù)與數(shù)據(jù)庫(kù)搜索序列比對(duì)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)藥物設(shè)計(jì)基因芯片技術(shù)幾個(gè)方面做了介紹較為系統(tǒng)地闡述了生物信息學(xué)在這些領(lǐng)域的應(yīng)用當(dāng)然它所涉及的內(nèi)容與方法遠(yuǎn)遠(yuǎn)不只上面提到的那些新基因和的發(fā)現(xiàn)與鑒定非編碼區(qū)信息結(jié)構(gòu)分析遺傳密碼的起源和生物進(jìn)化完整基因組的比較研究大規(guī)?；蚬δ鼙磉_(dá)譜的分析等都是生物信息學(xué)研究的對(duì)象相信不久的將來(lái)生物信息學(xué)會(huì)在生命科學(xué)領(lǐng)域扮演越來(lái)越重要的角色。參考獻(xiàn)：1、現(xiàn)代生物信息學(xué)及其主要研究領(lǐng)域蕭浪濤（湖南農(nóng)業(yè)大學(xué)理學(xué)院，湖南長(zhǎng)沙*****）2、生物信息學(xué)技術(shù)進(jìn)展郭志云張懷渝梁龍軍事醫(yī)學(xué)科學(xué)院生物工程研究所，北京*****;四川農(nóng)業(yè)大學(xué)生命科學(xué)及理學(xué)院，雅安*****3、利用生物信息學(xué)技術(shù)研究蛋白功能的幾種方法王劍利楊章民綜述王一理審閱西安交通大學(xué)醫(yī)學(xué)院免疫病理學(xué)研究室（西安，*****）第五篇：生物信息學(xué)（第二版）《精要速覽系列-先鋒版生物信息學(xué)（第二版）》d.r.westhead，j.h.parishr.m.twyman科學(xué)出版社2014a生物信息學(xué)概述相關(guān)學(xué)習(xí)站plexes）的形成。了解這些復(fù)合物對(duì)于注釋蛋白質(zhì)功能是必需，也是解釋信號(hào)級(jí)聯(lián)和調(diào)控絡(luò)等分子途徑的一個(gè)步驟。死效應(yīng)反映了兩個(gè)突變的蛋白質(zhì)遺傳方法抑制子突變體可以通過(guò)恢復(fù)被破壞的蛋白質(zhì)互作來(lái)補(bǔ)償有害的原始突變體。而合成致死效應(yīng)反映了兩個(gè)突變的蛋白質(zhì)不能相互作用，顯性負(fù)突變（dominantnegativemutation）顯示了一種起著多聚復(fù)合體作用的蛋白質(zhì)。3.親和性方法可通過(guò)幾種利用蛋白質(zhì)親和性（特異結(jié)合的傾向）分析的物理方法來(lái)為蛋白質(zhì)之間的相互關(guān)系提供直接的證據(jù)，比如親和性管柱層析法，免疫共沉淀。由ciphergen公司使親和實(shí)驗(yàn)格式更趨微型化，使得在蛋白質(zhì)芯片的發(fā)展中達(dá)到頂峰。4、分子和原子的方法x射線晶體學(xué)和核磁共振譜有助于在原子水平識(shí)別蛋白質(zhì)互作，其它的蛋白質(zhì)互作分析的分子方法包括熒光共振能量傳遞（fret），表面基元共振譜（spr）和表面增強(qiáng)激光接吸附/離子化技術(shù)（seldl），其中的很多方法可通過(guò)質(zhì)譜技術(shù)直接集成到蛋白質(zhì)注釋中?；趲?kù)的方法基于庫(kù)的蛋白質(zhì)互作實(shí)驗(yàn)有兩個(gè)主要優(yōu)點(diǎn)：它是高度并行的實(shí)驗(yàn)格式；候選互作蛋白質(zhì)及其cdnas之間直接關(guān)聯(lián)。影響最大的方法是酵母雙雜交系統(tǒng)（yeasttwo-hybridsystem,y2h）,在這個(gè)系統(tǒng)中蛋白質(zhì)通過(guò)識(shí)別與之連接的一個(gè)功能轉(zhuǎn)錄因子進(jìn)行互作。c數(shù)據(jù)庫(kù)--內(nèi)容，結(jié)構(gòu)和注釋已注釋的序列數(shù)據(jù)庫(kù)初級(jí)序列數(shù)據(jù)庫(kù)genbank（ncbi）、核酸序列數(shù)據(jù)庫(kù)（embl）和日本的dna數(shù)據(jù)庫(kù)（ddbj）swiss-prot和tremblswiss-prot收集了確認(rèn)的蛋白質(zhì)序列及與結(jié)構(gòu)，功能和所屬蛋白質(zhì)家族有關(guān)的注釋信息。相關(guān)數(shù)據(jù)庫(kù)trembl翻譯了初級(jí)核酸數(shù)據(jù)庫(kù)中的編碼序列。其他數(shù)據(jù)庫(kù)1.omimomim指人類孟德爾遺傳的聯(lián)機(jī)數(shù)據(jù)庫(kù)，用于研究人類遺傳學(xué)和人類分子生物學(xué)的強(qiáng)大資源。每個(gè)omim條目都有一個(gè)對(duì)特定基因或性狀的已知信息的全總結(jié)，并有指向初級(jí)序列數(shù)據(jù)庫(kù)和其它遺傳學(xué)資源的鏈接。incyte和unigeneincyte是商業(yè)數(shù)據(jù)庫(kù)，它提供了基因序列和專家注釋的記錄，這是專門為藥物研究開發(fā)服務(wù)的數(shù)據(jù)庫(kù)。 unigene是一種用來(lái)把genbank序列聚類并與est數(shù)據(jù)相關(guān)聯(lián)的實(shí)驗(yàn)工具。結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)數(shù)據(jù)庫(kù)（pdb），核酸數(shù)據(jù)庫(kù)（ndb），大分子結(jié)構(gòu)數(shù)據(jù)庫(kù)（msd）e通過(guò)序列相似性標(biāo)準(zhǔn)搜索序列數(shù)據(jù)庫(kù)序列相似性搜索序列聯(lián)配序列聯(lián)配是是相似度量化的第一步，用來(lái)區(qū)分偶然性的相似和真實(shí)的生物學(xué)關(guān)系。聯(lián)配結(jié)果以變化（突變）、插入或缺失（或空位indel）來(lái)顯示序列之間的差異，這些差異可以用進(jìn)化術(shù)語(yǔ)來(lái)說(shuō)明。聯(lián)配算法動(dòng)態(tài)規(guī)劃算法可以計(jì)算兩條之間的最佳聯(lián)配，其中廣泛使用的算法有smith-waterman算法（局部聯(lián)配）和needleman-wunsch算法（全局聯(lián)配）。聯(lián)配分支和空位罰分用簡(jiǎn)單的聯(lián)配分值來(lái)測(cè)量相同匹配殘基的比例或數(shù)目。得從聯(lián)配分值中扣去空位罰分，以保證聯(lián)配算法能得出有生物學(xué)意義的結(jié)果而沒(méi)有太多的空位。數(shù)據(jù)庫(kù)搜索：fasta和blast統(tǒng)計(jì)分值相似度記分的p值是指獲得至少與兩條無(wú)關(guān)序列間的偶然相似性一樣高的分值的概率。低p值表明重要的匹配，這些匹配可能會(huì)有真實(shí)生物學(xué)意義。相關(guān)的e值（期望值）是至少與所識(shí)別的相似性記同樣高分值的偶然事件的期望概率。兩序列見(jiàn)相似度的低p值對(duì)應(yīng)于大數(shù)據(jù)庫(kù)搜索的高e值。敏感性和特異性敏感性衡量數(shù)據(jù)庫(kù)中真實(shí)生物序列關(guān)系的比例，該關(guān)系表現(xiàn)為擊中項(xiàng)（有意義的相似序列）。特異性指的是對(duì)應(yīng)于真實(shí)生物學(xué)關(guān)系的擊中項(xiàng)的比例。改變e和p的默認(rèn)值會(huì)導(dǎo)致這些互補(bǔ)的優(yōu)良度測(cè)量方法之間的平衡。f多序列聯(lián)配：基因和蛋白質(zhì)家族多序列聯(lián)配和家族關(guān)系多序列聯(lián)配多序列聯(lián)配表明兩條或兩條以上序列之間的關(guān)系，可以解釋關(guān)于蛋白質(zhì)結(jié)構(gòu)和功能的許多線索。當(dāng)所考察的序列不同時(shí)，保守的殘基往往是維持穩(wěn)定結(jié)構(gòu)或生物學(xué)功能的關(guān)鍵殘基。漸進(jìn)聯(lián)配漸進(jìn)聯(lián)配方法以兩序列聯(lián)配來(lái)初步評(píng)價(jià)序列是如何相關(guān)的，并在這個(gè)基礎(chǔ)上構(gòu)建向?qū)?，然后使用向?qū)渲鸩教砑有蛄械铰?lián)配中，從最密切相關(guān)的序列開始到距離最遠(yuǎn)的序列結(jié)束。蛋白質(zhì)家族和模式數(shù)據(jù)庫(kù)蛋白質(zhì)家族把序列分配到蛋白質(zhì)家族中是預(yù)測(cè)蛋白質(zhì)功能是非常有價(jià)值的方法。多序列聯(lián)配信息的表示方法有很多種，包括聯(lián)配本身、一致序列、保守殘基和殘基模式、序列輪廓以及其他的序列家族的概率模型。這些根據(jù)不同的應(yīng)用都有不同的用途，其中大多數(shù)已經(jīng)被開發(fā)和存儲(chǔ)在數(shù)據(jù)庫(kù)中，里面含有大量不同

人人文庫(kù)> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

生物信息學(xué)學(xué)習(xí)心得

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

生物信息學(xué)學(xué)習(xí)心得

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔