生物信息學(xué)概述_第1頁
生物信息學(xué)概述_第2頁
生物信息學(xué)概述_第3頁
生物信息學(xué)概述_第4頁
生物信息學(xué)概述_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

生物信息學(xué)概述演示文稿目前一頁\總數(shù)五十七頁\編于十九點(優(yōu)選)生物信息學(xué)概述目前二頁\總數(shù)五十七頁\編于十九點生物分子信息生物分子至少攜帶著三種信息遺傳信息與功能相關(guān)的結(jié)構(gòu)信息進化信息生物分子信息的特征生物分子信息數(shù)據(jù)量大生物分子信息復(fù)雜生物分子信息之間存在著密切的聯(lián)系目前三頁\總數(shù)五十七頁\編于十九點遺傳信息的載體——DNA

遺傳信息的載體主要是DNA

控制生物體性狀的基因是一系列DNA片段生物體生長發(fā)育的本質(zhì)就是遺傳信息的傳遞和表達DNA通過自我復(fù)制,在生物體的繁衍過程中傳遞遺傳信息基因通過轉(zhuǎn)錄和翻譯,使遺傳信息在生物個體中得以表達,并使后代表現(xiàn)出與親代相似的生物性狀2023/4/294蛋白質(zhì)RNA轉(zhuǎn)錄DNA翻譯目前四頁\總數(shù)五十七頁\編于十九點DNA前體RNAmRNA多肽鏈2023/4/29目前五頁\總數(shù)五十七頁\編于十九點生命機器的執(zhí)行者--蛋白質(zhì)蛋白質(zhì)功能取決于蛋白質(zhì)的空間結(jié)構(gòu)

蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的序列(這是目前基本共認的假設(shè)),蛋白質(zhì)結(jié)構(gòu)的信息隱含在蛋白質(zhì)序列之中。2023/4/29目前六頁\總數(shù)五十七頁\編于十九點DNA分子和蛋白質(zhì)分子都含有進化信息通過比較相似的蛋白質(zhì)序列,如肌紅蛋白和血紅蛋白,可以發(fā)現(xiàn)由于基因復(fù)制而產(chǎn)生的分子進化證據(jù)。通過比較來自于不同種屬的同源蛋白質(zhì),即直系同源蛋白質(zhì),可以分析蛋白質(zhì)甚至種屬之間的系統(tǒng)發(fā)生關(guān)系,推測它們共同的祖先蛋白質(zhì)。2023/4/297目前七頁\總數(shù)五十七頁\編于十九點生物分子信息DNA序列數(shù)據(jù)

蛋白質(zhì)序列數(shù)據(jù)

生物分子結(jié)構(gòu)數(shù)據(jù)

生物分子功能數(shù)據(jù)

最基本直觀復(fù)雜生物信息數(shù)據(jù)類型2023/4/29目前八頁\總數(shù)五十七頁\編于十九點

DNA核酸序列蛋白質(zhì)氨基酸序列蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)功能最基本的生物信息維持生命活動的機器第一部遺傳密碼第二部遺傳密碼?生命體系千姿百態(tài)的變化生物分子數(shù)據(jù)及其關(guān)系2023/4/299目前九頁\總數(shù)五十七頁\編于十九點第一部遺傳密碼已被破譯,但對密碼的轉(zhuǎn)錄過程還不清楚,對大多數(shù)DNA非編碼區(qū)域的功能還知之甚少對于第二部密碼,目前則只能用統(tǒng)計學(xué)的方法進行分析。破譯“第二遺傳密碼”:即折疊密碼(foldingcode),從蛋白質(zhì)的一級結(jié)構(gòu)得到立體結(jié)構(gòu),即可直接從基因推測其編碼蛋白質(zhì)所對應(yīng)的生物學(xué)功能。破解折疊密碼被列為“21世紀的生物學(xué)”的重要課題。生物分子數(shù)據(jù)是寶藏,生物信息數(shù)據(jù)庫是金礦,等待我們?nèi)ネ诰蚝屠?023/4/29目前十頁\總數(shù)五十七頁\編于十九點Bioinformatics,生物

+信息

+學(xué)--新興的交叉學(xué)科ComputersciencesMathematicalsciencesLifesciences二、生物信息學(xué)的概念目前十一頁\總數(shù)五十七頁\編于十九點定義一:生物信息學(xué)是一門收集、分析遺傳數(shù)據(jù)以及分發(fā)給研究機構(gòu)的新學(xué)科(1987)定義二:生物信息學(xué)特指數(shù)據(jù)庫類的工作,包括持久穩(wěn)固的在一個穩(wěn)定的地方提供對數(shù)據(jù)的支持(1994)定義三:采用信息科學(xué)技術(shù),對各種生物信息(包括核酸、蛋白質(zhì)等)的收集、加工、儲存、分析、解釋的一門學(xué)科。收集、加工、儲存:計算機科學(xué)家分析、解釋:生物學(xué)家目前十二頁\總數(shù)五十七頁\編于十九點三、生物信息學(xué)發(fā)展簡史(一)前基因組時代的生物信息學(xué)

起源于20世紀70-80年代。這一階段的主要成就包括核酸和蛋白質(zhì)序列的初步分析、生物學(xué)數(shù)據(jù)庫的建立以及檢索工具的開發(fā)。例如Dayhoff的替換矩陣、Neelleman和Wunsch的序列比對及GenBank(由美國國立生物技術(shù)信息中心建立和維護的核酸與蛋白質(zhì)序列數(shù)據(jù)庫)等大型數(shù)據(jù)庫的建立,形成了生物信息學(xué)的雛形。目前十三頁\總數(shù)五十七頁\編于十九點1967:Dayhoff研制出蛋白質(zhì)序列圖集,即后來著名的蛋白質(zhì)信息源PIR;1970:Needleman和Wunsch提出了著名的序列比對算法,是生物信息學(xué)發(fā)展中最重要的貢獻;1978:Gingeras等人研制了核酸序列中酶切位點識別程序;1981:Doolittle提出了關(guān)于序列模式的概念;1986:日本核酸序列數(shù)據(jù)庫DDBJ誕生;1986:蛋白質(zhì)數(shù)據(jù)庫SWISS-PROT誕生;1988:美國國家生物技術(shù)信息中心NCBI誕生;1988:成立歐洲分子生物學(xué)網(wǎng)絡(luò)(EMBNet),EMBL數(shù)據(jù)庫誕生目前十四頁\總數(shù)五十七頁\編于十九點(二)基因組時代的生物信息學(xué)以基因組計劃的實施為標(biāo)志的基因組時代(1990年至2001年)是生物信息學(xué)成為一個較完整的新興學(xué)科并得到高速發(fā)展的時期。這一時期生物信息學(xué)確立了自身的研究領(lǐng)域和學(xué)科特征,成為生命科學(xué)的熱點學(xué)科和重要前沿領(lǐng)域之一。這一階段的主要成就包括大分子序列以及表達序列標(biāo)簽(expressedsequencetag,EST)數(shù)據(jù)庫的高速發(fā)展、BLAST(basiclocalalignmentsearchtool)和FASTA(fastalignment)等工具軟件的研制和相應(yīng)新算法的提出、基因的尋找與識別、電子克?。╥nsilicocloning)技術(shù)等,大大提高了管理和利用海量數(shù)據(jù)的能力。目前十五頁\總數(shù)五十七頁\編于十九點人類基因組計劃開始(HumanGenomeProject,HGP)人類基因組計劃帶來了

生物信息學(xué)20世紀90年代目前十六頁\總數(shù)五十七頁\編于十九點人類基因組計劃(HGP,HumanGenomeProject)目標(biāo):整體上破解人類遺傳信息的奧秘由美國NIH和能源部提出和帶頭,美、英、德、法、日、中共同參與的國際合作項目。完成人全部24(22+X+Y)條染色體中3.2×109個堿基對的序列測定,主要任務(wù)包括做圖(遺傳圖譜、物理圖譜以及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別,其根本任務(wù)是解讀和破譯生物體的生老病死以及與疾病相關(guān)的遺傳信息。目前十七頁\總數(shù)五十七頁\編于十九點18基因組(Genome):包含細胞或生物體全套的遺傳信息的全部遺傳物質(zhì)

包括:細胞核基因組DNA細胞質(zhì)(線粒體、葉綠體)基因組DNA

人類基因組:3.2×109bp目前十八頁\總數(shù)五十七頁\編于十九點目前十九頁\總數(shù)五十七頁\編于十九點曼哈頓原子彈計劃阿波羅登月計劃人類基因組計劃人類自然科學(xué)史上的3大計劃目前二十頁\總數(shù)五十七頁\編于十九點21AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.目前二十一頁\總數(shù)五十七頁\編于十九點222001年2月15日《Nature》封面2001年2月16日《Science》封面目前二十二頁\總數(shù)五十七頁\編于十九點我國對人類基因組計劃的貢獻目前二十三頁\總數(shù)五十七頁\編于十九點24目前二十四頁\總數(shù)五十七頁\編于十九點目前二十五頁\總數(shù)五十七頁\編于十九點humanArabidopsis擬南芥ThermotogamaritimaEscherichiacoli大腸桿菌Buchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis目前二十六頁\總數(shù)五十七頁\編于十九點目前二十七頁\總數(shù)五十七頁\編于十九點數(shù)據(jù)庫中的蛋白質(zhì)序列Swiss-prot:≈550,000條蛋白質(zhì)序列目前二十八頁\總數(shù)五十七頁\編于十九點29結(jié)構(gòu)與功能信號網(wǎng)絡(luò)代謝途徑細胞重建系統(tǒng)重建基因組基因(三)后基因組時代的生物信息學(xué)目前二十九頁\總數(shù)五十七頁\編于十九點四、生物信息學(xué)的研究領(lǐng)域基因組序列裝配基因識別基因功能預(yù)報基因多態(tài)性分析基因進化mRNA結(jié)構(gòu)預(yù)測基因芯片設(shè)計基因芯片數(shù)據(jù)分析疾病相關(guān)基因分析蛋白質(zhì)序列分析蛋白質(zhì)家族分類蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)折疊研究代謝途徑分析轉(zhuǎn)錄調(diào)控機制蛋白質(zhì)芯片設(shè)計蛋白質(zhì)芯片數(shù)據(jù)分析藥物設(shè)計目前三十頁\總數(shù)五十七頁\編于十九點大規(guī)模核酸測序及拼接基因識別與定位基因相關(guān)的SNP研究非編碼區(qū)信息結(jié)構(gòu)分析比較基因組學(xué)

(一)核酸及基因組信息目前三十一頁\總數(shù)五十七頁\編于十九點大規(guī)?;蚪M測序目前三十二頁\總數(shù)五十七頁\編于十九點33目前三十三頁\總數(shù)五十七頁\編于十九點運用計算機軟件進行序列拼接目前三十四頁\總數(shù)五十七頁\編于十九點基因識別與定位

目前三十五頁\總數(shù)五十七頁\編于十九點基因相關(guān)的SNP研究:

單核苷酸多態(tài)性(SingleNucleotidePolymorphisms,SNP):主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種。占所有已知多態(tài)性的90%以上。SNP在人類基因組中廣泛存在,平均每500~1000個堿基對中就有1個,估計其總數(shù)可達300萬個甚至更多。目前三十六頁\總數(shù)五十七頁\編于十九點37SNP的研究意義尋找疾病相關(guān)的突變位點法醫(yī)學(xué)研究器官移植中供體/受體配對分析

目前三十七頁\總數(shù)五十七頁\編于十九點

全基因組關(guān)聯(lián)分析(Genome-wideassociationstudy,GWAS):是指在人類全基因組范圍內(nèi)找出存在的序列變異,即單核苷酸多態(tài)性(SNP),從中篩選出與疾病相關(guān)的SNPs

目前三十八頁\總數(shù)五十七頁\編于十九點非編碼區(qū)信息結(jié)構(gòu)分析:基因表達調(diào)控分析在微生物中,非編碼區(qū)只占整個基因組序列的10%-20%;但在高等生物和人類基因組中,非編碼序列則占了基因組序列的絕大部分。在人的基因組中,非編碼序列超過95%。非編碼區(qū)有調(diào)控作用的核苷酸序列,包括位于編碼區(qū)上游的RNA聚合酶結(jié)合位點。目前三十九頁\總數(shù)五十七頁\編于十九點比較基因組學(xué)(ComparativeGenomics)是基于基因組圖譜和測序基礎(chǔ)上,對已知的基因和基因組結(jié)構(gòu)進行比較,來了解基因的功能、表達機理和物種進化的學(xué)科目前四十頁\總數(shù)五十七頁\編于十九點(二)蛋白質(zhì)及蛋白質(zhì)組信息蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)功能預(yù)測基因表達及蛋白質(zhì)組信息學(xué)目前四十一頁\總數(shù)五十七頁\編于十九點蛋白質(zhì)三維結(jié)構(gòu)測定主要方法:X射線晶體結(jié)構(gòu)分析、多維核磁共振(NMR)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),EC)等物理方法Difficult!Expensive!TooMuchTime!蛋白質(zhì)結(jié)構(gòu)及功能預(yù)測目前四十二頁\總數(shù)五十七頁\編于十九點目前四十三頁\總數(shù)五十七頁\編于十九點蛋白質(zhì)組研究

蛋白質(zhì)組(proteome):即包括一種細胞乃至一種生物所表達的全部蛋白質(zhì)。蛋白質(zhì)組本質(zhì)上指的是在大規(guī)模水平上研究蛋白質(zhì)的特征,包括蛋白質(zhì)的表達水平,翻譯后的修飾,蛋白與蛋白相互作用等,由此獲得蛋白質(zhì)水平上的關(guān)于疾病發(fā)生,細胞代謝等過程的整體而全面的認識。

目前四十四頁\總數(shù)五十七頁\編于十九點基因組數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫DDBJEMBLGenBankSWISS-PROTPDBPIR(三)生物分子數(shù)據(jù)的收集與管理2023/4/29目前四十五頁\總數(shù)五十七頁\編于十九點(四)數(shù)據(jù)庫搜索及序列比較

搜索同源序列在一定程度上就是通過序列比較尋找相似序列序列比較的一個基本操作就是比對(Alignment),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種定性描述多重序列比對研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。

2023/4/2946目前四十六頁\總數(shù)五十七頁\編于十九點發(fā)現(xiàn)同源分子2023/4/2947目前四十七頁\總數(shù)五十七頁\編于十九點48生物信息學(xué)和人類基因組計劃為藥物靶標(biāo)的發(fā)現(xiàn)和新藥的研制開創(chuàng)了新天地,未來的藥物設(shè)計將是基于生物信息學(xué)的知識挖掘的過程通過數(shù)據(jù)分析首先確立靶標(biāo)分子預(yù)測蛋白質(zhì)分子結(jié)構(gòu)設(shè)計藥物分子與靶標(biāo)分子相互作用(五)

在藥學(xué)領(lǐng)域應(yīng)用目前四十八頁\總數(shù)五十七頁\編于十九點

所謂基因組藥物(Genomicdrug)是指利用基因序列數(shù)據(jù),經(jīng)生物信息學(xué)分析、高通量基因表達、高通量功能篩選和體內(nèi)外藥效研究開發(fā)得到的新藥候選物.

基于機理的藥物發(fā)現(xiàn):基因組藥物實際上利用了反向生物學(xué)的原理.沿著從基因序列一蛋白質(zhì)一功能一藥物的途徑研制新藥,其優(yōu)勢是取自龐大的人類基因資源及其編碼蛋白質(zhì)做為原材料,具有巨大的開發(fā)潛力。基因組藥物目前四十九頁\總數(shù)五十七頁\編于十九點人類基因組約有10萬左右的基因.編碼10萬以上的蛋白質(zhì),其中至少5%即5000以上的基因編碼蛋白質(zhì)可能具有藥物開發(fā)前景。大量基因特別是疾病相關(guān)基因申請專利,如肥胖。目前五十頁\總數(shù)五十七頁\編于十九點

理想的抗生素靶標(biāo)應(yīng)為微生物細胞存活所必須,在病原體中高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論