蛋白質組相關生物信息學課件_第1頁
蛋白質組相關生物信息學課件_第2頁
蛋白質組相關生物信息學課件_第3頁
蛋白質組相關生物信息學課件_第4頁
蛋白質組相關生物信息學課件_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 過去十年中,全世界的分子生物學家們所收集的原始信息不斷激增。在不太久之前,這些信息的分析整理工作只有不情愿的研究生去做,因為他們對擺弄試管比敲擊鍵盤更有興趣,而現(xiàn)在有很多人已全身心地投入了這個領域。生物信息學正處于新興萌芽中,它可以不嚴格地定義為分子生物學和計算生物學的交叉,這個領域中已經產生了大量重要的發(fā)現(xiàn),并有希望揭示更多大自然的奧秘。對大多數(shù)人而言,生物信息學的吸引力在于它是生物學中嶄新和有待開墾的領域;而對其他人,其吸引力蘊藏在簡化論者對化學層次上的細節(jié)的熱愛和系統(tǒng)遺傳學家對了解各物種體系之間內在關系的興趣之中。生物信息學的好處早已作為談資得以廣泛宣揚,它被宣稱是能解決一切痼疾的仙丹

2、,或是肢解序列數(shù)據(jù)的強大工具,或簡稱之為搞科學一條迷人途徑。而實際上,生物信息學是在艱難而有意義工作中的一種新的方法。這一領域中,研究方法大多在不斷變化并有待發(fā)展和完善,與當年生物化學的黃金年代并無不同,那時人們選擇各種能溶解和分析目標分子的手段,不象如今生化實驗室中所用技術要成熟和精巧得多。然而,在生物信息學被推向前進的競賽中,一些人曾企圖將其從科學分支降級為購買了合適工具包就完成的功能。而維護了生物信息學在科學領域中地位的正是學術用戶群體本身,無論他們是在私立大學里還是在政府贊助的研究中心里。生物信息學中已取得的卓越進展就蘊藏在從收集整理原始數(shù)據(jù),到開發(fā)更新更強的數(shù)據(jù)處理方法的工作之中,而

3、且一切均處于信息和技術自由共享的環(huán)境里。生物信息學群體的獨特之處在于,在商業(yè)部門之外,其“團體精神”比生物學中許多競爭性領域要開放得多。由此想法,本書試圖能讓那些想了解更多序列分析方法的科學家跳進書中,來體驗令人著迷的科學旅途。蛋白質組研究中的生物信息學 第一節(jié) 生物信息學簡介一、什么是生物信息學 生物信息學是隨著人類基因組計劃而發(fā)展起來的。生物信息學是一門新興的交叉學科。它包含了生物信息的獲取、處理、存儲、發(fā)布、分析和解釋等在內的所有方面它綜合運用數(shù)學、計算機科學和生物學的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學意義。二、生物信息學的研究內容 生物信息學從有以下研究內容。 1序列比對 基

4、本問題是比較兩個或兩個以上符號序列的相似性或不相似性。序列比對是生物信息學的基礎,非常重要。2. 結構比對 比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。3. 蛋白質結構預測 包括二級和三級結構預測,是最重要的課題之一。4. 計算機輔助基因識別 基本問題是給定基因組序列后,正確識別基因的范圍和在基因組序列中的精確位置。這是最重要的課題之一。5. 非編碼區(qū)分析和DNA語言研究 在人類基因組中,編碼部分占總序列的3一5,其他通常稱為“垃圾”DNA,其實一點也不是垃圾,只是我們暫時還不知道其重要的功能。分析非編碼區(qū)DNA序列需要大膽的想象和嶄新的研究思路相方法。DNA序列作為一種遺傳語言,

5、不僅體現(xiàn)在編碼序列之中,而且隱含在非編碼序列之中。6. 分子進化和比較基因組學 早期的工作主要是利用不同物種中同一種基因序列的異同來研究生物的進化,構建進化樹。既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至可通過相關蛋白質的結構比對來研究分子進化。 近年來由于較多模式生物基因組測序任務的完成,為從整個基因組的角度來研究分子進化提供了條件。7. 序列重疊群裝配 一般來說,根據(jù)現(xiàn)行的測序技術,每次反應只能測比500 bp或更多一些堿基對的序列,這就有一個由大量的較短的序列全體構成的重疊群。逐步把它們拼接起來形成序列更長的重疊群,直至得到完整序列的過程稱為重疊群裝配。8遺傳密碼的起源 遺傳密

6、碼為什么是現(xiàn)在這樣的?這一直是一個謎。一種最簡單的理論認為,密碼子與氨基酸之間的關系是生物進化歷史上一次偶然的事件而造成的,并被固定在現(xiàn)代生物最后的共同祖先里,一直延續(xù)至今。不同于這種“凍結”理論,有人曾分別提出過選擇優(yōu)化、化學和歷史等三種學說來解釋遺傳密碼。隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源和檢驗上述理論的真?zhèn)翁峁┝诵碌乃夭摹?9基于結構的藥物設計 人類基因組計劃的目的之一在于闡明人的約10萬種蛋白質的結構、功能、相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括藥物治療。基于生物大分子結構的藥物設計是生物信息學中的極為重要的研究領域。10生物信息處理并行

7、算法的研究 由于生物信息數(shù)據(jù)的規(guī)模極其巨大,因此國內外都開展了生物信息處理算法并行化方向的研究。主要是研究生物信息學中的一些關鍵的算法,研究其中的可并行性然后將其固化到硬件芯片中,從而提高整個計算系統(tǒng)的性能。11. 其它 如基因表達譜分析,代謝網(wǎng)絡分析,基因芯片設計和蛋白質組學數(shù)據(jù)分析逐漸成為生物信息學中新興的重要研究領域。 2001年9月,國家科學技術部對“生物和現(xiàn)代農業(yè)技術領域生物信息技術主題”提出的目標是: 實現(xiàn)生物技術與信息技術以及其他學科的結合,實現(xiàn)基因組數(shù)據(jù)、蛋白質組和結構基因組數(shù)據(jù)、天然及合成化合物數(shù)據(jù)的計算機處理、分析和可視化,以及生物實驗和生物分子的模擬設計,解析蛋白質三維結

8、構和蛋白質組的時空表達關系等,提高生物信息處理、分析和利利用的水平。三. 我國生物信息學研究的目標主要內容是: 1生物信息的獲取與開發(fā) 2生物信息加工和利用 3結構基因組和蛋白質組學研究 4高通量藥物篩選及相關技術 5. 小分子藥物設計和分子設計 6. 生物芯片 7. 化學創(chuàng)新藥物和新劑型四. 蛋白質組研究中生物信息學的任務Proteomic analysis requires highly sophisticated bioinformatic tools in not only electrophoretic and MS separation but also in the assign

9、ement of physicochemical properties and prediction of potential post-translational modifications and 3D structuresDatabases exist for the protein maps of a broad range of organisms, tissues, and disease statesUltimately, given the dynamic nature of the proteome, complex experimental details and rela

10、ted results need to be extrapolated in the context of the relevant biochemical pathways or disease implicationsFor example:How to classify proteins into functional classes?How to compare one proteome with another?How to include functional/activity/pathway information in databases?How to extract func

11、tional motifs from sequence data?How to predict phenotype from proteotype? How to correlate changes in protein expression with disease? How to distinguish important from unimportant changes in expression? How to compare, archive, retrieve gel data? How to rapidly, accurately identify proteins from M

12、S and 2D gel data? How to include expression info in databases? How to predict 3D structure from 1D sequence? How to determine function from structure? How to classify proteins on basis of structure? How to recognize 3D motifs and patterns? How to use bioinformatics databases to help in 3D structure

13、 determination? How to predict which proteins will express well or produce stable, folded molecules?第二節(jié) 數(shù)據(jù)庫的構建 數(shù)據(jù)庫是生物信息學的主要內容,各種數(shù)據(jù)庫幾乎覆蓋了生物科學的各個領域。 美國洛斯阿拉莫斯國家實驗室1979年開通的基因庫Genbank,現(xiàn)在由1988年成立的國家生物信息中心(NCBI)管理維護。 歐洲分子生物學實驗室1982年開始服務的EMBL數(shù)據(jù)庫和隨后建立的歐洲生物網(wǎng)(EMBNet)1994年改由當年建在英國劍橋的歐洲生物信息研究所(EBI)管理。 日本1984年著手建

14、立國家級的核較數(shù)據(jù)庫DDBJ,1987年正式服務。目前絕大部分核酸和蛋白質數(shù)據(jù)由美國、歐洲和日本產生,以上三家共同組成了DDBJ/EMBIGeneBank國際核酸序列數(shù)據(jù)庫。其他國家如德國、法國、意大利等也紛紛建立自己的數(shù)據(jù)庫,為本國服務。第三節(jié) 蛋白質組研究中常用的網(wǎng)站及數(shù)據(jù)庫從1994 年起每年第一期 (Nucleic Acid Research) 是分子生物學數(shù)據(jù)庫???,由專人綜述當前的在線分子生物學數(shù)據(jù)庫資源。SWISS-PROT/TrEMBL 高度注釋(比如蛋白功能描述、結構域結構、轉錄后修飾、變異等),冗余程度最低,與其他數(shù)據(jù)庫整合程度最高。TrEMBL是SWISS-PROT的補充

15、,含有所有的EMBL核苷酸的翻譯產物,但未整合進SWISS-PROT 。Protein Information Resource(PIR) 廣泛的、注釋的、非冗余的蛋白質序列數(shù)據(jù)庫。蛋白信息資源與慕尼黑蛋白序列信息中及日本國際蛋白質信息數(shù)據(jù)庫合作,產生的公共領域中最廣泛的熟練注釋的蛋白序列數(shù)據(jù)庫-PIR國際蛋白質序列數(shù)據(jù)庫。NCBInr 是一個非冗余的蛋白質數(shù)據(jù)庫,由NCBI搜集,以供其搜索工具BLAST和Entrez所用。 dbEST 是GenBank的分支,含有從大量的生物中來的一次反應測序得到的cDNA或叫表達序列標簽。這是一個核酸數(shù)據(jù)庫,被Mascot從6個相位翻譯得到。OWLOWL混

16、合蛋白質數(shù)據(jù)庫(Composite Protein Sequence Database)是一個非冗余的蛋白質序列數(shù)據(jù)庫,由4個公用的一級資源組成:SWISS-PROT、PIR、Genbank和NRL-3D。UniGene 美國國家生物技術信息中心(NCBl)提供的公用數(shù)據(jù)庫,該數(shù)據(jù)庫將GenBank中屬于同一條基因的所有片段拼接成完整的基因進行收錄。7.其它數(shù)據(jù)庫如下圖 PDB中的每條記錄有顯式序列(explicit sequence)和隱式序列(implicit sequence)信息。 PDB的隱式序列即為立體化學數(shù)據(jù),包括每個原子的名稱和原子的三維坐標。在實際應用中,PDB數(shù)據(jù)庫應與結構

17、模型顯示軟件相結合。由于PDB的主要信息是三維結構,如果直接將三維結構信息以文本的形式返回給用戶,用戶將難以讀懂這些信息。實用的方法是通過分子模型軟件,以圖形方式顯示三維結構?;ヂ?lián)網(wǎng)上有許多可以利用的分子模型軟件如RasMol、 CHIME 、MolPOV等,這些軟件能夠以各種各樣的模型顯示出生物大分子的三維結構如結構骨架模型、棒狀模型、球棒模型、空間填充模型和帶狀模型等。此外,PDB還說明了蛋白質某些特定部位的二級結構類型如a螺旋和b折疊。觀看生物分子3D微觀立體結構的軟件,可以旋轉,以多個模式觀看,并可以存成普通圖形文件。 IE與NetScape瀏覽器插件,安裝后,可以直接用瀏覽器觀看PD

18、B格式的文件,直接在瀏覽器中觀看3D分子。 CHIME 2.6 SP6是PDB格式至POV格式轉化工具,可以將大分子PDB格式文件轉化為POV格式,以便用pov-ray進行三維渲染,生成質量非常高的分子三維圖形。軟件有許多選項,只需設定這些選項,便能生成相應的POV格式文件,直接調用Pov-Ray軟件,生成相應的非常高質量的三維圖像。MolPOV 2.0.82.CPHmodelsWX23.MMDB http:/sander.ebi.ac.uk/hssp/ 所有實驗測定的三維結構 現(xiàn)在,許多蛋白質家族的三維結構已經知道、因此很有可能在搜索序列數(shù)據(jù)庫時會碰到巳知結構的同源物。Entrez的三維納構

19、數(shù)據(jù)庫的目標就是使這些信息以及其提供的功能注釋能夠很方便地提供給分子生物學家。比如,人們可能會選與一個感興趣的序列相似的所有的序列,以及到所有已知的三維結構的鏈接。在確定一個已知結構的同源物后,人們可以通過觀察分子圖像相比對情況來推導近似的3D結構。 DSSP還包括一個實用程序,根據(jù)蛋白質的三維結構用它就可以計算一個蛋白質所對應的二級結構。在DSSP數(shù)據(jù)庫中,蛋白質的二級結構共分7種類型,其編碼含義是:H代表a螺旋,E代表b折疊,G和I分別代表3-螺旋和p螺旋,B代表孤立的b橋,T代表氫鍵轉折,S代表彎曲。DSSP二級結構實例 六. 在線蛋白工具樹立質量法制觀念、提高全員質量意識。7月-227月-22Sunday, July 31, 2022人生得意須盡歡,莫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論