生物信息學在變態(tài)反應學中的應用_第1頁
生物信息學在變態(tài)反應學中的應用_第2頁
生物信息學在變態(tài)反應學中的應用_第3頁
生物信息學在變態(tài)反應學中的應用_第4頁
生物信息學在變態(tài)反應學中的應用_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學在變態(tài)反應學中的應用杜智華 劉志剛基金項目: 基金項目:本課題獲國家九七三計劃(No.2005CB121000)和廣東省科技重點計劃項目(No.2003A3080502)資助。作者簡介:杜智華,女,博士,研究方向為生物信息學,過敏原的檢測、分析及新藥的研發(fā)。* 通訊作者: 劉志剛, 教授,博士生導師。Tel: Fax: E-mail: lzg(深圳大學生命科學學院,深圳 518060)摘要 變態(tài)反應疾病是臨床上的常見病、多發(fā)病,是當前世界性的重大衛(wèi)生學問題之一。隨著現代醫(yī)學、免疫學和分子生物學的迅速發(fā)展,過敏原以及相關數據的

2、快速增加,生物信息學的在變態(tài)反應學中的重要性越來越突出。生物信息學以計算機為工具對過敏原數據進行儲存、檢索和分析,是對傳統生命科學在變態(tài)反應學研究中的一個重要補充。本文主要介紹了生物信息學在過敏反應研究中的重要的應用,包括:過敏原的結構分析,蛋白質致敏性的評估,過敏原之間交叉反應的預測,確定B-細胞和T-細胞表位的分析。通過這些方法的介紹,旨在說明生物信息學在過敏反應研究中的應用價值。關鍵詞 變態(tài)反應;過敏原;致敏性評估;生物信息學; Bioinformatics for the study of allergy Du zhihua, Liu zhigang *(College of Life

3、 Sciences, ShenZhen University, ShenZhen 518060, China)Abstract: Objective Allergy is a major cause of disease and has a significant impact on society. As the number of characterized allergens and related information is increasing rapidly, it is needed to store, retrieve and analyze these data. Bioi

4、nformatics provides various computational tools and approaches to acquire, store, visualize and interpret allergens and these are complementary to traditional laboratory study. This paper presents an overview of applications of bioinformatics available for the research of allergy ranging from struct

5、ural analysis of allergen, assessment of allergenicity, cross-reactivity and identification of B- and T-cell epitopes. Keywords allergy;bioinformatics; cross-reactivity;T-cell epitope;B-cell epitope; IgE epitope;過敏反應又稱超敏反應或變態(tài)反應,是指機體受同一過敏原再次刺激后產生的一種異?;虿±硇悦庖叻磻?。過敏原進入患者體內,隨即被巨噬細胞 (抗原呈遞細胞、APC細胞) 捕獲,巨噬細胞對

6、過敏原消化、處理后將抗原表位決定簇傳遞給輔助性T淋巴細胞,再傳給B細胞。B細胞分裂并產生免疫球蛋白E(IgE),IgE與人體自身的肥大細胞和血清中嗜堿細胞的Fc受體結合而致敏。肥大細胞主要分布在皮膚、黏膜和毛細血管周圍。當患者再次接觸這種過敏原,過敏原就會與致敏細胞上的IgE抗體結合,使細胞脫顆粒,釋放出組胺、5羥色胺、緩激肽等活性物質,導致過敏性疾病的發(fā)生。隨著過敏原以及相關數據的快速增加(國際免疫學會聯合會維護并保持更新經確認的過敏原資料庫1),生物信息學在變態(tài)反應學中的重要性越來越突出。 生物信息學是以計算機為主要工具,從核酸和蛋白質序列出發(fā),分析序列中表達結構和功能的生物信息。它能夠對

7、日益增長的過敏原的序列和結構等相關信息進行收集、儲存、提取、加工、分析和研究,同時建立理論模型,指導實驗研究。 它由數據庫、計算機網絡和應用軟件三大部分構成,在變態(tài)反應研究中發(fā)揮不可替代的作用。本文首先介紹了生物信息學中的主要方法,然后研究了這些方法在過敏反應研究中的重要應用,包括:蛋白質致敏性評估,過敏原之間交叉反應的預測,確定B-細胞和T-細胞表位的分析。通過這些方法的介紹,旨在說明生物信息學在過敏反應研究中的應用價值。一、 生物信息學的主要功能生物信息學通??梢詰玫缴锟茖W相關的研究中。例如,用于序列分類、相似性搜索、DNA序列編碼區(qū)識別、分子結構與功能預測、進化過程的構建等方面的計算

8、工具已成為變態(tài)反應研究工作的重要組成部分。針對核酸序列的分析就是在核酸序列中尋找過敏原基因,找出基因的位置和功能位點的位置,以及標記已知的序列模式等過程。針對蛋白質序列的分析,可以預測出蛋白質的許多物理特性,包括等電點分子量、酶切特性、疏水性、電荷分布等以及蛋白質二級結構預測,三維結構預測等。生物信息學中的主要方法有:1. 序列比對:比較兩個或兩個以上核酸序列或蛋白質序列的相似性或不相似性。相似性是指序列比對過程中用來描述檢測序列和目標序列之間相同DNA堿基或氨基酸殘基順序所占比例的高低。當相似程度高于50%時,比較容易推測檢測序列和目標序列可能是同源序列;而當相似性程度低于20%時,就難以確

9、定或者根本無法確定其是否具有同源性。序列比對是生物信息學的基礎,非常重要。同源序列的多序列比對也是生物信息學工具中一個有力的工具。它可以被視為如同定點誘變一樣的技術,允許觀察殘基可以改變到什么程度而蛋白質仍保持功能;它也可以得到圍繞某一殘基的三級結構信息。2. 結構比對:比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性。3. 蛋白質結構的預測:蛋白質結構預測包括2級和3級結構的預測。傳統生物學認為,蛋白質序列決定了它的三維結構,也就決定了它的功能。由于用X光晶體衍射和核磁共振技術(NMR)測定蛋白質的三維結構,無法適應蛋白質飛速增長的需要,因此多用演繹法和歸納法來預測。演繹法主要是從一些

10、基本原理或假設出發(fā)來預測和研究蛋白質的結構和折疊過程。歸納法主要是從觀察和總結已知的蛋白質結構規(guī)律出發(fā)來預測未知蛋白質的結構,例如:同源模建和指認(Threading)方法。4. 構造分子進化樹:利用不同物種中同一種基因序列的異同來研究生物的進化,構建進化樹。既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至于可通過相關蛋白質的結構比對來研究分子進化。5. 聚類:基因聚類的目標是將表達模式相近的基因聚在一起,因為表達模式相近的基因被認為具有相近或相關的功能。這種分析旨在將基因分成一些功能相近或相關的小組,這樣便于去探索基因的功能。 生物信息學是生物學中的一個不可缺少的有效工具,但

11、是生物學才是生物信息學的核心和靈魂,生物信息學中的算法和工具只有運用到具體的生物研究課題中,才能起到巨大作用。二、 生物信息學在變態(tài)反應中的應用生物信息學能快速對蛋白的過敏性做出評價,主要是通過對過敏原的同源性、交叉反應性和過敏原的刺激機體產生免疫應答的能力進行預測。1. 同源性預測生物信息學中的相似性分析是一種最簡單快捷的致敏性預測方法,用來比較基因的表達產物是否同已知的過敏蛋白具有同源性。 目前已知過敏原的氨基酸序列都被過敏原數據庫收錄(表1中列出了現有過敏原數據庫以及網址),過敏原的相似性分析主要是以這些數據庫聯合檢索的過敏原序列為基礎進行的。表1:過敏原數據庫數據庫網址Internat

12、ional Union of ImmunologicalSocieties (IUIS) 國際免疫學會聯合會Allergome 過敏原相關數據庫Structural Database of Allergenic Proteins (SDAP) 過敏相關基因數據庫/SDAPFood Allergy Research and Resource Program (FARRP) 食物過敏原相關數據庫PROTALL 英國食品過敏原數據庫http:/www.ifr.bbsrc.

13、ac.uk/ProtallBioinformatics for Food Safety 食品安全相關數據庫/sgendel/fa.htmSwiss-Prots Allergen Index SWISS-PROT蛋白質序列數據庫的過敏原數據索引/sprotInformall 歐盟關于食品過敏原的數據庫Central Science Laboratory 英國過敏原數據庫.uk/allergen/AllerPRedict 新加坡A

14、-star研究所的過敏原數據庫以及分析工具.sg/Templar/DB/Allergen/Allermatch 荷蘭過敏原數據庫以及分析工具/International Immunogenetics (IMGT) Information System 國際免疫遺傳學信息系統http:/imgt.cines.fr/AllAllergy 關于過敏(變態(tài))反應數據庫網站FASTA 7 和 BLAST2 是最常用序列相似性比較的工具,二者都采用局部比對策略,功能基本相同。輸入基因或蛋白質序列,通過

15、BLAST或FASTA等程序搜索數據庫,列出與輸入序列有較高相似性的已知過敏原序列。BLAST搜索速度快,對大型數據庫的操作比較有效,FAST對搜索局部小匹配更敏感,且容易對本地數據庫進行操作,因此在過敏原的相似性分析中傾向于使用FAST程序。 由于相似性分析主要目的是鑒定轉基因產物同過敏原的交叉反應,也就是證明轉化基因是否有相同的抗原表位,因此過敏原的相似性比較要求局部的氨基酸完全匹配,為此必需選擇單位矩陣。有證據表明,與IgE結合抗原表位并不是完全保守,因此通常采用雙步分析,即先用單位矩陣作相同表位的預測,再用取代矩陣作進一步的驗證,使用取代矩陣的分析也同時實現了同源性預測。聯合國糧農組織

16、及世界衛(wèi)生組織(FAO/WHO)、國際生命科學研究所(ILSI)制定了一系列關于蛋白致敏性評價的標準(FAO/WHO,2001,;2003,h傳統生物學以及生物信息學的測試。生物信息學部分過敏性的判定標準包括以下兩個標準:至少有6個連續(xù)的氨基酸與已知過敏原相同或者在長度為80個氨基酸的窗口中,同過敏蛋白的同源性在35%以上3,4,5。由于6個連續(xù)的氨基酸相同的判定很容易出現假陽性結果,因此必須與同源性分析同時進行,在兩者都成陽性結果時,才能判斷轉化蛋白的過敏可能性。然而,Silvanovich A. 等(2005)通過概率學研究,表明8個或更少連續(xù)的氨基酸相同判定蛋白過敏性只是一個隨機產生的結

17、果,對致敏性評估不具備任何意義13。另外,目前序列相似性分析僅局限于氨基酸順序的比較,由于除了氨基酸順序決定表位之外還存在構象決定表位引起過敏,序列相似性分析并不能包括構象決定表位分析,因此在序列相似性分析之后,還應該包括空間結構的分析(進行3-D結構的比較對過敏蛋白結構進行相似性分析)。必要時應做血清學試驗來驗證目的基因編碼的蛋白是否能與特異性IgE結合,從而更準確地判斷該基因或蛋白是否引起過敏。2. 交叉反應預測在變態(tài)反應中花粉癥患者常會存在與一些植物類食物過敏原如蔬菜、水果之間的交叉過敏。通過生物信息學的分析,大多數植物蛋白質引起的過敏都具有非常相似的形狀。 Jenkins等6報道了所有

18、的植物類食物過敏原按照蛋白質家族分類,只歸類到3,849種蛋白質家族中的20種。而其中4個家族就囊括了三分之二的過敏原。研究結果還表明,過敏原的結構是非常相似的,提示保守結構及其生物學活性在決定過敏原特性方面可能起重要作用。結構生物信息分析表明在對任何潛在IgE交叉過敏原性進行評估時(如新的蛋白質),均應包括3D結構保守序列,即使蛋白表面結構單一的一個保守區(qū)域也可產生交叉反應。通過對這些開花植物結構的進一步認識,研究結果就可以解釋為何似乎并無相似性的種系之間會發(fā)生交叉反應。另外,通過對新開發(fā)食物蛋白保守3D結構進行評估,可以預測其是否會存在同其他過敏原的交叉反應,對避免可能出現的嚴重食物過敏有

19、重大的意義。3. 免疫原性預測相似性分析和血清學檢測只能對目前已知的或已經發(fā)生過敏反應的過敏原進行預測。如果要對從來未有過的或新合成的蛋白質進行預測,就只能通過對該蛋白質本身的刺激機體產生免疫應答的能力進行預測??乖瓫Q定簇是存在于抗原分子表面、決定抗原特異性的特殊化學基團。是抗原分子和TCR、BCR及抗體特異性結合的部位,又稱抗原表位。 過敏原抗原表位的預測工作對于分子生物學實驗,如多肽疫苗的合成、診斷試劑的制備和單克隆抗體的篩選等,都是必不可少的工具,并且得到越來越廣泛的應用。蛋白抗原表位的預測自從80年代就已經被提出,根據蛋白的免疫原性與蛋白質結構特性關系,主要根據下面幾個條件:1) 親水

20、特性:蛋白抗原各氨基酸殘基可分為親水性殘基和疏水性殘基兩類。在機體內,疏水性殘基一般埋在蛋白內部,而親水性殘基位于表面,因此蛋白的親水部位與蛋白的抗原位點有密切的聯系。Hopp & Woods在1981年提出了確定蛋白抗原表位的方法12,通過分析氨基酸序列,去尋找親水性最強的部位,根據每個氨基酸的親水值,沿著肽鏈對每6個氨基酸的親水值進行平均,獲得了所有值的平均值后,確定最高值。 發(fā)現最高點總是落入或者接近抗原表位。但是,新的研究發(fā)現親水性部位與表位并無很好的一致性,即高親水部位不一定是抗原表位,抗原表位也不一定是親水性部位14。2) 兩親性:同時具有親水性和疏水性。例如:除親水性殘基

21、外,疏水性殘基也經常出現在表位中,各殘基在蛋白抗原位點中的相對出現率對抗原表位的定位預測有一定意義。T細胞表位往往出現在兩親性的結構中,因此利用兩親性可預測T細胞表位。這是因為,T細胞表位以其親水性面與T細胞受體結合,以其疏水性面與抗原呈遞細胞結合。3) 分子運動性:運動性高的區(qū)域往往與連續(xù)性抗原表位的位置吻合,因為蛋白質轉角區(qū)往往具有較大的自由度。4) 表面可及性:由于抗原抗體反應發(fā)生在蛋白質表面,因此抗原表位趨向于蛋白質的表面部位。認為轉角結構為凸出結構,多出現在蛋白抗原表  面,利于與抗體嵌合,較可能成為抗原表位。螺旋、片層結構規(guī)則,不易變形,較難嵌合抗體,一般不作為

22、抗原位點10,11。5) 序列多變性:指蛋白抗原構象不是剛性不變的,其多肽骨架有一定程度的活動性,因為抗原與抗原受體或抗體結合有一個嵌合的過程。6) 肽鏈的兩端:在大多數蛋白質中,N端和C端往往位于分子表面并且相互靠近,處于肽鏈的末端,使得柔韌性相對大些。預測蛋白抗原表位一般以上述多種方案綜合考慮,尤其以表面可及性、多變性、兩親性及兩親性預測為重要。概括而言,作為蛋白抗原的表位首先應位于或移動于蛋白表面,有利于與抗原受體或抗體結合,另外要有一定柔韌性,因為抗原與抗原受體或抗體結合有一個嵌合的過程。另外,T細胞表位可以根據主要組織相容性復合體(MHC)類與多肽的結合能力來預測。最近,基于已有知識

23、的同源模擬和蛋白質三級結構預測也應用到了預測T細胞表位。當過敏原進入體內后,免疫系統將其處理為大約包括10個氨基酸的多肽。像這樣的肽段,或是抗原決定簇,被呈現于“抗原提呈細胞 (APC細胞)”上,與主要組織相容性復合體(MHC)類分子結合并提呈給輔助性T淋巴細胞(Th)。 MHC-II分子對抗原分子的特異性識別在特異性免疫的起動階段起著重要作用。只有當過敏原和細胞表面的MHC-II分子結合成抗原肽才能被T細胞識別。只有極少的多肽片段有適合MHC蛋白的形狀,然而MHC具有高度多態(tài)性,有成千上百個細微差別的不同形態(tài),使肽段的結合多樣化。生物信息學用計算機的方法可以解決抗原決定簇多態(tài)性預測的問題。B

24、rusic等設計的神經網絡系統可以預測出非典型的表位,大概有80的正確率8。該算法基于人工中樞網絡系統,將計算機互相連接,類似于簡單的大腦神經網絡。當計算機“學習”大量能與已知MHC蛋白結合的多肽特征后,中樞網絡將“學習”有可能是最好結合者多肽的特性。當將未知蛋白序列輸入系統,計算機將選出最有可能與獨特的MHC蛋白結合的肽段。這個算法主要的缺陷在于,對于每一個MHC多態(tài)性,必須給予上百個結合肽段的數據,而系統不能立刻鑒定出能與許多個MHC多態(tài)性結合的肽段。 Hammer等根據多態(tài)性的HLA等位基因具有相似的“口袋”提出了TEPITOPE算法解決了上述問題9。在比較了不同的MHC多態(tài)序列后,發(fā)現

25、了針對每個天然氨基酸(共2 0個)的35種結合“口袋”。 通過計算一個蛋白抗原中的所有肽段,與包含有35個已測口袋51個最常見MHC變體的結合能力,就可以預測出免疫刺激表位具有最強結合能力的肽段。這種算法也可以確定與不同的MHC多肽變體結合的“混合”多肽,并能找出最佳疫苗候選者。但是,Malandain (2004)指出上述算法中存在的一個嚴重問題:過敏反應不是由肽段,例如B細胞表位觸發(fā)的 15。他指出B細胞表位和T細胞表位只是次要因素,他們并不能解釋為什么抗原能被提呈細胞識別。并說明到現在還找不到抗原T細胞表位和B細胞表位的共同特征是因為在抗原被其處理為大約包括10個氨基酸的多肽之前,抗原提

26、呈細胞必須識別整個未被處理前的整個分子。因此在識別過敏原取決于完整、天然蛋白的某些特性,這些線索在T細胞肽段中已經不存在了。最新的研究表明,無脊椎動物和植物在進化過程中對外來的危險物質顯示出相同的機制:一組感受器例如:toll-like負責發(fā)現一些有共同特性的特殊分子模式,通常由混雜的成分組成(肽段,液體,離子,和/或者碳水化合物半族)。這些具有免疫原性模式的合成特性可能是限制僅通過肽段中樞來預測致敏性的原因。Furmonaviciene等 (2006)在Bioinformatics雜志上發(fā)表的一篇論文進一步探討了過敏原能被識別的機制 16 。他們根據美國免疫學家Janeway等在2000年提

27、出的病原體模式識別理論 17:模式識別受體(pattern recognition receptor, PRR)識別應答病原相關的分子模式(Pathogen-associated molecular pattern,PAMP),指出有可能過敏原也存在PAMP, 即共有的一種保守分子模式,能夠被PRR識別,觸發(fā)的Th2應答,導致產生免疫球蛋白E(IgE)以及過敏反應。他們通過對已知維結構的過敏原: Ara 1, Act c 1, Bet v1 和 Ves v5以及它們的同源序列的分析證實了這個推論這個推論也能夠說明為什么在大量的蛋白質家族中,只有非常小的一部分才會引起過敏反應然而,這個理論需要進

28、一步通過生物信息學的方法證實。三、 結論生物信息學是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域。本文系統的介紹了生物信息學在變態(tài)反應研究中的應用。生物信息學技術具有快速高效的特點,是更深入研究有過敏反應所必須的,并且已在一些致敏評價中發(fā)揮重要作用。生物信息學方法的缺點是它是一種理論預測,因此還需傳統生物學的輔助,要同其他的免疫學實驗方法結合起來才能進一步給出準確的評價。參 考 文 獻1King TP, Hoffman D, Lowenstein H, et al. Allergen nomenclature J. Allergy 1995,50:765774

29、.2. Altschul,SF, Madden,TL, Schaffer,AA.,et al. Gapped BLAST and PSA-BLAST: a new generation of protein database search programs J. Nucleic Acids Res. 1997,17:3389-3402. 3FAO/WHO. Evaluation of allergenicity of genetically modified foods. Report of a joint FAO/WHO Expert Consultation on Allergenicit

30、y of Foods Derived from Biotechnology.2001.4. FAO/WHO. Report of the Fourth Session of The Codex ad hoc Intergovernmental Task Force on Foods Derived from Biotechnology.2003.5. Taylor,SL. Protein allergenicity assessment of foods produced through agricultural biotechnology J6. Jenkins, JA, Griffiths

31、-Jones, S., Shewry, PR, et al. Structural relatedness of plant food allergens with specific reference to cross-reactive allergens: An in silico analysis J. J. Allergy and Clinical Immunology 2005, 115:163-17077Pearson, WR. and Lipman, DJ. Improved Tools for Biological Sequence Comparison J, Proc. Na

32、tl. Acad. Sci. 1988, 85: 2444- 2448.8Brusic V, Rudy G, Honeyman G, et al. Prediction of MHC class II-binding peptides using an evolutionary algorithm and artificial neural network J. Bioinformatics 1998. 14:121130.9Sturniolo,T., Bono,E. Ding j., Raddrizzani,L, et al. Generation of tissue-specific and promiscuous HLA ligand databases using DNA microarrays and virtual HLA class II matrices J. Nature Biotechnology,1999, 17:555561.10Shih DT, Boettiger D, Buck CA. Epitopes of adhesion-perturbing monoclonal antibodies map within

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論