版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第頁人類基因組計(jì)劃篇一:人類基因組計(jì)劃的歷史背景人類基因組計(jì)劃的歷史背景問題的提出盡管生物機(jī)體的尺寸有限,但并未能為研究工作帶來任何容易之處。人們經(jīng)過了不懈的努力,渴望解開生命之謎這個(gè)多年的愿望并未向前推進(jìn)多少,謎仍是個(gè)謎!以往研究的艱履或失敗教訓(xùn)使人們頭腦開始清醒地認(rèn)識到,任何僅依靠單一學(xué)科如細(xì)胞學(xué)、發(fā)青學(xué)、腫瘤學(xué)、人類遺傳學(xué)或分子生物學(xué)的獨(dú)自努力都無濟(jì)于事,都太局限了,難以完成人類對自身的認(rèn)識和保護(hù)。美國曾投巨資但基本上以失敗告吹了的腫瘤十年計(jì)劃也說明了這個(gè)問題。所以,要知道某事物的局部作用機(jī)制最好先知道全局的看法逐漸主導(dǎo)了人們的認(rèn)識(DulbeccoR,1986)。在繞了一大段彎路后,人們回過頭來決定開始進(jìn)行人的所有基因即基因組的研究,全面探討這個(gè)“摸得到,猜不透,的人體奧秘,由此形成了基因組學(xué)(genomics)和人類基因組計(jì)劃(humangenomeproject,hgp),其最終目的是對生命進(jìn)行系統(tǒng)地和科學(xué)地解碼,以此達(dá)到了解和認(rèn)識生命的起源,種間和個(gè)體間存在差異的起因,疾病產(chǎn)生的機(jī)制以及長壽與衰老等生命現(xiàn)象(underes,1996)。人類基因組計(jì)劃以前的遺傳學(xué)或稱基因?qū)W(genetics)偏重于單個(gè)基因的研究,而人類基因組計(jì)劃則是把目光投向整個(gè)基因組的所有基因,從整體水平去考慮基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系等。隨著數(shù)理化、信息和材料等學(xué)科的滲透以及具有時(shí)代特征的工業(yè)化技術(shù)管理模式的引進(jìn),hgp真正成為了生命科學(xué)領(lǐng)域的第一項(xiàng)大科學(xué)工程,其規(guī)模和意義遠(yuǎn)遠(yuǎn)超過阿波羅(Apollo)登月計(jì)劃和曼哈頓(manhatton)原子彈計(jì)劃口hgp的正式啟動(dòng)也就標(biāo)志著解碼生命的真正開始也就很自然地成為人們關(guān)注的焦點(diǎn)。歷史的回顧對人類基因組的研究在70年代已具有一定的雛形,在80年代在許多國家已形成一定規(guī)模,并在以下的幾個(gè)事件的影響下形成了投資額最多、最具規(guī)模的美國人類基因組計(jì)劃。1984年在utah州的Aita,whiteR和mendelsoIlhnm受美國能源部(Doe)的委托主持召開了一個(gè)小型專業(yè)會(huì)議討論測定人類整個(gè)基因組的DnA序列的意義和前景(cook-y明n則,1989)。1985年5月在加州antacruz由美國能說部的sindeimerRL主持的議上提出了測定人類基因組全序列的動(dòng)議,由此形成了美國能源部的“人類基因組計(jì)劃”草案。1986年3月,在新墨西哥州的santaFe討論了這一計(jì)劃的可行性,隨后美國能源部宣布實(shí)施這一草案。1986年著名遺傳學(xué)家mcK1mickV提出從整個(gè)基因組的層次研究遺傳的科學(xué)稱“基因組學(xué)"。1986年3月7日,諾貝爾獎(jiǎng)獲得者DulbeccoR在science雜志上發(fā)表的一篇有關(guān)開展人類基因組計(jì)劃的短文。1986年6月在美國冷泉港,另兩位諾貝爾獎(jiǎng)獲得者gIbedw及bergp主持了有關(guān)“人類基因組計(jì)劃”的專家會(huì)議。1987年初,美國能源部與國家健康研究院(nIh)為“人類基因組計(jì)劃"下?lián)芰藛?dòng)經(jīng)費(fèi)約550萬美元(1987年全年1.66億美元),并開始籌建人類基因組計(jì)劃實(shí)驗(yàn)室。1988年2月,國家科學(xué)研究委員會(huì)(nRc)的專家撰寫了“人類基因組的作圖與測序(mappingandsequencingthehumangenome)”的報(bào)告,全面地介紹了有關(guān)這項(xiàng)史無前例的、看起來似“膽大妄為,計(jì)劃的內(nèi)容(nati?mlResearchcouncil,1988)。同年,美國成立了“國家人類基因組研究中心",由因提出DnA分子雙螺旋模型的貢獻(xiàn)而獲諾貝爾獎(jiǎng)的沃森(watsonJ)出任第一任主任。Duibeeco短文的功績DulbeccoR于1986年在science雜志上發(fā)表的題為“癌癥研究的轉(zhuǎn)折點(diǎn)——人類基因組的全序列分析”的短文,回顧了70年代以來癌癥研究的進(jìn)展,使人們認(rèn)識到包括癌癥在內(nèi)的人類疾病的發(fā)生,都與基因直接、間接有關(guān);同時(shí),他指出要么仍處在用“零敲碎打”的方法piecemealapproach)開展研究,要么從整體上研究和分析整個(gè)人類基因組及其序列。DulbeccoR在他的文章中還指出:“這一計(jì)劃的意義,可以與征服宇宙的計(jì)劃媲美。我們也應(yīng)該以征服宇宙的氣魄來開展這一計(jì)劃”,并且談到“這樣的工作是任何一個(gè)實(shí)驗(yàn)室難以單獨(dú)承擔(dān)的項(xiàng)目。:這個(gè)世界上發(fā)生的一明事情,都與這一人類的DnA制思思相關(guān)”。今天當(dāng)我們重讀這一短文時(shí)仍感到Dtelbecco的膽識和引起全世界巨大反響的意義所在。這也是為什么許多單項(xiàng)領(lǐng)域的進(jìn)展都有足夠的理由在世界范圍內(nèi)提出一個(gè)“計(jì)劃,,,如“遺傳工程計(jì)劃"、“腫瘤計(jì)劃"、“腦計(jì)劃”、“蛋白質(zhì)計(jì)劃”、“信號傳導(dǎo)計(jì)劃”等時(shí),人們最終選擇和接受“人類基因組計(jì)劃"作為全球性重大計(jì)劃的原因所在。這看來是由于自然科學(xué)的自身規(guī)律,內(nèi)在聯(lián)系和發(fā)展階段等因素導(dǎo)致了人們的最后選擇。如果仔細(xì)想一下,所有這些計(jì)劃的最關(guān)鍵因素都離不開基因的作用,就會(huì)倍加感到Dulbecco短文的高瞻遠(yuǎn)矚,只有弄清楚了人類基因組的全部或大部分基因的工作情況,實(shí)施其他計(jì)劃才成為可能。世界的行動(dòng)歷經(jīng)5年左右的辯論后,美國國會(huì)正式批準(zhǔn)美國的“人類基因組計(jì)劃”于1990年10月1日正式啟動(dòng)。其規(guī)模在世界上是最大的,總體計(jì)劃是在15年內(nèi)投入至少30億美元進(jìn)行人類全基因組的分析。在DIllbecco短文的影響下,整個(gè)西歐幾乎全部都動(dòng)了起來,并各具特色。最早開始國家級hgp的是意大利的國家研究委員會(huì)(nationalResearchcouncil)。1987年,該委員會(huì)組織了15個(gè),以后發(fā)展到30個(gè)實(shí)驗(yàn)室開始了人類基因組計(jì)劃的研究。其特點(diǎn)是技術(shù)多樣(YAc、雜種細(xì)胞、cDnA等)、區(qū)域集中(基本上限于xq24-qtee區(qū)域)。1989年2月開始的英國hgp的特點(diǎn)是:帝國癌癥研究基金會(huì)與國家醫(yī)學(xué)研究委員會(huì)(IcRp-mRc)共同負(fù)責(zé)全國協(xié)調(diào)與資金調(diào)控;劍橋附近的sanger中心注重首先在線蟲基因組上積累經(jīng)驗(yàn),改進(jìn)大規(guī)模DnA測序技術(shù);同時(shí),建立了YAc庫的篩選與克隆、特異細(xì)胞系、DnA探針、基因組DnA、cDnA文庫、比較生物基因組DnA序列、信息分析等的“英國人類基因組資源中心”,并向全國的用于研究目的會(huì)員免費(fèi)提供技術(shù)及實(shí)驗(yàn)材料服務(wù)??芍^“資源集中,全國協(xié)調(diào)”。1990年6月法國的國家人類基因組計(jì)劃開始啟動(dòng)。科學(xué)研究部(ministryofResearch)委托國家醫(yī)學(xué)科學(xué)院(ImseRm)制定人類基因組計(jì)劃,主要特點(diǎn)是注重整體基因組、cDnA和自動(dòng)化。諾貝爾獎(jiǎng)金獲得者DaussetJ于1983年用自己的獎(jiǎng)金建立的ceph(人類多態(tài)性研究中心)和法國民眾捐款至少5000萬美元建造的genethon為全世界的hgp做出了不可磨滅的貢獻(xiàn),特別是在全基因組YAc重疊群、微衛(wèi)星標(biāo)記(遺傳圖)的構(gòu)建以及馳名世界的用作基因組研究的經(jīng)典材料ceph家系(80個(gè)3代多個(gè)體家系)的影響方面產(chǎn)生了巨大的影響。1995年6月德國才正式開始了hgp。雖然起步晚,但來勢迅猛q他們先后成立了資源中心和基因掃描定位中心,并已開始了對21號染色體的大規(guī)模測序工作。此外,1990年6月歐洲共同體通過了“歐洲人類基因組研究計(jì)劃”,主要資助23個(gè)實(shí)驗(yàn)室重點(diǎn)用于“資源中心”的建立與運(yùn)轉(zhuǎn)。這也是歐洲計(jì)劃在多個(gè)領(lǐng)域趕超美國的一個(gè)重要方面。另外,榜上有名的還有丹麥、俄羅斯等國,以及亞太地區(qū)的日本、韓國、澳大利亞等。中國hgp是于1994年初在吳雯院士、強(qiáng)伯勤院士、陳笠院士和楊煥明教授的倡導(dǎo)下啟動(dòng)的工最初由國家自然科學(xué)基金委員會(huì)和“863”高科技計(jì)劃的支持下.先后啟動(dòng)了“中華民峽基因組中若干位點(diǎn)基因結(jié)構(gòu)的研究”和“重大疾病相關(guān)基因的定位、克隆、結(jié)構(gòu)與功能研究"(陳蘭等,1998)。經(jīng)過了幾年的摸索已逐漸形成了自己的體系,并進(jìn)一步看清了開展這項(xiàng)工作的重要性。l998年在國家科技部的領(lǐng)導(dǎo)和牽線下,決定在北京和上海各成立一個(gè)中心J上海中心以陳笠院士掛帥于同年的3月份正式揭牌,并于10月份改名為中國南方基因中心二同時(shí),決定成立若干中國人類遺傳資源保護(hù)中心,國家衛(wèi)生部起到牽頭的作用。中國科學(xué)院和中國醫(yī)學(xué)科學(xué)院以及一些大學(xué)、研究所也為中國的hgp做了大量的工作和注入了資金二1998年中國科學(xué)院遺傳所由楊煥明和余軍教授組織,以及1999年由強(qiáng)伯勤院士挑頭在北京又先后成立了中國科學(xué)院北京人類基因組中心和北方人類基因組中心。盡管它們顯得有些姍姍來遲了,但使我國在人類基因組的研究實(shí)力豁然間得到了進(jìn)一步的增強(qiáng)。然而,除了早期的政府介入外,時(shí)至今日,世界上-幾乎所有大大小小的醫(yī)藥公司都卷入了這場所謂的hgp,無形中已形成了一場“搶基因”大戰(zhàn)。為了迎接挑戰(zhàn),由collinsF領(lǐng)導(dǎo)的美國國家人類基因組計(jì)劃和morganm負(fù)責(zé)的由wellcome慈善基金會(huì)所資助的英國人類基因組計(jì)劃決定于2000年春天完成人類基因組具有90%序列的“工作框架圖”(pennisie,1999),而到20XX年完成具有99.99%的高精度的序列圖(marshallere.1999)。這里包含著兩層意思,第一層也是主要的一層,為了迎接公司方面的挑戰(zhàn),特別是對付像“1emgenomics這類的公司所號稱的將于20XX年測完人類基因組的全部序列(marshalleandpennisie,1998)的“宣戰(zhàn)”;第二層意思則是于20XX年慶賀DnA雙螺旋模型提出50周年。篇二:人類基因組計(jì)劃與生物信息學(xué)之間的關(guān)系人類基因組計(jì)劃與生物信息學(xué)之間的關(guān)系摘要:生物信息學(xué)是20世紀(jì)80年代末隨著人類基因組計(jì)劃啟動(dòng)而興起的一門新的交叉學(xué)科。本文回顧了人類基因組計(jì)劃與生物信息學(xué)的發(fā)展過程,梳理了兩者之間的關(guān)系。1人類基因組計(jì)劃人類基因組計(jì)劃(humangenomeproject,hgp)由美國科學(xué)家RenatoDulbecco于1986年率先提出,旨在闡明人類基因組3×109核苷酸序列,破譯人類全部遺傳信息,使得人類第一次在分子水平上全面認(rèn)識自我。人類基因組研究的主要任務(wù)有兩個(gè):(1)“讀出”人類基因組全部ATcg語言,即全基因組核苷酸順序測定;(2)“讀懂”人類基因組全部ATcg語言,即人類全部基因的編碼及功能的研究[1]。1990年美國首先正式啟動(dòng)“人類基因組計(jì)劃”(hgp),決定在15年內(nèi)提供30億美元的資助,完成人類全部DnA分子核苷酸序列的測定。隨后,英國、法國、日本、加拿大、前蘇聯(lián)、中國等許多國家積極響應(yīng)。1993年馬里蘭州huntValley會(huì)議上經(jīng)美國人類基因組研究中心(chgR)修訂后的hgp內(nèi)容包括:人類基因組作圖(遺傳圖譜、物理圖譜)及序列分析;基因的鑒定;基因組研究技術(shù)的建立、創(chuàng)新與改進(jìn);模式生物(主要包括大腸桿菌、酵母、果蠅、線蟲、小鼠、水稻、擬南芥等)基因組的作圖和測序;信息系統(tǒng)的建立,信息的儲(chǔ)存、處理及相應(yīng)的軟件開發(fā);與人類基因組相關(guān)的倫理、法律和社會(huì)問題的研究;研究人員的培訓(xùn);技術(shù)轉(zhuǎn)讓及產(chǎn)業(yè)開發(fā);研究計(jì)劃的外延等幾方面。hgp計(jì)劃前5年的重點(diǎn)是制作遺傳圖譜和物理圖譜,在此過程中不斷發(fā)展出新的作圖、DnA測序、基因鑒定等實(shí)驗(yàn)技術(shù),使研究速度不斷加快[2]。隨之而來的是信息的爆炸性增長,迫切需要對海量生物信息進(jìn)行處理。20XX年的春天,科學(xué)家公布了人類基因組的絕大部分序列。即:人類基因組的工作草圖,這意味著基因組的研究進(jìn)入信息提取和數(shù)據(jù)分析的嶄新階段。根據(jù)國際數(shù)據(jù)庫的統(tǒng)計(jì)1999年12月DnA堿基數(shù)目為30億,2000年4月DnA堿基數(shù)目是60億,大約每14個(gè)月翻一番。面對如此龐大的數(shù)據(jù)量,只有通過計(jì)算機(jī)才能夠有效地管理和運(yùn)行?;蚪M研究最終是要把生物學(xué)問題轉(zhuǎn)化成對數(shù)字符號的處理問題,要解決這樣的問題就必須發(fā)展新的分析理論、方法、技術(shù)、工具和依賴計(jì)算機(jī)的信息處理[3]。2生物信息學(xué)主要研究內(nèi)容生物信息學(xué)是本世紀(jì)80年代末開始隨著基因組測序數(shù)據(jù)迅猛增加而逐漸興起的一門新興學(xué)科領(lǐng)域,它的核心是基因組信息學(xué)。基因組信息學(xué)作為一個(gè)學(xué)科領(lǐng)域,包括基因組信息的獲取、處理、存儲(chǔ)、分配、分析和解釋?;蚪M信息學(xué)的關(guān)鍵是“讀懂”人類基因組的核苷酸順序,即全部基因在染色體上的確切位置及各DnA片段的功能[4]。它的內(nèi)涵包括:①要發(fā)展有效的能支持大尺度數(shù)據(jù)需要的軟件和數(shù)據(jù)庫;②需產(chǎn)生若干數(shù)據(jù)庫工具,包括電子網(wǎng)絡(luò)等遠(yuǎn)程通訊工具,能容易地處理日益增長的物理圖、遺傳圖、染色體圖和序列信息,并在這些數(shù)據(jù)資料中進(jìn)行比較。③要研究算法和分析技術(shù),用于解釋基因組信息,例如預(yù)測功能基因等。不言而喻,與之相應(yīng)的計(jì)算很多都是大規(guī)模的,有些甚至需要發(fā)展新一代巨型機(jī)才能完成[5]。生物信息學(xué)的另一個(gè)重要任務(wù)是進(jìn)行蛋白質(zhì)、RnA等的結(jié)構(gòu)模擬和分子設(shè)計(jì)以及隨之而來的藥物設(shè)計(jì)。它是一門以知識為基礎(chǔ)的學(xué)科,關(guān)鍵資源是知識,關(guān)鍵技術(shù)是信息處理。這門新興學(xué)科是由生物學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)和計(jì)算機(jī)科學(xué)諸學(xué)科交叉發(fā)展而成的嶄新學(xué)科,是揭示人類及重要?jiǎng)又参锓N類的基因組信息繼而進(jìn)行生物大分子結(jié)構(gòu)模擬和藥物設(shè)計(jì)的基礎(chǔ),為天然生物大分子的改性和基于受體結(jié)構(gòu)的藥物分子設(shè)計(jì)提供依據(jù)。它不僅對認(rèn)識生物體和生物信息的起源、遺傳、發(fā)育與進(jìn)化的本質(zhì)具有重要意義,而且可為人類疾病的診斷和防治開辟全新的途徑,還可為動(dòng)植物的物種改良提供堅(jiān)實(shí)的理論基礎(chǔ)。通過對影響藥物代謝或效應(yīng)通路有關(guān)基因的編碼序列的再測序,有可能揭示個(gè)體對藥物反應(yīng)差別的遺傳學(xué)基礎(chǔ)[6]。2.1序列比對(Alignment)。基本問題是比較兩個(gè)或兩個(gè)以上符號序列的相似性或不相似性。序列比對是生物信息學(xué)的基礎(chǔ),非常重要。兩個(gè)序列的比對有較成熟的動(dòng)態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫的比對軟件包——bLAsT和FAsTA,可以免費(fèi)下載使用。這些軟件在數(shù)據(jù)庫查詢和搜索中有重要的應(yīng)用。有時(shí)兩個(gè)序列總體并不很相似,但某些局部片段相似性較高。smith-waterman算法是解決局部比對的好算法,缺點(diǎn)是速度較慢。兩個(gè)以上序列的多重序列比對目前還缺乏快速而又十分有效的算法。多重序列對比是指三個(gè)以上序列的相似度比較。多重序列對比方法與尋找基因序列的功能區(qū)密切相關(guān),其目的是為了揭示一族功能或進(jìn)化上相關(guān)的序列間的結(jié)構(gòu)相似性。一級多個(gè)序列間的相似性在序列的成對比較中通常無法表現(xiàn)出來。一般來說,把兩個(gè)序列的比較方法用于幾個(gè)序列的比較也是不切實(shí)際的,因?yàn)檫@將需要大量計(jì)算機(jī)內(nèi)存和運(yùn)算時(shí)間。隱馬爾可夫模型近來已用于多重DnA、蛋白質(zhì)序列的比較,并達(dá)到了目前流行的標(biāo)準(zhǔn)方法所取得的準(zhǔn)確率。吉布斯采樣方法也被用來檢測微弱序列信息[7]。2.2結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測,包括2級和3級結(jié)構(gòu)預(yù)測,是最重要的課題之一。從方法學(xué)上來看有演繹法和歸納法兩種途徑。前者主要是從一些基本原理或假設(shè)出發(fā)來預(yù)測和研究蛋白質(zhì)的結(jié)構(gòu)和折疊過程。分子力學(xué)和分子動(dòng)力學(xué)屬于這一范疇。后者主要是從觀察和總結(jié)已知結(jié)構(gòu)的蛋白質(zhì)結(jié)構(gòu)規(guī)律出發(fā)來預(yù)測未知蛋白質(zhì)的結(jié)構(gòu)。同源模建和指認(rèn)(Threading)方法屬于這一范疇。雖然經(jīng)過30余年的努力,蛋白質(zhì)結(jié)構(gòu)預(yù)測研究現(xiàn)狀遠(yuǎn)遠(yuǎn)不能滿足實(shí)際需要。確定大分子結(jié)構(gòu)x射線晶體學(xué)和核磁共振是在原子水平上推導(dǎo)大分子結(jié)構(gòu)的主要方法。兩種方法都產(chǎn)生極大數(shù)量的數(shù)據(jù),這些數(shù)據(jù)的解釋完全依賴于高性能的計(jì)算機(jī)和復(fù)雜的處理算法。綜合多項(xiàng)實(shí)驗(yàn)技術(shù)得到的結(jié)構(gòu)信息是分析結(jié)構(gòu)問題的基礎(chǔ)。實(shí)驗(yàn)數(shù)據(jù)分析的發(fā)展正導(dǎo)致蛋白質(zhì)結(jié)構(gòu)預(yù)測新方法的產(chǎn)生。改進(jìn)后的預(yù)測算法為解決晶體學(xué)中的數(shù)據(jù)分析問題開辟了新的途徑,新的更精細(xì)的蛋白質(zhì)結(jié)構(gòu)使我們能夠更為深入地了解蛋白質(zhì)折疊問題,這是結(jié)構(gòu)預(yù)測的核心[8]。2.3分子進(jìn)化早期的工作主要是利用不同物種中同一種基因序列的異同來研究生物的進(jìn)化,構(gòu)建進(jìn)化樹。既可以用DnA序列也可以用其編碼的氨基酸序列來做,甚至于可通過相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對來研究分子進(jìn)化。以上研究已經(jīng)積累了大量的工作。近年來由于較多模式生物基因組測序任務(wù)的完成,為從整個(gè)基因組的角度來研究分子進(jìn)化提供了條件。序列對比算法確定了兩個(gè)序列的最大匹配路徑,使得一個(gè)序列以最少的變化轉(zhuǎn)變成另一個(gè)序列。研究人員常常構(gòu)建這個(gè)編輯——距離函數(shù)來摸擬序列在自然進(jìn)行過程中發(fā)生的變化。給定進(jìn)化上相關(guān)序列的一組變異距離,可以重建表示序列之間進(jìn)化關(guān)系的進(jìn)化樹。這需要快速、高效,穩(wěn)定、容錯(cuò)的進(jìn)化樹重建算法。目前,這些要求是不相容的,最快的算法不夠穩(wěn)定,而且不能有效利用序列中的信息。近來的發(fā)展產(chǎn)生了推導(dǎo)進(jìn)化樹的新方法,以及評估進(jìn)化樹可靠度的方法,并且增進(jìn)了對方法的總體特性的認(rèn)識[9]。3生物信息學(xué)在人類基因組計(jì)劃中的作用3.1基因組數(shù)據(jù)獲取人類基因組研究的首要目標(biāo)是獲得人的整套遺傳密碼。人的遺傳密碼有32億個(gè)堿基,而早期的DnA測序儀每個(gè)反應(yīng)只能讀取幾百到上千個(gè)堿基。要得到人的全部遺傳密碼首先要把人的基因組打碎,測完一個(gè)個(gè)小段的序列后再把它們重新拼接起來。20XX年初在《自然》、《科學(xué)》兩雜志上公布的人類基因組工作草圖報(bào)道,它含有約29億堿基,其物理圖譜覆蓋率為96%,序列覆蓋率為94%。有大于90%的連續(xù)序列群已大于10萬堿基;有約25%的連續(xù)序列群已等于或大于千萬堿基。在這些序列中發(fā)現(xiàn)了3萬~4萬個(gè)編碼蛋白質(zhì)的基因。在基因組大規(guī)模測序的每一個(gè)環(huán)節(jié)都與信息分析緊密相關(guān)[10]。從測序儀的光密度采樣與分析、堿基讀出、載體標(biāo)識與去除、拼接、填補(bǔ)序列間隙,到重復(fù)序列標(biāo)識、讀框預(yù)測和基因標(biāo)注,每一步都是緊密依賴生物信息學(xué)的軟件和數(shù)據(jù)庫的。其中,序列拼接和填補(bǔ)序列間隙是最為關(guān)鍵的首要難題。其困難不僅來自它巨大的海量數(shù)據(jù),而且在于它含有高度重復(fù)的序列。為此,這一過程特別需要把實(shí)驗(yàn)設(shè)計(jì)和信息分析時(shí)刻聯(lián)系在一起。另一方面,必須按照不同步驟的要求,發(fā)展適當(dāng)?shù)乃惴跋鄳?yīng)的軟件,以應(yīng)對各種復(fù)雜的問題。國際上很多著名的基因組研究中心,都有自己的拼接和組裝策略,并且這樣的工作都是在超級計(jì)算機(jī)上完成的[11]。3.2基因的電腦克隆發(fā)現(xiàn)新基因是當(dāng)前國際上基因組研究的熱點(diǎn),使用生物信息學(xué)的方法是發(fā)現(xiàn)新基因的重要手段。利用esT數(shù)據(jù)庫發(fā)現(xiàn)新基因也被稱為基因的電腦克隆。esT序列是基因表達(dá)的短cDnA序列,它們攜帶著完整基因的某些片段的信息。20XX年10月genbank的esT數(shù)據(jù)庫中人類esT序列已超過380萬條,大約覆蓋了人類基因的,90%以上。我國早在1996年就開始了通過電腦克隆尋找新基因的研究。原理是找到屬于同一基因的所有esT片段,再把它們連接起來。由于esT序列是全世界很多實(shí)驗(yàn)室隨機(jī)產(chǎn)生的,所以屬于同一基因的很多esT序列間必然有大量重復(fù)小片段,利用這些小片段作為標(biāo)志就可以把不同的esT連起來,直到發(fā)現(xiàn)了它們的全長,這樣就可以說通過電腦克隆找到了一個(gè)基因。如果這個(gè)基因以前未曾發(fā)現(xiàn)過,那么就是一個(gè)新基因。但是進(jìn)行電腦克隆程序設(shè)計(jì)是復(fù)雜的,計(jì)算量是巨大的。3.3發(fā)現(xiàn)單核苷酸的多態(tài)性(snp)有的人吸煙喝酒卻長壽,也有人自幼就病痛纏身,同一種治療腫瘤的藥物對一些人非常有效,對另一些人則完全無效,這是他們基因組中存在的差異!這種差異很多表現(xiàn)為單個(gè)堿基上的變異,也就是單核苷酸的多態(tài)性(snp)現(xiàn)在普遍認(rèn)為snp研究是人類基因組計(jì)劃走向應(yīng)用的重要步驟。這主要是因?yàn)閟np將提供一個(gè)強(qiáng)有力的工具,用于高危群體的發(fā)現(xiàn)、疾病相關(guān)基因的鑒定、藥物的設(shè)計(jì)和測試以及生物學(xué)的基礎(chǔ)研究等。snp在基因組中分布相當(dāng)廣泛,近來的研究表明在人類基因組中每300堿基對就出現(xiàn)一次。大量存在的snp位點(diǎn)使人們有機(jī)會(huì)發(fā)現(xiàn)與各種疾病,包括腫瘤相關(guān)的基因組突變。從實(shí)驗(yàn)操作來看,通過snp發(fā)現(xiàn)疾病相關(guān)基因突變要比通過家系來得容易。有些snp并不直接導(dǎo)致疾病基因的表達(dá),但由于它與某些疾病基因相鄰,而成為重要的標(biāo)記。snp在基礎(chǔ)研究中也發(fā)揮了巨大的作用,近年來通過生物信息學(xué)對snp的分析,使得科學(xué)家在人類進(jìn)化、人類種群的演化和遷徙領(lǐng)域取得了一系列重要成果。3.4從功能基因組到系統(tǒng)生物學(xué)在不同的組織中表達(dá)基因的數(shù)目差別是很大的,腦中基因表達(dá)的數(shù)目最多,約有3萬至4萬個(gè)轉(zhuǎn)錄子,有的組織中只有幾十或幾百個(gè)基因表達(dá)。同一組織在不同的個(gè)體生長發(fā)育階段,表達(dá)基因的種類、數(shù)量也是不同的。有些基因是在幼年時(shí)期表達(dá)的,有些是中年階段表達(dá)的,有些要到老年時(shí)期才表達(dá)。我們不僅需要了解基因的序列,還要了解基因的功能,也就是要了解在不同的時(shí)間、不同的組織中基因的表達(dá)譜,這就是通常所說的功能基因組研究。為了得到基因的表達(dá)譜,國際上在核酸和蛋白質(zhì)兩個(gè)層次上都發(fā)展了新技術(shù)。這就是在核酸層次上的基因芯片(或稱DnA芯片)技術(shù)和在蛋白質(zhì)層次上的大規(guī)模蛋白質(zhì)分離和序列鑒定技術(shù),也稱蛋白質(zhì)組技術(shù)。由于芯片上樣品點(diǎn)的密度很大,可以達(dá)到每片幾十萬,因此表達(dá)譜數(shù)據(jù)挖掘和知識發(fā)現(xiàn)就成了該研究成功與否的關(guān)鍵。無論是生物芯片還是蛋白質(zhì)組技術(shù)的發(fā)展,都更強(qiáng)烈地依賴于生物信息學(xué)的理論、技術(shù)與數(shù)據(jù)庫。下一步,功能基因組研究將朝著復(fù)雜系統(tǒng)的方向發(fā)展,即:探討生物系統(tǒng)中各部分、各層次的相互作用,從而進(jìn)入系統(tǒng)生物學(xué)的領(lǐng)域。3.5基于結(jié)構(gòu)的藥物設(shè)計(jì)人類基因組計(jì)劃的目的之一在于闡明人的約10萬種蛋白質(zhì)的編碼序列,從而了解蛋白質(zhì)的結(jié)構(gòu)、功能、相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域。為了抑制某些酶或蛋白質(zhì)的活性,在已知其3級結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對接算法,在計(jì)算機(jī)上設(shè)計(jì)抑制劑分子,作為候選藥物。這種發(fā)現(xiàn)新藥物的方法有強(qiáng)大的生命力,也有著巨大的經(jīng)濟(jì)效益。3.6界面和可視化工具大量復(fù)雜的全基因組數(shù)據(jù)引發(fā)了數(shù)據(jù)可視化描述工具的發(fā)展,在生物信息學(xué)中主要見于:(1)進(jìn)行序列操作和分析的圖形用戶界面,通過便捷的桌面工具進(jìn)行數(shù)據(jù)的瀏覽和與數(shù)據(jù)間的互動(dòng);(2)專門的可視技術(shù),靈活運(yùn)用圖形、顏色和面積等方法對大量的數(shù)據(jù)進(jìn)行描述,最大限度地利用人類的感官對特征和模式進(jìn)行挑選;(3)可視編程,屬于特殊的、高級的、領(lǐng)域?qū)S械挠?jì)算機(jī)語言中的圖形描述算法。雖然已經(jīng)有幾十種綜合的圖形界面用于基因組數(shù)據(jù)的處理,但是它們中有顯著效果的并不多,較多見的是AceDb,它那令人印象深刻的具有生物學(xué)意義的可視界面為它贏得了第一批用戶,現(xiàn)在它與Java合用稱為JADe(/jade)。私人企業(yè)正在致力于應(yīng)用熟練的用戶界面建立綜合的桌面工具包,如DnAsTAR、netgenics、Informax、DoubleTwist和genomia??梢源_定的是,一些用作基因組注釋的系統(tǒng),正在進(jìn)行圖形界面的建設(shè)。除了發(fā)展高度集中的整體系統(tǒng)外,還有一種向“輕量級”的界面組件發(fā)展的趨勢。這種理論促進(jìn)了可重組和可重復(fù)利用的軟件模塊(如多重排列瀏覽器cInemA和其它類似的窗口文件),可以裝配在即插即用的系統(tǒng)內(nèi),迅速地建立新的界面,例如biowidgets系統(tǒng),這個(gè)系統(tǒng)和其它系統(tǒng)一樣執(zhí)行Java,它已經(jīng)產(chǎn)品化,并且貫穿了以coRbA為標(biāo)準(zhǔn)進(jìn)行對象管理的生命科學(xué)研究組(http://www.lsr.ebi.ac.uk)的工作,該系統(tǒng)為通用性的工業(yè)化標(biāo)準(zhǔn)做出了貢獻(xiàn)。3.7相關(guān)軟件(1)DnA序列測序軟件:staden程序包,下載網(wǎng)址:http://www.mrclmb.cam.ac.uk/pubseq/down(:人類基因組計(jì)劃)loads.html。(2)DnA序列分析軟件:Artemis是DnA序列顯示和注釋工具。網(wǎng)址:http://www.sanger.ac.uk/software/Artemis/。genescan是基因判認(rèn)工具。網(wǎng)址:/genscAn.html。(3)pcR和測序所需引物的設(shè)計(jì)程序:primer3。其網(wǎng)址:/cgibin/primer/info.cgi/,也可下載源程序:(/pub/software/)。primer-Design為引物設(shè)計(jì)程序Ftp://ftp.chemie.un-imarburg.de(/pub/primerDesign/)。(4)序列相似性和同源比較:同源比較最常用的軟件是cLusTAL(ftp://ftpigbmc.ustrasbg.fr/pub/clustalw)。相似性比較最常用的軟件是bLAsT(blast/)和FAsTA(http://www2.ebiac.uk/fasta3/)。(5)DnA序列獲取:Retrieve/Retrieve/,通常采用e-mail方法給這兩個(gè)服務(wù)器發(fā)一封帶有特定格式和命令的e-mail(Retrieve@),很快就可收到帶有詳細(xì)查尋結(jié)果的回信。(6)系統(tǒng)進(jìn)化樹構(gòu)建和穩(wěn)定性分析:pYLIp(/phylit.html)megAT()。人類基因組計(jì)劃所有工作都涉及到大量數(shù)據(jù)的處理工作,生物學(xué)已不再是僅僅基于試驗(yàn)觀察的科學(xué),理論和計(jì)算將越來越發(fā)揮巨大的作用。人類基因組計(jì)劃為生物信息學(xué)創(chuàng)造了施展身手的巨大的空間??茖W(xué)家們普遍相信本世紀(jì)是人類基因組研究取得輝煌成果的時(shí)代,也是它創(chuàng)造巨大的經(jīng)濟(jì)效益和社會(huì)效益的時(shí)代。參考文獻(xiàn)[1]蔡立羽,王志中.人類基因組計(jì)劃中的生物信息學(xué)[J].國外醫(yī)學(xué)生物醫(yī)學(xué)工程分冊,1998,21(1):44-47.[2]李晉楠.“人類基因組計(jì)劃”研究進(jìn)展綜述[J].浙江師大學(xué)報(bào)(自然科學(xué)版),1999,22(3):69-72.[3]羅世煒.生物信息學(xué)與人類基因組計(jì)劃[J].生物學(xué)通報(bào),20XX,40(1):13-14.[4]張樹庸.人類基因組計(jì)劃[J].實(shí)驗(yàn)動(dòng)物科學(xué)與管理,20XX,20(2):41-43.篇三:人類基因組計(jì)劃的倫理問題人類基因組計(jì)劃帶來的倫理問題摘要:人類基因組計(jì)劃是從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系,在揭開生命的奧秘的同時(shí),人類基因組計(jì)劃正面臨著隱私權(quán)被侵犯、基因歧視、遺傳檢測、基因資源的商業(yè)化問題等一系列倫理問題,要解決這些問題,必須堅(jiān)持以下倫理原則:尊重自主性原則、不傷害原則、有利原則以及公正原則。關(guān)鍵詞:人類基因組計(jì)劃倫理問題倫理原則人類基因組計(jì)劃(humangenomeproject,hgp)是由美國科學(xué)家于1985年率先提出,于1990年正式啟動(dòng)的。目的是:①鑒定出人類的所有基因;②確定構(gòu)成人類基因組的約30億個(gè)堿基對的序列;③將上述信息儲(chǔ)存于專門的數(shù)據(jù)庫中,并開發(fā)出相應(yīng)的分析工具;④研究由此而產(chǎn)生的倫理、法律和社會(huì)問題并提出相應(yīng)對策。美國、英國、法蘭西共和國、德意志聯(lián)邦共和國、日本和我國科學(xué)家共同參與了這一預(yù)算達(dá)30億美元的人類基因組計(jì)劃。按照這個(gè)計(jì)劃的設(shè)想,在20XX年,要把人體內(nèi)約10萬個(gè)基因的密碼全部解開,同時(shí)繪制出人類基因的譜圖。換句話說,就是要揭開組成人體4萬個(gè)基因的30億個(gè)堿基對的秘密。人類基因組計(jì)劃與曼哈頓原子彈計(jì)劃和阿波羅計(jì)劃并稱為三大科學(xué)計(jì)劃。1998年5月一批科學(xué)家在美國羅克威爾組建塞萊拉遺傳公司,目標(biāo)是投入3億美元,到20XX年繪制出完整的人體基因組圖譜。1999年9月中國獲準(zhǔn)加入人類基因組計(jì)劃,負(fù)責(zé)測定人類基因組全部序列的1%,也就是3號染色體上的3000萬個(gè)堿基對。中國是繼美、英、日、德、法之后第6個(gè)國際人類基因組計(jì)劃參與國,也是參與這一計(jì)劃的惟一發(fā)展中國家。2000年6月26日,人類基因組的科學(xué)家宣布人類基因草圖繪制完畢。在“20XX國際人類基因大會(huì)”上,國際人類基因組組織新任主席佳之認(rèn)為,明年春天“生命天書”的破譯將完成。人類基因組計(jì)劃對人類基因疾病研究有著重要意義。人類疾病相關(guān)的基因是人類基因組中結(jié)構(gòu)和功能完整性至關(guān)重要的信息。對于單基因病,采用“定位克隆”和“定位候選克隆”的全新思路,導(dǎo)致了亨廷頓舞蹈病、遺傳性結(jié)腸癌和乳腺癌等一大批單基因遺傳病致病基因的發(fā)現(xiàn),為這些疾病的基因診斷和基因治療奠定了基礎(chǔ)。對于心血管疾病、腫瘤、糖尿病、神經(jīng)精神類疾?。ɡ夏晷园V呆、精神分裂癥)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點(diǎn)。健康相關(guān)研究是hgp的重要組成部分,1997年相繼提出:“腫瘤基因組解剖計(jì)劃”“環(huán)境基因組學(xué)計(jì)劃”。人類基因組計(jì)劃在醫(yī)學(xué)上的貢獻(xiàn)也越發(fā)重大。基因診斷、基因治療和基于基因組知識的治療、基于基因組信息的疾病預(yù)防、疾病易感基因的識別、風(fēng)險(xiǎn)人群生活方式、環(huán)境因子的干預(yù)等等這些,都是醫(yī)學(xué)水平上基因組計(jì)劃的研究成果體現(xiàn)。然而,事物都具有兩面性。而基因的發(fā)展同時(shí)也帶來了巨大的爭議。人類基因組計(jì)劃開展初期,政治家、媒體甚至廣大民眾對它的看法不約而同都帶有反對色彩。暫且不去討論對于政治家而言有類基因組計(jì)劃到底代表了什么,但對于媒體與民眾而言,我們更關(guān)注的是人類基因組計(jì)劃的倫理性與道德性,而它一開始也成為了道德、倫理、法律、和社會(huì)問題討論的焦點(diǎn)。一、遺傳信息的隱私權(quán)問題人身自由和隱私權(quán)都是人的權(quán)利和尊嚴(yán)的內(nèi)容。那么來源于一個(gè)人的體細(xì)胞或配子細(xì)胞的遺傳信息是否享有同樣的權(quán)利和尊嚴(yán)呢?在倫理學(xué)界,對這一問題的回答基本上是肯定的。人類基因組研究既然可以清楚地了解人體的一切,那么對于每個(gè)個(gè)體來說,便也無秘密可言。自己的身體沒有屬于自己的秘密,這難道不是件可怕的事情嗎?它遭遇著來自社會(huì)、倫理和法律的種種挑戰(zhàn)。人類基因組計(jì)劃一開始就包含著一個(gè)子計(jì)劃,稱為hgp的倫理、法律和社會(huì)含義,目標(biāo)是預(yù)測和考慮人類基因組計(jì)劃對個(gè)人和社會(huì)的含義;考查將人類基因組繪圖和排序的后果。1990年國際人類基因組研究所建立了eLsI研究計(jì)劃。在1990~1996年間,eLsI研究計(jì)劃資助了128個(gè)研究和教育項(xiàng)目,共3259萬美元。研究集中在4個(gè)領(lǐng)域:(1)利用和解釋遺傳信息時(shí)如何保護(hù)隱私和達(dá)到公正;(2)新基因技術(shù)應(yīng)用到臨床時(shí),如何處理知情同意等問題;(3)對于參與基因研究的人類受試者,如何做到知情同意,保護(hù)個(gè)人隱私;(4)公眾和專業(yè)人員的教育。人類基因組計(jì)劃的管理者認(rèn)為,eLsI研究計(jì)劃對hgp的成功與否至關(guān)重要。在談到人類基因組計(jì)劃的倫理問題時(shí),“隱私權(quán)”是使用得較多的一個(gè)詞。雖然有hgp作為參考,但是法律上并沒有明文規(guī)定,于是很多情況下一些問題也便產(chǎn)生:你同意你的基因樣本被獲取研究,那誰該知道這些結(jié)果呢?你有權(quán)知道或不想知道,甚至放棄知道的權(quán)利。但別人呢?你的親屬、朋友、戀人、學(xué)校、工作單位和保險(xiǎn)公司等,他們誰能夠知道?也許你的親屬應(yīng)該知道,因?yàn)樗赡芎湍憔哂型瑯拥闹虏』?,有較高的風(fēng)險(xiǎn)。二、基因組圖譜和信息的使用與人的社會(huì)權(quán)利人類基因組研究將提供更多現(xiàn)在尚不知道的疾病基因,同時(shí)也將提供更多的基因探針,對很多疾病進(jìn)行基因診斷(包括產(chǎn)前和胚胎早期的診斷),特別是對遺傳性疾病。由此不僅會(huì)引發(fā)出上述科學(xué)活動(dòng)與隱私權(quán)的矛盾,也會(huì)引發(fā)出與人們的社會(huì)權(quán)利的矛盾,用于遺傳病治療與研究的基因圖譜若用人單位知道了,如果你存在缺陷基因,在求職時(shí)是否可以以基因缺陷作為理由拒絕
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版電子競技賽事贊助與直播服務(wù)合同4篇
- 2025版智慧農(nóng)業(yè)用地租賃管理合同模板4篇
- 二手房資金監(jiān)管服務(wù)規(guī)范化合同2024版
- 二零二五年度戶外廣告宣傳推廣合同
- 2025年度男女雙方協(xié)議離婚后的財(cái)產(chǎn)分配及子女監(jiān)護(hù)合同3篇
- 2025年度面包烘焙品牌跨界合作訂購合同4篇
- 二零二五年度農(nóng)藥行業(yè)數(shù)據(jù)分析與研究報(bào)告合同
- 二零二五年度影視行業(yè)演員形象代言合同保密條款范本3篇
- 2025年度跨境電商企業(yè)出口貸款合同范本2篇
- 【地理】地圖的選擇和應(yīng)用(分層練) 2024-2025學(xué)年七年級地理上冊同步備課系列(人教版)
- (正式版)CB∕T 4552-2024 船舶行業(yè)企業(yè)安全生產(chǎn)文件編制和管理規(guī)定
- JBT 14588-2023 激光加工鏡頭 (正式版)
- 2024年四川省成都市樹德實(shí)驗(yàn)中學(xué)物理八年級下冊期末質(zhì)量檢測試題含解析
- 九型人格與領(lǐng)導(dǎo)力講義
- 廉潔應(yīng)征承諾書
- 2023年四川省成都市中考物理試卷真題(含答案)
- 泵車述職報(bào)告
- 2024年山西文旅集團(tuán)招聘筆試參考題庫含答案解析
- 恢復(fù)中華人民共和國國籍申請表
- 管理期貨的趨勢跟蹤策略 尋找危機(jī)阿爾法
評論
0/150
提交評論