人類基因組計(jì)劃陳竺典藏版_第1頁
人類基因組計(jì)劃陳竺典藏版_第2頁
人類基因組計(jì)劃陳竺典藏版_第3頁
人類基因組計(jì)劃陳竺典藏版_第4頁
人類基因組計(jì)劃陳竺典藏版_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

歡迎閱讀精彩文章請(qǐng)隨時(shí)關(guān)注我們的最新文章月616日人類基因組計(jì)劃陳竺主講人簡介陳竺:中國科學(xué)院副院長。分子生物學(xué)家。江蘇鎮(zhèn)江人。198年9獲法國巴黎第七大學(xué)博士學(xué)位。上海第二醫(yī)科大學(xué)附屬瑞金醫(yī)院教授、研究員。國家人類基因組南方研究中心主任。上海血液學(xué)研究所所長。內(nèi)容簡介人類基因組這個(gè)研究,第一次在生命科學(xué)里面實(shí)現(xiàn)了整體上的遺傳信息的解析,基因組功能的研究?;蚪M就是一個(gè)生命體的遺傳信息的總和。生命信息的儲(chǔ)存單位,實(shí)際上就是我們說的基因,載體是脫氧核糖核酸在多細(xì)胞的生物里,不同的細(xì)胞之間,由不同的細(xì)胞所組成的組織之間,由不同的組織所形成的器官之間都在發(fā)生信息的流動(dòng)。這個(gè)就是我們所說的:遺傳學(xué)的中心法則?;蚪M就是一個(gè)生命體的遺傳信息的總和。雙螺旋的發(fā)現(xiàn)大概是世紀(jì)生命科學(xué)最最偉大的突破。四種不同的堿基構(gòu)成了紛繁復(fù)雜的遺傳學(xué)語言。實(shí)際上絕大多數(shù)的人類疾病都是多基因控制的。人類基因組計(jì)劃正式啟動(dòng)是199年0,就是要用年的時(shí)間,到 年完成人類基因組 全序列的測(cè)定。到今天為止我們也還沒有這樣的技術(shù),說拿來一條染色體,我們就能直接測(cè)序。所以整個(gè)人類基因組計(jì)劃實(shí)際上就是由復(fù)雜到簡單,再由簡單又回歸復(fù)雜的一個(gè)過程。在人類基因組測(cè)序起步的時(shí)候,當(dāng)時(shí)用的 序列的分析方法是凝膠電泳為主的方法,基本上還是手工運(yùn)作的。但是在世紀(jì)年代以后,新的一個(gè)測(cè)序技術(shù)產(chǎn)生了就是毛細(xì)管電泳儀技術(shù)。使得測(cè)序的速度大大加快。一天就可以有10萬0個(gè)堿基對(duì)的的序列被測(cè)出。中國也加入這一個(gè)測(cè)序計(jì)劃,我們承擔(dān)了1%的任務(wù)。200年04月份,21號(hào)染色體全序列測(cè)序草圖完成了?,F(xiàn)在我們已經(jīng)可以做到在指甲蓋大小的生物芯片上點(diǎn)上人類的基因組,所有的基因都點(diǎn)在上面。將來要去看病,不光要帶病卡,還要帶一個(gè)自己的芯片。醫(yī)生用藥診斷之前,用芯片看看你可能得什么病。通過對(duì)進(jìn)化不同階段的生物體基因組學(xué)的比較,就可以發(fā)現(xiàn)基因組結(jié)構(gòu)組成的功能調(diào)節(jié)的規(guī)律。實(shí)際上人類疾病相關(guān)的基因,也恰恰是人類基因組結(jié)構(gòu)和功能完整性至關(guān)重要的信息。實(shí)際上在過去幾年當(dāng)中,對(duì)疾病的研究早已成為人類基因組研究一個(gè)重要計(jì)劃的組成部分。199年7提出了兩個(gè)計(jì)劃:一個(gè)是腫瘤基因組的解剖計(jì)劃,還有一個(gè)叫環(huán)境基因組計(jì)劃。實(shí)際上都是和健康相關(guān)的。人類基因組計(jì)劃對(duì)醫(yī)學(xué)的貢獻(xiàn),一個(gè)是在診斷方面,另外是在基因治療方面。對(duì)于我們這樣發(fā)展中國家來說,更應(yīng)該注重預(yù)防。我們國家的基因組計(jì)劃,是199年4開始啟動(dòng)的,從功能基因組的角度進(jìn)行切入。采取結(jié)構(gòu)與功能并重,多學(xué)科交叉建立關(guān)鍵技術(shù),進(jìn)行基因組多樣性和疾病基因研究。這是我們一開始的時(shí)候一個(gè)策略。我們可以很自豪的說:現(xiàn)在除了染色體,所有的染色體上面都遍布著中國科學(xué)家發(fā)現(xiàn)和命名的基因。最近我們啟動(dòng)了一個(gè)中華民族基因組 的大規(guī)模的研究。這個(gè)工作從群體遺傳學(xué)轉(zhuǎn)向了,我們中國人群特點(diǎn)的、疾病發(fā)生發(fā)展的遺傳學(xué)信息的研究。所以,如果現(xiàn)在我們能夠把中華民族生命元素變異的系統(tǒng)目錄和數(shù)據(jù)庫做出來的話,就能夠獲得我國生物醫(yī)學(xué)界和制藥工業(yè)界技術(shù)創(chuàng)新的知識(shí)產(chǎn)權(quán)來造福子孫后代來貢獻(xiàn)于全人類。全文當(dāng)然清華是我們國家最高等的學(xué)府之一了。所以,今天到這里來,也有點(diǎn)誠惶誠恐。那么主要是來求教的?,F(xiàn)在我要給大家介紹的人類基因組這個(gè)研究,可以說是第一次,在生命科學(xué)里面,實(shí)現(xiàn)了某種大科學(xué)的概念。也就是說來一個(gè)整體上的遺傳信息的解析,基因組功能的研究。所以我說現(xiàn)在生物學(xué)的特點(diǎn),已經(jīng)從70年代、80年代,主要是以分析為主,學(xué)科的精細(xì)化,分工的細(xì)化,這樣一個(gè)趨勢(shì)到了一個(gè)新的平臺(tái)上面。這個(gè)平臺(tái)就是大綜合,其實(shí)我們中國的科學(xué),一開始就是講究大綜合。你看我們的藝術(shù)也是這樣,我們的寫意畫就是一種大綜合。這個(gè)東西方的融合非常重要,把西方嚴(yán)謹(jǐn)?shù)姆治?,和中國早在幾千年前的大綜合的思路結(jié)合在一起的話,我想有可能帶來一些新的突破的機(jī)遇。那么這張圖我想,恐怕不光是搞生命科學(xué)的,就是我們非生命科學(xué)的同學(xué)們,也都是非常熟悉的,遺傳學(xué)中心法則。我們都知道,生命活動(dòng)它的本質(zhì),它是一個(gè)信息的流動(dòng)。有人一直說,我們都是搞生命科學(xué)的。但是突然有一個(gè)冒出一句話:“什么是生命”?這個(gè)倒可以讓人思索一番。我個(gè)人體會(huì),生命信息它的儲(chǔ)存單位,生命的重要特點(diǎn)之一,它有記憶功能。那么它的儲(chǔ)存的單位,實(shí)際上就是我們說的基因,在絕大部分的生命體我們知道,它的載體是脫氧核糖核酸 但是它的執(zhí)行單位,主要來說是蛋白質(zhì)。這里面它用信息的語言,不是一樣的,一個(gè)是核酸的語言,一個(gè)是氨基酸的語言。所以在這個(gè)空間信息的流動(dòng),需要有一些調(diào)控的機(jī)制。這個(gè)調(diào)控大家知道,第一步就是轉(zhuǎn)錄。這個(gè)時(shí)候生命信息的語言,沒有發(fā)生變化,都是核酸的語言。只是從到了上面,這個(gè)過程我們稱為轉(zhuǎn)錄。然后語言要發(fā)生變化,發(fā)生轉(zhuǎn)換,要求來進(jìn)行翻譯了。所以從 上面的生命語言,變成蛋白質(zhì)的生命語言。當(dāng)然我們知道這個(gè)蛋白質(zhì),很多的蛋白質(zhì)它都具有代謝的活動(dòng)。生命體和非生命體的重要差別之一就是有代謝和新陳代謝,然后蛋白質(zhì)可以形成高級(jí)空間的構(gòu)型。那么在這個(gè)里面,細(xì)胞的不同的部分互相之間作用,細(xì)胞核和細(xì)胞漿互相在作用。然后在多細(xì)胞的生物里,不同的細(xì)胞之間、由不同的細(xì)胞所組成的組織之間、由不同的組織所形成的器官之間都在發(fā)生信息的流動(dòng)。我想這個(gè)就是我們所說的“遺傳學(xué)的中心法則”。那么基因這個(gè)概念,大家都很清楚了或者說基本概念很清楚,確切的定義也許今天還不是非常清楚。那么基因組是什么意思?基因組就是一個(gè)生命體的遺傳信息的總和。那么在這里我們就不是單個(gè)基因,而是所有的基因。它所編碼所有的氨基酸相互之間的這個(gè)關(guān)系,所以感官性是完全不一樣的。雙螺旋結(jié)構(gòu)的發(fā)現(xiàn)大概是世紀(jì)生命科學(xué)最最偉大的突破。那么、、c四種不同的堿基,構(gòu)成了紛繁復(fù)雜的遺傳學(xué)語言,生命信息的最基本的符號(hào)。這個(gè)最基本的符號(hào)實(shí)在是讓我們感到非常簡單。大自然就用這四種簡單的字符,組成了讓我們嘆為觀止的大千世界的無數(shù)生命的多樣性的現(xiàn)象。那么它的遺傳信息,在絕大多數(shù)的生命體,我剛才說的是 的分子。那么它的排列組合在那里就決定了,或者說在相當(dāng)大的程度上決定了生命活動(dòng)在人體,也就是我們講的:生、老、病、死等等這些活動(dòng)。那么我們?cè)谥v雙螺旋結(jié)構(gòu)的時(shí)候,我們都知道,堿基對(duì)、 是生物的大分子。一般來說我們不是用一個(gè)質(zhì)量單位來表示它的體量,而是用它的長度。那么一個(gè),中文叫一個(gè)堿基對(duì)。但是在基因來說,一個(gè)基因常常是要成千上萬個(gè)堿基對(duì)。所以我們引入了“千堿基對(duì)”這樣的尺度。然后再做到基因組的時(shí)候,我們都知道基因組它是非常大的尺度,所以又發(fā)明了一些新的尺度單位,像指的是百萬堿基對(duì)。這個(gè)是基因組計(jì)劃之前的,我們對(duì)人類基因組的一些了解。我們知道人類基因組的長度,一個(gè)單倍體的基因組的長度大概是30億個(gè)堿基對(duì)。一般的教科書上都說,序列當(dāng)中編碼序列,也就是說我們剛才說的,發(fā)生轉(zhuǎn)錄表達(dá)的,可以被稱之為基因的序列。大概實(shí)際上是指成熟的,發(fā)生加工以后的 當(dāng)中的序列,大概小于%。也就是說,非編碼序列占了絕大多數(shù)。在人體細(xì)胞核里面,遺傳信息它是以染色體的方式進(jìn)行組織的,分布于22個(gè)常染色體和2條性染色體。我們都知道以前的生物科學(xué)的特點(diǎn),基本上是師傅帶徒弟、作坊式的操作。那么到了80年代中期的時(shí)候,我想一個(gè)是生命科學(xué)的這個(gè)科學(xué)思維的大大擴(kuò)展,第二個(gè)是技術(shù)的這個(gè)進(jìn)步。比方說當(dāng)時(shí)遺傳工程已經(jīng)非常成熟了,當(dāng)時(shí) 測(cè)序也相對(duì)成熟,然后的技術(shù)在那里開始產(chǎn)生了。因此使得科學(xué)家們,生命科學(xué)家們的雄心壯志,在那里萌發(fā)了,決心要沖破原來的這種作坊式的被物理學(xué)界甚至化學(xué)界不太看得起的那種運(yùn)作方式,搞一點(diǎn)可以稱為是大科學(xué)的東西。當(dāng)然我想科學(xué)研究的條件,思維這是一個(gè)方面。但是實(shí)際上回顧一下科學(xué)史的話,很多重大的事件它還是需求在那里拉動(dòng)的。我們有的科學(xué)家批評(píng)這樣的做法,意思是說我們要注意把基礎(chǔ)研究和社會(huì)重大需求結(jié)合在一起。我覺得實(shí)際上這有點(diǎn)失之偏頗的,就是說有各種各樣類型的研究:有的是一種自由的探索,那么這個(gè)可以非常小心,一個(gè)人的腦瓜里都可以產(chǎn)生諾貝爾獎(jiǎng)的構(gòu)思。但是也有一些研究的確是希望能夠造福人類的。但是這樣的研究提出的挑戰(zhàn),實(shí)際上又可以孕育著不知道多少人的諾貝爾獎(jiǎng)的思想在里面。那么人類基因組計(jì)劃,就是這樣一個(gè)典型。我們看第一份,可以認(rèn)為是正式的標(biāo)書。我們做這個(gè)課題,一般來說首先要有標(biāo)書。那么人類基因組計(jì)劃的第一個(gè)標(biāo)書,可以被認(rèn)為是諾貝爾獎(jiǎng)獲得者 年發(fā)表在《科學(xué)》雜志的一篇短文。它的這個(gè)短文的題目是什么呢?《腫瘤研究的轉(zhuǎn)折點(diǎn)——人類基因組研究》。事實(shí)上我們知道美國有一位雄心勃勃的年輕總統(tǒng)肯尼迪上臺(tái)以后,當(dāng)時(shí)他在科學(xué)上有兩大計(jì)劃:一個(gè)是實(shí)現(xiàn)人類登月,還有一個(gè)戰(zhàn)勝癌癥。那么人類登月隨著阿波羅計(jì)劃的比較順利地實(shí)施,196年9人類實(shí)現(xiàn)了登月。但是攻克腫瘤的計(jì)劃是一個(gè)失敗的。為什么?原來科學(xué)家把問題想得太簡單了,以為腫瘤就是一兩個(gè)基因的問題。但實(shí)際上絕大多數(shù)的腫瘤,都是多基因的問題。它涉及的面是整個(gè)基因組的問題,是遺傳信息的整體上面紊亂的這樣一些問題。就是剛才講的,我們不要以為好像一個(gè)融合基因打到小鼠里面去,就足以引起一個(gè)白血病,不是那么簡單的。因?yàn)槿绻菢拥脑挘阋淮蜻M(jìn)去就要產(chǎn)生白血病,事實(shí)上我們羅拉白血病,在受精卵里面注射進(jìn)這個(gè)融合基因以后,需要等待一年的時(shí)間才會(huì)出現(xiàn)白血病而且不是每一個(gè)小時(shí)都會(huì)發(fā)生白血病。所以就提示有其他的決定因素在里面。我們現(xiàn)在知道有時(shí)候幾個(gè)基因一起傳染的時(shí)候,它發(fā)生白血病的速率就會(huì)大大加快。這個(gè)文章它就說,如果我們想更多地了解腫瘤,我們從現(xiàn)在開始必須關(guān)注細(xì)胞的基因組。從哪那個(gè)物種著手努力?如果我們想理解人類腫瘤,那就應(yīng)該從人類開始。人類腫瘤研究將因?qū)?的詳細(xì)知識(shí)而得到巨大的推動(dòng)。實(shí)際上絕大多數(shù)的人類疾病都是多基因的。人類基因組計(jì)劃正式起動(dòng),現(xiàn)在一般的說法是199年0。那么199年0因?yàn)槭敲绹鴩鴷?huì)通過了正式啟動(dòng)這樣一個(gè)計(jì)劃。這個(gè)計(jì)劃雄心勃勃就是要用年的時(shí)間,到年完成的全序列的測(cè)定。這個(gè)投資量是多少呢?30億美元。當(dāng)時(shí)計(jì)算的依據(jù)是測(cè)一個(gè)堿基對(duì)大概需要一美元。整個(gè)計(jì)劃在這個(gè)地方實(shí)際上是一個(gè)比較狹義的一個(gè)計(jì)劃,這個(gè)計(jì)劃實(shí)際上就是一個(gè)測(cè)序計(jì)劃。實(shí)際上我們講測(cè)序,讀出天書只是理解人類自身的第一步,最重要的是讀懂天書。但是即使是這樣讀出天書一個(gè)計(jì)劃的話,它也要經(jīng)歷很多的磨難,很多的困難。也就是說,到今天為止,我們還沒有這樣的技術(shù)說,拿來一條染色體,我們就能夠直接測(cè)序,從一頭測(cè)到另外一頭我們沒有辦法這樣做。所以整個(gè)人類基因組計(jì)劃,實(shí)際上可以簡單地說就是由復(fù)雜到簡單再由簡單又回歸復(fù)雜,最后大概還是回歸到簡單。也就是說把不能直接測(cè)序的一條染色體拿來給它進(jìn)行分解,分解成比較小的可以操作的這樣的單位。那么怎么分解呢?那就是作圖,你可以用遺傳學(xué)的方法去作圖,也可以用物理學(xué)的方法來作圖。我們知道遺傳學(xué)作圖,就是利用遺傳學(xué)的標(biāo)志來確定標(biāo)志間相對(duì)的距離。另外一個(gè)概念就是說要構(gòu)成一些所謂的 連續(xù)的克隆系,那么這些片斷,它互相之間重疊,它可以覆蓋整個(gè)的染色體,從一端覆蓋到另外一端。這樣就把一個(gè)不能直接拿來測(cè)序的單位,就給它解析成比較小的、可以操作的這樣一個(gè)單位。最后給它重新組合成忠實(shí)于原來染色體里面生命信息這個(gè)排列的,這樣一個(gè)狀況在這里面,識(shí)別全部的人類基因。所以人類基因組就是作圖,或者狹義的人類基因組計(jì)劃,就是作圖的計(jì)劃,遺傳圖、物理圖、序列圖,然后基因圖。在人類基因組計(jì)劃進(jìn)行大規(guī)模測(cè)序的策略有兩種,一種就是我剛才說的那種思路,實(shí)際上叫逐個(gè)克隆。我剛才說了,你把 克隆的連續(xù)克隆系建起來了,覆蓋整條染色體了,然后你就把一個(gè)一個(gè)的克隆,用得最多的就是叫 ——細(xì)菌的人工染色體,大概 多個(gè)這樣的長度。那么把這個(gè)克隆一個(gè)一個(gè)挑出來,挑出來以后再進(jìn)行亞克隆。這種亞克隆就是這樣的,就可以測(cè)序了,測(cè)序以后再給它組裝起來、還原起來。這樣一個(gè)策略,是國際上公共領(lǐng)域的測(cè)序計(jì)劃所采取的策略。實(shí)際上它是歷史的沿革,就是說從作圖,遺傳、物理作圖演化過來的。我們都知道美國的瑟拉爾公司,也知道奎克曼特。那么它搞了一個(gè)叫全基因組鳥槍法,在一定作圖信息基礎(chǔ)上,繞過大片段連續(xù)克隆系統(tǒng)的構(gòu)建而直接將基因組分解成小片段隨機(jī)測(cè)序,然后利用超級(jí)計(jì)算機(jī)來進(jìn)行組裝。能夠使得人類基因組,在初步完成作圖以后,很快地邁入到測(cè)序,尤其是大規(guī)模測(cè)序。并且使得整個(gè)進(jìn)度朝向人們的預(yù)期。這里面有兩個(gè)重大因素的貢獻(xiàn),不得不承認(rèn)這里面,工業(yè)界的貢獻(xiàn)是非常大的。比如說在人類基因組起步的時(shí)候,當(dāng)時(shí)用的這個(gè) 序列的分析方法,還是凝膠電泳儀為主的方法,基本上還是手工運(yùn)作的。但是在20世紀(jì)90年代上半段的時(shí)間里面,新的一個(gè)測(cè)序技術(shù)出現(xiàn)了,毛細(xì)管電泳儀。另外把自動(dòng)化的運(yùn)作和包括工業(yè)界的管理這種系統(tǒng),都引進(jìn)來。所以使得測(cè)序的速度大大加快。你像這樣一個(gè)測(cè)試儀,它的名字就叫做 什么意思?就是毛細(xì)管電泳,它差不多兩小時(shí)就可以進(jìn)行讀出一個(gè)序列,大概能夠讀到幾百個(gè)堿基,那么它一天可以做十班,那么它是道,所以一天可以做 道。每一道按照他們的宣傳,都可以達(dá)到一個(gè)的話,實(shí)際上是很難做到的,這是最理想的狀態(tài)下。所以一天就可以有10萬0個(gè)堿基對(duì)的產(chǎn)出。但是曾經(jīng)使學(xué)術(shù)界感覺比較困惑的另外一個(gè)問題,就是說如果我們現(xiàn)在處于一個(gè)知識(shí)爆炸的這樣一個(gè)時(shí)代,可以說生物信息的爆炸,是最最給人印象深刻的。我們看在基因組計(jì)劃起步之前,在公共數(shù)據(jù)庫里邊 序列增長非常緩慢。然后年以后,就是指數(shù)增長期。而且這個(gè)東西我是統(tǒng)計(jì)到去年、200年0兩家世界的公共領(lǐng)域,測(cè)序計(jì)劃和瑟拉爾分別宣布完成了所謂的工作草圖。這個(gè)時(shí)候是這樣一個(gè)情況,現(xiàn)在大概是這樣的情況。199年9當(dāng)時(shí)面對(duì)著瑟拉爾的強(qiáng)行挑戰(zhàn),它是199年8成立的,號(hào)稱三年要拿下人類基因組,國際人類基因組計(jì)劃決定迎接挑戰(zhàn)。就由國際上16個(gè)組,分擔(dān)了人類基因組測(cè)序的任務(wù),中國也加入這樣一個(gè)測(cè)序計(jì)劃。當(dāng)然我們承擔(dān)的是1%的任務(wù),1%還是很重要的。因?yàn)閷?duì)于一個(gè)發(fā)展中的國家來說,能夠擠入到這種屬于發(fā)達(dá)國家的俱樂部里面,應(yīng)該說還是很不容易的。有些事情我們想擠也不一定擠得進(jìn)去的,像空間站的計(jì)劃,人家還防范你。在這里我想介紹一下什么叫工作框架圖?因?yàn)槎荚谡f工作框架圖,什么叫工作框架圖?其實(shí)就是一個(gè)工作草圖。那么它的意思呢?就是說通過對(duì)染色體位置明確的 (細(xì)菌人工染色體)連續(xù)克隆系4—5倍覆蓋率的測(cè)序,獲得基因組9%0以上的基因序列,其錯(cuò)誤率應(yīng)該低于1%。也就是說你的覆蓋面要達(dá)到基因組的9%0以上。第二個(gè)呢,錯(cuò)誤率應(yīng)該低于1%。10個(gè)0堿基對(duì)立面允許你有一個(gè)以下的堿基對(duì)的錯(cuò)誤。雖然這只是一張草圖,但是它已經(jīng)有用途,就是對(duì)基因組結(jié)構(gòu)的基本認(rèn)識(shí),基因的識(shí)別和解析、疾病基因的定位克隆、單個(gè)核苷酸的多態(tài)性的發(fā)現(xiàn)等。那么講到草圖就一定有一個(gè)最終完成圖了,所以這張圖的定義,要求測(cè)序所用的克隆能忠實(shí)地代表常染色質(zhì)的基因組結(jié)構(gòu),覆蓋率要達(dá)到99%.以9上,然后序列的錯(cuò)誤率應(yīng)該低于萬分之一。與工作框架圖的關(guān)系呢,實(shí)際上就是在工作框架圖的基礎(chǔ)上再加大測(cè)序的覆蓋率,填補(bǔ)空隙,使得序列的精度增加,能夠達(dá)到這樣一個(gè)標(biāo)準(zhǔn)。也就是說,它是草圖的下一步。200年06月25號(hào),當(dāng)時(shí)的測(cè)序的情況是怎么樣的呢?我們看當(dāng)時(shí)在公共領(lǐng)域就是說各國政府支持的六各國家,美國、英國、德國、日本、法國、中國,六國政府支持的公共領(lǐng)域的計(jì)劃,當(dāng)時(shí)是覆蓋了大概人類基因組的86.%8。其中包含一部分已經(jīng)完成,就是我們剛才說的最終序列圖這樣標(biāo)準(zhǔn)的序列大概是20%多一點(diǎn)點(diǎn),然后66%左右的序列處于所謂的工作草圖這樣的階段。那么也可以說,還沒有完成。因?yàn)槲覀冋f要達(dá)到90%以上,但是同時(shí)瑟拉爾他號(hào)稱他的覆蓋率已經(jīng)超過了95%。當(dāng)然他的覆蓋率其實(shí)包括了所有的公共領(lǐng)域的這個(gè)貢獻(xiàn),再加上他的貢獻(xiàn),所以兩者相加起來。我想我們應(yīng)該相信大概90%以上的序列,都是被工作草圖以上的這樣一個(gè)序列的質(zhì)量所覆蓋著。我們看看公共領(lǐng)域測(cè)序計(jì)劃當(dāng)時(shí)的情況,在2條染色體上分布的情況。我們知道,實(shí)際上199年912月份,22號(hào)染色體作為人類最小的染色體之一,它的全序列被測(cè)定,或者說是它的常染色體,指部分的全序列。我們注意到它的短臂這個(gè)地方,就是易染色體區(qū)域,實(shí)際上非常難測(cè)。因?yàn)槎际谴罅康目招蛄?,又沒有多少基因。200年04月份21號(hào)染色體全序列完成了,也是同樣的定義,就是說常染色體的這個(gè)部分。我們看這里是用深紅的顏色來表示,差不多就是最終完成的。而這種黃顏色表示的是我們剛才說的工作草圖,在大部分染色體區(qū)域,是工作草圖部分。實(shí)際上現(xiàn)在我們講的,完成人類基因組全序列的測(cè)定,都是指的常染色體部分,所以有的人說也許人類基因組序列永遠(yuǎn)也不能被結(jié)束。2年020月115日,我們知道公共領(lǐng)域在《自然》上,都是有一種分庭抗禮的,兵對(duì)兵、將對(duì)將的感覺。2月16號(hào)就登了瑟拉爾序列,顯然,經(jīng)過新的一輪角逐,比200年06月份的時(shí)候,完成序列的質(zhì)量又要高得很多。所以這樣的話,應(yīng)該認(rèn)為,兩家加在一起的信息,應(yīng)該說比我剛才說的一般的定義又要進(jìn)一步了。所以就產(chǎn)生了一個(gè)在工作草圖和最終完成圖之間的一個(gè)中間狀態(tài),這個(gè)中間狀態(tài)就叫做高質(zhì)量的草圖。但是就是這樣一個(gè)高質(zhì)量的草圖,讓我們已經(jīng)基本上知道我人體生命信息的家當(dāng)?shù)降子卸啻?。弄到最后我們發(fā)現(xiàn)我們的家當(dāng)好像還是比較可憐的,比我們?cè)瓉淼南胂瘢驗(yàn)槲覀兊幕驍?shù)量大概只有線蟲,只有90多0個(gè)細(xì)胞的一個(gè)生命體的大概一倍左右,我們就比那么一個(gè)小蟲多一倍。從低等生物到高等生物它的基因組的復(fù)雜度,與其說是由基因的數(shù)量來決定的,還不如說更主要的是由基因的長度來決定的。我們最近完成了一個(gè)細(xì)菌的測(cè)序,叫鉤端螺旋體,可以引起傳染病的。它平均一個(gè)就有一個(gè)基因,這么小的一個(gè)東西, 萬個(gè)堿基對(duì)的一個(gè)基因組,有 個(gè)基因。我們?nèi)?0億個(gè)堿基對(duì),我們不過就3萬個(gè),頂多接近4萬個(gè)這樣一個(gè)數(shù)字。但是你看到了酵母,到了真核細(xì)胞的話,那它就是平均大概到個(gè)一個(gè)基因。然后到了果蠅的話,雖然它的基因數(shù)量好像還沒有線蟲的多。但是它的基因長度已經(jīng)達(dá)到個(gè)以上,然后到了哺乳類一個(gè)基因,大概像人類現(xiàn)在是 多個(gè)才有一個(gè)基因。所以替換、剪接這種可能性就大大增加了。另外跟時(shí)間和空間,也就是發(fā)育階段和組織特異性表達(dá)的調(diào)控相關(guān)這些序列復(fù)雜大大增加了。雖然基因在高等生物可以達(dá)到十的五次方數(shù)量級(jí),幾萬到十萬個(gè)這樣的比較高等的生物。但是實(shí)際上它的蛋白質(zhì)的結(jié)構(gòu)域,實(shí)際上如果把基因組比成一個(gè)大廈的話,組成這個(gè)大廈的預(yù)制件,這個(gè)數(shù)量實(shí)際上是比較有限的。那么另外有一些高級(jí)生物中有更為豐富的結(jié)構(gòu)域組合,神經(jīng)功能、組織特異發(fā)育、調(diào)控、止血和免疫系統(tǒng)的基因,在脊椎動(dòng)物大量擴(kuò)展。數(shù)以百計(jì)的人類基因源于脊椎動(dòng)物進(jìn)化過程中某個(gè)時(shí)間點(diǎn)上,細(xì)菌基因的橫向轉(zhuǎn)移。基因組在不同個(gè)體之間差異很大——單核苷酸多態(tài)性,單倍體的基因差異為1/12,能5夠?qū)е碌鞍踪|(zhì)變異的不到1%。這本遺傳天書,已經(jīng)放在我們面前了,接下來就是要讀懂它。要讀懂它,一定要從大的系統(tǒng)的概念來考慮怎么樣讀懂。一個(gè)這個(gè)基因組的信息,和外界的環(huán)境,是在那里相互作用。另外這個(gè)基因組的信息不是從天上掉下來的,它是通過一個(gè)漫長的幾十億年進(jìn)化的過程發(fā)展過來的,所以要用比較的方法去讀它。另外要考慮到在個(gè)體之間和群體之間又是有變異的,這種變異也受到外界環(huán)境的一些調(diào)節(jié)。所以功能基因組學(xué)的研究內(nèi)容,雖然現(xiàn)在沒有一個(gè)嚴(yán)格的定義,但是我個(gè)人認(rèn)為,至少包括這幾個(gè)方面:人類基因組 序列變異性研究,其核心的內(nèi)容是 N因?yàn)檫@是最常見的變異類型,當(dāng)然還有很多其他的變異。然后基因組表達(dá)調(diào)控的研究,這個(gè)是發(fā)育階段組織器官的變異,然后模式生物體的研究,這個(gè)里面包括進(jìn)化的意思,和利用模式生物進(jìn)行功能研究。當(dāng)然從事所有這些研究,就像我們進(jìn)行測(cè)序研究一樣。生物信息學(xué),它既是一個(gè)基本的工具,又是一個(gè)新興的學(xué)科。因?yàn)樽詈笠堰@些信息整合起來,搞成一個(gè)我們所說的,系統(tǒng)生物學(xué)的話,你一定要用理論的手段,和大規(guī)模信息處理的手段。那么基因組序列變異性的研究,,這種變異類型實(shí)際上是所有基因組的共同特征。它在相當(dāng)大的程度上決定了不同的個(gè)體群體,這個(gè)是指的人類在疾病的易感性,對(duì)環(huán)境致病因子反應(yīng)性和其他性狀上面的差別。在這里我舉一個(gè)例子,說明這個(gè)性狀有多么重要。我們就來看一看,我們對(duì)藥物的反應(yīng)性。我想我們每一個(gè)人、再健康的人,一生當(dāng)中總要接觸一些藥物的?,F(xiàn)在有一個(gè)新的提法叫藥物遺傳學(xué),指的是大部分藥物,在體內(nèi)代謝的酶會(huì)有遺傳多態(tài)性。像這里,一類是改變基團(tuán)的一些酶,一類是對(duì)基團(tuán)進(jìn)行轉(zhuǎn)移的一些酶。它都有很多的多態(tài)性,這種多態(tài)性的后果是什么呢?它在相當(dāng)大的程度上決定了我們個(gè)體對(duì)藥物的反應(yīng)性。比方說這是一個(gè)很復(fù)雜的程序,但是我想我們主要的信息在這個(gè)地方。對(duì)于某一個(gè)藥物來說,最適合它的基因型的,它的療效可以達(dá)到7%5,毒性只有1%。同樣一個(gè)藥,如果到了一個(gè)最不適合它的一個(gè)個(gè)體的情況是怎么樣?它的療效只有1%0,毒性大于8%0。那么基因組表達(dá)以及表達(dá)的調(diào)控的這個(gè)研究,這個(gè)我想都可以理解。那么指的是在全細(xì)胞的水平,如果是在單細(xì)胞的生命體是整個(gè)生命體的水平,識(shí)別基因組的所有轉(zhuǎn)錄表達(dá)的產(chǎn)物。實(shí)際上它是高通量的結(jié)構(gòu)生物學(xué),大批量解析蛋白質(zhì)的高級(jí)結(jié)構(gòu),是連接基因組功能研究和新藥開發(fā)研究的橋梁。然后為了在這樣大的規(guī)模上,在整體水平上獲得功能信息,需要一些所謂的并行化的分析手段。就是現(xiàn)在已經(jīng)做得到在指甲蓋大小的生物芯片上點(diǎn)上人類的基因組,所有的基因都點(diǎn)在上面。所以有人說將來要去看病不光要帶病卡,還要帶一個(gè)自己的芯片。醫(yī)生用藥診斷之前先把芯片插進(jìn)去,看看你可能得什么病,說起來很好,也很嚇人的。模式生物體的研究一般的說法大概從單細(xì)胞、第一個(gè)生命跟外界隔絕以后,到現(xiàn)在的萬物之靈的人類,大概是14億年的進(jìn)化史。那么通過進(jìn)化不同階段的生物體基因組序列的比較,發(fā)現(xiàn)基因組結(jié)構(gòu)組成和功能調(diào)節(jié)的規(guī)律。那么基因組計(jì)劃,我剛才說一個(gè)是科學(xué)興趣使然,科學(xué)家要探索人類的自身,另外也是社會(huì)驅(qū)動(dòng)使然,就是說要戰(zhàn)勝人類的疾病。所以最后它的價(jià)值的實(shí)現(xiàn),我想還是應(yīng)該回歸到對(duì)人類的健康的貢獻(xiàn)上面去。那么在這個(gè)意義上說,人類疾病相關(guān)的基因是人類基因組中結(jié)構(gòu)和功能完整性至關(guān)重要的信息。我們看到過去的十年當(dāng)中,由于人類基因組研究的帶動(dòng),使得人類疾病相關(guān)性的研究有了長足的進(jìn)步。單基因疾病由于定位克隆和定位候選克隆的新思路,導(dǎo)致了一大批遺傳病基因的發(fā)現(xiàn)。我們知道傳統(tǒng)的對(duì)基因的認(rèn)識(shí),是從表型到基因型。也就是你知道一個(gè)蛋白質(zhì),你測(cè)定了它的氨基酸的序列,然后根據(jù)密碼址的原理,你推測(cè)它的 的序列可能是什么。你合成一個(gè)探針到基因組當(dāng)中一調(diào),把基因調(diào)出來。比方說血紅蛋白病,這是第一個(gè)人類發(fā)現(xiàn)的分子病,它就是先知道了豬蛋白氨基酸的序列,然后再把它的基因調(diào)出來。但是絕大多數(shù)的人類疾病,我們不知道它的生化基礎(chǔ)是什么東西,特別是在基因組計(jì)劃之前。比方說像亨氏舞蹈病,我們就知道這個(gè)人會(huì)手舞足蹈,叫亨氏舞蹈病。比方說像遺傳性的結(jié)腸癌,我們知道大腸部位大容易長息肉,但是我們不知道那個(gè)蛋白質(zhì)出了問題。你怎么辦?怎么來找到它的疾病基因?所以有了一個(gè)新的概念,叫反過來的遺傳學(xué),是什么呢?先去找它的基因,然后再去看它的表型。一旦拿到基因以后,很容易你馬上可以推測(cè)它的蛋白質(zhì)的結(jié)構(gòu)。你可以產(chǎn)生抗體,你可以接下來做很多基因的功能。健康相關(guān)的研究是 的重要組成部分, 年相繼提出:腫瘤基因組的解剖計(jì)劃,環(huán)境基因組計(jì)劃。人類基因組計(jì)劃對(duì)醫(yī)學(xué)的貢獻(xiàn)?;?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論