第三章基因組的結(jié)構(gòu)與功能

上傳人：溫*** IP屬地：境外上傳時間：2023-10-17 格式：PPT 頁數(shù)：229 大?。?9.39MB 積分：50 舉報 版權(quán)申訴

已閱讀5頁，還剩224頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章基因組的結(jié)構(gòu)與功能問題1.什么是基因組？不同物種基因組的組成、結(jié)構(gòu)和功能有何不同？2.什么是基因組計劃？基因組計劃應(yīng)用了哪些遺傳學(xué)原理？3.后基因組時代的遺傳研究方法和領(lǐng)域有哪些？4.討論：4.1基因組信息是否應(yīng)該公開？4.2你對基因組的起源和進(jìn)化有何認(rèn)識？第一節(jié)

基因組概論基因組研究的關(guān)鍵問題是它到底含有多少基因。我們可以從4個水平來考察基因的總數(shù)目，而這4個水平對應(yīng)于基因表達(dá)的4個連續(xù)過程：基因組（genome）轉(zhuǎn)錄組（transcriptome）蛋白質(zhì)組（proteome）蛋白質(zhì)組合體一基因組概念基因組概念基因組genome真核生物中單倍體細(xì)胞中所含的整套染色體。一個物種的單倍體染色體組所含有的一整套基因。整套染色體所包含的DNA分子以及DNA分子所攜帶的全部遺傳指令?；蚪M概念基因組genome細(xì)胞中所有遺傳物質(zhì)（通常是DNA）的總和，包括基因序列和基因間序列。每種生物都攜帶特定的基因組序列，基因組包含了構(gòu)成和維持該生物體生命形式與生命活動所需的全部遺傳信息。DNA基因組RNA基因組核基因組線粒體基因組葉綠體基因組基因組學(xué)

genomics病毒是非細(xì)胞型的微生物，結(jié)構(gòu)簡單，體積微小，只含有一種類型的核酸（DNA或RNA），缺乏完整的酶和能量系統(tǒng)，依靠自身的核酸指導(dǎo)和利用活細(xì)胞宿主的合成裝置進(jìn)行復(fù)制和表達(dá)。病毒基因組的大部分是用來編碼蛋白質(zhì)的，只有非常小的一份不被翻譯二病毒基因組流感的啟示……流行時間發(fā)源地流行病毒流行地區(qū)死亡人數(shù)1918年-1919年美國/法國H1N1三元重組病毒全球全球4000萬-1億25%美國人感染1957年中國H2N2二元重組病毒全球全球100萬（美國6.98萬）1968年香港H3N2二元重組病毒全球美國3.38萬SARS和甲型H1N1流行時間發(fā)源地流行病毒流行地區(qū)病死率2003年中國H5N1高致病性禽流感亞洲61%2009年北美H1N1三元重組病毒全球1.22%兩個問題：為什么如此猖狂和可怖的流感病毒不能像天花病毒一樣被“消滅”？為什么不能通過接種疫苗進(jìn)行有效的預(yù)防？為什么每一次大流行的流感病毒的類型都不一樣？解答頻繁爆發(fā)的流感流行

流感病毒基因組—

結(jié)構(gòu)RNA病毒，編碼兩類蛋白質(zhì)：核蛋白（RNA聚合酶和核衣殼蛋白）和表面蛋白；按照核蛋白分類：甲、乙、丙型流感；按照表面蛋白分亞型（H&N）：

H為血凝素抗原(Haemagglutinin)，幫助病毒粘住和進(jìn)入細(xì)胞，然后進(jìn)行復(fù)制,H至少有15種亞型，其中H5和H7的致病性最高。N為神經(jīng)氨酸抗原(Neuraminidase)，進(jìn)入宿主細(xì)胞后控制細(xì)胞裂解，使病毒在宿主體內(nèi)自由傳播，有9種亞型。解答頻繁爆發(fā)的流感流行

流感病毒基因組—

變異1）基因重組

由于流感病毒的基因序列是以獨立的片段存在于病毒體內(nèi)，因此當(dāng)不同病毒感染同一宿主細(xì)胞時，容易發(fā)生染色體的交換和重組，發(fā)生變異。（H1N1*H5N1;H1N1*H1N2）。2）抗原漂變

RNA病毒基因組中沒有復(fù)制校正系統(tǒng)，因此基因組的突變壓力較小，流感病毒隨時有進(jìn)一步突變的可能。流感病毒基因組測序的發(fā)現(xiàn)2009年3月起源于墨西哥和美國的甲型H1N1流感，為A型流感病毒，屬于H1N1亞型流感病毒毒株。H1N1為單股RNA病毒，基因組13.6kb，含8個獨立的基因片段，分別編碼RNA聚合酶PB1，聚合酶PA，PB1-F2和PB2，基質(zhì)蛋白M1和M2，非結(jié)構(gòu)蛋白NS1和2，核衣殼蛋白NP，凝血酶素HA和神經(jīng)氨酸NA。PB1來自人的H3N2PB2和PA來自于禽的H5N1HA,NP和NS來自北美豬的H1N1；NA和MP來自歐洲豬的H1N1新H1N1毒株基因重組認(rèn)識病毒基因組的重大意義１）臨床疫情診斷２）分子流行病學(xué)研究３）合理科學(xué)的防治監(jiān)控４）制備有效的抗病毒疫苗

病毒基因組6類：雙鏈DNA病毒基因組單鏈DNA病毒基因組正鏈RNA病毒基因組負(fù)鏈RNA病毒基因組雙鏈RNA病毒基因組反轉(zhuǎn)錄病毒基因組病毒基因組－1雙鏈DNA病毒基因組雙鏈線狀：皰疹病毒，痘病毒，虹彩病毒，腺病毒特殊結(jié)構(gòu)：皰疹病毒，虹彩病毒有末端冗余序列，可自5’端外切，產(chǎn)生粘末端并形成環(huán)狀；腺病毒有末端反向重復(fù)序列，可形成柄環(huán)狀分子。復(fù)制表達(dá)：利用宿主核內(nèi)依賴DNA的RNA聚合酶轉(zhuǎn)錄早期mRNA；再在細(xì)胞質(zhì)的核糖體上翻譯早期蛋白，以合成子代DNA分子；以子代DNA分子為模板，轉(zhuǎn)錄晚期mRNA；再在核糖體上翻譯病毒結(jié)構(gòu)蛋白。（半保留復(fù)制）病毒基因組－2單鏈DNA病毒基因組動物DNA病毒中的細(xì)小病毒科特殊結(jié)構(gòu)：5’端和3’端均有回文序列，可形成發(fā)夾結(jié)構(gòu)；能產(chǎn)生兩種不同極性的單鏈DNA，或正或負(fù)的同種病毒能夠退火形成雙鏈DNA。復(fù)制表達(dá)：依賴宿主DNA聚合酶。如：Φχ174噬菌體Φχ174是一種小噬菌體，含有一個環(huán)狀單鏈DNA分子，稱為正鏈，感染宿主細(xì)胞后，先復(fù)制形成負(fù)鏈從而形成雙鏈復(fù)制型（RF）DNA分子，其后進(jìn)行復(fù)制直到20－50個左右的RF，然后以RF為模板合成正鏈φχ174分子。＋＋－＋－＋病毒基因組－3正鏈RNA病毒基因組均為線狀分子，具mRNA活性。復(fù)制表達(dá)：黃病毒科，小RNA病毒科以+RNA為模板合成-RNA，再以-RNA合成新+RNA的。SARS冠狀病毒SARScoronavirus

包膜蛋白膜蛋白核衣殼蛋白刺突蛋白

病毒RNA聚合酶

單股正鏈RNA、不分節(jié)段，

5′端有甲基化帽，

3′端有poly(A)結(jié)構(gòu)。

脊髓灰質(zhì)炎病毒、鼻病毒、多數(shù)RNA噬菌體、冠狀病毒病毒基因組－4負(fù)鏈RNA病毒基因組有包膜，如，副黏病毒科，正黏病毒科。絲狀病毒科含有依賴RNA的RNA聚合酶。復(fù)制表達(dá)：在酶的作用下，首先轉(zhuǎn)錄出互補(bǔ)的+RNA，形成復(fù)制型RNA，再以其正鏈RNA為模板，轉(zhuǎn)錄出互補(bǔ)的子代-RNA,同時翻譯出病毒結(jié)構(gòu)蛋白和酶。.

禽流感病毒(H5N1)

avianinfluenzaAvirus8節(jié)段-ssRNA血凝素（HA）神經(jīng)氨酸酶（N)病毒基因組－5雙鏈RNA病毒基因組如呼腸弧病毒科在依賴RNA的RNA聚合酶的作用下轉(zhuǎn)錄mRNA，再翻譯蛋白質(zhì)。復(fù)制表達(dá)：負(fù)鏈復(fù)制出正鏈，正鏈再復(fù)制出新負(fù)鏈，其子代RNA全部為新合成的RNA。病毒基因組－6反轉(zhuǎn)錄病毒基因組反轉(zhuǎn)錄病毒科反轉(zhuǎn)錄病毒為正鏈RNA病毒，無mRNA的翻譯模板活性，缺少侵染性。需在逆轉(zhuǎn)錄酶的作用下首先將RNA轉(zhuǎn)變?yōu)閏DNA，新合成的cDNA環(huán)化后整合插入宿主的核DNA中，隨宿主DNA復(fù)制、轉(zhuǎn)錄、翻譯達(dá)到擴(kuò)增目的的一類病毒。有三個基本的結(jié)構(gòu)基因

白血病病毒、肉瘤病毒、

人類免疫缺陷病毒

5′端有甲基化帽，3′端有poly(A)，

另有多個基因表達(dá)調(diào)控位點。三個結(jié)構(gòu)蛋白基因：gag-編碼病毒衣殼、基質(zhì)等結(jié)構(gòu)蛋白的基因；pol-編碼逆轉(zhuǎn)錄酶(p66/p55)、蛋白水解酶和整合酶；env-編碼gpl20和gp41兩種包膜糖蛋白。有的逆轉(zhuǎn)錄病毒還帶有癌基因（onc），即有的逆轉(zhuǎn)錄病毒有致癌作用。反轉(zhuǎn)錄病毒基因組的結(jié)構(gòu)與功能HIV

艾滋病，既獲得性免疫缺陷綜合癥（AIDS），是由人類免疫缺陷病毒（HIV）引起的一種免疫缺陷性疾病。到2002年6月底全球已有6000萬人感染了HIV，其中2000萬人已被艾滋病奪去生命，艾滋病正已每天1.4萬人受感染的速度擴(kuò)大流行，目前該病尚無法治愈，也無有效疫苗。截止到2003底我國HIV感染者已近84萬，進(jìn)入了快速增長期。

2009-8-6：據(jù)英國廣播公司BBC報道，美國科學(xué)家們宣布HIV病毒的基因組結(jié)構(gòu)已經(jīng)被完全破解。這項研究的成果已經(jīng)被刊登在《自然》雜志上，供人們進(jìn)一步審視潛藏在HIV病毒內(nèi)部的信息。HIV可以分為HIV-1及HIV-2。歐美白人的愛滋病毒大多屬於HIV-1；非洲黑人以HIV-2占大多數(shù)。HIV-1的基因組共有9718nt，與其它逆轉(zhuǎn)錄病毒不同，除了通常的gag，pol和env基因外，基因組中還存在6個其它基因，這些基因都比較小，分別通過一組經(jīng)過剪切的mRNA表達(dá)，從而使HIV對被感染細(xì)胞比其它逆轉(zhuǎn)錄病毒具有更強(qiáng)的損傷。病毒基因組中特征序列的結(jié)構(gòu)與功能重疊基因（overlappinggene）：共有同一段DNA序列的兩個或多個基因稱為重疊基因。末端豐余（terminalredundancy）：又叫末端冗余，也稱為末端同向重復(fù)序列。循環(huán)排列（circularpermutation）：指一些病毒基因組的線狀雙鏈DNA具有相同的基因順序，但若以不同的核苷酸為起點進(jìn)行排列，可以產(chǎn)生末端序列互不相同的線狀分子?；匚男蛄校╬alindrome，；palindromicsequence）、粘性末端（stickyend，cohesiveend，cohesiveterminus），帽子和poly（A）LTR（longterminalrepeat）一般反轉(zhuǎn)錄病毒的原病毒DNA都是由兩個主要部分組成的，即長度達(dá)數(shù)千堿基對的中間區(qū)，及其兩側(cè)的長末端重復(fù)序列(longterminalrepeats，LTR)。這兩段5’-LTR和3’-LTR各長數(shù)百個堿基對，呈同向排列，它是由病毒RNA分子5’-末端的r-u5序列和3’-末端的u3-r序列結(jié)合而成的。所以原病毒DNA的長度超過了它的病毒RNA鏈。5’-LTR含有轉(zhuǎn)錄起始信號，使整個基因組轉(zhuǎn)錄成一個全長的RNA分子；而3’-LTR則含有一個使病毒RNA轉(zhuǎn)錄為多聚腺苷酸化的信號。反轉(zhuǎn)錄病毒的DNA插入宿主細(xì)胞染色體時，在5’LTR的U3左端和3’端LTR的U5右端各丟失2bp，而在宿主染色體插入位點上生成4～6bp的重復(fù)序列。反轉(zhuǎn)錄病毒的DNA基因組整合在宿主染色體上的位點是隨機(jī)的。每個受感染的細(xì)胞一般有1～10份前病毒拷貝。反轉(zhuǎn)錄病毒DNA的整合是復(fù)制病毒RNA的必經(jīng)階段。只有當(dāng)受感染細(xì)胞處于細(xì)胞分裂期間，反轉(zhuǎn)錄病毒DNA基因組才能接觸到宿主細(xì)胞的遺傳物質(zhì)。因此，反轉(zhuǎn)錄病毒只能在分裂中的細(xì)胞內(nèi)復(fù)制。原病毒的整合作用與噬菌體DNA的不同。噬菌體DNA整合的結(jié)果，它的DNA序列既沒有喪失也沒有增多；而原病毒在整合過程中，其末端序列有少量的喪失，又有大片段的LTRDNA的重復(fù)，發(fā)生了微妙重排，但它的遺傳信息量即編碼區(qū)序列并沒有喪失。整合在寄主細(xì)胞染色體DNA上的原病毒基因組DNA，其兩端的LTR序列，都是由一個稱為U3-R-U5組件盒的特殊結(jié)構(gòu)組成的。LTR序列事實上是一種完整的調(diào)節(jié)區(qū)，含有反轉(zhuǎn)錄病毒DNA基因組表達(dá)活性所需要的全部調(diào)節(jié)元件。原病毒DNA的表達(dá)與腫瘤的誘發(fā)有的逆轉(zhuǎn)錄病毒還帶有癌基因（onc），即有的逆轉(zhuǎn)錄病毒有致癌作用。

細(xì)胞的轉(zhuǎn)化是一種叫做onc的腫瘤基因引起的。在勞斯肉瘤病毒RNA基因組中，這個額外的腫瘤式基因叫做src，它能使RSV感染的動物誘發(fā)產(chǎn)生肉瘤。

自然界中還有另一類不具備復(fù)制能力的反轉(zhuǎn)錄病毒。它的DNA中有一段大的缺失，是由細(xì)胞DNA序列所取代。當(dāng)這類復(fù)制缺陷的反轉(zhuǎn)錄病毒同具有復(fù)制能力的病毒混合培養(yǎng)時，由于后者提供了它所缺少的蛋白質(zhì)和酶分子，因此也能夠進(jìn)行增殖。我們稱這種能夠給缺陷性載體病毒提供產(chǎn)瘤特性的細(xì)胞DNA序列叫做腫瘤基因。現(xiàn)已鑒定出大量的細(xì)胞基因，移放到反轉(zhuǎn)錄病毒基因組上，就表現(xiàn)出腫瘤基因的功能。這些事實說明，反轉(zhuǎn)錄病毒的基因組能夠承載真核基因組DNA，而且獲得這類DNA序列的缺陷性病毒，通過輔助病毒的互補(bǔ)作用，便能正常地增殖。這種特性是發(fā)展反轉(zhuǎn)錄病毒作為基因克隆載體的重要依據(jù)。反轉(zhuǎn)錄病毒－基因載體缺失編碼病毒外殼蛋白基因的逆轉(zhuǎn)錄病毒，去感染某種含有輔助病毒的細(xì)胞株（合成蛋白外殼，但缺失了識別蛋白外殼進(jìn)行包裝的信號，因此它不能包裝成病毒顆粒），逆轉(zhuǎn)錄病毒的RNA進(jìn)入輔助病毒的外殼蛋白，成為病毒顆粒，把受感染的細(xì)胞同骨髓細(xì)胞一起培養(yǎng)，包裝在輔助病毒外殼蛋白中的逆轉(zhuǎn)錄病毒RNA，進(jìn)入骨髓細(xì)胞，病毒DNA插入宿主細(xì)胞基因組，基因的活性得到表達(dá)。由于骨髓細(xì)胞里面沒有輔助病毒，所以整合進(jìn)宿主基因組的逆轉(zhuǎn)錄病毒，不再有外殼蛋白可供包裝，因此也就無法增殖，而只能被“陷”在宿主基因組中，通過細(xì)胞分裂而傳給下一代子細(xì)胞問題反轉(zhuǎn)錄病毒的整合作用與噬菌體DNA整合有何不同？請解釋U3-R-U5組件盒及其功能。三原核生物基因組細(xì)菌染色體DNA質(zhì)粒DNA以大腸桿菌（Escherichiacoli）為例類核（nucleoid）：細(xì)菌染色體在

細(xì)胞內(nèi)形成的一個致密區(qū)域大腸桿菌細(xì)胞結(jié)構(gòu)nucleoid質(zhì)粒plasmid大腸桿菌染色體結(jié)構(gòu)

蛋白質(zhì)核心超螺旋DNA環(huán)

由一條環(huán)狀雙鏈DNA分子組成，

通常只有一個DNA復(fù)制起點。C-Value:4.6×106bp大腸桿菌染色體DNA大腸桿菌4000K3000K2000K1000K0OriCTerC(二)結(jié)構(gòu)基因大多組成操縱子乳糖操縱子

lacoperontayz

opstructural

genepromoterterminatoroperator?-galactosidase半乳糖苷酶z?-galactosidepermease半乳糖苷透過酶y

?-galactosidetransacetylase半乳糖苷乙酰轉(zhuǎn)移酶a

多個功能相關(guān)的結(jié)構(gòu)基因成簇串聯(lián)排列，與上游共同的調(diào)控區(qū)和下游轉(zhuǎn)錄終止信號組成的基因表達(dá)單位。操縱子operon:其它結(jié)構(gòu)特點

值：4,639,221bp基因數(shù)：4288基因大?。?50bp/gene基因間隔：118bp/２gene1.基因密度非常高，編碼區(qū)在

基因組中所占比例大；2.結(jié)構(gòu)基因沒有內(nèi)含子，多為

單拷貝，rRNA基因為多拷貝；3.重復(fù)序列很少，重復(fù)片段為

轉(zhuǎn)座子；

50kb四真核生物基因組染色體DNA線粒體DNA真核生物基因組組裝方式異染色質(zhì)：堿性染料染色時著色較深的染色質(zhì)組分組成型異染色質(zhì)：所有細(xì)胞中均有的一種持久性結(jié)構(gòu)，不含任何基因，總是保持致密的組成狀態(tài)。除復(fù)制期以外，在整個細(xì)胞周期均處于聚縮狀態(tài)，形成多個染色中心，如著絲粒和端粒、Y染色體大部分區(qū)域兼性異染色質(zhì)：非持久性的異染色質(zhì)，在某些細(xì)胞類型或一定的發(fā)育階段,原來的常染色質(zhì)聚縮,并喪失基因轉(zhuǎn)錄活性,變?yōu)楫惾旧|(zhì)，異染色質(zhì)化可能是關(guān)閉基因活性的一種途徑異染色質(zhì)結(jié)構(gòu)緊密，使控制基因表達(dá)的蛋白無法接近常染色質(zhì)：指間期核內(nèi)染色質(zhì)纖維折疊壓縮程度低,處于伸展?fàn)顟B(tài),用堿性染料染色時著色淺的那些染色質(zhì)。常染色質(zhì)狀態(tài)只是基因轉(zhuǎn)錄的必要條件而非充分條件

核型（karyotype）：即細(xì)胞分裂中期染色體按照大小與著絲粒的位置依次排列，組成的每種生物特有的染色體組圖像帶型（bandingpattern）：某些染料與中期染色體特異性結(jié)合使染色體不同部位產(chǎn)生著色差異。Q帶：喹丫因染色G帶：溫和蛋白酶處理后吉姆薩染色。右G帶圖顯示，深著色區(qū)與淺著色區(qū)相間分布，表明染色質(zhì)的組成是非均一性R帶：加熱的堿性溶液處理人類基因組23對染色體，約30億對核苷酸，編碼4約萬個基因，攜帶了有關(guān)人類個體生長發(fā)育、生老病死的全部遺傳信息。第二節(jié)基因組結(jié)構(gòu)一、基因組大?。海▎伪扼w）基因組的DNA總量是活生物的一個重要特征，我們稱它為C值（C-value），即一個單倍體基因組的全部DNA含量從小于106bp的支原體到大于1011bp的植物和兩棲動物，不同生物的C值變化很大。對于特定物種，C值是恒定的。圖3.5概括了不同門類生物的C值變化范圍。隨著生物復(fù)雜度的增加，最小基因組的大小也隨著增加，但當(dāng)高等真核生物的DNA總量增加時，我們看到其中一些生物門類的基因組大小也有廣泛的變化。圖3.6繪出了每一門類中的一個成員所需要的最小DNA總量，它暗示了組成較復(fù)雜的原核生物和較低等的真核生物所需要的最小基因組大小。酵母的基因組約為1.3X107bp,并不比最大的細(xì)菌基因組大多少。因此，成為真核生物并不意味著基因組要比原核生物的要大很多。圖3.7列出了一些最普遍應(yīng)用的模式生物的基因組。圖中可以看出隨著生物復(fù)雜性的增加，基因組的大小也穩(wěn)定增加。但從兩棲類之后的高等生物，基因組的大小與生物形態(tài)上的復(fù)雜性就沒有必然的聯(lián)系了。C值悖論在每一種生物中其單倍體基因組的DNA總量是特異的，被稱為C值（CValue）。生物的C值（或基因組大?。┎⒉慌c生物復(fù)雜程度相關(guān)的現(xiàn)象稱作C值悖論。例如如變形蟲的C值是人的200倍。爪蟾的基因組大小與人類相同。為什么自然選擇會允許這種變化，這種變化是否對它們的進(jìn)化產(chǎn)生影響？我們知道基因要比編碼蛋白質(zhì)所需要的序列大許多，因為外顯子（編碼區(qū)域）只是基因全長的一小部分，這就解釋了為什么需要更多的DNA，用來為有機(jī)體的所有蛋白質(zhì)提供讀框。斷裂基因的大部分序列可能跟蛋白質(zhì)編碼沒關(guān)系，而且在基因之間可能也有相當(dāng)長的非編碼區(qū)域。因此，不可能從基因組總的大小來推斷基因的數(shù)目。通過分析古細(xì)菌和獨立生存的最小細(xì)菌的基因組，我們鑒定能獨立生活的細(xì)胞所需要的最小基因數(shù)目。最小的古細(xì)菌基因組約有1500條基因。具有最小基因組并獨立生活的細(xì)菌是喜溫生物Aquifexaeolicus，它有1.5Mb大小的基因組和1512條基因；一種“典型”的革蘭氏陰性細(xì)菌流感嗜血桿菌有1743條基因，每條基因的大小約為900bp。由此，我們得出這樣一個結(jié)論：構(gòu)成一個獨立生活的生物所必需的基因約為1500條。我們觀察真核生物的基因組，我們發(fā)現(xiàn)基因組的大小與基因數(shù)目之間的相關(guān)性喪失了。單細(xì)胞真核生物的基因組與最大的細(xì)菌基因組的大小差不多，高等真核生物有更多的基因，但是它們的基因數(shù)目與它們的基因組大小是不對稱的，這一點可以從圖3.12中看出。G值悖論物種的基因數(shù)與其復(fù)雜性也沒有明顯的相關(guān)性，稱為G值悖論。例如，人和擬南芥的基因數(shù)分別是30,000和25,000。由于一些基因以多拷貝形式存在，或者與其他基因是同源的，所以不同種類的基因數(shù)目小于物種的總體基因數(shù)目。我們能夠把物種的基因分成許多小類，每一類的基因是相關(guān)的，這可以通過比較它們的外顯子而得出?；蚍N類的數(shù)目通常是基因家族數(shù)目加上獨特基因數(shù)目而推算出來的。如果每一條基因都表達(dá)，那么基因總數(shù)將與組成有機(jī)體所需要的蛋白質(zhì)總數(shù)是對等的。但是，兩個方面的原因使得蛋白質(zhì)總數(shù)與基因總數(shù)是不同的：由于基因是多拷貝的，一些基因編碼相同的蛋白質(zhì)，還有一些編碼相關(guān)蛋白質(zhì)，這些相關(guān)蛋白質(zhì)也是在不同時期或不同位置起相同作用；另外由于一些基因可以通過可變剪接產(chǎn)生多種蛋白質(zhì)，因此，蛋白質(zhì)總數(shù)可能比基因總數(shù)要大得多。有多少基因是所有物種（或群體或真核生物等）所共有的呢？又有多少事某一物種所特有的呢？圖3.17對酵母，線蟲和果蠅的基因組進(jìn)行了比較，在不同物種中，編碼功能相同的蛋白質(zhì)的基因稱為直向同源基因（ortholog）。為方便，如果在兩個不同物種中兩條基因的序列相似性達(dá)80%以上，我們就認(rèn)為它們是編碼相同功能的蛋白質(zhì)。用這個規(guī)則去衡量，約20%的果蠅基因在酵母和線蟲中存在直向同源基因，這些基因也許是所有真核生物所需要的。如果對果蠅和線蟲進(jìn)行比較，我們會發(fā)現(xiàn)多達(dá)30%的基因?qū)儆谥毕蛲椿?，這些多出的10%的基因也許是多細(xì)胞動物所共有的。這使得剩下的大部分編碼蛋白質(zhì)的基因分別是果蠅或線蟲所特有的基因。MCB,Figure4-17,圖解人類基因組核苷酸序列的結(jié)構(gòu)組成

二、基因組組成相關(guān)概念人類基因組3000Mb基因外序列2100Mb基因和基因相關(guān)序列900Mb編碼序列90Mb非編碼序列810Mb假基因內(nèi)含子前導(dǎo)區(qū)，尾區(qū)重復(fù)序列420Mb單拷貝和低拷貝序列1680Mb串聯(lián)重復(fù)散在重復(fù)衛(wèi)星DNA微衛(wèi)星DNA小衛(wèi)星DNALTR元件SINELINEDNA轉(zhuǎn)座子人類22號染色體A)48Mb,全基因組的1.5%；B)長臂部分取1/10放大10倍，大約包括40個基因；C)B圖繼續(xù)放大10倍，可見四個基因；D)一個基因的完整序列：包括上游調(diào)控元件，外顯子和內(nèi)含子等；可以成功地轉(zhuǎn)譯出一個有功能的蛋白。一段基因序列的基本組成：外顯子和內(nèi)含子，開放閱讀框，啟動子，CpG島斷裂基因被內(nèi)含子間隔的基因序列，真核生物絕大多數(shù)基因的表現(xiàn)形式。1978年Gilbert創(chuàng)立了內(nèi)含子(intron)和外顯子(exon)兩個名詞，內(nèi)含子是指在成熟的mRNA中不出現(xiàn)的序列，而外顯子是指在成熟的mRNA中出現(xiàn)的編碼序列。發(fā)現(xiàn)歷史：法國科學(xué)家Chambon：雞的輸卵管細(xì)胞和紅細(xì)胞的Southern雜交試驗。1977年美國的Sharp和Roberts同時發(fā)現(xiàn)了內(nèi)含子，提出了斷裂基因的概念。Splitgene1978年Gilbort創(chuàng)用了內(nèi)含子(intro)和外顯子(exon)兩個名詞。內(nèi)含子是指在成熟的mRNA中不出現(xiàn)的序列Exon是指在成熟的mRNA中出現(xiàn)的編碼序列。ORF開放閱讀框（OpenReadingFrame）：位于起始密碼子ATG與終止密碼子（TAA,TAG,TGA）之間，被翻譯成蛋白質(zhì)的遺傳序列。前導(dǎo)片段和后隨片段：ORF上、下游的非編碼序列?！瓕τ谌魏谓o定的核酸序列（單鏈DNA或mRNA），根據(jù)密碼子的起始位置，可以按照三種方式進(jìn)行解釋。例如，序列ATTCGATCGCAA這三種閱讀順序稱為閱讀框（readingframes）CAAAATTCGATCGATTCGATCGCAAATTCGATCGCA（1）（3）（2）一個開放閱讀框（ORF,openreadingframe）是一個沒有終止編碼的密碼子序列。Promoter啟動子（promoter）：基因序列上游專一地與RNA聚合酶結(jié)合,啟動轉(zhuǎn)錄的DNA元件，決定轉(zhuǎn)錄的起始位置和效率。具有一定的保守序列，受到多種轉(zhuǎn)錄因子的調(diào)節(jié)。核心啟動子元件（TATA盒，BRE序列，Inr序列，DPE序列）和上游啟動子元件（CAAT盒和GC盒、以及距轉(zhuǎn)錄起始點更遠(yuǎn)的上游元件）CpGislandCpG島：CpG島是指哺乳類生物基因組中長度為0.5～4kb的一段富含CpG二核苷酸成分的DNA序列,幾乎都位于基因的啟動子區(qū)。CG含量高于基因組平均水平，一般大于50%。哺乳類基因組中至少一半基因的啟動子區(qū)存在CpG島，篩查CpG島對識別基因序列有重要意義。CpG島的甲基化水平是調(diào)控基因表達(dá)的重要因素之一。甲基化只發(fā)生在CpG二核苷酸中的胞嘧啶。因為DNA的甲基化可改變?nèi)旧|(zhì)的結(jié)構(gòu),從而引起不同DNA結(jié)合蛋白的結(jié)合。增強(qiáng)子（enhancer）：通過啟動子來提高轉(zhuǎn)錄效率的一種遠(yuǎn)端遺傳性調(diào)控元件。也有核心結(jié)構(gòu)，但沒有固定的位置和方向性。沉寂子（silencer）：不受距離和方向限制的負(fù)調(diào)控元件，參與時空特異性基因的表達(dá)關(guān)閉。絕緣子（insulator）：絕緣子本身對基因的表達(dá)既沒有正效應(yīng)，也沒有負(fù)效應(yīng)，其作用只是不讓其他調(diào)控元件對基因的活化效應(yīng)或失活效應(yīng)發(fā)生作用。帽子結(jié)構(gòu)是指在真核生物中轉(zhuǎn)錄后修飾形成的成熟mRNA在5'端的一個特殊結(jié)構(gòu)，即m7GpppN結(jié)構(gòu)，又稱為甲基鳥苷帽子。它是在RNA三磷酸酶，mRNA鳥苷酰轉(zhuǎn)移酶，mRNA（鳥嘌呤-7）甲基轉(zhuǎn)移酶和mRNA（核苷-2’）甲基轉(zhuǎn)移酶催化形成的。mRNA的帽結(jié)構(gòu)功能：①能被核糖體小亞基識別，促使mRNA和核糖體的結(jié)合；②m7Gppp結(jié)構(gòu)能有效地封閉RNA5’末端，以保護(hù)mRNA免疫5’核酸外切酶的降解，增強(qiáng)mRNA的穩(wěn)定基因簇基因家族基因超家族假基因重疊基因轉(zhuǎn)座基因基因座（Locus）基因在染色體上所處的位置。每個特定的基因在染色體上都有其特定的座位。功能相近且緊密連鎖的一組基因?；虼貎?nèi)的基因序列和功能都高度一致。如核糖體RNA基因，組蛋白編碼基因。基因簇（Genecluster）人的四種組蛋白分子，共有60個編碼基因，分布在7條染色體上，序列高度保守，在6號染色體短臂有兩個集中的基因簇。每個基因簇都含有多拷貝的各組蛋白編碼基因。基因家族Genefamily

序列高度相似但不一定完全相同的重復(fù)基因。通常以基因簇的方式存在，也可以散在在不同的染色體上。如人的珠蛋白基因。α-globinβ-globin基因超家族Genesuperfamily

基因的同源度較低，但在功能上具有明顯的相關(guān)性。如免疫球蛋白家族。假基因pseudogene又稱擬基因，基因組中與有功能的基因相似，失去編碼功能的DNA序列。根據(jù)形成方式的不同可以分為兩種類型：

常規(guī)假基因(conventional/classicalpseudogene):

通常是在基因組進(jìn)化過程中功能基因復(fù)制后發(fā)生突變產(chǎn)生的失活產(chǎn)物。

已加工假基因(processedpseudogene):

通常來自功能基因的RNA轉(zhuǎn)錄產(chǎn)物反轉(zhuǎn)錄成DNA后重新插入（隨機(jī)地）到基因組中。Conventionalpseudogene常規(guī)假基因以人的珠蛋白為例：珠蛋白是研究基因組進(jìn)化的良好模型。動物中原始的攜氧分子是150aa的單鏈，50億年前出現(xiàn)了α和β鏈基因的分化，β鏈進(jìn)一步復(fù)制和進(jìn)化出胎兒特異的珠蛋白基因。爪蟾中珠蛋白基因簇僅有一個，而鳥類和哺乳動物中珠蛋白基因簇分布于兩條染色體上。在復(fù)制進(jìn)化的過程中，α-珠蛋白和β-珠蛋白的基因簇內(nèi)還產(chǎn)生了至少一個假基因。它們同樣是在進(jìn)化中由復(fù)制產(chǎn)生，序列和正?；驇缀跬耆恢?，但因為突變?nèi)鄙賳幼硬荒苷１磉_(dá)或者表達(dá)的蛋白產(chǎn)物沒有活性。Processedpseudogene已加工假基因

來自功能基因的RNA轉(zhuǎn)錄產(chǎn)物。mRNA的反轉(zhuǎn)錄為cDNA后再次插入基因組，形成一個新的基因拷貝。這個基因拷貝通常不含有啟動子序列和內(nèi)含子，而保留了polyA和polyT的尾巴。由于沒有啟動子不能正常轉(zhuǎn)錄和表達(dá)，成為假基因。插入位點是隨機(jī)的，因此這類假基因通常散在地分布在基因組中。如一些tRNA和rRNA的編碼基因。重疊基因overlappinggene指兩個或兩個以上的基因共有一段DNA序列，或者是一段DNA序列成為兩個或兩個以上基因的組成部分。重疊基因首先是在噬菌體ΦΧ174中發(fā)現(xiàn)的。病毒，細(xì)菌，果蠅，擬南芥和人中都有重疊基因的發(fā)現(xiàn)。

人的NF1基因（I型神經(jīng)纖維瘤）的第26個內(nèi)含子中包含了三個獨立轉(zhuǎn)譯的基因序列。三、基因組中的重復(fù)序列單一序列和重復(fù)序列

單一序列：基因組中只有一份的DNA序列。包括大多數(shù)編碼蛋白質(zhì)的結(jié)構(gòu)基因和基因間間隔序列。重復(fù)序列：基因組中重復(fù)出現(xiàn)的序列。分為串聯(lián)重復(fù)序列(tandemlyrepeatedDNA)和散在重復(fù)序列(interspreadrepetitiveDNA)，人基因組中重復(fù)序列占全基因組的50%以上。高度重復(fù)序列：重復(fù)次數(shù)>10萬，如衛(wèi)星DNA(satelliteDNA)，多位于染色體的末端和著絲粒部位，也有散在分布的，大多不可轉(zhuǎn)錄。中度重復(fù)序列：長約300bp,一般10-幾千個拷貝。如散在重復(fù)DNA，通常散在分布于各個染色體上。多數(shù)中度重復(fù)序列屬于轉(zhuǎn)座元件。（SINES和LINEs）輕度重復(fù)序列：在基因組中含有2-10拷貝，如珠蛋白基因，生長激素基因等。串聯(lián)重復(fù)序列——衛(wèi)星DNA染色體著絲粒端粒附近中度重復(fù)序列：①長散在重復(fù)序列LINESlonginterspersedrepeatedsegments

長度>1000bp(可達(dá)7Kb),拷貝數(shù)104-105，如人LINE1②短散在重復(fù)序列SINESshortinterspersedrepeatedsegments

長度<500bp，拷貝數(shù)>105．如人Alu序列散在重復(fù)序列的產(chǎn)生機(jī)制一定和串聯(lián)重復(fù)序列不同，后者可以通過復(fù)制中的滑移或重組產(chǎn)生，而前者依賴于轉(zhuǎn)座事件。生物基因組中極為分散的重復(fù)序列往往仍然保留了轉(zhuǎn)座的活性。在人類的基因組中有一種中等重復(fù)序列，長約

300bp

，在其

170bp

處有一個限制性酶AluI

的酶切位點，故稱這個重復(fù)序列為

Alu

基因家族（

Alufamily），大約平均每隔

6Kb

左右就有一個

Alu

序列，因此它可能含在內(nèi)含子或基因附近的序列中。因此它可作為人類

DNA

片段的特異標(biāo)記。Alu基因重復(fù)片段全長6.1kb。兩側(cè)同樣有正向重復(fù)序列，內(nèi)部含有兩個開放閱讀框ORF1和ORF2。ORF1編碼一個分子量約40kD的蛋白，而ORF2編碼蛋白內(nèi)部含有反轉(zhuǎn)錄酶結(jié)構(gòu)域和內(nèi)切酶結(jié)構(gòu)域。5’端含有一段內(nèi)部啟動子序列，而3’端含有(A)n/(T)n序列。人基因組內(nèi)LINE-1的拷貝數(shù)達(dá)到100,000-500,000左右，但全長重復(fù)序列很少，通常缺失5’UTR序列。功能不清。LINE-1的轉(zhuǎn)座活性——Nature460,1127-1131(27August2009)L1retrotranspositioninhumanneuralprogenitorcellsLINE-1藍(lán)色：tandemrepeats;著絲粒和染色體末端；黑色：interspersedrepeats；散在分布；重復(fù)序列第三節(jié)

人類基因組計劃10年完成草圖（1990-2000）14年完成全部測序（1990-2003）美國，英國，德國，法國，日本和中國六個國家的科研機(jī)構(gòu)參與其中。美國地區(qū)的總開銷為3,452.9百萬美元。

遺傳圖譜基因圖譜

序列圖譜物理圖譜人類基因組的四張圖還包括對五種生物基因組的研究：大腸桿菌、酵母、線蟲、果蠅和小鼠，稱之為人類的五種“模式生物”。

HGP的主要任務(wù)

遺傳圖：采用遺傳學(xué)分析方法將基因或其它DNA順序標(biāo)定在染色體上構(gòu)建連鎖圖。這一方法包括雜交實驗，家系分析。遺傳圖距單位為厘摩(cM),每單位厘摩定義為1%交換率。物理圖：采用分子生物學(xué)技術(shù)直接將DNA分子標(biāo)記、基因或克隆標(biāo)定在基因組實際位置。物理圖的距離依作圖方法而異，如輻射雜種（radiationhybrid）作圖的計算單位為厘鐳(cR),限制性片段作圖與克隆作圖的圖距為DNA的分子長度，即堿基對(bp,kb)。第一代分子遺傳標(biāo)記——RFLPsRestrictionFragmentLengthPolymorphism

限制性片段長度多態(tài)性第二代分子遺傳標(biāo)記——SSLPsSimplesequencelengthpolymorphism

簡單序列長度多態(tài)性第三代分子遺傳標(biāo)記——SNPsSinglenucleotidepolymorphism

單核苷酸多態(tài)物理作圖的分類1）限制性作圖（Restrictionmapping）將限制性酶切位點標(biāo)定在DNA分子的相對位置。2）依靠克隆的基因組作圖(Clone-basedmapping)

根據(jù)克隆的DNA片段之間的重疊順序構(gòu)建重疊群

(Contig)。3）熒光標(biāo)記原位雜交（Fluorescentinsitu

hybridization,FISH）將熒光標(biāo)記的探針與染色體雜交確定分子標(biāo)記的所在位置。4）順序標(biāo)簽位點（Sequencetaggedsite,STS）作圖

通過PCR或分子雜交將小段DNA順序定位在基因組的DNA區(qū)段中。人類基因組的測序路線基因組測序基因組計劃的最后一關(guān)，也是最終目標(biāo)。DNA測序方法發(fā)明于上世紀(jì)70年代。鏈終止法是現(xiàn)在常用的大規(guī)?；蚪M測序方法，利于實現(xiàn)自動化。鳥槍法測序（shotgun）即直接從單個測序反應(yīng)中得到的短序列（500bp）通過檢測重疊區(qū)推導(dǎo)出完整序列。建立高度隨機(jī)、插入片段大小為2kb左右的基因文庫(為保證覆蓋率，6-8倍測序）高效、大規(guī)模的末端測序序列集合填補(bǔ)缺口鳥槍法測序的一般步驟1995年，在不借助任何圖譜的情況下，人們利用鳥槍法測序完成了全長為1830kb的流感嗜血桿菌的全基因組測序。14臺測序儀，用三個月時間完成了必需的28,463個測序反應(yīng)，測序總長度達(dá)6倍基因組，最后由140個序列疊連群的拼接而成。但是，由于計算量過大，容易產(chǎn)生錯排和缺口等問題，一般認(rèn)為鳥槍法測序?qū)τ诨蚪M大小在5Mb以下的生物較為適用。公共領(lǐng)域的

測序方案2.構(gòu)建300,000個BAC克隆的文庫明確克隆的基因組定位3.Clone-by-clone測序法1.制作較高密度的遺傳圖譜和物理圖譜Clone-by-clone測序(逐個克隆法)公共測序計劃使用的主要測序方法。先將基因組DNA連續(xù)分段克隆到BAC載體中進(jìn)行擴(kuò)增純化等操作，然后分別構(gòu)建亞克隆進(jìn)行測序和拼接，最后再進(jìn)行全基因組組裝。如果用全基因組鳥槍法測人基因組，需要檢測6萬條序列（10倍基因組全長）。65臺測序儀，每天1000條序列，3年能完成。但是，需要？計算機(jī)？時間才能將這6萬條序列正確拼裝起來？人類基因組的鳥槍法測序？

定向鳥槍法——以Celera為代表的私人測序公司使用的主要測序方法。直接將基因組隨機(jī)斷裂，構(gòu)建到亞克隆中進(jìn)行測序和拼接；利用不同克隆文庫來增加隨機(jī)片斷的基因組覆蓋率，避免重復(fù)序列丟失；利用遺傳圖和物理圖以及超級計算機(jī)進(jìn)行計算和組裝；Nature2001,409(6822)HPGScience2001,291(5507)CeleraFrancisCollinsJCVenter認(rèn)識人類基因組3,000,000,000bp，588,000pages，3bp/s，自己的基因組天書，要讀50年1.全部人類基因組約有39000多個基因；平均的基因大小有27kbp；G+C含量偏低，僅占38%；19號染色體是含基因最豐富的染色體，而13號染色體含基因量最少。2.基因數(shù)量少得驚人：Celera公司將人類基因總數(shù)定在2.6383萬到3.9114萬個之間，不超過40,000。不同物種中，人基因組中非編碼基因比例遠(yuǎn)遠(yuǎn)高于其他多種生物。3.已經(jīng)發(fā)現(xiàn)和定位了26000多個功能基因，其中尚有42%的基因尚不知道功能，在已知基因中酶占10.28%，核酸酶占7.5%，信號傳導(dǎo)占12.2%，轉(zhuǎn)錄因子占6.0%，信號分子占1.2%，受體分子占5.3%，選擇性調(diào)節(jié)分子占3.2%。4.發(fā)現(xiàn)和利用基因組新穎成員：轉(zhuǎn)座子、逆轉(zhuǎn)座子和病毒殘余序列利于指導(dǎo)基因治療，重復(fù)序列被用于遺傳分析和定位克隆等。5.對基因表達(dá)調(diào)節(jié)的重新認(rèn)識：一些基因的表達(dá)調(diào)控序列與被調(diào)節(jié)基因直線距離相距甚遠(yuǎn)，但空間結(jié)構(gòu)處于最佳位置。6.不同染色體變異的鑒定：對染色體重排和斷裂等畸變的認(rèn)識促進(jìn)了疾病分子遺傳學(xué)的發(fā)展，為疾病的診斷、預(yù)防和治療提供理論依據(jù)。7.對個體多態(tài)性的重視：個人DNA序列的多態(tài)性可被廣泛用于基因診斷、組織配型、發(fā)育進(jìn)化等許多醫(yī)療、司法和人類學(xué)的研究。此外，這些遺傳信息還有助于研究人類歷史進(jìn)程。第四節(jié)后基因組時代的遺傳研究HPG對疾病研究的影響遺傳性疾病定位致病基因克隆診斷學(xué)預(yù)防醫(yī)學(xué)基因治療藥物治療認(rèn)識基本的生物學(xué)缺陷因HPG而加速功能克隆80年代之前使用的疾病基因定位方法。至1986年，人類通過功能克隆的方法克隆了200余種人類疾病基因的致病基因。功能克隆時首先收集所要克隆的基因的蛋白質(zhì)產(chǎn)物及其功能的信息，據(jù)此分離基因，并對基因進(jìn)行定位。性狀（疾病）染色體定位，獲得基因序列疾病功能從氨基酸序列出發(fā)從文庫調(diào)取基因基因蛋白質(zhì)產(chǎn)物（生物學(xué)功能）1.氨基酸序列測定，據(jù)此推測可能的核苷酸序列，合成寡核苷酸探針，然后用探針從文庫中篩選得到相應(yīng)的編碼基因；用異常蛋白質(zhì)制備獨特性抗體，從cDNA表達(dá)文庫中篩選陽性克隆。根據(jù)克隆的DNA序列確定疾病基因分子缺陷；功能克隆中，首先分析和純化異常基因的產(chǎn)物（主要是蛋白質(zhì)），然后有兩條不同的研究路線：

80年代早期：絕大部分分子病、遺傳性代謝缺陷（酶）病如：白化病（albinism）、苯丙酮尿癥（phenylkeonuria，PKU）和鐮刀形細(xì)胞貧血?。╯ickle-celldisease）等都是采取的這一策略。鐮刀形細(xì)胞貧血癥是功能克隆的經(jīng)典案例。正常血紅蛋白（HbA）由四條多肽鏈組成（2條鏈，兩條鏈）。早在1949年P(guān)auling等人就發(fā)現(xiàn)鐮刀型細(xì)胞貧血癥是由于血紅蛋白的變異造成的（在相同電泳條件下，電泳行為不同）分子疾病。后來通過對比病變HbS蛋白和HbA序列，人們發(fā)現(xiàn)患者的血紅蛋白中一個Glu突變成了Val，在毛細(xì)血管中容易形成棒狀結(jié)構(gòu)，丟失攜氧能力。定位克隆始于20世紀(jì)80年代后期,利用遺傳連鎖或細(xì)胞學(xué)定位技術(shù)將致病基因定位于染色體的特定區(qū)帶。先通過連鎖分析找出與目的基因緊密連鎖的遺傳標(biāo)記在染色體上的位置。再從定位的染色體區(qū)段內(nèi)分離克隆所要的基因，并進(jìn)一步研究其功能。疾病遺傳標(biāo)記，染色體定位基因序列mRNAcDNA蛋白質(zhì)產(chǎn)物生物學(xué)功能

疾病

功能基因基因定位方法——家系連鎖分析法連鎖分析原理：若某一遺傳標(biāo)記與待定基因距離較遠(yuǎn)，則它們在向子代傳遞時容易發(fā)生自由分離，稱作“連鎖平衡”；反之，距離較近時不發(fā)生自由分離，呈現(xiàn)“共分離”現(xiàn)象，即“連鎖不平衡”。據(jù)此我們可在染色體上將待定基因標(biāo)定在某一DNA標(biāo)記附近。家系連鎖分析法：以兩代或兩代以上的家系材料為基礎(chǔ)，觀察標(biāo)記位點與致病基因位點在家系內(nèi)是否呈“共分離”，并利用優(yōu)勢對數(shù)計分法（LOD）計算出遺傳距離和連鎖程度。兩基因座連鎖且相距θ值的似然性兩基因座不連鎖但相距θ值的似然性LOD=lg

例如：Lod值等于3代表連鎖機(jī)率是不連鎖機(jī)率的1000倍。據(jù)此判斷候選基因與某個遺傳標(biāo)記之間是否存在連鎖，遺傳距離又是多少。一般認(rèn)為，Lods>1支持連鎖,Lods<-2否定連鎖,Lods>3肯定連鎖,Lods介于-2與3之間需增加家系材料.這一方法需要確定性狀或疾病的遺傳方式,基因頻率以及外顯率，一般進(jìn)行參數(shù)統(tǒng)計分析。1989囊性纖維化1990Wilms瘤；I型神經(jīng)纖維瘤；無脈絡(luò)膜病1991脆性X染色體；家族性結(jié)腸息肉；Kallmann綜合癥1992強(qiáng)直性肌營養(yǎng)不良；Lowe綜合癥；Norrie綜合癥1993Menkes??；X連鎖丙種球蛋白缺乏癥；甘油激酶缺乏癥；腎上腺腦白質(zhì)營養(yǎng)不良；多發(fā)性神經(jīng)纖維瘤2型；Hungtington??；VonHippel-Lindau病；脊髓小腦共濟(jì)失調(diào)I；無腦回畸形；Wilson病；結(jié)節(jié)樣硬化1994Mcleod綜合癥；多囊腎I；軟骨發(fā)育不全；WiskottAldrich綜合癥；早發(fā)性乳腺瘤；先天性腎上腺發(fā)育不全；Emery-Dreifuss肌營養(yǎng)不良；Machado-Joseph病1995……1998年夏家輝院士率領(lǐng)的湘雅醫(yī)院醫(yī)學(xué)遺傳學(xué)國家重點實驗室在國際上首次定位克隆了神經(jīng)性耳聾的疾病基因GJB3（1p33-p35）。序列分析進(jìn)一步發(fā)現(xiàn)一個錯義突變和一個同義突變是導(dǎo)致兩個家系發(fā)生高頻神經(jīng)性耳聾的原因。賀林實驗室利用布依族、苗族和漢族的三個A-I型短指（趾）癥大家系，對該病的致病基因進(jìn)行了精確定位（位點定在2q35-36區(qū)）、克隆，并首次發(fā)現(xiàn)了人IHH基因和該基因上的三個突變位點是導(dǎo)致A-I型短指（趾）癥的直接原因。人類基因組計劃基因組多樣性計劃單倍型計劃藥物基因組學(xué)ENCODE計劃……比較基因組學(xué)疾病基因組學(xué)遺傳差異計劃

人類基因組多樣性計劃

（ThehumanGenomeDiversity(HGD)Project）1991年HGDP執(zhí)行委員會在當(dāng)時擔(dān)任HGP主席的Waiter主持下正式成立。1992年～1993年就HGDP涉及到的科學(xué)、技術(shù)和倫理問題展開討論，制定了HGDP的主要研究目標(biāo)。1997年美國國家研究委員會成立了人類基因組多樣性問題委員會，對其可行性與意義進(jìn)行了深入的討論．最后支持開展人類遺傳變異的研究。NIH(美國最大的醫(yī)學(xué)研究組織)表示愿意和國際人類基因組多樣性計劃合作。Nature雜志1997年l1月發(fā)表文章表示對HGDP的支持．1997年10月Science認(rèn)可了人類基因組多樣性研究的文章。歐洲人類多樣性研究中心(CEPH)對HGDP表現(xiàn)強(qiáng)烈興趣，表示愿意與HGDP密切合作開展工作．HGD開展歷程HGD計劃的目標(biāo)

使用新技術(shù)研究基因的遺傳學(xué)并結(jié)合歷史學(xué)、考古學(xué)和語言學(xué)等準(zhǔn)確定義世界上不同人群的起源從世界各地采集的人群標(biāo)本并建立永生細(xì)胞系，鑒定人類基因組的多樣性，并建立服務(wù)于全世界的資源庫，這個庫不但包含來自于全世界人群的遺傳多樣性，還是可被全世界科學(xué)家共同開發(fā)的、長時間的遺傳統(tǒng)計數(shù)庫和生物樣品庫。樣品收集：如何定義人群，建立人群目錄，列出需要人群樣品收集社會人口統(tǒng)計學(xué)資料：樣品資料，血液質(zhì)量，是否建立細(xì)胞系，DNA的抽提和鑒定等，還有性別、年齡、目前居住地、出生地及語方特征，個體父母的信息，文化和語言特征。分析樣品：遺傳標(biāo)記多態(tài)性建立數(shù)據(jù)庫：建立開放的代表人類遺傳多樣性生物學(xué)樣品，遺傳學(xué)和統(tǒng)計學(xué)的數(shù)據(jù)庫。HGD計劃的實施HGD計劃的重要性對人類歷史和身份有一個廣泛的說明和解釋所建立的資源庫為尋找引起或抵抗疾病遺傳因素提供信息。HGD計劃把不同國家的人們結(jié)合到一起?？涨耙?guī)模的遺傳學(xué)家同人類學(xué)家、考古學(xué)家、生物學(xué)家、語言家和歷史學(xué)家之間的合作，為自然科學(xué)與人類學(xué)搭起橋梁。在弄清個體或人群間的自然差異后，使人類遺傳學(xué)對種族有一個正確的認(rèn)識。中國的HGD計劃我國人口占世界的22%，有56個已識別的民族和205種語言，擁有極為豐富的疾病人群資源(包括疾病群體、家系和個體)。中國是從事HGD研究的極為理想的地區(qū)。成立中國人類基因組多樣性研究中心采集中華民族各人群的更大樣本(每人群100～200人)的DNA樣品建立和完善必要的法律和法規(guī)防止國外攫取我國人類遺傳資源，同時促進(jìn)正常的國際與國內(nèi)合作引進(jìn)國外人類基因組多樣性大規(guī)模、快速分析的技術(shù)方法積極開展我國人群DNA多態(tài)性的研究，并繼續(xù)進(jìn)行中國人基因組經(jīng)典遺傳標(biāo)記的多樣性研究HapMap是人類基因組中常見遺傳多態(tài)位點的目錄，它描述了這些變異的形式、在DNA上存在的位置、在同一群體內(nèi)部和不同人群間的分布狀況。HapMap計劃并不是利用HapMap中的信息來建立特定的遺傳變異與某一疾病之間的聯(lián)系，而是為其他研究者提供相關(guān)信息使之能夠?qū)⑦z傳多態(tài)位點和特定疾病風(fēng)險聯(lián)系起來，從而為預(yù)防、診斷和治療疾病提供新的方法。HaplotypeMapProject（單倍型計劃）HaplotypeMapProject（單倍型計劃）單倍型:指一條染色體上緊密相連的兩個或兩個以上基因座內(nèi)一組等位基因的基因型。通常單倍型內(nèi)的基因是作為一個單位進(jìn)行遺傳的。

2002年10月國際單倍型聯(lián)合會正式啟動了以尋找標(biāo)記SNPs的遺傳變異的HapMap計劃。2003年中國承擔(dān)了其中10%的工作任務(wù)。2005年10月一份包括了269份不同人基因組樣本的單倍型圖譜發(fā)表在Nature雜志上。DNA堿基序列—字母單倍型--單詞和短語（降低復(fù)雜度）由于重組熱點等原因，基因組內(nèi)的連鎖不平衡的基因通常是像積木一樣塊狀分布的，并且每個積木內(nèi)部的單倍型差異遠(yuǎn)低于理論值。Block-likestructureoflinkagedisequilibrium&Lowhaplotypediversity單倍型的塊狀結(jié)構(gòu)提示我們將遺傳疾病和這些單倍型關(guān)聯(lián)起來更加容易。HapMap在一定程度上解決了連鎖分析中的遺傳標(biāo)記數(shù)量和代表性的問題，對復(fù)雜疾病的遺傳分析具有重要的意義。根據(jù)Y染色體單倍型來分析早期人類遷徙的途徑全基因組關(guān)聯(lián)分析Genome-wideassociationanalysis(GWAS)研究對象：復(fù)雜性疾病，包括腫瘤、心血管病、糖尿病、肥胖癥、精神疾病等；計劃方案：成套DNA的全基因組測序和掃描，測定疾病的基因變異和單核苷酸多態(tài)性；基本手段：關(guān)聯(lián)分析；研究成果：確定一系列疾病發(fā)病的致病基因、相關(guān)基因、易感區(qū)域和單核苷酸多態(tài)性變異，尋找疾病的標(biāo)記物，進(jìn)行早期診斷和最有效的個體化治療，開發(fā)新藥物和新的特異性防治措施。

ENCODE計劃在2003年9月，美國國立人類基因研究所提出了一個“DNA元件的百科全書”（EncyclopediaofDNAElements,ENCODE）研究計劃。旨在找出人類基因組序列中所有的結(jié)構(gòu)和功能元件，形成一個完整的人類基因組的“元件目錄”。

包括：編碼蛋白質(zhì)的基因；非編碼蛋白質(zhì)的基因；轉(zhuǎn)錄調(diào)控元件；其他調(diào)節(jié)染色體結(jié)構(gòu)和動態(tài)活動的功能序列，如DNA復(fù)制起始序列。ENCODE計劃“由點及面”的研究策略：示范期：運用人類基因組計劃中成熟的方法和手段進(jìn)行研究，將注解任務(wù)局限于按一定標(biāo)準(zhǔn)選擇的分布在不同染色體上的44個小片段（ENCODtargets），每個片段大約是0.5萬到200萬個堿基序列；這些具有代表性的片段總共只占人類基因組中所有結(jié)構(gòu)和功能元件序列的1％左右。技術(shù)發(fā)展期：小規(guī)模試點研究未被充分研究的功能基因。產(chǎn)出期：開發(fā)高通量篩選和檢測技術(shù)進(jìn)行研究，即將前面兩個階段的研究成果應(yīng)用到對整個基因組的研究中。

ENCODE團(tuán)隊試點計劃目前已經(jīng)基本完成，主要包括以下三方面的內(nèi)容：①對編碼的功能DNA進(jìn)行鑒定和分類；對已存在的幾種方法進(jìn)行了測試和比較，嚴(yán)格分析了人類基因組序列中已被定義的序列。②闡明人類生物學(xué)和疾病之間的關(guān)系；③對大量鑒定基因特征的方法、技術(shù)和手段進(jìn)行檢測和評估。ENCODE計劃2007年6月，ENCODE團(tuán)隊相繼在《自然*(Nature)和《基因組研究》(GenomeResearch)上發(fā)表了29篇相關(guān)論文，報道了他們4年來努力的成果，即通過建立一個目錄，詳盡地描述1％人類基因組的全部生理功能基礎(chǔ)。該結(jié)果高度肯定了鑒定和歸類人類基因組功能元件的工程的成功，并且由于幾項新技術(shù)的興起，大量關(guān)于功能元件的數(shù)據(jù)被獲得，這標(biāo)志著技術(shù)發(fā)展階段也獲得了成功。ENCODE計劃基因組序列的轉(zhuǎn)錄是廣譜的，在基因組的初級轉(zhuǎn)錄本中可以找到絕大多數(shù)基因的序列信息。編碼基因轉(zhuǎn)譯成蛋白質(zhì)只是基因序列的一種功能形式。重新認(rèn)識了基因轉(zhuǎn)錄和復(fù)制的分子機(jī)制（識別序列，組蛋白作用等等）。3.大約一半人類基因組中的功能元件在進(jìn)化過程中不會受到大的限制，這一點很可能意味著基因組中大量的功能元件是生物不斷進(jìn)化的素材。ENCODE計劃意義：2003年人類基因組計劃的完成僅僅標(biāo)志著人類向著利用基因信息診斷、治療和預(yù)防疾病的目標(biāo)邁出了重要的第一步。這就好比我們只得到了人體的“使用手冊”，但是如果要將這份手冊用于疾病診斷和治療，我們必須讀懂這份手冊。ENCODE計劃首次系統(tǒng)地研究了所有類型的功能元件的位點和組織方式，對基因組計劃的實際應(yīng)用具有劃時代的意義，為未來進(jìn)一步認(rèn)識整個人類基因組的功能藍(lán)圖開辟了道路。ENCODE計劃首先ENCODE計劃推翻了傳統(tǒng)的觀點：即我們的基因藍(lán)圖(geneticblueprint)作為一群獨立基因(independentgenes)，漂浮在“垃圾DNA”(junkDNA)的大海上。事實上，人類基因藍(lán)圖的30億個化學(xué)“字母”組成了一個極為復(fù)雜的網(wǎng)絡(luò)，在這個網(wǎng)絡(luò)中，基因、調(diào)控基序(regulatoryelements)和其它DNA序列以一種人們尚未了解的重疊方式相互作用，共同著控制人類的生理活動。ENCODE計劃其次“DNA元件百科全書”加深了對哺乳動物基因組進(jìn)化的認(rèn)識。傳統(tǒng)理論認(rèn)為，與生理功能相關(guān)的重要DNA序列往往位于基因組中的“進(jìn)化限制”(evolutionaryconstraint)區(qū)域，它們在物種進(jìn)化過程中更容易保存下來。但是，最新的研究表明，大約一半人類基因組中的功能元件在進(jìn)化過程中，不會受到很大限制。科學(xué)家認(rèn)為，哺乳動物缺乏“進(jìn)化限制”這一點很可能意味著，許多物種的基因組都囊括了大量的包括RNA轉(zhuǎn)錄副本在內(nèi)的功能元件，在進(jìn)化過程中，這些功能元件成了基因“倉庫”。ENCODE計劃功能基因組學(xué)又往往被稱為后基因組學(xué)，它利用結(jié)構(gòu)基因組所提供的信息和產(chǎn)物，發(fā)展和應(yīng)用新的實驗手段，通過在基因組或系統(tǒng)水平上全面分析基因的功能，使得生物學(xué)研究從對單一基因或蛋白質(zhì)的研究轉(zhuǎn)向多個基因或蛋白質(zhì)同時進(jìn)行系統(tǒng)的研究。這是在基因組靜態(tài)的堿基序列弄清楚之后轉(zhuǎn)入對基因組動態(tài)的生物學(xué)功能學(xué)研究。研究內(nèi)容包括基因功能發(fā)現(xiàn)、基因表達(dá)分析及突變檢測。基因的功能包括：生物學(xué)功能，如作為蛋白質(zhì)激酶對特異蛋白質(zhì)進(jìn)行磷酸化修飾；細(xì)胞學(xué)功能，如參與細(xì)胞間和細(xì)胞內(nèi)信號傳遞途徑；發(fā)育上功能，如參與形態(tài)建成等。采用的手段包括經(jīng)典的減法雜交，差示篩選，cDNA代表差異分析以及mRNA差異顯示等，但這些技術(shù)不能對基因進(jìn)行全面系統(tǒng)的分析，新的技術(shù)應(yīng)運而生，包括基因表達(dá)的系統(tǒng)分析（serialanalysisofgeneexpression,SAGE），cDNA微陣列（cDNAmicroarray），DNA芯片（DNAchip）等。功能基因組學(xué)1997年6月28日金賽特·可伯特實驗室（巴黎）宣布成立世界上第一個獨特的基因與制藥公司，研究基因變異所致的不同疾病患者對藥物的不同反應(yīng)，并在此基礎(chǔ)上研制新藥或新的用藥方法，這一新概念被稱為藥物基因組學(xué)?；蛐蛄械亩鄳B(tài)性產(chǎn)生的等位基因不僅與疾病發(fā)生發(fā)展相關(guān)，而且影響藥物的代謝、活性、作用途徑、不良反應(yīng)等，因此造成了藥物的效應(yīng)呈現(xiàn)多態(tài)性。一方面，基因組SNP多態(tài)檢測為藥物的個性化治療提供了前提條件；另一方面，許多基因組研究相關(guān)的新技術(shù)手段使得更多的新藥和新的藥物靶點得到開發(fā)。為患者提供個性化健康指導(dǎo)服務(wù)、個性化用藥指導(dǎo)服務(wù)和個性化體檢指導(dǎo)服務(wù)。藥物基因組學(xué)研究生物進(jìn)化過程中基因組的動態(tài)變化和基因的變異，揭示生物類群的親緣關(guān)系和進(jìn)化規(guī)律的學(xué)科。進(jìn)化基因組學(xué)結(jié)構(gòu)基因組學(xué)是一門研究生物中所有的蛋白質(zhì)結(jié)構(gòu)。主要利用實驗方式(X-射線晶體衍射、核磁共振質(zhì)譜)或計算方式(HomologyModeling)

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 醫(yī)學(xué)資料

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第三章基因組的結(jié)構(gòu)與功能

文檔簡介

溫馨提示

最新文檔

評論

第三章 基因組的結(jié)構(gòu)與功能

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第三章基因組的結(jié)構(gòu)與功能