Gene7-02從基因到基因組課件_第1頁
Gene7-02從基因到基因組課件_第2頁
Gene7-02從基因到基因組課件_第3頁
Gene7-02從基因到基因組課件_第4頁
Gene7-02從基因到基因組課件_第5頁
已閱讀5頁,還剩136頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Lecture 2From Genes to Genomes(7)Interrupted genes(8)Introduction引言Restriction endonucleases are a key tool in mapping DNA 通過限制性內(nèi)切作圖 How variable are individual genomes? 分子標(biāo)記,分子標(biāo)記作圖與應(yīng)用(?)Interrupted Gene Exon sequences are conserved but introns vary Genes can be isolated by the conservation of exons

2、 基因在尺寸大小上分布廣泛53斷裂基因是如何發(fā)展進(jìn)化的?58本講主要內(nèi)容Introduction 1993 Nobel Richard J. Roberts and Phillip A. Sharp Genomic2.2Restriction endonucleases are a key tool in mapping DNA We can think about mapping genes and genomes at several levels of resolution:Genetic mapA cytogeneticA genetic (or linkage) map identi

3、fies the distance between mutations in terms of recombination frequencies. A linkage map can also be constructed by measuring recombination between sites in genomic DNA. Physic mapA restriction map is constructed by cleaving DNA into fragments with restriction enzymes and measuring the distances bet

4、ween the sites of cleavage.Transceiption mapThe ultimate map is to determine the sequence of the DNA. From the sequence, we can identify genes and the distances between them. 5000bp長(zhǎng)的DNA分子由兩個(gè)限制性酶A和B切成片段,而后DNA進(jìn)行電泳。每一條片段的大小由已知大小的片段的位置來決定,如中部所示。酶A將DNA切成4段(長(zhǎng)為2100, 1400, 1000, 500pb), 酶B切為3段(長(zhǎng)為2500, 1300

5、, 1200bp)。那么是否能根據(jù)這些數(shù)據(jù)制作一個(gè)圖譜,來顯示DNA分子的特定的斷裂點(diǎn)呢?雙單酶切做physical map真正構(gòu)建限制性圖譜時(shí)需要許多酶,所以解決由各種各樣酶產(chǎn)生的十分復(fù)雜的覆蓋片段是十分必要的。許多更進(jìn)一步的技術(shù)就用來構(gòu)建圖譜。 另一種方法是用部分(酶切)消化,通過在一些條件下,一種酶并不確認(rèn)每一種DNA分子的目標(biāo)切點(diǎn)而是不能在目標(biāo)切點(diǎn)上進(jìn)行切除。這種條件可以設(shè)置,這樣這種酶有一個(gè)特殊的可能性,例如,只切它所識(shí)位點(diǎn)的50。單酶切也可實(shí)現(xiàn)作圖應(yīng)用單酶切不完全消化技術(shù),酶A可能產(chǎn)生3500, 3100, 1400bp等的分裂片段,通過比較完全消化的部分產(chǎn)品, 1000-2100

6、bp片段可被認(rèn)作3100bp部分片段的鄰近成分。同樣,2100, 1400bp片段可被置于3500bp部分片段作為鄰近成分。這樣該技術(shù)允許單切酶切點(diǎn)按序排列。如果一種酶的兩個(gè)些切點(diǎn)離得非常近(比如,小于50bp),則所產(chǎn)生的非常小的片段就在瓊脂糖凝膠上丟失。當(dāng)然,當(dāng)其它片段的分子量相加時(shí),這種情況會(huì)導(dǎo)致脫節(jié)。這個(gè)問題可以通過應(yīng)用其他一些限制性酶來構(gòu)建圖譜而被克服掉,所以用不同酶產(chǎn)生的片段中有總夠的覆蓋來保證所有的DNA都被包含進(jìn)來。 通過用末端標(biāo)記技術(shù)比較部分酶切消化,一系列的由一種酶所確定的切點(diǎn)可以直接相對(duì)末端而在圖上做出來,圖2.4顯示了僅由它們放射性的標(biāo)記末端而識(shí)別出的片段,那些分子內(nèi)的

7、切點(diǎn)被忽略掉,然后而一系列片段確定了距標(biāo)記末端的每一個(gè)切點(diǎn)。如果圖6.4的左端5000bp片段被做上標(biāo)記,酶A的部分?jǐn)嗔褜⒘⒓创_定出距末段的1000, 3100, 4500bp切點(diǎn)。Figure 2.4 When restriction fragments are identified by their possession of a labeled end, each fragment directly shows the distance of a cutting site from the end. Successive fragments increase in length by t

8、he distance between adjacent restriction sites. 2.2 Restriction endonucleases are a key tool in mapping DNA 1000, 3100, 4500bpDNA 結(jié)構(gòu)在不同種類的生物體內(nèi)存在著相當(dāng)大的差異隨著對(duì)基因及基因組認(rèn)識(shí)的不斷深入,發(fā)現(xiàn)同種的不同個(gè)體之間,盡管其蛋白質(zhì)產(chǎn)物的結(jié)構(gòu)和功能完全相同或僅有微小差異,但在DNA 水平卻存在著差異或明顯差異,尤其在不編碼蛋白質(zhì)的區(qū)域以及沒有重要調(diào)節(jié)功能的區(qū)域表現(xiàn)更為突出。DNA 順序上的大多數(shù)突變是中性突變,即不影響生物體的表型,因而過去長(zhǎng)期對(duì)這些突變不

9、太重視,也無法用傳統(tǒng)的遺傳學(xué)方法來研究。2.3 How variable are individual genomes? 個(gè)體基因組如何變化? (though HPG)For example , you and me 與 酶切有關(guān)(小基因組)分子操作技術(shù)的不斷發(fā)展,從DNA 水平上直接分析生物體的突變成為可能。假如DNA 順序中的某個(gè)堿基發(fā)生了突變,尤其是在某種限制性內(nèi)切酶的位點(diǎn)(突變或缺失)。這樣,利用該限制性內(nèi)切酶消化此DNA 時(shí),便會(huì)產(chǎn)生與正常不同的限制性片段。這樣,在同種生物的不同個(gè)體中會(huì)出現(xiàn)不同長(zhǎng)度的限制性片段類型,即限制性片段多態(tài)性(RFLP )。其他的顯示DNA差異(多態(tài)性的)?

10、分子標(biāo)記 構(gòu)建高分別率遺傳圖譜( 80年代,Botsein提出DNA限制性片段長(zhǎng)度多態(tài)性(RFLP)可以作為遺傳標(biāo)記,從此開創(chuàng)了直接應(yīng)用DNA多態(tài)的新階段.90年代,DNA多聚酶鏈?zhǔn)椒磻?yīng)(PCR)的發(fā)展,使直接擴(kuò)增DNA的多態(tài)性成為可能,并在此基礎(chǔ)上產(chǎn)生了許多種新型分子標(biāo)記,諸如擴(kuò)增片段多態(tài)性(ALFR)、串聯(lián)重復(fù)序列(VNTR), RAPD是較為突出的一種. SNP 單鏈構(gòu)型多態(tài)性(PCR-SSCP)、序列特異擴(kuò)增區(qū)域(SCAR).另一類是由于DNA 分子內(nèi)部發(fā)生較大的順序變化所致。這一類多態(tài)性又可以分成兩類: 第一類是由于DNA 順序上發(fā)生突變?nèi)缛笔А⒅貜?fù)、插入所致。反映的是在RLFP多態(tài)

11、 第二類是所謂“高變區(qū)”。高變區(qū)(highly variable region ),是由多個(gè)串聯(lián)重復(fù)順序組成的,不同的個(gè)體高變區(qū)內(nèi)所串聯(lián)重復(fù)的拷貝數(shù)相差懸殊,因而高變區(qū)的長(zhǎng)度變化很大,從而使高變區(qū)兩側(cè)限制性內(nèi)切酶識(shí)別位點(diǎn)的固定位置隨高變區(qū)的大小而發(fā)生相對(duì)位移。所以這一類型的RFLP 是由于高變區(qū)內(nèi)串聯(lián)重復(fù)順序的拷貝數(shù)不同所產(chǎn)生的,其突出特征是限制性內(nèi)切酶識(shí)別位點(diǎn)本身的堿基沒有發(fā)生改變,改變的只是它在基因組中的相對(duì)位置。即可反映在RLFP上,也可PCR擴(kuò)增 這就是說這兩種序列在人體基因組中不同的位置上分別重復(fù)不同的次數(shù),而在不同個(gè)體的基因組中,對(duì)應(yīng)位置上這兩種核心序列的重復(fù)次數(shù)也不相同。這樣用這

12、兩種探針之一與合適的酶切割的人體基因組DNA 片段雜交,在不同的個(gè)體將得到不同的DNA 指紋,而且探針33.5 的DNA 指紋圖也不相同。DNA 指紋具有細(xì)胞穩(wěn)定性和種系穩(wěn)定性,是按孟德爾規(guī)律遺傳的,而且雜合性高。對(duì)于由點(diǎn)突變引起的RFLP ,就某一個(gè)多態(tài)性切點(diǎn)來說只有兩種多態(tài)性,即切點(diǎn)有(+ )或切點(diǎn)無(- )。而對(duì)由于高變區(qū)重復(fù)片段長(zhǎng)度不同所引起的RFLP 來說,在基因組上某一個(gè)位置核心序列的重復(fù)次數(shù)在不同的個(gè)體不一樣,比如在個(gè)體為10 個(gè)拷貝,個(gè)體為15 個(gè)拷貝,而個(gè)體又可能為18 個(gè)拷貝等等。因此,在不同個(gè)體同一個(gè)相應(yīng)位置上核心序列的重復(fù)次數(shù)就是多態(tài)的,而不是雙態(tài)的。即使在基因組上的某

13、一個(gè)位置處核心序列的次數(shù)一樣,從而被酶切出的長(zhǎng)度相同,但在基因組的其他位置上該核心序列重復(fù)次數(shù)又可能不同。由于DNA 指紋是按孟德爾規(guī)律遺傳的,子代的DNA 指紋圖可以追溯到其父母DNA 指紋圖上,而在不是其父母的DNA 指紋圖上則很難找到與其一樣的小隨體DNA 片段。在父親的5 條可分辨的小隨體DNA 片段中,有4 條處于雜合狀態(tài),即這4 條DNA 片段有不同的個(gè)體長(zhǎng)度。因此,因高變區(qū)核心序列重復(fù)次數(shù)不同引起的RLFP 才是真正的多態(tài)性。在不同個(gè)體,這種RLFP 即DNA 指紋可以說不存在相同的。即使使用一種探針產(chǎn)生的DNA 指紋圖無法鑒定這兩個(gè)個(gè)體,如再用另一種探針便有可能將這兩個(gè)個(gè)體區(qū)分

14、開。DNA 指紋技術(shù)已被應(yīng)用于親子鑒定和法醫(yī)學(xué)上對(duì)罪犯的確認(rèn)等領(lǐng)域。Haplotype(單元型,單倍型 一條染色體或DNA分子的基因型) is the particular combination of alleles in a defined region of some chromosome, in effect the genotype in miniature. Originally used to described combinations of MHC alleles, it now may be used to describe particular combinations

15、of RFLPs.豐富的多態(tài)性(或高頻率)意味著每個(gè)個(gè)體有獨(dú)特的限制性位點(diǎn)。在特殊區(qū)域發(fā)現(xiàn)的位點(diǎn)組合稱為單體型(Haplotype)。單體型概念最初用于描述主要組織兼容性座位(編碼在免疫系統(tǒng)中很重要的蛋白質(zhì)區(qū)域,見第24 章)的遺傳組成?,F(xiàn)在延伸到描述基因組限定區(qū)域的等位基因或限制性位點(diǎn)(或者任何其他遺傳標(biāo)記)的特殊組合。(個(gè)體某些位點(diǎn)或基因的組成)2.3 How variable are individual genomes?個(gè)體基因組如何變化?SNP (single nucleotide polymorphism) is any site at which a single nucleot

16、ide has changed when two (haploid) genomes are compared.SNPs and HaplotypesA Single Nucleotide Polymorphism (SNP), pronounced snip, is a single DNA base variation observed in the human population.A haplotype stands for a set of linked SNPs on the same chromosome.SNP1SNP2SNP3-A C T T A G C T C-A A T

17、T T G C T C-A C T T T G C T T-A C T T T G C T C-Haplotype2Haplotype3C A CA T CC T THaplotype1SNP1SNP2SNP3Haplotype4C T C SNP,RLFP, VTRP實(shí)際上,在DNA 順序中,存在著大量的單個(gè)堿基的替換,但用通常所用的技術(shù)只能檢測(cè)出影響到限制性內(nèi)切酶識(shí)別位點(diǎn)上的突變。不同的多態(tài)性切點(diǎn)在一特定人群中出現(xiàn)(+ )的頻率不一樣。一段DNA,切點(diǎn)=0.6 (即60 的人含有該切點(diǎn),而另外40 的人在同一位點(diǎn)處不含該切點(diǎn)); 切點(diǎn)=0.4 。 隨機(jī) :、同時(shí)存在(+ )0.6 0.4=

18、0.24, 即24 的人同時(shí)含有、兩個(gè)切點(diǎn)。 非隨機(jī)相關(guān)的,那么同時(shí)存在的可能性將和預(yù)期的頻率相差較大。這種相關(guān)的非隨機(jī)性稱為: 連鎖不平衡。n ,2n 組合,每種組合稱為一種單元型,每種單元型隨機(jī)相關(guān)的預(yù)期出現(xiàn)頻率為各個(gè)位點(diǎn)頻率乘積。但是,實(shí)踐證明多態(tài)性切點(diǎn)之間并非隨機(jī)相關(guān)。例如,在珠蛋白基因簇內(nèi)多態(tài)性切點(diǎn)2 到9 共8 個(gè),理論應(yīng)有28=256 種組合,即256 種單體型。但實(shí)際上有3 種單體型在希臘、意大利和亞洲印度人A 染色體(攜帶正常珠蛋白基因的染色體)中就有94 ,而有些理論上的組合在實(shí)際上卻是不存在的。在理論上,單體型(從切點(diǎn)2 到9 )的頻率為 0.46 0.48 0.7 0.

19、27 0.83 0.52 0.37 0.32=0.0021, 而實(shí)際上該單體型的頻率為0.64 ,兩者相差甚大。這說明各個(gè)多態(tài)性切點(diǎn)之間是非隨機(jī)相關(guān)的(連鎖不平衡)。Mapping human genes by linkage analyisisPhysical dist.Genetic dist.Chromosome 1 : 283 Mb 270 cM (0.95 cM/Mb)q arm of chromosome 21: 30 Mb62 cM (2.1 cM/Mb)Human genome3200 Mb 3615 cM (1.13 cM/Mb)Female genome4460 cMMal

20、e genome 2590 cM Linkage equilibrium and disequilibriumDA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)DA=Da=f(D)*f(A)or(a)dA=da=f(d)*f(A)or(a)- Ratio form genetic distance to basepairs range from 0.01cM/Mb to 60 cM/Mb Linkage equilibrium and disequilibrium 90% of all SNPs are shared among disparate populat

21、ions African populations have smallers blocks (average 7.3kb) comparedwith 16.3kb in Europeans whereas the Chinese and Japanese blocks have an average size of 13.2kb. What do you use with these markers?Candidate gene analysis Based on prior localization information from affected familiesGenome-wide

22、scan定位克隆輔助選擇疾病診斷。分子標(biāo)記的重要作用:為發(fā)現(xiàn)疾病提供了診斷過程。有些遺傳描述詳細(xì)但是分子機(jī)制描述困難的人類疾病很難診斷,如果一個(gè)限制性片段與表型可靠地相關(guān),那么它的存在可用來診斷該種疾病,無論是在出生以前還是出生后。為分離基因提供依據(jù)。如果兩個(gè)位點(diǎn)很少或者從不重組,在遺傳圖譜中限制性片段應(yīng)該距離基因相對(duì)很近。盡管遺傳中“相對(duì)很近”用DNA 堿基對(duì)表示可能是有一定距離,但它提供了一個(gè)使我們沿著DNA 找到基因的起點(diǎn)。RELPs在人類基因組內(nèi)發(fā)生頻繁,對(duì)遺傳作圖是很有用。但HapMapCatalog of common human genetic variation across

23、the genome“Common” was taken to mean that the more rare allele was in at least 5% of the population1 Million SNPs were genotyped in 269 samples comprising 4 populationsAssociations between SNPs have been identified and cataloguedMarker Selection for Whole Genome StudiesUsing information from the Hap

24、Map, it is possible to select a set of 300,000-600,000 SNPs that will represent all variation in the genomeUsing array technologies, it is possible to genotype this many SNPs at once based on Common Disease-Common Variant HypothesisMultiple PopulationsThe DNA samples for the HapMap have come from a

25、total of 270 people. The Yoruba people of Ibadan, Nigeria, provided 30 sets of samples from two parents and an adult child (each such set is called a trio). In Japan, 45 unrelated individuals from the Tokyo area provided samples. In China, 45 unrelated individuals from Beijing provided samples. Thir

26、ty U.S. trios provided samples, which were collected in 1980 from U.S. residents with northern and western European ancestry by the Centre dEtude du Polymorphisme Humain (CEPH). 大量的SNP 連鎖不平衡 構(gòu)成了 豐富多態(tài)性The hapMap(haplotype map Post-genome確定限制性圖譜的突變點(diǎn)更困難一些。偶然它們將改變限制性酶的目標(biāo)切點(diǎn),但它們就保持不可探測(cè)性,因?yàn)橄拗菩云蔚脑谝吧秃屯蛔冃捅3?/p>

27、著同樣大小。有時(shí),探測(cè)通過它們對(duì)單鏈DNA較短的片段的移動(dòng)的影響是可以探測(cè)其順序變化的,在一項(xiàng)叫作單鏈構(gòu)型多態(tài)性(SSCP)的技術(shù)即可達(dá)到此項(xiàng)目的。但是在DNA更大區(qū)域內(nèi)尋找堿基替代物時(shí),決定核苷酸DNA的順序?qū)⒎浅1匾?。聚合酶鏈反?yīng)-單鏈構(gòu)象多態(tài)性分析(Single Strand Conformation Polymorphism Analysis of Polymerase Chain Reaction Products, PCR-SSCP)是近年來發(fā)展起來的一種基因分析方法。 PCR-SSCP分析的基本程序?yàn)椋菏紫萈CR擴(kuò)增特定靶序列,然后將擴(kuò)增產(chǎn)物變性為單鏈,進(jìn)行非變性聚丙烯酰胺凝膠

28、電泳。相同長(zhǎng)度的DNA單鏈其序列不同,甚至單個(gè)堿基不同,所形成的構(gòu)象不同,電泳遷移率也不同。PCR產(chǎn)物變性后,單鏈產(chǎn)物經(jīng)中性聚丙烯酰胺凝膠電泳,靶DNA中含單堿基置換,或數(shù)個(gè)堿基插入或缺失等改變時(shí),因遷移率變化會(huì)出現(xiàn)泳動(dòng)變位,從而可將變異DNA與正常DNA區(qū)分開。PCR-SSCP分析技術(shù)是一種DNA單鏈凝膠電泳技術(shù),該技術(shù)已被廣泛用于癌基因和抗癌基因變異的檢測(cè)、高分別率的分子標(biāo)記遺傳圖譜Using microsatellite repeats as molecular markers for mapping. A hybridization pattern is shown for a fam

29、ily with six children, and this pattern is interpreted at the top of the illustration with the use of four different-sized microsatellite “alleles,” M through M, one of which (M) is probably linked in cis configuration to the disease allele P.Four alleles for a restriction marker are found in all po

30、ssible pairwise combinations, and segregate independently at each generation. Photograph kindly provided by Ray White.圖2.7 限制片段長(zhǎng)度多態(tài)性(RFLP)可以按孟德爾方式遺傳,四種等位基因在每代中獨(dú)立地分離,但圖中經(jīng)限制消化后所有Figure 2.7 Restriction site polymorphisms are inherited according to Mendelian rules.Figure 2.8 A restriction polymorphism c

31、an be used as a genetic marker to measure recombination distance from a phenotypic marker (such as eye color). The figure simplifies the situation by showing only the DNA bands corresponding to the allele of the other genome in a diploid. 圖2.8 可用限制酶多態(tài)性作為遺傳標(biāo)記,測(cè)量?jī)蓚€(gè)重組子表型(如眼睛的顏色)所對(duì)應(yīng)的遺傳學(xué)距離。圖2.8 中做了簡(jiǎn)化,僅將有

32、關(guān)的等位基因列出。Figure 2.9 If a restriction marker is associated with a phenotypic characteristic, the restriction site must be located near the gene responsible for the phenotype. 圖2.9 如果某限制性標(biāo)記與一個(gè)表型相關(guān),則該限制酶位點(diǎn)必定位于決定此表型的基因附近。圖中,突變將正常人普遍存在的帶轉(zhuǎn)換成病人中普遍存在的帶。The mutation changing the band that is common in normal

33、 people into the band that is common in patients is very closely linked to the disease gene.Figure 2.13 All functional globin genes have an interrupted structure with three exons. . 2.4 Organization of interrupted genes may be conservedinterruptions occur at homologous positions in all known active

34、globin genes:mammals, birds, and frogs. The first short, and the second longer, but the actual lengths can vary. Most of variation from the second intron. In the mouse, the second intron in the -globin gene is only 150 bp long, tatol 850 bp, compared with the major -globin gene where the intron leng

35、th of 585 bp gives the gene a total length of 1382 bp. The variation in length of the genes is much greater than the range of lengths of the mRNAs (-globin mRNA = 585 bases, -globin mRNA = 620 bases). Intron types, universal and conservationAll classes of genes may be interrupted: nuclear genes codi

36、ng for proteins, nucleolar genes coding for rRNA, and genes coding for tRNA. Interruptions also are found in mitochondrial genes in lower eukaryotes, and in chloroplast genes. Interrupted genes do not appear to be excluded from any class of eukaryotes, and have been found in bacteria and bacteriopha

37、ges, although they are extremely rare in prokaryotic genomes.2.4 Organization of interrupted genes may be conserved高等 真核生物多數(shù)基因都有內(nèi)含子,沒有內(nèi)含于的僅占極少數(shù)。裂殖酵母較多釀酒酵母只有少數(shù)基因有內(nèi)含子,大腸桿菌T4噬菌體、枯草桿菌spo1噬菌體和藍(lán)細(xì)菌少數(shù)基因有內(nèi)含子。線粒體、葉綠體基因也有內(nèi)含子。不但編碼蛋白質(zhì)的基因有,編碼 tRNA的基因也有內(nèi)含子。不同生物的同一基因,內(nèi)含子長(zhǎng)度盡管 變化很大,但數(shù)目、位置往往相同。一般, 一內(nèi)含子序列不會(huì)見之于另一內(nèi)合子,而外顯

38、子則往往和蛋白 質(zhì)的功能性結(jié)構(gòu)域相對(duì)應(yīng)。因此曾設(shè)想內(nèi)含子對(duì)于外顯子重新組合以促進(jìn)基因大步伐進(jìn)化起著重要作用。由于內(nèi)含子中信息 量小,在此處改組(shuffling),不會(huì)危及外顯子的功能結(jié)構(gòu)域。此看法是認(rèn)為一切生物原來都有內(nèi)含子,以后不斷進(jìn)化,原 核生物由于基因組小、復(fù)制快,內(nèi)含子成為快速復(fù)制的包袱,因 此逐漸失去。不同生物同一基因的內(nèi)含子數(shù)目、位置一致,是 其旁證。與此相反的一種看法認(rèn)為生物本來沒有內(nèi)含子,內(nèi)含子 是由于外顯子改組位置不準(zhǔn)確而來的。所以原核生物內(nèi)含子極少, 低等真核生物少,高等真核生物多. 酵母細(xì)胞色素c基因無內(nèi)含子,而人、鼠有之。內(nèi)含子回歸與傳染這又是個(gè)雞生蛋、蛋生雞的問題

39、。因此,自然而然地出現(xiàn)了 中問路線。孰是孰非,一時(shí)難于作出正確判斷。內(nèi)含子按其連接位點(diǎn)的結(jié)構(gòu)和剪接方式來分,可以分為三類, 即I類、II類和一般核Pre-mRNA類。I類: 4個(gè)保守序列 2個(gè)不大保守序列 E-EP(AUGGUGG-AAA), 排列:Q(AAUCAGCAGG), 5-E-P-Q-R-E-S-3R(UCAGAGACUACA), 真菌線粒體/葉綠體/四膜蟲rRNAS(AAGAUAUAGUCC) /T偶數(shù)噬菌體II類: 少數(shù)真菌線粒體/大多數(shù)葉綠體/植物線粒體70個(gè)II類內(nèi)含子分析:6個(gè)區(qū)I A B C (C1/C2) D (D1/D2) II III .VIII類內(nèi)含子 按其大 小

40、和結(jié)構(gòu)來說,又可分為普通的II類、III類和孿生內(nèi)含子 (twintron)三類。II類內(nèi)含子比較大,可達(dá)600核苷酸以上,有6個(gè)結(jié)構(gòu)域。III類內(nèi)含子可以看作是II類的缺失突變體,除II類的 結(jié)構(gòu)域VI保持完整外,結(jié)構(gòu)域I、Il、III、IV、V可以缺失,因 此比II類內(nèi)含子小很多,一般不超過150個(gè)核苷酸。孿生內(nèi)含子 是在III類內(nèi)含子(稱為外內(nèi)合子,)結(jié)構(gòu)域VI的上 游,插入了另一個(gè)甚至幾個(gè)II類(也有I類)內(nèi)含子(稱為內(nèi)內(nèi) 含子)。其實(shí)由兩個(gè)I類內(nèi)含子組成的孿生內(nèi)含子 也是有的。原生動(dòng)物有I類內(nèi)含子。最近報(bào) 道小球藻的病毒編碼蛋白質(zhì)(和TFIIS同源)的基因和14. 2kDa 可讀框有

41、I類內(nèi)含子。各類內(nèi)含子剪接的共同點(diǎn)是二步轉(zhuǎn)酯鍵 反應(yīng);不同點(diǎn)是I類、Il類都是自我剪接,一般核pre-mRNA類 則得有剪接體參加;Il類和核premRNA的剪接都有套索中間體。以前以為只有線粒體和葉綠體才有II類內(nèi)含子。后來按II類 內(nèi)含子中員為保守的序列合成引物,用聚合酶鏈?zhǔn)椒磻?yīng)從葉綠體的祖先藍(lán)細(xì)菌和線粒體的祖先紫細(xì)菌都擴(kuò)增、克隆到了II類內(nèi)含子. 因此,認(rèn)為現(xiàn)代核基因內(nèi)含子可能來源于II類內(nèi)含子。 從 剪接反應(yīng)的立體化學(xué)來看,PremRNA的剪接和II類內(nèi)含子的剪 接相似。但三類內(nèi)含子剪接是否有進(jìn)化上的聯(lián)系,迄今還沒有 明確的答案。有些pre-tRNA也有內(nèi)含子。由于pre-tRNA的結(jié)

42、構(gòu) 相對(duì)恒定,內(nèi)含子位置一定,剪接的信息不在內(nèi)含子而在外顯子, 剪接由酶進(jìn)行,與上面三類內(nèi)含子剪接的關(guān)系很小。 GT-AG 有些基因的外顯子不但被內(nèi)含子隔開,而且彼此相距甚遠(yuǎn)。例如,地錢的葉綠體核糖體蛋白s12基因由3個(gè)外顯子組成;3端的兩個(gè)外顯子由一股DNA編碼,5端的外顯子由另一股DNA編碼;兩者相距30 kb,萊茵衣藻MA基因的三個(gè)外顯子分別相距50、90kb;這類premRNA要經(jīng)過反式剪接,才能成為成熟的mRNA。錐蟲只有反式剪接,線蟲有10一15的PremRNA是反式剪接;甚至同一基因、既可順式、又可反式剪接,得到不同的mRNA。內(nèi)含子由此一基因轉(zhuǎn)移到另一基因,稱為轉(zhuǎn)座。用PCR法

43、證明酵母線粒體II類內(nèi)含子al1轉(zhuǎn)座到cox1。Podospora anserina線粒體cox1基因的II類內(nèi)含子a轉(zhuǎn)座到tRNAIle基因和tRNASer基因之間。Figure 2.14 Mammalian genes for DHFR(dihydrofolate reductase) . gene is organized into 6 exons that correspond to the 2000 base mRNA. But they extend over a much greater length of DNA because the introns are very lon

44、g. In three mammals the exons remain essentially the same, and the relative positions of the introns are unaltered, but the lengths of individual introns vary extensively, resulting in a variation in the length of the gene from 25-31 kb. 2.5 Exon sequences are conserved but introns vary外顯子序列保守,內(nèi)含子序列

45、多變比較大的基因DHFR球蛋白和DHFR基因說明了一個(gè)普遍現(xiàn)象:那些在進(jìn)化過程中相關(guān)的基因有著相類似的結(jié)構(gòu),至少包括了一些內(nèi)含子位置的保守性,基因長(zhǎng)度的變化主要取決于內(nèi)含子長(zhǎng)度的變化。 結(jié)構(gòu)基因在其基因組中是獨(dú)特的嗎?答案可能是模棱兩可的。既是又不是整個(gè)基因的長(zhǎng)度是獨(dú)特的,但其外顯子通常與其它基因外顯子相關(guān)。一般而言,當(dāng)兩個(gè)基因是相關(guān)的,它們外顯子的關(guān)系比內(nèi)含子的關(guān)系更緊密。在特殊情況下,兩個(gè)基因的外顯子可能編碼同一個(gè)蛋白質(zhì),但其內(nèi)含子可能不同。說明這兩個(gè)基因可能起源于一個(gè)共同的祖先基因,拷貝間內(nèi)含子差異積累,但因編碼蛋白質(zhì)功能的需要,其外顯子區(qū)域是保守。外顯子可能是基因進(jìn)化的基礎(chǔ),它們可以通

46、過不同的方式進(jìn)行組合。一個(gè)基因可能含有幾個(gè)與其他基因相關(guān)的外顯子,但也存在一些并不相關(guān)的外顯子。一般而言,此時(shí)其內(nèi)含子也不相關(guān)。這些基因可能是由同一些外顯子經(jīng)復(fù)制和轉(zhuǎn)移產(chǎn)生的。兩個(gè)基因的相似性可用點(diǎn)陣作圖進(jìn)行比較(圖2.15)。一個(gè)點(diǎn)表明該位置上基因的序列相同。如果兩個(gè)序列完全相同,則點(diǎn)組成一條45 度的直線。若存在不相似區(qū),則直線會(huì)被打斷,并且另一個(gè)相關(guān)序列的缺失或插入會(huì)使其平行或垂直地被替換。Figure 2.15 The sequences of the mouse maj and min globin genes are closely related in coding region

47、s, but differ in the flanking regions and large intron. The line peters out in the flanking regions and in the large intron This is a typical pattern, in which coding sequences are well related, the relationship can extend beyond the boundaries of the exons, but it is lost in longer introns and the

48、regions on either side of the gene. 內(nèi)含子趨異的模式也包括大小的變化(由插入和缺失產(chǎn)生)以及堿基組成。內(nèi)含子比外顯子進(jìn)化快。當(dāng)不同種間的基因進(jìn)行比較,有時(shí)其外顯子同源,而內(nèi)含子間變化巨大,甚至不存在任何相關(guān)序列。外顯子和內(nèi)含子中突變率是相同的,但在外顯子中經(jīng)過選擇使突變被更有效地剔除。如此相反,內(nèi)含子不受編碼功能的限制,其自由積累點(diǎn)突變和其他變異更快。這暗示內(nèi)含子沒有序列特意性功能,其存在對(duì)基因是否是必要的目前尚無定論。Genes can be isolated by the conservation of exonsSuppose we know by g

49、enetic data that a particular genetic trait is located in a given chromosomal region. If we lack knowledge about the nature of the gene product, how are we to identify the gene in a region that may be (for example) 1 Mb?Zoo blot describes the use of Southern blotting to test the ability of a DNA pro

50、be from one species to hybridize with the DNA from the genomes of a variety of other species.2.6 Genes can be isolated by the conservation of exons可利用保守的外顯子分離基因Figure 2.17 A zoo blot with a probe from the human Y chromosomal gene zfy identifies cross-hybridizing fragments on the sex chromosomes of o

51、ther mammals and birds. There is one reacting fragment on the Y chromosome and another on the X chromosome. Data kindly provided by Dabid Page. 2.6 Genes can be isolated by the conservation of exons鑒定基因的主要方法大都以外顯子的保守性和內(nèi)含子的多變性比較為基礎(chǔ)。一個(gè)功能在不同種內(nèi)是保守的基因,其代表的蛋白質(zhì)序列應(yīng)該有兩個(gè)性質(zhì):具有一個(gè)開放讀框,并與其他種屬有相關(guān)的序列。這些特點(diǎn)可以用來分離基因。圍

52、饒的一個(gè)克隆開始,沿著染色體這個(gè)區(qū)域步移(Chromosome Walking),從文庫中鑒定重復(fù)基因(如圖2.16)。We start with a clone that lies in the general vicinity of this region and then we walk through the region by identifying overlapping clones from a library. As shown in Figure 2.16, a sub fragment from one end of the first clone is used to

53、isolate clones that extend farther along the chromosome. These clones in turn are used to isolate the next set. In each cycle, a new clone is selected because its restriction map coincides at one end with the end of the previous clone, but at the other end has new material. It is possible to walk fo

54、r hundreds of kb, typically at a rate of 100 kb per month. Chromosome walking allows large contiguous regions of the chromosome to be represented in a library of clones.Figure 2.16 Chromosome walking is accomplished by successive hybridizations between overlapping genomic clones. 2.6Genes can be iso

55、lated by the conservation of exons當(dāng)然,如果染色體的全部序列被確定,鑒定一個(gè)獨(dú)特的基因就更加容易。可從染色體步行中獲得的連續(xù)系列克隆進(jìn)行測(cè)序,或者通過其他方式(比如直接比較序列)使克隆相聯(lián)系。若序列已知,基因可以通過比較其RNA 或蛋白質(zhì)產(chǎn)物來確定,或者通過序列中的一個(gè)突變進(jìn)性鑒定。第一條可以用動(dòng)物印跡法(zoo blot)來證明,首先我們從上述區(qū)域克隆出一小段序列作為探針(放射性標(biāo)記的)。利用Southern blotting的方法和別的物種的相關(guān)DNA雜交,這個(gè)探針常是人的DNA,若發(fā)現(xiàn)在許多物種中都存在與之雜交的片段,我們可以認(rèn)為它是基因的外顯子。這類確

56、定的外顯子經(jīng)測(cè)序后,若證明它們含可譯框,就可被用來分離這個(gè)區(qū)域周圍的基因。若這些都顯示出是外顯子的一部分,則可以繼續(xù)鑒定整個(gè)基因,然后分離相應(yīng)的cDNA或mRNA,最后鑒定蛋白。上述方法對(duì)鑒定那些遺傳上暗示存在但其實(shí)質(zhì)未知的基因來說是寶貴的。一個(gè)例子是利用位于人Y 染色體上的zfy基因作探針,與其它動(dòng)物的性染色體雜交的結(jié)果(圖2.17),該探針能與哺乳動(dòng)物和其他種類的性染色體特異性雜交,含有開放讀框,用于鑒定一個(gè)保守基因。當(dāng)目標(biāo)基因含有很多大的外顯子且很長(zhǎng)時(shí),Zoo blot 方法特別有用。Duchenne肌肉營養(yǎng)不良(DMD,一種肌肉退化失調(diào)癥)基因鑒定,就是其中一例(圖2.18)DMD 基

57、因與X 染色體連鎖,并影響1/3500男子出生。連鎖分析表明DMD 位點(diǎn)位于X 染色體Xp21 條帶上?;糄MD 疾病的病人通常在該條帶上產(chǎn)生DNA重排(Rearrangement)。通過比較X-連鎖DNA探針與患者DNA和正常人的雜交能力,可以獲得重排或患者體內(nèi)相關(guān)的克隆片段。染色體步移用來建立探針兩端的限制性圖譜,范圍可超過100kb 的區(qū)域。通過對(duì)一系列患者中獲得的DNA 分析,確定該區(qū)域有一很大缺失,并在兩個(gè)方向上延伸。最值得一提的是,缺失切除了一個(gè)對(duì)基因功能很重要的片段,并且該基因或至少基因的一部分包含在這個(gè)區(qū)域內(nèi)Figure 2.18 The gene involved in Du

58、chenne muscular dystrophy has been tracked down by chromosome mapping and walking to a region in which deletions can be identified with the occurrence of the disease.2.6 Genes can be isolated by the conservation of exonsThis approach is especially important when the target gene is spread out because

59、 it has many large introns. This proved to be the case with Duchenne muscular dystrophy (DMD), a degenerative disorder of muscle, which is X-linked and affects 1 in 3500 of human male births. The steps in identifying the gene are summarized in Figure 2.10.基因在染色體上的大致區(qū)域確定后,我們需要鑒定它的內(nèi)含子和外顯子。采用zoo blot方法

60、確定了與小鼠X 染色體和其他哺乳動(dòng)物DNA 雜交的片段(圖2.19),詳細(xì)檢查片段內(nèi)是否存在開放讀框和典型的內(nèi)含子-外顯子邊界序列。將符合這些標(biāo)準(zhǔn)的片段作為探針,進(jìn)一步在肌肉mRNA 構(gòu)建的 cDNA 文庫中檢測(cè)同源序列。Figure 2.19 The Duchene muscular dystrophy gene has been characterized by zoo blotting, cDNA hybridization, genomic hybridization, and identification of the protein. 2.6 Genes can be isolat

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論