分子標(biāo)記遺傳圖譜的構(gòu)建方法---完整_第1頁
分子標(biāo)記遺傳圖譜的構(gòu)建方法---完整_第2頁
分子標(biāo)記遺傳圖譜的構(gòu)建方法---完整_第3頁
分子標(biāo)記遺傳圖譜的構(gòu)建方法---完整_第4頁
分子標(biāo)記遺傳圖譜的構(gòu)建方法---完整_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、分子標(biāo)記遺傳圖譜的構(gòu)建檢測出的每個分子標(biāo)記反映的都是相應(yīng)染色體座位上的遺傳多態(tài)性狀態(tài)。 為了有效地分 析利用分子標(biāo)記所提供的遺傳信息, 人們希望知道不同分子標(biāo)記在染色體上的相對位置或排 列情況,也就是要構(gòu)建分子標(biāo)記的遺傳連鎖圖譜。利用 DNA 標(biāo)記構(gòu)建遺傳連鎖圖譜在原理 上與傳統(tǒng)遺傳圖譜的構(gòu)建是一樣的。其基本步驟包括:選擇適合作圖的 DNA 標(biāo)記;根據(jù)遺 傳材料之間的 DNA 多態(tài)性,選擇用于建立作圖群體的親本組合;建立具有大量 DNA 標(biāo)記 處于分離狀態(tài)的 分離群體或衍生系 ;測定作圖群體中不同個體或株系的標(biāo)記基因型; 對標(biāo)記 基因型數(shù)據(jù)進(jìn)行連鎖分析, 構(gòu)建標(biāo)記連鎖圖。 至今為止, 已構(gòu)建了

2、許多植物的高密度分子標(biāo) 記連鎖圖。本章側(cè)重介紹利用 DNA 標(biāo)記構(gòu)建分子遺傳連鎖圖譜的原理與方法。第一節(jié) 作圖群體的建立要構(gòu)建 DNA 標(biāo)記連鎖圖譜,必須建立 作圖群體 。建立作圖群體需要考慮的重要因素包 括親本的選配 、分離群體 類型的選擇 及群體 大小的確定 等。一、親本的選配親本的選擇直接影響到構(gòu)建連鎖圖譜的難易程度及所建圖譜的適用范圍。 一般應(yīng)從四個 方面對親本進(jìn)行選擇,首 先要考慮親本間的 DNA 多態(tài)性 。親本之間的 DNA 多態(tài)性與其親 緣關(guān)系有著密切關(guān)系, 這種親緣關(guān)系可用地理的、 形態(tài)的或同工酶多態(tài)性作為選擇標(biāo)準(zhǔn)。 一 般而言, 異交作物的多態(tài)性高 ,自交作物的多態(tài)性低。例如

3、,玉米的多態(tài)性極好,一般自交 系間配制的群體就可成為理想的 RFLP 作圖群體; 番茄的多態(tài)性較差, 因而只能選用不同種 間的后代構(gòu)建作圖群體;水稻的多態(tài)性居中,美國康乃爾大學(xué) S.D.Tanksley 實驗室 1988 年 發(fā)表的 RFLP 連鎖圖譜是以秈稻和爪哇稻之間的雜交組合為基礎(chǔ)構(gòu)建的( McCouch et al. 1988)。在作物育種實踐中,育種家常將野生種的優(yōu)良性狀轉(zhuǎn)育到栽培種中,這種親源關(guān)系 較遠(yuǎn)的雜交轉(zhuǎn)育, DNA 多態(tài)性非常豐富。第二,選擇親本時應(yīng)盡量選用純度高的材料,并 進(jìn)一步通過自交進(jìn)行純化。第三,要考慮雜交后代的可育性。 親本間的差異過大, 雜種染色 體之間的配對和

4、重組會受到抑制, 導(dǎo)致連鎖座位間的 重組率偏低 ,并導(dǎo)致嚴(yán)重的 偏分離現(xiàn) 象, 降低所建圖譜的可信度和適用范圍; 嚴(yán)重的還會降低雜種后代的結(jié)實率, 甚至導(dǎo)致不育, 影 響分離群體的構(gòu)建。 由于各種原因, 僅用一對親本 的分離群體建立的遺傳圖譜往往不能完全 滿足基因組研究和各種育種目標(biāo)的要求,應(yīng)選用幾個不同的親本組合,分別進(jìn)行連鎖作圖,以達(dá)到相互彌補的目的。第四,選配親本時還應(yīng)對親本及其F1 雜種進(jìn)行細(xì)胞學(xué)鑒定。若雙親間存在相互易位, 或多倍體材料(如小麥) 存在單體或部分染色體缺失等問題, 那末其后 代就 不宜用來構(gòu)建連鎖圖譜 。二、分離群體類型的選擇根據(jù)其遺傳穩(wěn)定性可將分離群體分成兩大類:一

5、類稱為暫時性分離群體,如F2、 F3、F4、bc、三交群體等,這類群體中分離單位是個體,一經(jīng)自交或近交其遺傳組成就會發(fā)生 變化,無法永久使用。另一類稱為永久性分離群體,如RI 、 DH 群體等,這類群體中分離單位是株系, 不同株系之間存在基因型的差異, 而株系內(nèi)個體間的基因型是相同且純合的, 是 自交不分離的。 這類群體可通過自交或近交繁殖后代, 而不會改變?nèi)后w的遺傳組成, 可以永 久使用。構(gòu)建 DNA 連鎖圖譜可以選用不同類型的分離群體,它們各有其優(yōu)缺點,因此應(yīng)結(jié)合具 體情況選用。(一)F2 代群體F2群體是常用的作圖群體,迄今大多數(shù)植物的DNA標(biāo)記連鎖圖譜都是 用F2群體構(gòu)建的。不論是自花

6、授粉植物,還是異花授粉植物,建立F2群體都是容易的,這是使用 F2群體進(jìn)行遺傳作圖的最大優(yōu)點。但 F2群體的一個不足之處是存在雜合基因型。對于顯性標(biāo)記, 將無法識別顯性純合基因型和雜合基因型。 由于這種基因型信息簡并現(xiàn)象的存在, 會降低作 圖的精度。而為了提高精度,減小誤差,則必須使用較大的群體,從而會增加DNA 標(biāo)記分析的費用。F2 群體的另一個缺點是不易長期保存,有性繁殖一代后,群體的遺傳結(jié)構(gòu)就會發(fā)生變 化。為了延長 F2 群體的使用時間,一種方法是對其進(jìn)行無性繁殖,如進(jìn)行組織培養(yǎng)擴繁。 但這種方法不是所有的植物都適用,且耗資費工。另一種方法是使用F2 單株的衍生系( F3株系或F4家系)

7、。將衍生系內(nèi)多個單株混合提取 DNA,則能代表原F2單株的DNA組成。 為了保證這種代表性的真實可靠, 衍生系中選取的單株必須是隨機的, 且數(shù)量要足夠多。 這 種方法對于那些繁殖系數(shù)較大的自花授粉植物(如水稻、小麥等)特別適用。(二)BC1 群體BCi (回交一代)也是一種常用的作圖群體。BCi群體中每一分離的基因座只有兩種基因型,它直接反映了 Fi代配子的分離比例,因而BCi群體的作圖效率最高,這是它優(yōu)于F2群體的地方。BCi群體還有一個用途,就是可以用來檢驗雌、雄配子在基因間的重組率上是 否存在差異。 其方法是比較正、 反回交群體中基因的重組率是否不同。 例如正回交群體為 (A X B )

8、X A,反回交群體為 A X( A X B),則前者反映的是雌配子中的重組率,后者反映的 是雄配子中的重組率。雖然BCi群體是一種很好的作圖群體,但它也與F2群體一樣,存在不能長期保存的問題??梢杂肍2中使用的類似方法來延長 BCi群體的使用時間。另外,對于一些人工雜交比 較困難的植物,BCi群體也不太合適,因為一是難以建立較大的 BCi群體,二是容易出現(xiàn)假 雜種,造成作圖的誤差。順便一提,對于一些自交不親和的材料,可以使用三交群體,即(A XB)X C。由于存在自交不親和性,這樣的三交群體中不存在假雜種現(xiàn)象。(三)RI 群體RI (重組自交系)群體是雜種后代經(jīng)過多代自交而產(chǎn)生的一種作圖群體,

9、通常從F2代開始,采用單粒傳的方法來建立。由于自交的作用是使基因型純合化,因此,RI 群體中每個株系都是純合的,因而 RI 群體是一種可以長期使用的永久性分離群體。理論上,建立一 個無限大的 RI 群體, 必須自交無窮多代才能達(dá)到完全純合; 建立一個有限大小的 RI 群體則 只需自交有限代。然而,即使是建立一個通常使用的包含 i00200 個株系的 RI 群體,要達(dá) 到完全純合,所需的自交代數(shù)也是相當(dāng)多的。據(jù)吳為人等(i997)從理論上推算,對一個擁有iO條染色體的植物種,要建立完全純合的RI作圖群體,至少需要自交 i5代。可見,建立 RI 群體是非常費時的。在實際研究中,人們往往無法花費那么

10、多時間來建立一個真正的 RI群體,所以常常使用自交67代的“準(zhǔn)” RI群體。從理論上推算,自交6代后,單個基因座的雜合率只有大約3%,已基本接近純合。然而,由于構(gòu)建連鎖圖譜時涉及到大量的DNA 標(biāo)記座位,因而雖然多數(shù)標(biāo)記座位已達(dá)到或接近完全純合,但仍有一些標(biāo)記座位存在 較高的雜合率,有的高達(dá)20%以上(李維明等2000)。盡管如此,實踐證明,利用這樣的“準(zhǔn)” RI 群體來構(gòu)建分子標(biāo)記連鎖圖譜仍是可行的。在RI群體中,每一分離座位上只存在兩種基因型,且比例為i:i。從這點看,RI群體的遺傳結(jié)構(gòu)與 BCi 相似, 也反映了 Fi 配子的分離比例。但值得注意的是,當(dāng)分析RI 群體中兩個標(biāo)記座位之間的

11、連鎖關(guān)系時,算得的重組率比例并不等于F1 配子中的重組率,這是因為在建立 RI 群體的過程中, 兩標(biāo)記座位間每一代都會發(fā)生重組, 所以 RI 群體中得到的重組 率比例是多代重組頻率的積累。不過,從理論上可以推算出,RI群體中的重組比例(R)與Fi配子中的重組率(r)之間的關(guān)系為:R=2r/(1+2r)。因此,用RI群體仍然可以估計重組率, 亦即 RI 群體仍然可以用于遺傳作圖。RI 群體的優(yōu)點是可以長期使用,可以進(jìn)行重復(fù)試驗。因此它除了可用于構(gòu)建分子標(biāo)記 連鎖圖外,特別適合于數(shù)量性狀基因座( QTL )的定位研究。但是,考慮到構(gòu)建 RI 群體要 花費很長時間,如果僅是為了構(gòu)建分子標(biāo)記連鎖圖的話

12、,選用RI 群體是不明智的。另外,異花授粉植物由于存在自交衰退和不結(jié)實現(xiàn)象,建立 RI 群體也比較困難。(四)DH 群體高等植物的單倍體(Haploid )是含有配子染色體數(shù)的個體。單倍體經(jīng)過染色體加倍形 成的二倍體稱為加倍單倍體或雙單倍體(DH )。 DH 群體產(chǎn)生的途徑很多,亦因物種不同而異,最常見的方法是通過花藥培養(yǎng),即取F1 植株的花藥進(jìn)行離體培養(yǎng),誘導(dǎo)產(chǎn)生單倍體植株,然后對染色體進(jìn)行加倍產(chǎn)生 DH 植株。 DH 植株是純合的,自交后即產(chǎn)生純系,因此 DH 群體可以穩(wěn)定繁殖,長期使用,是一種永久性群體。DH 群體的遺傳結(jié)構(gòu)直接反映了 F1配子中基因的分離和重組,因此DH群體與BCi群體

13、一樣,作圖效率是最高的。 另外,由于DH 群體跟 RI 群體一樣,可以反復(fù)使用,重復(fù)試驗,因此也特別適合于QTL 定位的研究。DH 群體直接從 Fi 花粉經(jīng)培養(yǎng)產(chǎn)生,因而建立DH 群體所需時間不多。但是,產(chǎn)生 DH植株有賴于花培技術(shù)。 有些植物的花藥培養(yǎng)非常困難, 就無法通過花培來建立 DH 群體。 另 外,植物的花培能力跟基因型關(guān)系較大, 因而花培過程會對不同基因型的花粉產(chǎn)生選擇效應(yīng), 從而破壞 DH 群體的遺傳結(jié)構(gòu), 造成較嚴(yán)重的偏分離現(xiàn)象, 這會影響遺傳作圖的準(zhǔn)確性。 因 此,如果是以構(gòu)建分子標(biāo)記連鎖圖為主要目的的話,DH 群體不是一種理想的作圖群體。三、群體大小的確定遺傳圖譜的分辨率和

14、精度,很大程度上取決于群體大小。群體越大,則作圖精度越高。但群體太大, 不僅增大實驗工作量, 而且增加費用。 因此確定合適的群體大小是十分必要的。 合適群體大小的確定與作圖的內(nèi)容有關(guān)。大量的作圖實踐表明,構(gòu)建DNA 標(biāo)記連鎖圖譜所 需的群體遠(yuǎn)比構(gòu)建形態(tài)性狀特別是數(shù)量性狀的遺傳圖譜要小, 大部分已發(fā)表的分子標(biāo)記連鎖 圖譜所用的分離群體一般都不足 100 個單株或家系。 而如果用這樣大小的群體去定位那些控 制農(nóng)藝性狀尤其是數(shù)量性狀的基因, 就會產(chǎn)生很大的試驗誤差。 從作圖效率考慮, 作圖群體 所需樣本容量的大小取決于以下兩個方面: 一是從隨機分離結(jié)果可以辨別的最大圖距, 二是 兩個標(biāo)記間可以檢測到

15、重組的最小圖距。因此,作圖群體的大小可根據(jù)研究的目標(biāo)來確定。 作圖群體越大, 則可以分辨的最小圖距就越小, 而可以確定的最大圖距也越大。 如果建圖的 目的是用于基因組的序列分析或基因分離等工作, 則需用較大的群體, 以保證所建連鎖圖譜 的精確性。 在實際工作中, 構(gòu)建分子標(biāo)記骨架連鎖圖可基于大群體中的一個隨機小 群體(如 150 個單株或家系) ,當(dāng)需要精細(xì)地研究某個連鎖區(qū)域時, 再有針對性地在骨架連鎖圖的基 礎(chǔ)上擴大群體。這種大小群體相結(jié)合的方法,既可達(dá)到研究的目的,又可減輕工作量。作圖群體大小還取決于所用群體的類型。如常用的F2和BCi兩種群體,前者所需的群體就必須大些。這是因為, F2

16、群體中存在更多種類的基因型,而為了保證每種基因型都有 可能出現(xiàn),就必須有較大的群體。一般而言,F(xiàn)2 群體的大小必須比 BC1 群體大約大一倍,才能達(dá)到與BCi相當(dāng)?shù)淖鲌D精度。所以說,BCi的作圖效率比F2高得多。在分子標(biāo)記連鎖圖的構(gòu)建中,DH群體的作圖效率在統(tǒng)計上與 BCi相當(dāng),而RI群體則稍差些??偟恼f來, 在分子標(biāo)記連鎖圖的構(gòu)建方面,為了達(dá)到彼此相當(dāng)?shù)淖鲌D精度,所需的群體大小的順序為 F2>RI>BC i 和 DH 。第二節(jié) 圖譜構(gòu)建的理論基礎(chǔ)一、染色體遺傳理論1903年W. S. Sutton和T. Boveri分別提出了遺傳因子位于染色體上的理論,他們將染色體看作是孟德爾基

17、因的物理載體。該理論亦稱為 Sutton-Boveri 染色體遺傳理論,其基本要 點如下:(1)體細(xì)胞核內(nèi)的染色體成對存在,其中一條來自雌親,一條來自雄親,成對染色 體的兩個成員是同源的。 (2)每條染色體在個體的生命周期中均能保持其結(jié)構(gòu)上的恒定性和 遺傳上的連續(xù)性,因而在個體的發(fā)育過程中起著一定的作用。(3)在減數(shù)分裂中,同源染色體的兩個成員相互配對,隨后又發(fā)生分離,走向細(xì)胞的兩極,從而形成兩個單倍體性細(xì)胞。二、基因重組和連鎖理論連鎖圖譜構(gòu)建的理論基礎(chǔ)是染色體的交換與重組。在細(xì)胞減數(shù)分裂時,非同源染色體上的基因相互獨立、自由組合,同源染色體上的基因產(chǎn)生交換與重組,交換的頻率隨基因間距離的增加

18、而增大。位于同一染色體上的基因在遺傳過程中一般傾向于維系在一起,而表現(xiàn)為基因連鎖。它們之間的重組是通過一對同源染色體的兩個非姊妹染色單體之間的交換來實現(xiàn) 的。假設(shè)某一對同源染色體上存在A-a,B-b兩對連鎖基因,現(xiàn)有兩個親本Pi和P2,它們的基因型分別為 AABB和aabb,兩親本雜交產(chǎn)生 AaBb雙雜合體。Fi在減數(shù)分裂過程中應(yīng) 產(chǎn)生4種類型的配子,其中兩種為親型配子AB和ab,兩種為重組型配子 Ab和aB。由于A-a和B-b位于同一染色體上,要產(chǎn)生重組型配子必須在這兩個基因的連鎖區(qū)段上發(fā)生交換。重組型配子所占的比例取決于減數(shù)分裂細(xì)胞中發(fā)生交換的頻率。交換頻率越高,則重組型配子的比例越大。重

19、組型配子最大可能的比例是50%,這時在所有減數(shù)分裂的細(xì)胞中,在兩對基因的連鎖區(qū)段上都發(fā)生交換,相當(dāng)于這兩對基因間無連鎖,表現(xiàn)為獨立遺傳。重組型配子占總配子的比例稱為 重組率,用r表示。重組率的高低取決于交換的頻率, 而兩對基因之間的交換頻率取決于它們之間的直線距離。重組率的值變化于完全連鎖時的 0%到完全獨立時的 50%之間。因此重組率可用來表示基因間的遺傳圖距,圖距單位用厘摩(centi-Morgan , cM)表示,icM的大小大致符合 1%的重組率。三、圖譜制作的統(tǒng)計學(xué)原理(一) 兩點測驗如果兩個基因座位于同一染色體上且相距較近,則在分離后代中通常表現(xiàn)為連鎖遺傳。對兩個基因座之間的連鎖關(guān)

20、系進(jìn)行檢測,稱為兩點測驗。在進(jìn)行連鎖測驗之前,必須了解各基因座位的等位基因分離是否符合孟德爾分離比例,這是連鎖檢驗的前提。在共顯性條件下,F(xiàn)2群體中一個座位上的基因型分離比例為1:2:1,而BC1和DH群體中分離比例均為 1:1 ;在顯性條件下,F(xiàn)2群體中分離比例為 3:1,而BC1和DH群體中分離比例仍為 1:1。檢驗DNA 標(biāo)記的分離是否偏離孟德爾比例,一般采用2檢驗。只有當(dāng)待檢驗的兩個基因座各自的 分離比例正常時,才可進(jìn)行這兩個座位的連鎖分析。在 DNA 標(biāo)記連鎖圖譜的制作過程中,常常會遇到大量 DNA 標(biāo)記偏離孟德爾分離比例的異 常分離現(xiàn)象,這種異常分離在遠(yuǎn)緣雜交組合的分離群體及 DH

21、 和 RI 群體中尤為明顯。目前 在水稻中已發(fā)現(xiàn)了十余個與異常分離有關(guān)的基因座位, 這些基因座位可能影響配子生活力和 競爭力,導(dǎo)致配子選擇,從而產(chǎn)生異常分離。異常分離會使連鎖的檢驗受到影響,一些本來不存在連鎖的標(biāo)記由于各自的異常分離, 可能誤導(dǎo)得出連鎖的結(jié)論, 而另一些本來連鎖著的標(biāo)記也有可能由于異常分離而無法檢測到 連鎖。發(fā)生嚴(yán)重異常分離的標(biāo)記一般不應(yīng)用于連鎖作圖。 將分離比的檢驗與連鎖檢驗相結(jié)合, 是實際分析過程中解決異常分離的常用方法。在一般的遺傳學(xué)教材中, 重這種估計方法無法得到采用最大似然法進(jìn)行重兩個連鎖座位不同基因型出現(xiàn)的頻率是估算重組值的基礎(chǔ)。組值的估計是根據(jù)分離群體中重組型個體

22、占總個體的比例來估計的。估計值的標(biāo)準(zhǔn)誤, 因而無法對估值進(jìn)行顯著性檢驗和置信區(qū)間估計。組率的估計可解決這一問題。 最大似然法以滿足其估計值在觀察結(jié)果中出現(xiàn)的概率最大為條 件。在人類遺傳學(xué)研究中, 由于通常不知道父母的基因型或父母中標(biāo)記基因的連鎖相是相斥 還是相引, 因而無法簡單地通過計算重組體出現(xiàn)的頻率來進(jìn)行連鎖分析,而必須通過適當(dāng)?shù)慕y(tǒng)計模型來估算重組率, 并采用似然比檢驗的方法來推斷連鎖是否存在,即比較假設(shè)兩座位間存在連鎖( r < 0.5)的概率與假設(shè)沒有連鎖( r = 0.5)的概率。這兩種概率之比可以用似然比統(tǒng)計量來表示,即L (r) /L (0.5),其中L ()為似然函數(shù)。為

23、了計算方便,常將L (r)/L( 0.5)取以 10 為底的對數(shù),稱為 LOD 值。為了確定兩對基因之間存在連鎖,一般要求 似然比大于 1000:1,即 LOD>3 ;而要否定連鎖的存在, 則要求似然比小于 100:1,即 LOD<2 。在其它生物遺傳圖譜的構(gòu)建中, 似然比的概念也用來反映重組率估值的可靠性程度或作 為連鎖是否真實存在的一種判斷尺度。(二) 多點測驗兩點測驗是最簡單, 也是最常用的連鎖分析方法。 然而, 在構(gòu)建分子標(biāo)記連鎖圖中,每 條染色體都涉及到許多標(biāo)記座位。 遺傳作圖的目的就是要確定這些標(biāo)記座位在染色體上的正 確排列順序及彼此間的遺傳圖距。 所以, 這里涉及到一

24、個同時分析多個基因座之間連鎖關(guān)系 的問題。這個問題看似簡單,其實挺復(fù)雜,因為對于 m 個連鎖座位,就有 m!/2 種可能的排 列順序。例如,若 m = 10,則共有 1,814,400 種可能。要從這么多種可能中挑選出正確的順序,確實沒那么容易。這項工作用兩點測驗方法是難以完成的, 因為它每次只能分析兩個座 位間的連鎖關(guān)系。由于兩點測驗估得的重組率存在誤差, 因此,根據(jù)比較不同座位之間重組 率大小來確定座位的排列順序是不可靠的,很可能存在錯誤。為了解決這個問題,就必須同時對多個座位進(jìn)行聯(lián)合分析,利用多個座位間的共分離信息來確定它們的排列順序,也就是進(jìn)行多點測驗。在事先未知各基因座位于哪條染色體

25、的情 況下,可先進(jìn)行兩點測驗,根據(jù)兩點測驗的結(jié)果,將那些基因座分成不同的連鎖群,然后再對各連鎖群(染色體)上的座位進(jìn)行多點連鎖分析。與兩點測驗一樣,多點測驗通常也采用似然比檢驗法。先對各種可能的基因排列順序進(jìn)行最大似然估計,然后通過似然比檢驗確定出可能性最大的順序。在每次多點測驗中,不能包含太多的座位,否則可能的排列數(shù)會非常大,即使使用高速的計算機,也要花費很長的時間。在一條染色體上,經(jīng)過多次多點測驗,就能確定出最佳的基因排列順序,并估計出相鄰 基因間的遺傳圖距,從而構(gòu)建出相應(yīng)的連鎖圖。對于在兩點測驗中沒能歸類到某個連鎖群(染色體)的基因座,可在各連鎖群的連鎖圖初步建成之后,再嘗試定位到某個連

26、鎖群上。但在構(gòu)建分子標(biāo)記連鎖圖的實際研究中,往往總有一些標(biāo)記無法定位到染色體上。造成這種現(xiàn)象的原因,主要可能是在測定標(biāo)記基因型時存在錯誤。(三)交換干擾與作圖函數(shù)隨著間距的增加,兩個基因座之間便可能在兩處同時發(fā)生遺傳物質(zhì)的交換,即雙交換。在染色體某區(qū)段上發(fā)生的雙交換,其實際頻率往往少于由單交換概率相乘所估得的理論值。這是因為一個位置上所發(fā)生的交換會減少其周圍另一個單交換的發(fā)生,這種現(xiàn)象稱為交叉干擾。干擾的程度可用符合系數(shù) C表示,符合系數(shù)C為實際雙交換值與理論雙交換值的比值。 理論雙交換值是指兩個相鄰的單交換同時獨立發(fā)生的概率。實際雙交換實際雙交換C= = 理論雙交換 值訂2C的值變動于01之

27、其中ri和也分別為兩個相鄰染色體區(qū)段發(fā)生單交換的概率。符合系數(shù) 間。當(dāng)C=0時,表示完全干擾,沒有雙交換發(fā)生;當(dāng) C=1時,表示沒有干擾,兩單交換獨立發(fā)生。一般而言,兩單交換的位置相距越遠(yuǎn),則彼此干擾的程度就越低,符合系數(shù)就越大。要計算兩個相距較遠(yuǎn)的基因座之間的圖距時,如果中間沒有其它基因座可利用,則兩個基因座之間實際發(fā)生的雙交換就不能被鑒別出來,因此,采用一些數(shù)學(xué)方法進(jìn)行矯正是必要的,否則,從 重組率估計出的圖距就會比真實圖距小。這種矯正可通過作圖函數(shù)來實現(xiàn)。在C=1的假定下,圖距 x與重組率r之間的關(guān)系服從 Haldane作圖函數(shù):x=-( 1/2)In( 1-2r)其中x以M為單位。這里

28、 M讀作Morgan (摩爾根),它是用著名遺傳學(xué)家摩爾根的姓命名 的,并取第一個字母表示。1M=100cM (厘摩),1cM為一個遺傳單位,即1%的重組率。根據(jù)Haldane作圖函數(shù),20%的重組率相當(dāng)于圖距為 -(1/2)ln( 1-2X 0.20) = 0.255M,即25.5cM。Haldane作圖函數(shù)的不合理之處在于假定了完全沒有交叉干擾。為了將交叉干擾的因素考慮進(jìn)去,一種比較合理的假設(shè)是,雙交換符合系數(shù)與重組率之間存在線性關(guān)系,即C=2r。該式表示,C值隨r的增加而增加,干擾相應(yīng)減弱。當(dāng) r=0.5 (即沒有連鎖)時,C=1 (即沒 有干擾)。根據(jù)這一假設(shè)推導(dǎo)出了如下作圖函數(shù)( K

29、osambi作圖函數(shù)):1+2rx=(1/4)ln 1 名根據(jù)上式可以算出,當(dāng) r=0.2時,x=21.2cM??梢奒osambi作圖函數(shù)算出的圖距比Haldane作圖函數(shù)的小。由于Kosambi作圖函數(shù)比Haldane作圖函數(shù)更合理,因此它在遺傳學(xué)研究中 得到了更廣泛的應(yīng)用。第三節(jié) DNA標(biāo)記分離數(shù)據(jù)的數(shù)學(xué)處理一、分離數(shù)據(jù)的收集與數(shù)字化DNA多態(tài)性信息,是進(jìn)行遺從分離群體中收集分子標(biāo)記的分離數(shù)據(jù),獲得不同個體的 傳連鎖分析的第一步。通常各種 DNA 標(biāo)記基因型的表現(xiàn)形式是電泳帶型, 將電泳帶型數(shù)字 化是 DNA 標(biāo)記分離數(shù)據(jù)進(jìn)行數(shù)學(xué)處理的關(guān)鍵。下面以 RFLP 為例來說明將 DNA 標(biāo)記帶型

30、數(shù)字化的方法。假設(shè)某個 RFLP 座位在兩個 親本(Pi,P2)中各顯示一條帶,由于 RFLP是共顯性的,則 Fi個體中將表現(xiàn)出兩條帶,而 F2群體中不同個體的 帶型有三種,即Pi型、P2型和Fi (雜合體)型。可以根據(jù)習(xí)慣或研究 人員的喜好,任意選擇一組數(shù)字或符號,來記錄F2個體的帶型。例如,將 Pi帶型記為1, P2帶型記為3, Fi帶型記為2。如果帶型模糊不清或由于其它原因使數(shù)據(jù)缺失,則可記為0。假設(shè)全部試驗共有 120個F2單株,檢測了 100個RFLP標(biāo)記,這樣可得到一個由 100 (行) X 120 (列)的、由簡單數(shù)字組成的 RFLP數(shù)據(jù)矩陣。進(jìn)行 DNA 標(biāo)記帶型數(shù)字化的基本原

31、則是,必須區(qū)分所有可能的類型和情況,并賦與相應(yīng)的數(shù)字或符號。比如在上例中,總共有4種類型,即P1型、F1型、P2型和缺失數(shù)據(jù),故可用4個數(shù)字1、2、3和0分別表示之。如果存在顯性標(biāo)記,則F2中還會出現(xiàn)兩種情況。一種是P1對P2顯性,于是P1型和F1型無法區(qū)分,這時應(yīng)將 P1型和F1型作為一種類型,記 為4。另一種情況正好相反,P2對P1顯性,無法區(qū)分 P2型和F1型,故應(yīng)將它們合為一種類型,記為 5。對于 BC1、 DH 和 RI 群體,每個分離的基因座都只有兩種基因型,不論是共顯性標(biāo)記 還是顯性標(biāo)記, 兩種基因型都可以識別, 加上缺失數(shù)據(jù)的情況,總共只有 3種類型。因而用 3 個數(shù)字就可以將

32、標(biāo)記全部帶型數(shù)字化。在分析質(zhì)量性狀基因與遺傳標(biāo)記之間的連鎖關(guān)系時, 也必須將有關(guān)的表型數(shù)字化, 其方 法與標(biāo)記帶型的數(shù)字化相似。例如,假設(shè)在 DH 群體中,有一個主基因控制株高,那么就可 以將株系按植株的高度分為高稈和矮稈兩大類, 然后根據(jù)親本的表現(xiàn)分別給高稈和矮稈株系 賦值,如 1 和 2。將質(zhì)量性狀經(jīng)過這樣的數(shù)字化處理,就可以與DNA 標(biāo)記數(shù)據(jù)放在一起進(jìn)行連鎖分析。DNA 標(biāo)記數(shù)據(jù)的收集和處理應(yīng)注意以下問題:(1)應(yīng)避免利用沒有把握的數(shù)據(jù) 。由于分子多態(tài)性分析涉及許多實驗步驟,很難避免出現(xiàn)錯誤,經(jīng)常會遇到所得試驗結(jié)果(如X-光片) 不清楚等問題。 如果硬性地利用這樣沒有把握的數(shù)據(jù), 不僅會

33、嚴(yán)重影響該標(biāo)記自身的 定位, 而且還會影響到其它標(biāo)記的定位。 因此,應(yīng)刪除沒有把握的數(shù)據(jù),寧可將其作為缺失 數(shù)據(jù)處理,或重做試驗。 ( 2)應(yīng)注意親本基因型,對親本基 因型的賦值(如 P1 型為 1, P2 型為2),在所有的標(biāo)記座位上必須統(tǒng)一,千萬別混淆。如果已知某兩個座位是連鎖的,而所得結(jié)果表明二者是獨立分配的,這就有可能是把親本類型弄錯引起的。(3)當(dāng)兩親本出現(xiàn)多條帶的差異時,應(yīng)通過共分離分析鑒別這些帶是屬于同一座位還是分別屬于不同座位。如屬于不同座位,應(yīng)逐帶記錄分離數(shù)據(jù)。二、遺傳圖距與物理距離對應(yīng)關(guān)系的估計不同生物的1cM圖距所對應(yīng)的實際物理距離(堿基對數(shù)量)存在很大差異。一般而言,生

34、物越低等或越簡單,1cM圖距平均對應(yīng)的堿基對數(shù)量就越少(表 3.1)o表3.1中給出的各 種生物中遺傳圖距與物理距離之間的對應(yīng)關(guān)系只是一個大約的平均值,實際上它變化很大。在一條染色體上,由于不同區(qū)域上發(fā)生交換的頻率存在差異,因而遺傳圖距與物理距離之間的對應(yīng)關(guān)系可以有很大的變化。例如,在著絲粒附近,染色體交換受到抑制,因而所估計的遺傳圖距小于平均對應(yīng)的物理距離。在同一種生物中,兩個特定基因座之間的遺傳圖距會因遺傳背景的不同而改變,甚至有時由同一對親本所產(chǎn)生的遺傳背景相同的不同群體間也存在 很大差異。表3.1不同生物中單位圖距所相當(dāng)?shù)钠骄锢砭嚯x物種基因組大?。╧b)遺傳圖距(cM)kb / cM

35、嗜菌體T41.6 X 1028000.2大腸桿菌4.2 X 1031,7502.4酵母2.0 X 1044,2004.8真菌2.7 X 1041,00027.0線蟲8.0 X 104320250.0果蠅1.4 X 105280500.0水稻4.5 X 1051,500300.0小鼠3.0 X 1061,7001,800.0人 類3.3 X 1063,3001,000.02.5 X 1062,5001,000.0三、構(gòu)建DNA標(biāo)記圖譜的計算機軟件遺傳圖譜的構(gòu)建需要對大量標(biāo)記之間的連鎖關(guān)系進(jìn)行統(tǒng)計分析。隨著標(biāo)記數(shù)目的增加, 計算工作量常常呈指數(shù)形式增加,這是手工無法完成的。因此,必須借助計算機進(jìn)行

36、分析和處理。許多學(xué)者為構(gòu)建遺傳圖譜設(shè)計了專用程序包,通過In ternet網(wǎng)址 http:/li /soft/list.html可以獲得各種專用程序的相關(guān)信息,如軟件的名稱及簡要介紹,源程序編碼語言、支持的操作系統(tǒng)、執(zhí)行程序的名稱、參考文獻(xiàn)以及獲取軟件的網(wǎng)址等。應(yīng)用于植物遺傳連鎖分析和遺傳圖譜構(gòu)建的常用軟件有LINKAGE、 MAPMAKER/EXP 等。LINKAGE 軟件可通過 ftp:/ /software/linkage 獲 得,該軟件是利用最大似然法估計兩座位或多座位間的重組率和LOD值;MAPM

37、AKER/EXP可通過 ftp:/ /distri- bution/software/mapmaker3獲得,該軟件可以應(yīng)用于各種類型的實驗群體進(jìn)行遺傳作圖,是目前應(yīng)用最為廣泛的作圖軟件之一。第四節(jié) DNA標(biāo)記連鎖圖譜的完善一、DNA標(biāo)記連鎖群的染色體定位把分子標(biāo)記所建立的連鎖群與經(jīng)典遺傳圖譜聯(lián)系起來,并將其歸屬到相應(yīng)的染色體上, 是構(gòu)建了一個比較飽和的分子圖譜之后十分重要的工作。通常根據(jù)分子標(biāo)記與已知染色體位置的形態(tài)標(biāo)記的連鎖關(guān)系來確定分子標(biāo)記連鎖群屬于哪條染色體。還可以利用非整倍體或染色體結(jié)構(gòu)變異材料,如水稻中利用三體、玉米中利用A/B易位系、小麥

38、中利用缺體 /四體染色體代換系等,將分子標(biāo)記連鎖群歸屬到相應(yīng)的染色體上。以水稻為例,目前已獲得全套12條染色體的初級三體(2n+1 )。在水稻某種三體中,由于三體染色體有一式3份,其DNA含量為其它11條染色體的1.5倍。在DNA定量相當(dāng)準(zhǔn)確的條件下,用已知能檢測某一連鎖群的探針分別與12種三體的總DNA雜交。根據(jù)劑量效應(yīng),雜交強弱與同源序列的含量成正比,雜交后對應(yīng)三體的DNA濾膜放射自顯影顯帶強度將明顯高于其它 11種,由此可以判定該標(biāo)記所對應(yīng)的序列就在該三體染色體上。隨著技術(shù)的進(jìn)步, 原位分子雜交的靈敏度已可以揭示單拷貝序列的雜交位點, 因此采用 原位分子雜交可以容易地將連鎖群的分子標(biāo)記定

39、位到染色體上。要得到一個完整的遺傳圖譜, 必須知道染色體上的標(biāo)記與著絲粒之間的距離。一個完整的染色體具有以下幾個主要部分:著絲粒、縊痕、隨體及端粒, 這些基本結(jié)構(gòu)在生物染色體 的運動與復(fù)制等方面起著重要的作用,其結(jié)構(gòu)也是遺傳圖譜制作中不可忽視的重要部分。由于著絲粒并不是一個基因, 不能從表型測知, 因此采用常規(guī)的兩點、 三點乃至多點分 析方法是無法確定標(biāo)記與著絲粒之間的關(guān)系的。 在經(jīng)典遺傳圖譜的構(gòu)建中, 一般采用近端著 絲粒染色體來對基因與著絲之間的距離進(jìn)行定位。 近端著絲粒染色體是正常染色體在著絲粒 附近斷裂形成的異常染色體。目前已獲得小麥全部 42 條染色體的近端著絲粒染色體。利用 染色體

40、易位材料也可以判斷著絲粒在染色體上的位置。 一般易位點和著絲粒所在部分的交換 被抑制, 因而推算位于著絲粒兩旁的易位點與標(biāo)記基因間的重組率時一般都偏小。 利用這個 現(xiàn)象可以推算連鎖圖上著絲粒的位置。 在細(xì)胞學(xué)上, 利用已知易位點的易位系統(tǒng)進(jìn)行基因分 析也可知道著絲粒的位置。早在 1945 年,在玉米中就利用易位分析的結(jié)果推測了全部染色 體的著絲粒位置。染色體上的端粒是指染色體的自然末端。 在遺傳圖譜的構(gòu)建中, 端粒位置的確定就意味 著為染色體的全長設(shè)定界標(biāo)。 傳統(tǒng)的凝膠電泳方法由于分辨能力有限, 大多數(shù)情況下無法將 具有多態(tài)性的端粒片段區(qū)分開來。一般要借助具有高分辨率的脈沖場凝膠電泳(PFGE

41、 )才能將有差異的端粒片段分離開來。利用 PFGE 與切割位點稀少的限制性酶相結(jié)合, Wu 和 Tanksley( 1993)研究了水稻端粒結(jié)構(gòu)的特征,采用來自擬南芥的端粒探針,將三個水稻的 端粒 DNA 電泳條帶分別定位在第 8、9、11 染色體上,并證實了多態(tài)性的端粒片段不僅在 遺傳上而且在物理上與遺傳圖譜上最遠(yuǎn)端的 RFLP 標(biāo)記相連鎖。目前,在日本水稻基因組研究計劃所構(gòu)建的包含 2275 個標(biāo)記的水稻分子連鎖圖中,除 第 9 染色體之外, 其余 11 條染色體的著絲粒 (區(qū)) 都已定位 ( Harushima et al. 1998 )。另外, 該圖中的第 5染色體短臂、第 11 染色

42、體兩臂以及第 12染色體短臂的端粒也已定位。二、飽和 DNA 標(biāo)記連鎖圖的制作一個遺傳圖譜飽和度是指單位長度染色體上已定位的標(biāo)記數(shù)或標(biāo)記在染色體上的密度。20cM。如果構(gòu)建連鎖基本的染色體連鎖框架圖大概要求在染色體上的標(biāo)記平均間隔不大于圖譜的目的是為了進(jìn)行主基因的定位,其平均間隔要求在1020cM或更小。用于 QTL定位的連鎖圖,其標(biāo)記的平均間隔要求在 10cM以下。如果構(gòu)建的連鎖圖譜是為了進(jìn)行基因克隆,則要求目標(biāo)區(qū)域標(biāo)記的平均間隔在1cM以下。不同生物基因組大小有極大差異,因此滿足上述要求所需的標(biāo)記數(shù)是不同的。以人類和水稻為例,它們的基因組全長分別為3.3 x 106kb和4.5X 105k

43、b,如果構(gòu)建一個平均圖距為0.5CM的分子圖譜,則所要定位的標(biāo)記數(shù)就要分別達(dá)到6600和3000個。幾種生物不同圖譜飽和度下所需定位的標(biāo)記數(shù)如表3.2所示。表3.2遺傳圖譜達(dá)到特定飽和度所需的標(biāo)記數(shù)生物人類水稻玉米擬南芥番茄基因組(kb)3.3X 1064.5X 1052.5X 10647.0X 107.1 X 105大小(cM)3300150025005001500kb/cM10003001000140473圖20cM165751252575譜10cM33015025050150飽5cM660300500100300和1cM3300150025005001500度0.5cM660030005

44、00010003000Tanksley等(1988)以假設(shè)擁有12條染色體,每條長 100cM,全長1200cM的生物為例,研究了所需標(biāo)記數(shù)與圖譜飽和度之間的關(guān)系,發(fā)現(xiàn)影響所需標(biāo)記數(shù)的主要因素有兩個。 一個是標(biāo)記間的平均距離,即圖譜總長度除以定位的標(biāo)記數(shù), 它反映了標(biāo)記圖譜的平均密度。 對 于染色體全長1200cM的生物,如果定位了 120個標(biāo)記,則標(biāo)記間的平均距離為 10cM。另一個因素是標(biāo)記間的最大距離。標(biāo)記在基因組上的分布是不均勻的。即使在一張平均密度很 高的圖譜上,仍然可能存在較大的間隙區(qū)。例如, 據(jù)理論推算,如果用于作圖的標(biāo)記是隨機 選擇的,則當(dāng)標(biāo)記平均距離為 1cM 時,仍有可能存

45、在 10cM 的間距。而若要將最大可能間 距從 10cM 減小到 5cM ,則需要另外增加 1000 個標(biāo)記。因此,通過提高圖譜平均密度的方 法來縮小最大標(biāo)記間距是很困難的。 在實際研究中, 為了填補間隙, 應(yīng)有針對性地在間隙區(qū) 上尋找標(biāo)記,或?qū)ふ以撻g隙所在區(qū)域上有差異的親本構(gòu)建作圖群體。沒有一種標(biāo)記在基因組中分布是完全隨機的。 如著絲粒區(qū)通常以重復(fù)序列為主, 因而以 單拷貝克隆為探針的 RFLP 標(biāo)記就不可能不覆蓋這些染色體區(qū)域。 從這一點考慮, 利用特性 上互補的不同 DNA 標(biāo)記進(jìn)行遺傳作圖,將有助于提高遺傳圖譜的飽和度。三、DNA 標(biāo)記連鎖圖與經(jīng)典遺傳連鎖圖的整合從 1987 年報道玉米和番茄的 RFLP 遺傳圖譜以來,具有重要經(jīng)濟價值的栽培植物幾乎 都已構(gòu)建了以 RFLP 為主的 DNA 標(biāo)記遺傳圖譜,其中水稻分子圖譜上所定位的 RFLP 標(biāo)記 數(shù)已超過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論