版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人類群體遺傳學(xué)基本原理和分析方法,中科院-馬普學(xué)會(huì)計(jì)算生物學(xué)伙伴研究所,中國(guó)科學(xué)院上海生命科學(xué)研究院研究生課程 人類群體遺傳學(xué),徐書(shū)華 金 力,20082009學(xué)年第二學(xué)期人類群體遺傳學(xué)分析方法課程表 上課時(shí)間:每周四上午10:00-11:50 上課地點(diǎn):中科大廈4樓403室第7教室,第一講 Hardy-Weinberg平衡檢驗(yàn)及其應(yīng)用,Hardy-Weinberg Equilibrium (HWE)定律 HWE的偏離(固定指數(shù)) HWE的偏離( Wahlund定律) HWE在單基因遺傳疾病研究中的應(yīng)用 HWE在多基因復(fù)雜疾病研究中的應(yīng)用 檢驗(yàn)HWE的常用方法和軟件 全基因組數(shù)據(jù)中的HWE檢驗(yàn)
2、問(wèn)題,Why do students need to know Hardy-Weinberg Equilibrium?,As Thomas Merten (1992) states: If you have ever been asked questions such as the ones that follow, you begin to see why studying population genetics might be useful: 1. Im confused! How can O be the most common of the blood types if it is
3、a recessive trait? 2. If Huntingtons disease is a dominant trait, shouldnt three-fourths of the population have Huntingtons while one-fourth have the normal phenotype? 3. Shouldnt recessive traits be gradually swamped out so they disappear from the population?,基本概念,突變(mutation) 遺傳多態(tài)性(genetic polymor
4、phism) 遺傳座位(locus) 等位基因(allele) 核苷酸位點(diǎn)(nucleotide) 序列(sequence) 位點(diǎn)(site) 分離位點(diǎn)(segregating site),基本概念,單倍體(haploid)、二倍體(diploid) 基因型(genotype) 雜合子(heterozygote)、純合子(homozygotye) 等位基因頻率(allele frequency) 基因型頻率(genotype frequency),一個(gè)群體由N個(gè)個(gè)體組成,其中有一對(duì)常染色體等位基因A, a,其頻率分別以p、q表示 。 可能的基因型為AA,Aa,aa三種,其頻率分別以D、H、R表
5、示,其中D+H+R=1。,若群體中有,n1 AA n2 Aa n3 aa N=n1+n2+n3,合計(jì),1,計(jì)算基因型頻率,等位基因A的頻率,等位基因a的頻率,其中,p+q=D+H/2+H/2+R=1,計(jì)算等位基因頻率,精 子 A(p) a(q) 卵 A(p) AA(p2) Aa(pq) 子 a(q) Aa(pq) aa(q2) 由表可見(jiàn)子代基因型組成:p2+2pq+q2=1 這里基因型AA的頻率為p2,基因型aa的頻率為 q2,基因型Aa的頻率為2pq。 AA:Aa:aa= p2:2pq:q2,子一代向下一代提供的配子中兩種基因頻率分別是: A=p2+1/2(2pq)=p2+pq=p(p+q)
6、=p a=q2+ 1/2(2pq)=q2+pq=q(p+q)=q 由此可見(jiàn),子代基因A的頻率仍然是p,基因a的頻率仍然是q,而且將以這種頻率在所有世代傳遞下去,這就是遺傳平衡。,p2 2pq q2,Hardy-Weinberg平衡定律,Hardy-Weinberg平衡定律,群體中的等位基因頻率以及基因型頻率并不隨世代的推移而變化。,保持群體HWE的理論條件,Random mating No differential fertility of the genotypes Equal genotype frequencies in the two sexes No mutation No immi
7、gration No differential emigration No differential viability Infinite population size,人類進(jìn)化中的5個(gè)基本動(dòng)力元素,突變(mutation) 婚配 (random mating) 選擇 (selection) 漂變 (drift) 遷移 (migration),現(xiàn)代人群是一個(gè)HWE群體嗎?,有趣的是,對(duì)于一個(gè)特定的地理群體,絕大部分基因組區(qū)域處于HWE狀態(tài)。,HWE平衡群體的性質(zhì)(1),雜合體的比例為H=2pq,H的最大值為1/2,當(dāng)q=1/2,p=1/2時(shí),H取最大值1/2,HWE平衡群體的性質(zhì)(2),Aa
8、Aa的交配頻率永遠(yuǎn)為AAaa交配頻率的2倍 AaAa=H2=4p2q2 AAaa=2DR=2p2q2,因此,隱性基因“a”在群體中不易消失,總是保持一定頻率。當(dāng)一般群體中隱性個(gè)體稀少的時(shí)候,其中大多數(shù)為AaAa交配的后代。,例如 人類白化病被認(rèn)為是一個(gè)簡(jiǎn)單的隱性性狀,某地白化病的嬰兒的發(fā)病率q2 (aa)=1/10000 , q(a)=1/100 但群體中,雜合子的比例要大得多,其中由AaAa得到的aa個(gè)體占,當(dāng)q很小時(shí),p=1,則H-Ws law取得一種極限形式,H=2q 差不多所有的隱性基因都處于雜合狀態(tài)中,雜合子個(gè)體的比例約為隱性基因頻率的兩倍。上述白化病 q=0.01,一般q2可看作發(fā)
9、病率,雜合子的頻率=2,HWE平衡群體的性質(zhì)(3),HWE在單基因遺傳疾病研究中的應(yīng)用,計(jì)算基因型頻率 隨機(jī)交配時(shí)純合子(基因型)的頻率可用配子(基因)頻率平方求得 ; 雜合子頻率=2x隱性等位基因頻率(如前所述). 計(jì)算隱性性狀的發(fā)病率(出生前死亡) 計(jì)算等位基因頻率,計(jì)算等位基因頻率(隱性),如已知某種常染色體隱性遺傳?。ò谆。┰谝惶囟ㄈ巳褐蓄l率,就能計(jì)算這個(gè)異?;虻臄y帶者和基因頻率。白化病發(fā)病(aa)(q2)的頻率為110000,即其基因型頻率,則致病基因(a)頻率1/100= 0.01;基因A的頻率10.01=0.99;而雜合子攜帶者的頻率為2pq=2991001100150。因此
10、,在比例中,每個(gè)受累的個(gè)體將有200個(gè)左右在臨床上無(wú)癥狀的攜帶者。,計(jì)算等位基因頻率(顯性),常染色體顯性遺傳病,如并指癥,在一個(gè)群體多為雜合子(Aa)發(fā)病。 雜合子(H)的頻率為2pq,由于q值大,近于1,故H2p,p=1/2H。因此,只要知道雜合子發(fā)病率,就易求得基因A的頻率。如并指癥的發(fā)病率為 11000,H12000,p=1/2H=1/4000,即致病基因A的頻率為0.000025。,在已知某一性狀頻率的群體中,確定等位基因頻率和雜合子攜帶者頻率。,例如:已知白化病的發(fā)病率為1/20000,求白化病致病基因頻率q和攜帶者頻率。 白化病為AR遺傳病,患者為致病基因的純合子,因此: 發(fā)病率
11、(aa) = q2 = 1/20000 a= q =0.007 A=p = 1 q =0.993 攜帶者頻率(Aa) = 2pq = 2 0.993 0.007 = 0.0139 這提示人群中有1.4%為白化病致病基因攜帶者,對(duì)于遺傳咨詢很重要。,對(duì)于一種罕見(jiàn)的AD遺傳病 致病基因頻率p很低,p2可以忽略,因此: 2pq p2 + 2pq 患者幾乎都以雜合子形式出現(xiàn),=1, 對(duì)于一種罕見(jiàn)的XD遺傳病 致病基因頻率p很低,正?;蝾l率q1 男性患者 = 致病基因頻率 = p 女性患者 = p2 + 2pq = 2p 男性患者 女性患者 女性患病率是男性患病率的2倍,= 1/2, 對(duì)于一種罕見(jiàn)的A
12、R遺傳病 致病基因頻率q很低,正?;蝾l率p1 : 雜合攜帶者頻率 = 2pq =2q 即雜合攜帶者頻率約為致病基因頻率的2倍。 雜合攜帶者 2pq 2 純合患者 q2 q 提示: 致病基因頻率q越低,致病基因在群體中主要以雜合攜帶者形式存在。,=,=, 對(duì)于一種罕見(jiàn)的XR遺傳病 致病基因頻率q很低, 男性患者 = 致病基因頻率 = q 女性患者 = 致病基因頻率的平方 = q2 男性患者 q 1 女性患者 q2 q 提示:疾病越罕見(jiàn),q越低,女性患者越罕見(jiàn)。,=,=,HWE的偏離(固定指數(shù)),固定指數(shù)(F): 如果一個(gè)座位上有兩個(gè)等位基因,Hardy-Weinberg比率的任何偏差可以由參量
13、F來(lái)度量,F(xiàn)稱為固定指數(shù),則基因型頻率可以由下式給出:,由以上第二式可得:,固定指數(shù)F可正可負(fù),視情況而定。 可以看出,當(dāng)h0小于h時(shí),F(xiàn)取正值;當(dāng)h0大于h時(shí),F(xiàn)取負(fù)值。在近親交配時(shí),雜合子頻率的觀察值減小,F(xiàn)就取正值。,隨機(jī)交配(h)情況下雜合子的預(yù)期頻率,群體(h0)中下雜合子的觀察頻率,上式可寫(xiě)成,亞群體(sub-population),以上考慮的是一個(gè)簡(jiǎn)單的群體,不論其是否近親交配。 然而,實(shí)際上大多數(shù)的自然群體可被再分為許多不同的繁殖單位或亞群體(sub-population),盡管這些群體并不是完全隔離的。這種情況下,研究群體內(nèi)和群體間的遺傳變異就顯得十分重要。,可再分群體中的基
14、因型頻率,假定一個(gè)群體可分為s個(gè)亞群體,每一個(gè)亞群體都滿足Hardy-Weiberg平衡。設(shè)xk為第k個(gè)亞群體中等位基因A1的頻率,則基因型A1A1,A1A2,A2A2的頻率分別為,我們用wk來(lái)表示第k個(gè)亞群體的相對(duì)大小,且總和為1。則A1A1,A1A2,A2A2在整個(gè)群體中的頻率為:,其中,和,是亞群體中等位基因頻率的均值和方差。,可再分群體中的固定指數(shù),比較,我們知道,,因此,表明如果一個(gè)群體被分為多個(gè)交配單位,純合子的頻率要高于Hardy-Weinberg比率。這個(gè)性質(zhì)首先由Wahlund(1928)發(fā)現(xiàn),被稱為Wahlund定律,也稱Wahlund現(xiàn)象。 當(dāng)?shù)任换蝾l率在所有亞群體中一
15、致時(shí),F(xiàn)為0;而當(dāng)每個(gè)亞群體都被固定為某一個(gè)等位基因時(shí),F(xiàn)為1。,HWE的偏離(Wahlund定律),Wahlund現(xiàn)象的啟示,群體結(jié)構(gòu)(population structure)的存在! 反之,當(dāng)F為負(fù)值的時(shí)候,,雜合子頻率比Hardy-Weinberg平衡時(shí)預(yù)期的要高,意味著雜合優(yōu)勢(shì),某種程度的自然選擇發(fā)生。,雜合優(yōu)勢(shì)與平衡選擇(后面“自然選擇”章節(jié)細(xì)談),檢驗(yàn)HWE的常用方法,X2-test,觀察值,期望值,實(shí)例,例 MN血型基因頻率的計(jì)算,結(jié)論:三個(gè)基因型頻率的觀察值與HWE定律所期望的頻率沒(méi)有顯著差異。,精確檢驗(yàn),Am.J.Hum.Genet 2005, 76:887-893,HWE
16、在復(fù)雜疾病遺傳研究中的應(yīng)用,數(shù)據(jù)分析中,檢測(cè)可能的數(shù)據(jù)質(zhì)量問(wèn)題(typing error)。 Case-control study 一般要求所有檢測(cè)位點(diǎn)在control中處于HWE。 多個(gè)位點(diǎn)處于HWD暗示近親婚配或群體結(jié)構(gòu)的存在。 在排除其他可能的因素以后,篩選可能受到自然選擇的基因。,全基因組數(shù)據(jù)中的HWE檢驗(yàn)問(wèn)題,Affymetrix 500K, Illumina 650K 多重檢驗(yàn)(multiple testing)問(wèn)題 If you have 10,000 genes in your genome, and perform a statistical analysis, a p-va
17、lue cutoff of 0.05 allows a 5% chance of error. That means that 500 genes out of 10,000 could be found to be significant by chance alone.,多重檢驗(yàn)校正方法,Bonferroni correction Bonferroni Step-down (Holm) correction Westfall and Young Permutation Benjamini and Hochberg False Discovery Rate,Bonferroni correc
18、tion,The p-value of each gene is multiplied by the number of genes in the gene list. If the corrected p-value is still below the error rate, the gene will be significant: Corrected P-value= p-value * n (number of genes in test) 0.05 As a consequence, if testing 1000 genes at a time, the highest acce
19、pted individual p-value is 0.00005, making the correction very stringent. The expected number of false positives will be 0.05.,Bonferroni Step-down (Holm) correction,This correction is very similar to the Bonferroni, but a little less stringent: 1) The p-value of each gene is ranked from the smalles
20、t to the largest. 2) The first p-value is multiplied by the number of genes present in the gene list; if the end value is less than 0.05, the gene is significant; Corrected P-value= p-value * n 0.05 3) The second p-value is multiplied by the number of genes less 1. Corrected P-value= p-value * n-1 0
21、.05 4) The third p-value is multiplied by the number of genes less 2. Corrected P-value= p-value * n-2 0.05 It follows that sequence until no gene is found to be significant.,Westfall and Young Permutation,The Westfall and Young permutation follows a step-down procedure similar to the Holm method, c
22、ombined with a bootstrapping method to compute the p-value distribution: 1) P-values are calculated for each gene based on the original data set and ranked. 2) The permutation method creates a pseudo-data set by dividing the data into artificial treatment and control groups. 3) P-values for all gene
23、s are computed on the pseudo-data set. 4) The successive minima of the new p-values are retained and compared to the original ones. 5) This process is repeated a large number of times, and the roportion of resampled data sets where the minimum pseudo-p-value is less than the original p-value is the adjusted p-value. Because of the permutations, the method is very slow.,Benjamini and Hochberg False Discovery Rate,This correction is the least stringent of all 4 options, and therefo
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年標(biāo)準(zhǔn)工程施工總包協(xié)議條款版
- 2024年度預(yù)制混凝土構(gòu)件產(chǎn)業(yè)鏈金融合作合同范本3篇
- 2024年旅游租車服務(wù)協(xié)議讓您旅途更輕松
- 猜拳java課程設(shè)計(jì)
- 工程內(nèi)業(yè)資料員工作總結(jié)(14篇)
- 2024年土地征收及土地租賃合同范本3篇
- 總經(jīng)理發(fā)言稿
- 激光課程設(shè)計(jì)論文
- 市場(chǎng)方案集錦九篇
- 2025年山東淄博市張店區(qū)“服務(wù)基層人才專項(xiàng)”招募187人管理單位筆試遴選500模擬題附帶答案詳解
- CDASHStandards數(shù)據(jù)采集標(biāo)準(zhǔn)全版
- 初中地理學(xué)科學(xué)習(xí)新課標(biāo)(2022版)考核試卷有答案
- 玻璃工業(yè)的節(jié)能減排與綠色制造
- 波士頓咨詢-X大型制造業(yè)數(shù)字化轉(zhuǎn)型戰(zhàn)略規(guī)劃項(xiàng)目(交付版)
- 紀(jì)法培訓(xùn)課件
- 上海市浦東新區(qū)部分學(xué)校聯(lián)考2023-2024學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試題
- 南京理工大學(xué)物理化學(xué)課程考試8套卷(含答案)
- 泌尿外科工作總結(jié)及計(jì)劃
- 2023-2024學(xué)年度第一學(xué)期墻新學(xué)校小學(xué)部六年級(jí)課外閱讀答題活動(dòng)
- 光伏發(fā)電項(xiàng)目現(xiàn)場(chǎng)安全檢查表(帶檢查依據(jù))
- Animate動(dòng)畫(huà)設(shè)計(jì)與制作實(shí)例教程(Animate CC 2019)完整全套教學(xué)課件 第1-9章 VI 標(biāo)識(shí)- 網(wǎng)站應(yīng)用
評(píng)論
0/150
提交評(píng)論