w06 -GWAS結(jié)果分析課件_第1頁
w06 -GWAS結(jié)果分析課件_第2頁
w06 -GWAS結(jié)果分析課件_第3頁
w06 -GWAS結(jié)果分析課件_第4頁
w06 -GWAS結(jié)果分析課件_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、Genome-wide Association Study-GWAS,1,學習交流PPT,發(fā)展歷史,1996年Risch最早提出了GWAS設(shè)想; 2001年Hansen等最早應(yīng)用GWAS于植物Sea beet的研究中; 2005年Klein等在Science雜志上最早報道了GWAS在人類中的研究,發(fā)現(xiàn)了與年齡相關(guān)性的黃斑變性病癥顯著相關(guān)的基因。,2,學習交流PPT,什么是GWAS,全基因組關(guān)聯(lián)分析:利用全基因組范圍內(nèi)篩選出高密度的分子標記對所研究的群體進行掃描,分析掃描得出的分子標記數(shù)據(jù)與表型性狀之間關(guān)聯(lián)關(guān)系的方法。即:GWAS利用全基因組范圍內(nèi)的LD(連鎖不平衡)來確定影響某些表型性狀或數(shù)量

2、性狀的基因。,3,學習交流PPT,分子標記,是遺傳標記的一種 遺傳標記(genetic marker):指可追蹤染色體、染色體某一階段、某個基因座在家系中傳遞的任何一種遺傳特性。 基本特征:可遺傳性、可識別性 遺傳標記類型 形態(tài)標記(morphological markers) 細胞學標記(cytological markers) 生化標記(biochemical markers) 分子標記(molecular markers),4,學習交流PPT,形態(tài)學標記,能夠用肉眼識別和觀察,并能明確顯示遺傳多態(tài)性的外部形態(tài)特征 優(yōu)點:簡單直觀、經(jīng)濟方便; 缺點:標記數(shù)少、多態(tài)性低、容易受環(huán)境條件的影響

3、、并且有一些標記與不良形狀連鎖。,5,學習交流PPT,細胞學標記,能夠顯示遺傳多態(tài)性的細胞學特征。主要指染色體核型、帶型和數(shù)量特性的變異等,它們反映了染色體在結(jié)構(gòu)和數(shù)量上的遺傳多態(tài)性。 染色體核型:數(shù)量、大小、著絲粒位置等; 染色體數(shù)量:單體、缺體、三體等; 染色體結(jié)構(gòu):缺失、易位、倒位、重復(fù)等。 特點: 優(yōu)點:不易受環(huán)境影響,呈孟德爾方式遺傳; 缺點:常伴有對生物有害的表型效應(yīng),難以獲得相應(yīng)的標記材料;或者觀測和鑒定比較困難;需要花費較大的人力和較長時間來培育,難度較大等。,6,學習交流PPT,生物標記,是指以生物體內(nèi)的某些生化形狀作遺傳標記,如血型、血清蛋白、種子儲藏蛋白、同工酶和等位酶等

4、。 特點: 優(yōu)點:表現(xiàn)近中性,對生物經(jīng)濟性狀一般沒有大的不良影響;直接反映基因產(chǎn)物差異,受環(huán)境影響較小。 缺點:可用標記數(shù)量少,染色方法和電泳技術(shù)有一定難度。,7,學習交流PPT,分子標記,廣義:是指可遺傳的并可檢測的DNA序列或蛋白質(zhì)。 狹義:DNA標記,指能反映生物個體或種群間基因組中某種差異的特異DNA片段。 優(yōu)勢: 直接以DNA的形式表現(xiàn),在生物體的各個組織、各個發(fā)育階段可檢測到,不受季節(jié)、環(huán)境限制。 數(shù)量多 多態(tài)性高; 表現(xiàn)為中性,不影響目標形狀的表達 許多標記表現(xiàn)為共顯性,能區(qū)別純合體和雜合體,8,學習交流PPT,第一代:限制性片段長度多態(tài)性 (Restriction Fragme

5、nt Length Polymorphism, RFLP) 第二代:微衛(wèi)星多態(tài)性(microsatellite) 第三代:SNP SNP:Single Nucleotide Polymorphism,單核苷酸多態(tài)性 指同一位點不同等位基因 之間核苷酸的差異。,分子標記,9,學習交流PPT,理論上講,SNP既可能是二等位多態(tài)性,也可能是3個或4個等位多態(tài)性,但后兩者非常少見,幾乎可以忽略; 占所有已知多態(tài)性的90%以上; SNP數(shù)目:目前,測得大約15003000萬個SNP位點。 分為:同義SNP(synonymous SNP)和非同義SNP(non-synonymous SNP)。,10,學習

6、交流PPT,SNPs的基因型,人體除性染色體外,每個染色體都有兩份,個體所擁有的一對等位基因的類型稱作基因型。 核定個體的基因型,稱作基因分型。,11,學習交流PPT,SNP,雙等位基因標記 主要等位基因(major allele):在一般人群中較多見的等位基因; 次要等位基因(minor allele): 四種可能的形式 一種轉(zhuǎn)換( CT或GA):2/3 三種顛換(CA或GT, CG或GC,TA或AT),12,學習交流PPT,SNP作為遺傳標記的優(yōu)勢,變異程度不如微衛(wèi)星 數(shù)量巨大,分布密度高:人類基因組中1SNP/1000bp 更穩(wěn)定的遺傳特性:多數(shù)并不位于基因編碼區(qū),甚至不在基因區(qū),穩(wěn)定而

7、無害 基因分型簡單:快速、大批量、自動化,13,學習交流PPT,SNP概念界定,基因組DNA的差異 cDNA中發(fā)現(xiàn)的:可能是RNA編輯的結(jié)果? 單堿基的插入和缺失? 疾病易感等位基因? 在正常人(無病個體)中可出現(xiàn) SNP & mutation,14,學習交流PPT,基因型和表型,15,學習交流PPT,SNP的檢測,PCR SNP芯片 新一代測序 ,16,學習交流PPT,GWAS的目的,尋找哪些SNP標記與疾病相關(guān) 關(guān)聯(lián)分析,17,學習交流PPT,基本流程,建立研究群體,選擇盡可能大的群體作研究樣本,建立目標性狀數(shù)據(jù)庫。 提取樣本DNA,進行質(zhì)量控制以達到基因分型的要求,對基因型數(shù)據(jù)進行檢測和

8、質(zhì)量控制以達到后續(xù)關(guān)聯(lián)分析的要求。 利用合適的統(tǒng)計模型對SNP和目標性狀進行關(guān)聯(lián)分析; 對關(guān)聯(lián)分析的結(jié)果進行高級分析及驗證。,18,學習交流PPT,關(guān)聯(lián)分析,19,學習交流PPT,GWAS分類,基于無關(guān)個體(unrelated individual)的關(guān)聯(lián)分析:(1)病例對照分析法(Case-control analysis),主要用來研究質(zhì)量性狀,即是否患?。唬?)基于隨機群體的關(guān)聯(lián)分析(Population-based association analysis):主要用來研究數(shù)量性狀。 基于家系的關(guān)聯(lián)分析(Family-based association):傳遞不平衡檢驗法(Transmi

9、ssion Disequilibrium Test, TDT),20,學習交流PPT,GWAS分類,家系數(shù)據(jù)分析遺傳標記與疾病數(shù)量表型和質(zhì)量表型的關(guān)聯(lián)可以排除人群混雜對于關(guān)聯(lián)分析的影響,但其在發(fā)現(xiàn)陽性關(guān)聯(lián)的檢驗方面不如相同樣本量的病例對照研究有效。 當前的人口狀況使得大規(guī)模的家系數(shù)據(jù)很難獲得,目前的研究中病例對照研究居多。,21,學習交流PPT,22,學習交流PPT,GWAS試驗設(shè)計,單階段設(shè)計(One-stage design):一次性選用足夠大的樣本量,對每一個樣本都進行SNP基因型分型,然后分析相關(guān)性狀與每個SNP的關(guān)聯(lián)效應(yīng); 兩階段設(shè)計(Two-stage design)或多階段設(shè)計(

10、Multiple-stage design):(1)先選擇一個小樣本量進行SNP分型,統(tǒng)計分析時在較為寬松的P值條件下先篩選出與目標性狀呈顯著相關(guān)的SNPs;(2)然后在大樣本中對第一步中已經(jīng)篩選出的SNPs進行分型,結(jié)合兩個階段的分析結(jié)果進行最后統(tǒng)計。,23,學習交流PPT,質(zhì)量控制,24,學習交流PPT,質(zhì)量控制,25,學習交流PPT,質(zhì)量控制,26,學習交流PPT,質(zhì)量控制,27,學習交流PPT,質(zhì)量控制,28,學習交流PPT,關(guān)聯(lián)分析的理論基礎(chǔ),連鎖不平衡(Linkage Disequilibrium, LD):又稱等位基因關(guān)聯(lián),是指同一條染色體上,兩個等位基因間的非隨機相關(guān)。即:當位

11、于同一條染色體的兩個等位基因同時存在的概率大于人群中因隨機分布而同時出現(xiàn)的概率時,就稱這兩個位點處于LD狀態(tài)。 DP(AB)-P(A)*P(B),29,學習交流PPT,LD產(chǎn)生的原因,30,學習交流PPT,LD的度量,31,學習交流PPT,D的意義,32,學習交流PPT,D值的95可信區(qū)間(95%),33,學習交流PPT,r2的意義,34,學習交流PPT,影響LD的因素,35,學習交流PPT,影響LD的因素,36,學習交流PPT,基于SNP的LD關(guān)聯(lián)分析,37,學習交流PPT,基于SNP的LD關(guān)聯(lián)分析,38,學習交流PPT,LD作圖,LD作圖是將一段基因的所有SNPs的LD關(guān)系標記在基因序列中

12、,用來觀察重組熱點。 作圖方法有: LD散點圖(dot plot) LD矩陣圖(LD matrix) 鄰近LD窗口分析(adjacent LD window analysis),39,學習交流PPT,LD 散點圖,40,學習交流PPT,LD矩陣圖(LD matrix),41,學習交流PPT,鄰近LD窗口分析,42,學習交流PPT,43,學習交流PPT,關(guān)聯(lián)檢驗的模型,假定:某個SNP位點有兩個等位基因:A,a;形成三個基因型:AA, Aa, aa。假設(shè)A是minor位點。當我們檢驗該SNP位點與疾病的關(guān)系時,我們不知道該位點以何種方式起作用(等位,基因型,顯性,隱性)。,44,學習交流PPT,

13、關(guān)聯(lián)檢驗的模型,Genotypic Model Hypothesis: all 3 different genotypes have different effects: AA vs. Aa vs. aa 卡方檢驗,45,學習交流PPT,46,學習交流PPT,關(guān)聯(lián)檢驗的模型,2. Dominant Model Hypothesis: the genetic effects of AA and Aa are the same (assuming A is the minor allele) : AA+Aa vs. aa,47,學習交流PPT,關(guān)聯(lián)檢驗的模型,3. Recessive Model

14、Hypothesis: the genetic effects of Aa and aa are the same (A is the minor allele): AA vs. Aa+aa,48,學習交流PPT,關(guān)聯(lián)檢驗的模型,4. Allelic Model Hypothesis: the genetic effects of allele A and allele a are different: A vs. a,49,學習交流PPT,關(guān)聯(lián)檢驗,Odd Ratio值(OR) 關(guān)聯(lián)檢驗中如果某SNP與某疾病的關(guān)聯(lián)p值小于顯著性水平,則拒絕不關(guān)聯(lián)的零假設(shè),支持該SNP與疾病存在關(guān)聯(lián)的假設(shè),O

15、R值的目的是進一步估計其關(guān)聯(lián)的強度。 點估計和區(qū)間估計,50,學習交流PPT,關(guān)聯(lián)檢驗,51,學習交流PPT,關(guān)聯(lián)檢驗,95% CI (Confidence Interval)的計算 lnOR近似地服從正態(tài)分布,52,學習交流PPT,R在GWAS中的應(yīng)用,Public Database HapMap SNPedia dbSNP OMIM,53,學習交流PPT,The SNP association analysis,R package: SNPassoc,54,學習交流PPT,mySNP=snp(SNPs$snp10001, sep=“/”),55,學習交流PPT,56,學習交流PPT,57,學習交流PPT,58,學習交流PPT,59,學習交流PPT,60,學習交流PPT,61,學習交流PPT,62,學習交流PPT,The whole genome SNP association analysis,data(HapMap) str(HapMap) str(HapMap.SNPs.pos),63,學習交流PPT,64,學習交流PPT,The SNP annotation and enrichment,Motivation Once we have some SNPs that are potentia

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論