BCC精品培訓(xùn)關(guān)聯(lián)分析課件_第1頁
BCC精品培訓(xùn)關(guān)聯(lián)分析課件_第2頁
BCC精品培訓(xùn)關(guān)聯(lián)分析課件_第3頁
BCC精品培訓(xùn)關(guān)聯(lián)分析課件_第4頁
BCC精品培訓(xùn)關(guān)聯(lián)分析課件_第5頁
已閱讀5頁,還剩109頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

全基因組關(guān)聯(lián)分析周家蓬博士zhoujp@QQ群:2598041811全基因組關(guān)聯(lián)分析周家蓬博士1基本概念歷史、現(xiàn)狀和趨勢一般流程研究策略應(yīng)用價值2基本概念歷史、現(xiàn)狀和趨勢一般流程研究策略應(yīng)用價值2全基因組關(guān)聯(lián)研究Genome-wideassociationstudy(GWAS)檢測全基因組范圍的遺傳變異與可觀測性狀間的遺傳關(guān)聯(lián)3全基因組關(guān)聯(lián)研究Genome-wideassociatio遺傳變異的檢測SNP芯片

Affymetrix:500Kchip(Randomlydistributed)

Illumina:550Kchip(gene-based)高通量測序

Illumina/Solexa:DNA-seq,RNA-seq4遺傳變異的檢測SNP芯片4遺傳變異的數(shù)量“單倍型圖譜計劃1”(Nature2005)SNP:1M“單倍型圖譜計劃2”(Nature2007)SNP:4M“單倍型圖譜計劃3”(Nature2010)SNP:10M

5遺傳變異的數(shù)量“單倍型圖譜計劃1”(Nature2005SNP和SNP基因型TTCAGTCAGATTCCAGCCCTTCAGTCAGATTCCAGCCC樣本1樣本2TTCAGTCAGATTCCAGCCCTTCAGTCAGAGTCCAGCCC6SNP和SNP基因型TTCAGTCAGATTCCAGCCCT表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀表型校正:去除outliers,取特征值,取剩余值模型:混合線性模型方程組算法:SNP,單倍型,CNV,Gene-set(SNPs)Add.,Dom.,Rec.,Int.Frequentist,Bayesian方差/秩和,均值/中位數(shù)打分值,似然比

Bonferroni,F(xiàn)DR,Permutation,Bootstrap7表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀7編碼基因型Foronemarkerwithtwoalleles,therecanbethreepossiblegenotypes:GenotypeCodingAA2Aa1aa08編碼基因型Foronemarkerwithtwoa病例/對照設(shè)計的數(shù)據(jù)結(jié)構(gòu)individualaffectiongenderSNP1SNP2…SNPn11F21…221M22…130F12…241F11…250M0-9…1sampleidcase/controlgenotypes9病例/對照設(shè)計的數(shù)據(jù)結(jié)構(gòu)individualaffectio遺傳假設(shè)和遺傳模型GenotypicmodelHypothesis:all3differentgenotypeshavedifferenteffectsGenotypeGenotypicValueAAμAAAaμAaaaμaaAAvs.Aavs.aa10遺傳假設(shè)和遺傳模型GenotypicmodelGenotyDominantmodelHypothesis:thegeneticeffectsofAAandAaarethesameGenotypeGenotypicValueAAμA-AaμA-aaμaaAAandAavs.aa遺傳假設(shè)和遺傳模型(續(xù))11DominantmodelGenotypeGenotypiRecessivemodelHypothesis:thegeneticeffectsofAaandaaarethesameGenotypeGenotypicValueAAμA-Aaμa-aaμaaAAvs.Aaandaa12遺傳假設(shè)和遺傳模型(續(xù))RecessivemodelGenotypeGenotypAllelicmodelHypothesis:thegeneticeffectsofalleleAandalleleaaredifferentGenotypeGenotypicValueAA2μAAaμA+μaaa2μaAvs.a13遺傳假設(shè)和遺傳模型(續(xù))AllelicmodelGenotypeGenotypic卡方檢驗GenotypicmodelNullhypothesis:Independence

AAAaaacasesnAAnAanaacontrolsmAAmAamaadf=214卡方檢驗GenotypicmodelAAAaaacasesChi-squaredteststatistic:OistheobservedcellcountsEistheexpectedcellcounts,undernullhypothesisofindependence

統(tǒng)計量15Chi-squaredteststatistic:統(tǒng)計量Rcode>Statistics<-rchisq(1000,df=5)>hist(Statistics,prob=T)>curve(dchisq(x,df=5),col='blue',add=TRUE)>curve(dchisq(x,df=2),col='red',add=TRUE)>P<-1-pchisq(10,df=2);P[1]0.006737947

統(tǒng)計量P值16Rcode統(tǒng)計量P值16GWAS的歷史2005年,Science雜志報道了第一篇GWAS研究:年齡相關(guān)性黃斑變性之后陸續(xù)出現(xiàn)了有關(guān)冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂癥以及相關(guān)表型的報道17GWAS的歷史2005年,Science雜志報道了第一篇GWGWAS的現(xiàn)狀18GWAS的現(xiàn)狀18GWAS的趨勢19GWAS的趨勢19探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般到特殊)“穆勒五法”:求同法、求異法、求同求異法、共變法、排除法全基因組關(guān)聯(lián)研究主要基于共變法思想科學(xué)技術(shù)史之父薩頓認為科學(xué)是人類唯一具有累積性和繼承性的活動20探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般一般流程使用SNP分型芯片獲得高通量的基因型對基因型進行質(zhì)量評估和控制若為質(zhì)量性狀,需進行群體分層檢測;如為數(shù)量性狀,則對表型進行協(xié)變量校正采用若干遺傳模型進行全基因組關(guān)聯(lián)分析增加額外的數(shù)據(jù)進行結(jié)果驗證21一般流程使用SNP分型芯片獲得高通量的基因型21AHMU案例IlluminaHuman610Quad

BeadChipCallrate<90%,MAF

<1%,HWE

P

<10-71139病例vs.1132對照,PCA分析Cochran-Armitage趨勢檢驗5182病例vs.6516對照,539病例vs.824對照NatGenet.2009Feb;41(2):205-210.22AHMU案例IlluminaHuman610QuadB計算過程PLINK

/~purcell/plink/plink–fileAHMU–mind0.05–maf0.01–hwe0.000001–model–outAHMU23計算過程PLINK23輸入輸出AHMU.pedAHMU.mapAHMU.model24輸入輸出AHMU.ped24GWAS主要策略Meta分析缺失填充通路分析互作分析25GWAS主要策略Meta分析缺失填充通路分析互作分析25Meta分析定義合并多個研究數(shù)據(jù),增加樣本量,提高檢測效力,發(fā)現(xiàn)新易感位點成功案例

Ⅱ型糖尿病、克隆病、多發(fā)性硬化、類風(fēng)濕性關(guān)節(jié)炎、直結(jié)腸癌等26Meta分析定義26Meta分析分析步驟檢測研究異質(zhì)性選擇模型固定效應(yīng)模型,隨機誤差(弱)隨機效應(yīng)模型,群體分層(強)單因素分析合并各研究檢驗統(tǒng)計量、標準誤或p值常用軟件

METAL、Comprehensive

Meta-analysis等27Meta分析分析步驟27缺失填充定義缺失基因型填充(Imputation)主要是為了解決致病變異或其緊密連鎖標簽分型遺漏的問題成功案例約1/3-1/2的GWAS文章使用該技術(shù)28缺失填充定義28缺失填充分析步驟對自產(chǎn)數(shù)據(jù)進行基因型質(zhì)量控制選擇合適的參考數(shù)據(jù)庫,對高質(zhì)量的基因型數(shù)據(jù)進行缺失填充根據(jù)計算得出的準確率(info>0.8)對填充基因型進行篩選過濾進行關(guān)聯(lián)分析常用軟件

BEAGLE、IMPUTE、MACH和PLINK等29缺失填充分析步驟29通路分析定義將SNPs按照生物學(xué)通路分組,比較各通路在病例/對照或連續(xù)性狀數(shù)量上的差異成功案例克隆病、I型糖尿病、類風(fēng)濕性關(guān)節(jié)炎、精神分裂癥、乳腺癌等30通路分析定義30通路分析分析步驟選擇生物通路(KEGG)選擇Tag

SNPs(HapMap)多因素分析顯著SNPs結(jié)果綜合常用軟件

GSEA、IPA等31通路分析分析步驟31互作分析定義研究基因-基因、基因-環(huán)境間交互作用成功案例老年黃斑變性、帕金森病、直腸癌、膀胱癌,哮喘等32互作分析定義32互作分析分析步驟選擇顯著及近似顯著SNPs選擇風(fēng)險環(huán)境因素構(gòu)建互作模型多因素分析常用軟件

PLINK、Random

Jungle、BEAM等33互作分析分析步驟33其他策略兩階段法精細定位/目標測序表型/性狀聯(lián)合單倍型分析34其他策略兩階段法34遺傳變異的檢測SNP芯片

Affymetrix:500Kchip(Randomlydistributed)

Illumina:550Kchip(gene-based)高通量測序

Illumina/Solexa:DNA-seq,RNA-seq35遺傳變異的檢測SNP芯片35高通量測序Next-generationsequencing(NGS)平行測序36高通量測序Next-generationsequencinSNP分型:

coverage&variantfrequency37參考基因組序列個體正向序列個體反向序列SNP分型:

coverage&variantfreq遺傳變異的種類占總變異的90%單核苷酸多態(tài)性SinglenucleotidepolymorphismSNP1-50bp

DNA片段插入缺失Insertion-deletionInDel>50bpDNA片段結(jié)構(gòu)變異Structural

variationSV38遺傳變異的種類占總變異的90%單核苷酸多態(tài)性Singlen遺傳變異的數(shù)量“千人基因組計劃”(Nature2012)SNP:38MInDel:1.4MSV:14K39遺傳變異的數(shù)量“千人基因組計劃”(Nature2012)3效應(yīng)大小vs.變異頻率4040效應(yīng)大小vs.變異頻率4040家系病例或極端性狀個體

NatRevGenet.2010Jun;11(6):415-25.41家系病例或極端性狀個體NatRevGenet.2010外顯子突變是孟德爾疾病主要病因;多向性效應(yīng)影響復(fù)雜疾病價格相對低廉目前主要用于檢測孟德爾疾病新的策略或方法:Lasso,折疊法,聚合法外顯子組測序42外顯子突變是孟德爾疾病主要病因;多向性效應(yīng)影響復(fù)雜疾病外顯子Lasso嶺回歸:|beta|2<tLasso回歸:|beta|<t貝葉斯:全概率&損失函數(shù)機器學(xué)習(xí):SVM43Lasso嶺回歸:|beta|2<tLa低覆蓋度測序+缺失基因型填充44Pasaniucet.al.,2012低覆蓋度測序+缺失基因型填充44Pasaniucet.a策略評估Pasaniuc等證實覆蓋度低至0.1-0.5X依然可以通過后續(xù)的填充方法獲得高密度芯片的效果45策略評估Pasaniuc等證實覆蓋度低至0.1-0.5X依然策略評估(續(xù))Howie等發(fā)明了一種pre-phasing的填充方法,該方法通過對GWAS樣本個體進行連鎖相構(gòu)建,進而利用參考庫的單倍型進行缺失基因型填充46策略評估(續(xù))Howie等發(fā)明了一種pre-phasing的NGS-GWAS水稻農(nóng)藝性狀14種運用重測序技術(shù)對517個中國水稻地方品系進行進化及GWAS分析~1X重測序KNN基因型填充算法MLM遺傳模型

NatGenet.2010Oct;42:961–967.47NGS-GWAS水稻農(nóng)藝性狀14種47高密度芯片低覆蓋度測序基本特點芯片基于正常人群中的高頻SNP標記設(shè)計,沒有與疾病相關(guān)的突變信息可以同時檢測到人群中的高頻SNP和未被發(fā)現(xiàn)的低頻突變最高分辨率根據(jù)不同的芯片型號,一般在30-100bp精確到單個堿基覆蓋范圍只能局限于芯片內(nèi)容,無法獲得全部基因組信息僅受到能夠定位到基因組的reads數(shù)據(jù)量影響,可獲得全基因組的信息技術(shù)原理雜交原理,實驗環(huán)境和樣本對實驗重復(fù)有很大影響合成測序,重復(fù)性好動態(tài)量程弱信號被舍棄,強信號會飽和沒有局限數(shù)據(jù)產(chǎn)出選擇不可以可以背景噪音高低數(shù)據(jù)延展性隨著人類基因組的進一步完善,測序數(shù)據(jù)可以進一步深挖高密度芯片vs.低覆蓋度測序48高密度芯片低覆蓋度測序基本特點芯片基于正常人群中的高頻SNP測序成本49測序成本49GWAS:Array-basedvs.NGS-based50GWAS:Array-basedvs.NGS-base基本流程高通量測序基因分型:

CLCGenomicsWorkbench&ServerBWA/Bowtie+SAMtools/GATK+IGV全基因組關(guān)聯(lián)分析:

PLINK,TASSEL,QTDT/FBATBEAGLE/IMPUTE+SNPTEST可視化和注釋:

IGV/gPlink+ANNOVAR/Annotation.pl51基本流程高通量測序基因分型:51GWAS模塊52植物育種動物育種人類疾病TASSELQTDTFBATPBATPLINKSNPTESTMENDELBEAMIMPUTEBEAGLEMETALHAPLOVIEWFASTSNPLinuxC/C++RPerlPythonMySQLGWAS模塊52植物育種動物育種人類疾病TASSELQTDT應(yīng)用藥物治療抗抑郁藥、精神疾病藥物、丙型肝炎治療,肝損害等副作用,為個體化醫(yī)療奠定理論基礎(chǔ)意義中國每年因藥物不良反應(yīng)住院治療的病人已逾250萬人,其中約20萬人因此死亡,個體化醫(yī)療勢在必行53應(yīng)用藥物治療53丙型肝炎治療丙肝全球1.7億人感染的病毒性疾病,無根治辦法,治療效果因人而異IL28B基因

TT基因型攜帶者痊愈率約1/4;CC基因型攜帶者痊愈率達4/5

09年GWAS最具價值成果正在美國申請專利54丙型肝炎治療丙肝54應(yīng)用動植物育種在牛豬雞、玉米小麥等方面,歐美農(nóng)業(yè)部等國家機構(gòu)和Euribrid、Hubbard、MetaMoprhix等公司都已開展全基因組選擇意義在提高動植物產(chǎn)品的產(chǎn)量和質(zhì)量的同時,還可以有效管理生物多樣性,使得遺傳增益不會破壞某些未來可能需要的性狀55應(yīng)用動植物育種55全基因組選擇GenomicSelection,GS

利用整個基因組的標記信息和各性狀值來估計每個標記或染色體片段的效應(yīng)值,然后將效應(yīng)值加和即得到基因組育種值丹麥案例

2012年人均GDP達$59928,農(nóng)業(yè)大國

2008年GS用于牛育種;2010年引入豬育種56全基因組選擇GenomicSelection,GS56演講完畢,謝謝觀看!演講完畢,謝謝觀看!全基因組關(guān)聯(lián)分析周家蓬博士zhoujp@QQ群:25980418158全基因組關(guān)聯(lián)分析周家蓬博士1基本概念歷史、現(xiàn)狀和趨勢一般流程研究策略應(yīng)用價值59基本概念歷史、現(xiàn)狀和趨勢一般流程研究策略應(yīng)用價值2全基因組關(guān)聯(lián)研究Genome-wideassociationstudy(GWAS)檢測全基因組范圍的遺傳變異與可觀測性狀間的遺傳關(guān)聯(lián)60全基因組關(guān)聯(lián)研究Genome-wideassociatio遺傳變異的檢測SNP芯片

Affymetrix:500Kchip(Randomlydistributed)

Illumina:550Kchip(gene-based)高通量測序

Illumina/Solexa:DNA-seq,RNA-seq61遺傳變異的檢測SNP芯片4遺傳變異的數(shù)量“單倍型圖譜計劃1”(Nature2005)SNP:1M“單倍型圖譜計劃2”(Nature2007)SNP:4M“單倍型圖譜計劃3”(Nature2010)SNP:10M

62遺傳變異的數(shù)量“單倍型圖譜計劃1”(Nature2005SNP和SNP基因型TTCAGTCAGATTCCAGCCCTTCAGTCAGATTCCAGCCC樣本1樣本2TTCAGTCAGATTCCAGCCCTTCAGTCAGAGTCCAGCCC63SNP和SNP基因型TTCAGTCAGATTCCAGCCCT表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀表型校正:去除outliers,取特征值,取剩余值模型:混合線性模型方程組算法:SNP,單倍型,CNV,Gene-set(SNPs)Add.,Dom.,Rec.,Int.Frequentist,Bayesian方差/秩和,均值/中位數(shù)打分值,似然比

Bonferroni,F(xiàn)DR,Permutation,Bootstrap64表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀7編碼基因型Foronemarkerwithtwoalleles,therecanbethreepossiblegenotypes:GenotypeCodingAA2Aa1aa065編碼基因型Foronemarkerwithtwoa病例/對照設(shè)計的數(shù)據(jù)結(jié)構(gòu)individualaffectiongenderSNP1SNP2…SNPn11F21…221M22…130F12…241F11…250M0-9…1sampleidcase/controlgenotypes66病例/對照設(shè)計的數(shù)據(jù)結(jié)構(gòu)individualaffectio遺傳假設(shè)和遺傳模型GenotypicmodelHypothesis:all3differentgenotypeshavedifferenteffectsGenotypeGenotypicValueAAμAAAaμAaaaμaaAAvs.Aavs.aa67遺傳假設(shè)和遺傳模型GenotypicmodelGenotyDominantmodelHypothesis:thegeneticeffectsofAAandAaarethesameGenotypeGenotypicValueAAμA-AaμA-aaμaaAAandAavs.aa遺傳假設(shè)和遺傳模型(續(xù))68DominantmodelGenotypeGenotypiRecessivemodelHypothesis:thegeneticeffectsofAaandaaarethesameGenotypeGenotypicValueAAμA-Aaμa-aaμaaAAvs.Aaandaa69遺傳假設(shè)和遺傳模型(續(xù))RecessivemodelGenotypeGenotypAllelicmodelHypothesis:thegeneticeffectsofalleleAandalleleaaredifferentGenotypeGenotypicValueAA2μAAaμA+μaaa2μaAvs.a70遺傳假設(shè)和遺傳模型(續(xù))AllelicmodelGenotypeGenotypic卡方檢驗GenotypicmodelNullhypothesis:Independence

AAAaaacasesnAAnAanaacontrolsmAAmAamaadf=271卡方檢驗GenotypicmodelAAAaaacasesChi-squaredteststatistic:OistheobservedcellcountsEistheexpectedcellcounts,undernullhypothesisofindependence

統(tǒng)計量72Chi-squaredteststatistic:統(tǒng)計量Rcode>Statistics<-rchisq(1000,df=5)>hist(Statistics,prob=T)>curve(dchisq(x,df=5),col='blue',add=TRUE)>curve(dchisq(x,df=2),col='red',add=TRUE)>P<-1-pchisq(10,df=2);P[1]0.006737947

統(tǒng)計量P值73Rcode統(tǒng)計量P值16GWAS的歷史2005年,Science雜志報道了第一篇GWAS研究:年齡相關(guān)性黃斑變性之后陸續(xù)出現(xiàn)了有關(guān)冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂癥以及相關(guān)表型的報道74GWAS的歷史2005年,Science雜志報道了第一篇GWGWAS的現(xiàn)狀75GWAS的現(xiàn)狀18GWAS的趨勢76GWAS的趨勢19探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般到特殊)“穆勒五法”:求同法、求異法、求同求異法、共變法、排除法全基因組關(guān)聯(lián)研究主要基于共變法思想科學(xué)技術(shù)史之父薩頓認為科學(xué)是人類唯一具有累積性和繼承性的活動77探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般一般流程使用SNP分型芯片獲得高通量的基因型對基因型進行質(zhì)量評估和控制若為質(zhì)量性狀,需進行群體分層檢測;如為數(shù)量性狀,則對表型進行協(xié)變量校正采用若干遺傳模型進行全基因組關(guān)聯(lián)分析增加額外的數(shù)據(jù)進行結(jié)果驗證78一般流程使用SNP分型芯片獲得高通量的基因型21AHMU案例IlluminaHuman610Quad

BeadChipCallrate<90%,MAF

<1%,HWE

P

<10-71139病例vs.1132對照,PCA分析Cochran-Armitage趨勢檢驗5182病例vs.6516對照,539病例vs.824對照NatGenet.2009Feb;41(2):205-210.79AHMU案例IlluminaHuman610QuadB計算過程PLINK

/~purcell/plink/plink–fileAHMU–mind0.05–maf0.01–hwe0.000001–model–outAHMU80計算過程PLINK23輸入輸出AHMU.pedAHMU.mapAHMU.model81輸入輸出AHMU.ped24GWAS主要策略Meta分析缺失填充通路分析互作分析82GWAS主要策略Meta分析缺失填充通路分析互作分析25Meta分析定義合并多個研究數(shù)據(jù),增加樣本量,提高檢測效力,發(fā)現(xiàn)新易感位點成功案例

Ⅱ型糖尿病、克隆病、多發(fā)性硬化、類風(fēng)濕性關(guān)節(jié)炎、直結(jié)腸癌等83Meta分析定義26Meta分析分析步驟檢測研究異質(zhì)性選擇模型固定效應(yīng)模型,隨機誤差(弱)隨機效應(yīng)模型,群體分層(強)單因素分析合并各研究檢驗統(tǒng)計量、標準誤或p值常用軟件

METAL、Comprehensive

Meta-analysis等84Meta分析分析步驟27缺失填充定義缺失基因型填充(Imputation)主要是為了解決致病變異或其緊密連鎖標簽分型遺漏的問題成功案例約1/3-1/2的GWAS文章使用該技術(shù)85缺失填充定義28缺失填充分析步驟對自產(chǎn)數(shù)據(jù)進行基因型質(zhì)量控制選擇合適的參考數(shù)據(jù)庫,對高質(zhì)量的基因型數(shù)據(jù)進行缺失填充根據(jù)計算得出的準確率(info>0.8)對填充基因型進行篩選過濾進行關(guān)聯(lián)分析常用軟件

BEAGLE、IMPUTE、MACH和PLINK等86缺失填充分析步驟29通路分析定義將SNPs按照生物學(xué)通路分組,比較各通路在病例/對照或連續(xù)性狀數(shù)量上的差異成功案例克隆病、I型糖尿病、類風(fēng)濕性關(guān)節(jié)炎、精神分裂癥、乳腺癌等87通路分析定義30通路分析分析步驟選擇生物通路(KEGG)選擇Tag

SNPs(HapMap)多因素分析顯著SNPs結(jié)果綜合常用軟件

GSEA、IPA等88通路分析分析步驟31互作分析定義研究基因-基因、基因-環(huán)境間交互作用成功案例老年黃斑變性、帕金森病、直腸癌、膀胱癌,哮喘等89互作分析定義32互作分析分析步驟選擇顯著及近似顯著SNPs選擇風(fēng)險環(huán)境因素構(gòu)建互作模型多因素分析常用軟件

PLINK、Random

Jungle、BEAM等90互作分析分析步驟33其他策略兩階段法精細定位/目標測序表型/性狀聯(lián)合單倍型分析91其他策略兩階段法34遺傳變異的檢測SNP芯片

Affymetrix:500Kchip(Randomlydistributed)

Illumina:550Kchip(gene-based)高通量測序

Illumina/Solexa:DNA-seq,RNA-seq92遺傳變異的檢測SNP芯片35高通量測序Next-generationsequencing(NGS)平行測序93高通量測序Next-generationsequencinSNP分型:

coverage&variantfrequency94參考基因組序列個體正向序列個體反向序列SNP分型:

coverage&variantfreq遺傳變異的種類占總變異的90%單核苷酸多態(tài)性SinglenucleotidepolymorphismSNP1-50bp

DNA片段插入缺失Insertion-deletionInDel>50bpDNA片段結(jié)構(gòu)變異Structural

variationSV95遺傳變異的種類占總變異的90%單核苷酸多態(tài)性Singlen遺傳變異的數(shù)量“千人基因組計劃”(Nature2012)SNP:38MInDel:1.4MSV:14K96遺傳變異的數(shù)量“千人基因組計劃”(Nature2012)3效應(yīng)大小vs.變異頻率9797效應(yīng)大小vs.變異頻率4040家系病例或極端性狀個體

NatRevGenet.2010Jun;11(6):415-25.98家系病例或極端性狀個體NatRevGenet.2010外顯子突變是孟德爾疾病主要病因;多向性效應(yīng)影響復(fù)雜疾病價格相對低廉目前主要用于檢測孟德爾疾病新的策略或方法:Lasso,折疊法,聚合法外顯子組測序99外顯子突變是孟德爾疾病主要病因;多向性效應(yīng)影響復(fù)雜疾病外顯子Lasso嶺回歸:|beta|2<tLasso回歸:|beta|<t貝葉斯:全概率&損失函數(shù)機器學(xué)習(xí):SVM100Lasso嶺回歸:|beta|2<tLa低覆蓋度測序+缺失基因型填充101Pasaniucet.al.,2012低覆蓋度測序+缺失基因型填充44Pasaniucet.a策略評估Pasaniuc等證實覆蓋度低至0.1-0.5X依然可以通過后續(xù)的填充方法獲得高密度芯片的效果102策略評估Pasaniuc等證實覆蓋度低至0.1-0.5X依然策略評估(續(xù))Howie等發(fā)明了一種pre-phasing的填充方法,該方法通過對GWAS樣本個體進行連鎖相構(gòu)建,進而利用參考庫的單倍型進行缺失基因型填充103策略評估(續(xù))Howie等發(fā)明了一種pre-phasing的NGS-GWAS水稻農(nóng)藝性狀14種運用重測序技術(shù)對517個中國水稻地方品系進行進化及GWAS分析~1X重測序KNN基因型填充算法MLM遺傳模型

NatGenet.2010Oct;42:961–967.10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論