隨機SNP在全基因組關聯(lián)研究人群分層分析中的應用_第1頁
隨機SNP在全基因組關聯(lián)研究人群分層分析中的應用_第2頁
隨機SNP在全基因組關聯(lián)研究人群分層分析中的應用_第3頁
隨機SNP在全基因組關聯(lián)研究人群分層分析中的應用_第4頁
隨機SNP在全基因組關聯(lián)研究人群分層分析中的應用_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 926 HEREDITAS (Beijing 2010 第 32 卷 圖4 SNP 數(shù)量和 STRUCTURE 個體祖先推斷關系圖 A: 反映不同數(shù)目的 AIMs 和隨機分布于全基因組的 SNP 對 4 個洲際人群的識別效果。 B: 反映不同數(shù)目的 AIMs 和隨機分布于全基因組的 SNP 對 CHB(中國北京漢族樣本 和 JPT( 日本東京樣本 兩個祖先較近的洲內人群的識別效果??v軸的百分比是指該人群的祖先系數(shù)小于 0.8 的個體 所占的百分比。 遠的洲際人群 , 還是祖先起源較近的人群之間 , 都 可以用隨機均勻分布的位點來尋找人群潛在的遺傳 結構?;陔S機選擇 SNP 組合計算的 Fs

2、t 要小于基 于 AIM 計算的 Fst, 提示隨機選擇 SNP 識別人群內部 圖 5 4 個人群基于不同 SNP 集合的 STRUCTURE 聚類 圖 (k=4 YRI、 JPT、 CEU、 CHB 的含義見圖 1。 遺傳結構的效果可能不如 AIMs。但從 STRUCTURE 分析的結果來看, 隨機選擇的 SNP 同樣能夠識別人群 內部的遺傳結構。因此 , 當有針對特定人群可用的 的最大祖先系數(shù)大于 0.8 的效果 ; 而當區(qū)分祖先起 源較近的人群時 , 3 000 個 SNP 就可以使 92.4%的個 體的最大祖先系數(shù)大于 0.8, 10 000 個 SNP 就可使 AIMs 時, 優(yōu)先選

3、擇 AIMs 來識別遺傳結構; 當針對特 定研究人群并沒有可用的 AIMs 時, 隨機均勻分布于 特定研究識別 全基因組的 SNP 則是一種較好的選擇。 遺傳結構時, 需要的 SNP 數(shù)目與人群之間遺傳分化的 大小有關, 祖先起源越近, 需要的 SNP 數(shù)目越多。對 99.7%的個體的最大祖先系數(shù)大于 0.8。這些結果提 示 , 在全基因組關聯(lián)性研究中 , 無論是祖先起源較 圖6 CHB(中國北京漢族樣本 和 JPT(日本東京樣本 基于不同 SNP 集合的 STRUCTURE 聚類圖 第9期 曹宗富等 : 隨機 SNP 在全基因組關聯(lián)研究人群分層分析中的應用 927 于不同大陸起源的人群, 需

4、要 500 個以上的 SNP; 對 祖先起源較近的人群, 至少需要 3 00010 000 個 SNP。 同時, 為了保證結果的可靠性, 可增加不同 SNP 數(shù)目 進行重復驗證, 以觀察結果的一致性。 組顯著性的也有 7 個 SNPs, 對關聯(lián)研究也具有很大影 響。這些結果提示關聯(lián)研究中對不同大陸起源的洲際 人群的遺傳結構檢出非常重要, 即使祖先起源較近人 群, 其遺傳亞結構的影響也依然不容忽視。 同時 , 本研究篩選出來的人群之間具有全基因 組顯著性的位點 , 可為關聯(lián)研究提供參考。在不同 祖先起源的全基因組關聯(lián)研究中 , 當檢出與疾病關 聯(lián)的 SNP 中含有與本研究篩選出的位點時 , 應謹

5、慎 對待。在 GWAS 中 , 國際合作越來越多 , 同時也有 更多的 GWAS 數(shù)據(jù)可以共享使用 3,21。當多個不同 大陸起源洲際人群的復雜樣本聯(lián)合使用時 , 人群遺 傳結構是必然存在的。因此 , 本研究對復雜樣本的 關聯(lián)研究也具有參考價值。 f 值和 Fisher 精確檢驗結果提示 , CHB 和 JPT 之 間等位基因頻率具有較大差異的 SNP 較少 , 同時 , 本研究對不同 SNP 組合的 Fst 分析結果均提示 , CHB 和 JPT 具有較近的祖先 , 該結果也被 Rosenberg 等 19 用全基因組的微衛(wèi)星數(shù)據(jù)聚類得到證實。當把 4 個 人群進行 STRUCTURE 分析

6、時 , 任何 SNP 組合都不 能識別東亞人群 CHB 和 JPT 間的遺傳結構。然而 , 當把 CHB 和 JPT 單獨分析時 , 增加 AIMs 或隨機選 擇的 SNP 數(shù)目 , 或者利用 EASTASIAAIMS, 卻能夠 發(fā)現(xiàn)內部存在的遺傳結構。 Miao 等 20 利用 Y-STR 單體型和 HapMap Phase2 的常染色體 SNP 數(shù)據(jù)進行 參考文獻 (References: 1 Wang WY, Barratt BJ, Clayton DG, Todd JA. Genome-wide association studies: theoretical and practica

7、l concerns. Nat Rev Genet, 2005, 6(2: 109118. 2 Balding DJ. A tutorial on statistical methods for population association studies. Nat Rev Genet, 2006, 7(10: 781791. 3 The Wellcome Trust Case Control Consortium. Genome-wide association study of 14 000 cases of seven common diseases and 3 000 shared c

8、ontrols. Nature, 2007, 447(7145: 661683. 4 Zhang XJ, Huang W, Yang S, Sun LD, Zhang FY, Zhu QX, Zhang FR, Zhang C, Du WH, Pu XM, Li H, Xiao FL, Wang ZX, Cui Y, Hao F, Zheng J, Yang XQ, Cheng H, He CD, Liu XM, Xu LM, Zheng HF, Zhang SM, Zhang JZ, Wang HY, Cheng YL, Ji BH, Fang QY, Li YZ, Zhou FS, Han

9、 JW, Quan C, Chen B, Liu JL, Lin D, Fan L, Zhang AP, Liu SX, Yang CJ, Wang PG, Zhou WM, Lin GS, Wu WD, Fan X, Gao M, Yang BQ, Lu WS, Zhang Z, Zhu KJ, Shen SK, Li M, Zhang XY, Cao TT, Ren W, Zhang X, He J, Tang XF, Lu S, Yang JQ, Zhang L, Wang DN, Yuan F, Yin XY, Huang HJ, Wang HF, Lin XY, Liu JJ. Ps

10、oriasis genome-wide association study identifies susceptibility variants within LCE gene cluster at 1q21. Nat Genet, 2009, 41(2: 205210. 5 Han JW, Zheng HF, Cui Y, Sun LD, Ye DQ, Hu Z, Xu JH, Cai ZM, Huang W, Zhao GP, Xie HF, Fang H, Lu QJ, Xu JH, Li XP, Pan YF, Deng DQ, Zeng FQ, Ye ZZ, Zhang XY, Wa

11、ng QW, Hao F, Ma L, Zuo XB, Zhou FS, Du WH, Cheng YL, Yang JQ, Shen SK, Li J, Sheng YJ, Zuo XX, Zhu WF, Gao F, Zhang PL, Guo Q, Li B, Gao M, Xiao FL, Quan C, Zhang C, Zhang Z, Zhu KJ, Li Y, Hu DY, Lu WS, Huang JL, Liu SX, Li STRUCTURE 分析也獲得了相似的結果。這些結果 說明 , 雖然 CHB 和 JPT 具有較近的遺傳祖先 , 但其 內部存在的遺傳結構仍然可以識別

12、 , 只是與祖先較 遠的人群一起進行分析時 , 難以識別內部存在的遺 傳結構。這些結果提示 , 人群之間較大的遺傳分層 使得較小的遺傳分層難以識別。在全基因組關聯(lián)性 研究中 , 當 對祖先較近 人群進行人 群分層研究 時 , 目前常常采用不同大陸起源的 HapMap 人群做參考 , 需要慎重對待 , 還需要進一步選用祖先較近的人群 做參考人群單獨進行分層分析。 比較 Fst 和 STRUCTURE 兩種方法的結果 , 可 以發(fā)現(xiàn)兩種方法的結果有一定的差異。譬如 , Fst 結 果顯示 AIM 識別人群結構的效果要比隨機均勻選擇 的 SNP 效果更好 , 但是 STRUCTURE 的結果顯示 ,

13、 隨機均勻選擇的 SNP 識別人群結構的效果并不比篩 選的 AIM 效果差。這些結果反映了兩種方法在算法 上的差異 , 每種算法都可能有其局限性 , 因此識別 人群分層時常需要多種方法相互驗證。尤其是單獨 對 CHB 和 JPT 分析時 , 當 SNP 數(shù)目超過 1 500 時 , 隨 機選擇的 SNP 要比篩選的 AIMs 識別人群結構的效 果更好 , 可能是由于 STRUCTURE 軟件算法或抽樣 樣本量太小引起的 , 該問題有待進一步探討。 Fisher 精確檢驗結果顯示在不同祖先人群之間等 位基因頻率具有顯著差異的位點最高可占全基因組的 20%以上, 提示遺傳結構對關聯(lián)分析的影響是巨大

14、的。 同時, 對祖先較近人群 CHB 和 JPT 之間, 達到全基因 928 HEREDITAS (Beijing 2010 第 32 卷 H, Ren YQ, Wang ZX, Yang CJ, Wang PG, Zhou WM, Lv YM, Zhang AP, Zhang SQ, Lin D, Li Y, Low HQ, Shen M, Zhai ZF, Wang Y, Zhang FY, Yang S, Liu JJ, Zhang XJ. Genome-wide association study in a Chinese Han population identifies nine

15、new susceptibility loci for systemic lupus erythematosus. Nat Genet, 2009, 41(11: 12341237. 6 Gudmundsson J, Sulem P, Manolescu A, Amundadottir LT, Gudbjartsson D, Helgason A, Rafnar T, Bergthorsson JT, Agnarsson BA, Baker A, Sigurdsson A, Benediktsdottir KR, Jakobsdottir M, Xu J, Blondal T, Kostic

16、J, Sun J, Ghosh S, Stacey SN, Mouy M, Saemundsdottir J, Backman VM, Kristjansson K, Tres A, PartinAW, Albers- Akkers MT, Godino-Ivan Marcos J, Walsh PC, Swinkels DW, Navarrete S, Isaacs SD, Aben KK, Graif T, Cashy J, Ruiz-Echarri M, Wiley KE, Suarez BK, Witjes JA, Frigge M, Ober C, Jonsson E, Einars

17、son GV, Mayordomo JI, Kiemeney LA, Isaacs WB, Catalona WJ, Barkardottir RB, Gulcher JR, Thorsteinsdottir U, Kong A, Stefansson K. Genome-wide association study identifies a second prostate cancer susceptibility variant at 8q24. Nat Genet, 2007, 39(5: 631637. 7 Papassotiropoulos A, Stephan DA, Huente

18、lman MJ, Hoerndli FJ, Craig DW, Pearson JV, Huynh KD, Brunner F, Corneveaux J, Osborne D, Wollmer MA, Aerni A, Coluccia D, Hänggi J, Mondadori CR, Buchmann A, Reiman EM, Caselli RJ, Henke K, de Quervain DJ. Common Kibra alleles are associated with human memory performance. Science, 2006, 314(57

19、98: 475478. 8 Sladek R, Rocheleau G, Rung J, Dina C, Shen L, Serre D, Boutin P, Vincent D, Belisle A, Hadjadj S, Balkau B, Heude B, Charpentier G, Hudson TJ, Montpetit A, Pshezhetsky AV, Prentki M, Posner BI, Balding DJ, Meyre D, Polychronakos C, Froguel P. A genome-wide association study identifies

20、 novel risk loci for type 2 diabetes. Nature, 2007, 445(7130: 881885. 9 Bouatia-Naji N, Bonnefond A, Cavalcanti-Proença C, Spars T, Holmkvist J, Marchand M, Delplanque J, Lobbens S, Rocheleau G, Durand E, De Graeve F, Chèvre JC, Borch-Johnsen K, Hartikainen AL, Ruokonen A, Tichet J, Marre

21、M, Weill J, Heude B, Tauber M, Lemaire K, Schuit F, Elliott P, Jrgensen T, Charpentier G, Hadjadj S, Cauchi S, Vaxillaire M, Sladek R, Visvikis-Siest S, Balkau B, Lévy-Marchal C, Pattou F, Meyre D, Blakemore AI, Jarvelin MR, Walley AJ, Hansen T, Dina C, Pedersen O, Froguel P. A variant near MTN

22、R1B is associated with increased fasting plasma glucose levels and type 2 diabetes risk. Nat Genet, 2009, 41(1: 8994. 10 Bouatia-Naji N, Rocheleau G, Van Lommel L, Lemaire K, Schuit F, Cavalcanti-Proença C, Marchand M, Hartikainen AL, Sovio U, De Graeve F, Rung J, Vaxillaire M, Tichet J, Marre

23、M, Balkau B, Weill J, Elliott P, Jarvelin MR, Meyre D, Polychronakos C, Dina C, Sladek R, Froguel P. A polymorphism within the G6PC2 gene is associated with fasting plasma glucose levels. Science, 2008, 320(5879: 10851088. 11 The International HapMap Consortium. The International HapMap Project. Nat

24、ure, 2003, 426(6968: 789796. 12 Thorisson GA, Smith AV, Krishnan L, Stein LD. The International HapMap Project Web site. Genome Res, 2005, 15(11: 15921593. 13 McKeigue PM. Mapping genes that underlie ethnic differences in disease risk: methods for detecting linkage in admixed populations, by conditi

25、oning on parental admixture. AM J Hum Genet, 1998, 63(1: 241251 14 Kosoy R, Nassir R, Tian C, White PA, Butler LM, Silva G, Kittles R, Alarcon-Riquelme ME, Gregersen PK, Belmont JW, De La Vega FM, Seldin MF. Ancestry informative marker sets for determining continental origin and admixture proportion

26、s in common populationns in America. Hum Mutat, 2009, 30(1: 6978. 15 Tian C, Kosoy R, Lee A, Ransom M, Belmont JW, Gregersen PK, Seldin MF. Analysis of East Asia genetic substructure using genome-wide SNP arrays. PLoS One, 2008, 3(12: e3862. 16 Weir B, Cockerham C. Estimating F-statistics for the analysis of population str

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論