天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 醫(yī)學(xué)論文 > 護(hù)理論文 >

主成分分析用于校正人群分層時(shí)位點(diǎn)選擇策略的探討

發(fā)布時(shí)間:2018-03-16 02:12

  本文選題:全基因組關(guān)聯(lián)研究 切入點(diǎn):千人基因組計(jì)劃 出處:《南京醫(yī)科大學(xué)》2015年碩士論文 論文類型:學(xué)位論文


【摘要】:全基因組關(guān)聯(lián)研究(Genome-wide association study,GWAS)已經(jīng)成功鑒別出了許多與復(fù)雜疾病(complex disease)/可測性狀(observable trait)有關(guān)的易感性位點(diǎn)。眾所周知,在復(fù)雜疾病的全基因組關(guān)聯(lián)研究中,人群分層(population stratification)現(xiàn)象是一個(gè)重要的問題。如果這種混雜效應(yīng)沒有得到適當(dāng)?shù)目刂?可能會(huì)增加結(jié)果的假陽性率,導(dǎo)致虛假關(guān)聯(lián)。因此,在GWAS中充分考慮人群遺傳結(jié)構(gòu),控制人群分層是十分必要的。目前,用于全基因組關(guān)聯(lián)研究中控制人群分層的方法有很多,比如:主成分分析(principal component analysis,PCA),基因組對(duì)照(genomic control,GC),混合模型(mixed models)等。PCA由Hotelling于1933年提出,是經(jīng)典的多元統(tǒng)計(jì)分析方法之一。該方法通過將高維空間的問題投影到低維空間,在損失少許信息的基礎(chǔ)上,最終提取到最有效的信息。在GWAS中,PCA被廣泛用于檢測人群亞結(jié)構(gòu)、校正人群分層和對(duì)人類歷史變遷做出合理的推論等方面。本研究利用“千人基因組計(jì)劃”中的低覆蓋度全基因組測序數(shù)據(jù)(low-coverage whole genome sequencing dataset)與高覆蓋度全基因組測序數(shù)據(jù)(high-coverage whole genome sequencing dataset),探討基于不同種類變異位點(diǎn)構(gòu)建主成分是否可以用于識(shí)別不同大陸人群(European,Asian和African),尤其是識(shí)別遺傳結(jié)構(gòu)上更為相近的European和Asian。最終旨在提供全基因組關(guān)聯(lián)研究中校正人群分層時(shí)位點(diǎn)選擇的策略,同時(shí)進(jìn)一步闡明各個(gè)大陸人群歷史起源及變遷過程。研究內(nèi)容包括以下三個(gè)方面:(1)基于“1000genome”網(wǎng)站上下載到的2010年8月份完成的低覆蓋度全基因組測序(low-coveragewgs)數(shù)據(jù),首先利用其中的1號(hào)染色體數(shù)據(jù),將不同種族人群之間的變異位點(diǎn)進(jìn)行匹配以得到共同的位點(diǎn),然后將共有的變異位點(diǎn)進(jìn)行分類,分為常見變異(commonvariants,cv),低頻變異(low-frequencyvariants,lfv)和罕見變異(rarevariants,rv)。之后,基于每一種變異位點(diǎn)以及它們的組合構(gòu)建主成分,來檢測利用不同位點(diǎn)構(gòu)建主成分時(shí)用于人群分層的效果。(2)基于以上low-coveragewgs數(shù)據(jù)中所有染色體數(shù)據(jù),首先針對(duì)每條染色體上不同種族人群間的位點(diǎn)進(jìn)行匹配得到相同位點(diǎn),然后將22條染色體的位點(diǎn)進(jìn)行整合得到三個(gè)人群的全基因組共有變異位點(diǎn)數(shù)據(jù),將整合后的變異位點(diǎn)進(jìn)行分類,分為cv,lfv與rv。最終,基于每一種變異位點(diǎn)以及它們的組合構(gòu)建主成分,探索利用不同位點(diǎn)構(gòu)建主成分時(shí)用于人群分層的效果。(3)基于“1000genome”網(wǎng)站上下載到的2011年6月份完成的高覆蓋度全基因組測序(high-coveragewgs)數(shù)據(jù),利用其中五條染色體數(shù)據(jù)(1號(hào),5號(hào),10號(hào),15號(hào)與20號(hào)染色體),其余數(shù)據(jù)預(yù)處理步驟及構(gòu)建主成分的方式均與以上相同。本研究的主要結(jié)果是:(1)low-coveragewgs數(shù)據(jù)中1號(hào)染色體結(jié)果:基于cvs或lfvs所構(gòu)建的前兩個(gè)主成分便能夠很好的將eur、asn和afr人群分開,cvs的表現(xiàn)稍優(yōu)于lfvs,但rvs的效果并不理想。除此之外,基于不同組合的位點(diǎn)構(gòu)建主成分,即cvs+lfvs、cvs+rvs和cvs+lfvs+rvs,三者識(shí)別不同種族的能力與單獨(dú)利用cvs效果相近,但相對(duì)于單獨(dú)利用lfvs有明顯的改善。與此同時(shí),選擇以上效果最優(yōu)的cvs用于每個(gè)洲的亞群分層,發(fā)現(xiàn)其能夠較好的識(shí)別亞群遺傳結(jié)構(gòu),尤其是對(duì)于afr的亞群分層。(2)low-coverage WGS數(shù)據(jù)中所有染色體結(jié)果:與以上的結(jié)果一致。但值得一提的是,在利用全基因組數(shù)據(jù)之后,每種變異位點(diǎn)進(jìn)行人群分層的效果有了進(jìn)一步提升。且CVs用于亞群分層的結(jié)果也有了進(jìn)一步的提升。以上兩種結(jié)果都可以從人群分層的定量結(jié)果中獲得。(3)high-coverage WGS數(shù)據(jù)中五條染色體結(jié)果:與以上的結(jié)果基本一致。但值得一提的是,被分開的每個(gè)洲的人群都有較高的集中程度,尤其對(duì)于歐洲和亞洲來說,人群較集中,沒有多余的散點(diǎn)。同時(shí)發(fā)現(xiàn)RVs的效果優(yōu)于以上低覆蓋度數(shù)據(jù)中RVs的結(jié)果,其能夠很明顯地將AFR和non-AFR分開。
[Abstract]:......
【學(xué)位授予單位】:南京醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:R440

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 范p,

本文編號(hào):1617869


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/huliyixuelunwen/1617869.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶05d96***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
91麻豆视频国产一区二区| 午夜久久精品福利视频| 丁香六月婷婷基地伊人| 久久国产精品热爱视频| 国产又粗又猛又爽色噜噜| 国产欧美一区二区久久| 国产大屁股喷水在线观看视频 | 隔壁的日本人妻中文字幕版| 日本道播放一区二区三区| 五月情婷婷综合激情综合狠狠 | 日本一本在线免费福利| 日韩一区二区三区18| 经典欧美熟女激情综合网| 91精品国自产拍老熟女露脸| 国产欧美一区二区色综合| 欧美成人国产精品高清| 亚洲女同一区二区另类| 国产精品九九九一区二区| 日韩国产传媒在线精品| 欧美日韩人妻中文一区二区| 欧美在线观看视频三区| 在线一区二区免费的视频| 色一情一伦一区二区三| 国产在线日韩精品欧美| 亚洲熟女乱色一区二区三区| 老司机精品线观看86| 老司机精品在线你懂的| 国产一区国产二区在线视频| 最新69国产精品视频| 好吊色欧美一区二区三区顽频| 91欧美一区二区三区| 国产精品久久久久久久久久久痴汉 | 日韩人妻毛片中文字幕| 午夜国产福利在线播放| 亚洲一区二区三区三区| 97人妻精品一区二区三区免| 午夜精品久久久免费视频 | 日本国产欧美精品视频| 亚洲一区精品二人人爽久久| 日本一区不卡在线观看| 国产丝袜女优一区二区三区|