當(dāng)前位置：主頁 > 醫(yī)學(xué)論文 > 護(hù)理論文 >

主成分分析用于校正人群分層時位點選擇策略的探討

發(fā)布時間：2018-03-16 02:12

本文選題：全基因組關(guān)聯(lián)研究　切入點：千人基因組計劃　出處：《南京醫(yī)科大學(xué)》2015年碩士論文　論文類型：學(xué)位論文

【摘要】：全基因組關(guān)聯(lián)研究(Genome-wide association study,GWAS)已經(jīng)成功鑒別出了許多與復(fù)雜疾病(complex disease)/可測性狀(observable trait)有關(guān)的易感性位點。眾所周知,在復(fù)雜疾病的全基因組關(guān)聯(lián)研究中,人群分層(population stratification)現(xiàn)象是一個重要的問題。如果這種混雜效應(yīng)沒有得到適當(dāng)?shù)目刂?可能會增加結(jié)果的假陽性率,導(dǎo)致虛假關(guān)聯(lián)。因此,在GWAS中充分考慮人群遺傳結(jié)構(gòu),控制人群分層是十分必要的。目前,用于全基因組關(guān)聯(lián)研究中控制人群分層的方法有很多,比如:主成分分析(principal component analysis,PCA),基因組對照(genomic control,GC),混合模型(mixed models)等。PCA由Hotelling于1933年提出,是經(jīng)典的多元統(tǒng)計分析方法之一。該方法通過將高維空間的問題投影到低維空間,在損失少許信息的基礎(chǔ)上,最終提取到最有效的信息。在GWAS中,PCA被廣泛用于檢測人群亞結(jié)構(gòu)、校正人群分層和對人類歷史變遷做出合理的推論等方面。本研究利用“千人基因組計劃”中的低覆蓋度全基因組測序數(shù)據(jù)(low-coverage whole genome sequencing dataset)與高覆蓋度全基因組測序數(shù)據(jù)(high-coverage whole genome sequencing dataset),探討基于不同種類變異位點構(gòu)建主成分是否可以用于識別不同大陸人群(European,Asian和African),尤其是識別遺傳結(jié)構(gòu)上更為相近的European和Asian。最終旨在提供全基因組關(guān)聯(lián)研究中校正人群分層時位點選擇的策略,同時進(jìn)一步闡明各個大陸人群歷史起源及變遷過程。研究內(nèi)容包括以下三個方面:(1)基于“1000genome”網(wǎng)站上下載到的2010年8月份完成的低覆蓋度全基因組測序(low-coveragewgs)數(shù)據(jù),首先利用其中的1號染色體數(shù)據(jù),將不同種族人群之間的變異位點進(jìn)行匹配以得到共同的位點,然后將共有的變異位點進(jìn)行分類,分為常見變異(commonvariants,cv),低頻變異(low-frequencyvariants,lfv)和罕見變異(rarevariants,rv)。之后,基于每一種變異位點以及它們的組合構(gòu)建主成分,來檢測利用不同位點構(gòu)建主成分時用于人群分層的效果。(2)基于以上low-coveragewgs數(shù)據(jù)中所有染色體數(shù)據(jù),首先針對每條染色體上不同種族人群間的位點進(jìn)行匹配得到相同位點,然后將22條染色體的位點進(jìn)行整合得到三個人群的全基因組共有變異位點數(shù)據(jù),將整合后的變異位點進(jìn)行分類,分為cv,lfv與rv。最終,基于每一種變異位點以及它們的組合構(gòu)建主成分,探索利用不同位點構(gòu)建主成分時用于人群分層的效果。(3)基于“1000genome”網(wǎng)站上下載到的2011年6月份完成的高覆蓋度全基因組測序(high-coveragewgs)數(shù)據(jù),利用其中五條染色體數(shù)據(jù)(1號,5號,10號,15號與20號染色體),其余數(shù)據(jù)預(yù)處理步驟及構(gòu)建主成分的方式均與以上相同。本研究的主要結(jié)果是:(1)low-coveragewgs數(shù)據(jù)中1號染色體結(jié)果:基于cvs或lfvs所構(gòu)建的前兩個主成分便能夠很好的將eur、asn和afr人群分開,cvs的表現(xiàn)稍優(yōu)于lfvs,但rvs的效果并不理想。除此之外,基于不同組合的位點構(gòu)建主成分,即cvs+lfvs、cvs+rvs和cvs+lfvs+rvs,三者識別不同種族的能力與單獨利用cvs效果相近,但相對于單獨利用lfvs有明顯的改善。與此同時,選擇以上效果最優(yōu)的cvs用于每個洲的亞群分層,發(fā)現(xiàn)其能夠較好的識別亞群遺傳結(jié)構(gòu),尤其是對于afr的亞群分層。(2)low-coverage WGS數(shù)據(jù)中所有染色體結(jié)果:與以上的結(jié)果一致。但值得一提的是,在利用全基因組數(shù)據(jù)之后,每種變異位點進(jìn)行人群分層的效果有了進(jìn)一步提升。且CVs用于亞群分層的結(jié)果也有了進(jìn)一步的提升。以上兩種結(jié)果都可以從人群分層的定量結(jié)果中獲得。(3)high-coverage WGS數(shù)據(jù)中五條染色體結(jié)果:與以上的結(jié)果基本一致。但值得一提的是,被分開的每個洲的人群都有較高的集中程度,尤其對于歐洲和亞洲來說,人群較集中,沒有多余的散點。同時發(fā)現(xiàn)RVs的效果優(yōu)于以上低覆蓋度數(shù)據(jù)中RVs的結(jié)果,其能夠很明顯地將AFR和non-AFR分開。
[Abstract]:......
【學(xué)位授予單位】：南京醫(yī)科大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2015
【分類號】：R440

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 范p，

本文編號：1617869

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/huliyixuelunwen/1617869.html

上一篇：全髖關(guān)節(jié)置換術(shù)中自體血回輸對患者炎性細(xì)胞因子的影響
下一篇：醫(yī)院感染鮑氏不動桿菌分布與耐藥性分析

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

主成分分析用于校正人群分層時位點選擇策略的探討