稀有變異關(guān)聯(lián)性分析中折疊與非折疊法的模擬比較研究
本文關(guān)鍵詞:稀有變異關(guān)聯(lián)性分析中折疊與非折疊法的模擬比較研究,由筆耕文化傳播整理發(fā)布。
【摘要】:目的復(fù)雜疾病是基因和環(huán)境因素共同作用的結(jié)果,為識(shí)別與復(fù)雜疾病有關(guān)的遺傳變異,遺傳流行病學(xué)家已提出多種基于基因連鎖和/或基因關(guān)聯(lián)性分析的統(tǒng)計(jì)學(xué)方法。近年來,全基因組關(guān)聯(lián)研究(genome-wide association studies,GWAS)在常見變異(common variant)與復(fù)雜疾病或性狀關(guān)聯(lián)分析中取得了巨大的成就。但同時(shí)也發(fā)現(xiàn),常見變異僅能解釋疾病或性狀遺傳度的很少比例,此現(xiàn)象稱為“遺傳缺失(missingheritability)”。一個(gè)很有可能的原因就是,稀有變異(rare variant)對(duì)復(fù)雜疾病存在中到強(qiáng)度的影響。然而面對(duì)在人群中頻率極低的稀有變異,如果仍然沿用GWAS中分析常見變異的統(tǒng)計(jì)學(xué)方法鑒別稀有變異對(duì)疾病的影響,得到的效能是非常低下的。隨著全基因組測(cè)序技術(shù)的進(jìn)步,稀有變異數(shù)據(jù)越來越容易獲得,對(duì)稀有變異的探索將提高我們對(duì)人類疾病和性狀生物學(xué)機(jī)制的理解。本研究可為分子遺傳流行病學(xué)者在研究稀有變異和疾病關(guān)聯(lián)時(shí)選擇適宜的稀有變異關(guān)聯(lián)分析統(tǒng)計(jì)方法提供參考和理論依據(jù),并為稀有變異關(guān)聯(lián)分析統(tǒng)計(jì)方法實(shí)際應(yīng)用的推廣和普及提供理論和方法學(xué)上的支持。 方法根據(jù)DNA序列稀有變異疾病狀態(tài)作用模式假設(shè),研究10種稀有變異關(guān)聯(lián)性分析方法,,通過設(shè)置不同的樣本量、非關(guān)聯(lián)稀有變異數(shù)目、關(guān)聯(lián)稀有變異效應(yīng)值大小及其方向、關(guān)聯(lián)稀有變異權(quán)重以及變異間連鎖不平衡狀態(tài)水平,系統(tǒng)模擬不同影響因素組合下的遺傳情境,探討不同模型原理的稀有變異關(guān)聯(lián)性分析方法的適用條件,并比較這些方法在不同遺傳情境中的I類錯(cuò)誤和效能。所有的方法運(yùn)算過程均在R3.0.2軟件中完成。 結(jié)果各方法方法一類錯(cuò)誤均保持在0.05水平上下。關(guān)聯(lián)稀有變異的效應(yīng)大小和方向均相同時(shí),隨樣本量增大、連鎖不平衡參數(shù)增加和非關(guān)聯(lián)變異個(gè)數(shù)減少各方法效能增高;小和中樣本量且連鎖不平衡參數(shù)為0時(shí),無方向考慮的三種方法(CMC、w-Sum和SUM)和aSum在非關(guān)聯(lián)變異不存在或個(gè)數(shù)較少時(shí)表現(xiàn)更突出應(yīng)。關(guān)聯(lián)稀有變異的效應(yīng)大小相同但方向不同時(shí),除大樣本外各法效能均顯著降低?偟膩碚f,連鎖不平衡參數(shù)越大,非關(guān)聯(lián)變異數(shù)量越多,各方法效能更進(jìn)一步降低。有方向考慮的折疊法(SSU、SSUw、aSUM)和非折疊法(C-α、SKAT_linear、SKAT_wlinear和RR)均高于無方向考慮的折疊法;高連鎖不平衡時(shí)RR方法表現(xiàn)最優(yōu)。當(dāng)關(guān)聯(lián)稀有變異效應(yīng)權(quán)重為MAF的方差倒數(shù)時(shí),總的來說,隨著連鎖不平衡參數(shù)增加非關(guān)聯(lián)稀有變異個(gè)數(shù)減少,各方法效能逐漸升高。無非關(guān)聯(lián)變異干擾時(shí),w-Sum效能高于CMC;連鎖不平衡參數(shù)為0和0.5時(shí),SSUw和SKAT_wlinear效能分別高于SSU和SKAT_linear效能。 結(jié)論所有的方法在各自相適宜的遺傳情境下都表現(xiàn)出良好的性能。無方向考慮的折疊法適合簡(jiǎn)單的遺傳環(huán)境,其他方法在其他較為復(fù)雜的遺傳環(huán)境中仍能保持良好的性能。兩種方法起到互補(bǔ)的作用。
【關(guān)鍵詞】:稀有變異關(guān)聯(lián)性分析 折疊法 非折疊法
【學(xué)位授予單位】:廣東藥學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R181.33
【目錄】:
- 摘要5-7
- Abstract7-10
- 1 前言10-18
- 1.1 稀有變異關(guān)聯(lián)性研究的發(fā)展及現(xiàn)狀10-12
- 1.2 稀有變異影響疾病表型的作用模式假設(shè)12-13
- 1.3 稀有變異關(guān)聯(lián)研究統(tǒng)計(jì)方法研究現(xiàn)狀13-17
- 1.4 本研究主要內(nèi)容和研究意義17-18
- 2 模型原理與方法18-36
- 2.1 本研究數(shù)據(jù)結(jié)構(gòu)18
- 2.2 置換檢驗(yàn)(permutation test)18-19
- 2.3 稀有變異關(guān)聯(lián)性研究方法19-36
- 2.3.1 多元與折疊合并法(Combined Multivariate and Collapsing , CMC)19-20
- 2.3.2 權(quán)重加和檢驗(yàn)(weight Sum test,w-Sum)20-22
- 2.3.3 加和檢驗(yàn)(SUM test)22-23
- 2.3.4 基于邊際得分統(tǒng)計(jì)量的改良方法:SSU 和 SSUw23-24
- 2.3.5 數(shù)據(jù)自適應(yīng)加和檢驗(yàn)(data-adaptive Sum test,aSum)24-26
- 2.3.6 C-α檢驗(yàn)方法26-28
- 2.3.7 序列核關(guān)聯(lián)性檢驗(yàn)(Sequence Kernel Association Test,SKAT)28-31
- 2.3.8 嶺回歸(Ridge Regression,RR)31-36
- 3 模擬研究36-44
- 3.1 參數(shù)設(shè)置36-39
- 3.2 模擬數(shù)據(jù)集的產(chǎn)生39-42
- 3.3 評(píng)價(jià)指標(biāo)42
- 3.4 統(tǒng)計(jì)軟件42-44
- 4 結(jié)果44-64
- 4.1 樣本量為 250 時(shí)各類方法的一類錯(cuò)誤和效能44-50
- 4.1.1 各類方法的一類錯(cuò)誤44
- 4.1.2 各類方法的效能44-50
- 4.2 樣本量為 500 時(shí)各類方法的一類錯(cuò)誤和效能50-55
- 4.2.1 各類方法的一類錯(cuò)誤50
- 4.2.2 各類方法的效能50-55
- 4.3 樣本量為 1000 時(shí)各類方法的一類錯(cuò)誤和效能55-60
- 4.3.1 各類方法的一類錯(cuò)誤55
- 4.3.2 各類方法的效能55-60
- 4.4 樣本量對(duì)各種方法的影響60-64
- 4.4.1 對(duì)各種方法一類錯(cuò)誤的影響60
- 4.4.2 對(duì)各種方法效能的影響60-64
- 5 討論64-72
- 5.1 關(guān)聯(lián)變異效應(yīng)大小和作用方向的影響65
- 5.2 連鎖不平衡狀態(tài)的影響65-66
- 5.3 非關(guān)聯(lián)變異數(shù)量的影響66-67
- 5.4 關(guān)聯(lián)變異權(quán)重的影響67
- 5.5 樣本量的影響67-72
- 6 主要結(jié)論和應(yīng)用建議72-74
- 7 本研究的創(chuàng)新點(diǎn)與局限性74-76
- 7.1 本研究創(chuàng)新之處74
- 7.2 本研究不足之處及進(jìn)一步研究方向74-76
- 附錄 1 aSum、SKAT-linear、SKAT-wlinear、SSU、SSUw、Sum 以及 C-α方法的 AssotesteR 包調(diào)用和運(yùn)算 R 程序76-78
- 附錄 2 RR 方法的 RVtests 包調(diào)用和運(yùn)算 R 程序78-80
- 參考文獻(xiàn)80-96
- 攻讀碩士學(xué)位期間發(fā)表論文96-98
- 致謝98-99
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 陳肯界;;小額信貸促進(jìn)農(nóng)戶增收效應(yīng)的地區(qū)差異分析[J];當(dāng)代經(jīng)濟(jì);2014年03期
2 尹玲;夏蕾;許才國(guó);;基于隨機(jī)森林的女性體型判別[J];紡織學(xué)報(bào);2014年05期
3 陳廷武;;基于方差分析的監(jiān)測(cè)網(wǎng)穩(wěn)定性假設(shè)檢驗(yàn)方法[J];工程勘察;2014年04期
4 劉惠蘭;周靜;朱華亮;徐光清;丁霞;張苗苗;;自動(dòng)觀測(cè)與人工觀測(cè)能見度的差異性分析及檢驗(yàn)[J];安徽農(nóng)業(yè)大學(xué)學(xué)報(bào);2014年03期
5 張佳進(jìn);陳立暢;陳克平;唐君君;;基于R語言的農(nóng)業(yè)試驗(yàn)統(tǒng)計(jì)軟件的設(shè)計(jì)與實(shí)現(xiàn)[J];電子設(shè)計(jì)工程;2014年14期
6 歐祖軍;李洪毅;;R軟件在方程求根中的應(yīng)用[J];蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年05期
7 吳歡;謝德悠;;基于集成預(yù)測(cè)模型的貴州省農(nóng)作物受災(zāi)面積預(yù)測(cè)[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年04期
8 李亭;田原;鄔倫;劉亮;;基于隨機(jī)森林方法的滑坡災(zāi)害危險(xiǎn)性區(qū)劃[J];地理與地理信息科學(xué);2014年06期
9 陳胤華;張克乾;;公元1180和1181年浙江金華地區(qū)梅汛期降水的重建[J];古地理學(xué)報(bào);2014年06期
10 戴雪;萬榮榮;楊桂山;王曉龍;;鄱陽湖水文節(jié)律變化及其與江湖水量交換的關(guān)系[J];地理科學(xué);2014年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 孫涵亮;陸偉;朱雯卿;;互動(dòng)電視收集用戶行為信息研究[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)第六次會(huì)員代表大會(huì)、2014年學(xué)術(shù)年會(huì)暨第七屆《王選新聞科學(xué)技術(shù)獎(jiǎng)》和優(yōu)秀論文獎(jiǎng)?lì)C獎(jiǎng)大會(huì)論文集(二等獎(jiǎng))[C];2014年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 王霞;馬尾松人工林近自然化改造初期效果分析研究[D];北京林業(yè)大學(xué);2013年
2 劉鑫;中國(guó)金融市場(chǎng)化過程中的貨幣需求、貨幣供給與貨幣政策[D];東北財(cái)經(jīng)大學(xué);2013年
3 王潔丹;人口死亡率水平的數(shù)量研究[D];廈門大學(xué);2014年
4 張克慧;支撐性資產(chǎn)內(nèi)部?jī)r(jià)值與定價(jià)研究[D];財(cái)政部財(cái)政科學(xué)研究所;2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 金穎;Copula函數(shù)的穩(wěn)健性和不確定性分析[D];長(zhǎng)安大學(xué);2013年
2 薛潔;關(guān)于GIS不確定性傳播問題的若干研究[D];長(zhǎng)安大學(xué);2013年
3 雷特;基于LT公司銷售數(shù)據(jù)的需求預(yù)測(cè)與庫存控制[D];華中科技大學(xué);2013年
4 孫俊;實(shí)力非對(duì)稱對(duì)博弈策略選擇的影響[D];云南財(cái)經(jīng)大學(xué);2013年
5 張凱;基于蒙特卡羅模擬的最小二乘統(tǒng)計(jì)量性質(zhì)的研究[D];天津財(cái)經(jīng)大學(xué);2013年
6 臧亮亮;滬深股市收益率及其相關(guān)性的實(shí)證分析[D];天津財(cái)經(jīng)大學(xué);2013年
7 郭俊峰;中小板股票市場(chǎng)波動(dòng)性研究[D];南京財(cái)經(jīng)大學(xué);2013年
8 王婷婷;死亡率模型的拓展研究和中國(guó)人口死亡率的預(yù)測(cè)[D];浙江大學(xué);2014年
9 古俊哲;有限高斯混合模型聚類算法的研究[D];蘭州商學(xué)院;2014年
10 原少斌;回歸分析中異常值診斷方法的比較研究[D];蘭州商學(xué)院;2014年
本文關(guān)鍵詞:稀有變異關(guān)聯(lián)性分析中折疊與非折疊法的模擬比較研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):407833
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/407833.html