天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

稀有變異關聯(lián)性分析中折疊與非折疊法的模擬比較研究

發(fā)布時間:2017-05-30 20:06

  本文關鍵詞:稀有變異關聯(lián)性分析中折疊與非折疊法的模擬比較研究,由筆耕文化傳播整理發(fā)布。


【摘要】:目的復雜疾病是基因和環(huán)境因素共同作用的結果,為識別與復雜疾病有關的遺傳變異,遺傳流行病學家已提出多種基于基因連鎖和/或基因關聯(lián)性分析的統(tǒng)計學方法。近年來,全基因組關聯(lián)研究(genome-wide association studies,GWAS)在常見變異(common variant)與復雜疾病或性狀關聯(lián)分析中取得了巨大的成就。但同時也發(fā)現(xiàn),常見變異僅能解釋疾病或性狀遺傳度的很少比例,此現(xiàn)象稱為“遺傳缺失(missingheritability)”。一個很有可能的原因就是,稀有變異(rare variant)對復雜疾病存在中到強度的影響。然而面對在人群中頻率極低的稀有變異,如果仍然沿用GWAS中分析常見變異的統(tǒng)計學方法鑒別稀有變異對疾病的影響,得到的效能是非常低下的。隨著全基因組測序技術的進步,稀有變異數(shù)據(jù)越來越容易獲得,對稀有變異的探索將提高我們對人類疾病和性狀生物學機制的理解。本研究可為分子遺傳流行病學者在研究稀有變異和疾病關聯(lián)時選擇適宜的稀有變異關聯(lián)分析統(tǒng)計方法提供參考和理論依據(jù),并為稀有變異關聯(lián)分析統(tǒng)計方法實際應用的推廣和普及提供理論和方法學上的支持。 方法根據(jù)DNA序列稀有變異疾病狀態(tài)作用模式假設,研究10種稀有變異關聯(lián)性分析方法,,通過設置不同的樣本量、非關聯(lián)稀有變異數(shù)目、關聯(lián)稀有變異效應值大小及其方向、關聯(lián)稀有變異權重以及變異間連鎖不平衡狀態(tài)水平,系統(tǒng)模擬不同影響因素組合下的遺傳情境,探討不同模型原理的稀有變異關聯(lián)性分析方法的適用條件,并比較這些方法在不同遺傳情境中的I類錯誤和效能。所有的方法運算過程均在R3.0.2軟件中完成。 結果各方法方法一類錯誤均保持在0.05水平上下。關聯(lián)稀有變異的效應大小和方向均相同時,隨樣本量增大、連鎖不平衡參數(shù)增加和非關聯(lián)變異個數(shù)減少各方法效能增高;小和中樣本量且連鎖不平衡參數(shù)為0時,無方向考慮的三種方法(CMC、w-Sum和SUM)和aSum在非關聯(lián)變異不存在或個數(shù)較少時表現(xiàn)更突出應。關聯(lián)稀有變異的效應大小相同但方向不同時,除大樣本外各法效能均顯著降低?偟膩碚f,連鎖不平衡參數(shù)越大,非關聯(lián)變異數(shù)量越多,各方法效能更進一步降低。有方向考慮的折疊法(SSU、SSUw、aSUM)和非折疊法(C-α、SKAT_linear、SKAT_wlinear和RR)均高于無方向考慮的折疊法;高連鎖不平衡時RR方法表現(xiàn)最優(yōu)。當關聯(lián)稀有變異效應權重為MAF的方差倒數(shù)時,總的來說,隨著連鎖不平衡參數(shù)增加非關聯(lián)稀有變異個數(shù)減少,各方法效能逐漸升高。無非關聯(lián)變異干擾時,w-Sum效能高于CMC;連鎖不平衡參數(shù)為0和0.5時,SSUw和SKAT_wlinear效能分別高于SSU和SKAT_linear效能。 結論所有的方法在各自相適宜的遺傳情境下都表現(xiàn)出良好的性能。無方向考慮的折疊法適合簡單的遺傳環(huán)境,其他方法在其他較為復雜的遺傳環(huán)境中仍能保持良好的性能。兩種方法起到互補的作用。
【關鍵詞】:稀有變異關聯(lián)性分析 折疊法 非折疊法
【學位授予單位】:廣東藥學院
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:R181.33
【目錄】:
  • 摘要5-7
  • Abstract7-10
  • 1 前言10-18
  • 1.1 稀有變異關聯(lián)性研究的發(fā)展及現(xiàn)狀10-12
  • 1.2 稀有變異影響疾病表型的作用模式假設12-13
  • 1.3 稀有變異關聯(lián)研究統(tǒng)計方法研究現(xiàn)狀13-17
  • 1.4 本研究主要內容和研究意義17-18
  • 2 模型原理與方法18-36
  • 2.1 本研究數(shù)據(jù)結構18
  • 2.2 置換檢驗(permutation test)18-19
  • 2.3 稀有變異關聯(lián)性研究方法19-36
  • 2.3.1 多元與折疊合并法(Combined Multivariate and Collapsing , CMC)19-20
  • 2.3.2 權重加和檢驗(weight Sum test,w-Sum)20-22
  • 2.3.3 加和檢驗(SUM test)22-23
  • 2.3.4 基于邊際得分統(tǒng)計量的改良方法:SSU 和 SSUw23-24
  • 2.3.5 數(shù)據(jù)自適應加和檢驗(data-adaptive Sum test,aSum)24-26
  • 2.3.6 C-α檢驗方法26-28
  • 2.3.7 序列核關聯(lián)性檢驗(Sequence Kernel Association Test,SKAT)28-31
  • 2.3.8 嶺回歸(Ridge Regression,RR)31-36
  • 3 模擬研究36-44
  • 3.1 參數(shù)設置36-39
  • 3.2 模擬數(shù)據(jù)集的產生39-42
  • 3.3 評價指標42
  • 3.4 統(tǒng)計軟件42-44
  • 4 結果44-64
  • 4.1 樣本量為 250 時各類方法的一類錯誤和效能44-50
  • 4.1.1 各類方法的一類錯誤44
  • 4.1.2 各類方法的效能44-50
  • 4.2 樣本量為 500 時各類方法的一類錯誤和效能50-55
  • 4.2.1 各類方法的一類錯誤50
  • 4.2.2 各類方法的效能50-55
  • 4.3 樣本量為 1000 時各類方法的一類錯誤和效能55-60
  • 4.3.1 各類方法的一類錯誤55
  • 4.3.2 各類方法的效能55-60
  • 4.4 樣本量對各種方法的影響60-64
  • 4.4.1 對各種方法一類錯誤的影響60
  • 4.4.2 對各種方法效能的影響60-64
  • 5 討論64-72
  • 5.1 關聯(lián)變異效應大小和作用方向的影響65
  • 5.2 連鎖不平衡狀態(tài)的影響65-66
  • 5.3 非關聯(lián)變異數(shù)量的影響66-67
  • 5.4 關聯(lián)變異權重的影響67
  • 5.5 樣本量的影響67-72
  • 6 主要結論和應用建議72-74
  • 7 本研究的創(chuàng)新點與局限性74-76
  • 7.1 本研究創(chuàng)新之處74
  • 7.2 本研究不足之處及進一步研究方向74-76
  • 附錄 1 aSum、SKAT-linear、SKAT-wlinear、SSU、SSUw、Sum 以及 C-α方法的 AssotesteR 包調用和運算 R 程序76-78
  • 附錄 2 RR 方法的 RVtests 包調用和運算 R 程序78-80
  • 參考文獻80-96
  • 攻讀碩士學位期間發(fā)表論文96-98
  • 致謝98-99

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 陳肯界;;小額信貸促進農戶增收效應的地區(qū)差異分析[J];當代經濟;2014年03期

2 尹玲;夏蕾;許才國;;基于隨機森林的女性體型判別[J];紡織學報;2014年05期

3 陳廷武;;基于方差分析的監(jiān)測網穩(wěn)定性假設檢驗方法[J];工程勘察;2014年04期

4 劉惠蘭;周靜;朱華亮;徐光清;丁霞;張苗苗;;自動觀測與人工觀測能見度的差異性分析及檢驗[J];安徽農業(yè)大學學報;2014年03期

5 張佳進;陳立暢;陳克平;唐君君;;基于R語言的農業(yè)試驗統(tǒng)計軟件的設計與實現(xiàn)[J];電子設計工程;2014年14期

6 歐祖軍;李洪毅;;R軟件在方程求根中的應用[J];蘭州文理學院學報(自然科學版);2014年05期

7 吳歡;謝德悠;;基于集成預測模型的貴州省農作物受災面積預測[J];貴州大學學報(自然科學版);2014年04期

8 李亭;田原;鄔倫;劉亮;;基于隨機森林方法的滑坡災害危險性區(qū)劃[J];地理與地理信息科學;2014年06期

9 陳胤華;張克乾;;公元1180和1181年浙江金華地區(qū)梅汛期降水的重建[J];古地理學報;2014年06期

10 戴雪;萬榮榮;楊桂山;王曉龍;;鄱陽湖水文節(jié)律變化及其與江湖水量交換的關系[J];地理科學;2014年12期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 孫涵亮;陸偉;朱雯卿;;互動電視收集用戶行為信息研究[A];中國新聞技術工作者聯(lián)合會第六次會員代表大會、2014年學術年會暨第七屆《王選新聞科學技術獎》和優(yōu)秀論文獎頒獎大會論文集(二等獎)[C];2014年

中國博士學位論文全文數(shù)據(jù)庫 前4條

1 王霞;馬尾松人工林近自然化改造初期效果分析研究[D];北京林業(yè)大學;2013年

2 劉鑫;中國金融市場化過程中的貨幣需求、貨幣供給與貨幣政策[D];東北財經大學;2013年

3 王潔丹;人口死亡率水平的數(shù)量研究[D];廈門大學;2014年

4 張克慧;支撐性資產內部價值與定價研究[D];財政部財政科學研究所;2014年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 金穎;Copula函數(shù)的穩(wěn)健性和不確定性分析[D];長安大學;2013年

2 薛潔;關于GIS不確定性傳播問題的若干研究[D];長安大學;2013年

3 雷特;基于LT公司銷售數(shù)據(jù)的需求預測與庫存控制[D];華中科技大學;2013年

4 孫俊;實力非對稱對博弈策略選擇的影響[D];云南財經大學;2013年

5 張凱;基于蒙特卡羅模擬的最小二乘統(tǒng)計量性質的研究[D];天津財經大學;2013年

6 臧亮亮;滬深股市收益率及其相關性的實證分析[D];天津財經大學;2013年

7 郭俊峰;中小板股票市場波動性研究[D];南京財經大學;2013年

8 王婷婷;死亡率模型的拓展研究和中國人口死亡率的預測[D];浙江大學;2014年

9 古俊哲;有限高斯混合模型聚類算法的研究[D];蘭州商學院;2014年

10 原少斌;回歸分析中異常值診斷方法的比較研究[D];蘭州商學院;2014年


  本文關鍵詞:稀有變異關聯(lián)性分析中折疊與非折疊法的模擬比較研究,由筆耕文化傳播整理發(fā)布。



本文編號:407833

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/407833.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶77390***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com