基于得分檢驗(yàn)的整體基因間共關(guān)聯(lián)作用統(tǒng)計(jì)方法研究
本文關(guān)鍵詞:基于得分檢驗(yàn)的整體基因間共關(guān)聯(lián)作用統(tǒng)計(jì)方法研究
更多相關(guān)文章: 整體基因 得分檢驗(yàn) 統(tǒng)計(jì)量 共關(guān)聯(lián)
【摘要】:[研究背景]全基因組關(guān)聯(lián)研究(genome wide association study,GWAS)試圖尋找與疾病狀態(tài)相關(guān)的遺傳位點(diǎn),這對人類理解復(fù)雜疾病的遺傳機(jī)制發(fā)揮著重要作用,同時(shí)也為成功實(shí)現(xiàn)復(fù)雜疾病的預(yù)防和診治提供了嶄新的技術(shù)方法。然而,總結(jié)GWAS的分析結(jié)果,卻發(fā)現(xiàn)其與預(yù)期成果相差甚遠(yuǎn),借助GWAS發(fā)現(xiàn)的遺傳變異,較難解釋大部分復(fù)雜疾病的遺傳特征,這就引發(fā)了遺傳度的缺失問題。導(dǎo)致該問題產(chǎn)生的原因有很多:如基因-基因聯(lián)合效應(yīng)的存在、罕見變異的影響、對已鑒定出與疾病相關(guān)等位基因效應(yīng)的低估、表觀遺傳因素可能會導(dǎo)致親人間比較相似,以及對所要研究疾病遺傳度的過高估計(jì)等。其中,基因-基因交互作用的存在是對遺傳度缺失的一個(gè)合理解釋,其在疾病的認(rèn)識和發(fā)展中占有重要作用。如果忽略了基因之間的交互作用,將無法真實(shí)準(zhǔn)確地描述遺傳變異的效應(yīng)。流行病學(xué)中基因-基因交互作用可以理解為,在兩基因變異獨(dú)立作用于某疾病(或表型)的前提下,其對該疾病(或表型)的聯(lián)合作用。統(tǒng)計(jì)學(xué)中常用logistic回歸模型中的乘積項(xiàng)來表示傳統(tǒng)意義上的相乘交互作用。此模型暗含了基因A和B間要符合近乎獨(dú)立性假設(shè)。事實(shí)上,在復(fù)雜基因網(wǎng)絡(luò)系統(tǒng)中,基因之間往往是通過特定通路結(jié)點(diǎn)之間的相關(guān)聯(lián)而發(fā)揮網(wǎng)絡(luò)調(diào)控作用,而并非相互獨(dú)立地對疾病產(chǎn)生作用。在此基礎(chǔ)上,本課題組提出了一種新概念—基因-基因共關(guān)聯(lián),其可以定義為與該病相關(guān)的兩基因之間的聯(lián)合效應(yīng),即為兩基因獨(dú)立情況下的交互作用和兩基因不獨(dú)立情況下的關(guān)聯(lián)作用之和。通常,位于與某種疾病相關(guān)的同一條特定通路或同一個(gè)網(wǎng)絡(luò)中的基因是協(xié)同工作的,并且與疾病相關(guān)的交互位點(diǎn)之間高度相關(guān)。在此背景下,基因-基因共關(guān)聯(lián)要比基因-基因交互作用更加適用于處理遺傳度的缺失問題。另外,檢驗(yàn)基因-基因共關(guān)聯(lián)作用可以在某種程度上為學(xué)習(xí)和構(gòu)建遺傳網(wǎng)絡(luò)提供幫助。因此,發(fā)展能夠有效檢驗(yàn)基因-基因共關(guān)聯(lián)的統(tǒng)計(jì)方法是一項(xiàng)十分重要而迫切的任務(wù)。為了檢驗(yàn)兩整體基因之間的共關(guān)聯(lián)作用,本課題組已經(jīng)發(fā)展了多種統(tǒng)計(jì)方法,如基于單核苷酸多態(tài)性(single nucleotide polymorphisms, SNPs)水平的F isher r toz轉(zhuǎn)換統(tǒng)計(jì)量、基于典型相關(guān)理論構(gòu)建的統(tǒng)計(jì)量(statistic based on canonical correlations,CCU)、基于核典型相關(guān)理論構(gòu)建的統(tǒng)計(jì)量(statistic based on kernel canonical correlation analysis,KCCU)及基于偏最小二乘路徑模型構(gòu)建的統(tǒng)計(jì)量(partial least squares path modeling,PLSPM)。然而現(xiàn)有的方法尚不能有效檢驗(yàn)兩整體基因間的共關(guān)聯(lián)作用,各種方法在計(jì)算速度和檢驗(yàn)效能上都具有一定程度的局限性。故發(fā)展有效基于整體基因檢驗(yàn)基因-基因共關(guān)聯(lián)作用的統(tǒng)計(jì)方法具有十分重要的意義。[研究目的]本研究將基于經(jīng)典得分檢驗(yàn)理論構(gòu)建一種新型統(tǒng)計(jì)量(score-based statistic,SBS),用于檢驗(yàn)整體基因之間的共關(guān)聯(lián)作用。[研究方法]該統(tǒng)計(jì)量是想通過捕獲兩致病基因間的協(xié)方差效應(yīng),對基因-基因共關(guān)聯(lián)作用進(jìn)行檢驗(yàn)。一系列理論推導(dǎo)、統(tǒng)計(jì)模擬和實(shí)際數(shù)據(jù)分析將被用來評價(jià)該統(tǒng)計(jì)方法的穩(wěn)定性和有效性。為了更加全面地評價(jià)該方法的具體表現(xiàn),在統(tǒng)計(jì)模擬和實(shí)際數(shù)據(jù)分析的過程中,幾種常用方法同時(shí)被用來比較,如基于單個(gè)SNP的(?)logistic回歸模型、基于主成分分析的logistic回歸模型、基于協(xié)方差的δ2統(tǒng)計(jì)量、CCU統(tǒng)計(jì)量、KCCU統(tǒng)計(jì)量、PLSPM統(tǒng)計(jì)量及LASSO等。[結(jié)論]1、本文總結(jié)了各種檢驗(yàn)基因間共關(guān)聯(lián)作用的統(tǒng)計(jì)方法,指出了從整體基因?qū)用娣治龌?基因共關(guān)聯(lián)作用的必要性,而不是簡單分析單一SNP對間的共關(guān)聯(lián)作用。2、本文以傳統(tǒng)的得分檢驗(yàn)思想為基礎(chǔ),提出基于整體基因的用于檢驗(yàn)基因-基因共關(guān)聯(lián)的SBS統(tǒng)計(jì)量。1)與多種現(xiàn)有非參數(shù)檢驗(yàn)基因-基因共關(guān)聯(lián)作用的統(tǒng)計(jì)方法相比,該方法在原假設(shè)成立的前提下,嚴(yán)格服從卡方分布,所以在具體的假設(shè)檢驗(yàn)過程中,避免使用自助抽樣或置換檢驗(yàn)技術(shù),計(jì)算速度大大提高,更適合用來檢驗(yàn)兩基因間的共關(guān)聯(lián)作用。2)與基于單個(gè)SNP的檢驗(yàn)方法相比,本研究提出的SBS統(tǒng)計(jì)量以整體基因?yàn)榛A(chǔ),能夠抓住各基因內(nèi)部的連鎖不平衡(linkage disequilibrium,LD)結(jié)構(gòu),綜合利用多個(gè)SNP位點(diǎn)間的信息,這既符合遺傳學(xué)原理,又便于理解基因功能,檢驗(yàn)基因間的共關(guān)聯(lián)更有效率,同時(shí)也可以避免多個(gè)SNP間的多重共線性問題。3)和其他幾種方法相比,SBS統(tǒng)計(jì)量既能利用基因內(nèi)部的線性信息,又能利用基因內(nèi)部的非線性結(jié)構(gòu),具有較高的檢驗(yàn)效能。3、統(tǒng)計(jì)模擬和實(shí)際數(shù)據(jù)分析表明:1)本文提出的SBS統(tǒng)計(jì)量在不同樣本量、不同主效應(yīng)組合及不同相關(guān)結(jié)構(gòu)下,一類錯(cuò)誤均穩(wěn)定在給定的檢驗(yàn)水準(zhǔn)附近,說明該統(tǒng)計(jì)量具有良好的穩(wěn)定性。2)在原假設(shè)不成立的條件下,隨著交互效應(yīng)及樣本量的增加,檢驗(yàn)效能逐漸增大;隨著兩基因間相關(guān)結(jié)構(gòu)的變化,SBS統(tǒng)計(jì)量的檢驗(yàn)效能也不斷變化,且和其他方法相比,始終處于相對較高的水平。3)在關(guān)于風(fēng)濕性關(guān)節(jié)炎和冠心病的實(shí)際數(shù)據(jù)分析中,SBS統(tǒng)計(jì)量能夠快速且準(zhǔn)確地檢驗(yàn)基因間的共關(guān)聯(lián)作用,充分顯示了其優(yōu)越的實(shí)用性。
【關(guān)鍵詞】:整體基因 得分檢驗(yàn) 統(tǒng)計(jì)量 共關(guān)聯(lián)
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R394
【目錄】:
- 中文摘要8-11
- 英文摘要11-15
- 符號說明15-16
- 前言16-21
- 原理與方法21-33
- 一、基因-基因交互作用與共關(guān)聯(lián)作用21-22
- 1.1 基因-基因交互作用定義21
- 1.2 基因-基因共關(guān)聯(lián)作用定義21-22
- 二、兩整體基因間共關(guān)聯(lián)作用統(tǒng)計(jì)量的構(gòu)建22-24
- 2.1 構(gòu)建統(tǒng)計(jì)量22-23
- 2.2 假設(shè)檢驗(yàn)23-24
- 三、統(tǒng)計(jì)模擬24-31
- 3.1 模擬數(shù)據(jù)的產(chǎn)生24-25
- 3.2 模型評價(jià)25-26
- 3.3 模型比較26-31
- 四、實(shí)際數(shù)據(jù)分析31-33
- 4.1 類風(fēng)濕性關(guān)節(jié)炎數(shù)據(jù)分析31
- 4.2 冠心病數(shù)據(jù)分析31-33
- 結(jié)果33-46
- 一、統(tǒng)計(jì)模擬結(jié)果33-43
- 1.1 統(tǒng)計(jì)量的穩(wěn)定性評價(jià)33-34
- 1.2 統(tǒng)計(jì)量的有效性評價(jià)34-43
- 二、實(shí)際數(shù)據(jù)分析結(jié)果43-46
- 2.1 類風(fēng)濕性關(guān)節(jié)炎數(shù)據(jù)分析結(jié)果43-44
- 2.2 冠心病數(shù)據(jù)分析結(jié)果44-46
- 討論46-51
- 一、基因-基因共關(guān)聯(lián)作用的合理性46
- 二、用于檢驗(yàn)基因-基因共關(guān)聯(lián)作用的相關(guān)統(tǒng)計(jì)方法46-47
- 三、SBS統(tǒng)計(jì)量的優(yōu)越性47-49
- 四、SBS統(tǒng)計(jì)量的局限性49-51
- 結(jié)論51-52
- 創(chuàng)新與不足52-53
- 附錄53-62
- 參考文獻(xiàn)62-69
- 致謝69-70
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄70-71
- 附件71
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 張富祥,金尚憲;電子屏蔽和離子間關(guān)聯(lián)對Pd-D系統(tǒng)中氘核聚變率的影響[J];科學(xué)通報(bào);1992年14期
2 繆勝清,李承森;量子理想氣體中粒子間的統(tǒng)計(jì)關(guān)聯(lián)作用[J];大學(xué)物理;1989年06期
3 吳建斌;電子關(guān)聯(lián)作用對Jahn-Teller效應(yīng)引起的結(jié)構(gòu)相變的影響[J];物理學(xué)報(bào);1991年09期
4 胡文英,曾雉,鄭慶祺,黃美純;電子間關(guān)聯(lián)作用對過渡金屬氧化物磁矩的影響[J];物理學(xué)報(bào);1995年02期
5 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 徐靜;基于得分檢驗(yàn)的整體基因間共關(guān)聯(lián)作用統(tǒng)計(jì)方法研究[D];山東大學(xué);2016年
2 張霄帥;疾病遺傳網(wǎng)絡(luò)構(gòu)建中兩整體基因之間共關(guān)聯(lián)作用的統(tǒng)計(jì)推斷方法研究[D];山東大學(xué);2012年
3 薛冰;電子關(guān)聯(lián)體系角分辨光電子譜理論研究[D];中國科學(xué)院研究生院(上海應(yīng)用物理研究所);2015年
4 王嬋;罕見變異與復(fù)雜疾病的關(guān)聯(lián)分析[D];西南交通大學(xué);2014年
,本文編號:1064887
本文鏈接:http://sikaile.net/xiyixuelunwen/1064887.html