X染色體標(biāo)記位點上Hardy-Weinberg平衡律的似然比檢驗及印記效應(yīng)的檢驗
發(fā)布時間:2017-09-06 14:53
本文關(guān)鍵詞:X染色體標(biāo)記位點上Hardy-Weinberg平衡律的似然比檢驗及印記效應(yīng)的檢驗
更多相關(guān)文章: X染色體 似然比檢驗 標(biāo)記位點 近交系數(shù) 質(zhì)量性狀 印記效應(yīng)
【摘要】:背景:關(guān)聯(lián)分析是一種通過標(biāo)記位點來定位疾病位點的有用工具,在病例對照數(shù)據(jù)與家系數(shù)據(jù)中都有廣泛的應(yīng)用。它利用標(biāo)記位點與疾病位點間的關(guān)系來定位變異基因。如果標(biāo)記位點離疾病位點很近,這樣會導(dǎo)致連鎖不平衡,那么兩位點同時被傳遞的可能性很大。于是,患病人群中該標(biāo)記等位基因頻率要高于或低于正常人群。所以,關(guān)聯(lián)分析通過標(biāo)記位點定位了疾病位點。常染色體上基于病例對照研究的關(guān)聯(lián)分析通常需要Hardy-Weinberg平衡律(Hardy-Weinberg equilibrium)的假設(shè)。如果Hardy-Weinberg平衡律不成立時,基于病例對照數(shù)據(jù)的關(guān)聯(lián)分析方法的第一類錯誤率可能會偏大。而今,X染色體上標(biāo)記位點與疾病位點間關(guān)聯(lián)性的檢驗方法研究以及Hardy-Weinberg平衡律對關(guān)聯(lián)分析的影響研究越來越受到重視。然而,在X染色體上,有兩個問題需要被關(guān)注:(1)對于同一個位點上的同一等位基因,男性與女性的等位基因頻率是否相等;(2)女性群體中的近交系數(shù)是否為0。因此,男、女性間的等位基因頻率是否有顯著差異和女性中的Hardy-Weinberg平衡律是否成立經(jīng)常用來篩選X染色體上連鎖的變異基因。對于(1)和(2),已經(jīng)有學(xué)者提出了相應(yīng)的方法分別對其進行檢驗。然而,這些方法的第一類錯誤率和檢驗效能還沒有被探討與研究。另外,目前尚未見文獻報導(dǎo)同時檢驗(1)與(2)的方法。印記效應(yīng)(imprinting effects),也稱親源效應(yīng)(parent-of-origin effects),是一種有關(guān)親代基因的表達(dá)與否的后生現(xiàn)象,對研究基因?qū)Ρ硇偷挠绊懹兄浅V匾饔。基因印記是一種非孟德爾遺傳現(xiàn)象。如果后代來自父親的等位基因沒有被表達(dá),而來自母親的等位基因被表達(dá),此現(xiàn)象稱為父系印記;反過來,如果只有來自父親的基因被表達(dá)而來自母親的基因沒有被表達(dá),即為母系印記。存在印記效應(yīng)時,兩種有序雜合子基因型的外顯率可能是不同的。常染色體上常見的與印記相關(guān)的疾病有:Angelman綜合征、Beckwith-Wiedemann綜合征、Prader-Willi綜合征、肥胖癥、糖尿病等。而X染色體上與印記效應(yīng)相關(guān)的疾病有Turner綜合征。Turner綜合征只在女性個體中存在,可能是由其中一整條X染色體的缺失或者部分缺失引起。所以,印記效應(yīng)的檢驗在研究遺傳疾病方面有重要意義。常染色體上已經(jīng)有很多檢驗印記效應(yīng)的方法,但這些方法都不適用于X染色體。到目前為止,我們尚未發(fā)現(xiàn)X染色體上印記效應(yīng)的檢驗方法。需要注意的是,X染色體在男、女性間的遺傳是不對稱的。女性有兩條X染色體,一條是父系的,一條是母系的;而男性只有一條母系的X染色體。這種不對稱性使得研究X染色體上印記效應(yīng)檢驗的方法更加困難。另一方面,目前已經(jīng)有很多基于家系或病例對照數(shù)據(jù)的X染色體上關(guān)聯(lián)分析方法。但是,在關(guān)聯(lián)存在的情況下,尚未有方法用于檢驗X染色體上的印記效應(yīng)。本文的研究目的主要有以下兩點:(1)基于X染色體上的標(biāo)記位點,提出檢驗Hardy-Weinberg平衡律的似然比方法;(2)針對不同的核心家庭結(jié)構(gòu),提出檢驗印記效應(yīng)的非參數(shù)方法。方法:(1)首先,基于X染色體上收集的樣本,通過合并Zheng等人提出的兩個檢驗統(tǒng)計量(檢驗?zāi)、女性間的等位基因頻率是否相等(Z1)以及女性群體中的近交系數(shù)是否為0(Z2)),提出Z0統(tǒng)計量來同時檢驗(1)男性等位基因頻率等于女性等位基因頻率和(2)女性群體中的近交系數(shù)為0。為了提高此方法的檢驗效能,我們進一步提出一種新的似然比檢驗方法。對于X染色體上的某一個位點,首先分別寫出原假設(shè)和備擇假設(shè)下的似然函數(shù)。然后,用EM算法得到未知參數(shù)的最大似然估計值并且構(gòu)建LRTo統(tǒng)計量來同時檢驗(1)和(2)。如果原假設(shè)被拒絕,則進一步構(gòu)造兩個假設(shè)檢驗來找到原假設(shè)被拒絕的原因。于是,提出另外兩個似然比檢驗統(tǒng)計量,LRT1(檢驗?zāi)信缘牡任换蝾l率是否相等)和LRT2(檢驗女性中近交系數(shù)是否為0)。值得注意的是,從模擬結(jié)果可以看出,LRTo和LRT2的第一類錯誤率偏保守。因此,我們用參數(shù)的bootstrap方法來評價LRTo和LRT2的有效性及其表現(xiàn),分別記為LR-Tob和LRT2b。而且,我們還探討了群體分層對新提出方法的影響。另外,我們用均方根誤和偏差來評估未知參數(shù)的最大似然估計值的估計準(zhǔn)確性。最后,我們使用了來自北美的類風(fēng)濕關(guān)節(jié)炎基因數(shù)據(jù)對新提出方法加以實例驗證。(2)考慮在關(guān)聯(lián)存在的前提下,提出x染色體上質(zhì)量性狀的印記效應(yīng)檢驗方法。首先,針對父母和患病女兒組成的三聯(lián)體家庭,用統(tǒng)計量XPAT (parental-asymmetry test on X chromosome)來檢驗X染色體上的印記效應(yīng)。然后,基于兩人家庭(父親-女兒對或母親-女兒對),提出檢驗統(tǒng)計量1-XPAT。通過同時考慮三聯(lián)體和兩人家庭,構(gòu)造統(tǒng)計量C-XPAT來檢驗印記效應(yīng)。更進一步地,我們把這三種方法拓展到可以納入多個小孩且其中至少有一個患病女兒的完整家庭(家庭成員的基因信息是完整的)和不完整核心家庭(父代中父親或母親的基因信息缺失)。值得注意的是,因為1-XPAT統(tǒng)計量中需要用到等位基因頻率,我們用三種方式加以處理:用真實的等位基因頻率,相應(yīng)的統(tǒng)計量記為1-XPATt;用母親等位基因頻率的估計值,相應(yīng)的統(tǒng)計量記為1-XPATm;用父親等位基因頻率的估計值,相應(yīng)的統(tǒng)計量記為1-XPATfo最后,我們使用了來自北美的類風(fēng)濕關(guān)節(jié)炎基因數(shù)據(jù)對新提出方法加以實例驗證。結(jié)果:(1)模擬結(jié)果表明,LRT0和LRT2的第一類錯誤率均偏保守,LRT1的第一類錯誤率接近顯著性水平。而LRT0和LRT2經(jīng)過參數(shù)的bootstrap方法校正后(LRTob和LRT2b)能很好地控制犯第一類錯誤的概率。Z0,Z1和Z2也能很好地控制第一類錯誤率。通過不同的參數(shù)設(shè)置來比較這幾個統(tǒng)計量的檢驗效能,LRTob的檢驗效能比LRTo與Z0的都要高,而LRTo和Zo的檢驗效能很接近;LRT1和Z1的檢驗效能也很接近;當(dāng)近交系數(shù)大于0時,LRT2b的檢驗效能比LRT2與Z2的都要高,且LRT2比Z2的檢驗效能稍微小一點。對于男性等位基因頻率的估計值,不管用EM算法估計或Zheng等人的方法估計,值是一樣的;對于女性等位基因頻率和合并等位基因頻率的估計值,不管是用EM算法估計或Zheng等人的方法估計,其均方根誤和偏差都很接近。而對于近交系數(shù)的估計值,在某些情況下,雖然基于EM算法的偏差比Zheng等人的稍大,但是在所有情況下,基于EM算法的均方根誤都比Zheng等人的要小。另外,群體分層模型確實會導(dǎo)致近交系數(shù)不為0,這跟Overall和Nichols的結(jié)論是一致的。此時基于EM算法的近交系數(shù)估計值的均數(shù)比Zheng等人的估計值稍大,但相應(yīng)的標(biāo)準(zhǔn)差要小。另外,類風(fēng)濕關(guān)節(jié)炎數(shù)據(jù)的分析結(jié)果表明,雖然沒有找到有統(tǒng)計學(xué)意義的位點,但證實了新提出方法的實用性。(2)在不同的參數(shù)設(shè)置情況下,對新提出方法的第一類錯誤率和檢驗效能進行了模擬。模擬結(jié)果表明,XPAT在各種參數(shù)設(shè)置下的第一類錯誤率都在顯著性水平附近;1-XPATt和1-XPATm的第一類錯誤率保持在顯著性水平附近,但1-XPATf嚴(yán)重偏大。因此,在后續(xù)的模擬研究中,我們僅用母親等位基因頻率的估計值計算1-XPAT的值。通過納入不完整核心家庭,C-XPAT的檢驗效能比只納入完整核心家庭的XPAT明顯要高很多。另外,不管女性群體中的近交系數(shù)是否為0,新提出方法的第一類錯誤率一直保持在顯著性水平附近。類風(fēng)濕關(guān)節(jié)炎數(shù)據(jù)的分析結(jié)果表明,雖然沒有找到與印記相關(guān)的有統(tǒng)計學(xué)意義的位點,但證實了新提出方法的實用性。結(jié)論:(1)為了提高檢驗X染色體上Hardy-Weinberg平衡律的檢驗效能,提出了三種似然比檢驗方法。但由于其中有兩個統(tǒng)計量的第一類錯誤率偏保守,所以我們采用參數(shù)的bootstrap方法尋找其分布的臨界值。模擬結(jié)果表明,基于bootstrap方法的LRTob和LRT2b,LRT1,Zo和之前的Z1和Z2的第一類錯誤率在各自的原假設(shè)下都能控制在顯著性水平的附近。通過檢驗效能的比較,LRTob的檢驗效能比LRT0和Z0都高。在近交系數(shù)大于0的情況下,LRT2b的檢驗效能比LRT2和Z2高很多,然而LRT2比Z2的檢驗效能稍微小一點。另外,在男性等位基因頻率不等于女性等位基因頻率的情況下,LRT1和Z1的檢驗效能很接近。(2)在X染色體上的標(biāo)記位點與疾病位點存在關(guān)聯(lián)的情況下,針對質(zhì)量性狀,提出檢驗印記效應(yīng)的方法。首先,基于由父母和他們患病的女兒組成的三聯(lián)體家庭,構(gòu)建X染色體上的親代不對稱檢驗XPAT。然后,我們用1-XPAT來處理兩人家庭(父女對或母女對)。通過同時考慮三聯(lián)體家庭和兩人家庭,我們用C-XPAT來檢驗印記效應(yīng)。更進一步地,我們把這三種方法拓展到可以處理完整和不完整核心家庭,這兩種核心家庭中可以包含多個女兒,但至少有一個女兒是患病的。在不同的參數(shù)設(shè)置下,我們通過模擬研究來評估新提出方法的第一類錯誤率和檢驗效能。模擬中的樣本主要考慮三種不同家庭結(jié)構(gòu),這樣比只考慮一種結(jié)構(gòu)更加合理。模擬結(jié)果表明,在不同的參數(shù)設(shè)置下,新提出方法的第一類錯誤率被控制得很好。通過檢驗效能的比較,不論用真實等位基因頻率或母親的基因型估計的等位基因頻率,C-XPAT的檢驗效能都比XPAT高。在此研究中,不需要女性群體中Hardy-Weinberg平衡律成立的假設(shè),這一點已經(jīng)在理論推斷和模擬研究中被證實。
【關(guān)鍵詞】:X染色體 似然比檢驗 標(biāo)記位點 近交系數(shù) 質(zhì)量性狀 印記效應(yīng)
【學(xué)位授予單位】:南方醫(yī)科大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R394
【目錄】:
- 摘要3-8
- ABSTRACT8-15
- 第一章 前言15-21
- 1.1 基本概念15-17
- 1.2 印記效應(yīng)17
- 1.3 關(guān)聯(lián)分析17-18
- 1.4 論文組成部分18-19
- 1.5 參考文獻19-21
- 第二章 X染色體標(biāo)記位點上Hardy-Weinberg平衡律的似然比檢驗21-73
- 2.1 引言21-22
- 2.2 方法22-28
- 2.3 結(jié)果28-40
- 2.4 討論40-44
- 2.5 附錄44-70
- 2.6 參考文獻70-73
- 第三章 X染色體上基于質(zhì)量性狀和核心家庭的遺傳印記效應(yīng)檢驗方法73-111
- 3.1 引言73-74
- 3.2 方法74-79
- 3.3 結(jié)果79-90
- 3.4 討論90-93
- 3.5 附錄93-109
- 3.6 參考文獻109-111
- 第四章 研究展望111-112
- 碩士論文發(fā)表情況112-113
- 致謝113-115
- 基金115-116
本文編號:803785
本文鏈接:http://sikaile.net/yixuelunwen/binglixuelunwen/803785.html
最近更新
教材專著