人口歷史推斷的隨機(jī)模型與方法研究
本文選題:群體遺傳學(xué) + 人口歷史 ; 參考:《北京交通大學(xué)》2016年博士論文
【摘要】:群體遺傳學(xué)是一門定量地研究生物進(jìn)化機(jī)制的遺傳學(xué)科,它為揭示進(jìn)化原理和進(jìn)化過程提供堅(jiān)實(shí)的理論依據(jù)。人口歷史推斷是群體遺傳學(xué)中至關(guān)重要的問題,有利于我們更好地了解人類的起源與發(fā)展。群體遷移,群體混合以及群體擴(kuò)張等人口歷史事件會(huì)對基因的遺傳變異產(chǎn)生巨大影響,在遺傳數(shù)據(jù)中留下很多有用的信息,因此我們可以利用這些信息推斷人口歷史。隨著測序技術(shù)和計(jì)算方法的不斷發(fā)展,我們可以獲得越來越多的遺傳特征,如何更有效地利用遺傳特征推斷人口歷史是一個(gè)非常有挑戰(zhàn)性的問題。在本文中,我們通過構(gòu)建隨機(jī)模型刻畫遺傳特征的產(chǎn)生和變化過程,利用統(tǒng)計(jì)推斷的方法實(shí)現(xiàn)人口歷史的重構(gòu)。本文主要考慮兩種與基因重組密切相關(guān)的遺傳特征——祖先片段和IBD片段,研究基于這兩種特征推斷人口歷史的隨機(jī)模型與方法。本文的第一項(xiàng)工作是研究基于祖先片段推斷人口混合歷史的隨機(jī)模型與方法,F(xiàn)在已有的推斷人口混合歷史的方法都有一個(gè)缺陷:在推斷混合歷史時(shí),需事先設(shè)定一個(gè)混合模型,然后在設(shè)定的模型下進(jìn)行推斷。但在實(shí)際應(yīng)用中,真實(shí)的混合模型是未知的,如果設(shè)定的混合模型與真實(shí)模型相差很大,則推斷出的混合歷史往往不準(zhǔn)確。為了解決這個(gè)問題,本文給出一般混合模型的刻畫,并首次推導(dǎo)一般混合模型下祖先片段長度的理論分布,為人口混合歷史的推斷提供理論基礎(chǔ);谧嫦绕伍L度的分布,我們開發(fā)了兩種推斷人口混合歷史的方法,第一種方法——AdmixInfer方法,實(shí)現(xiàn)三個(gè)經(jīng)典混合模型下最優(yōu)模型的選擇以及混合歷史中參數(shù)的估計(jì)。我們通過大量的模擬數(shù)據(jù)驗(yàn)證了AdmixInfer方法的有效性和穩(wěn)定性,同時(shí)在真實(shí)數(shù)據(jù)的應(yīng)用中,AdmixInfer方法也有很好的表現(xiàn)。更進(jìn)一步,為了解決一般混合模型下人口混合歷史的推斷問題,我們開發(fā)了第二種方法——MultiWaveInfer方法,采用似然比檢驗(yàn)和EM算法估計(jì)混合波數(shù)以及混合歷史中的參數(shù)。同樣的,大量的模擬數(shù)據(jù)驗(yàn)證了Multi WaveInfer方法的有效性和穩(wěn)定性。本文的另一項(xiàng)工作是研究基于IBD片段推斷人口遷移歷史的隨機(jī)模型與方法。IBD片段已被證實(shí)非常適合重構(gòu)近代的人口歷史。利用IBD片段推斷人口歷史,關(guān)鍵在于構(gòu)建人口模型并計(jì)算溯祖時(shí)間的分布。前人利用IBD片段推斷人口遷移歷史時(shí),忽略了溯祖時(shí)間之前溯祖事件的信息以及溯祖事件與遷移事件的相互影響,使得溯祖時(shí)間的分布不準(zhǔn)確。為彌補(bǔ)這個(gè)缺陷,本文提出了一種新的推斷人口遷移歷史的方法-——MIBD方法,采用帶結(jié)構(gòu)的溯祖理論,用一個(gè)連續(xù)時(shí)間的馬氏過程描述兩個(gè)群體遷移模型下的溯祖過程,并利用Kolmogorov向后方程計(jì)算溯祖時(shí)間的分布。在此分布下,我們可以估計(jì)IBD共享率,進(jìn)而推斷人口的遷移歷史。模擬結(jié)果顯示,在兩個(gè)群體的遷移模型下,MIBD方法估計(jì)的IBD共享率是非常穩(wěn)定和準(zhǔn)確的。
[Abstract]:Population genetics is a genetic discipline that quantitatively studies the mechanism of biological evolution, which provides a solid theoretical basis for revealing the principles and processes of evolution. Population history inference is a very important problem in population genetics, which is helpful for us to better understand the origin and development of human beings. Population historical events, such as population migration, population mixing and population expansion, will have a great impact on genetic variation, leaving a lot of useful information in genetic data, so we can use these information to infer population history. With the development of sequencing technology and computational methods, we can obtain more and more genetic characteristics. How to use genetic characteristics more effectively to infer population history is a very challenging problem. In this paper, we use the statistical inference method to reconstruct the population history by constructing a stochastic model to describe the process of generation and change of genetic characteristics. In this paper, two genetic characteristics closely related to gene recombination, ancestral fragments and IBD fragments, are considered, and the stochastic models and methods for inferring population history based on these two characteristics are studied. The first work of this paper is to study stochastic models and methods for inferring population mixed history based on ancestral fragments. There is one drawback in the existing methods for inferring the mixed history of population: in order to infer the mixed history, a mixed model should be set up in advance and then inferred under the set model. But in practical application, the real mixed model is unknown. If the set mixing model is very different from the real model, the inferred mixing history is often inaccurate. In order to solve this problem, this paper gives a description of the general mixed model, and deduces the theoretical distribution of the length of ancestral fragments under the general mixed model for the first time, which provides a theoretical basis for the inference of population mixing history. Based on the distribution of ancestral fragment length, we develop two methods to infer population mixing history. The first method, AdmixInfer method, realizes the selection of optimal models under three classical mixed models and the estimation of parameters in mixed history. The validity and stability of the AdmixInfer method are verified by a large number of simulation data. At the same time, the AdmixInfer method also has a good performance in the application of real data. Furthermore, in order to solve the problem of inferring population mixing history in general mixed model, we develop a second method, Multiwave Infer method, which uses likelihood ratio test and EM algorithm to estimate the mixed wavenumber and the parameters in the mixed history. Similarly, a large number of simulation data verify the effectiveness and stability of the Multi WaveInfer method. Another work of this paper is to study the stochastic models and methods for inferring the history of population migration based on IBD fragments. IBDfragments have been proved to be very suitable for reconstructing modern population history. The key to infer population history by using IBD fragment is to build population model and calculate the distribution of traceability time. When people used IBD fragments to infer the history of population migration, they ignored the information of the anatomic events before the date of tracing and the interaction between the events and the events of migration, which made the distribution of the time of traceback inaccurate. In order to remedy this defect, a new method of inferring the history of population migration, the MIBD method, is proposed in this paper. Using the theory of traceback with structure, a continuous time Markov process is used to describe the traceback process in two population migration models. The Kolmogorov backward equation is used to calculate the distribution of traceback time. Under this distribution, we can estimate the IBD sharing rate and infer the migration history of the population. The simulation results show that the IBD sharing rate estimated by the MIBD method is very stable and accurate under the migration model of two populations.
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:Q347
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 W.杰爾契雷斯特;李紀(jì)人;;隨機(jī)模型[J];華水科技情報(bào);1981年03期
2 G.S.Vakhromeyev;武傳真;;用隨機(jī)模型對非均勻地質(zhì)體的位場計(jì)算[J];地球物理學(xué)進(jìn)展;1987年03期
3 王國成;潘宏雨;;隨機(jī)模型與地下水系統(tǒng)參數(shù)計(jì)算方法之探索[J];河南地質(zhì);1990年03期
4 陳華云;方積乾;;細(xì)胞歷經(jīng)周期的隨機(jī)模型[J];生物數(shù)學(xué)學(xué)報(bào);1991年02期
5 孫立鐫;包煥升;孫青彬;姜鴻飛;顏華;;氣象仿真隨機(jī)模型[J];哈爾濱科學(xué)技術(shù)大學(xué)學(xué)報(bào);1991年04期
6 佘志剛;;隨機(jī)模型解商店訂貨問題[J];科技經(jīng)濟(jì)市場;2007年04期
7 劉國光;茅寧;;氣溫隨機(jī)模型與我國氣溫期權(quán)定價(jià)研究[J];數(shù)理統(tǒng)計(jì)與管理;2008年06期
8 B.K.沙哈 ,李紫金;礦床的隨機(jī)模型[J];地質(zhì)科技情報(bào);1983年03期
9 李廣云;隨機(jī)模型誤差對參數(shù)估計(jì)的影響[J];解放軍測繪學(xué)院學(xué)報(bào);1992年01期
10 M.S.Rosenbaum;王生;;隨機(jī)模型在建立工程地質(zhì)數(shù)據(jù)庫中的應(yīng)用[J];世界地質(zhì);1992年02期
相關(guān)會(huì)議論文 前8條
1 劉方;王利珍;翁廟成;;火災(zāi)增長隨機(jī)模型[A];2005西南地區(qū)暖通空調(diào)熱能動(dòng)力年會(huì)論文集[C];2005年
2 董松挺;王高;趙平;;拓展的Gamma-Gamma隨機(jī)模型及其應(yīng)用[A];第八屆中國管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2006年
3 呂志成;劉增軍;張國柱;王飛雪;;GPS精密定位觀測值隨機(jī)模型的研究[A];第二屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會(huì)電子文集[C];2011年
4 陳塑寰;;結(jié)構(gòu)分析的區(qū)間理論[A];新世紀(jì) 新機(jī)遇 新挑戰(zhàn)——知識(shí)創(chuàng)新和高新技術(shù)產(chǎn)業(yè)發(fā)展(下冊)[C];2001年
5 溫建明;馮奇;;彈性限位浮筏系統(tǒng)的隨機(jī)動(dòng)力學(xué)模型[A];第九屆全國振動(dòng)理論及應(yīng)用學(xué)術(shù)會(huì)議論文摘要集[C];2007年
6 溫建明;馮奇;;彈性限位浮筏系統(tǒng)的隨機(jī)動(dòng)力學(xué)模型[A];第九屆全國振動(dòng)理論及應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2007年
7 溫建明;馮奇;;彈性限位浮筏系統(tǒng)的隨機(jī)動(dòng)力學(xué)模型[A];第八屆全國動(dòng)力學(xué)與控制學(xué)術(shù)會(huì)議論文集[C];2008年
8 尚慶明;;導(dǎo)線最小范數(shù)解法和偽隨機(jī)誤差處理[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
相關(guān)重要報(bào)紙文章 前1條
1 永安期貨研究院 高博然 陳星;從隨機(jī)模型看資金管理的重要性[N];期貨日報(bào);2011年
相關(guān)博士學(xué)位論文 前3條
1 倪旭敏;人口歷史推斷的隨機(jī)模型與方法研究[D];北京交通大學(xué);2016年
2 何文炯;風(fēng)險(xiǎn)理論中的若干隨機(jī)模型及其應(yīng)用[D];浙江大學(xué);2001年
3 梁曉冰;脈沖發(fā)放神經(jīng)元及其耦合系統(tǒng)的隨機(jī)模型研究與應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 李德偉;隨機(jī)模型對GPS/BDS聯(lián)合定位精度影響研究[D];山東理工大學(xué);2016年
2 李玲玲;隨機(jī)模型在癌癥研究中的應(yīng)用[D];華中師范大學(xué);2015年
3 姚嬌嬌;幾類種群隨機(jī)模型的動(dòng)力學(xué)行為[D];集美大學(xué);2014年
4 沈皓;多尺度自回歸隨機(jī)模型及其實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2003年
5 劉志強(qiáng);基于隨機(jī)模型精化的GPS精密定位算法研究與實(shí)現(xiàn)[D];河海大學(xué);2007年
6 丁凱;基于隨機(jī)模型的IGS臺(tái)站高精度解算及其時(shí)間序列分析[D];山東科技大學(xué);2010年
7 張利鳳;傳染病傳播的確定模型與隨機(jī)模型的比較及參數(shù)估計(jì)[D];西南交通大學(xué);2010年
8 于海妹;基于隨機(jī)模型的鐵路客運(yùn)樞紐站咽喉能力計(jì)算方法[D];北京交通大學(xué);2015年
9 呂孫云;隨機(jī)模型及其在洪水地區(qū)組成中的研究與發(fā)展[D];四川大學(xué);2003年
10 王志平;GPS/BDS組合相對定位隨機(jī)模型研究[D];合肥工業(yè)大學(xué);2015年
,本文編號(hào):1808481
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/1808481.html