天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

單體型分析的算法研究

發(fā)布時(shí)間:2024-02-03 05:51
  單體型是染色單體上一組緊密連鎖的位點(diǎn),通常會共同遺傳給后代,可以視作多個位點(diǎn)組成的“超級等位基因”。單體型信息在全基因組關(guān)聯(lián)分析,連鎖分析,遺傳表現(xiàn),流行病學(xué),群體遺傳學(xué)中都有重要的作用。大部分生物,包括人類都是二倍體,常規(guī)的新一代測序技術(shù)只能獲得兩條單體型復(fù)合得到的基因型序列信息,而每條染色體上各自的序列信息(又稱為相型信息)無法被直接觀測。此外,將來自不同個體DNA混合測序的混合基因池設(shè)計(jì)方法,由于具有成本低廉等優(yōu)點(diǎn),也被廣泛應(yīng)用在全基因組關(guān)聯(lián)分析(GWAS)的第一階段中。因此,如何從不完全的基因型數(shù)據(jù),或是混合基因型數(shù)據(jù)中,重建個體的相型信息,推斷出群體中真實(shí)存在的單體型以及估計(jì)對應(yīng)的頻率,是基因組學(xué)研究中的基礎(chǔ)問題,已經(jīng)得到了廣泛關(guān)注。本文梳理了文獻(xiàn)中單體型分析的主要算法框架發(fā)展歷史,并且提出了基于壓縮感知的單體型頻率估計(jì)算法CSHAP以及用于分型的基于近似溯祖先驗(yàn)的廣義EM算法(GEM)。大量模擬研究表明,CSHAP算法在單體型頻率估計(jì)問題上有優(yōu)秀的表現(xiàn)和極高的計(jì)算效率。我們的算法支持個體設(shè)計(jì)和混合設(shè)計(jì),并且無論當(dāng)哈代-溫伯格平衡定律成立與否均可以給出穩(wěn)健估計(jì)。從模擬試驗(yàn)的表...

【文章頁數(shù)】:118 頁

【學(xué)位級別】:博士

【部分圖文】:

圖1.1?SRA數(shù)據(jù)庫測序總量的增長??注:數(shù)據(jù)來源于?NCBI?(https://trace.ncbi.nlm.nih.gov/Traces/sra/)

圖1.1?SRA數(shù)據(jù)庫測序總量的增長??注:數(shù)據(jù)來源于?NCBI?(https://trace.ncbi.nlm.nih.gov/Traces/sra/)

萬對喊基對(base?pair,bp)和606條DNA序列,隨后以每18個月翻一番的速??度持續(xù)指數(shù)增長(Benson?etal.,2009),截止2019年2月,己經(jīng)收錄了超過3000??億對bp和2億條DNA序列。圖1.1展示了美國國家生物技術(shù)信息中心(NCBI)??中SRA....


圖3.3混合池設(shè)計(jì)下,PoooL,?AEM和CSHAP算法對AGT頻率估計(jì)的精度??注:r代表樣本量(混合基因池的個數(shù)),n代表池的容量(每個基因池內(nèi)的個體??數(shù))

圖3.3混合池設(shè)計(jì)下,PoooL,?AEM和CSHAP算法對AGT頻率估計(jì)的精度??注:r代表樣本量(混合基因池的個數(shù)),n代表池的容量(每個基因池內(nèi)的個體??數(shù))

雜合位點(diǎn)數(shù)最高達(dá)到了?37,并且各自的相型由Rieder?et?al.?(1999)中的Figure?2給??出。在假設(shè)HWE成立的條件下,我們分別生成了:T?=?50,100,2〇0,?5〇0,1000,2000??個體,并且測試了?3.3.1節(jié)中的所有方法,重復(fù)試驗(yàn)的平均精度....


圖4.3存在不同程度的缺失時(shí),PHASE,?fastPHASE,CSHAP,?Shape-IT和PL-EM算法對??AGT頻率估計(jì)的精度??注:樣本量r?=?100,缺失率a從5%到30%不等

圖4.3存在不同程度的缺失時(shí),PHASE,?fastPHASE,CSHAP,?Shape-IT和PL-EM算法對??AGT頻率估計(jì)的精度??注:樣本量r?=?100,缺失率a從5%到30%不等

CSHAP算法的各項(xiàng)誤差比PHASE還要低。這充分體現(xiàn)了?CSHAP算法對于缺失??數(shù)據(jù)的穩(wěn)健性。??對于G6PD數(shù)據(jù),不同算法的結(jié)果匯總于圖4.4?梢,當(dāng)數(shù)據(jù)存在缺失時(shí),??PL-EM精度估計(jì)的表現(xiàn)較差。同時(shí)注意到Shape-IT錯誤的估計(jì)了更多不存在的??單體型,導(dǎo)致了較高....


圖5.1隱馬爾可夫模型方法示意圖(Lo,?2011),??注:這個例子中,有g?=?4個位點(diǎn)上的JV?=?4條模板單體型(藍(lán)圈)

圖5.1隱馬爾可夫模型方法示意圖(Lo,?2011),??注:這個例子中,有g?=?4個位點(diǎn)上的JV?=?4條模板單體型(藍(lán)圈)

第一條單體型是第20個模板單體型;。玻,第二條單體型則是第100個模板單體??型九100。??圖5.1是隱馬爾可夫模型方法的一個示意圖,圖中有g?=?4個位點(diǎn)上的N?=?4??條模板單體型,紅色箭頭代表隱藏的狀態(tài)轉(zhuǎn)移序列,虛線代表觀測到的基因型。??i?i?i?i??i?i?i....



本文編號:3893831

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3893831.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c98e8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
成年午夜在线免费视频| 中文字幕日韩欧美一区| 国产又大又黄又粗又免费| 初尝人妻少妇中文字幕在线| 免费人妻精品一区二区三区久久久| 日本婷婷色大香蕉视频在线观看 | 91精品国产综合久久不卡| 欧美午夜伦理在线观看| 亚洲欧美日韩另类第一页| 99久只有精品免费视频播放| 亚洲一区二区三区三区| 成人国产一区二区三区精品麻豆| 91人人妻人人爽人人狠狠| 日韩免费国产91在线| 日本精品视频一二三区| 日韩一级免费中文字幕视频| 国产成人精品国内自产拍| 开心久久综合激情五月天| 欧美一区二区日韩一区二区| 日韩不卡一区二区在线| 久久亚洲午夜精品毛片| 国产午夜精品在线免费看| 又大又长又粗又猛国产精品| 不卡视频免费一区二区三区| 五月婷婷综合缴情六月| 亚洲欧美一二区日韩高清在线 | 国产一区二区精品丝袜| 欧美一区二区三区99| 亚洲一区二区福利在线| 国产精品免费无遮挡不卡视频| 国产又色又爽又黄又大| 久久精品伊人一区二区| 亚洲美女国产精品久久| 中文字幕日产乱码一区二区| 亚洲专区一区中文字幕| 国内外免费在线激情视频| 国产成人午夜在线视频| 日韩精品区欧美在线一区| 亚洲精品黄色片中文字幕| 黄色激情视频中文字幕| 欧美乱码精品一区二区三|