單體型分析的算法研究
【文章頁數(shù)】:118 頁
【學(xué)位級別】:博士
【部分圖文】:
圖1.1?SRA數(shù)據(jù)庫測序總量的增長??注:數(shù)據(jù)來源于?NCBI?(https://trace.ncbi.nlm.nih.gov/Traces/sra/)
萬對喊基對(base?pair,bp)和606條DNA序列,隨后以每18個月翻一番的速??度持續(xù)指數(shù)增長(Benson?etal.,2009),截止2019年2月,己經(jīng)收錄了超過3000??億對bp和2億條DNA序列。圖1.1展示了美國國家生物技術(shù)信息中心(NCBI)??中SRA....
圖3.3混合池設(shè)計(jì)下,PoooL,?AEM和CSHAP算法對AGT頻率估計(jì)的精度??注:r代表樣本量(混合基因池的個數(shù)),n代表池的容量(每個基因池內(nèi)的個體??數(shù))
雜合位點(diǎn)數(shù)最高達(dá)到了?37,并且各自的相型由Rieder?et?al.?(1999)中的Figure?2給??出。在假設(shè)HWE成立的條件下,我們分別生成了:T?=?50,100,2〇0,?5〇0,1000,2000??個體,并且測試了?3.3.1節(jié)中的所有方法,重復(fù)試驗(yàn)的平均精度....
圖4.3存在不同程度的缺失時(shí),PHASE,?fastPHASE,CSHAP,?Shape-IT和PL-EM算法對??AGT頻率估計(jì)的精度??注:樣本量r?=?100,缺失率a從5%到30%不等
CSHAP算法的各項(xiàng)誤差比PHASE還要低。這充分體現(xiàn)了?CSHAP算法對于缺失??數(shù)據(jù)的穩(wěn)健性。??對于G6PD數(shù)據(jù),不同算法的結(jié)果匯總于圖4.4?梢,當(dāng)數(shù)據(jù)存在缺失時(shí),??PL-EM精度估計(jì)的表現(xiàn)較差。同時(shí)注意到Shape-IT錯誤的估計(jì)了更多不存在的??單體型,導(dǎo)致了較高....
圖5.1隱馬爾可夫模型方法示意圖(Lo,?2011),??注:這個例子中,有g?=?4個位點(diǎn)上的JV?=?4條模板單體型(藍(lán)圈)
第一條單體型是第20個模板單體型;。玻,第二條單體型則是第100個模板單體??型九100。??圖5.1是隱馬爾可夫模型方法的一個示意圖,圖中有g?=?4個位點(diǎn)上的N?=?4??條模板單體型,紅色箭頭代表隱藏的狀態(tài)轉(zhuǎn)移序列,虛線代表觀測到的基因型。??i?i?i?i??i?i?i....
本文編號:3893831
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3893831.html