基于多位點(diǎn)連鎖不平衡度量的標(biāo)簽SNP選擇方法研究
發(fā)布時(shí)間:2017-12-21 19:01
本文關(guān)鍵詞:基于多位點(diǎn)連鎖不平衡度量的標(biāo)簽SNP選擇方法研究 出處:《中南大學(xué)》2014年碩士論文 論文類(lèi)型:學(xué)位論文
更多相關(guān)文章: 單核苷酸多態(tài)性 標(biāo)簽SNP 蟻群算法 生物信息學(xué)
【摘要】:摘要:基因組上由于單個(gè)核苷酸變異所導(dǎo)致的序列多態(tài)性被稱為單核苷酸多態(tài)性(Single Nucleotide Polymorphism, SNP)。研究發(fā)現(xiàn),在不同樣本之間可以通過(guò)使用少量的SNP位點(diǎn)即可以表示整個(gè)樣本主要的遺傳信息,而這些SNP位點(diǎn)被稱為標(biāo)簽SNP(tag SNP)。通過(guò)基因型序列確定其對(duì)應(yīng)的單體型序列過(guò)程被稱為單體分型(Haplotyping)。雖然生物實(shí)驗(yàn)可得到更為精確、可靠的單體分型結(jié)果,但是該過(guò)程代價(jià)高昂,難以滿足實(shí)時(shí)分析大規(guī)模生物數(shù)據(jù)的需求。因此,利用生物信息學(xué)方法選擇標(biāo)簽SNP位點(diǎn),然后在標(biāo)簽位點(diǎn)上開(kāi)展單體分析,可以大大降低代價(jià),并可靠地保留原始序列的變異信息。 從包含幾十萬(wàn)個(gè)SNP的基因組中選擇標(biāo)簽SNP被證實(shí)為NP難問(wèn)題。目前,已有一些方法被用于標(biāo)簽SNP選擇。但是,它們?nèi)源嬖跁r(shí)間復(fù)雜度高、標(biāo)簽SNP數(shù)目多以及樣本重構(gòu)準(zhǔn)確度偏低等不足。針對(duì)這些不足,本文設(shè)計(jì)了一種基于多位點(diǎn)連鎖不平衡度量的標(biāo)簽SNP選擇方法。本文主要的工作如下: 第一:結(jié)合現(xiàn)有文獻(xiàn),更為系統(tǒng)地描述了標(biāo)簽SNP選擇問(wèn)題,并比較分析當(dāng)前基于不同思路的方法特點(diǎn),然后詳細(xì)闡述基于樣本重構(gòu)策略的基本步驟。 第二:在候選子集構(gòu)造階段,本文主要?jiǎng)?chuàng)新工作在于結(jié)合SNP數(shù)據(jù)生物含義,將經(jīng)典的蟻群算法用于子集構(gòu)造。該過(guò)程中,為了有效降低算法的計(jì)算復(fù)雜度,本文以多位點(diǎn)連鎖不平衡度量為優(yōu)化目標(biāo),利用蟻群算法的尋找近優(yōu)解,其中工作內(nèi)容包括設(shè)計(jì)啟發(fā)函數(shù)及路徑選擇算子等,以提高算法性能。 第三:在標(biāo)簽子集精選階段,我們提出后向刪除算法用于標(biāo)簽SNP子集精選。該過(guò)程以樣本重構(gòu)的準(zhǔn)確度為目標(biāo),采用后向淘汰策略選擇具有最優(yōu)分類(lèi)準(zhǔn)確度的標(biāo)簽SNP子集,該過(guò)程的主要目的是進(jìn)一步提高重構(gòu)準(zhǔn)確率及降低標(biāo)簽SNP的數(shù)量。 第四:為了驗(yàn)證本文改進(jìn)方法的有效性,我們基于C++語(yǔ)言設(shè)計(jì)實(shí)現(xiàn)了該改進(jìn)算法。然后在多個(gè)真實(shí)數(shù)據(jù)集上進(jìn)行了比較實(shí)驗(yàn),采用的評(píng)價(jià)指標(biāo)有重構(gòu)準(zhǔn)確度、運(yùn)行時(shí)間上以及標(biāo)簽SNP數(shù)量,實(shí)驗(yàn)結(jié)果表明,本文方法具備較優(yōu)性能。
【學(xué)位授予單位】:中南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:Q811.4;TP18
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 裴志利;梁艷春;盧奕南;曹忠波;孔英;;從SNP到標(biāo)簽SNP的算法實(shí)現(xiàn)與討論[J];內(nèi)蒙古民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年06期
,本文編號(hào):1316798
本文鏈接:http://sikaile.net/yixuelunwen/swyx/1316798.html
最近更新
教材專著