基于人工蜂群優(yōu)化貝葉斯網(wǎng)絡(luò)的上位性挖掘方法研究
發(fā)布時(shí)間:2021-04-12 08:53
全基因組關(guān)聯(lián)分析方法作為目前常用的檢測(cè)影響表型性狀的基因位點(diǎn)的方法,可用于分析復(fù)雜疾病中的相關(guān)遺傳機(jī)制。但該方法主要側(cè)重于主效基因的檢測(cè),忽略了基因與基因之間的相互作用,即上位性。貝葉斯網(wǎng)絡(luò)在因果關(guān)系構(gòu)建方面具有獨(dú)特的優(yōu)勢(shì),目前已被廣泛地用于上位性挖掘研究。然而貝葉斯網(wǎng)絡(luò)往往進(jìn)行局部或者隨機(jī)搜索,導(dǎo)致容易陷入局部最優(yōu),且存在學(xué)習(xí)效率低、無法處理大規(guī)模節(jié)點(diǎn)等問題。為了解決上述問題,本文提出了一種基于人工蜂群優(yōu)化貝葉斯網(wǎng)絡(luò)的上位性挖掘方法,包括以下3個(gè)方面的研究?jī)?nèi)容:(1)為了提高人工蜂群優(yōu)化貝葉斯網(wǎng)絡(luò)上位性挖掘算法中初始網(wǎng)絡(luò)的質(zhì)量,在基于約束的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法Fast-IAMB的基礎(chǔ)上,設(shè)計(jì)了omb-Fast算法。在該算法中的馬爾科夫毯擴(kuò)張階段,重點(diǎn)考慮表型性狀對(duì)基因位點(diǎn)的影響。根據(jù)表型性狀與SNP節(jié)點(diǎn)之間的條件互信息值判斷是否將該SNP節(jié)點(diǎn)加入馬爾科夫毯中。使得馬爾科夫毯能夠更加準(zhǔn)確地反映出上位性基因位點(diǎn)與表型性狀間的關(guān)系,從而利用該方法快速準(zhǔn)確地生成包括SNP位點(diǎn)和表型性狀的初始網(wǎng)絡(luò)。(2)為了解決貝葉斯網(wǎng)絡(luò)容易陷入局部最優(yōu),進(jìn)而影響網(wǎng)絡(luò)構(gòu)建和上位性挖掘準(zhǔn)確性的問題。本文將人工...
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
上位性數(shù)據(jù)格式表示
華中農(nóng)業(yè)大學(xué)2020屆碩士研究生學(xué)位論文362F1-score1/Precision1/Recall=+(34)如Eq.(34)所示,F(xiàn)1-score由精確率和召回率求得,考慮到精確率和召回率兩個(gè)標(biāo)準(zhǔn),是評(píng)判預(yù)測(cè)結(jié)果好壞的綜合指標(biāo)。F1-score得分越高,說明預(yù)測(cè)結(jié)果的精確率和召回率越好,預(yù)測(cè)結(jié)果中包含的錯(cuò)誤關(guān)聯(lián)位點(diǎn)數(shù)越少,結(jié)果越可靠。4.2.3二節(jié)點(diǎn)模擬數(shù)據(jù)結(jié)果與分析通過GAMETES模擬數(shù)據(jù)軟件生成了17組DNME模型二節(jié)點(diǎn)強(qiáng)關(guān)聯(lián)數(shù)據(jù)(見附表1)。本實(shí)驗(yàn)比較分析了BEAM,AntEpiSeeker,BOOST,ESMO,omb-Fast以及BnBeeEpi在17組模擬數(shù)據(jù)集下的效率、準(zhǔn)確率、F1-score以及假陽性率。如下圖10所示,利用柱形圖對(duì)以上六種上位性挖掘方法的準(zhǔn)確率進(jìn)行比較。圖10上位性2位點(diǎn)模型不同方法的準(zhǔn)確率比較Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods
基于人工蜂群優(yōu)化貝葉斯網(wǎng)絡(luò)的上位性挖掘方法研究37圖10上位性2位點(diǎn)模型不同方法的準(zhǔn)確率比較(續(xù)圖)Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods如圖10所示,通過柱形圖直觀地比較了六種上位性挖掘方法在二節(jié)點(diǎn)強(qiáng)關(guān)聯(lián)數(shù)據(jù)集上的準(zhǔn)確率。BEAM算法作為經(jīng)典的貝葉斯方法,在本次實(shí)驗(yàn)中參數(shù)均為默認(rèn)設(shè)置,BEAM算法的閾值參數(shù)默認(rèn)設(shè)置為0.3。雖然該閾值范圍從統(tǒng)計(jì)學(xué)意義上來說已經(jīng)很大了,但是從圖10可見BEAM算法表現(xiàn)并不好。經(jīng)過分析發(fā)現(xiàn),該算法具有一定的隨機(jī)性,導(dǎo)致準(zhǔn)確率降低。BnBeeEpi與其他四種上位性挖掘算法在檢測(cè)準(zhǔn)確性上表現(xiàn)優(yōu)異。其原因是模擬數(shù)據(jù)的致病模型相比真實(shí)數(shù)據(jù)而言較為簡(jiǎn)單,并且遺傳率的大小控制在[0.05,0.4]區(qū)間內(nèi),遺傳效應(yīng)顯著,因此以上算法容易挖掘出強(qiáng)關(guān)聯(lián)位點(diǎn)。如下圖11所示,利用柱形圖對(duì)六種上位性挖掘方法的F1-score進(jìn)行比較。
【參考文獻(xiàn)】:
期刊論文
[1]遺傳風(fēng)險(xiǎn)評(píng)分在復(fù)雜疾病遺傳學(xué)研究中的應(yīng)用[J]. 牛大彥,嚴(yán)衛(wèi)麗. 遺傳. 2015(12)
[2]單核苷酸多態(tài)性檢測(cè)方法研究進(jìn)展[J]. 常培葉,趙平. 中國老年學(xué)雜志. 2015(16)
[3]基于改進(jìn)粒子群優(yōu)化算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 江浩,江兵. 聊城大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[4]基于人工蜂群算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 張平,劉三陽,朱明敏. 智能系統(tǒng)學(xué)報(bào). 2014(03)
[5]全基因組關(guān)聯(lián)研究中的交互作用研究現(xiàn)狀[J]. 李放歌,王志鵬,戶國,李輝. 遺傳. 2011(09)
[6]全基因組關(guān)聯(lián)分析的進(jìn)展與反思[J]. 凃欣,石立松,汪樊,王擎. 生理科學(xué)進(jìn)展. 2010(02)
[7]混合優(yōu)化的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 許麗佳,黃建國,王厚軍,龍兵. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2009(05)
博士論文
[1]全基因組單核苷酸多態(tài)性交互作用研究[D]. 尚軍亮.西安電子科技大學(xué) 2013
[2]面向基因表達(dá)數(shù)據(jù)的致病基因挖掘方法研究[D]. 張煥萍.南京航空航天大學(xué) 2009
碩士論文
[1]基于多目標(biāo)蟻群優(yōu)化算法的全基因組關(guān)聯(lián)分析研究[D]. 景鵬杰.上海交通大學(xué) 2015
本文編號(hào):3133018
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
上位性數(shù)據(jù)格式表示
華中農(nóng)業(yè)大學(xué)2020屆碩士研究生學(xué)位論文362F1-score1/Precision1/Recall=+(34)如Eq.(34)所示,F(xiàn)1-score由精確率和召回率求得,考慮到精確率和召回率兩個(gè)標(biāo)準(zhǔn),是評(píng)判預(yù)測(cè)結(jié)果好壞的綜合指標(biāo)。F1-score得分越高,說明預(yù)測(cè)結(jié)果的精確率和召回率越好,預(yù)測(cè)結(jié)果中包含的錯(cuò)誤關(guān)聯(lián)位點(diǎn)數(shù)越少,結(jié)果越可靠。4.2.3二節(jié)點(diǎn)模擬數(shù)據(jù)結(jié)果與分析通過GAMETES模擬數(shù)據(jù)軟件生成了17組DNME模型二節(jié)點(diǎn)強(qiáng)關(guān)聯(lián)數(shù)據(jù)(見附表1)。本實(shí)驗(yàn)比較分析了BEAM,AntEpiSeeker,BOOST,ESMO,omb-Fast以及BnBeeEpi在17組模擬數(shù)據(jù)集下的效率、準(zhǔn)確率、F1-score以及假陽性率。如下圖10所示,利用柱形圖對(duì)以上六種上位性挖掘方法的準(zhǔn)確率進(jìn)行比較。圖10上位性2位點(diǎn)模型不同方法的準(zhǔn)確率比較Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods
基于人工蜂群優(yōu)化貝葉斯網(wǎng)絡(luò)的上位性挖掘方法研究37圖10上位性2位點(diǎn)模型不同方法的準(zhǔn)確率比較(續(xù)圖)Fig.102-locusepistasisdetectionaccuracycomparisonofdifferentmethods如圖10所示,通過柱形圖直觀地比較了六種上位性挖掘方法在二節(jié)點(diǎn)強(qiáng)關(guān)聯(lián)數(shù)據(jù)集上的準(zhǔn)確率。BEAM算法作為經(jīng)典的貝葉斯方法,在本次實(shí)驗(yàn)中參數(shù)均為默認(rèn)設(shè)置,BEAM算法的閾值參數(shù)默認(rèn)設(shè)置為0.3。雖然該閾值范圍從統(tǒng)計(jì)學(xué)意義上來說已經(jīng)很大了,但是從圖10可見BEAM算法表現(xiàn)并不好。經(jīng)過分析發(fā)現(xiàn),該算法具有一定的隨機(jī)性,導(dǎo)致準(zhǔn)確率降低。BnBeeEpi與其他四種上位性挖掘算法在檢測(cè)準(zhǔn)確性上表現(xiàn)優(yōu)異。其原因是模擬數(shù)據(jù)的致病模型相比真實(shí)數(shù)據(jù)而言較為簡(jiǎn)單,并且遺傳率的大小控制在[0.05,0.4]區(qū)間內(nèi),遺傳效應(yīng)顯著,因此以上算法容易挖掘出強(qiáng)關(guān)聯(lián)位點(diǎn)。如下圖11所示,利用柱形圖對(duì)六種上位性挖掘方法的F1-score進(jìn)行比較。
【參考文獻(xiàn)】:
期刊論文
[1]遺傳風(fēng)險(xiǎn)評(píng)分在復(fù)雜疾病遺傳學(xué)研究中的應(yīng)用[J]. 牛大彥,嚴(yán)衛(wèi)麗. 遺傳. 2015(12)
[2]單核苷酸多態(tài)性檢測(cè)方法研究進(jìn)展[J]. 常培葉,趙平. 中國老年學(xué)雜志. 2015(16)
[3]基于改進(jìn)粒子群優(yōu)化算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 江浩,江兵. 聊城大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[4]基于人工蜂群算法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 張平,劉三陽,朱明敏. 智能系統(tǒng)學(xué)報(bào). 2014(03)
[5]全基因組關(guān)聯(lián)研究中的交互作用研究現(xiàn)狀[J]. 李放歌,王志鵬,戶國,李輝. 遺傳. 2011(09)
[6]全基因組關(guān)聯(lián)分析的進(jìn)展與反思[J]. 凃欣,石立松,汪樊,王擎. 生理科學(xué)進(jìn)展. 2010(02)
[7]混合優(yōu)化的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)[J]. 許麗佳,黃建國,王厚軍,龍兵. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2009(05)
博士論文
[1]全基因組單核苷酸多態(tài)性交互作用研究[D]. 尚軍亮.西安電子科技大學(xué) 2013
[2]面向基因表達(dá)數(shù)據(jù)的致病基因挖掘方法研究[D]. 張煥萍.南京航空航天大學(xué) 2009
碩士論文
[1]基于多目標(biāo)蟻群優(yōu)化算法的全基因組關(guān)聯(lián)分析研究[D]. 景鵬杰.上海交通大學(xué) 2015
本文編號(hào):3133018
本文鏈接:http://sikaile.net/kejilunwen/yysx/3133018.html
最近更新
教材專著