魯棒矩陣分解方法的研究及在疾病關(guān)聯(lián)數(shù)據(jù)上的應(yīng)用
發(fā)布時(shí)間:2021-08-04 19:18
近年來(lái),越來(lái)越多的復(fù)雜疾病,如癌癥、糖尿病、心腦血管疾病等,正成為死亡率極高的疾病。而且,生物學(xué)家和醫(yī)學(xué)家的研究表明,這些復(fù)雜的疾病往往與多種生物分子有關(guān)聯(lián),如藥物-靶標(biāo)相互作用(Drug-Target Interaction,DTI)、藥物-疾病相互作用(Drug-Disease Interaction,DDI)、miRNA-疾病關(guān)聯(lián)(miRNA-Disease Association,MDA)和lncRNA-疾病關(guān)聯(lián)(lncRNA-Disease Association,LDA)。雖然這些疾病關(guān)聯(lián)數(shù)據(jù)中,蘊(yùn)含著解決復(fù)雜疾病的關(guān)鍵的生物信息規(guī)律,但是,這些數(shù)據(jù)中包含著大量的噪聲,這些噪聲會(huì)干擾挖掘潛在的疾病關(guān)聯(lián)信息。在生物信息學(xué)中,矩陣分解模型是一種被廣泛應(yīng)用的預(yù)測(cè)模型,如圖正則矩陣分解模型(Graph Regularized Matrix Factorization,GRMF)和協(xié)同矩陣分解模型(Collaborative Matrix Factorization,CMF)。但是,傳統(tǒng)的矩陣分解模型在疾病關(guān)聯(lián)預(yù)測(cè)中存在著一些弊端:疾病關(guān)聯(lián)數(shù)據(jù)集中的噪聲值會(huì)干擾算法的準(zhǔn)確度;誤差值的...
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)測(cè)流程圖
第2章稀疏圖正則矩陣分解方法11數(shù)據(jù)集的大小和類(lèi)型,對(duì)錯(cuò)誤的容忍度有所不同。一般來(lái)說(shuō),只要誤差在合理范圍內(nèi),就可以接受。圖2.2和圖2.3分別示出的對(duì)NR和GPCR的數(shù)據(jù)集的不同方法的收斂。圖2.1預(yù)測(cè)流程圖圖2.2三個(gè)方法在NR數(shù)據(jù)集上的收斂性比較
第2章稀疏圖正則矩陣分解方法12圖2.3三個(gè)方法在GPCR數(shù)據(jù)集上的收斂性比較2.5.1CVd下的相互作用預(yù)測(cè)表2.2列出了CVd下的實(shí)驗(yàn)結(jié)果,最高的AUPR值以粗體顯示,括號(hào)中給出標(biāo)準(zhǔn)偏差。在NR數(shù)據(jù)集下,所提的方法優(yōu)于GRMF方法,并且在添加WKNKN之后與GRMF方法幾乎相同。重要的是,使用了預(yù)處理后,所提方法的性能獲得了較大的提高。此外,將權(quán)重矩陣添加到所提的方法,并使用WKNKN后,預(yù)測(cè)的準(zhǔn)確性也得到了提高。而且在將權(quán)重矩陣添加到L2,1-GRMF并使用WKNKN后,預(yù)測(cè)準(zhǔn)確性也得到了提高。圖2.4顯示了NR數(shù)據(jù)集上每種方法的CVd側(cè)的PR曲線。表2.2CVd下各個(gè)方法的AUPR值MethodsNRGPCRICECMF0.482(0.034)0.406(0.008)0.350(0.008)0.375(0.007)GRMF0.517(0.025)0.369(0.011)0.341(0.016)0.349(0.012)WGRMF0.520(0.025)0.408(0.010)0.364(0.018)0.404(0.014)L2,1-GRMF0.543(0.034)0.373(0.011)0.345(0.012)0.346(0.013)L2,1-WGRMF0.542(0.024)0.400(0.010)0.370(0.016)0.408(0.013)WKNKN+CMF0.515(0.032)0.409(0.010)0.350(0.014)0.385(0.004)WKNKN+GRMF0.542(0.028)0.404(0.011)0.356(0.014)0.390(0.010)WKNKN+WGRMF0.528(0.033)0.410(0.012)0.369(0.017)0.401(0.013)WKNKN+L2,1-GRMF0.573(0.011)0.394(0.007)0.356(0.012)0.386(0.013)WKNKN+L2,1-WGRMF0.544(0.026)0.394(0.012)0.374(0.016)0.385(0.007)但是,在GPCR數(shù)據(jù)集上運(yùn)行所提的方法,發(fā)現(xiàn)它沒(méi)有優(yōu)于以前的方法,初步估計(jì)是數(shù)據(jù)集本身的問(wèn)題。圖2.5顯示了GPCR數(shù)據(jù)集上每種方法在CVd側(cè)的PR曲線。我們觀察到,執(zhí)行CVd實(shí)驗(yàn)時(shí)使用權(quán)重矩陣比不使用權(quán)重矩陣獲得的AUPR值高。此外,在IC數(shù)據(jù)集上,使用了WKNKN的L2,1-WGRMF方法優(yōu)于其他任何方法,略優(yōu)于使用了WKNKN
【參考文獻(xiàn)】:
期刊論文
[1]基于HeteSim的疾病關(guān)聯(lián)長(zhǎng)非編碼RNA預(yù)測(cè)[J]. 馬毅,郭杏莉,孫宇彤,苑倩倩,任陽(yáng),段然,高琳. 計(jì)算機(jī)研究與發(fā)展. 2019(09)
[2]一種預(yù)測(cè)miRNA與疾病關(guān)聯(lián)關(guān)系的矩陣分解算法[J]. 劉曉燕,陳希,郭茂祖,車(chē)凱,王春宇. 智能系統(tǒng)學(xué)報(bào). 2018(06)
[3]miRNA與疾病關(guān)聯(lián)關(guān)系預(yù)測(cè)算法[J]. 郭茂祖,王詩(shī)鳴,劉曉燕,田偵. 軟件學(xué)報(bào). 2017(11)
[4]藥物-疾病關(guān)系預(yù)測(cè):一種推薦系統(tǒng)模型[J]. 汪浩,王海平,吳信東,劉琦. 中國(guó)藥理學(xué)通報(bào). 2015(12)
[5]中國(guó)女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬(wàn)青,鄭榮壽. 中國(guó)腫瘤臨床. 2015(13)
[6]結(jié)直腸癌流行病學(xué)與預(yù)防[J]. 萬(wàn)德森. 中國(guó)中西醫(yī)結(jié)合外科雜志. 2011(01)
[7]基于流形學(xué)習(xí)的聚類(lèi)方法在基因芯片表達(dá)譜分析中的應(yīng)用[J]. 黃偉,劉戰(zhàn)民,薛丹,尹京苑. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2010(01)
本文編號(hào):3322261
【文章來(lái)源】:曲阜師范大學(xué)山東省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)測(cè)流程圖
第2章稀疏圖正則矩陣分解方法11數(shù)據(jù)集的大小和類(lèi)型,對(duì)錯(cuò)誤的容忍度有所不同。一般來(lái)說(shuō),只要誤差在合理范圍內(nèi),就可以接受。圖2.2和圖2.3分別示出的對(duì)NR和GPCR的數(shù)據(jù)集的不同方法的收斂。圖2.1預(yù)測(cè)流程圖圖2.2三個(gè)方法在NR數(shù)據(jù)集上的收斂性比較
第2章稀疏圖正則矩陣分解方法12圖2.3三個(gè)方法在GPCR數(shù)據(jù)集上的收斂性比較2.5.1CVd下的相互作用預(yù)測(cè)表2.2列出了CVd下的實(shí)驗(yàn)結(jié)果,最高的AUPR值以粗體顯示,括號(hào)中給出標(biāo)準(zhǔn)偏差。在NR數(shù)據(jù)集下,所提的方法優(yōu)于GRMF方法,并且在添加WKNKN之后與GRMF方法幾乎相同。重要的是,使用了預(yù)處理后,所提方法的性能獲得了較大的提高。此外,將權(quán)重矩陣添加到所提的方法,并使用WKNKN后,預(yù)測(cè)的準(zhǔn)確性也得到了提高。而且在將權(quán)重矩陣添加到L2,1-GRMF并使用WKNKN后,預(yù)測(cè)準(zhǔn)確性也得到了提高。圖2.4顯示了NR數(shù)據(jù)集上每種方法的CVd側(cè)的PR曲線。表2.2CVd下各個(gè)方法的AUPR值MethodsNRGPCRICECMF0.482(0.034)0.406(0.008)0.350(0.008)0.375(0.007)GRMF0.517(0.025)0.369(0.011)0.341(0.016)0.349(0.012)WGRMF0.520(0.025)0.408(0.010)0.364(0.018)0.404(0.014)L2,1-GRMF0.543(0.034)0.373(0.011)0.345(0.012)0.346(0.013)L2,1-WGRMF0.542(0.024)0.400(0.010)0.370(0.016)0.408(0.013)WKNKN+CMF0.515(0.032)0.409(0.010)0.350(0.014)0.385(0.004)WKNKN+GRMF0.542(0.028)0.404(0.011)0.356(0.014)0.390(0.010)WKNKN+WGRMF0.528(0.033)0.410(0.012)0.369(0.017)0.401(0.013)WKNKN+L2,1-GRMF0.573(0.011)0.394(0.007)0.356(0.012)0.386(0.013)WKNKN+L2,1-WGRMF0.544(0.026)0.394(0.012)0.374(0.016)0.385(0.007)但是,在GPCR數(shù)據(jù)集上運(yùn)行所提的方法,發(fā)現(xiàn)它沒(méi)有優(yōu)于以前的方法,初步估計(jì)是數(shù)據(jù)集本身的問(wèn)題。圖2.5顯示了GPCR數(shù)據(jù)集上每種方法在CVd側(cè)的PR曲線。我們觀察到,執(zhí)行CVd實(shí)驗(yàn)時(shí)使用權(quán)重矩陣比不使用權(quán)重矩陣獲得的AUPR值高。此外,在IC數(shù)據(jù)集上,使用了WKNKN的L2,1-WGRMF方法優(yōu)于其他任何方法,略優(yōu)于使用了WKNKN
【參考文獻(xiàn)】:
期刊論文
[1]基于HeteSim的疾病關(guān)聯(lián)長(zhǎng)非編碼RNA預(yù)測(cè)[J]. 馬毅,郭杏莉,孫宇彤,苑倩倩,任陽(yáng),段然,高琳. 計(jì)算機(jī)研究與發(fā)展. 2019(09)
[2]一種預(yù)測(cè)miRNA與疾病關(guān)聯(lián)關(guān)系的矩陣分解算法[J]. 劉曉燕,陳希,郭茂祖,車(chē)凱,王春宇. 智能系統(tǒng)學(xué)報(bào). 2018(06)
[3]miRNA與疾病關(guān)聯(lián)關(guān)系預(yù)測(cè)算法[J]. 郭茂祖,王詩(shī)鳴,劉曉燕,田偵. 軟件學(xué)報(bào). 2017(11)
[4]藥物-疾病關(guān)系預(yù)測(cè):一種推薦系統(tǒng)模型[J]. 汪浩,王海平,吳信東,劉琦. 中國(guó)藥理學(xué)通報(bào). 2015(12)
[5]中國(guó)女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬(wàn)青,鄭榮壽. 中國(guó)腫瘤臨床. 2015(13)
[6]結(jié)直腸癌流行病學(xué)與預(yù)防[J]. 萬(wàn)德森. 中國(guó)中西醫(yī)結(jié)合外科雜志. 2011(01)
[7]基于流形學(xué)習(xí)的聚類(lèi)方法在基因芯片表達(dá)譜分析中的應(yīng)用[J]. 黃偉,劉戰(zhàn)民,薛丹,尹京苑. 中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào). 2010(01)
本文編號(hào):3322261
本文鏈接:http://sikaile.net/kejilunwen/yysx/3322261.html
最近更新
教材專(zhuān)著