基于深度協(xié)同過(guò)濾模型的致病基因預(yù)測(cè)方法研究
發(fā)布時(shí)間:2021-02-10 15:17
發(fā)掘控制疾病發(fā)生的新基因具有重要的醫(yī)學(xué)意義。致病基因?yàn)殛U明疾病機(jī)理和預(yù)測(cè)疾病潛在風(fēng)險(xiǎn)提供了有效線索。近年來(lái),伴隨著生物信息學(xué)相關(guān)技術(shù)的發(fā)展,各種基因組、基因型和表型等生物數(shù)據(jù)出現(xiàn)爆發(fā)式增長(zhǎng),基于多重生物網(wǎng)絡(luò)的計(jì)算方法為基因疾病關(guān)系預(yù)測(cè)發(fā)揮了重要作用。然而,這些生物網(wǎng)絡(luò)通常伴隨著高噪聲高維度等特點(diǎn),這大大影響了網(wǎng)絡(luò)的可靠性。本文主要研究基因與疾病關(guān)聯(lián)關(guān)系的預(yù)測(cè)方法,主要包括了基因和疾病的特提取及矩陣填充兩個(gè)重要部分。本文圍繞這兩個(gè)環(huán)節(jié)進(jìn)行優(yōu)化和改進(jìn)。具體的研究?jī)?nèi)容如下:1)為了獲取更深層的生物特征,引入了深度學(xué)習(xí)模型——多層降噪自編碼器(SDAE)來(lái)處理基因相關(guān)數(shù)據(jù)集,并與傳統(tǒng)協(xié)同過(guò)濾方法相結(jié)合,構(gòu)建一個(gè)深度協(xié)同過(guò)濾(DCF)模型。將這個(gè)模型作為本文研究工作的基準(zhǔn)模型。2)由于基因-疾病關(guān)聯(lián)關(guān)系數(shù)據(jù)存在不確定反饋的特性,采用基于正類和無(wú)標(biāo)簽樣本的學(xué)習(xí)方法(PU learning),有差別地懲罰對(duì)正類樣本和無(wú)標(biāo)簽樣本誤分類的情況。實(shí)驗(yàn)結(jié)果表明,PU模型性能略高于基準(zhǔn)模型,驗(yàn)證了有偏學(xué)習(xí)方法的在這一特定場(chǎng)景下的作用。3)為了進(jìn)一步挖掘基因相關(guān)數(shù)據(jù)集的可利用信息,借鑒網(wǎng)絡(luò)表示學(xué)習(xí)中節(jié)點(diǎn)嵌入(n...
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-i致病基因預(yù)測(cè)方法一般步驟??
Years??圖1-2?PubMed數(shù)據(jù)庫(kù)中生物信息學(xué)相關(guān)著作過(guò)去三十年的數(shù)量變化情況[14]??如圖1-2所示,自1970年作為一個(gè)學(xué)科領(lǐng)域被提出以來(lái),生物信息學(xué)己經(jīng)經(jīng)??過(guò)了四十多年的持續(xù)發(fā)展。在PubMed數(shù)據(jù)庫(kù)丨13]中檢索生物信息學(xué)關(guān)鍵字,可以??
取得重大進(jìn)步,生物信息學(xué)領(lǐng)域也不例外。深度學(xué)習(xí)可以幫助從DNA序列中發(fā)??現(xiàn)連接點(diǎn),從X射線圖像中識(shí)別手指關(guān)節(jié),從腦電圖(EEG)信號(hào)中檢測(cè)到失誤??等,上述過(guò)程如圖3-1所示:??17??
【參考文獻(xiàn)】:
期刊論文
[1]PTEN in liver diseases and cancer[J]. Marion Peyrou,Lucie Bourgoin,Michelangelo Foti. World Journal of Gastroenterology. 2010(37)
[2]全基因組關(guān)聯(lián)分析的進(jìn)展與反思[J]. 凃欣,石立松,汪樊,王擎. 生理科學(xué)進(jìn)展. 2010(02)
本文編號(hào):3027568
【文章來(lái)源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-i致病基因預(yù)測(cè)方法一般步驟??
Years??圖1-2?PubMed數(shù)據(jù)庫(kù)中生物信息學(xué)相關(guān)著作過(guò)去三十年的數(shù)量變化情況[14]??如圖1-2所示,自1970年作為一個(gè)學(xué)科領(lǐng)域被提出以來(lái),生物信息學(xué)己經(jīng)經(jīng)??過(guò)了四十多年的持續(xù)發(fā)展。在PubMed數(shù)據(jù)庫(kù)丨13]中檢索生物信息學(xué)關(guān)鍵字,可以??
取得重大進(jìn)步,生物信息學(xué)領(lǐng)域也不例外。深度學(xué)習(xí)可以幫助從DNA序列中發(fā)??現(xiàn)連接點(diǎn),從X射線圖像中識(shí)別手指關(guān)節(jié),從腦電圖(EEG)信號(hào)中檢測(cè)到失誤??等,上述過(guò)程如圖3-1所示:??17??
【參考文獻(xiàn)】:
期刊論文
[1]PTEN in liver diseases and cancer[J]. Marion Peyrou,Lucie Bourgoin,Michelangelo Foti. World Journal of Gastroenterology. 2010(37)
[2]全基因組關(guān)聯(lián)分析的進(jìn)展與反思[J]. 凃欣,石立松,汪樊,王擎. 生理科學(xué)進(jìn)展. 2010(02)
本文編號(hào):3027568
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3027568.html
最近更新
教材專著