天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于對抗遷移學(xué)習(xí)的少樣本基因表達(dá)譜癌癥分類

發(fā)布時間:2021-07-08 03:36
  得益于深度學(xué)習(xí)強(qiáng)大的特征學(xué)習(xí)能力,深度學(xué)習(xí)在近年來獲得了廣泛的研究與應(yīng)用。相對于傳統(tǒng)機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)能夠自動學(xué)習(xí)數(shù)據(jù)的高階特征,節(jié)省了手工設(shè)計特征的工作。但是,當(dāng)訓(xùn)練樣本較少時,深度學(xué)習(xí)方法的過擬合問題嚴(yán)重,導(dǎo)致深度學(xué)習(xí)難以取得滿意的效果。例如,在基因表達(dá)譜癌癥分類任務(wù)上,由于基因表達(dá)譜數(shù)據(jù)的獲取成本很高,使得可用的訓(xùn)練樣本十分有限,導(dǎo)致直接在少樣本的基因表達(dá)譜數(shù)據(jù)上使用深度學(xué)習(xí)進(jìn)行癌癥分類效果不佳。因此,本文以多個相關(guān)的基因表達(dá)譜數(shù)據(jù)集為研究對象,利用遷移學(xué)習(xí)挖掘多個基因表達(dá)譜數(shù)據(jù)的知識,有效提升了少樣本基因表達(dá)譜癌癥分類的效果。本文主要完成了以下兩個工作:(1)大部分癌癥基因表達(dá)譜數(shù)據(jù)集之間存在天然的聯(lián)系,如急性白血病和慢性白血病,因此為了挖掘癌癥基因表達(dá)譜數(shù)據(jù)集的知識來幫助另一個癌癥基因表達(dá)譜進(jìn)行分類,本文針對基因表達(dá)譜癌癥分類任務(wù),提出了一種新型的基于生成對抗網(wǎng)絡(luò)的遷移學(xué)習(xí)模型(Adversarial Transfer Learning for Gene Expression Profile,ATL-GEP)。通過引入生成對抗網(wǎng)絡(luò),ATL-GEP模型能夠自動地去除源領(lǐng)域表... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:66 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于對抗遷移學(xué)習(xí)的少樣本基因表達(dá)譜癌癥分類


結(jié)構(gòu)化數(shù)據(jù):人臉類任務(wù)設(shè)計而成

基因表達(dá)譜,非結(jié)構(gòu)化數(shù)據(jù),領(lǐng)域


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文圖1-1結(jié)構(gòu)化數(shù)據(jù):人臉圖1-2非結(jié)構(gòu)化數(shù)據(jù):基因表達(dá)譜類任務(wù)設(shè)計而成。該模型通過對抗學(xué)習(xí)的方式將從源領(lǐng)域數(shù)據(jù)集學(xué)到的知識遷移到目標(biāo)領(lǐng)域的分類模塊中。該方法分兩階段,第一階段是源領(lǐng)域分類模塊學(xué)習(xí)階段,從能夠通過源領(lǐng)域分類模塊獲取源領(lǐng)域的知識或者表征;第二階段固定源領(lǐng)域分類模塊的參數(shù),通過生成對抗網(wǎng)絡(luò)的對抗學(xué)習(xí)方式將獲取到的源領(lǐng)域表征結(jié)融合到由目標(biāo)領(lǐng)域分類任務(wù)學(xué)到的本地表征中,同時目標(biāo)領(lǐng)域分類任務(wù)學(xué)出本地和共享表征的權(quán)重,讓目標(biāo)領(lǐng)域分類任務(wù)自行學(xué)習(xí)出共享表征的權(quán)重參數(shù)以決定表征遷移的程度,豐富目標(biāo)領(lǐng)域的表征以提升目標(biāo)領(lǐng)域分類模塊的學(xué)習(xí)能力。(2)為了利用多個相關(guān)基因表達(dá)譜領(lǐng)域的知識,本文在ATL-GEP的基礎(chǔ)上,提出了一個新的對抗多任務(wù)學(xué)習(xí)模型(AdversarialMulti-taskLearningforGeneEx-pressionProfile,AMTL-GEP),該模型同樣基于生成對抗網(wǎng)絡(luò)并能夠結(jié)合多份領(lǐng)域的數(shù)據(jù)互相遷移并共同提升學(xué)習(xí)能力。AMTL-GEP模型對領(lǐng)域判別器做出改進(jìn),使得領(lǐng)域判別器能夠判別處理多個領(lǐng)域的表征。共享表征也與本地表征加權(quán)融合,各個領(lǐng)域的分類任務(wù)各自學(xué)出權(quán)重參數(shù)以決定遷移的程度,并將遷移學(xué)習(xí)的兩階段學(xué)習(xí)合并成一階段學(xué)習(xí),使得所有領(lǐng)域的分類模塊能夠?qū)W到其他領(lǐng)域的知識共同提升學(xué)習(xí)能力。1.4本文的結(jié)構(gòu)安排本文主要研究如何利用遷移學(xué)習(xí)提升少樣本學(xué)習(xí)能力的問題,共包含4個章節(jié),本篇論文組織結(jié)構(gòu)如下:第一章為緒論,首先介紹遷移學(xué)習(xí)和生成對抗網(wǎng)絡(luò)的研究背景,遷移學(xué)習(xí)解決少樣本問題的研究意義。然后對遷移學(xué)習(xí)、生成對抗網(wǎng)絡(luò)和少樣本領(lǐng)域的的國內(nèi)外研究現(xiàn)狀進(jìn)行了總結(jié),接著概述本文針對少樣本領(lǐng)域中的基因表達(dá)譜癌癥分類問題進(jìn)行的主要研究工作,最后給出本論文的組織

基因表達(dá)譜,數(shù)據(jù)


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文第2章基因表達(dá)譜及對抗遷移學(xué)習(xí)相關(guān)技術(shù)介紹本章首先介紹基因表達(dá)譜數(shù)據(jù)的相關(guān)背景,之后介紹遷移學(xué)習(xí)和生成對抗網(wǎng)絡(luò)的背景、定義和使用場景,最后介紹本文中使用到的技術(shù)。2.1基因表達(dá)譜基因表達(dá)譜是一種在分子生物學(xué)領(lǐng)域,借助cDNA、表達(dá)序列標(biāo)簽或寡核苷酸芯片來測定細(xì)胞或組織的基因表達(dá)情況的生物數(shù)據(jù),其中基因表達(dá)情況包括特定基因是否表達(dá)、表達(dá)豐度、不同組織、不同發(fā)育階段以及不同生理狀態(tài)下的表達(dá)差異;虮磉_(dá)譜的數(shù)據(jù)挖掘,對于癌癥的治療與診斷、病理分析與研究具有重要意義。其中基因表達(dá)譜數(shù)據(jù)通過DNA微陣列實驗來獲齲DNA微陣列由一個個已知序列的基因探針排列而成,將其和將樣本的核苷酸序列進(jìn)行雜交,通過紅綠熒光標(biāo)記可以得到實驗樣本的基因表達(dá)水平。圖2-1基因表達(dá)譜數(shù)據(jù)展示2.1.1基因表達(dá)譜數(shù)據(jù)獲取一次DNA微陣列實驗的最主要目的是獲取實驗樣本的基因表達(dá)水平信息。DNA微陣列實驗將實驗樣本用紅色熒光標(biāo)記,之后將對照樣本用綠色熒光標(biāo)記,兩者標(biāo)記完成后將其混合,之后將混合的樣本和DNA微陣列的探針序列進(jìn)行雜交并洗脫,最后使用專業(yè)儀器可以檢測到不同種類的熒光強(qiáng)度。基因的表達(dá)水平用紅、綠熒光強(qiáng)度的比值來表示;虮磉_(dá)譜數(shù)據(jù)的可視化如圖2-1所示,其中紅色代表該基因點實驗樣本表達(dá)水平較高,綠色代表對照樣本基因表達(dá)水平較低,黃色表示兩者表達(dá)水平相當(dāng),黑色表示兩者均不表達(dá)。實驗流程如圖2-2所示。-7-

【參考文獻(xiàn)】:
期刊論文
[1]前列腺增生經(jīng)尿道電切術(shù)近期出血的原因和處理[J]. 葛校軍,周偉民,宗益平,吳盤芳.  現(xiàn)代泌尿外科雜志. 2010(05)
[2]基因表達(dá)譜芯片雜交影響因素的初步研究[J]. 祝驥,馬文麗,李凌,毛向明,鄭文嶺.  生命科學(xué)研究. 2004(02)



本文編號:3270774

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3270774.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1a42b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com