天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 基因論文 >

基于基因表達(dá)與DNA甲基化數(shù)據(jù)的癌癥分類方法研究

發(fā)布時(shí)間:2021-10-19 15:35
  癌癥是一種全球性的致命的疾病,近幾年癌癥發(fā)病率急劇上升,中國(guó)面臨的問題更加突出。隨著計(jì)算機(jī)科學(xué)和機(jī)器學(xué)習(xí)技術(shù)的迅速發(fā)展,計(jì)算機(jī)輔助癌癥檢測(cè)起到了越來越重要的作用。近年來,基因測(cè)序技術(shù)也取得了重大的突破,人們已經(jīng)取得了越來越多的癌癥組學(xué)數(shù)據(jù)。利用機(jī)器學(xué)習(xí)方法挖掘組學(xué)數(shù)據(jù)中的重要信息,研究各種類型的組學(xué)數(shù)據(jù)與癌癥發(fā)生和發(fā)展的關(guān)系成為當(dāng)今的研究熱點(diǎn)。本文從RNASeq數(shù)據(jù)和DNA甲基化數(shù)據(jù)入手,旨在探索機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法在癌癥組學(xué)數(shù)據(jù)分類問題中的應(yīng)用。針對(duì)RNA-Seq數(shù)據(jù),本文通過搭建深度卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行癌癥診斷研究與癌癥類型預(yù)測(cè),并在乳腺癌、胃癌、肺腺癌三個(gè)癌癥數(shù)據(jù)集上對(duì)設(shè)計(jì)的模型進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,相比傳統(tǒng)機(jī)器學(xué)習(xí)方法,基于深度卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型能夠通過多層的非線性變換提取出更加抽象的特征,在癌癥基因表達(dá)數(shù)據(jù)分類任務(wù)上取得了更加準(zhǔn)確的預(yù)測(cè)效果,準(zhǔn)確率和召回率均有提升。對(duì)于DNA甲基化數(shù)據(jù),雖然深度卷積神經(jīng)網(wǎng)絡(luò)在特征提取上有優(yōu)勢(shì),但是由于臨床癌癥甲基化數(shù)據(jù)集樣本特征維度高、樣本數(shù)目較少,直接設(shè)計(jì)大規(guī)模的卷積神經(jīng)網(wǎng)絡(luò)容易過擬合。對(duì)此,本文搭建了一個(gè)融合淺層機(jī)器學(xué)習(xí)方法與卷積神... 

【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:72 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于基因表達(dá)與DNA甲基化數(shù)據(jù)的癌癥分類方法研究


癌癥組學(xué)研究策略Fig.1-1CancerOmicsresearchstrategies

示意圖,分類器,示意圖,決策樹


上海交通大學(xué)碩士學(xué)位論文-11-圖2-1KNN分類器示意圖Fig.2-1AnexampletoillustrateKNNclassifierKNN分類器依據(jù)對(duì)象之間的距離作為對(duì)象之間非相似性的評(píng)價(jià)指標(biāo),對(duì)距離的定義通常使用歐氏距離或曼哈頓距離,計(jì)算方法分別如式2-3和2-4所示:d(x,y)=√∑()2=1(2-3)d(x,y)=∑||=1(2-4)KNN分類器具有精度高、對(duì)異常樣本不敏感的優(yōu)點(diǎn),但其計(jì)算復(fù)雜度高,在模型訓(xùn)練前往往需要先進(jìn)行特征選擇。2.1.3決策樹決策樹(DecisionTree,DT)是一種樹形結(jié)構(gòu)的分類與回歸算法,由節(jié)點(diǎn)和連接節(jié)點(diǎn)之間的邊組成,在此我們主要分析分類決策樹。決策樹的節(jié)點(diǎn)包括內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn),每一個(gè)內(nèi)部節(jié)點(diǎn)表示一個(gè)決策條件,而葉子節(jié)點(diǎn)表示決策結(jié)果。決策樹的決策過程可以看作一系列if-then規(guī)則的集合,從根節(jié)點(diǎn)開始,經(jīng)過多次判斷得到結(jié)論。圖2-2是決策樹的示意圖,其中圓點(diǎn)表示內(nèi)部節(jié)點(diǎn),方框表示葉子節(jié)點(diǎn)。

示意圖,決策樹,示意圖,算法


上海交通大學(xué)碩士學(xué)位論文-12-圖2-2決策樹結(jié)構(gòu)示意圖Fig.2-2Thestructureschematicofadecisiontree決策樹的構(gòu)建包括兩個(gè)階段:決策樹的生成和決策樹的修剪。最早的決策樹構(gòu)建算法是由Quinlan提出的ID3算法[40],ID3算法通過在每個(gè)節(jié)點(diǎn)上使用信息增益來確定最佳的分裂屬性。隨后,Quinlan又提出C4.5算法,C4.5算法算法使用信息增益率替代信息增益作為屬性的度量指標(biāo),克服了ID3算法使用信息增益確定最佳分裂屬性的不足。此外,Breiman等人提出分類回歸樹(CART)算法[41],分類回歸樹是一棵二叉樹,既能作分類樹,又能作回歸樹。當(dāng)CART是分類樹時(shí),GINI值用作節(jié)點(diǎn)分裂的依據(jù);當(dāng)CART是回歸樹時(shí),使用樣本的最小方差作為節(jié)點(diǎn)分裂的依據(jù)。決策樹分類算法具有計(jì)算復(fù)雜度低,輸出結(jié)果易于理解的優(yōu)點(diǎn),但它受噪聲干擾較大,容易將噪聲作為分類的依據(jù),容易產(chǎn)生過擬合。2.1.4隨機(jī)森林分類器隨機(jī)森林分類器(RandomForest,RF)是一種集成的分類算法,它以決策樹為基本單元,其輸出由多個(gè)決策樹的輸出共同決定。1996年,Breiman提出了Bagging學(xué)習(xí)方法[42],該方法對(duì)訓(xùn)練樣本集進(jìn)行有放回的抽樣,生成大量略有差異的訓(xùn)練樣本子集,然后用每個(gè)樣本子集訓(xùn)練得到一個(gè)弱分類器,最后通過集成弱分類器得到一個(gè)較為可靠的強(qiáng)分類器,使其性能高于單個(gè)弱分類器的性能。2001年,Bremain結(jié)合Bagging方法和隨機(jī)子空間劃分策略,提出了RF算法,該算法利用Bootstrap抽樣方法增加構(gòu)建分類回歸樹的數(shù)據(jù)的隨機(jī)性,然后組合多棵分類回歸樹進(jìn)行預(yù)測(cè),得到最終結(jié)果。隨機(jī)森林算法具有許多優(yōu)點(diǎn)。該算法中引入的隨機(jī)性使其魯棒性更強(qiáng),也更不容易過擬合,且便于進(jìn)行并行計(jì)算。此外,隨機(jī)森林算法不僅可以對(duì)數(shù)據(jù)進(jìn)行

【參考文獻(xiàn)】:
期刊論文
[1]關(guān)于深度學(xué)習(xí)的綜述與討論[J]. 胡越,羅東陽,花奎,路海明,張學(xué)工.  智能系統(tǒng)學(xué)報(bào). 2019(01)
[2]卷積神經(jīng)網(wǎng)絡(luò)概述[J]. 侯宇昆.  中國(guó)新通信. 2017(09)
[3]National cancer incidence and mortality in China, 2012[J]. Wanqing Chen,Rongshou Zheng,Tingting Zuo,Hongmei Zeng,Siwei Zhang,Jie He.  Chinese Journal of Cancer Research. 2016(01)
[4]第三代測(cè)序技術(shù)及其應(yīng)用[J]. 張得芳,馬秋月,尹佟明,夏濤.  中國(guó)生物工程雜志. 2013(05)
[5]基因芯片技術(shù)在植物基因克隆中的應(yīng)用研究進(jìn)展[J]. 孫兵,閆彩霞,張廷婷,鄭奕雄,畢玉平,陳高,單世華.  基因組學(xué)與應(yīng)用生物學(xué). 2009(01)
[6]人類表觀基因組計(jì)劃[J]. 黃慶,郭穎,府偉靈.  生命的化學(xué). 2004(02)

博士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的癌癥篩查與診斷人工智能研究[D]. 劉奎.北京郵電大學(xué) 2018
[2]基于智能優(yōu)化算法的腫瘤微陣列基因表達(dá)數(shù)據(jù)分類研究[D]. 劉亞杰.云南大學(xué) 2014

碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的癌癥風(fēng)險(xiǎn)預(yù)測(cè)研究與實(shí)現(xiàn)[D]. 孫悅.北京郵電大學(xué) 2018
[2]基于神經(jīng)網(wǎng)絡(luò)的全基因組DNA甲基化預(yù)測(cè)研究[D]. 劉光輝.大連海事大學(xué) 2017



本文編號(hào):3445142

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3445142.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ee727***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com