天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 醫(yī)學(xué)論文 > 腫瘤論文 >

基于最大相關(guān)最小冗余樸素貝葉斯分類器的腫瘤分類方法研究

發(fā)布時(shí)間:2018-07-09 13:54

  本文選題:基因表達(dá)譜 + 腫瘤分類。 參考:《重慶醫(yī)科大學(xué)》2017年碩士論文


【摘要】:目的利用基因表達(dá)譜數(shù)據(jù)研究腫瘤的發(fā)生發(fā)展機(jī)理,有助于腫瘤的診斷與個(gè)性化治療。然而,基因芯片檢測(cè)的基因數(shù)量巨大,檢測(cè)費(fèi)用也較高加之樣本收集的困難,造成了基因表達(dá)譜數(shù)據(jù)高維小樣本的特點(diǎn)。此外,基因表達(dá)數(shù)據(jù)還存在高噪聲、高冗余及樣本分布不均衡等特點(diǎn),傳統(tǒng)分類方法已不再適用,高維數(shù)據(jù)的分類問(wèn)題正面臨前所未有的挑戰(zhàn)。特征選擇與分類器相結(jié)合是解決這類問(wèn)題的一種思路,本文以最大相關(guān)最小冗余樸素貝葉斯分類器(Na?ve Bayes classifier based on the Maximum Relevance Minimum Redundancy feature selection method,m RMR-NBC)為例,將其應(yīng)用于模擬數(shù)據(jù)、公開的基因表達(dá)譜數(shù)據(jù)以及實(shí)際臨床腫瘤樣本的基因表達(dá)譜數(shù)據(jù),并與常用分類方法進(jìn)行對(duì)比研究,證明該思路的優(yōu)越性,以期為實(shí)際臨床腫瘤樣本分類提供理論依據(jù)。方法(1)進(jìn)行高維數(shù)據(jù)模擬研究,將m RMR-NBC應(yīng)用于高維數(shù)據(jù)分類問(wèn)題中,并將其與支持向量機(jī)、極限學(xué)習(xí)機(jī)與隨機(jī)森林進(jìn)行比較,探討樣本量、基因數(shù)以及信噪比對(duì)分類準(zhǔn)確率的影響;(2)應(yīng)用公開的結(jié)腸癌與肺癌基因表達(dá)譜數(shù)據(jù),分別采用m RMR-NBC、支持向量機(jī)、極限學(xué)習(xí)機(jī)與隨機(jī)森林進(jìn)行比較研究,驗(yàn)證模擬研究結(jié)果;(3)從GEO數(shù)據(jù)庫(kù)下載人類非小細(xì)胞肺癌基因表達(dá)數(shù)據(jù)集(GSE10245),共獲得40例肺腺癌和18例肺鱗癌組織的基因表達(dá)譜數(shù)據(jù)。進(jìn)行預(yù)處理后,采用m RMR-NBC進(jìn)行分析,選取特征基因;利用迪杰斯特拉算法進(jìn)行最短路徑分析,篩選候選基因;利用DAVID軟件進(jìn)行GO與KEGG富集分析。采用文獻(xiàn)回顧法分析對(duì)分類有貢獻(xiàn)的基因在腫瘤發(fā)生發(fā)展中的作用。結(jié)果(1)在模擬數(shù)據(jù)中,m RMR-NBC的綜合分類準(zhǔn)確率達(dá)到96.71%,與支持向量機(jī)分類準(zhǔn)確率相當(dāng),依次高于隨機(jī)森林與極限向量機(jī)。上述幾種方法的分類準(zhǔn)確率與樣本量的相關(guān)系數(shù),均具有統(tǒng)計(jì)學(xué)意義(P0.05)。其中,m RMR-NBC、支持向量機(jī)與極限學(xué)習(xí)機(jī)的分類準(zhǔn)確率與樣本量為負(fù)相關(guān),而隨機(jī)森林的分類準(zhǔn)確率則與樣本量呈正相關(guān)。隨機(jī)森林的分類準(zhǔn)確率還與基因數(shù)呈負(fù)相關(guān)(P0.05),而暫未發(fā)現(xiàn)m RMR-NBC的分類準(zhǔn)確率與基因數(shù)間的相關(guān)性。對(duì)m RMR-NBC的分類準(zhǔn)確率進(jìn)行析因設(shè)計(jì)的方差分析結(jié)果顯示,僅樣本量對(duì)分類準(zhǔn)確率有影響(P0.05)。(2)應(yīng)用m RMR-NBC分析結(jié)腸癌與肺癌基因表達(dá)譜數(shù)據(jù)顯示,當(dāng)納入基因數(shù)分別為15與12時(shí)分類準(zhǔn)確率最高分別達(dá)到95.16%與97.26%,m RMR-NBC僅使用極少的屬性參與分類就能得到非常好的分類效果,且隨著納入分析的基因增多分類效果逐漸趨于穩(wěn)定。支持向量機(jī)在結(jié)腸癌與肺癌數(shù)據(jù)集上分類準(zhǔn)確率分別達(dá)到90.32%與94.52%;極限學(xué)習(xí)機(jī)則分別為82.26%與69.86%;隨機(jī)森林分別為81.98%與77.62%。(3)運(yùn)用m RMR-NBC篩選特征基因8個(gè);最短路徑分析篩選候選基因21個(gè),其中AURKA、SLC7A2基因分別在最短路徑中出現(xiàn)3、2次。富集分析后發(fā)現(xiàn),上述基因主要涉及卵母細(xì)胞減數(shù)分裂、細(xì)胞周期調(diào)控、癌癥通路等信號(hào)通路。結(jié)論m RMR-NBC適用于處理高維小樣本數(shù)據(jù)的分類問(wèn)題;能在僅有極少屬性參與分類時(shí),得到較高的分類準(zhǔn)確率,優(yōu)于隨機(jī)森林、極限學(xué)習(xí)機(jī)等方法;能較為準(zhǔn)確地篩選腫瘤相關(guān)基因,這將有助于了解基因在腫瘤發(fā)生發(fā)展中的作用,推動(dòng)精準(zhǔn)醫(yī)學(xué)與個(gè)性化治療的發(fā)展。
[Abstract]:Objective To study the development mechanism of tumor by using gene expression profiling data , which is helpful to the diagnosis and treatment of tumor . In this paper , the classification accuracy rate of random forests is 90.32 % and 97.26 % , respectively , and the classification accuracy rate of random forests is 80.98 % and 77.62 % , respectively .
【學(xué)位授予單位】:重慶醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:R730.2

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 趙發(fā)林;張濤;李康;;基于遺傳算法的隨機(jī)森林模型在特征基因篩選中的應(yīng)用[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2016年04期

2 翟俊海;張素芳;胡文祥;王熙照;;核心集徑向基函數(shù)極限學(xué)習(xí)機(jī)[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2016年02期

3 何淑琳;張雪英;孫穎;張衛(wèi);;基于極限學(xué)習(xí)機(jī)的語(yǔ)音情感識(shí)別[J];微電子學(xué)與計(jì)算機(jī);2015年07期

4 袁聯(lián)雄;佘玲玲;林愛華;駱福添;;常用分類算法在不同樣本量和類分布的不平衡數(shù)據(jù)中的分類效果比較[J];中國(guó)醫(yī)院統(tǒng)計(jì);2015年01期

5 亓慧;王文劍;郭虎升;;一種基于特征選擇的SVM Bagging集成方法[J];小型微型計(jì)算機(jī)系統(tǒng);2014年11期

6 王志凱;朱麗娟;竇震;姚雪彪;;紡錘體組裝檢驗(yàn)點(diǎn):染色體穩(wěn)定性的守護(hù)神[J];中國(guó)細(xì)胞生物學(xué)學(xué)報(bào);2014年09期

7 高相銘;劉付斌;楊世鳳;;基于極限學(xué)習(xí)機(jī)的供水管網(wǎng)故障智能診斷方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年08期

8 吳登國(guó);李曉明;;基于極限學(xué)習(xí)機(jī)的配電網(wǎng)重構(gòu)[J];電力自動(dòng)化設(shè)備;2013年02期

9 楊玉花;魏曉莉;鄭建全;;脂氧合酶代謝與肺癌研究進(jìn)展[J];國(guó)際藥學(xué)研究雜志;2012年06期

10 于彬;張巖;;基于GA-SVM方法的結(jié)腸癌基因表達(dá)譜數(shù)據(jù)分析[J];青島科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年06期

相關(guān)博士學(xué)位論文 前1條

1 王明怡;微陣列數(shù)據(jù)挖掘技術(shù)的研究[D];浙江大學(xué);2004年

相關(guān)碩士學(xué)位論文 前4條

1 葉倩怡;基于Xgboost方法的實(shí)體零售業(yè)銷售額預(yù)測(cè)研究[D];南昌大學(xué);2016年

2 樊鵬;基于優(yōu)化的xgboost-LMT模型的供應(yīng)商信用評(píng)價(jià)研究[D];廣東工業(yè)大學(xué);2016年

3 劉孝良;基于半監(jiān)督學(xué)習(xí)的隨機(jī)森林算法研究與應(yīng)用[D];中國(guó)海洋大學(xué);2013年

4 劉利平;基因模式的PICA獲取及基于Boosting的模式分類[D];西安電子科技大學(xué);2004年

,

本文編號(hào):2109579

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/zlx/2109579.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5f65a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国内尹人香蕉综合在线| 丰满少妇高潮一区二区| 真实国产乱子伦对白视频不卡| 免费国产成人性生活生活片| 精品少妇人妻一区二区三区| 少妇熟女亚洲色图av天堂| 亚洲日本加勒比在线播放| 黄色国产一区二区三区| 国产色第一区不卡高清| 好吊妞在线免费观看视频| 国产又粗又猛又长又黄视频| 国产精品久久三级精品| 千仞雪下面好爽好紧好湿全文| 国产视频一区二区三区四区| 福利在线午夜绝顶三级| 91久久精品国产成人| 国产中文另类天堂二区| 日韩一本不卡在线观看| 精品综合欧美一区二区三区| 国产又粗又爽又猛又黄的| 丰满人妻一二区二区三区av| 久久久精品日韩欧美丰满| 国产色一区二区三区精品视频| 高清欧美大片免费在线观看| 精品伊人久久大香线蕉综合| 中文字幕日韩欧美理伦片| 亚洲精品中文字幕无限乱码| 伊人欧美一区二区三区| 欧洲一区二区三区自拍天堂| 成人免费视频免费观看| 中文字幕不卡欧美在线| 91精品国产综合久久精品| 日韩一区欧美二区国产| 亚洲欧美日本视频一区二区| 亚洲高清中文字幕一区二区三区| 国产小青蛙全集免费看| 在线免费视频你懂的观看| 日韩少妇人妻中文字幕| 最新日韩精品一推荐日韩精品| 国产色第一区不卡高清| 欧美一区日韩二区亚洲三区|