天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 基因論文 >

面向基因表達數(shù)據(jù)的代價敏感學習優(yōu)化方法

發(fā)布時間:2020-08-14 06:16
【摘要】:利用機器學習的方法對基因表達數(shù)據(jù)進行分類,可以有效的對癌癥等疾病進行早期識別診斷,對人類健康水平的提高有十分重要的意義。決策樹算法及相關的集成算法由于容易理解,結(jié)構(gòu)簡單等特性而被廣泛的應用。但由于基因表達數(shù)據(jù)分布不平衡的特點,傳統(tǒng)的分類算法在基因表達數(shù)據(jù)分類方面的表現(xiàn)還有待提高。代價敏感算法可以有效地彌補傳統(tǒng)分類器只注重分類精度的片面性。同時,代價敏感算法本身由于缺乏適當?shù)脑u價標準與合理的參數(shù)確定方法,同樣需要進一步優(yōu)化提高。針對上述問題,本文進行了以下研究:(1)基于旋轉(zhuǎn)森林算法在處理基因表達數(shù)據(jù)分類時的優(yōu)勢,提出了一種針對基因表達數(shù)據(jù)分類的代價敏感旋轉(zhuǎn)森林算法。通過將誤分類代價、測試代價和拒識代價嵌入旋轉(zhuǎn)森林算法中,構(gòu)造代價敏感旋轉(zhuǎn)森林算法。實驗結(jié)果表明,代價敏感旋轉(zhuǎn)森林算法可以在保證分類精度的基礎上有效地降低分類代價。(2)結(jié)合幾種常用的評價指標,提出一種針對代價敏感算法的分類精度計算方法,以平衡精度替換總體精度來有效的評定代價敏感算法的分類性能。相比于傳統(tǒng)的總體精度,平衡精度不會忽略小類樣本的貢獻。通過代價敏感超限學習機對基因表達數(shù)據(jù)進行分類對比實驗,結(jié)果表明平衡精度可以更為客觀、合理的表示代價敏感算法的分類性能。(3)以改進的平衡精度作為評價標準,通過自適應算法得到不同權(quán)值下的分類精度,最終擬合得到可以使分類精度達到最優(yōu)的代價權(quán)值確定函數(shù)。并在基因表達數(shù)據(jù)集上進行驗證,證明通過該函數(shù)獲得的代價權(quán)值對不同類型的數(shù)據(jù)集具有普遍適應性。通過以上研究,解決了代價敏感算法在面對基因表達數(shù)據(jù)分類時產(chǎn)生的代價參數(shù)確定問題,根據(jù)分類樣本的特性對代價權(quán)值進行調(diào)整,可以有效地提高代價敏感算法的分類性能。
【學位授予單位】:中國計量大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP181;R730.4
【圖文】:

曲線,曲線,召回率,準確率


e)樣例 錯誤正例 FP 正確負例 T標如公式(2-12)所示: 22precisionrecall1 recall precision-measure ,recall precisionTPTP FPTPTP FNF F 準確率召回率值 準確率和召回率是結(jié)合使用的,我們在實際分類中很難實現(xiàn),因此根據(jù)不確率或召回率。F 值綜合了準確率和評估指標的基礎上,利用 ROC 曲線C 曲線是一種用圖形化方式表現(xiàn)分類模的真正率和假正率,如圖 2.1 所示。

面向基因表達數(shù)據(jù)的代價敏感學習優(yōu)化方法


Lung上的分類代價

數(shù)據(jù)集,分類精度,樣本數(shù)


17圖 3. 2 Ovarian 上的分類代價表 3. 3 lung 和 ovarian 數(shù)據(jù)集上的總體分類精度數(shù)據(jù)集 樣本數(shù) 30 60 90 120 150 180 210 240 270 3lungRoF 0.591 0.625 0.698 0.655 0.821 0.83 0.848 0.856 0.878 0C-RoF 0.498 0.538 0.573 0.608 0.693 0.782 0.72 0.755 0.738 ovarianRoF 0.641 0.654 0.657 0.738 0.763 0.825 0.801 0.792 0.849 0C-RoF 0.639 0.64 0.642 0.662 0.725 0.781 0.779 0.769 0.838 0

【相似文獻】

相關期刊論文 前10條

1 王長本,劉興暉,王偉靈,周新;基因表達數(shù)據(jù)的聚類分析[J];國外醫(yī)學(臨床生物化學與檢驗學分冊);2004年04期

2 王修竹;劉自偉;齊陽;鮑競;;基因表達數(shù)據(jù)的預處理方法[J];兵工自動化;2006年07期

3 孔薇;牟曉陽;;基于大腦不同區(qū)域的阿爾茨海默癥基因表達數(shù)據(jù)分析[J];上海交通大學學報;2013年06期

4 馬李冰;侯艷;李貞子;李康;;多步驟決策樹方法在基因表達數(shù)據(jù)上的應用研究[J];中國衛(wèi)生統(tǒng)計;2017年01期

5 莊振華;王年;李學俊;梁棟;王繼;;癌癥基因表達數(shù)據(jù)的熵度量分類方法[J];安徽大學學報(自然科學版);2010年02期

6 劉英;;蛋白質(zhì)網(wǎng)絡和基因表達數(shù)據(jù)與癌癥轉(zhuǎn)移的預測[J];國際藥學研究雜志;2008年02期

7 顧明亮;為基因表達數(shù)據(jù)的發(fā)表制訂標準[J];基礎醫(yī)學與臨床;2002年04期

8 劉瓏龍;周西龍;劉雪峰;;基于遺傳算法和學習向量化網(wǎng)絡的基因表達數(shù)據(jù)的閾值分析[J];中國海洋大學學報(自然科學版);2013年12期

9 孔薇;陶偉杰;牟曉陽;;基于非負矩陣分解的大腦不同區(qū)域基因表達數(shù)據(jù)分析[J];中國生物醫(yī)學工程學報;2012年06期

10 趙潔茹;;淺談模式識別中的支持向量機技術分析腫瘤基因表達數(shù)據(jù)[J];科技資訊;2011年33期

相關會議論文 前8條

1 劉會娟;侯艷;李康;;ARTIVA在時間序列基因表達數(shù)據(jù)網(wǎng)絡構(gòu)建中的應用[A];2017年中國衛(wèi)生統(tǒng)計學學術年會論文集[C];2017年

2 楊昆;李建中;王朝坤;徐繼偉;;基因表達數(shù)據(jù)的基于類別樹和SVMs的多類癌癥分類算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

3 霍煜;袁德成;;基于PCA和DE-ELM的肝癌基因表達數(shù)據(jù)分析[A];2018中國自動化大會(CAC2018)論文集[C];2018年

4 崔光照;曹祥紅;張華;;基于小波變換的基因表達數(shù)據(jù)去噪聚類分析[A];第十二屆全國信號處理學術年會(CCSP-2005)論文集[C];2005年

5 武曉巖;方慶偉;;基因表達數(shù)據(jù)分析的隨機森林方法及算法改進[A];黑龍江省第十次統(tǒng)計科學討論會論文集[C];2008年

6 馮晶;夏冉;曾勇華;劉娟;周懷北;;腫瘤基因表達數(shù)據(jù)庫系統(tǒng)[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

7 梅楨;申琦;冶保獻;;用于基因表達數(shù)據(jù)模式識別的KNN和SVM集成算法[A];中國化學會第26屆學術年會化學信息學與化學計量學分會場論文集[C];2008年

8 王章輝;趙宇海;王國仁;李源;;一種基于投影聚類的無監(jiān)督表型區(qū)分算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年

相關博士學位論文 前10條

1 姜濤;基因表達數(shù)據(jù)挖掘關鍵技術研究[D];西北工業(yè)大學;2016年

2 陸慧娟;基于基因表達數(shù)據(jù)的腫瘤分類算法研究[D];中國礦業(yè)大學;2012年

3 張麗娟;微陣列基因表達數(shù)據(jù)分類問題中的屬性選擇技術研究[D];國防科學技術大學;2008年

4 黃德生;基因表達數(shù)據(jù)在腫瘤診斷、基因功能預測中的應用研究[D];中國醫(yī)科大學;2009年

5 劉亞杰;基于智能優(yōu)化算法的腫瘤微陣列基因表達數(shù)據(jù)分類研究[D];云南大學;2014年

6 王文俊;基因表達數(shù)據(jù)的相似性度量和特征提取研究[D];西安電子科技大學;2011年

7 毛志毅;基因表達數(shù)據(jù)基因篩選與近紅外光譜微量成分模型優(yōu)化方法研究[D];南開大學;2014年

8 楊博;基因調(diào)控網(wǎng)絡構(gòu)建及在癌癥基因預測中的應用[D];西安電子科技大學;2014年

9 殷路;基因表達數(shù)據(jù)的雙聚類分析與研究[D];電子科技大學;2017年

10 石金龍;基因表達及其轉(zhuǎn)錄調(diào)控機制的計算分析[D];國防科學技術大學;2010年

相關碩士學位論文 前10條

1 楊磊;面向基因表達數(shù)據(jù)的代價敏感學習優(yōu)化方法[D];中國計量大學;2018年

2 吳韻怡;基于深度學習的基因表達數(shù)據(jù)處理在藥效預測上的應用[D];哈爾濱工業(yè)大學;2019年

3 宋飛豹;遺傳聚類算法的改進及其在基因表達數(shù)據(jù)分析中的應用[D];安徽大學;2019年

4 楊燴婷;雙聚類算法及其在基因表達數(shù)據(jù)分析中應用研究[D];吉林大學;2019年

5 劉圣輝;基于基因表達數(shù)據(jù)的新型特征提取算法研究[D];山東大學;2018年

6 夏春秋;融合自訓練和低秩表示的基因表達數(shù)據(jù)癌癥分類方法[D];南京理工大學;2018年

7 余顯學;基于基因表達數(shù)據(jù)的癌癥亞型發(fā)現(xiàn)雙聚類方法研究[D];西南大學;2018年

8 劉鴻儒;面向基因表達數(shù)據(jù)快速聚類的算法研究[D];哈爾濱工業(yè)大學;2018年

9 張晶;面向基因表達數(shù)據(jù)的并行特征選擇及集成分類[D];大連理工大學;2018年

10 范媛;基于基因表達數(shù)據(jù)的癌癥亞型分類研究[D];北京化工大學;2018年



本文編號:2792627

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2792627.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1a3b0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com