天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 基因論文 >

基于基因表達數(shù)據(jù)的癌癥特征基因選擇方法研究

發(fā)布時間:2017-07-04 07:07

  本文關鍵詞:基于基因表達數(shù)據(jù)的癌癥特征基因選擇方法研究


  更多相關文章: 基因表達數(shù)據(jù) 特征選擇 JLLESR SSLLE LLRFC score+


【摘要】:隨著微陣列技術的發(fā)展和癌癥基因表達數(shù)據(jù)的積累,從海量基因表達數(shù)據(jù)中選取特征基因用于癌癥分類的研究引起研究者的廣泛關注。然而由于基因表達數(shù)據(jù)的樣本數(shù)量只有幾十個而維數(shù)卻高達上萬個,基于機器學習和統(tǒng)計分析的傳統(tǒng)分類方法容易出現(xiàn)過擬合或維數(shù)災難的問題;此外,僅少部分基因與癌癥的發(fā)生相關,基因表達數(shù)據(jù)中存在大量的冗余和不相關基因。從海量的基因表達數(shù)據(jù)中選擇癌癥類別相關的特征基因,對于癌癥臨床診斷、分類等提供重要的參考。特征選擇作為處理基因表達數(shù)據(jù)的一種典型方法,從原始特征中僅選擇與疾病類別相關的特征基因,不僅能夠規(guī)避維數(shù)災難,降低計算的復雜度,還能有效提升分類效果,并且所選擇的特征基因還有明確的生物解釋性。因此本文就基因表達數(shù)據(jù)的癌癥特征基因選擇方法,分別從單個特征評價、子集評分以及稀疏嵌入學習三個角度進行了研究,主要工作有:(1)將局部線性表示Fisher準則(Locally Linear Representation Fisher Criterion)這種特征提取方法改進為LLRFC score特征選擇方法,同時結(jié)合特征間相關性分析進一步排除冗余,提出一種新的特征選擇方法LLRFC score+;趯LRFC特征提取方法的分析,將其改進為一種對單個特征打分的Filter型特征選擇方法LLRFC score。由于該方法沒有考慮特征間的相關性,所選特征子集中仍有冗余特征。因此,利用皮爾遜相關系數(shù),提出了一種能夠濾除冗余的特征選擇方法LLRFC score+。并將兩種方法應用于9種不同類別的癌癥基因表達數(shù)據(jù),分別與Laplacian score、T-test和Fisher score三種方法選擇的特征進行分類效果比對,結(jié)果發(fā)現(xiàn)LLRFC score和LLRFC score+兩種方法分類準確率要比其他三種方法高。相比LLRFC score方法,LLRFC score+方法的分類效果更好,充分證明了我們所提出方法選擇特征的有效性。(2)提出一種基于子集評分的有監(jiān)督局部線性嵌入特征選擇方法SSLLE(Subset-score Supervised Locally Linear Embedding)。有監(jiān)督局部線性嵌入方法(SLLE)能夠有效保持數(shù)據(jù)間的局部特性還充分考慮樣本標簽信息,在高維數(shù)據(jù)的分類中廣泛應用,但其僅從單個特征評價的角度選擇特征,所選特征集合并非最優(yōu)分類特征子集,因此本文結(jié)合圖論框架下迭代優(yōu)化子集評分特征選擇方法,提出一種基于子集評分的有監(jiān)督局部線性嵌入特征選擇方法SSLLE。并將其應用于6種不同類別的癌癥基因表達數(shù)據(jù),和基于特征評分的有監(jiān)督局部線性嵌入特征選擇方法FSLLE進行分類效果比較,結(jié)果證明從子集角度評分的SSLLE方法更有效,所選擇特征的分類效果更好。(3)提出一種聯(lián)合稀疏局部線性嵌入的特征選擇方法JLLESR(Joint Locally Linear Embedding Sparse Regression);谙∈璺稊(shù)學習的方法能夠有效用于特征選擇,但稀疏方法是基于特征的全局結(jié)構(gòu),忽略了特征分布的局部結(jié)構(gòu)。而局部線性嵌入學習方法LLE能夠很好地保持特征間的局部近鄰關系。因此將LLE方法和稀疏學習相結(jié)合,提出一種聯(lián)合稀疏局部線性嵌入的特征選擇方法JLLESR,由原始特征與低維嵌入的變換矩陣的2,1范數(shù)作為“罰函數(shù)”加入目標函數(shù)進行特征的稀疏約束,最小化原始特征回歸到其低維嵌入的目標函數(shù),根據(jù)特征在回歸函數(shù)中的重要性進行評判,選擇貢獻度大的特征組建特征子集。在6種公開的腫瘤基因表達數(shù)據(jù)集上與LLRFC score(本文所提第一種方法)、Laplacian score、Fisher score以及T-test等特征選擇方法進行分類效果比對,JLLESR的分類效果最好。此外,這種方法不受類別標簽和參數(shù)的影響。
【關鍵詞】:基因表達數(shù)據(jù) 特征選擇 JLLESR SSLLE LLRFC score+
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:R73-3
【目錄】:
  • 摘要4-6
  • Abstract6-11
  • 第1章 緒論11-23
  • 1.1 課題研究背景和意義11-12
  • 1.2 微陣列實驗和基因表達數(shù)據(jù)12-16
  • 1.2.1 基因微陣列實驗12-14
  • 1.2.2 基因表達數(shù)據(jù)及其特點14-15
  • 1.2.3 基因表達數(shù)據(jù)分析方法15-16
  • 1.3 癌癥基因表達數(shù)據(jù)特征選擇方法的國內(nèi)外研究現(xiàn)狀16-19
  • 1.4 特征基因選擇方法所面臨的問題和挑戰(zhàn)19-20
  • 1.5 本文的主要研究內(nèi)容20
  • 1.6 本文的組織結(jié)構(gòu)安排20-23
  • 第2章 特征選擇算法及分類方法23-37
  • 2.1 特征選擇簡介23-28
  • 2.1.1 特征選擇的定義23-24
  • 2.1.2 特征選擇的基本框架24
  • 2.1.3 特征選擇算法的分類24-28
  • 2.2 一些經(jīng)典的Filter特征選擇算法28-30
  • 2.2.1 T-test方法28
  • 2.2.2 Fisher score方法28-29
  • 2.2.3 Laplacian score方法29-30
  • 2.3 基于流形學習的圖嵌入特征評分方法30-33
  • 2.3.1 經(jīng)典流形學習方法30-31
  • 2.3.2 圖嵌入框架及其線性泛化31-32
  • 2.3.3 圖嵌入特征評分方法32-33
  • 2.4 分類方法33-35
  • 2.4.1 支持向量機33-34
  • 2.4.2 K近鄰分類方法34-35
  • 2.4.3 其它分類方法35
  • 2.5 本章小結(jié)35-37
  • 第3章 基于LLRFC的特征選擇方法研究37-57
  • 3.1 引言37
  • 3.2 LLRFC特征提取方法37-45
  • 3.2.1 局部線性嵌入LLE方法37-39
  • 3.2.2 Fisher判別及其圖嵌入理論下的泛化39-43
  • 3.2.3 LLRFC特征提取方法43-45
  • 3.3 LLRFC score的特征選擇方法45-46
  • 3.4 基于相關分析去冗余的特征選擇方法LLRFC score+46-49
  • 3.4.1 特征-類別相關性分析46
  • 3.4.2 特征-特征相關性分析46-47
  • 3.4.3 特征冗余性分析47-48
  • 3.4.4 LLRFC score+特征選擇算法48-49
  • 3.4.5 算法的復雜度分析49
  • 3.5 算法比較實驗及結(jié)果分析49-54
  • 3.5.1 實驗數(shù)據(jù)集描述49-51
  • 3.5.2 分類器的選擇51
  • 3.5.3 實驗參數(shù)的選取和結(jié)果分析51-52
  • 3.5.4 實驗結(jié)果分析52-54
  • 3.6 本章小結(jié)54-57
  • 第4章 有監(jiān)督局部線性嵌入的子集評分特征選擇方法研究57-65
  • 4.1 引言57
  • 4.2 跡比形式下的特征選擇方法57-61
  • 4.2.1 跡比問題57-59
  • 4.2.2 基于特征評分的方法59
  • 4.2.3 基于子集評分的方法59-61
  • 4.3 監(jiān)督局部線性嵌入的子集評分特征選擇方法SSLLE61-63
  • 4.4 分類實驗及結(jié)果分析63-64
  • 4.5 本章小結(jié)64-65
  • 第5章 聯(lián)合稀疏局部線性嵌入的特征選擇方法研究65-73
  • 5.1 引言65
  • 5.2 稀疏學習65-67
  • 5.2.1 幾種常見的范數(shù)及其擴展65-67
  • 5.2.2 稀疏特征選擇模型67
  • 5.3 聯(lián)合稀疏學習的局部嵌入特征選擇方法67-70
  • 5.3.1 聯(lián)合稀疏學習的嵌入特征選擇方法JLLESR67-69
  • 5.3.2 JLLESR方法的優(yōu)化求解69-70
  • 5.4 分類結(jié)果比較及其分析70-72
  • 5.5 本章小結(jié)72-73
  • 結(jié)論與展望73-77
  • 參考文獻77-83
  • 攻讀碩士學位期間所取得的成果83-85
  • 致謝85

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 張玲;伍亞舟;陳軍;易東;;小波-神經(jīng)網(wǎng)絡方法在基因表達數(shù)據(jù)分析中的應用研究[J];重慶醫(yī)學;2010年17期

2 劉英;;蛋白質(zhì)網(wǎng)絡和基因表達數(shù)據(jù)與癌癥轉(zhuǎn)移的預測[J];國際藥學研究雜志;2008年02期

3 馬猛;鈕俊清;寧巖;鄭浩然;王煦法;;聚類和關聯(lián)規(guī)則挖掘在基因表達數(shù)據(jù)分析中的應用研究[J];北京生物醫(yī)學工程;2008年04期

4 易東 ,張彥琦 ,王文昌 ,張蔚 ,楊夢蘇 ,黃明輝 ,方志俊;基于偽F統(tǒng)計量的模糊聚類方法在基因表達數(shù)據(jù)分析中的應用[J];中國衛(wèi)生統(tǒng)計;2002年03期

5 伍亞舟;張玲;羅萬春;易東;;基因表達數(shù)據(jù)的多尺度特征提取與分類研究[J];計算機工程與應用;2009年13期

6 吳騁,王志勇,賀佳,賀憲民;基因表達數(shù)據(jù)中誤分類點的識別與處理[J];數(shù)理醫(yī)藥學雜志;2004年03期

7 陸慧娟;陸江江;王明怡;陸羿;;基于壓縮感知的癌癥基因表達數(shù)據(jù)分類[J];中國計量學院學報;2012年01期

8 王美華;蘇雄斌;蔡瑞初;羅靜;;一種基于關聯(lián)規(guī)則與支持向量機的基因表達數(shù)據(jù)分類模型[J];計算機應用與軟件;2014年05期

9 張濤;趙發(fā)林;武振宇;李康;;Radviz可視化方法在基因表達數(shù)據(jù)分析中的應用[J];中國衛(wèi)生統(tǒng)計;2011年01期

10 吳騁,賀佳,王志勇;基于LibSVMs軟件的基因表達數(shù)據(jù)處理[J];中國衛(wèi)生統(tǒng)計;2004年04期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 楊昆;李建中;王朝坤;徐繼偉;;基因表達數(shù)據(jù)的基于類別樹和SVMs的多類癌癥分類算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年

中國博士學位論文全文數(shù)據(jù)庫 前8條

1 張煥萍;面向基因表達數(shù)據(jù)的致病基因挖掘方法研究[D];南京航空航天大學;2009年

2 蔡瑞初;基因表達數(shù)據(jù)挖掘若干關鍵技術研究[D];華南理工大學;2010年

3 劉亞杰;基于智能優(yōu)化算法的腫瘤微陣列基因表達數(shù)據(jù)分類研究[D];云南大學;2014年

4 陸慧娟;基于基因表達數(shù)據(jù)的腫瘤分類算法研究[D];中國礦業(yè)大學;2012年

5 張麗娟;微陣列基因表達數(shù)據(jù)分類問題中的屬性選擇技術研究[D];國防科學技術大學;2008年

6 毛志毅;基因表達數(shù)據(jù)基因篩選與近紅外光譜微量成分模型優(yōu)化方法研究[D];南開大學;2014年

7 張琛;基因芯片數(shù)據(jù)處理與分析方法研究[D];吉林大學;2011年

8 程慧杰;基于模式識別方法的基因表達數(shù)據(jù)分析研究[D];哈爾濱工程大學;2012年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 李科;EMD去噪算法研究及其在結(jié)腸癌基因表達數(shù)據(jù)集中的應用[D];陜西師范大學;2015年

2 田小龍;基于智能優(yōu)化計算的雙聚類算法研究[D];西安電子科技大學;2014年

3 晉飛鳴;基于ELM的腫瘤基因表達數(shù)據(jù)分類算法研究[D];東北大學;2013年

4 嚴晶;基因表達數(shù)據(jù)的合并雙向聚類算法[D];湘潭大學;2015年

5 周靜;一種基于多維基因組數(shù)據(jù)的基因功能模塊的識別方法[D];黑龍江大學;2015年

6 高雪峰;膜計算在基因表達數(shù)據(jù)分析中的應用[D];西華大學;2015年

7 陳輝輝;基于基因表達數(shù)據(jù)的信息基因選擇研究[D];山東大學;2016年

8 梁妍;基于多目標的基因表達數(shù)據(jù)雙聚類算法的研究[D];廣西大學;2016年

9 李曉丹;基于基因表達數(shù)據(jù)的癌癥特征基因選擇方法研究[D];北京工業(yè)大學;2016年

10 李靖;基于支持向量機的基因表達數(shù)據(jù)降維方法的研究[D];蘇州大學;2011年

,

本文編號:516787

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/516787.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶02d0a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
久久国产精品亚州精品毛片| 国产成人亚洲精品青草天美| 伊人天堂午夜精品草草网| 亚洲最新的黄色录像在线| 丝袜av一区二区三区四区五区 | 久久永久免费一区二区| 视频一区二区黄色线观看| 亚洲少妇人妻一区二区| 国产不卡最新在线视频| 欧美成人免费一级特黄| 亚洲中文字幕熟女丝袜久久| 国产精品欧美激情在线观看| 精品亚洲一区二区三区w竹菊| 日韩三级黄色大片免费观看| 国产精品免费精品一区二区| 大香蕉伊人一区二区三区| 午夜久久精品福利视频| 欧美三级精品在线观看| 国产水滴盗摄一区二区| 国产又粗又深又猛又爽又黄| 国产又粗又长又大高潮视频| 日本免费一区二区三女| 福利视频一区二区三区| 国产一区二区不卡在线播放 | 高清一区二区三区四区五区| 免费在线播放不卡视频| 色鬼综合久久鬼色88| 日韩欧美二区中文字幕| 色婷婷久久五月中文字幕| 亚洲一区二区三区一区| 国产精品内射视频免费| 老熟女露脸一二三四区| 欧美国产日产综合精品| 女生更色还是男生更色| 美女被啪的视频在线观看| 国产亚洲中文日韩欧美综合网| 亚洲中文字幕熟女丝袜久久| 91亚洲精品亚洲国产| 国产又粗又猛又长又大| 精品丝袜一区二区三区性色| 亚洲视频一区二区久久久|