天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于蛋白質(zhì)質(zhì)譜的腫瘤生物標(biāo)記物選擇與分類

發(fā)布時(shí)間:2017-08-18 17:27

  本文關(guān)鍵詞:基于蛋白質(zhì)質(zhì)譜的腫瘤生物標(biāo)記物選擇與分類


  更多相關(guān)文章: 腫瘤 蛋白質(zhì)質(zhì)譜 高維特征選擇 方差分析 分類


【摘要】:蛋白質(zhì)組學(xué)質(zhì)譜技術(shù)是目前廣泛應(yīng)用的蛋白質(zhì)研究技術(shù)之一,特別是在癌癥的早期診斷和生物標(biāo)記物識(shí)別方面。該方法產(chǎn)生的海量質(zhì)譜數(shù)據(jù)需進(jìn)一步分析才能實(shí)現(xiàn)對(duì)蛋白質(zhì)的定性和定量研究。因此,以生物信息學(xué)方法研究質(zhì)譜數(shù)據(jù)已成為關(guān)鍵。通過分析比較病例組和對(duì)照組細(xì)胞組織中的蛋白質(zhì)提取物,能夠發(fā)現(xiàn)在疾病病理中起重要作用的異常生物標(biāo)記物,從而正確的分類病例組和對(duì)照組。腫瘤蛋白質(zhì)質(zhì)譜數(shù)據(jù)具有樣本小、維數(shù)高、噪音大、非線性等特點(diǎn),挖掘可信的蛋白質(zhì)生物標(biāo)記物對(duì)腫瘤早期診斷與揭示發(fā)病機(jī)理等意義重大。首先,本文從縱向與橫向兩個(gè)方向綜合考慮特征(峰度值)在病例組與對(duì)照組中的強(qiáng)度值差異,具體地,視數(shù)據(jù)集為兩因素混合水平實(shí)驗(yàn),其中A因素為樣本標(biāo)簽(包括病例組與對(duì)照組兩個(gè)水平),B因素為特征(m個(gè)特征即m水平),應(yīng)用非平衡雙向方差分析發(fā)展了一種新的高維特征選擇方法:基于F測(cè)驗(yàn)的最高得分特征子集(Top Score Feature Subset based on F test, TSFS-F),并提出一種新的分類方法:基于F值的直接分類(Direct Inference Classifier based of F-test, DIC-F)。其次,為了評(píng)價(jià)本文方法的有效性,參比了2個(gè)特征選擇方法SVM-MRMR和SVM-SVMRFE:其中MRMR和SVMRFE僅能獲得特征的重要性排序,無法給出具體的特征子集,因此結(jié)合SVM對(duì)訓(xùn)練集做10-fold交叉測(cè)試,以特征重要性排序逐個(gè)引入特征,再取交叉測(cè)試精度最高對(duì)應(yīng)的前若干個(gè)特征為特征子集。2個(gè)腫瘤蛋白質(zhì)質(zhì)譜數(shù)據(jù)的10次重復(fù)實(shí)驗(yàn)結(jié)果表明:1)TSFS-F所選最優(yōu)特征子集特征數(shù)少而穩(wěn)定;2)在KNN、NB、SVM三個(gè)分類器上的獨(dú)立預(yù)測(cè)精度均優(yōu)于參比特征選擇方法,并有效改善了SVM分類器的過擬合,是一種魯棒的高維特征選擇新方法;3)DIC-F和三個(gè)參比分類器比較,分類精度雖稍弱于SVM,但和TSFS-F配合的分類精度均高于其他特征選擇方法和分類器的組合。T SFS-F和DIC-F在復(fù)雜疾病生物標(biāo)記選擇與分類等高維特征選擇領(lǐng)域有廣泛應(yīng)用前景。
【關(guān)鍵詞】:腫瘤 蛋白質(zhì)質(zhì)譜 高維特征選擇 方差分析 分類
【學(xué)位授予單位】:湖南農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:R730.4;Q811.4
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第一章 緒論9-24
  • 1 研究目的、意義及研究背景9-22
  • 1.1 蛋白質(zhì)質(zhì)譜數(shù)據(jù)預(yù)處理9-10
  • 1.2 特征選擇10-13
  • 1.2.1 過濾法(Filter Method)11
  • 1.2.2 封裝器法(Wrapper Method)11-12
  • 1.2.3 嵌入式方法(Embedded Method)12-13
  • 1.2.4 其他方法13
  • 1.3 分類13-20
  • 1.3.1 降維14-15
  • 1.3.2 常用分類器15-20
  • 1.4 蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析的常用軟件20-21
  • 1.4.1 R20-21
  • 1.4.2 Weka21
  • 1.5 總結(jié)21-22
  • 2 研究?jī)?nèi)容與創(chuàng)新點(diǎn)22-23
  • 2.1 主要研究?jī)?nèi)容22
  • 2.2 主要?jiǎng)?chuàng)新點(diǎn)22-23
  • 3 本文內(nèi)容編排23-24
  • 第二章 特征選擇方法與分類器24-37
  • 1 基于SVM的最小冗余最大相關(guān)特征選擇方法25-29
  • 1.1 最小冗余特征選擇25
  • 1.2 最小冗余判別函數(shù)25-29
  • 1.2.1 離散變量的最小冗余最大相關(guān)25-27
  • 1.2.2 連續(xù)變量的最小冗余最大相關(guān)27-29
  • 1.3 SVM-MRMR特征選擇方法29
  • 2 基于SVM的SVMRFE特征選擇方法29-33
  • 2.1 基于SVM的遞歸特征消除法30-33
  • 2.1.1 基于相關(guān)系數(shù)的特征排序30
  • 2.1.2 基于靈敏度分析的特征排序30-31
  • 2.1.3 遞歸特征消除法31
  • 2.1.4 SVMRFE特征選擇方法31-33
  • 2.2 SVM-SVMRFE特征選擇方法33
  • 3 基于F測(cè)驗(yàn)的最高得分特征選擇算法33-36
  • 3.1 多個(gè)特征F值的定義34-35
  • 3.2 基于F值的最高得分特征子集35-36
  • 4 基于F值的直接分類36-37
  • 第三章 算法驗(yàn)證與結(jié)果分析37-48
  • 1 數(shù)據(jù)集37
  • 1.1 OvarianDataset4-3-02數(shù)據(jù)集37
  • 1.2 OvarianCD_PostQAQC數(shù)據(jù)集37
  • 2 數(shù)據(jù)預(yù)處理37-44
  • 2.1 數(shù)據(jù)加載38
  • 2.2 質(zhì)譜數(shù)據(jù)的重采樣38-39
  • 2.3 基線校正39-40
  • 2.4 譜峰對(duì)齊40-41
  • 2.5 標(biāo)準(zhǔn)化41
  • 2.6 譜峰提取與去噪41-42
  • 2.7 譜峰合并(Binning)42-44
  • 3 特征選擇方法結(jié)果分析44-47
  • 3.1 不同特征選擇方法在三個(gè)分類器上的獨(dú)立預(yù)測(cè)精度44-45
  • 3.2 不同特征選擇方法在SVM上的泛化性能45-46
  • 3.3 高頻特征頻次共現(xiàn)分析46-47
  • 4 分類器結(jié)果分析47-48
  • 第四章 結(jié)論與展望48-50
  • 參考文獻(xiàn)50-58
  • 致謝58-59
  • 作者簡(jiǎn)歷59

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李岸達(dá);何楨;何曙光;;基于Filter與Wrapper的復(fù)雜產(chǎn)品關(guān)鍵質(zhì)量特性識(shí)別[J];工業(yè)工程與管理;2014年03期

2 YUAN Hanning;WANG Shuliang;LI Ying;FAN Jinghua;;Feature Selection with Data Field[J];Chinese Journal of Electronics;2014年04期

3 周敬東;李敏慧;周明剛;黃云朋;王焱清;;油茶果的模糊聚類色選算法[J];中國(guó)農(nóng)機(jī)化學(xué)報(bào);2015年04期

4 孔英會(huì);張少明;;ReliefF-SVM RFE組合式特征選擇人臉識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2013年11期

5 張瀚文;劉劍;張妙恬;孟國(guó)營(yíng);;一種基于投影的特征選擇方法[J];工礦自動(dòng)化;2014年01期

6 歐璐;于德介;;基于監(jiān)督拉普拉斯分值和主元分析的滾動(dòng)軸承故障診斷[J];機(jī)械工程學(xué)報(bào);2014年05期

7 Fatemeh Azmandian;Ayse Yilmazer;Jennifer G.Dy;Javed A.Aslam;David R.Kaeli;;Harnessing the Power of GPUs to Speed Up Feature Selection for Outlier Detection[J];Journal of Computer Science & Technology;2014年03期

8 劉青鳳;李紅蘭;;基于數(shù)據(jù)挖掘方法的風(fēng)力渦輪機(jī)狀態(tài)監(jiān)測(cè)技術(shù)研究[J];計(jì)算機(jī)測(cè)量與控制;2014年05期

9 賀鄧超;郝文寧;陳剛;靳大尉;;基于最小分類錯(cuò)誤率和Parzen窗的降維方法[J];計(jì)算機(jī)工程與應(yīng)用;2014年14期

10 謝娟英;謝維信;;基于特征子集區(qū)分度與支持向量機(jī)的特征選擇算法[J];計(jì)算機(jī)學(xué)報(bào);2014年08期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 張逸石;王騰;張子剛;;Feature Selection for Classification Using Data Envelopment Analysis[A];第十一屆全國(guó)博士生學(xué)術(shù)年會(huì)——信息技術(shù)與安全專題論文集[C];2013年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 耿耀君;高通量數(shù)據(jù)特征選擇算法研究[D];西安電子科技大學(xué);2013年

2 尹華;面向高維和不平衡數(shù)據(jù)分類的集成學(xué)習(xí)研究[D];武漢大學(xué);2012年

3 王鋒;基于;瘷C(jī)理的粗糙特征選擇高效算法研究[D];山西大學(xué);2013年

4 李文峰;基于主題模型的用戶建模研究[D];北京郵電大學(xué);2013年

5 潘巍巍;故障嚴(yán)重程度識(shí)別的有序分類特征分析方法[D];哈爾濱工業(yè)大學(xué);2013年

6 應(yīng)文豪;基于Parzen Window估計(jì)的分類與聚類方法及應(yīng)用研究[D];江南大學(xué);2013年

7 李丹;基于流聚類的網(wǎng)絡(luò)業(yè)務(wù)識(shí)別關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2013年

8 劉遵仁;多類型屬性的鄰域粗糙模型和約簡(jiǎn)算法的研究[D];上海大學(xué);2013年

9 李勁松;數(shù)據(jù)挖掘方法在磷酸鋁合成數(shù)據(jù)分析上的應(yīng)用[D];東北師范大學(xué);2013年

10 劉波;組稀疏子空間的大間隔特征選擇[D];重慶大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 黃莉莉;多標(biāo)簽學(xué)習(xí)中特征選擇和分類問題的研究[D];安徽大學(xué);2013年

2 張俊曉;多維貝葉斯分類器的研究[D];西安電子科技大學(xué);2013年

3 張少明;實(shí)時(shí)視頻監(jiān)控人臉識(shí)別技術(shù)研究[D];華北電力大學(xué);2013年

4 王新瑩;最優(yōu)特征選擇算法在文本分類上的應(yīng)用研究[D];電子科技大學(xué);2013年

5 陶騰飛;基于多目標(biāo)優(yōu)化的多標(biāo)簽特征選擇算法研究[D];南京師范大學(xué);2013年

6 王鼎;基于相對(duì)熵和網(wǎng)格密度過濾的聚類算法研究[D];燕山大學(xué);2013年

7 王吉松;基于最大權(quán)重獨(dú)立集的特征選擇方法研究[D];東北師范大學(xué);2013年

8 陳培煜;基于腫瘤臨床指標(biāo)的多維時(shí)間序列分類建模的研究[D];北京工業(yè)大學(xué);2013年

9 曹經(jīng)緯;基于粗糙集的海量數(shù)據(jù)約簡(jiǎn)技術(shù)及應(yīng)用研究[D];河北工業(yè)大學(xué);2012年

10 于永兵;基于改進(jìn)ESN的混沌時(shí)間序列預(yù)測(cè)方法的研究[D];遼寧科技大學(xué);2012年



本文編號(hào):695825

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/swyx/695825.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶77888***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com