卵巢癌蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析模型研究
本文關(guān)鍵詞:卵巢癌蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析模型研究
更多相關(guān)文章: 質(zhì)譜數(shù)據(jù) 峰值檢測 局部最大搜索(LMS) 特征加權(quán)選擇算法 Relief
【摘要】:癌組織在病理狀態(tài)表達(dá)的蛋白質(zhì)和肽豐度會出現(xiàn)異常變化,在特定癌癥的肽表達(dá)中找到一組最佳的蛋白質(zhì)或多肽標(biāo)記物,可臨床用于特定類型的癌癥診斷分析。本文介紹了一種基于局部最大值搜索(LMS)峰值檢測算法和Relief算法的新方法,在應(yīng)用于MALDI-TOF低分辨率數(shù)據(jù),可以更準(zhǔn)確的實現(xiàn)分類判別。該方法包括局部最大值搜索(LMS)峰值檢測算法,Relief特征選擇算法和支持向量機的學(xué)習(xí)分類法。對低分辨率的卵巢癌數(shù)據(jù)集8-7-02而言,LMS算法經(jīng)參數(shù)優(yōu)化可以非常有效的用于峰值檢測。在本數(shù)據(jù)集上Relief算法對LMS檢測的峰值進(jìn)行特征選擇時體現(xiàn)出了良好的性能。至于學(xué)習(xí)分類器,支持向量機進(jìn)行預(yù)測分類的測試精度,在識別癌癥組和健康組時取得了滿意的性能結(jié)果。LMS的最佳參數(shù)集是通過控制變量的方法實現(xiàn)的,取得了99.9738%的平均精確度(標(biāo)準(zhǔn)差為0.0018),在1000個獨立的10折交叉驗證中得到97.7437%的平均特異性(標(biāo)準(zhǔn)差為0.0109)。本文提出了一種新的特征加權(quán)選擇算法,該算法通過求F-score算法和Relief算法的聯(lián)合權(quán)重,實現(xiàn)了高分辨率的MALDI-TOF質(zhì)譜數(shù)據(jù)更精確分類。我們歸納了數(shù)據(jù)處理的“四步走”戰(zhàn)略:(1)原始質(zhì)譜數(shù)據(jù)對齊后按一定距離等間距分組,(2)局部最大搜索峰值檢測算法(LMS)進(jìn)行峰值檢測,(3)新的特征加權(quán)選擇算法(FRW)用來進(jìn)行特征選擇,(4)支持向量機進(jìn)行癌癥組和健康組的分類甄別。LMS的最佳參數(shù)集也是通過控制變量的方法實現(xiàn)的,取得了97.4167%的平均精確度(標(biāo)準(zhǔn)差為0.0146),在1000個獨立的10折交叉驗證中得到最佳特異性為98.6111%。
【關(guān)鍵詞】:質(zhì)譜數(shù)據(jù) 峰值檢測 局部最大搜索(LMS) 特征加權(quán)選擇算法 Relief
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R737.31
【目錄】:
- 摘要8-9
- ABSTRACT9-11
- 縮略詞11-12
- 第一章 緒論12-20
- 1.1 基因突變與癌癥發(fā)生12-14
- 1.2 卵巢癌現(xiàn)狀與早期癌癥診斷14-15
- 1.3 質(zhì)譜分析模型研究的目的及意義15-17
- 1.4 論文的主要工作及結(jié)構(gòu)17-20
- 1.4.1 論文的主要工作17-18
- 1.4.2 論文的結(jié)構(gòu)18-20
- 第二章 低分辨率卵巢癌的數(shù)據(jù)分析20-36
- 2.1 實驗數(shù)據(jù)集20
- 2.2 實驗方法20-25
- 2.2.1 刪除無效數(shù)據(jù)20-21
- 2.2.2 局部最大值搜索(LMS)峰值檢測和量化21-22
- 2.2.3 特征選擇算法22-24
- 2.2.4 支持向量機學(xué)習(xí)分類算法24-25
- 2.2.5 特征子集相似性分析和主成分分析25
- 2.3 實驗結(jié)果25-34
- 2.3.1 LMS峰值檢測和參數(shù)探究結(jié)果26-31
- 2.3.2 Relief算法與其他降維算法的比較31-32
- 2.3.3 特征子集相似性分析和主成分分析結(jié)果32-34
- 2.4 討論34-36
- 第三章 高分辨率卵巢癌的數(shù)據(jù)分析36-48
- 3.1 實驗數(shù)據(jù)集36
- 3.2 實驗方法36-39
- 3.2.1 刪除無效數(shù)據(jù)和等間距分組36-37
- 3.2.2 局部最大值搜索(LMS)峰值檢測和量化37-38
- 3.2.3 特征選擇算法38
- 3.2.4 F-score-Relief特征加權(quán)選擇算法38-39
- 3.2.5 支持向量機學(xué)習(xí)分類算法39
- 3.2.6 特征子集相似性分析和主成分分析39
- 3.3 實驗結(jié)果39-47
- 3.3.1 LMS峰值檢測和參數(shù)探究結(jié)果40-41
- 3.3.2 FRW算法與其他算法的分類結(jié)果比較41-43
- 3.3.3 樣本方差CV的限制和K-S檢驗算法降維結(jié)果43-45
- 3.3.4 特征子集相似性分析和主成分分析結(jié)果45-47
- 3.4 討論47-48
- 第四章 總結(jié)與展望48-52
- 4.1 總結(jié)48-49
- 4.2 展望49-52
- 附錄52-54
- 參考文獻(xiàn)54-62
- 致謝62-64
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文64-66
- 學(xué)位論文評閱及答辯情況表66
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 王堯佳;祝磊;韓斌;厲力華;鄭智國;牟瀚舟;;基于遞歸零空間線性判別分析算法的蛋白質(zhì)質(zhì)譜數(shù)據(jù)特征選擇[J];航天醫(yī)學(xué)與醫(yī)學(xué)工程;2010年05期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 孫瑞祥;付巖;張京芬;李德泉;王海鵬;蔡津津;王曉彪;曾嶸;賀思敏;高文;;蛋白質(zhì)組質(zhì)譜信息處理的關(guān)鍵算法研究[A];中國蛋白質(zhì)組學(xué)第三屆學(xué)術(shù)大會論文摘要[C];2005年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 牛明;海量質(zhì)譜數(shù)據(jù)深度解析新方法及其應(yīng)用[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2012年
2 徐承建;質(zhì)譜數(shù)據(jù)發(fā)掘與聯(lián)用色譜分析方法及其在中藥分析中的應(yīng)用研究[D];中南大學(xué);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 潘超;面向復(fù)雜蛋白質(zhì)組的非標(biāo)記定量分析方法研究及其應(yīng)用[D];浙江大學(xué);2015年
2 楊秀忠;高維蛋白質(zhì)質(zhì)譜數(shù)據(jù)的分類方法對比研究[D];西南交通大學(xué);2015年
3 崔麗麗;卵巢癌蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析模型研究[D];山東大學(xué);2016年
4 馬海濱;質(zhì)譜數(shù)據(jù)結(jié)構(gòu)化存儲及壓縮問題研究[D];國防科學(xué)技術(shù)大學(xué);2010年
5 楊沖;面向質(zhì)譜數(shù)據(jù)的蛋白質(zhì)直接鑒定系統(tǒng)設(shè)計與實現(xiàn)[D];湖南大學(xué);2013年
6 楊錦瑜;質(zhì)譜數(shù)據(jù)挖掘及中藥色譜指紋圖譜評價新方法[D];中南大學(xué);2005年
7 賀權(quán)澤;動物毒素數(shù)據(jù)庫的建立與質(zhì)譜數(shù)據(jù)提取方法研究[D];湖南師范大學(xué);2011年
8 柯激情;基于稀疏表示的蛋白質(zhì)質(zhì)譜數(shù)據(jù)分析[D];杭州電子科技大學(xué);2012年
9 馬婷婷;某些腫瘤蛋白組質(zhì)譜數(shù)據(jù)的分析模型及其應(yīng)用[D];浙江理工大學(xué);2015年
10 張輝;離子阱串聯(lián)質(zhì)譜數(shù)據(jù)de novo分析方法與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2006年
,本文編號:955831
本文鏈接:http://sikaile.net/yixuelunwen/zlx/955831.html