基于網(wǎng)絡(luò)生物標(biāo)志物的特征選擇算法及其在癌癥檢測上的應(yīng)用
發(fā)布時間:2023-09-03 17:09
伴隨著高通量數(shù)據(jù)存儲技術(shù)的發(fā)展,以及在生物信息領(lǐng)域各種測序技術(shù)的成熟,生物信息數(shù)據(jù)的維度呈爆炸式增長。如何從海量的數(shù)據(jù)中挖掘有效的信息,是生物信息以及數(shù)據(jù)挖掘領(lǐng)域的熱門問題。人類的基因表達譜數(shù)據(jù)中包含著反映疾病產(chǎn)生原因的重要信息,而人體內(nèi)基因數(shù)量極多,如果能夠從眾多基因中挖掘和相關(guān)疾病相關(guān)的生物標(biāo)志物,不單單可以推動這類疾病的相關(guān)研究,還可以幫助臨床更好的治療該種疾病。而在基因表達譜數(shù)據(jù)集中,與某種病變相關(guān)的基因往往在正常樣本與患病樣本中具備差異性,因此找到這些基因后,可以使用機器學(xué)習(xí)算法進行分類,從而實現(xiàn)疾病的檢測和預(yù)測。生物信息學(xué)領(lǐng)域認為,功能相似的基因往往協(xié)同進行工作,可以視為一個整體看待。同時,這些基因在基因表達譜上存在數(shù)值上的相關(guān)性,彼此相關(guān)的基因便是網(wǎng)絡(luò)生物標(biāo)志物。本文基于網(wǎng)絡(luò)生物標(biāo)志物的理論基礎(chǔ),使用余弦相似度來描述基因之間的相關(guān)性,構(gòu)造網(wǎng)絡(luò)生物標(biāo)志物,同時,本文結(jié)合嵌入式特征選擇算法以及序列化特征選擇策略,以機器學(xué)習(xí)模型的分類性能作為主要評價指標(biāo),設(shè)計了一種特征選擇算法。該算法可以極大降低數(shù)據(jù)的特征維度,從海量基因中選擇基因子集,有效的實現(xiàn)對疾病的檢測。同時,本文整體對...
【文章頁數(shù)】:48 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇的研究現(xiàn)狀
1.2.2 網(wǎng)絡(luò)生物標(biāo)志物的研究現(xiàn)狀
1.3 本文的工作和創(chuàng)新
第2章 相關(guān)背景知識
2.1 數(shù)據(jù)預(yù)處理
2.1.1 缺失值的處理
2.1.2 離群值的處理
2.1.3 無量綱化
2.2 特征工程
2.2.1 特征提取
2.2.2 特征選擇
2.3 分類算法
2.3.1 決策樹
2.3.2 邏輯回歸
2.3.3 集成學(xué)習(xí)
2.4 性能評估
2.5 類別不平衡
2.5.1 類別不平衡及其危害
2.5.2 采樣
第3章 基于網(wǎng)絡(luò)生物標(biāo)志物的特征選擇算法
3.1 網(wǎng)絡(luò)生物標(biāo)志物
3.2 數(shù)據(jù)簡介
3.3 cosEdge算法流程
3.3.1 數(shù)據(jù)預(yù)處理
3.3.2 過采樣
3.3.3 降維
3.3.4 構(gòu)建cosEdge
3.3.5 獲取特征子集
3.4 結(jié)果預(yù)測
第4章 結(jié)果分析和討論
4.1 實驗環(huán)境設(shè)置
4.2 結(jié)果分析
4.2.1 不同網(wǎng)絡(luò)生物標(biāo)志物的對比
4.2.2 不同特征選擇算法的對比
第5章 總結(jié)和展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻
作者簡介
致謝
本文編號:3845439
【文章頁數(shù)】:48 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 特征選擇的研究現(xiàn)狀
1.2.2 網(wǎng)絡(luò)生物標(biāo)志物的研究現(xiàn)狀
1.3 本文的工作和創(chuàng)新
第2章 相關(guān)背景知識
2.1 數(shù)據(jù)預(yù)處理
2.1.1 缺失值的處理
2.1.2 離群值的處理
2.1.3 無量綱化
2.2 特征工程
2.2.1 特征提取
2.2.2 特征選擇
2.3 分類算法
2.3.1 決策樹
2.3.2 邏輯回歸
2.3.3 集成學(xué)習(xí)
2.4 性能評估
2.5 類別不平衡
2.5.1 類別不平衡及其危害
2.5.2 采樣
第3章 基于網(wǎng)絡(luò)生物標(biāo)志物的特征選擇算法
3.1 網(wǎng)絡(luò)生物標(biāo)志物
3.2 數(shù)據(jù)簡介
3.3 cosEdge算法流程
3.3.1 數(shù)據(jù)預(yù)處理
3.3.2 過采樣
3.3.3 降維
3.3.4 構(gòu)建cosEdge
3.3.5 獲取特征子集
3.4 結(jié)果預(yù)測
第4章 結(jié)果分析和討論
4.1 實驗環(huán)境設(shè)置
4.2 結(jié)果分析
4.2.1 不同網(wǎng)絡(luò)生物標(biāo)志物的對比
4.2.2 不同特征選擇算法的對比
第5章 總結(jié)和展望
5.1 工作總結(jié)
5.2 工作展望
參考文獻
作者簡介
致謝
本文編號:3845439
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3845439.html
最近更新
教材專著