基于特征協同作用的生物數據分析方法研究
發(fā)布時間:2022-11-06 13:18
近年來,隨著計算機技術的飛速發(fā)展,生物信息學取得了長足的進步。如何從生物數據中挖掘出有用的信息,是生物信息學研究者們需要解決的問題。研究表明,從協同的角度對生物體內基因、蛋白、代謝物等特征進行研究有助于人們深入理解生物機體運行機制。本文提出了基于特征組合的隨機森林算法RF-FC。該方法以特征的組合可以反映出生物體更為宏觀的、系統的變化為出發(fā)點,在隨機森林基決策樹的分叉過程中不僅僅考察單特征的區(qū)分能力,還使用線性核支持向量機對所有特征對、特征三元組進行考察,從單特征、特征對、特征三元組中選取最佳方式進行結點的分裂。在14個公共數據集上的實驗結果表明,本文提出的RF-FC算法的分類性能在大多數情況下優(yōu)于隨機森林。本文提出了基于Platt scaling技術和特征對得分的改進LC-k-TSP算法—LC-k-TSP-PlattCE。該方法在LC-k-TSP方法的決策階段使用Platt scaling算法計算基分類器對未知樣本的判別置信度,對每個基分類器依據對應特征對的第一得分進行加權。LC-k-TSP-PlattCE保留了LC-k-TSP的優(yōu)點,采用k>0對特征的線性關系構建集成分類器,分類準...
【文章頁數】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 本文主要工作
2 生物信息學數據挖掘常用技術
2.1 數據預處理
2.1.1 缺失值處理
2.1.2 數據變換
2.2 降維方法
2.2.1 特征選擇
2.2.2 特征提取
2.3 分類技術
2.3.1 決策樹
2.3.2 樸素貝葉斯
2.3.3 最近鄰
2.3.4 支持向量機
2.3.5 隨機森林
2.4 分類器性能評估
2.4.1 數據劃分
2.4.2 性能評價指標
2.5 本章小結
3 基于特征組合的隨機森林算法
3.1 決策樹與隨機森林算法
3.2 基于特征組合的隨機森林算法RF-FC
3.2.1 基決策樹構建
3.2.2 未知樣本分類
3.3 實驗
3.3.1 實驗設置
3.3.2 實驗結果與討論
3.4 本章小結
4 基于Platt scaling和特征對得分的改進LC-k-TSP算法
4.1 LC-k-TSP算法
4.2 LC-k-TSP-PlattCE算法
4.2.1 置信度分析
4.2.2 特征對加權
4.2.3 加權決策
4.2.4 整體流程
4.3實驗
4.3.1 實驗設置
4.3.2 實驗結果與討論
4.4 本章小結
5 基于多組合關系的生物網絡構建與模塊標志物發(fā)現算法
5.1 MCR-Net算法
5.1.1 多種組合關系網絡構建
5.1.2 模塊標志物搜索
5.1.3 多模塊信息融合策略
5.2 實驗
5.2.1 實驗設置
5.2.2 實驗結果與討論
5.3 RF-FC算法、LC-k-TSP-PlattCE算法、MCR-Net算法的比較
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表學術論文情況
致謝
本文編號:3703569
【文章頁數】:74 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 本文主要工作
2 生物信息學數據挖掘常用技術
2.1 數據預處理
2.1.1 缺失值處理
2.1.2 數據變換
2.2 降維方法
2.2.1 特征選擇
2.2.2 特征提取
2.3 分類技術
2.3.1 決策樹
2.3.2 樸素貝葉斯
2.3.3 最近鄰
2.3.4 支持向量機
2.3.5 隨機森林
2.4 分類器性能評估
2.4.1 數據劃分
2.4.2 性能評價指標
2.5 本章小結
3 基于特征組合的隨機森林算法
3.1 決策樹與隨機森林算法
3.2 基于特征組合的隨機森林算法RF-FC
3.2.1 基決策樹構建
3.2.2 未知樣本分類
3.3 實驗
3.3.1 實驗設置
3.3.2 實驗結果與討論
3.4 本章小結
4 基于Platt scaling和特征對得分的改進LC-k-TSP算法
4.1 LC-k-TSP算法
4.2 LC-k-TSP-PlattCE算法
4.2.1 置信度分析
4.2.2 特征對加權
4.2.3 加權決策
4.2.4 整體流程
4.3實驗
4.3.1 實驗設置
4.3.2 實驗結果與討論
4.4 本章小結
5 基于多組合關系的生物網絡構建與模塊標志物發(fā)現算法
5.1 MCR-Net算法
5.1.1 多種組合關系網絡構建
5.1.2 模塊標志物搜索
5.1.3 多模塊信息融合策略
5.2 實驗
5.2.1 實驗設置
5.2.2 實驗結果與討論
5.3 RF-FC算法、LC-k-TSP-PlattCE算法、MCR-Net算法的比較
5.4 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表學術論文情況
致謝
本文編號:3703569
本文鏈接:http://sikaile.net/projectlw/swxlw/3703569.html
教材專著