面向基因表達(dá)數(shù)據(jù)的并行特征選擇及集成分類
發(fā)布時間:2021-01-13 23:46
生物信息學(xué)的研究處在一個數(shù)據(jù)爆炸的時代,近年來在基因組學(xué)、代謝組學(xué)、轉(zhuǎn)錄組和蛋白質(zhì)組學(xué)等領(lǐng)域技術(shù)的進(jìn)步,使得生物學(xué)家可以有更多的數(shù)據(jù)從不同方面對生命體進(jìn)行分析。非正常的生命活動通常會導(dǎo)致基因的異常表達(dá),這種表達(dá)值的變化可以通過微陣列技術(shù)以基因表達(dá)數(shù)據(jù)的形式呈現(xiàn)出來。對基因表達(dá)數(shù)據(jù)的分析可以診斷和識別植物脅迫響應(yīng)類型,在出現(xiàn)相應(yīng)癥狀之前減少由這些脅迫造成的影響。因為基因選擇是分類中非常重要的一步,高效的基因選擇和樣本分類方法在大規(guī);虮磉_(dá)數(shù)據(jù)的分析中變得越來越重要。Pathway是通路映射的集合,它代表了在分子間相互作用、反應(yīng)和關(guān)系網(wǎng)絡(luò)上的知識。利用Pathway知識進(jìn)行基因初步選擇,每個Pathway單元對應(yīng)一個基因子集,提高基因選擇結(jié)果在生物學(xué)角度上的可解釋性。本文采用基于相交鄰域粗糙集的屬性約簡方法在每個基因子集中篩選出關(guān)鍵基因。在集成分類階段,采用結(jié)合近鄰傳播聚類的選擇性集成方法。使用近鄰傳播聚類對基分類器進(jìn)行聚簇劃分,選擇作為類代表點的基分類器參與最后的集成分類。在擬南芥脅迫響應(yīng)相關(guān)的基因表達(dá)數(shù)據(jù)集上進(jìn)行實驗,表明結(jié)合Pathway知識的集成方法與現(xiàn)有的經(jīng)典集成方法相比在準(zhǔn)確...
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文結(jié)構(gòu)
2 特征選擇與樣本分類相關(guān)方法
2.1 特征選擇方法
2.2 基于基因表達(dá)數(shù)據(jù)的集成分類方法
2.3 海量生物數(shù)據(jù)的并行處理
2.4 相交鄰域粗糙集在基因表達(dá)數(shù)據(jù)中的應(yīng)用
2.5 本章小結(jié)
3 結(jié)合Pathway知識和近鄰傳播聚類的選擇性集成分類
3.1 融合Pathway知識的基因選擇方法
3.1.1 生物知識融合方法
3.1.2 基于相交鄰域粗糙集的基因選擇
3.2 結(jié)合近鄰傳播聚類的選擇性集成分類方法
3.2.1 近鄰傳播聚類
3.2.2 相似性矩陣計算方法
3.2.3 選擇性集成分類流程
3.3 實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)集及設(shè)置
3.3.3 實驗結(jié)果及分析
3.4 本章小結(jié)
4 基于并行基因選擇的動態(tài)選擇性集成分類
4.1 并行相交鄰域粗糙集計算方法
4.1.1 相交鄰域粗糙集的矩陣表示方法
4.1.2 并行相交鄰域粗糙集算法
4.2 多種啟發(fā)信息在基因選擇模型中的應(yīng)用
4.2.1 基因選擇中的啟發(fā)信息
4.2.2 基于相交鄰域粗糙集的基因選擇
4.3 基因表達(dá)數(shù)據(jù)的動態(tài)選擇性集成分類方法
4.3.1 基分類器之間的距離計算
4.3.2 動態(tài)選擇性集成
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)集及設(shè)置
4.4.2 實驗結(jié)果及分析
4.4.3 對比實驗
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號:2975771
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文結(jié)構(gòu)
2 特征選擇與樣本分類相關(guān)方法
2.1 特征選擇方法
2.2 基于基因表達(dá)數(shù)據(jù)的集成分類方法
2.3 海量生物數(shù)據(jù)的并行處理
2.4 相交鄰域粗糙集在基因表達(dá)數(shù)據(jù)中的應(yīng)用
2.5 本章小結(jié)
3 結(jié)合Pathway知識和近鄰傳播聚類的選擇性集成分類
3.1 融合Pathway知識的基因選擇方法
3.1.1 生物知識融合方法
3.1.2 基于相交鄰域粗糙集的基因選擇
3.2 結(jié)合近鄰傳播聚類的選擇性集成分類方法
3.2.1 近鄰傳播聚類
3.2.2 相似性矩陣計算方法
3.2.3 選擇性集成分類流程
3.3 實驗結(jié)果與分析
3.3.1 實驗數(shù)據(jù)集及設(shè)置
3.3.3 實驗結(jié)果及分析
3.4 本章小結(jié)
4 基于并行基因選擇的動態(tài)選擇性集成分類
4.1 并行相交鄰域粗糙集計算方法
4.1.1 相交鄰域粗糙集的矩陣表示方法
4.1.2 并行相交鄰域粗糙集算法
4.2 多種啟發(fā)信息在基因選擇模型中的應(yīng)用
4.2.1 基因選擇中的啟發(fā)信息
4.2.2 基于相交鄰域粗糙集的基因選擇
4.3 基因表達(dá)數(shù)據(jù)的動態(tài)選擇性集成分類方法
4.3.1 基分類器之間的距離計算
4.3.2 動態(tài)選擇性集成
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)集及設(shè)置
4.4.2 實驗結(jié)果及分析
4.4.3 對比實驗
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號:2975771
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2975771.html
最近更新
教材專著