面向腫瘤基因數(shù)據(jù)的鄰域粗糙集特征選擇方法研究
發(fā)布時(shí)間:2023-04-01 10:22
粗糙集理論是一種刻畫(huà)知識(shí)模糊性、不確定性和不完整性的有效數(shù)學(xué)工具。然而,經(jīng)典粗糙集理論是基于嚴(yán)格等價(jià)關(guān)系的,在處理具有高維度、低樣本和連續(xù)型等特點(diǎn)的基因表達(dá)數(shù)據(jù)時(shí)可能失效。鄰域粗糙集作為粗糙集的擴(kuò)展理論,適用于處理混合型(符號(hào)型和數(shù)值型)數(shù)據(jù),正在被廣泛應(yīng)用于人工智能、數(shù)據(jù)挖掘、模式識(shí)別等諸多領(lǐng)域。針對(duì)混合型的腫瘤基因數(shù)據(jù),本文基于鄰域關(guān)系研究了鄰域決策系統(tǒng)的不確定性度量方法,結(jié)合機(jī)器學(xué)習(xí)方法中的降維技術(shù),基于鄰域粗糙集模型提出了腫瘤基因數(shù)據(jù)的特征選擇算法,并將其運(yùn)用于腫瘤基因分類,通過(guò)理論分析和實(shí)驗(yàn)測(cè)試來(lái)進(jìn)一步驗(yàn)證所提出算法的有效性。本文的主要研究?jī)?nèi)容包括三個(gè)方面:(1)對(duì)于連續(xù)型數(shù)據(jù),傳統(tǒng)的特征選擇方法采用離散化處理,導(dǎo)致了具有分類能力的信息丟失從而影響分類精度。為此,通過(guò)鄰域粗糙集模型中的鄰域關(guān)系;B續(xù)型基因數(shù)據(jù),以保留連續(xù)型數(shù)據(jù)的分類信息,提出了一種基于Fisher線性判別和鄰域依賴度的基因選擇算法。首先,Fisher線性判別方法被用于腫瘤基因數(shù)據(jù)集的初步降維,有助于降低后續(xù)算法的計(jì)算復(fù)雜度,得到候選基因子集;然后,在鄰域決策系統(tǒng)中基于鄰域精確度定義了鄰域粗糙度,并將鄰域粗糙...
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容與結(jié)構(gòu)安排
1.3.1 主要研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)安排
第二章 相關(guān)理論介紹
2.1 粗糙集理論
2.2 信息熵度量
2.3 知識(shí)約簡(jiǎn)
2.4 鄰域粗糙集
2.5 特征選擇
2.6 腫瘤基因數(shù)據(jù)描述
第三章 基于Fisher線性判別和鄰域依賴度的基因選擇方法
3.1 引言
3.2 Fisher線性判別的相關(guān)概念
3.3 基于FLD和鄰域依賴度的基因選擇方法
3.3.1 鄰域依賴度
3.3.2 基于FLD和鄰域依賴度的腫瘤基因選擇算法
3.3.3 算法時(shí)間復(fù)雜度分析
3.4 實(shí)驗(yàn)分析
3.5 小結(jié)
第四章 基于鄰域熵不確定性度量的腫瘤基因選擇方法
4.1 引言
4.2 基礎(chǔ)理論
4.3 基于決策鄰域熵的腫瘤基因選擇方法
4.3.1 基于鄰域熵的不確定性度量
4.3.2 基于決策鄰域熵的啟發(fā)式非單調(diào)屬性約簡(jiǎn)算法
4.3.3 基于決策鄰域熵的腫瘤基因選擇算法
4.3.4 算法時(shí)間復(fù)雜度分析
4.4 實(shí)驗(yàn)分析
4.4.1 數(shù)據(jù)集描述
4.4.2 Fisher score算法的實(shí)驗(yàn)結(jié)果
4.4.3 鄰域參數(shù)值的選定
4.4.4 基于熵度量的特征選擇算法的分類性能比較
4.4.5 相關(guān)降維算法的分類性能比較
4.5 小結(jié)
第五章 基于鄰域近似決策熵的腫瘤基因數(shù)據(jù)的特征選擇方法
5.1 引言
5.2 鄰域近似精度
5.3 基于鄰域近似決策熵的腫瘤基因選擇方法
5.3.1 鄰域近似決策熵
5.3.2 基于鄰域近似決策熵的特征選擇算法
5.3.3 算法時(shí)間復(fù)雜度分析
5.4 實(shí)驗(yàn)分析
5.4.1 數(shù)據(jù)集描述
5.4.2 鄰域參數(shù)值的選定
5.4.3 腫瘤基因數(shù)據(jù)集的高維約簡(jiǎn)分類結(jié)果
5.5 小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間的科研成果
本文編號(hào):3776966
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容與結(jié)構(gòu)安排
1.3.1 主要研究?jī)?nèi)容
1.3.2 論文結(jié)構(gòu)安排
第二章 相關(guān)理論介紹
2.1 粗糙集理論
2.2 信息熵度量
2.3 知識(shí)約簡(jiǎn)
2.4 鄰域粗糙集
2.5 特征選擇
2.6 腫瘤基因數(shù)據(jù)描述
第三章 基于Fisher線性判別和鄰域依賴度的基因選擇方法
3.1 引言
3.2 Fisher線性判別的相關(guān)概念
3.3 基于FLD和鄰域依賴度的基因選擇方法
3.3.1 鄰域依賴度
3.3.2 基于FLD和鄰域依賴度的腫瘤基因選擇算法
3.3.3 算法時(shí)間復(fù)雜度分析
3.4 實(shí)驗(yàn)分析
3.5 小結(jié)
第四章 基于鄰域熵不確定性度量的腫瘤基因選擇方法
4.1 引言
4.2 基礎(chǔ)理論
4.3 基于決策鄰域熵的腫瘤基因選擇方法
4.3.1 基于鄰域熵的不確定性度量
4.3.2 基于決策鄰域熵的啟發(fā)式非單調(diào)屬性約簡(jiǎn)算法
4.3.3 基于決策鄰域熵的腫瘤基因選擇算法
4.3.4 算法時(shí)間復(fù)雜度分析
4.4 實(shí)驗(yàn)分析
4.4.1 數(shù)據(jù)集描述
4.4.2 Fisher score算法的實(shí)驗(yàn)結(jié)果
4.4.3 鄰域參數(shù)值的選定
4.4.4 基于熵度量的特征選擇算法的分類性能比較
4.4.5 相關(guān)降維算法的分類性能比較
4.5 小結(jié)
第五章 基于鄰域近似決策熵的腫瘤基因數(shù)據(jù)的特征選擇方法
5.1 引言
5.2 鄰域近似精度
5.3 基于鄰域近似決策熵的腫瘤基因選擇方法
5.3.1 鄰域近似決策熵
5.3.2 基于鄰域近似決策熵的特征選擇算法
5.3.3 算法時(shí)間復(fù)雜度分析
5.4 實(shí)驗(yàn)分析
5.4.1 數(shù)據(jù)集描述
5.4.2 鄰域參數(shù)值的選定
5.4.3 腫瘤基因數(shù)據(jù)集的高維約簡(jiǎn)分類結(jié)果
5.5 小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間的科研成果
本文編號(hào):3776966
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3776966.html
最近更新
教材專著