基于決策樹的肝病診斷技術(shù)研究
發(fā)布時間:2023-08-06 19:36
肝病是指發(fā)生在肝臟的病變,是一種常見的危害性極大的疾病。一直以來肝病的診斷方法都受到學(xué)者們的廣泛關(guān)注,隨著大數(shù)據(jù)技的發(fā)展,數(shù)據(jù)挖掘技術(shù)在醫(yī)療診斷領(lǐng)域中的應(yīng)用不斷增多,基于數(shù)據(jù)挖掘技術(shù)的肝病診斷系統(tǒng)研究也成為了近年來熱門的研究課題之一。本文以構(gòu)建肝病診斷模型為目標(biāo),探討在構(gòu)建過程中遇到的數(shù)據(jù)不平衡問題,“維數(shù)災(zāi)難”問題和模型建模方法選擇。首先,在解決數(shù)據(jù)不平衡問題時針對Borderline-SMOTE算法的缺陷提出一種新的算法BN-SMOTE;然后,在解決維數(shù)災(zāi)難問題時針對單準(zhǔn)則過濾式特征算法無法全面評價特征子集優(yōu)劣的問題提出一種新的多準(zhǔn)則融合的特征選擇算法MFMSC;最后,基于決策樹算法建立肝病診斷模型。具體工作如下:(1)針對經(jīng)典的Borderline-SMOTE算法在生成新樣本時,會漏選處于決策邊界的重要少數(shù)類樣本點導(dǎo)致模型分類準(zhǔn)確率下降的問題,提出一種新的算法BN-SMOTE。該算法首先在多數(shù)類樣本集中計算少數(shù)類樣本集的最近鄰,得到一個處于決策邊界的新多數(shù)類樣本集,然后在少數(shù)類樣本集中取該新多數(shù)類樣本集的最近鄰,找到處于決策邊界的少數(shù)類樣本集,解決了Borderline-SMOT...
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文結(jié)構(gòu)
第二章 相關(guān)技術(shù)概述
2.1 不平衡數(shù)據(jù)處理
2.1.1 欠采樣方法
2.1.2 過采樣方法
2.2 特征選擇
2.2.1 特征選擇的定義
2.2.2 特征選擇的基本流程
2.2.3 基于評價準(zhǔn)則的特征選擇算法
2.3 數(shù)據(jù)挖掘相關(guān)算法概述
2.3.1 決策樹算法
2.3.2 支持向量機(jī)
第三章 一種改進(jìn)的不平衡數(shù)據(jù)過采樣算法BN-SMOTE
3.1 Borderline-SMOTE算法簡介
3.1.1 Borderline-SMOTE算法
3.1.2 Borderline-SMOTE算法的缺陷
3.2 一種新的過采樣算法BN-SMOTE
3.2.1 算法流程
3.2.2 集合的構(gòu)建示例
3.3 實驗與分析
3.3.1 數(shù)據(jù)集描述
3.3.2 評價指標(biāo)
3.3.3 實驗環(huán)境和相關(guān)參數(shù)設(shè)置
3.3.4 實驗結(jié)果對比與分析
3.4 本章小結(jié)
第四章 基于多樣性度量的多準(zhǔn)則融合特征選擇算法MFMSC
4.1 .互信息、卡方檢驗和Relief-F評價方法簡介
4.1.1 互信息方法
4.1.2 卡方檢驗方法
4.1.3 Relief-F方法
4.2 MFMSC特征選擇算法
4.2.1 融合權(quán)重的選定
4.2.2 算法流程
4.3 實驗與分析
4.3.1 實驗環(huán)境和數(shù)據(jù)集描述
4.3.2 實驗設(shè)計
4.3.3 實驗結(jié)果與分析
4.4 本章小結(jié)
第五章 基于決策風(fēng)險代價的肝病診斷決策樹模型
5.1 誤判代價和決策風(fēng)險代價矩陣
5.2 一種基于決策風(fēng)險代價矩陣的決策樹算法DRM-C4.
5.2.1 誤判代價加權(quán)信息增益率
5.2.2 算法流程
5.3 實驗結(jié)果與分析
5.3.1 數(shù)據(jù)集描述
5.3.2 數(shù)據(jù)預(yù)處理
5.3.3 決策風(fēng)險代價矩陣的確定
5.3.4 肝病診斷模型的性能分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
參考文獻(xiàn)
致謝
碩士期間研究成果
本文編號:3839929
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 研究內(nèi)容及論文結(jié)構(gòu)
1.3.1 研究內(nèi)容
1.3.2 論文結(jié)構(gòu)
第二章 相關(guān)技術(shù)概述
2.1 不平衡數(shù)據(jù)處理
2.1.1 欠采樣方法
2.1.2 過采樣方法
2.2 特征選擇
2.2.1 特征選擇的定義
2.2.2 特征選擇的基本流程
2.2.3 基于評價準(zhǔn)則的特征選擇算法
2.3 數(shù)據(jù)挖掘相關(guān)算法概述
2.3.1 決策樹算法
2.3.2 支持向量機(jī)
第三章 一種改進(jìn)的不平衡數(shù)據(jù)過采樣算法BN-SMOTE
3.1 Borderline-SMOTE算法簡介
3.1.1 Borderline-SMOTE算法
3.1.2 Borderline-SMOTE算法的缺陷
3.2 一種新的過采樣算法BN-SMOTE
3.2.1 算法流程
3.2.2 集合的構(gòu)建示例
3.3 實驗與分析
3.3.1 數(shù)據(jù)集描述
3.3.2 評價指標(biāo)
3.3.3 實驗環(huán)境和相關(guān)參數(shù)設(shè)置
3.3.4 實驗結(jié)果對比與分析
3.4 本章小結(jié)
第四章 基于多樣性度量的多準(zhǔn)則融合特征選擇算法MFMSC
4.1 .互信息、卡方檢驗和Relief-F評價方法簡介
4.1.1 互信息方法
4.1.2 卡方檢驗方法
4.1.3 Relief-F方法
4.2 MFMSC特征選擇算法
4.2.1 融合權(quán)重的選定
4.2.2 算法流程
4.3 實驗與分析
4.3.1 實驗環(huán)境和數(shù)據(jù)集描述
4.3.2 實驗設(shè)計
4.3.3 實驗結(jié)果與分析
4.4 本章小結(jié)
第五章 基于決策風(fēng)險代價的肝病診斷決策樹模型
5.1 誤判代價和決策風(fēng)險代價矩陣
5.2 一種基于決策風(fēng)險代價矩陣的決策樹算法DRM-C4.
5.2.1 誤判代價加權(quán)信息增益率
5.2.2 算法流程
5.3 實驗結(jié)果與分析
5.3.1 數(shù)據(jù)集描述
5.3.2 數(shù)據(jù)預(yù)處理
5.3.3 決策風(fēng)險代價矩陣的確定
5.3.4 肝病診斷模型的性能分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 本文總結(jié)
6.2 研究展望
參考文獻(xiàn)
致謝
碩士期間研究成果
本文編號:3839929
本文鏈接:http://sikaile.net/yixuelunwen/xiaohjib/3839929.html
最近更新
教材專著