級聯(lián)GA-CatBoost在妊娠期糖尿病預(yù)測診斷中的研究
發(fā)布時間:2021-02-07 04:57
隨著信息智能化進(jìn)程不斷發(fā)展,互聯(lián)網(wǎng)與傳統(tǒng)醫(yī)療不斷融合,數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)技術(shù)已經(jīng)越來越頻繁地被用于預(yù)測疾病發(fā)生的可能性。在醫(yī)療診斷領(lǐng)域,越來越多的生理指標(biāo)、疾病類型和生物工程技術(shù),加大了醫(yī)生診斷疾病的難度,針對該問題,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)能夠從醫(yī)學(xué)數(shù)據(jù)中提取隱藏的、具有潛在價值的和新穎的信息,以提高診斷準(zhǔn)確性,減少時間和成本。一方面可以對醫(yī)生的診斷結(jié)果提供進(jìn)一步的驗(yàn)證,另一方面還能給醫(yī)生提供一個復(fù)雜疾病的分析工具。CatBoost(Category Boosting)是一種基于梯度提升樹并且支持類別特征及字符串類型特征的機(jī)器學(xué)習(xí)框架。梯度提升是一種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),是解決具有異構(gòu)特征、噪聲數(shù)據(jù)和復(fù)雜依賴關(guān)系的問題的主要方法。本文以妊娠期糖尿病為研究對象,采用迭代自組織數(shù)據(jù)分析法(Iterative Selforganizing Data Analysis Techniques Algorithm,ISODATA)和拉伊達(dá)準(zhǔn)則檢測并且剔除離群值,將CatBoost作為預(yù)測模型,使用遺傳算法(Genetic Algorithm,GA)優(yōu)化對CatBoost模型的參數(shù)進(jìn)行聯(lián)合優(yōu)化,選擇最...
【文章來源】:太原理工大學(xué)山西省 211工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 概述
1.2 課題研究的背景及意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 糖尿病預(yù)測模型研究現(xiàn)狀
1.3.2 集成學(xué)習(xí)算法在疾病預(yù)測方面的研究現(xiàn)狀
1.4 主要存在的問題
1.5 論文主要內(nèi)容及章節(jié)安排
1.6 本章小結(jié)
第二章 相關(guān)理論概述
2.1 妊娠期糖尿病預(yù)測診斷綜述
2.2 醫(yī)療數(shù)據(jù)離群點(diǎn)檢測方法
2.2.1 基于統(tǒng)計的離群點(diǎn)檢測
2.2.2 基于鄰近度的離群點(diǎn)檢測
2.2.3 基于密度的離群點(diǎn)檢測
2.2.4 基于One-class SVM的離群點(diǎn)檢測
2.2.5 基于聚類的離群點(diǎn)檢測
2.3 妊娠期糖尿病預(yù)測模型
2.3.1 支持向量機(jī)
2.3.2 人工神經(jīng)網(wǎng)絡(luò)
2.3.3 集成學(xué)習(xí)
2.4 預(yù)測診斷模型評估方法
2.4.1 交叉驗(yàn)證
2.4.2 性能評價指標(biāo)
2.5 本章小結(jié)
第三章 妊娠期糖尿病預(yù)測診斷數(shù)據(jù)預(yù)處理
3.1 實(shí)驗(yàn)數(shù)據(jù)介紹
3.2 檢測并剔除離群點(diǎn)
3.2.1 迭代自組織數(shù)據(jù)分析法(ISODATA)
3.2.2 ISODATA檢測并剔除妊娠期糖尿病數(shù)據(jù)離群點(diǎn)
3.3 離散化和特征分析
3.3.1 數(shù)據(jù)離散化
3.3.2 特征分析
3.4 缺失值處理
3.5 本章小結(jié)
第四章 基于遺傳算法改進(jìn)CatBoost算法
4.1 遺傳算法
4.2 網(wǎng)格搜索
4.3 基于遺傳算法改進(jìn)的CatBoost模型
4.3.1 GA-CatBoost模型
4.3.2 網(wǎng)格搜索和遺傳算法結(jié)果對比
4.4 本章小結(jié)
第五章 級聯(lián)GA-CatBoost妊娠期糖尿病預(yù)測模型
5.1 基于支持向量機(jī)的妊娠期糖尿病預(yù)測模型
5.2 基于人工神經(jīng)網(wǎng)絡(luò)的妊娠期糖尿病預(yù)測模型
5.3 基于GA-CatBoost妊娠期糖尿病預(yù)測模型
5.3.1 級聯(lián)GA-CatBoost模型
5.3.2 妊娠期糖尿病預(yù)測診斷實(shí)驗(yàn)結(jié)果
5.4 模型結(jié)果對比分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號:3021692
【文章來源】:太原理工大學(xué)山西省 211工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 概述
1.2 課題研究的背景及意義
1.3 國內(nèi)外研究現(xiàn)狀
1.3.1 糖尿病預(yù)測模型研究現(xiàn)狀
1.3.2 集成學(xué)習(xí)算法在疾病預(yù)測方面的研究現(xiàn)狀
1.4 主要存在的問題
1.5 論文主要內(nèi)容及章節(jié)安排
1.6 本章小結(jié)
第二章 相關(guān)理論概述
2.1 妊娠期糖尿病預(yù)測診斷綜述
2.2 醫(yī)療數(shù)據(jù)離群點(diǎn)檢測方法
2.2.1 基于統(tǒng)計的離群點(diǎn)檢測
2.2.2 基于鄰近度的離群點(diǎn)檢測
2.2.3 基于密度的離群點(diǎn)檢測
2.2.4 基于One-class SVM的離群點(diǎn)檢測
2.2.5 基于聚類的離群點(diǎn)檢測
2.3 妊娠期糖尿病預(yù)測模型
2.3.1 支持向量機(jī)
2.3.2 人工神經(jīng)網(wǎng)絡(luò)
2.3.3 集成學(xué)習(xí)
2.4 預(yù)測診斷模型評估方法
2.4.1 交叉驗(yàn)證
2.4.2 性能評價指標(biāo)
2.5 本章小結(jié)
第三章 妊娠期糖尿病預(yù)測診斷數(shù)據(jù)預(yù)處理
3.1 實(shí)驗(yàn)數(shù)據(jù)介紹
3.2 檢測并剔除離群點(diǎn)
3.2.1 迭代自組織數(shù)據(jù)分析法(ISODATA)
3.2.2 ISODATA檢測并剔除妊娠期糖尿病數(shù)據(jù)離群點(diǎn)
3.3 離散化和特征分析
3.3.1 數(shù)據(jù)離散化
3.3.2 特征分析
3.4 缺失值處理
3.5 本章小結(jié)
第四章 基于遺傳算法改進(jìn)CatBoost算法
4.1 遺傳算法
4.2 網(wǎng)格搜索
4.3 基于遺傳算法改進(jìn)的CatBoost模型
4.3.1 GA-CatBoost模型
4.3.2 網(wǎng)格搜索和遺傳算法結(jié)果對比
4.4 本章小結(jié)
第五章 級聯(lián)GA-CatBoost妊娠期糖尿病預(yù)測模型
5.1 基于支持向量機(jī)的妊娠期糖尿病預(yù)測模型
5.2 基于人工神經(jīng)網(wǎng)絡(luò)的妊娠期糖尿病預(yù)測模型
5.3 基于GA-CatBoost妊娠期糖尿病預(yù)測模型
5.3.1 級聯(lián)GA-CatBoost模型
5.3.2 妊娠期糖尿病預(yù)測診斷實(shí)驗(yàn)結(jié)果
5.4 模型結(jié)果對比分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號:3021692
本文鏈接:http://sikaile.net/yixuelunwen/fuchankeerkelunwen/3021692.html
最近更新
教材專著