天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研究

發(fā)布時間:2020-11-04 17:49
   隨著信息技術(shù)的快速發(fā)展,醫(yī)院信息系統(tǒng)和醫(yī)療數(shù)字化設(shè)備的廣泛應(yīng)用,醫(yī)學(xué)數(shù)據(jù)庫中有關(guān)病人的案例、檢驗、診斷和治療的信息大量積累,人們對于發(fā)掘醫(yī)學(xué)數(shù)據(jù)中所蘊含知識的需求日益迫切。借助數(shù)據(jù)挖掘技術(shù)對這些寶貴的醫(yī)學(xué)數(shù)據(jù)資源進行分析和處理發(fā)現(xiàn)有價值的信息,從而可以為疾病的診斷和治療提供科學(xué)的決策。模糊決策樹將模糊理論與決策樹算法相結(jié)合,可以對醫(yī)學(xué)數(shù)據(jù)中存在的模糊性和不確定性進行處理,增強決策樹算法的適用性,實現(xiàn)更加準確有效的醫(yī)學(xué)數(shù)據(jù)分類。本文主要開展了以下工作:(1)對模糊決策樹的兩種算法——模糊ID3算法和最小分類不確定性算法進行研究,在模糊數(shù)據(jù)集上完成模糊決策樹的構(gòu)建和規(guī)則提取,并利用模糊規(guī)則對新實例進行分類預(yù)測?偨Y(jié)清晰決策樹與模糊決策樹的區(qū)別。(2)對于醫(yī)學(xué)數(shù)據(jù)集中的連續(xù)值屬性,使用Kohonen特征映射算法和三角隸屬度函數(shù)完成數(shù)據(jù)的模糊化處理,實現(xiàn)連續(xù)值屬性的平滑劃分,更自然合理地描述數(shù)據(jù)集屬性的特征。(3)通過MATLAB實現(xiàn)模糊ID3算法和最小分類不確定性算法,并結(jié)合已有的C4.5和CART算法,在公開可用醫(yī)學(xué)數(shù)據(jù)集上構(gòu)建相應(yīng)的分類模型。比較四種決策樹算法生成模型的分類準確率以及規(guī)則數(shù)量的不同。模糊ID3算法在四組醫(yī)學(xué)數(shù)據(jù)集上都獲得了較高的分類準確率,且生成的規(guī)則數(shù)量適中,體現(xiàn)出模糊決策樹算法在處理醫(yī)學(xué)數(shù)據(jù)連續(xù)值屬性上的優(yōu)勢且能對數(shù)據(jù)中存在的模糊性進行處理。(4)針對模糊決策樹算法中的關(guān)鍵參數(shù)通常是依據(jù)經(jīng)驗設(shè)定的問題,本文提出使用改進粒子群算法對參數(shù)組合進行智能尋優(yōu)從而改善模糊決策樹性能。適應(yīng)度函數(shù)綜合考慮訓(xùn)練準確率、測試準確率、概括能力以及生成樹的規(guī)模。使用優(yōu)化的模糊決策樹算法在公開可用醫(yī)學(xué)數(shù)據(jù)集上構(gòu)建分類模型,證明應(yīng)用該方法進行醫(yī)學(xué)數(shù)據(jù)分類的必要性與有效性。該方法既能夠產(chǎn)生較為準確的預(yù)測結(jié)果,還能夠以決策樹的形式提供預(yù)測的理由。
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:R-05
【部分圖文】:

思路,決策樹,模糊決策樹,醫(yī)學(xué)數(shù)據(jù)


并在分類準確率方面與其他文獻中提出的分類方法進行比較,說明本文方法的??可行性和有效性??本文的研究思路如圖1-2所示。??I基于模糊決策樹的醫(yī)學(xué)數(shù)據(jù)分類研宄1?/......…………-,?,??、?J?研究問題、??'…—.............^???——乂??m?t、?〈〔相關(guān)理論?>??改進的^?^模糊??L子群算法?理論J??IT??f?^?N??模糊決策樹研究與兩種算法實現(xiàn)???\???^?v>??模糊決策樹在醫(yī)學(xué)數(shù)據(jù)?^??分類中的應(yīng)用效果??f ̄ ̄ ̄ ̄* ̄:?*\??結(jié)合&進的粒子群算^?.??提出基于模糊決策樹的混合模型|?y.-,,,,,,方法優(yōu)化>???\?[???實現(xiàn)改進粒子群算法??與模糊決策樹的集成???zzzzzzzzzr??f混合模型在醫(yī)¥數(shù)據(jù)分類中的效果評估^>??V?應(yīng)用‘%果驗證?)?\?1、.雙采1■卜1f

醫(yī)學(xué)數(shù)據(jù),分類過程


醫(yī)學(xué)非圖像數(shù)據(jù)進行研宄,通過數(shù)據(jù)分類技術(shù)發(fā)現(xiàn)醫(yī)學(xué)數(shù)據(jù)中相關(guān)疾病指標與患??病情況之間對應(yīng)的知識,從而為醫(yī)療診斷提供支持。??醫(yī)學(xué)數(shù)據(jù)分類的一般過程如圖2-1所示:首先對醫(yī)學(xué)數(shù)據(jù)進行預(yù)處理,通過數(shù)??據(jù)降維提取關(guān)鍵特征,再按照一定的比例將處理好的醫(yī)學(xué)數(shù)據(jù)集分為兩部分:訓(xùn)練??數(shù)據(jù)集和測試數(shù)據(jù)集。接下來分類器對訓(xùn)練數(shù)據(jù)集的己知類別信息進行學(xué)習(xí),學(xué)習(xí)??不同類別標記數(shù)據(jù)的不同特征和分類依據(jù)的模式。學(xué)習(xí)完成后,使用訓(xùn)練好的分類??器對測試數(shù)據(jù)集中的醫(yī)學(xué)數(shù)據(jù)進行分類,從而可以得到分類準確率等指標,通過指??標對分類方法進行評估。??p?訓(xùn)練數(shù)據(jù)集一?訓(xùn)練分類模型?<—類標簽信息??醫(yī)學(xué)數(shù)據(jù)集-?數(shù)據(jù)預(yù)處理數(shù)據(jù)降維——?????????????????-?測試數(shù)據(jù)集一?測試分類模型??圖2-1醫(yī)學(xué)數(shù)據(jù)分類過程??Fig.?2-1?Flowchart?of?medical?data?classification??11??

決策樹歸納,剪枝技術(shù),過度擬合,復(fù)雜結(jié)構(gòu)


它通常會被分成兩部分,一部分用來進行決策樹的構(gòu)建,稱為訓(xùn)練數(shù)據(jù)集,??另一部分用來驗證構(gòu)建的決策樹的性能,稱為測試數(shù)據(jù)集。決策樹歸納沒有參數(shù)假??設(shè),它通過逐漸選擇分割屬性來進行樹的擴展完成決策樹的構(gòu)建,流程如圖2-2所??示。在構(gòu)建過程中有兩個關(guān)鍵問題,一個是分割屬性選擇的標準,即選擇哪個屬性??去劃分樣例集,常用的屬性選擇標準有信息增益[35]、信息增益率[37]、Gini指數(shù)[38]??等;另一個是確定生成葉結(jié)點的條件,通常采用一定的算法對樹進行剪枝。??現(xiàn)實世界的數(shù)據(jù)一般不可能是完美的,可能會有數(shù)據(jù)不準確、含有噪聲或訓(xùn)練??樣本過少等情況。此時在基本的決策樹構(gòu)造過程中,有可能會出現(xiàn)過度擬合的問題,??即分類模型可以與訓(xùn)練數(shù)據(jù)較好的擬合但對測試數(shù)據(jù)的分類預(yù)測性能較低。??另外,如果不對決策樹的規(guī)模進行控制,而生成的決策樹復(fù)雜程度又很高時,??模型的可讀性就差,不容易被理解和接受。同時考慮到存儲決策樹所消耗的成本,??決策樹的規(guī)模也是越小越好。因此
【參考文獻】

相關(guān)期刊論文 前3條

1 祝曉燕;張金會;付士鵬;朱霄珣;;基于改進PSO的SVM參數(shù)優(yōu)化及其在風(fēng)速預(yù)測中的應(yīng)用[J];中國電力;2013年11期

2 孫娟;王熙照;;規(guī)則簡化與模糊決策樹剪枝的比較[J];計算機工程;2006年12期

3 王熙照;謝凱;;基于聚類的數(shù)據(jù)預(yù)處理對模糊決策樹產(chǎn)生的影響[J];計算機工程與應(yīng)用;2006年01期


相關(guān)博士學(xué)位論文 前2條

1 馮興華;基于公理模糊集的模糊決策樹算法研究[D];大連理工大學(xué);2013年

2 郭晉;神經(jīng)網(wǎng)絡(luò)模型在預(yù)測急性心肌梗死中的應(yīng)用及模型預(yù)測能力的比較研究[D];北京協(xié)和醫(yī)學(xué)院;2013年


相關(guān)碩士學(xué)位論文 前10條

1 魏存超;基于卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像分類的研究[D];哈爾濱工業(yè)大學(xué);2017年

2 胡凌;支持向量機在糖尿病數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年

3 翁勇強;支持向量機在醫(yī)學(xué)數(shù)據(jù)中的應(yīng)用研究[D];北京郵電大學(xué);2017年

4 鄔楊;基于機器學(xué)習(xí)的卵巢腫瘤預(yù)測與分析研究[D];吉林大學(xué);2016年

5 田曉春;SVM在醫(yī)學(xué)數(shù)據(jù)分類中的建模研究[D];太原理工大學(xué);2015年

6 高麗君;面向缺失數(shù)據(jù)的變精度粗糙集決策樹分類算法研究[D];大連海事大學(xué);2013年

7 黃雯;數(shù)據(jù)挖掘算法及其應(yīng)用研究[D];南京郵電大學(xué);2013年

8 黎鑫;關(guān)于生物醫(yī)學(xué)數(shù)據(jù)的聚類與分類算法研究及應(yīng)用[D];武漢科技大學(xué);2012年

9 林玲玲;基于C4.5算法的高血壓分類規(guī)則提取的研究[D];太原理工大學(xué);2012年

10 張云;支持向量機在醫(yī)學(xué)數(shù)據(jù)分析中的應(yīng)用[D];大連理工大學(xué);2008年



本文編號:2870409

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2870409.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4206a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com