關聯分類算法研究及其在冠心病診斷中的應用
發(fā)布時間:2022-01-08 13:11
隨著社會經濟的發(fā)展與物質條件的不斷充裕,國民生活方式愈發(fā)趨于不健康化。在社會老齡化與城市化不斷加速的背景下,以冠心病為代表的心血管疾病近年來在中國的流行趨勢明顯,已成為居民死亡的首要原因。另一方面,信息技術和物理存儲技術的不斷發(fā)展,也使得醫(yī)療診斷的手段越發(fā)多樣、過程越發(fā)復雜,由此積累了海量的醫(yī)療數據。如何有效地利用這些數據,發(fā)現其中有價值的信息,為疾病的預防與診斷提供參考,具有重要的研究意義。本文的具體研究成果如下:針對現有關聯分類算法資源消耗大、規(guī)則剪枝難、分類模型復雜的缺陷,提出了一種基于分塊挖掘和事先剪枝的關聯分類算法改進方案ACCP。根據分類屬性值的不同對分類規(guī)則前項進行分塊挖掘,并對頻繁項集挖掘過程和規(guī)則修剪過程進行了改進與優(yōu)化;赨CI數據集的實驗結果表明,此算法改進方案相比傳統CBA關聯分類算法和C4.5決策樹算法有著更好的分類性能,平均分類準確率分別提高了3.93和5.4個百分點,平均靈敏度分別提高了3.95和4.51個百分點,且在算法運行時間上明顯優(yōu)于傳統CBA算法,取得了較好的應用效果。針對傳統Relief系列算法無法過濾冗余特征的問題,提出了一種基于Relief...
【文章來源】:浙江理工大學浙江省
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 數據挖掘的研究現狀
1.2.2 關聯分類算法的研究現狀
1.2.3 特征約簡技術的研究現狀
1.2.4 數據挖掘在冠心病診療中的應用研究
1.3 主要研究內容和創(chuàng)新點
1.4 論文組織結構安排
第二章 關聯分類及特征約簡相關理論基礎
2.1 關聯分類算法論述
2.1.1 關聯分類的基本概念和定義
2.1.2 分類關聯規(guī)則生成
2.1.3 分類規(guī)則修剪
2.2 數據挖掘中的特征選擇
2.2.1 特征選擇相關理論
2.2.2 特征子集的生成
2.2.3 特征子集的評估
2.3 模型評測指標
2.4 本章小結
第三章 基于分塊挖掘和事先剪枝的關聯分類算法研究
3.1 引言
3.2 關聯分類算法改進思想
3.2.1 基于分類標識的規(guī)則挖掘
3.2.2 基于最大頻繁項集的事先剪枝
3.2.3 分類規(guī)則修剪
3.3 算法實現與實例分析
3.4 實驗結果驗證
3.4.1 實驗環(huán)境與數據準備
3.4.2 實驗結果分析
3.5 本章小結
第四章 基于Relief F算法和互信息的特征選擇算法研究
4.1 引言
4.2 基于Relief F算法的特征權重計算
4.3 基于互信息的特征子集生成和修正
4.3.1 基于類別屬性互信息的特征子集生成
4.3.2 基于特征間互信息的特征子集修正
4.4 實驗結果驗證
4.4.1 實驗數據準備與說明
4.4.2 實驗過程與結果分析
4.5 本章小結
第五章 改進后的關聯分類算法在冠心病診斷中的應用
5.1 引言
5.2 實驗環(huán)境介紹
5.3 實驗數據采集與處理
5.4 基于ACCP關聯分類算法的冠心病診斷
5.5 本章小結
第六章 總結與展望
6.1 全文工作總結
6.2 未來的工作展望
參考文獻
攻讀學位期間的研究成果
致謝
【參考文獻】:
期刊論文
[1]《中國心血管病預防指南(2017)》冠心病二級預防要點[J]. 實用心腦肺血管病雜志. 2018(01)
[2]《中國心血管病報告2017》概要[J]. 陳偉偉,高潤霖,劉力生,朱曼璐,王文,王擁軍,吳兆蘇,李惠君,顧東風,楊躍進,鄭哲,蔣立新,胡盛壽. 中國循環(huán)雜志. 2018(01)
[3]廣州市番禺區(qū)農民急性冠心病事件發(fā)病率及20年變化趨勢[J]. 鄧木蘭,李河,石美玲,何永全,廖劍勇,楊捷,江夏杏,郭成業(yè),麥勁壯,劉小清. 中華心血管病雜志. 2014 (03)
[4]數據挖掘中數據預處理關鍵技術研究[J]. 解二虎. 科技通報. 2013(12)
[5]BP神經網絡模型優(yōu)化研究[J]. 張琛. 吉林省教育學院學報. 2011(07)
[6]CBA分類算法的一種改進[J]. 禹蒲陽. 計算機應用與軟件. 2010(08)
[7]數據挖掘分類算法在冠心病臨床應用的比較[J]. 陳建新,西廣成,王偉,趙慧輝,陳靜. 北京生物醫(yī)學工程. 2008(03)
[8]特征選擇算法研究綜述[J]. 毛勇,周曉波,夏錚,尹征,孫優(yōu)賢. 模式識別與人工智能. 2007(02)
[9]改進的差別矩陣及其求核方法[J]. 楊明,孫志揮. 復旦學報(自然科學版). 2004(05)
[10]基于條件信息熵的決策表約簡[J]. 王國胤,于洪,楊大春. 計算機學報. 2002(07)
博士論文
[1]面向高維小樣本數據的分類特征選擇算法研究[D]. 張靖.合肥工業(yè)大學 2014
[2]機器學習中特征選問題研究[D]. 孫鑫.吉林大學 2013
[3]基于信息熵的特征選擇算法研究[D]. 劉華文.吉林大學 2010
[4]文本分類中特征選擇技術的研究[D]. 王博.國防科學技術大學 2009
[5]關聯規(guī)則挖掘方法的研究及應用[D]. 劉亞波.吉林大學 2005
碩士論文
[1]關聯分類算法及其在醫(yī)療數據中的應用研究[D]. 郭叔瑾.蘭州交通大學 2018
[2]基于條件信息熵的超高維分類數據特征篩選[D]. 孫超男.南京信息工程大學 2017
[3]關聯分類算法研究及其在海量慢病醫(yī)療數據挖掘中的應用[D]. 柴藝.北京郵電大學 2016
[4]基于數據挖掘的健康管理系統[D]. 崔志敏.河北科技大學 2015
[5]基于冠心病電子病歷的數據挖掘研究[D]. 李準.重慶醫(yī)科大學 2013
[6]基于關聯規(guī)則挖掘的分類算法研究[D]. 許立莎.西安科技大學 2012
[7]基于粗糙集理論屬性約簡的分類算法研究[D]. 杜艷輝.大連理工大學 2012
[8]關聯分析在冠心病診療數據中的應用研究[D]. 金軼.中南大學 2008
[9]特征選擇算法研究[D]. 蘇映雪.國防科學技術大學 2006
[10]基于關聯規(guī)則的挖掘理論研究及應用[D]. 熊瑾.南昌大學 2006
本文編號:3576619
【文章來源】:浙江理工大學浙江省
【文章頁數】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 數據挖掘的研究現狀
1.2.2 關聯分類算法的研究現狀
1.2.3 特征約簡技術的研究現狀
1.2.4 數據挖掘在冠心病診療中的應用研究
1.3 主要研究內容和創(chuàng)新點
1.4 論文組織結構安排
第二章 關聯分類及特征約簡相關理論基礎
2.1 關聯分類算法論述
2.1.1 關聯分類的基本概念和定義
2.1.2 分類關聯規(guī)則生成
2.1.3 分類規(guī)則修剪
2.2 數據挖掘中的特征選擇
2.2.1 特征選擇相關理論
2.2.2 特征子集的生成
2.2.3 特征子集的評估
2.3 模型評測指標
2.4 本章小結
第三章 基于分塊挖掘和事先剪枝的關聯分類算法研究
3.1 引言
3.2 關聯分類算法改進思想
3.2.1 基于分類標識的規(guī)則挖掘
3.2.2 基于最大頻繁項集的事先剪枝
3.2.3 分類規(guī)則修剪
3.3 算法實現與實例分析
3.4 實驗結果驗證
3.4.1 實驗環(huán)境與數據準備
3.4.2 實驗結果分析
3.5 本章小結
第四章 基于Relief F算法和互信息的特征選擇算法研究
4.1 引言
4.2 基于Relief F算法的特征權重計算
4.3 基于互信息的特征子集生成和修正
4.3.1 基于類別屬性互信息的特征子集生成
4.3.2 基于特征間互信息的特征子集修正
4.4 實驗結果驗證
4.4.1 實驗數據準備與說明
4.4.2 實驗過程與結果分析
4.5 本章小結
第五章 改進后的關聯分類算法在冠心病診斷中的應用
5.1 引言
5.2 實驗環(huán)境介紹
5.3 實驗數據采集與處理
5.4 基于ACCP關聯分類算法的冠心病診斷
5.5 本章小結
第六章 總結與展望
6.1 全文工作總結
6.2 未來的工作展望
參考文獻
攻讀學位期間的研究成果
致謝
【參考文獻】:
期刊論文
[1]《中國心血管病預防指南(2017)》冠心病二級預防要點[J]. 實用心腦肺血管病雜志. 2018(01)
[2]《中國心血管病報告2017》概要[J]. 陳偉偉,高潤霖,劉力生,朱曼璐,王文,王擁軍,吳兆蘇,李惠君,顧東風,楊躍進,鄭哲,蔣立新,胡盛壽. 中國循環(huán)雜志. 2018(01)
[3]廣州市番禺區(qū)農民急性冠心病事件發(fā)病率及20年變化趨勢[J]. 鄧木蘭,李河,石美玲,何永全,廖劍勇,楊捷,江夏杏,郭成業(yè),麥勁壯,劉小清. 中華心血管病雜志. 2014 (03)
[4]數據挖掘中數據預處理關鍵技術研究[J]. 解二虎. 科技通報. 2013(12)
[5]BP神經網絡模型優(yōu)化研究[J]. 張琛. 吉林省教育學院學報. 2011(07)
[6]CBA分類算法的一種改進[J]. 禹蒲陽. 計算機應用與軟件. 2010(08)
[7]數據挖掘分類算法在冠心病臨床應用的比較[J]. 陳建新,西廣成,王偉,趙慧輝,陳靜. 北京生物醫(yī)學工程. 2008(03)
[8]特征選擇算法研究綜述[J]. 毛勇,周曉波,夏錚,尹征,孫優(yōu)賢. 模式識別與人工智能. 2007(02)
[9]改進的差別矩陣及其求核方法[J]. 楊明,孫志揮. 復旦學報(自然科學版). 2004(05)
[10]基于條件信息熵的決策表約簡[J]. 王國胤,于洪,楊大春. 計算機學報. 2002(07)
博士論文
[1]面向高維小樣本數據的分類特征選擇算法研究[D]. 張靖.合肥工業(yè)大學 2014
[2]機器學習中特征選問題研究[D]. 孫鑫.吉林大學 2013
[3]基于信息熵的特征選擇算法研究[D]. 劉華文.吉林大學 2010
[4]文本分類中特征選擇技術的研究[D]. 王博.國防科學技術大學 2009
[5]關聯規(guī)則挖掘方法的研究及應用[D]. 劉亞波.吉林大學 2005
碩士論文
[1]關聯分類算法及其在醫(yī)療數據中的應用研究[D]. 郭叔瑾.蘭州交通大學 2018
[2]基于條件信息熵的超高維分類數據特征篩選[D]. 孫超男.南京信息工程大學 2017
[3]關聯分類算法研究及其在海量慢病醫(yī)療數據挖掘中的應用[D]. 柴藝.北京郵電大學 2016
[4]基于數據挖掘的健康管理系統[D]. 崔志敏.河北科技大學 2015
[5]基于冠心病電子病歷的數據挖掘研究[D]. 李準.重慶醫(yī)科大學 2013
[6]基于關聯規(guī)則挖掘的分類算法研究[D]. 許立莎.西安科技大學 2012
[7]基于粗糙集理論屬性約簡的分類算法研究[D]. 杜艷輝.大連理工大學 2012
[8]關聯分析在冠心病診療數據中的應用研究[D]. 金軼.中南大學 2008
[9]特征選擇算法研究[D]. 蘇映雪.國防科學技術大學 2006
[10]基于關聯規(guī)則的挖掘理論研究及應用[D]. 熊瑾.南昌大學 2006
本文編號:3576619
本文鏈接:http://sikaile.net/yixuelunwen/xxg/3576619.html
最近更新
教材專著