基于屬性離散化的貝葉斯分類算法及其應用研究
發(fā)布時間:2021-07-07 21:10
樸素貝葉斯分類算法由于其簡單且高效的優(yōu)點成為數(shù)據(jù)挖掘十大經(jīng)典算法之一,但是該算法在進行分類時假定屬性間是彼此獨立的。不過,在現(xiàn)實應用當中這類假設通常無法成立。在本文中,通過對數(shù)據(jù)預處理和減弱樸素貝葉斯算法的條件獨立性假設來提高算法的分類準確率。主要研究工作如下:離散化技術是經(jīng)常被用到數(shù)據(jù)預處理當中的技術。已知的數(shù)據(jù)離散化方法通常在處理不平衡數(shù)據(jù)集時表現(xiàn)不是非常理想。本文提出了一種新的離散化算法ICAIM算法,通過結合三個不同離散化標準的優(yōu)點來改善CAIM算法的性能。ICAIM算法提高了離散區(qū)間的質量,使離散化后的數(shù)據(jù)集的分類性能更好,尤其是不平衡數(shù)據(jù)集。同時,ICAIM算法的運行時間較CAIM算法有明顯提高。隱樸素貝葉斯分類算法忽視了數(shù)據(jù)集中冗余或者無關屬性對分類結果造成的不利影響,本文針對這一缺陷,提出了采用CFS算法對屬性實施選取操作,選出一組最優(yōu)的屬性子集合。在減弱樸素貝葉斯算法的條件獨立性假設的眾多方法之中,屬性權重法早已引起了研究者的重視。為進一步減弱條件獨立性假設引發(fā)的不利影響,本文將根據(jù)各屬性對分類結果的影響程度,為不同的屬性賦予相應的權重。本文提出的權重獲取方法不僅考慮了屬性與屬性間的依賴關系,而且考慮了屬性與類屬性間的依賴關系,使每個屬性獲取到的權重更加合理。現(xiàn)有的屬性加權方法僅將學習到的屬性權重納入樸素貝葉斯分類公式中,而不將權重納入其條件概率估計中,本文使用一種被稱之為深度屬性加權的方法,能夠提高樸素貝葉斯模型的質量。最后把本文所提出的ICAIM和SW-HNB算法應用到冠心病中醫(yī)輔助診療系統(tǒng)當中。首先通過ICAIM算法對冠心病臨床數(shù)據(jù)進行離散化處理,然后再用SW-HNB算法對患者的病癥分類。實驗證明該系統(tǒng)可以有效地起到輔助診療的效果。
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP18
本文編號:1420675
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP18
文章目錄
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.2 國內外研究現(xiàn)狀
1.2.1 離散化算法研究現(xiàn)狀
1.2.2 樸素貝葉斯分類方法研究現(xiàn)狀
1.3 本文主要工作及組織結構
第2章 相關背景知識
2.1 數(shù)據(jù)挖掘理論概述
2.1.1 數(shù)據(jù)挖掘任務
2.1.2 數(shù)據(jù)挖掘方法
2.1.3 數(shù)據(jù)挖掘流程
2.2 數(shù)據(jù)離散化
2.2.1 離散化概念
2.2.2 離散化評價標準
2.3 貝葉斯分類方法
2.3.1 貝葉斯分類相關理論
2.3.2 常用貝葉斯分類算法
2.4 本章小結
第3章 基于類別屬性關聯(lián)程度的數(shù)據(jù)離散化方法
3.1 CAIM離散算法
3.1.1 相關概念
3.1.2 算法描述
3.2 基于CAIM離散算法的改進
3.2.1 CAIR標準
3.2.2 CAIU標準
3.2.3 ICAIM算法
3.3 實驗與分析
3.4 本章小結
第4章 基于屬性加權的選擇性隱樸素貝葉斯分類算法
4.1 隱樸素貝葉斯分類算法
4.2 基于屬性選擇的HNB分類算法
4.3 基于屬性加權的HNB分類算法
4.3.1 信息增益率
4.3.2 屬性相關性度量
4.3.3 屬性加權HNB模型
4.4 基于屬性加權的選擇性HNB分類算法
4.5 實驗與分析
4.6 本章小結
第5章 數(shù)據(jù)離散化與貝葉斯改進算法在冠心病中醫(yī)輔助診療系統(tǒng)的應用
5.1 相關介紹
5.1.1 冠心病的危害
5.1.2 智能技術在冠心病預防和診治中的應用
5.2 中醫(yī)輔助診療系統(tǒng)介紹
5.2.1 系統(tǒng)整體框架
5.2.2 系統(tǒng)的開發(fā)工具和平臺
5.2.3 各個功能模塊設計
5.3 改進算法在中醫(yī)輔助診療系統(tǒng)中的應用
5.3.1 冠心病數(shù)據(jù)
5.3.2 基于類別屬性關聯(lián)程度的數(shù)據(jù)離散化算法的應用
5.3.3 基于屬性加權的選擇性隱樸素貝葉斯分類算法的應用
5.4 實驗與分析
5.5 本章小結
第6章 總結與展望
6.1 總結
6.2 下一步研究工作
參考文獻
致謝
【參考文獻】
相關期刊論文 前9條
1 閆志虹;;中西醫(yī)結合治療冠心病的研究進展[J];中國保健營養(yǎng);2013年02期
2 田松;何茜;;冠心病現(xiàn)代文獻中醫(yī)證型與證素的特征研究[J];湖南中醫(yī)藥大學學報;2013年01期
3 彭興媛;劉瓊蓀;;不同類變量下屬性聚類的樸素貝葉斯分類算法[J];計算機應用;2011年11期
4 楊萍;楊天社;杜小寧;李濟生;黃永宣;;一種基于類別屬性關聯(lián)程度最大化離散算法[J];控制與決策;2011年04期
5 鄧維斌;王國胤;王燕;;基于Rough Set的加權樸素貝葉斯分類算法[J];計算機科學;2007年02期
6 程克非;張聰;;基于特征加權的樸素貝葉斯分類器[J];計算機仿真;2006年10期
7 謝宏,程浩忠,牛東曉;基于信息熵的粗糙集連續(xù)屬性離散化算法[J];計算機學報;2005年09期
8 馬光志,陳鳳華;基于關聯(lián)規(guī)則的ABN分類器構造[J];計算機工程與科學;2005年05期
9 石洪波,黃厚寬,王志海;基于Boosting的TAN組合分類器[J];計算機研究與發(fā)展;2004年02期
本文編號:1420675
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1420675.html
最近更新
教材專著