基于多模型混合的貝葉斯網絡結構的研究與改進
本文關鍵詞:基于多模型混合的貝葉斯網絡結構的研究與改進,,由筆耕文化傳播整理發(fā)布。
【摘要】:一直以來,分類問題是數據挖掘和機器學習兩個領域中的所共有的重要的研究領域,很多學者在分類問題上投入了大量的精力,解決分類問題意義重大,因為這類問題在我們的工作和生活中非常熟悉;谪惾~斯網絡的分類方法成為解決這類問題的最好方法之一,像垃圾郵件過濾(Spam Detection)、產品推薦(Product Recommendation)、文本分類(Text Categorization)等分類問題,貝葉斯分類器都可以輕松應對這類問題。貝葉斯分類器以概率論和信息論為基礎,它能夠很好的處理缺失數據,而且有很高的分類精度。貝葉斯分類器中最為學者所熟悉的就是樸素貝葉斯分類器,結構簡單的樸素貝葉斯分類器,雖然是以忽略數據屬性之間的依賴關系的事實為假設,但在一些情況下,其分類精度仍然超越其他成熟的算法,盡管如此,并且樸素貝爺斯分類器得到人們的重視,樸素貝葉斯分類器已經應用到很多領域中用以解決分類問題,而且分類效果不錯,但是隨著應用的范圍越來越廣,這種忽略屬性間的依賴關系的分類器還是在分類效果上的表現不是很好,不能解決很多數據分類問題。為了彌補樸素貝葉斯分類器由于過多的依賴數值型屬性之間相互獨立的假設而帶來的不足問題,目前提出了很多改進的算法,這些改進的算法主要可以歸為三類,屬性選擇、結構擴展、局部學習。除了上述三種方法外,還有數據集實例加權、屬性加權、多模型組合學習等方法。其中多模型組合學習方法目前的研究成果較少,本文正是通過對一些已經成熟的貝葉斯分類算法進行分析、研究、整合,提出一個全新的分類算法。本文提出了一種改進的貝葉斯網絡分類器,稱為“隱藏-平均一依賴分類器”,簡稱H-AODE。H-AODE算法是基于AODE和HNB兩種分類器,它首先為每個屬性結點都學習一個樹擴展的樸素貝葉斯分類器,然后構造一個虛擬的結點,這個結點綜合了所有其他屬性對于該屬性節(jié)點的影響,最后對這些樹擴展的樸素貝葉斯分類器進行平均。為了驗證H-AODE算法分類效果,對算法進行了大量的實驗,采用了UCI數據庫中40多個有代表性的數據集進行了實驗,同時也對AODE、HNB、KDB、TAN、NB等成熟的分類算法進行實驗,最后進行了實驗結果的對比分析。
【關鍵詞】:貝葉斯網絡 組合學習 樸素貝葉斯 條件獨立
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP18
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-14
- 1.1 貝葉斯網絡研究的背景與意義9-10
- 1.2 貝葉斯網絡的研究現狀10-12
- 1.3 本課題的主要工作12
- 1.4 本文的組織結構12-14
- 第2章 相關理論知識介紹14-30
- 2.1 貝葉斯網絡基本模型14-15
- 2.2 貝葉斯網絡的學習15-20
- 2.2.1 結構學習16-19
- 2.2.2 參數學習19-20
- 2.3 信息論相關知識20-21
- 2.4 限制性貝葉斯網絡模型介紹21-28
- 2.4.1 樸素貝葉斯分類模型22-23
- 2.4.2 樹擴展樸素貝葉斯模型23-25
- 2.4.3 k階依賴貝葉斯模型25-27
- 2.4.4 平均一依賴估計分類算法27-28
- 2.5 多模型合并相關知識28-29
- 2.6 本章小結29-30
- 第3章 基于多模型混合的貝葉斯網絡結構30-40
- 3.1 隱藏樸素貝葉斯分類算法30-32
- 3.2 算法分析32-33
- 3.3 H-AODE算法33-36
- 3.3.1 H-AODE算法思想33
- 3.3.2 H-AODE算法描述33-34
- 3.3.3 H-AODE算法主要步驟34-35
- 3.3.4 后驗概率計算35-36
- 3.4 WH-AODE模型36-39
- 3.4.1 基于屬性變量和類變量互信息的改進36-37
- 3.4.2 基于屬性變量間互信息的改進37-39
- 3.5 本章小結39-40
- 第4章 基于UCI數據集的實驗與結果分析40-54
- 4.1 實驗數據與實驗方法40-45
- 4.1.1 實驗數據集描述與處理40-42
- 4.1.2 0-1 Loss簡介42-43
- 4.1.3 Bias/Variance簡介43-45
- 4.1.4 實驗方法45
- 4.2 實驗結果分析45-52
- 4.2.1 0-1 loss 分析45-49
- 4.2.2 Bias/Variance 分析49-51
- 4.2.3 基于不同規(guī)模的數據集分析51-52
- 4.3 實驗總結52-53
- 4.4 本章小結53-54
- 第5章 總結與展望54-56
- 5.1 課題總結54
- 5.2 工作展望54-56
- 參考文獻56-60
- 作者簡介及在學期間所取得的科研成果60-61
- 致謝61
【參考文獻】
中國期刊全文數據庫 前2條
1 孫林;徐久成;馬媛媛;;基于新的條件熵的決策樹規(guī)則提取方法[J];計算機應用;2007年04期
2 吳振強;馬建峰;;基于聯合熵的多屬性匿名度量模型[J];計算機研究與發(fā)展;2006年07期
中國博士學位論文全文數據庫 前5條
1 朱明敏;貝葉斯網絡結構學習與推理研究[D];西安電子科技大學;2013年
2 蔣良孝;樸素貝葉斯分類器及其改進算法研究[D];中國地質大學;2009年
3 董立巖;貝葉斯網絡應用基礎研究[D];吉林大學;2007年
4 黃友平;貝葉斯網絡研究[D];中國科學院研究生院(計算技術研究所);2005年
5 宮秀軍;貝葉斯學習理論及其應用研究[D];中國科學院研究生院(計算技術研究所);2002年
中國碩士學位論文全文數據庫 前7條
1 寧越;基于信息論的自篩選貝葉斯分類模型的研究與設計[D];吉林大學;2015年
2 魏會建;基于屬性約簡和屬性加權的樸素貝葉斯分類算法的研究[D];吉林大學;2014年
3 閆淵;基于信息論和函數依賴的半監(jiān)督學習[D];吉林大學;2013年
4 胡良東;共識貝葉斯網絡研究及應用[D];吉林大學;2013年
5 王國才;樸素貝葉斯分類器的研究與應用[D];重慶交通大學;2010年
6 李艷美;基于貝葉斯網絡的數據挖掘應用研究[D];西安電子科技大學;2008年
7 胡春玲;貝葉斯網絡的結構學習算法研究[D];合肥工業(yè)大學;2006年
本文關鍵詞:基于多模型混合的貝葉斯網絡結構的研究與改進,由筆耕文化傳播整理發(fā)布。
本文編號:357471
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/357471.html