基于多模型混合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的研究與改進(jìn)
本文關(guān)鍵詞:基于多模型混合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的研究與改進(jìn),,由筆耕文化傳播整理發(fā)布。
【摘要】:一直以來,分類問題是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)兩個(gè)領(lǐng)域中的所共有的重要的研究領(lǐng)域,很多學(xué)者在分類問題上投入了大量的精力,解決分類問題意義重大,因?yàn)檫@類問題在我們的工作和生活中非常熟悉;谪惾~斯網(wǎng)絡(luò)的分類方法成為解決這類問題的最好方法之一,像垃圾郵件過濾(Spam Detection)、產(chǎn)品推薦(Product Recommendation)、文本分類(Text Categorization)等分類問題,貝葉斯分類器都可以輕松應(yīng)對(duì)這類問題。貝葉斯分類器以概率論和信息論為基礎(chǔ),它能夠很好的處理缺失數(shù)據(jù),而且有很高的分類精度。貝葉斯分類器中最為學(xué)者所熟悉的就是樸素貝葉斯分類器,結(jié)構(gòu)簡(jiǎn)單的樸素貝葉斯分類器,雖然是以忽略數(shù)據(jù)屬性之間的依賴關(guān)系的事實(shí)為假設(shè),但在一些情況下,其分類精度仍然超越其他成熟的算法,盡管如此,并且樸素貝爺斯分類器得到人們的重視,樸素貝葉斯分類器已經(jīng)應(yīng)用到很多領(lǐng)域中用以解決分類問題,而且分類效果不錯(cuò),但是隨著應(yīng)用的范圍越來越廣,這種忽略屬性間的依賴關(guān)系的分類器還是在分類效果上的表現(xiàn)不是很好,不能解決很多數(shù)據(jù)分類問題。為了彌補(bǔ)樸素貝葉斯分類器由于過多的依賴數(shù)值型屬性之間相互獨(dú)立的假設(shè)而帶來的不足問題,目前提出了很多改進(jìn)的算法,這些改進(jìn)的算法主要可以歸為三類,屬性選擇、結(jié)構(gòu)擴(kuò)展、局部學(xué)習(xí)。除了上述三種方法外,還有數(shù)據(jù)集實(shí)例加權(quán)、屬性加權(quán)、多模型組合學(xué)習(xí)等方法。其中多模型組合學(xué)習(xí)方法目前的研究成果較少,本文正是通過對(duì)一些已經(jīng)成熟的貝葉斯分類算法進(jìn)行分析、研究、整合,提出一個(gè)全新的分類算法。本文提出了一種改進(jìn)的貝葉斯網(wǎng)絡(luò)分類器,稱為“隱藏-平均一依賴分類器”,簡(jiǎn)稱H-AODE。H-AODE算法是基于AODE和HNB兩種分類器,它首先為每個(gè)屬性結(jié)點(diǎn)都學(xué)習(xí)一個(gè)樹擴(kuò)展的樸素貝葉斯分類器,然后構(gòu)造一個(gè)虛擬的結(jié)點(diǎn),這個(gè)結(jié)點(diǎn)綜合了所有其他屬性對(duì)于該屬性節(jié)點(diǎn)的影響,最后對(duì)這些樹擴(kuò)展的樸素貝葉斯分類器進(jìn)行平均。為了驗(yàn)證H-AODE算法分類效果,對(duì)算法進(jìn)行了大量的實(shí)驗(yàn),采用了UCI數(shù)據(jù)庫(kù)中40多個(gè)有代表性的數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),同時(shí)也對(duì)AODE、HNB、KDB、TAN、NB等成熟的分類算法進(jìn)行實(shí)驗(yàn),最后進(jìn)行了實(shí)驗(yàn)結(jié)果的對(duì)比分析。
【關(guān)鍵詞】:貝葉斯網(wǎng)絡(luò) 組合學(xué)習(xí) 樸素貝葉斯 條件獨(dú)立
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP18
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-14
- 1.1 貝葉斯網(wǎng)絡(luò)研究的背景與意義9-10
- 1.2 貝葉斯網(wǎng)絡(luò)的研究現(xiàn)狀10-12
- 1.3 本課題的主要工作12
- 1.4 本文的組織結(jié)構(gòu)12-14
- 第2章 相關(guān)理論知識(shí)介紹14-30
- 2.1 貝葉斯網(wǎng)絡(luò)基本模型14-15
- 2.2 貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)15-20
- 2.2.1 結(jié)構(gòu)學(xué)習(xí)16-19
- 2.2.2 參數(shù)學(xué)習(xí)19-20
- 2.3 信息論相關(guān)知識(shí)20-21
- 2.4 限制性貝葉斯網(wǎng)絡(luò)模型介紹21-28
- 2.4.1 樸素貝葉斯分類模型22-23
- 2.4.2 樹擴(kuò)展樸素貝葉斯模型23-25
- 2.4.3 k階依賴貝葉斯模型25-27
- 2.4.4 平均一依賴估計(jì)分類算法27-28
- 2.5 多模型合并相關(guān)知識(shí)28-29
- 2.6 本章小結(jié)29-30
- 第3章 基于多模型混合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)30-40
- 3.1 隱藏樸素貝葉斯分類算法30-32
- 3.2 算法分析32-33
- 3.3 H-AODE算法33-36
- 3.3.1 H-AODE算法思想33
- 3.3.2 H-AODE算法描述33-34
- 3.3.3 H-AODE算法主要步驟34-35
- 3.3.4 后驗(yàn)概率計(jì)算35-36
- 3.4 WH-AODE模型36-39
- 3.4.1 基于屬性變量和類變量互信息的改進(jìn)36-37
- 3.4.2 基于屬性變量間互信息的改進(jìn)37-39
- 3.5 本章小結(jié)39-40
- 第4章 基于UCI數(shù)據(jù)集的實(shí)驗(yàn)與結(jié)果分析40-54
- 4.1 實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)方法40-45
- 4.1.1 實(shí)驗(yàn)數(shù)據(jù)集描述與處理40-42
- 4.1.2 0-1 Loss簡(jiǎn)介42-43
- 4.1.3 Bias/Variance簡(jiǎn)介43-45
- 4.1.4 實(shí)驗(yàn)方法45
- 4.2 實(shí)驗(yàn)結(jié)果分析45-52
- 4.2.1 0-1 loss 分析45-49
- 4.2.2 Bias/Variance 分析49-51
- 4.2.3 基于不同規(guī)模的數(shù)據(jù)集分析51-52
- 4.3 實(shí)驗(yàn)總結(jié)52-53
- 4.4 本章小結(jié)53-54
- 第5章 總結(jié)與展望54-56
- 5.1 課題總結(jié)54
- 5.2 工作展望54-56
- 參考文獻(xiàn)56-60
- 作者簡(jiǎn)介及在學(xué)期間所取得的科研成果60-61
- 致謝61
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 孫林;徐久成;馬媛媛;;基于新的條件熵的決策樹規(guī)則提取方法[J];計(jì)算機(jī)應(yīng)用;2007年04期
2 吳振強(qiáng);馬建峰;;基于聯(lián)合熵的多屬性匿名度量模型[J];計(jì)算機(jī)研究與發(fā)展;2006年07期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 朱明敏;貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)與推理研究[D];西安電子科技大學(xué);2013年
2 蔣良孝;樸素貝葉斯分類器及其改進(jìn)算法研究[D];中國(guó)地質(zhì)大學(xué);2009年
3 董立巖;貝葉斯網(wǎng)絡(luò)應(yīng)用基礎(chǔ)研究[D];吉林大學(xué);2007年
4 黃友平;貝葉斯網(wǎng)絡(luò)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
5 宮秀軍;貝葉斯學(xué)習(xí)理論及其應(yīng)用研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前7條
1 寧越;基于信息論的自篩選貝葉斯分類模型的研究與設(shè)計(jì)[D];吉林大學(xué);2015年
2 魏會(huì)建;基于屬性約簡(jiǎn)和屬性加權(quán)的樸素貝葉斯分類算法的研究[D];吉林大學(xué);2014年
3 閆淵;基于信息論和函數(shù)依賴的半監(jiān)督學(xué)習(xí)[D];吉林大學(xué);2013年
4 胡良東;共識(shí)貝葉斯網(wǎng)絡(luò)研究及應(yīng)用[D];吉林大學(xué);2013年
5 王國(guó)才;樸素貝葉斯分類器的研究與應(yīng)用[D];重慶交通大學(xué);2010年
6 李艷美;基于貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)挖掘應(yīng)用研究[D];西安電子科技大學(xué);2008年
7 胡春玲;貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)算法研究[D];合肥工業(yè)大學(xué);2006年
本文關(guān)鍵詞:基于多模型混合的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)的研究與改進(jìn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):357471
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/357471.html