結(jié)合稀疏貝葉斯學(xué)習(xí)和混合高斯的主動(dòng)學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-08-30 21:55
在現(xiàn)實(shí)生活中,人們可以很容易地獲取大量的數(shù)據(jù),但是通常其中大部分?jǐn)?shù)據(jù)是沒有樣本標(biāo)簽的。傳統(tǒng)的監(jiān)督學(xué)習(xí)算法僅使用少部分有標(biāo)簽的數(shù)據(jù)進(jìn)行訓(xùn)練,由于訓(xùn)練樣本規(guī)模小,信息不完備,很難達(dá)到較好的預(yù)測(cè)效果。如果對(duì)沒有樣本標(biāo)簽的樣本進(jìn)行人工標(biāo)注,又需要消耗大量的時(shí)間和精力,甚至在有些情況下根本無(wú)法完成對(duì)大量樣本的標(biāo)注。針對(duì)這個(gè)現(xiàn)實(shí)問題,傳統(tǒng)的監(jiān)督學(xué)習(xí)算法無(wú)法提出一個(gè)準(zhǔn)確、高效的解決方案,主動(dòng)學(xué)習(xí)算法卻可以解決這個(gè)問題。利用主動(dòng)學(xué)習(xí)的專家標(biāo)注機(jī)制可以不斷選擇信息量大的樣本進(jìn)行標(biāo)注擴(kuò)充樣本集,最終獲得較優(yōu)的預(yù)測(cè)模型。相關(guān)向量機(jī)是一種典型的稀疏貝葉斯學(xué)習(xí)模型,其具有很強(qiáng)的稀疏性,提供更靈活的核函數(shù)選擇以及概率化的輸出,并且也有著不亞于其他機(jī)器學(xué)習(xí)方法的預(yù)測(cè)性能。因此,本文主要結(jié)合相關(guān)向量機(jī)進(jìn)行主動(dòng)學(xué)習(xí)算法的研究,使用混合高斯探索樣本的分布特征,基于馬氏距離構(gòu)造結(jié)合樣本分布特性的混合高斯核函數(shù),改進(jìn)經(jīng)典的相關(guān)向量機(jī)模型,提出基于混合高斯核的直推式相關(guān)向量機(jī)算法,并將其應(yīng)用到主動(dòng)學(xué)習(xí)框架中,定義一種新的主動(dòng)學(xué)習(xí)算法。本文的主要研究工作如下:(1)為了在學(xué)習(xí)過程中充分考慮樣本的分布特性,利用混合高斯探索樣本的分...
【文章來(lái)源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
歐氏距離和馬氏距離對(duì)比圖
圖 2.2 不同核函數(shù)的 KTA 值對(duì)比綜上所述,混合高斯核函數(shù)考慮了樣本的分布特性,將樣本看作是一系列分布的疊加,基于馬氏距離分析了樣本關(guān)于各個(gè)高斯分布的聯(lián)系,能很好地?cái)?shù)據(jù)樣本的特征,并將這些特性通過核函數(shù)的映射帶入到高維特征空間中了核向量與目標(biāo)向量之間的相似度,因此,混合高斯核具有較強(qiáng)的抓取樣本的能力,利用核排列方法評(píng)估出混合高斯核函數(shù)具有較強(qiáng)的性能。實(shí)驗(yàn)與分析仿真數(shù)據(jù)集為了進(jìn)一步地驗(yàn)證混合高斯核函數(shù)的有效性,使用仿真數(shù)據(jù)集 TwoMoon實(shí)驗(yàn),將混合高斯核函數(shù)應(yīng)用到 RVM 算法中,和高斯核函數(shù)進(jìn)行對(duì)比,使法的評(píng)價(jià)標(biāo)準(zhǔn)(準(zhǔn)確率)對(duì)比兩種核函數(shù)的性能。為了在不同的數(shù)據(jù)場(chǎng)景下充分驗(yàn)證使用混合高斯核函數(shù)的 RVM 算法的
用高斯核和混合高斯核進(jìn)行 RVM 算法的訓(xùn)練,根據(jù)得到的 RVM 模型對(duì)整個(gè)數(shù)據(jù)集進(jìn)行預(yù)測(cè),比較預(yù)測(cè)結(jié)果的準(zhǔn)確性。實(shí)驗(yàn)一的結(jié)果如圖 2.3 所示,其中圖(a)顯示使用高斯核函數(shù)的預(yù)測(cè)結(jié)果,圖(b)顯示使用混合高斯核函數(shù)的預(yù)測(cè)結(jié)果。圖中虛線代表預(yù)測(cè)模型的決策邊界,黑色大圓圈表示相關(guān)向量。從圖中可以看出,使用高斯核函數(shù)得到的預(yù)測(cè)結(jié)果準(zhǔn)確率為 96.29%,使用混合高斯核函數(shù)得到的預(yù)測(cè)結(jié)果準(zhǔn)確率為 96.89%,略高于高斯核函數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于遺傳規(guī)劃和主動(dòng)學(xué)習(xí)的本體實(shí)例匹配[J]. 孫煜飛,馬良荔,解嘉宇. 計(jì)算機(jī)應(yīng)用研究. 2018(05)
[2]基于雙層采樣主動(dòng)學(xué)習(xí)的社交網(wǎng)絡(luò)虛假用戶檢測(cè)方法[J]. 譚侃,高旻,李文濤,田仁麗,文俊浩,熊慶宇. 自動(dòng)化學(xué)報(bào). 2017(03)
[3]動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)分類器主動(dòng)學(xué)習(xí)算法及其智能控制應(yīng)用[J]. 任紅格,李冬梅,李福進(jìn). 計(jì)算機(jī)應(yīng)用與軟件. 2016(07)
[4]一種基于主動(dòng)學(xué)習(xí)的惡意代碼檢測(cè)方法[J]. 毛蔚軒,蔡忠閩,童力. 軟件學(xué)報(bào). 2017(02)
[5]基于高斯過程模型的異常檢測(cè)算法[J]. 于冰潔,夏戰(zhàn)國(guó),王久龍. 計(jì)算機(jī)工程與設(shè)計(jì). 2016(04)
[6]基于相關(guān)系數(shù)的決策樹優(yōu)化算法[J]. 董躍華,劉力. 計(jì)算機(jī)工程與科學(xué). 2015(09)
[7]主動(dòng)特征學(xué)習(xí)及其在盲圖像質(zhì)量評(píng)價(jià)中的應(yīng)用[J]. 高飛,高新波. 計(jì)算機(jī)學(xué)報(bào). 2014(10)
[8]基于特征子集區(qū)分度與支持向量機(jī)的特征選擇算法[J]. 謝娟英,謝維信. 計(jì)算機(jī)學(xué)報(bào). 2014(08)
[9]一種新的基于SVM和主動(dòng)學(xué)習(xí)的圖像檢索方法[J]. 彭晏飛,尚永剛,王德建. 計(jì)算機(jī)工程與科學(xué). 2014(07)
[10]基于SVM主動(dòng)學(xué)習(xí)技術(shù)的PU文本分類[J]. 富震. 計(jì)算技術(shù)與自動(dòng)化. 2014(01)
博士論文
[1]快速塊稀疏貝葉斯學(xué)習(xí)算法的理論與應(yīng)用[D]. 劉本源.國(guó)防科學(xué)技術(shù)大學(xué) 2015
[2]相關(guān)向量機(jī)多分類算法的研究與應(yīng)用[D]. 柳長(zhǎng)源.哈爾濱工程大學(xué) 2013
[3]結(jié)合主動(dòng)學(xué)習(xí)的視覺場(chǎng)景理解[D]. 姚拓中.浙江大學(xué) 2011
碩士論文
[1]基于主動(dòng)學(xué)習(xí)的微博情感分析方法研究[D]. 關(guān)雅夫.吉林大學(xué) 2017
本文編號(hào):3373569
【文章來(lái)源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
歐氏距離和馬氏距離對(duì)比圖
圖 2.2 不同核函數(shù)的 KTA 值對(duì)比綜上所述,混合高斯核函數(shù)考慮了樣本的分布特性,將樣本看作是一系列分布的疊加,基于馬氏距離分析了樣本關(guān)于各個(gè)高斯分布的聯(lián)系,能很好地?cái)?shù)據(jù)樣本的特征,并將這些特性通過核函數(shù)的映射帶入到高維特征空間中了核向量與目標(biāo)向量之間的相似度,因此,混合高斯核具有較強(qiáng)的抓取樣本的能力,利用核排列方法評(píng)估出混合高斯核函數(shù)具有較強(qiáng)的性能。實(shí)驗(yàn)與分析仿真數(shù)據(jù)集為了進(jìn)一步地驗(yàn)證混合高斯核函數(shù)的有效性,使用仿真數(shù)據(jù)集 TwoMoon實(shí)驗(yàn),將混合高斯核函數(shù)應(yīng)用到 RVM 算法中,和高斯核函數(shù)進(jìn)行對(duì)比,使法的評(píng)價(jià)標(biāo)準(zhǔn)(準(zhǔn)確率)對(duì)比兩種核函數(shù)的性能。為了在不同的數(shù)據(jù)場(chǎng)景下充分驗(yàn)證使用混合高斯核函數(shù)的 RVM 算法的
用高斯核和混合高斯核進(jìn)行 RVM 算法的訓(xùn)練,根據(jù)得到的 RVM 模型對(duì)整個(gè)數(shù)據(jù)集進(jìn)行預(yù)測(cè),比較預(yù)測(cè)結(jié)果的準(zhǔn)確性。實(shí)驗(yàn)一的結(jié)果如圖 2.3 所示,其中圖(a)顯示使用高斯核函數(shù)的預(yù)測(cè)結(jié)果,圖(b)顯示使用混合高斯核函數(shù)的預(yù)測(cè)結(jié)果。圖中虛線代表預(yù)測(cè)模型的決策邊界,黑色大圓圈表示相關(guān)向量。從圖中可以看出,使用高斯核函數(shù)得到的預(yù)測(cè)結(jié)果準(zhǔn)確率為 96.29%,使用混合高斯核函數(shù)得到的預(yù)測(cè)結(jié)果準(zhǔn)確率為 96.89%,略高于高斯核函數(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于遺傳規(guī)劃和主動(dòng)學(xué)習(xí)的本體實(shí)例匹配[J]. 孫煜飛,馬良荔,解嘉宇. 計(jì)算機(jī)應(yīng)用研究. 2018(05)
[2]基于雙層采樣主動(dòng)學(xué)習(xí)的社交網(wǎng)絡(luò)虛假用戶檢測(cè)方法[J]. 譚侃,高旻,李文濤,田仁麗,文俊浩,熊慶宇. 自動(dòng)化學(xué)報(bào). 2017(03)
[3]動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)分類器主動(dòng)學(xué)習(xí)算法及其智能控制應(yīng)用[J]. 任紅格,李冬梅,李福進(jìn). 計(jì)算機(jī)應(yīng)用與軟件. 2016(07)
[4]一種基于主動(dòng)學(xué)習(xí)的惡意代碼檢測(cè)方法[J]. 毛蔚軒,蔡忠閩,童力. 軟件學(xué)報(bào). 2017(02)
[5]基于高斯過程模型的異常檢測(cè)算法[J]. 于冰潔,夏戰(zhàn)國(guó),王久龍. 計(jì)算機(jī)工程與設(shè)計(jì). 2016(04)
[6]基于相關(guān)系數(shù)的決策樹優(yōu)化算法[J]. 董躍華,劉力. 計(jì)算機(jī)工程與科學(xué). 2015(09)
[7]主動(dòng)特征學(xué)習(xí)及其在盲圖像質(zhì)量評(píng)價(jià)中的應(yīng)用[J]. 高飛,高新波. 計(jì)算機(jī)學(xué)報(bào). 2014(10)
[8]基于特征子集區(qū)分度與支持向量機(jī)的特征選擇算法[J]. 謝娟英,謝維信. 計(jì)算機(jī)學(xué)報(bào). 2014(08)
[9]一種新的基于SVM和主動(dòng)學(xué)習(xí)的圖像檢索方法[J]. 彭晏飛,尚永剛,王德建. 計(jì)算機(jī)工程與科學(xué). 2014(07)
[10]基于SVM主動(dòng)學(xué)習(xí)技術(shù)的PU文本分類[J]. 富震. 計(jì)算技術(shù)與自動(dòng)化. 2014(01)
博士論文
[1]快速塊稀疏貝葉斯學(xué)習(xí)算法的理論與應(yīng)用[D]. 劉本源.國(guó)防科學(xué)技術(shù)大學(xué) 2015
[2]相關(guān)向量機(jī)多分類算法的研究與應(yīng)用[D]. 柳長(zhǎng)源.哈爾濱工程大學(xué) 2013
[3]結(jié)合主動(dòng)學(xué)習(xí)的視覺場(chǎng)景理解[D]. 姚拓中.浙江大學(xué) 2011
碩士論文
[1]基于主動(dòng)學(xué)習(xí)的微博情感分析方法研究[D]. 關(guān)雅夫.吉林大學(xué) 2017
本文編號(hào):3373569
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3373569.html
最近更新
教材專著