基于聚類集成的半監(jiān)督分類算法研究
發(fā)布時間:2020-12-13 22:32
在許多真實的大數(shù)據(jù)場景中,樣本屬性可通過傳感器方便且廉價地獲取,而其標(biāo)簽則需要專家給出,困難且昂貴。這導(dǎo)致未標(biāo)記數(shù)據(jù)多,有標(biāo)記數(shù)據(jù)少。如果只使用少量已標(biāo)記的樣本進(jìn)行學(xué)習(xí),傳統(tǒng)的有監(jiān)督學(xué)習(xí)算法訓(xùn)練得到的分類模型,往往存在欠擬合等缺點,導(dǎo)致分類精度不高。半監(jiān)督分類充分利用未標(biāo)記樣本,提升分類器精度,近年來被廣泛用于智能信息處理、圖像處理、生命科學(xué)等領(lǐng)域。該方向主要有基于差異的方法、生成式方法、判別式方法和基于圖的方法等。這些方法性能優(yōu)越,并且數(shù)學(xué)理論完備、計算速度優(yōu)越、分類精度出眾等特點。然而,它們沒有充分考慮未標(biāo)記數(shù)據(jù)分布的不確定性與復(fù)雜性,導(dǎo)致算法的穩(wěn)定性和魯棒性欠佳。集成學(xué)習(xí)可以減少半監(jiān)督分類中無標(biāo)記樣本的標(biāo)注過程的不確定性,優(yōu)化半分類決策邊界問題,提升算法的抗干擾能力和可靠性。但是,半監(jiān)督學(xué)習(xí)適用于標(biāo)記樣本缺乏的情況,而傳統(tǒng)的集成學(xué)習(xí)本身就需要大量的標(biāo)記樣本進(jìn)行訓(xùn)練,這兩者之間存在矛盾;诖,本文提出一種基于聚類集成的半監(jiān)督分類方法,一方面提升了半監(jiān)督分類的穩(wěn)定性,另一方面解決了半監(jiān)督分類與集成學(xué)習(xí)之間對標(biāo)記樣本的需求矛盾。該方法包含了以下兩個的算法:1.結(jié)合初始中心優(yōu)化和屬性加...
【文章來源】:西南石油大學(xué)四川省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1聚類算法類型及相關(guān)代表算法??
五種聚類方法在PC指標(biāo)上的比較結(jié)果
五種聚類方法在RI指標(biāo)上的比較結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]半監(jiān)督集成學(xué)習(xí)綜述[J]. 蔡毅,朱秀芳,孫章麗,陳阿嬌. 計算機(jī)科學(xué). 2017(S1)
[2]用大智慧實現(xiàn)大數(shù)據(jù)的大價值[J]. 徐宗本. 新湘評論. 2016(22)
[3]基于K-means聚類的大學(xué)教學(xué)管理利益相關(guān)者分析[J]. 胡海濤,朱建民. 湘潭大學(xué)自然科學(xué)學(xué)報. 2015(03)
[4]基于改進(jìn)遺傳模擬退火K-means的心電波形的分類研究[J]. 何云斌,張曉瑞,萬靜,李松. 計算機(jī)應(yīng)用研究. 2014(11)
[5]基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)[J]. 張華. 軟件. 2013(03)
[6]高通量轉(zhuǎn)錄組測序的數(shù)據(jù)分析與基因發(fā)掘[J]. 周華,張新,劉騰云,余發(fā)新. 江西科學(xué). 2012(05)
[7]聚類集成方法研究[J]. 楊草原,劉大有,楊博,池淑珍,金弟. 計算機(jī)科學(xué). 2011(02)
[8]半監(jiān)督學(xué)習(xí)研究進(jìn)展[J]. 梁吉業(yè),高嘉偉,常瑜. 山西大學(xué)學(xué)報(自然科學(xué)版). 2009(04)
[9]基于成對約束的判別型半監(jiān)督聚類分析[J]. 尹學(xué)松,胡思良,陳松燦. 軟件學(xué)報. 2008(11)
[10]基于近鄰傳播算法的半監(jiān)督聚類[J]. 肖宇,于劍. 軟件學(xué)報. 2008(11)
博士論文
[1]聚類集成關(guān)鍵技術(shù)研究[D]. 羅會蘭.浙江大學(xué) 2007
本文編號:2915290
【文章來源】:西南石油大學(xué)四川省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1聚類算法類型及相關(guān)代表算法??
五種聚類方法在PC指標(biāo)上的比較結(jié)果
五種聚類方法在RI指標(biāo)上的比較結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]半監(jiān)督集成學(xué)習(xí)綜述[J]. 蔡毅,朱秀芳,孫章麗,陳阿嬌. 計算機(jī)科學(xué). 2017(S1)
[2]用大智慧實現(xiàn)大數(shù)據(jù)的大價值[J]. 徐宗本. 新湘評論. 2016(22)
[3]基于K-means聚類的大學(xué)教學(xué)管理利益相關(guān)者分析[J]. 胡海濤,朱建民. 湘潭大學(xué)自然科學(xué)學(xué)報. 2015(03)
[4]基于改進(jìn)遺傳模擬退火K-means的心電波形的分類研究[J]. 何云斌,張曉瑞,萬靜,李松. 計算機(jī)應(yīng)用研究. 2014(11)
[5]基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)旅游線路推薦系統(tǒng)[J]. 張華. 軟件. 2013(03)
[6]高通量轉(zhuǎn)錄組測序的數(shù)據(jù)分析與基因發(fā)掘[J]. 周華,張新,劉騰云,余發(fā)新. 江西科學(xué). 2012(05)
[7]聚類集成方法研究[J]. 楊草原,劉大有,楊博,池淑珍,金弟. 計算機(jī)科學(xué). 2011(02)
[8]半監(jiān)督學(xué)習(xí)研究進(jìn)展[J]. 梁吉業(yè),高嘉偉,常瑜. 山西大學(xué)學(xué)報(自然科學(xué)版). 2009(04)
[9]基于成對約束的判別型半監(jiān)督聚類分析[J]. 尹學(xué)松,胡思良,陳松燦. 軟件學(xué)報. 2008(11)
[10]基于近鄰傳播算法的半監(jiān)督聚類[J]. 肖宇,于劍. 軟件學(xué)報. 2008(11)
博士論文
[1]聚類集成關(guān)鍵技術(shù)研究[D]. 羅會蘭.浙江大學(xué) 2007
本文編號:2915290
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2915290.html
最近更新
教材專著