一種改進(jìn)的RAKEL多標(biāo)簽分類算法
本文關(guān)鍵詞:一種改進(jìn)的RAKEL多標(biāo)簽分類算法 出處:《浙江師范大學(xué)學(xué)報(bào)(自然科學(xué)版)》2016年04期 論文類型:期刊論文
更多相關(guān)文章: 多標(biāo)簽分類 RAKEL 標(biāo)簽空間 隨機(jī) 不頻繁的映射
【摘要】:RAKEL(random k-labelsets)算法是一種集成技術(shù),能有效解決多標(biāo)簽分類問題.它將原始標(biāo)簽集隨機(jī)選用一小部分標(biāo)簽子集構(gòu)成的數(shù)據(jù)集來訓(xùn)練每個(gè)分類器,但由于RAKEL算法構(gòu)造標(biāo)簽空間的隨機(jī)性,并未充分考察到樣本多個(gè)標(biāo)簽之間的相關(guān)性,從而造成分類精度不高,泛化性能受到一定影響.為此,提出了改進(jìn)的LC-RAKEL算法.首先,通過標(biāo)簽聚類將原始標(biāo)簽集劃分成標(biāo)簽簇,再從每個(gè)標(biāo)簽簇中各選擇一個(gè)標(biāo)簽構(gòu)成標(biāo)簽集,以此發(fā)現(xiàn)標(biāo)簽空間中重要且不頻繁的映射關(guān)系;然后,利用出現(xiàn)次數(shù)較少的標(biāo)簽集合組成新的訓(xùn)練數(shù)據(jù),訓(xùn)練相應(yīng)的分類器.實(shí)驗(yàn)證明,改進(jìn)的算法性能優(yōu)于其他常用多標(biāo)簽分類算法.
[Abstract]:RAKEL (random k-labelsets) algorithm is a kind of integrated technology, can effectively solve the multi label classification problem. It will be the original label set were randomly selected for a small part of the label subsets of data set to train each classifier, but due to the randomness of the RAKEL algorithm to construct the label space, and not to fully examine the correlation between samples of multiple tags thus, the classification accuracy is not high, the generalization performance will be affected. Therefore, an improved LC-RAKEL algorithm is proposed. Firstly, through the original label tag clustering set into tag clusters, then from each cluster in the choice of a tag tag tag set, in order to find the mapping between the label space is important and not frequent then, the training data set; the new use of fewer labels, training the corresponding classifier. The experimental results show that the improved algorithm has better performance than other commonly used multi label classification Algorithm.
【作者單位】: 浙江師范大學(xué)數(shù)理與信息工程學(xué)院;
【分類號】:TP181
【正文快照】: 多標(biāo)簽學(xué)習(xí)問題在現(xiàn)實(shí)世界中廣泛存在.例如,在圖像分類[1]中,一張圖片往往可以對應(yīng)多個(gè)主題,如“海灘”和“落日”.在文檔分類[2]中,一篇文檔可以屬于多個(gè)主題,如“世界杯”和“足球”.可以看出,每個(gè)樣例都與一個(gè)標(biāo)簽集合相對應(yīng).多標(biāo)簽學(xué)習(xí)主要研究當(dāng)樣本同時(shí)具有多個(gè)類別標(biāo)記
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王萍;張際平;;一種社會性標(biāo)簽聚類算法[J];計(jì)算機(jī)應(yīng)用與軟件;2010年02期
2 殷會;許建華;許花;;基于LS-SVM的多標(biāo)簽分類算法[J];南京師范大學(xué)學(xué)報(bào)(工程技術(shù)版);2010年02期
3 劉端陽;邱衛(wèi)杰;;基于平均期望間隔的多標(biāo)簽分類主動學(xué)習(xí)方法[J];計(jì)算機(jī)工程;2011年15期
4 蔣華;戚玉順;;基于球結(jié)構(gòu)支持向量機(jī)的多標(biāo)簽分類的主動學(xué)習(xí)[J];計(jì)算機(jī)應(yīng)用;2012年05期
5 張振海;李士寧;李志剛;;一種基于相關(guān)信息熵的多標(biāo)簽分類算法[J];西北工業(yè)大學(xué)學(xué)報(bào);2012年06期
6 劉端陽;邱衛(wèi)杰;;基于加權(quán)SVM主動學(xué)習(xí)的多標(biāo)簽分類[J];計(jì)算機(jī)工程;2011年08期
7 蔣華;戚玉順;;基于球結(jié)構(gòu)SVM的多標(biāo)簽分類[J];計(jì)算機(jī)工程;2013年01期
8 范海雄;劉付顯;夏璐;;基于概率LS-SVM的多標(biāo)簽非均衡樣本分類算法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年02期
9 許鈺;;基于偏側(cè)分類間隔的多標(biāo)簽SVM主動學(xué)習(xí)[J];電腦知識與技術(shù);2012年35期
10 陳小波;吳濤;高正龍;;基于粒計(jì)算的K近鄰多標(biāo)簽學(xué)習(xí)算法[J];計(jì)算機(jī)工程;2012年22期
相關(guān)博士學(xué)位論文 前2條
1 陳自潔;多標(biāo)簽分類問題的圖結(jié)構(gòu)描述及若干學(xué)習(xí)算法的研究[D];華南理工大學(xué);2015年
2 祁仲昂;有限且非完美的標(biāo)簽學(xué)習(xí)[D];浙江大學(xué);2013年
相關(guān)碩士學(xué)位論文 前7條
1 曹蕾;多標(biāo)簽分類中標(biāo)簽編碼算法研究[D];南京師范大學(xué);2015年
2 馮雪東;基于一對一分解的多標(biāo)簽分類算法研究[D];南京師范大學(xué);2013年
3 陳小波;基于粒計(jì)算的K近鄰多標(biāo)簽學(xué)習(xí)算法[D];安徽大學(xué);2012年
4 陳智;基于卷積神經(jīng)網(wǎng)絡(luò)的多標(biāo)簽場景分類[D];山東大學(xué);2015年
5 丁立朵;半定規(guī)劃核在垃圾標(biāo)簽檢測中的應(yīng)用研究[D];廣西大學(xué);2012年
6 王臻;基于學(xué)習(xí)標(biāo)簽相關(guān)性的多標(biāo)簽分類算法[D];中國科學(xué)技術(shù)大學(xué);2015年
7 薛曼;規(guī)范化標(biāo)簽傳遞法處理標(biāo)簽不平衡問題的研究[D];大連理工大學(xué);2013年
,本文編號:1339412
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1339412.html