基于不完全監(jiān)督的多標(biāo)簽分類算法
發(fā)布時間:2021-07-16 17:51
隨著多標(biāo)簽學(xué)習(xí)方法在多個領(lǐng)域的廣泛應(yīng)用,對多標(biāo)簽數(shù)據(jù)進(jìn)行準(zhǔn)確的分類,已成為研究多標(biāo)簽學(xué)習(xí)方法的重要課題之一。對于多標(biāo)簽數(shù)據(jù)來說,互聯(lián)網(wǎng)的快速發(fā)展使得獲取未標(biāo)注的數(shù)據(jù)變得十分方便,但是想要獲取已標(biāo)注的多標(biāo)簽數(shù)據(jù)需要花費大量的時間和金錢。對此,本文充分利用少量已標(biāo)注樣本和大量未標(biāo)記樣本,提出了基于不完全監(jiān)督的多標(biāo)簽分類算法。根據(jù)實現(xiàn)不完全監(jiān)督學(xué)習(xí)的兩種主要方式,本文將所提出的算法分為:基于主動學(xué)習(xí)的多標(biāo)簽分類算法和基于主動半監(jiān)督學(xué)習(xí)的多標(biāo)簽分類算法;谥鲃訉W(xué)習(xí)的多標(biāo)簽分類算法,首先根據(jù)多標(biāo)簽間的相互聯(lián)系,利用陸地移動距離構(gòu)建一個非對稱的多標(biāo)簽間相關(guān)性矩陣;再將二元信源的熵與多標(biāo)簽間相關(guān)性矩陣相結(jié)合的方法計算樣本標(biāo)簽對的信息含量,并以此作為主動學(xué)習(xí)的采樣標(biāo)準(zhǔn);最終將選取的樣本交給人類專家進(jìn)行標(biāo)注,迭代地完成主動學(xué)習(xí)過程。此算法在考慮多標(biāo)簽間相互關(guān)系的同時也考慮了已標(biāo)注數(shù)據(jù)和未標(biāo)注數(shù)據(jù)所包含的信息,進(jìn)一步提高了分類器對于多標(biāo)簽數(shù)據(jù)的分類性能;谥鲃影氡O(jiān)督學(xué)習(xí)的多標(biāo)簽分類算法,是在基于主動學(xué)習(xí)的多標(biāo)簽分類算法的基礎(chǔ)上為了進(jìn)一步提高算法的分類效率,而加入半監(jiān)督學(xué)習(xí)自動的進(jìn)行選擇和標(biāo)注未分類的多...
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1弱監(jiān)督學(xué)習(xí)概述圖??Fig.?2.1?The?overview?of?weakly?supervised?learning??
?大連海事大學(xué)專業(yè)學(xué)位碩士學(xué)位論文???間所對應(yīng)的地面距離,那么從不同位置運輸多少土到不同的深坑使得總運輸代價??最小,這個最小代價就是陸地移動距離。??EMD的計算可以借鑒運籌學(xué)領(lǐng)域中著名的最優(yōu)運輸問題的解決方案[43]。最優(yōu)??運輸問題[44]是在1781年由Monge教授首次提出的。如圖2.2為一個包含3個產(chǎn)地??與2個銷地的最優(yōu)運輸問題的示例。??圖2.2最優(yōu)運輸問題的示例??Fig.?2.2?An?example?of?optimal?transportation?problem??定義2.9定義P為包含w個產(chǎn)地的集合P?=?表示第f產(chǎn)地所包含??貨品的數(shù)量;2為包含《個銷地的集合0?=?,幻表示第7產(chǎn)地所需要貨品??的數(shù)量;4表示第/個產(chǎn)地在運輸單位數(shù)量的貨品到第7個銷售地所花費的代價。??運輸產(chǎn)地的貨品到銷地的最小代價如下:??WORKiP^F)^^^?(2.19)??/=!?./=!??需滿足如下約束條件:??fij^d?\<i<m?1<,/<??(2.20)??\<i<m?(2.21)??TrJu^^j?(2.22)??ni?n?nt?n??SX?石/.?=min(I^',I^/)?(2.23?)??i—l?j=l?i=l?7=1??14??
?大連海事大學(xué)專業(yè)學(xué)位碩士學(xué)位論文???〇、、、0?〇?0?/?0???〇?0??〇。0、、、〇、§?0。/?〇0〇?◎??〇?〇、2〇〇/。〇0??0?0?0?0?◎?/、〇n?0????〇。〇?e?〇?e?/〇、、、〇?0????(D?〇?3?0?/?〇〇?0、、、〇?〇??〇?0?o?,?0?0?〇?o、、、???SVM劃分的超平面??S3VM劃分的超平而???????1丨:類樣本?Q:負(fù)類樣本?0?:朱標(biāo)注樣本??圖4.1半監(jiān)督支持向量機(jī)??Fig.?4.1?Semi-Supervised?Support?Vector?Machine??直推式支持向量機(jī)(Transductive?Support?Vector?Machine,TSVM)?[32]是半監(jiān)??督支持向量機(jī)算法中較代表性是算法。tsvm算法運用對未標(biāo)記樣本進(jìn)行標(biāo)簽指??派的方式,令每個未標(biāo)記樣本分別作為正類樣本和負(fù)類樣本,在所有結(jié)果中找到??使得數(shù)據(jù)集中全部樣本最大化間隔的分離超平面,此時標(biāo)注的未標(biāo)記樣本的標(biāo)簽??即為其最終的預(yù)測標(biāo)簽。TSVM算法的具體過程如下:??算法4.2直推式半監(jiān)督支持向量機(jī)算法:??輸入:??Z?=?{(七,乃),."_(W,),__?,〇?,,乃)1少,e?{+1,一1}}表示己標(biāo)注樣本集;??V?=?{xw,x,+2,:..,xm}表示未標(biāo)注樣本集:??折中參數(shù)C,,松弛變量委20,/?=?1,2,...,》1:(叫/7)確定了一個分離超平面;??初始化:??1:根據(jù)己標(biāo)注樣本構(gòu)建的集合L,訓(xùn)練一個SVM/;??2:用8\^,對[/中的樣本進(jìn)行標(biāo)注,得到預(yù)測標(biāo)簽/?=?{(免+|,
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
[2]標(biāo)簽相關(guān)的多標(biāo)簽分類算法[J]. 喬亞琴,馬盈倉,張毅斌,楊小飛. 紡織高校基礎(chǔ)科學(xué)學(xué)報. 2017(04)
[3]基于HDP的監(jiān)督多標(biāo)簽文本分類研究[J]. 謝晨陽,盧焱鑫. 計算機(jī)工程與應(yīng)用. 2017(23)
[4]基于SVM的多示例多標(biāo)簽主動學(xué)習(xí)[J]. 李杰龍,肖燕珊,郝志峰,阮奕邦,張麗陽. 計算機(jī)工程與設(shè)計. 2016(01)
[5]主動學(xué)習(xí)的多標(biāo)簽圖像在線分類[J]. 徐美香,孫福明,李豪杰. 中國圖象圖形學(xué)報. 2015(02)
[6]半監(jiān)督k近鄰分類方法[J]. 陳日新,朱明旱. 中國圖象圖形學(xué)報. 2013(02)
[7]一種半監(jiān)督的多標(biāo)簽Boosting分類算法[J]. 趙晨陽,佀潔. 計算機(jī)應(yīng)用研究. 2012(09)
[8]一種基于模型共享的半監(jiān)督多標(biāo)簽圖像學(xué)習(xí)法[J]. 張大鵬,聞佳,劉曦. 系統(tǒng)仿真學(xué)報. 2012(09)
[9]基于加權(quán)SVM主動學(xué)習(xí)的多標(biāo)簽分類[J]. 劉端陽,邱衛(wèi)杰. 計算機(jī)工程. 2011(08)
本文編號:3287475
【文章來源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1弱監(jiān)督學(xué)習(xí)概述圖??Fig.?2.1?The?overview?of?weakly?supervised?learning??
?大連海事大學(xué)專業(yè)學(xué)位碩士學(xué)位論文???間所對應(yīng)的地面距離,那么從不同位置運輸多少土到不同的深坑使得總運輸代價??最小,這個最小代價就是陸地移動距離。??EMD的計算可以借鑒運籌學(xué)領(lǐng)域中著名的最優(yōu)運輸問題的解決方案[43]。最優(yōu)??運輸問題[44]是在1781年由Monge教授首次提出的。如圖2.2為一個包含3個產(chǎn)地??與2個銷地的最優(yōu)運輸問題的示例。??圖2.2最優(yōu)運輸問題的示例??Fig.?2.2?An?example?of?optimal?transportation?problem??定義2.9定義P為包含w個產(chǎn)地的集合P?=?表示第f產(chǎn)地所包含??貨品的數(shù)量;2為包含《個銷地的集合0?=?,幻表示第7產(chǎn)地所需要貨品??的數(shù)量;4表示第/個產(chǎn)地在運輸單位數(shù)量的貨品到第7個銷售地所花費的代價。??運輸產(chǎn)地的貨品到銷地的最小代價如下:??WORKiP^F)^^^?(2.19)??/=!?./=!??需滿足如下約束條件:??fij^d?\<i<m?1<,/<??(2.20)??\<i<m?(2.21)??TrJu^^j?(2.22)??ni?n?nt?n??SX?石/.?=min(I^',I^/)?(2.23?)??i—l?j=l?i=l?7=1??14??
?大連海事大學(xué)專業(yè)學(xué)位碩士學(xué)位論文???〇、、、0?〇?0?/?0???〇?0??〇。0、、、〇、§?0。/?〇0〇?◎??〇?〇、2〇〇/。〇0??0?0?0?0?◎?/、〇n?0????〇。〇?e?〇?e?/〇、、、〇?0????(D?〇?3?0?/?〇〇?0、、、〇?〇??〇?0?o?,?0?0?〇?o、、、???SVM劃分的超平面??S3VM劃分的超平而???????1丨:類樣本?Q:負(fù)類樣本?0?:朱標(biāo)注樣本??圖4.1半監(jiān)督支持向量機(jī)??Fig.?4.1?Semi-Supervised?Support?Vector?Machine??直推式支持向量機(jī)(Transductive?Support?Vector?Machine,TSVM)?[32]是半監(jiān)??督支持向量機(jī)算法中較代表性是算法。tsvm算法運用對未標(biāo)記樣本進(jìn)行標(biāo)簽指??派的方式,令每個未標(biāo)記樣本分別作為正類樣本和負(fù)類樣本,在所有結(jié)果中找到??使得數(shù)據(jù)集中全部樣本最大化間隔的分離超平面,此時標(biāo)注的未標(biāo)記樣本的標(biāo)簽??即為其最終的預(yù)測標(biāo)簽。TSVM算法的具體過程如下:??算法4.2直推式半監(jiān)督支持向量機(jī)算法:??輸入:??Z?=?{(七,乃),."_(W,),__?,〇?,,乃)1少,e?{+1,一1}}表示己標(biāo)注樣本集;??V?=?{xw,x,+2,:..,xm}表示未標(biāo)注樣本集:??折中參數(shù)C,,松弛變量委20,/?=?1,2,...,》1:(叫/7)確定了一個分離超平面;??初始化:??1:根據(jù)己標(biāo)注樣本構(gòu)建的集合L,訓(xùn)練一個SVM/;??2:用8\^,對[/中的樣本進(jìn)行標(biāo)注,得到預(yù)測標(biāo)簽/?=?{(免+|,
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
[2]標(biāo)簽相關(guān)的多標(biāo)簽分類算法[J]. 喬亞琴,馬盈倉,張毅斌,楊小飛. 紡織高校基礎(chǔ)科學(xué)學(xué)報. 2017(04)
[3]基于HDP的監(jiān)督多標(biāo)簽文本分類研究[J]. 謝晨陽,盧焱鑫. 計算機(jī)工程與應(yīng)用. 2017(23)
[4]基于SVM的多示例多標(biāo)簽主動學(xué)習(xí)[J]. 李杰龍,肖燕珊,郝志峰,阮奕邦,張麗陽. 計算機(jī)工程與設(shè)計. 2016(01)
[5]主動學(xué)習(xí)的多標(biāo)簽圖像在線分類[J]. 徐美香,孫福明,李豪杰. 中國圖象圖形學(xué)報. 2015(02)
[6]半監(jiān)督k近鄰分類方法[J]. 陳日新,朱明旱. 中國圖象圖形學(xué)報. 2013(02)
[7]一種半監(jiān)督的多標(biāo)簽Boosting分類算法[J]. 趙晨陽,佀潔. 計算機(jī)應(yīng)用研究. 2012(09)
[8]一種基于模型共享的半監(jiān)督多標(biāo)簽圖像學(xué)習(xí)法[J]. 張大鵬,聞佳,劉曦. 系統(tǒng)仿真學(xué)報. 2012(09)
[9]基于加權(quán)SVM主動學(xué)習(xí)的多標(biāo)簽分類[J]. 劉端陽,邱衛(wèi)杰. 計算機(jī)工程. 2011(08)
本文編號:3287475
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3287475.html
最近更新
教材專著