天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于鄰域共識(shí)的多示例多標(biāo)簽學(xué)習(xí)

發(fā)布時(shí)間:2021-01-14 10:05
  針對(duì)多示例多標(biāo)簽學(xué)習(xí)中可能會(huì)出現(xiàn)標(biāo)簽缺失問(wèn)題、類(lèi)屬屬性問(wèn)題、標(biāo)簽關(guān)系問(wèn)題以及示例關(guān)系問(wèn)題。本文首先從多標(biāo)簽學(xué)習(xí)的角度探索標(biāo)簽缺失問(wèn)題、接著從多示例學(xué)習(xí)的角度探索示例關(guān)系問(wèn)題,最后綜合前兩個(gè)問(wèn)題并結(jié)合類(lèi)屬屬性問(wèn)題以及標(biāo)簽缺失問(wèn)題提出一種基于鄰域共識(shí)的多示例多標(biāo)簽算法NC-MIML(Multi-Instance Multi-Label Base on Neighborhood Consensus)。本文主要工作及創(chuàng)新點(diǎn)如下:(1)為解決標(biāo)簽關(guān)系問(wèn)題,本文從多標(biāo)簽學(xué)習(xí)角度分析并提出一種基于引力模型的改進(jìn)多標(biāo)簽算法IMLDGM(Improved Multi-Label algorithm based on Data Gravity Model),IMLDGM算法在基于引力模型的多標(biāo)簽學(xué)習(xí)算法基礎(chǔ)上,考慮到數(shù)據(jù)粒子質(zhì)量與引力大小的關(guān)系以及標(biāo)簽的正、負(fù)相關(guān)性。通過(guò)仿真實(shí)驗(yàn)的結(jié)果表明,標(biāo)簽關(guān)系是影響著分類(lèi)器最終分類(lèi)的效果的。(2)為解決示例關(guān)系問(wèn)題,本文從多示例學(xué)習(xí)的角度分析并提出一種基于鄰域共識(shí)的多示例算法NC-mi Graph(Neighborhood Consensus-mi Graph),N... 

【文章來(lái)源】:遼寧科技大學(xué)遼寧省

【文章頁(yè)數(shù)】:70 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于鄰域共識(shí)的多示例多標(biāo)簽學(xué)習(xí)


圖1.1支持向量機(jī)工作流程圖

工作流程圖,近鄰,工作流程圖,標(biāo)簽


。K最近鄰的核心思想實(shí)際上就是在訓(xùn)練過(guò)程中,通過(guò)計(jì)算每一個(gè)待測(cè)樣本與其他訓(xùn)練樣本之間的距離,從而找出設(shè)定好的前K個(gè)最近的鄰居樣本,接著統(tǒng)計(jì)出這些鄰居樣本中屬于各個(gè)分類(lèi)的個(gè)數(shù),利用投票的方式去預(yù)測(cè)待測(cè)樣本的標(biāo)簽。從這里可以看出,預(yù)測(cè)待測(cè)樣本的標(biāo)簽僅僅只是使用了最近鄰居樣本的K個(gè),這個(gè)K應(yīng)該是遠(yuǎn)遠(yuǎn)小于數(shù)據(jù)樣本的總數(shù),因此這K個(gè)鄰居樣本的選擇便是此算法最關(guān)鍵的步驟。這種算法的主要優(yōu)點(diǎn)有:第一,算法簡(jiǎn)單易懂,很容易實(shí)現(xiàn)。第二,KNN能夠去處理多類(lèi)問(wèn)題。KNN算法訓(xùn)練和分類(lèi)預(yù)測(cè)流程如下圖1.2所示。圖1.2K近鄰工作流程圖Fig.1.2KNearest-Neighborworkflowchart同樣地,雖然KNN算法本身具有以上的優(yōu)點(diǎn),但是依舊存在一些很明顯的缺點(diǎn):第一,當(dāng)數(shù)據(jù)樣本的個(gè)數(shù)過(guò)大,那么計(jì)算距離的時(shí)候同樣會(huì)相應(yīng)地增加計(jì)算時(shí)間;第二,對(duì)于一些不平衡的數(shù)據(jù)而言,利用這種方式去預(yù)測(cè)樣本的分類(lèi)時(shí),往往計(jì)算的結(jié)果沒(méi)有太大意義。比如,正標(biāo)簽樣本遠(yuǎn)遠(yuǎn)大于負(fù)標(biāo)簽樣本時(shí),待測(cè)樣本的標(biāo)簽預(yù)測(cè)為正標(biāo)簽的比重就會(huì)遠(yuǎn)遠(yuǎn)大于預(yù)測(cè)為負(fù)標(biāo)簽。傳統(tǒng)的這種單示例單標(biāo)簽學(xué)習(xí)框架,雖然在處理某一些問(wèn)題的時(shí)候能夠提供一個(gè)很好的解決方案,但是往往在很多現(xiàn)實(shí)的應(yīng)用場(chǎng)景下,示例和標(biāo)簽之間的關(guān)系不僅僅只是一對(duì)一,還存在很多更為復(fù)雜的關(guān)系,如一對(duì)多(One-to-Many)、3

框架圖,標(biāo)簽,概念,框架


架,如多示例單標(biāo)簽學(xué)習(xí)(Multi-InstanceSingle-Label,MISL,簡(jiǎn)稱多示例學(xué)習(xí))框架、單示例多標(biāo)簽學(xué)習(xí)(Single-InstanceMulti-Label,SIML,簡(jiǎn)稱多標(biāo)簽學(xué)習(xí))框架以及多示例多標(biāo)簽學(xué)習(xí)(Multi-InstanceMulti-Label,MIML,簡(jiǎn)稱多示例多標(biāo)簽學(xué)習(xí))框架。1.2.1多標(biāo)簽學(xué)習(xí)多標(biāo)簽學(xué)習(xí)是在傳統(tǒng)單示例單標(biāo)簽學(xué)習(xí)的基礎(chǔ)上進(jìn)行擴(kuò)展的,主要解決的問(wèn)題是示例和多標(biāo)簽之間的問(wèn)題。傳統(tǒng)單示例單標(biāo)簽學(xué)習(xí)方式往往只是針對(duì)單個(gè)示例只對(duì)應(yīng)單個(gè)分類(lèi)標(biāo)簽,而現(xiàn)實(shí)情況中,一個(gè)對(duì)象往往具有多個(gè)分類(lèi)標(biāo)簽,這種類(lèi)型的分類(lèi)問(wèn)題稱之為多標(biāo)簽分類(lèi),如圖1.3所示。從圖上可以很清晰地看出,示例和標(biāo)簽之間的關(guān)系就是一種一對(duì)多的關(guān)系(One-to-Many)。目前,多標(biāo)簽學(xué)習(xí)在網(wǎng)頁(yè)分類(lèi)[4]、圖像標(biāo)注[5]、生物分析[6]等多個(gè)領(lǐng)域均得到了廣泛的應(yīng)用。圖1.3多標(biāo)簽學(xué)習(xí)框架概念描述Fig.1.3Multi-Labellearningframeworkconceptdescription查閱相關(guān)文獻(xiàn),在分析學(xué)者們提出解決示例與多個(gè)分類(lèi)標(biāo)簽之間這種問(wèn)題的方法后,可以發(fā)現(xiàn)求解多標(biāo)簽分類(lèi)算法主要有問(wèn)題轉(zhuǎn)化和算法適應(yīng)兩種思路。問(wèn)題轉(zhuǎn)化思路,簡(jiǎn)單點(diǎn)介紹就是將多標(biāo)簽分類(lèi)問(wèn)題轉(zhuǎn)化為一系列單標(biāo)簽分類(lèi)問(wèn)題,轉(zhuǎn)化過(guò)后對(duì)這些單標(biāo)簽分類(lèi)問(wèn)題進(jìn)行獨(dú)立求解,其中最具有代表性的算法就是SVM算法的擴(kuò)展版本MLSVM[7](Multi-LabelSupportVectorMachine)。MLSVM算法的核心思想是首先計(jì)算數(shù)據(jù)樣本中標(biāo)簽的個(gè)數(shù)p,然后根據(jù)標(biāo)簽的個(gè)數(shù)p將多標(biāo)簽訓(xùn)練數(shù)據(jù)集劃分為p個(gè)單標(biāo)簽訓(xùn)練數(shù)據(jù)集,再單獨(dú)對(duì)p個(gè)訓(xùn)練數(shù)據(jù)集使用SVM(Supportvectormachine)算法,通過(guò)計(jì)算出每個(gè)訓(xùn)練數(shù)據(jù)集中4

【參考文獻(xiàn)】:
期刊論文
[1]調(diào)查顯示:中國(guó)網(wǎng)民每天在娛樂(lè)應(yīng)用上花費(fèi)近5個(gè)小時(shí)[J]. 本刊訊.  數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(07)
[2]基于數(shù)據(jù)引力模型的改進(jìn)多標(biāo)簽算法[J]. 程子為,曾子維,張?jiān)妶?孫謀.  遼寧科技大學(xué)學(xué)報(bào). 2019(03)
[3]基于神經(jīng)網(wǎng)絡(luò)探究標(biāo)簽依賴關(guān)系的多標(biāo)簽分類(lèi)[J]. 宋攀,景麗萍.  計(jì)算機(jī)研究與發(fā)展. 2018(08)
[4]基于引力模型的多標(biāo)簽分類(lèi)算法[J]. 李兆玉,王紀(jì)超,雷曼,龔琴.  計(jì)算機(jī)應(yīng)用. 2018(10)
[5]一種基于示例非獨(dú)立同分布的多示例多標(biāo)簽分類(lèi)算法[J]. 陳彤彤,丁昕苗,柳嬋娟,鄒海林,周樹(shù)森,劉影.  計(jì)算機(jī)科學(xué). 2016(02)
[6]用于多標(biāo)記學(xué)習(xí)的分類(lèi)器圈方法[J]. 王少博,李宇峰.  軟件學(xué)報(bào). 2015(11)

碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的多示例多標(biāo)簽算法研究[D]. 王鼎.武漢理工大學(xué) 2018



本文編號(hào):2976705

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2976705.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9866c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com