天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

面向半監(jiān)督流形正則化分類學(xué)習(xí)的改進(jìn)框架研究

發(fā)布時(shí)間:2022-01-27 03:22
  半監(jiān)督分類學(xué)習(xí)是機(jī)器學(xué)習(xí)中一個(gè)重要研究領(lǐng)域,同時(shí)利用有標(biāo)記和無(wú)標(biāo)記樣本進(jìn)行學(xué)習(xí),以緩解樣本類標(biāo)記稀缺的問(wèn)題。流形正則化(Manifold regularization,MR)是半監(jiān)督分類中一個(gè)經(jīng)典有效的學(xué)習(xí)框架,但仍存在以下不足:1)在MR中,已標(biāo)記樣本的位置是隨機(jī)的,可能處于邊界區(qū)域甚至相反類中,將這些樣本的標(biāo)記傳播到它們的近鄰樣本,可能會(huì)誤導(dǎo)MR分類,盡管學(xué)習(xí)中會(huì)同時(shí)考慮未標(biāo)記樣本的分布結(jié)構(gòu)。2)MR的平滑約束是基于所有樣本對(duì)實(shí)現(xiàn)的,即將每個(gè)樣本對(duì)看作一個(gè)單獨(dú)對(duì)象。然而,光滑性本質(zhì)是逐點(diǎn)的,具體來(lái)說(shuō),光滑性自然地發(fā)生在“每一點(diǎn)處”,體現(xiàn)每個(gè)樣本點(diǎn)與其近鄰點(diǎn)的相關(guān)聯(lián)行為。因此,本文的研究問(wèn)題主要包括以下的兩個(gè)內(nèi)容:首先,為減少已標(biāo)記樣本極其稀缺或位置存在誤導(dǎo)時(shí)所產(chǎn)生的影響,對(duì)已標(biāo)記樣本集進(jìn)行擴(kuò)充,提出一種新的標(biāo)記擴(kuò)充的MR框架(Label-expanded Manifold Regularization for semi-supervised classification,LEMR)。在LEMR中,先利用聚類方法,如KFCM,發(fā)現(xiàn)每類中的高... 

【文章來(lái)源】:南京郵電大學(xué)江蘇省

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向半監(jiān)督流形正則化分類學(xué)習(xí)的改進(jìn)框架研究


針對(duì)現(xiàn)有的半監(jiān)督分類方法所大致整理的歸類圖

流形,聚類,樣本,無(wú)標(biāo)記


圖 2.1 聚類假設(shè)以及流形假設(shè)2.3 半監(jiān)督學(xué)習(xí)算法分類傳統(tǒng)的機(jī)器學(xué)習(xí)包括全監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。在全監(jiān)督學(xué)習(xí)方法中,僅僅利用有標(biāo)記樣本,在無(wú)監(jiān)督學(xué)習(xí)方法中,單單利用無(wú)標(biāo)記樣本。然而,一方面,全監(jiān)督學(xué)習(xí)只有在擁有大量的有標(biāo)記樣本時(shí)才能訓(xùn)練出泛化能力相對(duì)較優(yōu)的學(xué)習(xí)器。無(wú)監(jiān)督學(xué)習(xí)只利用無(wú)標(biāo)記樣本探索出樣本數(shù)據(jù)集中可能包含的結(jié)構(gòu),但是學(xué)習(xí)到的模型可能還不夠精確,最終導(dǎo)致性能低下。另一方面,在實(shí)際問(wèn)題中,獲取無(wú)標(biāo)記樣本十分容易,然而收集依賴人工標(biāo)記的有標(biāo)記樣本卻非常艱難。所以,能夠同時(shí)利用少量的有標(biāo)記樣本以及大量的無(wú)標(biāo)記樣本的半監(jiān)督分類學(xué)習(xí)成為了機(jī)器學(xué)習(xí)領(lǐng)域中備受關(guān)注和研究探討的主題,半監(jiān)督學(xué)習(xí)能夠?qū)⒈O(jiān)督學(xué)習(xí)中的來(lái)自少量的有標(biāo)記樣本提供的監(jiān)督信息以及無(wú)監(jiān)督學(xué)習(xí)中的來(lái)自大量的無(wú)標(biāo)記樣本蘊(yùn)含的結(jié)

數(shù)據(jù)分布,分類超平面


由全監(jiān)督支持向量機(jī)發(fā)展而來(lái)的大間隔半監(jiān)督分類方法,它通過(guò)最大化已標(biāo)記樣本以及無(wú)標(biāo)記樣本的類間間隔,采用聚類假設(shè)將樣本數(shù)據(jù)進(jìn)行劃分為多個(gè)聚類,并且引導(dǎo)分類邊界處于數(shù)據(jù)分布的低密度區(qū)域中,最后通過(guò)獲得的邊界將樣本子集進(jìn)行劃分[37]。經(jīng)典的大間隔方法包括直推式支持向量機(jī)(Transductive Support Vector Machines,TSVM)[39]和半監(jiān)督 SVM(Semi-Supervised Support Vector Machine,S3VM)[41]。在全監(jiān)督SVM 中,訓(xùn)練集僅包含有標(biāo)記樣本,在學(xué)習(xí)的過(guò)程中,按照經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化和間隔最大化的原則來(lái)尋找分類邊界。而在半監(jiān)督 SVM 中,訓(xùn)練集不僅包含有標(biāo)記樣本還包含大量的無(wú)標(biāo)記樣本,首先利用訓(xùn)練集中的已標(biāo)記樣本進(jìn)行學(xué)習(xí)獲得分類邊界,然后再不斷地調(diào)整無(wú)標(biāo)記樣本的預(yù)測(cè)標(biāo)簽以及懲罰參數(shù),使獲得的分類邊界能夠盡可能地從樣本分布相對(duì)稀疏的區(qū)域中穿過(guò),并且使間隔最大化。圖 2.2 所示的,即全監(jiān)督 SVM 的分類超平面以及半監(jiān)督 SVM的分類超平面,其中“+”表示的是正類的已標(biāo)記樣本,“ ”表示的是負(fù)類的已標(biāo)記樣本,“o”表示的是無(wú)標(biāo)記樣本,實(shí)線表示的是分類超平面。

【參考文獻(xiàn)】:
期刊論文
[1]基于局部流形重構(gòu)的半監(jiān)督多視圖圖像分類[J]. 董西偉.  計(jì)算機(jī)工程與應(yīng)用. 2016(18)
[2]基于無(wú)監(jiān)督學(xué)習(xí)算法的推特文本規(guī)范化[J]. 鄧加原,姬東鴻,費(fèi)超群,任亞峰.  計(jì)算機(jī)應(yīng)用. 2016(07)
[3]基于特征映射的半監(jiān)督文本分類算法[J]. 杜芳華,冀俊忠,趙學(xué)武,吳晨生.  北京工業(yè)大學(xué)學(xué)報(bào). 2016(02)
[4]基于自然鄰居流形排序圖像檢索技術(shù)研究[J]. 朱慶生,陳治,張程.  計(jì)算機(jī)應(yīng)用研究. 2016(04)
[5]基于查詢—文檔異構(gòu)信息網(wǎng)絡(luò)的半監(jiān)督學(xué)習(xí)[J]. 劉鈺峰,李仁發(fā).  通信學(xué)報(bào). 2014(08)

碩士論文
[1]半監(jiān)督支持向量機(jī)分類方法研究[D]. 陳永健.陜西師范大學(xué) 2014



本文編號(hào):3611661

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3611661.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e0e59***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com