最初,多標(biāo)記學(xué)習(xí)是為了解決文檔分類過(guò)程中遇到的語(yǔ)義分歧問(wèn)題,自提出以來(lái)已逐漸成為數(shù)據(jù)挖掘和信息檢索中的重要主題,F(xiàn)實(shí)生活中遇到的很多分類問(wèn)題都和多標(biāo)記相關(guān),多標(biāo)記學(xué)習(xí)的主要特征是增加了樣本分類的種類,從之前的單一標(biāo)記變成了多個(gè)標(biāo)記,使得對(duì)樣本的描述更加準(zhǔn)確。在多標(biāo)記學(xué)習(xí)中,樣本空間有限信息的有效利用一直是許多學(xué)者的研究方向,為了提升算法的健壯性以及提取數(shù)據(jù)特征的效率,許多學(xué)者都在不同方面做了新的優(yōu)化建議。研究表明特征重構(gòu)在一定程度上能夠提升算法性能,故將特征空間和標(biāo)記空間信息結(jié)合統(tǒng)一。針對(duì)傳統(tǒng)自編碼神經(jīng)擁有層級(jí)較為復(fù)雜計(jì)算過(guò)程,使得算法時(shí)間復(fù)雜度相對(duì)較大,引入了核極限自編碼器。在現(xiàn)實(shí)世界中,標(biāo)記之間往往存在一定的隱含關(guān)系,對(duì)標(biāo)記之間的關(guān)系進(jìn)行分析也是多標(biāo)記學(xué)習(xí)研究的熱點(diǎn);诖,本文展開(kāi)研究,主要工作如下:(1)多標(biāo)記學(xué)習(xí)算法的重難點(diǎn)是如何準(zhǔn)確獲取到各組待訓(xùn)練的樣本標(biāo)記信息之間存在的關(guān)系,在此基礎(chǔ)上去得到未知數(shù)據(jù)集合的預(yù)測(cè)結(jié)果,簡(jiǎn)單來(lái)說(shuō)就是借助已有數(shù)據(jù)集合提取數(shù)據(jù)關(guān)聯(lián)關(guān)系,進(jìn)行推算得到預(yù)測(cè)結(jié)果?紤]特征與標(biāo)記聯(lián)合重構(gòu)的特征能夠提升算法的分類性能,提出一種核極限學(xué)習(xí)自編碼算法(ML-KELMAE)。本文采用一種核極限學(xué)習(xí)機(jī)自編碼神經(jīng)網(wǎng)絡(luò),首先在神經(jīng)網(wǎng)絡(luò)輸入節(jié)點(diǎn)中加入標(biāo)記信息,然后使用核極限學(xué)習(xí)機(jī)自編碼神經(jīng)網(wǎng)絡(luò)把輸入特征作為目標(biāo)輸出,最后采用奇異值分解解決分類問(wèn)題。在多個(gè)多標(biāo)記基準(zhǔn)數(shù)據(jù)集上的結(jié)果顯示,該方法具有一定的優(yōu)勢(shì)。(2)在現(xiàn)實(shí)世界中,標(biāo)記集合中的個(gè)體與個(gè)體之間往往存在著一定的隱含關(guān)系,他們之間的這種關(guān)系對(duì)分類結(jié)果或多或少都有一定影響。因此,在進(jìn)行算法分類時(shí)把關(guān)聯(lián)關(guān)系因素加入到考慮中是十分有必要的。故在ML-KELMAE算法的基礎(chǔ)上加入標(biāo)記相關(guān)性因素,在原始標(biāo)記矩陣中加入標(biāo)記相關(guān)性信息,得到的矩陣代替原始矩陣。在算法對(duì)標(biāo)記相關(guān)性特性進(jìn)行優(yōu)化的基礎(chǔ)之上,加入了標(biāo)記與特征相關(guān)因素的考慮。在本文選定的測(cè)試集上進(jìn)行了測(cè)試,實(shí)驗(yàn)結(jié)果證明了加入標(biāo)記相關(guān)性提升算法性能的合理性和有效性。
【學(xué)位單位】:安慶師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2020
【中圖分類】:TP181
【部分圖文】:
自編碼網(wǎng)絡(luò)由三部分構(gòu)成(輸入層、隱藏層、輸出層),自編碼器由編碼器(encoder)部分和解碼器(decoder)部分構(gòu)成。其結(jié)構(gòu)如3.1圖所示:其作用是將輸入層樣本數(shù)據(jù)進(jìn)行壓縮操作到隱藏層之后重新解壓映射回輸出層。作為深度學(xué)習(xí)中一種無(wú)需標(biāo)記的無(wú)監(jiān)督特征學(xué)習(xí)方法,自編碼器能夠有效地提取數(shù)據(jù)特征內(nèi)在的聯(lián)系。學(xué)習(xí)策略可以表示為一最小重構(gòu)誤差函數(shù):

算法統(tǒng)計(jì)假設(shè)檢驗(yàn)分析
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 田楓;沈旭昆;;基于標(biāo)簽集相關(guān)性學(xué)習(xí)的大規(guī)模網(wǎng)絡(luò)圖像在線標(biāo)注[J];自動(dòng)化學(xué)報(bào);2014年08期
2 秦勝君;盧志平;;稀疏自動(dòng)編碼器在文本分類中的應(yīng)用研究[J];科學(xué)技術(shù)與工程;2013年31期
3 張敏靈;;一種新型多標(biāo)記懶惰學(xué)習(xí)算法[J];計(jì)算機(jī)研究與發(fā)展;2012年11期
4 鄧萬(wàn)宇;鄭慶華;陳琳;許學(xué)斌;;神經(jīng)網(wǎng)絡(luò)極速學(xué)習(xí)方法研究[J];計(jì)算機(jī)學(xué)報(bào);2010年02期
5 李勇,徐振寧,張維明;Internet個(gè)性化信息服務(wù)研究綜述[J];計(jì)算機(jī)工程與應(yīng)用;2002年19期
6 周志華,陳世福;神經(jīng)網(wǎng)絡(luò)集成[J];計(jì)算機(jī)學(xué)報(bào);2002年01期
相關(guān)碩士學(xué)位論文 前2條
1 張倩汶;基于標(biāo)記信息拓展的多標(biāo)記學(xué)習(xí)算法研究[D];東南大學(xué);2018年
2 殷洪峰;基于標(biāo)簽相關(guān)性的多標(biāo)簽分類算法及其在帕金森診療領(lǐng)域中的應(yīng)用[D];南京大學(xué);2017年
本文編號(hào):
2894437
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2894437.html