基于標(biāo)簽相關(guān)性學(xué)習(xí)的多標(biāo)簽圖像識(shí)別研究
發(fā)布時(shí)間:2021-08-19 20:01
多標(biāo)簽圖像分類旨在準(zhǔn)確的分類出圖像中的不同目標(biāo)所屬類別,其廣泛的用于場(chǎng)景識(shí)別、屬性分類等現(xiàn)實(shí)場(chǎng)景中。該任務(wù)的核心研究問(wèn)題是利用多個(gè)標(biāo)簽之間的相關(guān)性,根據(jù)已經(jīng)分類出的類別,推測(cè)出其他可能存在但是難以識(shí)別的類別。標(biāo)簽之間相關(guān)性的學(xué)習(xí)一直是多標(biāo)簽分類領(lǐng)域的核心研究課題,并且研究進(jìn)展緩慢,精度較差,難以直接落地于現(xiàn)實(shí)應(yīng)用。深度學(xué)習(xí)技術(shù)的飛速發(fā)展,加快了多標(biāo)簽圖像分類的研究進(jìn)程,也提供了標(biāo)簽相關(guān)性學(xué)習(xí)的新思路。針對(duì)標(biāo)簽相關(guān)性的學(xué)習(xí)問(wèn)題,本研究提出使用基于度量學(xué)習(xí)的多標(biāo)簽識(shí)別算法,將圖像和標(biāo)簽映射到同一個(gè)空間,在此空間中利用度量學(xué)習(xí)的方法聚類具有聯(lián)系的特征和標(biāo)簽,學(xué)習(xí)標(biāo)簽之間的聯(lián)系,并設(shè)計(jì)新的Ranking Loss監(jiān)督度量學(xué)習(xí)的過(guò)程。另外,在復(fù)雜情況下多標(biāo)簽圖像分類尤其是大規(guī)模多標(biāo)簽圖像分類任務(wù)中,以往的研究忽略了兩個(gè)更現(xiàn)實(shí)的問(wèn)題:類別分布不均衡和目標(biāo)大小差異較大,這兩個(gè)問(wèn)題都會(huì)對(duì)最終的分類結(jié)果產(chǎn)生壞的影響。本研究針對(duì)上述問(wèn)題,提出基于自注意力機(jī)制的算法,設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中自適應(yīng)的關(guān)注對(duì)識(shí)別有用的特征,并通過(guò)構(gòu)建特征注意力矩陣間接的利用標(biāo)簽之間的聯(lián)系。為驗(yàn)證算法的作用,本研究在國(guó)際權(quán)...
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
單標(biāo)簽圖像識(shí)別對(duì)比多標(biāo)簽圖像識(shí)別
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文的,對(duì)于生物來(lái)說(shuō),生物的神經(jīng)元之間的連接是稀疏連接方式,高效的深具有類似的性質(zhì)。Google 團(tuán)隊(duì)設(shè)計(jì)了 Inception 模塊,該模塊并行的使用的卷積獲取圖像的特征,Inception 模塊如下圖所示,以多支并行的結(jié)構(gòu)近神經(jīng)網(wǎng)絡(luò),在訓(xùn)練中,神經(jīng)網(wǎng)絡(luò)有更大選擇權(quán)選擇其中最有用的特征。
圖 2-1 Inception 模塊Inception 中使用了 1*1 的卷積核進(jìn)一步的減少參數(shù)量。在 Ima別結(jié)果表明,InceptionNet 實(shí)現(xiàn)了超過(guò) AlexNet 和 VGG 的識(shí)別準(zhǔn)on 模塊的提出使神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)朝著更深的方法發(fā)展,但是,網(wǎng)數(shù)量逐漸增加,過(guò)擬合和網(wǎng)絡(luò)難以優(yōu)化的問(wèn)題日益突出。單純?cè)鼋档土藞D像識(shí)別精度,出現(xiàn)退化的問(wèn)題。在這個(gè)基礎(chǔ)上,有研究結(jié)構(gòu),其圖示如下:
【參考文獻(xiàn)】:
期刊論文
[1]一種基于示例非獨(dú)立同分布的多示例多標(biāo)簽分類算法[J]. 陳彤彤,丁昕苗,柳嬋娟,鄒海林,周樹(shù)森,劉影. 計(jì)算機(jī)科學(xué). 2016(02)
[2]主動(dòng)學(xué)習(xí)的多標(biāo)簽圖像在線分類[J]. 徐美香,孫福明,李豪杰. 中國(guó)圖象圖形學(xué)報(bào). 2015(02)
本文編號(hào):3352051
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
單標(biāo)簽圖像識(shí)別對(duì)比多標(biāo)簽圖像識(shí)別
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文的,對(duì)于生物來(lái)說(shuō),生物的神經(jīng)元之間的連接是稀疏連接方式,高效的深具有類似的性質(zhì)。Google 團(tuán)隊(duì)設(shè)計(jì)了 Inception 模塊,該模塊并行的使用的卷積獲取圖像的特征,Inception 模塊如下圖所示,以多支并行的結(jié)構(gòu)近神經(jīng)網(wǎng)絡(luò),在訓(xùn)練中,神經(jīng)網(wǎng)絡(luò)有更大選擇權(quán)選擇其中最有用的特征。
圖 2-1 Inception 模塊Inception 中使用了 1*1 的卷積核進(jìn)一步的減少參數(shù)量。在 Ima別結(jié)果表明,InceptionNet 實(shí)現(xiàn)了超過(guò) AlexNet 和 VGG 的識(shí)別準(zhǔn)on 模塊的提出使神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)朝著更深的方法發(fā)展,但是,網(wǎng)數(shù)量逐漸增加,過(guò)擬合和網(wǎng)絡(luò)難以優(yōu)化的問(wèn)題日益突出。單純?cè)鼋档土藞D像識(shí)別精度,出現(xiàn)退化的問(wèn)題。在這個(gè)基礎(chǔ)上,有研究結(jié)構(gòu),其圖示如下:
【參考文獻(xiàn)】:
期刊論文
[1]一種基于示例非獨(dú)立同分布的多示例多標(biāo)簽分類算法[J]. 陳彤彤,丁昕苗,柳嬋娟,鄒海林,周樹(shù)森,劉影. 計(jì)算機(jī)科學(xué). 2016(02)
[2]主動(dòng)學(xué)習(xí)的多標(biāo)簽圖像在線分類[J]. 徐美香,孫福明,李豪杰. 中國(guó)圖象圖形學(xué)報(bào). 2015(02)
本文編號(hào):3352051
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3352051.html
最近更新
教材專著