基于生成式對(duì)抗網(wǎng)絡(luò)的圖像標(biāo)注方法研究
發(fā)布時(shí)間:2023-06-28 05:42
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展以及智能移動(dòng)設(shè)備的快速普及,每天都會(huì)產(chǎn)生數(shù)以億計(jì)的圖像數(shù)據(jù)并且被各個(gè)用戶上傳到互聯(lián)網(wǎng),這些圖像數(shù)據(jù)在大多雜亂無序的同時(shí)又包含著海量有用信息。為了對(duì)這些圖像數(shù)據(jù)進(jìn)行有效管理并高效利用其包含的有用信息,圖像語(yǔ)義自動(dòng)標(biāo)注技術(shù)應(yīng)運(yùn)而生。目前,圖像自動(dòng)標(biāo)注技術(shù)大多通過傳統(tǒng)機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的方法構(gòu)建標(biāo)注模型實(shí)現(xiàn)對(duì)未知圖像的自動(dòng)標(biāo)注。但是,這些標(biāo)注方法大多都存在一個(gè)問題,即輸出層的神經(jīng)元(分類器)數(shù)目與數(shù)據(jù)集標(biāo)注詞匯量成比例,這將導(dǎo)致2個(gè)問題:1.模型實(shí)用性較差,當(dāng)數(shù)據(jù)集詞匯量較大時(shí),過大的輸出層數(shù)目將會(huì)急劇增加模型的設(shè)計(jì)和訓(xùn)練難度;2.模型結(jié)構(gòu)穩(wěn)定性差,模型結(jié)構(gòu)會(huì)隨詞匯量變化而改變。針對(duì)上述問題,本文將生成式對(duì)抗網(wǎng)絡(luò)與Word2vec詞向量模型相結(jié)合,設(shè)計(jì)并實(shí)現(xiàn)了一種新的標(biāo)注模型。首先,通過Word2vec模型將標(biāo)注詞匯映射為一個(gè)維數(shù)固定且可選擇的多維詞向量;其次,利用生成式對(duì)抗網(wǎng)絡(luò)構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)模型(GAN-W),使模型生成器的輸出層神經(jīng)元數(shù)目與多維詞向量維數(shù)相等,生成器將生成與詞向量同維度的向量,使模型輸出層神經(jīng)元數(shù)目與標(biāo)注詞匯量解綁;最后,對(duì)模型多次輸出結(jié)果進(jìn)行排序...
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 論文研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與發(fā)展
1.3 論文的研究?jī)?nèi)容及組織機(jī)構(gòu)
2 關(guān)鍵基礎(chǔ)技術(shù)研究
2.1 深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)
2.2 生成式對(duì)抗網(wǎng)絡(luò)
2.3 詞向量模型
2.4 遷移學(xué)習(xí)
2.5 本章小結(jié)
3 基于GAN的標(biāo)注模型結(jié)構(gòu)
3.1 標(biāo)注模型設(shè)計(jì)思想
3.2 標(biāo)注模型整體結(jié)構(gòu)
3.3 數(shù)據(jù)預(yù)處理
3.4 GAN網(wǎng)絡(luò)訓(xùn)練模型
3.5 模型損失
3.6 測(cè)試模塊
3.7 GAN模型訓(xùn)練算法
3.8 本章小結(jié)
4 模型實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)數(shù)據(jù)集
4.2 評(píng)估方法
4.3 Word2vec模型訓(xùn)練參數(shù)對(duì)模型標(biāo)注性能的影響
4.4 詞向量維數(shù)對(duì)模型性能的影響
4.5 不同閾值對(duì)圖像標(biāo)注的影響
4.6 不同模型標(biāo)注性能對(duì)比
4.7 模型實(shí)際標(biāo)注效果
4.8 本章小結(jié)
5 總結(jié)與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
本文編號(hào):3836092
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 論文研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀與發(fā)展
1.3 論文的研究?jī)?nèi)容及組織機(jī)構(gòu)
2 關(guān)鍵基礎(chǔ)技術(shù)研究
2.1 深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)
2.2 生成式對(duì)抗網(wǎng)絡(luò)
2.3 詞向量模型
2.4 遷移學(xué)習(xí)
2.5 本章小結(jié)
3 基于GAN的標(biāo)注模型結(jié)構(gòu)
3.1 標(biāo)注模型設(shè)計(jì)思想
3.2 標(biāo)注模型整體結(jié)構(gòu)
3.3 數(shù)據(jù)預(yù)處理
3.4 GAN網(wǎng)絡(luò)訓(xùn)練模型
3.5 模型損失
3.6 測(cè)試模塊
3.7 GAN模型訓(xùn)練算法
3.8 本章小結(jié)
4 模型實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)數(shù)據(jù)集
4.2 評(píng)估方法
4.3 Word2vec模型訓(xùn)練參數(shù)對(duì)模型標(biāo)注性能的影響
4.4 詞向量維數(shù)對(duì)模型性能的影響
4.5 不同閾值對(duì)圖像標(biāo)注的影響
4.6 不同模型標(biāo)注性能對(duì)比
4.7 模型實(shí)際標(biāo)注效果
4.8 本章小結(jié)
5 總結(jié)與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
本文編號(hào):3836092
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3836092.html
最近更新
教材專著