基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法研究
發(fā)布時(shí)間:2021-05-05 18:08
隨著互聯(lián)網(wǎng)和多媒體技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)上各種形式的媒體內(nèi)容(文本、圖像、音頻、視頻)大量涌現(xiàn)并呈爆炸式增長(zhǎng),如何讓計(jì)算機(jī)能夠快速準(zhǔn)確地理解多媒體信息內(nèi)容并挖掘不同模態(tài)媒體之間的關(guān)聯(lián)信息以實(shí)現(xiàn)跨媒體的檢索,成為人們快速從混雜而又龐大的多媒體信息中獲取到自己所需有效信息的關(guān)鍵。近年來,深度學(xué)習(xí)在信息檢索領(lǐng)域發(fā)展迅速,因其強(qiáng)大的功能,也越來越多地被人們用于跨媒體檢索的研究中。由于成熟的深度神經(jīng)網(wǎng)絡(luò)模型參數(shù)數(shù)量大,計(jì)算量大,所以跨媒體檢索信息的速度會(huì)受到相應(yīng)限制,直接影響使用者檢索信息的體驗(yàn)感。本文簡(jiǎn)要分析了跨媒體研究現(xiàn)狀,對(duì)已有的跨媒體檢索方法進(jìn)行總結(jié)。在綜合分析了已有的跨媒體檢索方法的基礎(chǔ)上,以圖像和文本的雙向檢索為切入點(diǎn),針對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)模型計(jì)算量大的問題,提出將壓縮卷積神經(jīng)網(wǎng)絡(luò)用于圖像和文本雙向檢索的跨媒體檢索方法并取得了較好效果。本文的主要工作如下:(1)分別采用預(yù)訓(xùn)練的通道剪枝的VGG-16(Channel Pruning VGG-16)壓縮卷積神經(jīng)網(wǎng)絡(luò)和經(jīng)過目標(biāo)數(shù)據(jù)集微調(diào)的Channel Pruning VGG-16壓縮卷積神經(jīng)網(wǎng)絡(luò)來提取數(shù)據(jù)集圖像底層特征,采用狄利克雷(La...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容及論文組織結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 論文組織結(jié)構(gòu)
第二章 相關(guān)理論概述
2.1 跨媒體信息檢索概述
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
2.2.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)概述
2.3 常見的跨媒體檢索方法
2.3.1 共同空間學(xué)習(xí)方法
2.3.2 跨媒體相似性度量方法
2.4 本章小結(jié)
第三章 基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法
3.1 引言
3.2 跨媒體檢索框架
3.3 數(shù)據(jù)特征提取
3.3.1 圖像特征提取
3.3.2 文本特征提取
3.4 語義共享空間
3.5 圖像特征正則規(guī)范化
3.6 相似性度量算法
3.7 實(shí)驗(yàn)結(jié)果與分析
3.7.1 實(shí)驗(yàn)數(shù)據(jù)集
3.7.2 評(píng)價(jià)指標(biāo)
3.7.3 Wikipedia的實(shí)驗(yàn)結(jié)果及分析
3.7.4 Pascal Sentence的實(shí)驗(yàn)結(jié)果及分析
3.8 本章小結(jié)
第四章 基于數(shù)量積相似性度量的跨媒體檢索方法
4.1 引言
4.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)的微調(diào)
4.3 基于數(shù)量積的相似性度量的跨媒體檢索方法
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 實(shí)驗(yàn)設(shè)置
4.4.2 Wikipedia的實(shí)驗(yàn)結(jié)果及分析
4.4.3 Pascal Sentence的實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間的研究成果
致謝
本文編號(hào):3170343
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容及論文組織結(jié)構(gòu)
1.3.1 研究?jī)?nèi)容
1.3.2 論文組織結(jié)構(gòu)
第二章 相關(guān)理論概述
2.1 跨媒體信息檢索概述
2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)概述
2.2.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)概述
2.3 常見的跨媒體檢索方法
2.3.1 共同空間學(xué)習(xí)方法
2.3.2 跨媒體相似性度量方法
2.4 本章小結(jié)
第三章 基于壓縮卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法
3.1 引言
3.2 跨媒體檢索框架
3.3 數(shù)據(jù)特征提取
3.3.1 圖像特征提取
3.3.2 文本特征提取
3.4 語義共享空間
3.5 圖像特征正則規(guī)范化
3.6 相似性度量算法
3.7 實(shí)驗(yàn)結(jié)果與分析
3.7.1 實(shí)驗(yàn)數(shù)據(jù)集
3.7.2 評(píng)價(jià)指標(biāo)
3.7.3 Wikipedia的實(shí)驗(yàn)結(jié)果及分析
3.7.4 Pascal Sentence的實(shí)驗(yàn)結(jié)果及分析
3.8 本章小結(jié)
第四章 基于數(shù)量積相似性度量的跨媒體檢索方法
4.1 引言
4.2 壓縮卷積神經(jīng)網(wǎng)絡(luò)的微調(diào)
4.3 基于數(shù)量積的相似性度量的跨媒體檢索方法
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 實(shí)驗(yàn)設(shè)置
4.4.2 Wikipedia的實(shí)驗(yàn)結(jié)果及分析
4.4.3 Pascal Sentence的實(shí)驗(yàn)結(jié)果及分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間的研究成果
致謝
本文編號(hào):3170343
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3170343.html
最近更新
教材專著