天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)義圖像檢索研究

發(fā)布時(shí)間:2018-12-23 13:36
【摘要】:圖像檢索問(wèn)題作為計(jì)算機(jī)視覺(jué)的一個(gè)基本問(wèn)題,已經(jīng)有很多學(xué)者對(duì)它進(jìn)行過(guò)分析和研究。本世紀(jì)初,人們逐漸認(rèn)識(shí)到低級(jí)特征和高級(jí)語(yǔ)義特征之間固有的“語(yǔ)義鴻溝”,開(kāi)始涉及基于語(yǔ)義的圖像檢索,但收效甚微。近年來(lái),深度學(xué)習(xí)技術(shù)為飽受到傳統(tǒng)人工特征困擾的基于語(yǔ)義的圖像檢索問(wèn)題打開(kāi)了新的大門。相比較傳統(tǒng)方法,深度學(xué)習(xí)模型在挖掘深層次特征上有驚人的能力,更可能滿足圖像語(yǔ)義特征學(xué)習(xí)。但是,深度學(xué)習(xí)本身也處在一個(gè)快速發(fā)展的階段,并不是完全成熟的工具,在使用過(guò)程中需要克服一些深度學(xué)習(xí)本身帶來(lái)的問(wèn)題。例如,深度模型在實(shí)際訓(xùn)練中的參數(shù)優(yōu)化問(wèn)題。同時(shí)我們?cè)撨x擇什么樣的深度模型來(lái)應(yīng)對(duì)基于語(yǔ)義的圖像檢索問(wèn)題,是我們首先需要考慮的。本文梳理了圖像檢索技術(shù)和深度學(xué)習(xí)技術(shù)的發(fā)展歷程。在此基礎(chǔ)上,提出了一種基于語(yǔ)義的圖像檢索框架。該框架中主要包含三部分:(1)特征提取網(wǎng)絡(luò),在本文中稱為多層級(jí)的圖像語(yǔ)義特征提取網(wǎng)絡(luò),框架通過(guò)該網(wǎng)絡(luò)提取語(yǔ)義特征;(2)特征存儲(chǔ)結(jié)構(gòu),它將提取出來(lái)的特征降維并轉(zhuǎn)化成圖像語(yǔ)義距離度量公式可以計(jì)算的格式;(3)圖像語(yǔ)義距離度量公式,框架最終通過(guò)它實(shí)現(xiàn)圖像語(yǔ)義距離的計(jì)算。多層級(jí)的圖像語(yǔ)義特征提取網(wǎng)絡(luò)是該框架的核心,它的性能直接影響著整個(gè)框架的最終精度,該網(wǎng)絡(luò)能通過(guò)其層級(jí)結(jié)構(gòu)分次對(duì)圖像中的語(yǔ)義特征進(jìn)行提取,獨(dú)特的結(jié)構(gòu)設(shè)計(jì)使得它可以挖掘圖像中更深層的語(yǔ)義。特征存儲(chǔ)結(jié)構(gòu)將提取出來(lái)的圖像語(yǔ)義特征轉(zhuǎn)化成一種更低維更易計(jì)算的融合特征表,而圖像語(yǔ)義距離度量公式則將通過(guò)融合特征表計(jì)算圖像之間的語(yǔ)義距離,從而生成檢索結(jié)果序列。在基于語(yǔ)義的圖像檢索框架中,多層級(jí)的圖像語(yǔ)義特征提取網(wǎng)絡(luò)可以被替換成其他分類網(wǎng)絡(luò),以靈活地應(yīng)對(duì)不同的待檢索圖像。在多個(gè)數(shù)據(jù)集上的測(cè)試結(jié)果表明,與現(xiàn)有方法相比,本文框架能夠更加準(zhǔn)確地完成基于語(yǔ)義的圖像檢索工作。
[Abstract]:As a basic problem of computer vision, image retrieval has been analyzed and studied by many scholars. At the beginning of this century, people gradually realized the inherent "semantic gap" between low-level features and high-level semantic features, and began to involve semantic-based image retrieval with little effect. In recent years, depth learning technology has opened a new door for semantic image retrieval, which is beset by traditional artificial features. Compared with the traditional methods, the depth learning model has an amazing ability in mining deep-level features, and it is more likely to satisfy the semantic feature learning of images. However, deep learning itself is also in a rapid development stage, is not a fully mature tool, in the use of the process need to overcome some of the problems caused by the depth of learning itself. For example, the parameter optimization problem of depth model in practical training. At the same time, we should consider what depth model we should choose to deal with the semantic image retrieval problem. This paper reviews the development of image retrieval technology and depth learning technology. On this basis, a semantic-based image retrieval framework is proposed. The framework consists of three parts: (1) feature extraction network, which is called multi-level image semantic feature extraction network in this paper, is used to extract semantic feature; (2) feature storage structure, which reduces the dimension of the extracted feature and converts it into a format that can be calculated by the image semantic distance metric formula; (3) the image semantic distance measurement formula, by which the frame finally realizes the calculation of the image semantic distance. Multi-level image semantic feature extraction network is the core of the framework, and its performance directly affects the final accuracy of the whole framework. Unique structural design allows it to dig deeper semantics in images. The feature storage structure transforms the extracted image semantic features into a fusion feature table with lower dimension and easier to calculate, and the image semantic distance measurement formula calculates the semantic distance between images through the fusion feature table. Thus, the retrieval result sequence is generated. In the semantic-based image retrieval framework, the multi-level semantic feature extraction network can be replaced with other classification networks to flexibly deal with different images to be retrieved. The test results on multiple datasets show that the proposed framework is more accurate than the existing methods in image retrieval based on semantics.
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41;TP183

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 江士方,汪英姿;圖像及圖像檢索應(yīng)用前景的探討[J];江蘇工業(yè)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2003年04期

2 韓法旺;;基于云計(jì)算模式的圖像檢索研究[J];情報(bào)科學(xué);2011年10期

3 何巖;;以計(jì)算機(jī)為基礎(chǔ)的色彩圖像檢索方法與研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年12期

4 郭海鳳;李廣水;仇彬任;;基于融合多特征的社會(huì)網(wǎng)上圖像檢索方法[J];計(jì)算機(jī)與現(xiàn)代化;2013年12期

5 柏正堯,周紀(jì)勤;基于復(fù)數(shù)矩不變性的圖像檢索方法研究[J];計(jì)算機(jī)應(yīng)用;2000年10期

6 夏峰,張文龍;一種圖像檢索的新方法[J];計(jì)算機(jī)應(yīng)用研究;2002年11期

7 鄧誠(chéng)強(qiáng),馮剛;基于內(nèi)容的多特征綜合圖像檢索[J];計(jì)算機(jī)應(yīng)用;2003年07期

8 斯白露,高文,盧漢清,曾煒,段立娟;基于感興趣區(qū)域的圖像檢索方法[J];高技術(shù)通訊;2003年05期

9 劉怡,于沛;基于“知網(wǎng)”的新聞圖像檢索方法[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年02期

10 張榮,鄭浩然,李金龍,王煦法;進(jìn)化加速技術(shù)在圖像檢索中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2004年16期

相關(guān)會(huì)議論文 前10條

1 陳旭文;朱紅麗;;一種高效的圖像檢索方法[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

2 周向東;張亮;張琪;劉莉;殷慷;施伯樂(lè);;一種新的圖像檢索相關(guān)反饋方法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

3 陳世亮;李戰(zhàn)懷;閆劍鋒;;一種基于本體描述的空間語(yǔ)義圖像檢索方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

4 趙海英;彭宏;;基于最優(yōu)近似反饋的圖像檢索[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年

5 許相莉;張利彪;于哲舟;周春光;;基于商空間粒度計(jì)算的圖像檢索[A];第八屆全國(guó)信息隱藏與多媒體安全學(xué)術(shù)大會(huì)湖南省計(jì)算機(jī)學(xué)會(huì)第十一屆學(xué)術(shù)年會(huì)論文集[C];2009年

6 李凌偉;周榮貴;劉怡;;基于概念的圖像檢索方法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

7 楊關(guān)良;李忠杰;徐小杰;;基于代表色的圖像檢索方法研究[A];首屆信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2003年

8 彭瑜;喬奇峰;魏昆娟;;基于多示例學(xué)習(xí)的圖像檢索方法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

9 胡敬;武港山;;基于語(yǔ)義特征的風(fēng)景圖像檢索[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

10 許天兵;;一種基于語(yǔ)義分類的圖像檢索方法[A];中國(guó)圖象圖形學(xué)會(huì)第十屆全國(guó)圖像圖形學(xué)術(shù)會(huì)議(CIG’2001)和第一屆全國(guó)虛擬現(xiàn)實(shí)技術(shù)研討會(huì)(CVR’2001)論文集[C];2001年

相關(guān)重要報(bào)紙文章 前6條

1 美國(guó)明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士 密西西比州立大學(xué)國(guó)家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國(guó)教師報(bào);2014年

2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計(jì)算機(jī)世界;2001年

3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國(guó)紡織報(bào);2003年

4 中國(guó)科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年

5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開(kāi)復(fù)雜工藝“黑箱”[N];解放日?qǐng)?bào);2007年

6 本報(bào)記者 劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日?qǐng)?bào);2011年

相關(guān)博士學(xué)位論文 前10條

1 崔超然;圖像檢索中自動(dòng)標(biāo)注、標(biāo)簽處理和重排序問(wèn)題的研究[D];山東大學(xué);2015年

2 楊迪;基于內(nèi)容的分布式圖像檢索[D];北京郵電大學(xué);2015年

3 張旭;網(wǎng)絡(luò)圖像檢索關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2014年

4 吳夢(mèng)麟;基于半監(jiān)督學(xué)習(xí)的醫(yī)學(xué)圖像檢索研究[D];南京理工大學(xué);2015年

5 高毫林;基于哈希技術(shù)的圖像檢索研究[D];解放軍信息工程大學(xué);2014年

6 李清亮;圖像檢索中判別性增強(qiáng)研究[D];吉林大學(xué);2016年

7 劉爽;多特征融合圖像檢索方法及其應(yīng)用研究[D];哈爾濱理工大學(xué);2016年

8 程航;密文JPEG圖像檢索研究[D];上海大學(xué);2016年

9 李強(qiáng);基于語(yǔ)義理解的圖像檢索研究[D];天津大學(xué);2015年

10 劉少偉;面向用戶意圖的社會(huì)化圖像檢索[D];清華大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 陳修遠(yuǎn);基于深度卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)義圖像檢索研究[D];電子科技大學(xué);2017年

2 趙鴻;基于尺度不變局部特征的圖像檢索研究[D];華南理工大學(xué);2015年

3 孫劍飛;基于圖像索引的熱點(diǎn)話題檢索方法研究[D];蘭州大學(xué);2015年

4 章進(jìn)洲;圖像檢索中的用戶意圖分析[D];南京理工大學(xué);2015年

5 苗思楊;移動(dòng)圖像檢索中的漸進(jìn)式傳輸方式研究[D];大連海事大學(xué);2015年

6 都業(yè)剛;基于顯著性的移動(dòng)圖像檢索[D];大連海事大學(xué);2015年

7 王夢(mèng)蕾;基于用戶反饋和改進(jìn)詞袋模型的圖像檢索[D];南京理工大學(xué);2015年

8 許鵬飛;基于草圖的海量圖像檢索方法研究[D];浙江大學(xué);2015年

9 馮進(jìn)麗;基于BoF的圖像檢索與行為識(shí)別研究[D];山西大學(xué);2015年

10 喬維強(qiáng);基于低級(jí)特征和語(yǔ)義特征的醫(yī)學(xué)圖像檢索[D];北京理工大學(xué);2015年



本文編號(hào):2390053

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2390053.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5814f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com