天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習與哈希碼的圖像檢索方法研究

發(fā)布時間:2020-05-31 10:32
【摘要】:隨著網絡和多媒體技術的發(fā)展,基于內容的圖像檢索(CBIR)作為一種精確、快速的檢索方法越來越受到用戶的歡迎。近年來,CBIR面臨的主要問題是人工設計的底層特征難以描述人類所理解的圖像語義信息,即“語義鴻溝”問題,以及如何快速、有效地從海量圖像數(shù)據庫中檢索出相似圖像。這兩個問題對應的是CBIR的兩個主要步驟,即圖像特征提取以及基于圖像特征的索引建立。本文的研究便是圍繞這兩個主要步驟展開的。(1)提出一種圖像特征提取模塊——基于非監(jiān)督學習的SS-VGG16卷積神經網絡,應用在圖像特征提取階段。該模塊有三個創(chuàng)新點,解決了三個問題,即:VGG16模型參數(shù)量過大問題、VGG16網絡只能輸入固定大小圖像的問題、監(jiān)督學習不能基于無標簽圖像數(shù)據庫進行訓練的問題。本文對經典的卷積神經網絡VGG16進行改進,提出的基于Squeeze Net思想的輕量化S-VGG16網絡結構,旨在減少網絡的參數(shù)量,更少的參數(shù)量代表更短的網絡訓練時間,同時意味著更快的圖像特征提取速度。為了解決傳統(tǒng)CNN不能提取任意大小圖像的特征問題,本文使用空間金字塔池化(SPP)去代替S-VGG16網絡中的最后一個最大池化層,得到SS-VGG16網絡框架,使得網絡能夠接受任意大小的圖像作為輸入,因此無需進行圖像拉伸、裁剪等預處理,避免了圖像失真問題。考慮到對無標簽數(shù)據集進行圖像檢索,本文提出無監(jiān)督遷移學習對SS-VGG16框架進行訓練。該方法利用相似圖像數(shù)據的內在聯(lián)系,使用圖像特征均值作為訓練目標。為證明提出的SS-VGG16網絡結構的有效性,本文在MIT Places 365-Standard公共數(shù)據集上進行監(jiān)督學習實驗,使用Top-1和Top-5準確率作為評價標準,對比了本文提出的SS-VGG16與原始VGG16的圖像檢索性能,證明了SS-VGG16的有效性。為了證明本文提出的無標簽無監(jiān)督學習的有效性,使用Paris 6k、UKBench作為實驗數(shù)據集,并分別以MAP、Top-4準確率作為評價標準,將本文提出的方法與近年來使用無監(jiān)督學習方法進行比較,證明對SS-VGG16進行無監(jiān)督訓練在圖像檢索任務中的優(yōu)越性。(2)提出一種基于深度特征、特征預降維、以及迭代量化編碼的圖像檢索算法。在建立特征索引前,本文提出使用基于自編碼器的特征預降維方法對數(shù)據進行非線性學習,以達到對特征進行預降維的目的。在建立特征索引階段,本文提出使用迭代量化(ITQ)方法,對預降維后的SS-VGG16深度特征進行編碼;ITQ方法不斷逼近特征與設定比特數(shù)的哈希碼之間的量化誤差最小值,實現(xiàn)量化誤差的最小化。本文使用查全率(Recall)、查準率(Precision)和平均精度均值(MAP)作為檢索效果的評價指標,在Caltech256圖像庫上進行測試。實驗結果表明,本文提出的圖像檢索算法性能要優(yōu)于其他主流算法。
【圖文】:

圖像分類


研究認為人腦的神經元只能感受到小范圍的視覺變化。因靜止(Stationary)的特性,,即圖像的一部分統(tǒng)計數(shù)據與其他部分相同。這像的一部分學習的功能也可以應用到圖像的其他部分,因此每一個卷積的一個卷積核對圖像進行特征學習。 模型訓練過程如下,每個輸入圖像將通過一系列由卷積核組成的tion Layers)、激活函數(shù)、池化層和完全連接層(Fully Connected Layers, FtMax 函數(shù)對概率值介于 0 和 1 之間的對象進行分類。圖 2-3[40]描述了由的 CNN 的結構,通過多個卷積層、池化層對圖像數(shù)據進行分析,全連到包含語義信息的圖像特征,全連接層最后連接到 Softmax 層,對圖像這個過程稱為前向傳播(Forward Propagation, FP);而 CNN 的訓練過程則化 SoftMax 層與標準答案(Ground Truth)的誤差函數(shù),并通過隨機梯ic Gradient Descent )[41]等方法,將梯度方向等信息向前轉播,進而每一權重進行更新,這個過程稱為反向傳播(Back Propagation)。

示意圖,卷積,示意圖,卷積核


的輸出組合成該層的多通道矩陣輸出,即二維特征圖(Featu重能夠辨別局部信息,當圖像局部出現(xiàn)某種變化時,特征圖一個通道堆疊所有卷積核形成的特征圖的激活圖便可以得到個矩陣,通常是 3x3(也可以是 7x7)。輸入圖像的矩陣表,以生成特征映射形成特征圖。使用較小的卷積核可以減少算量,減少計算的復雜度。同時,較小卷積核反而能夠學習的特性是識別特定對象所需要的圖像特征的。例如,每種動絡能夠對它進行識別,而防止圖像信息丟失的方法是擁有許征映射到特征圖中的不同位置,較小卷積核能夠保證特征圖像的范圍產生聯(lián)系,F(xiàn)的卷積操作如圖 2-4 所示:
【學位授予單位】:五邑大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.41;TP18

【相似文獻】

相關期刊論文 前10條

1 陳濤;;基于多示例學習的圖像檢索方法[J];網絡安全技術與應用;2019年04期

2 樂藝;;基于機器學習的大規(guī)模船舶圖像檢索機制[J];艦船科學技術;2019年18期

3 方恩亮;細胞分裂方式圖像檢索[J];中學生物教學;1996年02期

4 冀振燕;姚偉娜;皮懷雨;;個性化圖像檢索和推薦[J];北京郵電大學學報;2017年03期

5 何巖;;以計算機為基礎的色彩圖像檢索方法與研究[J];計算機光盤軟件與應用;2013年12期

6 陳雅芳;;基于顏色特征與紋理特征的圖像檢索[J];硅谷;2012年06期

7 張麗麗;劉昌余;;基于盲取證的醫(yī)學圖像檢索及語義表達研究綜述[J];電腦知識與技術;2012年22期

8 曹梅;;網絡圖像檢索行為與心理研究[J];中國圖書館學報;2011年05期

9 崔文成;邵虹;;基于遺傳算法的圖像檢索中特征權重自動調整[J];計算機工程與應用;2008年02期

10 聶桂軍;周源;;圖像檢索研究進展[J];南京工業(yè)職業(yè)技術學院學報;2008年02期

相關會議論文 前10條

1 陳世亮;李戰(zhàn)懷;閆劍鋒;;一種基于本體描述的空間語義圖像檢索方法[A];第二十一屆中國數(shù)據庫學術會議論文集(技術報告篇)[C];2004年

2 王晗;滕鵬;梁瑋;;使用稠密興趣點包的非對稱風景圖像檢索[A];第七屆和諧人機環(huán)境聯(lián)合學術會議(HHME2011)論文集【poster】[C];2011年

3 許天兵;;一種基于語義分類的圖像檢索方法[A];中國圖象圖形學會第十屆全國圖像圖形學術會議(CIG’2001)和第一屆全國虛擬現(xiàn)實技術研討會(CVR’2001)論文集[C];2001年

4 周向東;張亮;張琪;劉莉;殷慷;施伯樂;;一種新的圖像檢索相關反饋方法[A];第十九屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2002年

5 李凌偉;周榮貴;劉怡;;基于概念的圖像檢索方法[A];第十九屆全國數(shù)據庫學術會議論文集(技術報告篇)[C];2002年

6 朱遠清;李才偉;;一種基于前景與背景劃分的區(qū)域圖像檢索方法及實現(xiàn)[A];第十三屆全國圖象圖形學學術會議論文集[C];2006年

7 彭瑜;喬奇峰;魏昆娟;;基于多示例學習的圖像檢索方法[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

8 胡敬;武港山;;基于語義特征的風景圖像檢索[A];2009年研究生學術交流會通信與信息技術論文集[C];2009年

9 王云鶴;史淼晶;許超;;基于流形聚類的圖像檢索方法[A];第七屆全國信號和智能信息處理與應用學術會議會刊[C];2013年

10 張世佳;黃鑫;王衡;汪國平;;一種基于綜合區(qū)域比較的圖像檢索方法[A];第一屆建立和諧人機環(huán)境聯(lián)合學術會議(HHME2005)論文集[C];2005年

相關重要報紙文章 前1條

1 ;圖像檢索新技術[N];中國知識產權報;2000年

相關博士學位論文 前10條

1 田星;動態(tài)環(huán)境下的圖像檢索問題研究[D];華南理工大學;2019年

2 周容;基于輪廓的圖像檢索研究[D];上海交通大學;2016年

3 李瑩;圖像檢索中的特征表達與排序研究[D];大連理工大學;2019年

4 周菊香;圖像檢索中的特征表達和相似性度量方法研究[D];大連理工大學;2019年

5 劉若愚;圖像檢索中的特征學習和索引技術研究[D];北京交通大學;2019年

6 于來行;基于視覺注意模型的圖像檢索方法研究[D];大連理工大學;2018年

7 蘇雯;語義分割及其在圖像檢索中的應用[D];中國科學技術大學;2018年

8 張憲林;基于草圖的圖像檢索關鍵技術研究[D];北京郵電大學;2019年

9 李珂;基于草圖的精細圖像檢索[D];北京郵電大學;2019年

10 蘇琨;手指靜脈圖像檢索與融合識別方法研究[D];山東大學;2019年

相關碩士學位論文 前10條

1 陸徐超;基于深度學習的視頻圖像檢索的哈希方法研究[D];上海交通大學;2018年

2 陳卓翔;基于隱式相關反饋的無查詢服裝圖像檢索[D];上海交通大學;2018年

3 趙恒川;基于語義的交互式圖像檢索[D];電子科技大學;2019年

4 王標;用于大規(guī)模圖像檢索的哈希編碼方法的研究[D];重慶郵電大學;2018年

5 王培雷;基于殘差網絡的多標簽圖像檢索方法研究[D];桂林電子科技大學;2019年

6 王娟;基于社會化標簽和顯著性區(qū)域的深度學習圖像檢索方法[D];西北大學;2019年

7 葉青青;用卷積神經網絡的多標簽圖像檢索方法研究[D];重慶郵電大學;2018年

8 謝雯斐;基于哈希算法的圖像檢索研究[D];重慶郵電大學;2018年

9 陳建華;基于多特征融合與LSH的密文圖像檢索研究[D];中南林業(yè)科技大學;2019年

10 呂明;基于多特征編碼的圖像檢索[D];河南大學;2019年



本文編號:2689718

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2689718.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶271d2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com