基于內(nèi)容的半監(jiān)督圖像檢索
本文關(guān)鍵詞:基于內(nèi)容的半監(jiān)督圖像檢索,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著科技的發(fā)展和人民日常需求的提高,圖像檢索已經(jīng)成為人們生活中不可缺少的一部分。目前大多數(shù)的搜索引擎(Bing, Google, Baidu等)對圖像的檢索都是基于文本檢索,由于這些文本信息不能全面地描述圖像內(nèi)容,導致圖像內(nèi)容與相關(guān)文字信息往往并不匹配,因此基于內(nèi)容的圖像檢索(CBIR,Content-Based Image Retrieval)成為當前計算機視覺領(lǐng)域的熱門課題。然而,不合適的相似度測量和特征量化,噪音干擾,特征檢測丟失,與語義概念之間存在很大的語義鴻溝,導致通過單一視覺特征得到檢索結(jié)果往往并不非常理想。 本論文深入分析了多種圖像底層特征以及圖像檢索中重排序的方法,引入了目前比較火熱的深度學習概念.;贏utoencoder模型,對全局特征和局部特征進行非線性融合,有效地提高了特征間的互補性。同時我們引入文本檢索中查詢擴展的思想,在半監(jiān)督模式下實現(xiàn)重排序。即利用少量的有標簽數(shù)據(jù),在離線情況下對數(shù)據(jù)集進行聚類建立索引,在線階段中檢測置信集作為訓練數(shù)據(jù),用加速隨機對偶上升算法訓練學習RankNet打分模型,進一步地提高了檢索效果。 在實驗部分,我們的方法已經(jīng)成功應用于Paris, FranceLandmark以及TRECVID INS2012(Instance Search)評測集中。實驗證明該算法可以改善不同初始檢索結(jié)果,彌補了一般重排序算法容易受到初始排名影響的缺陷。同時半監(jiān)督模式的索引結(jié)構(gòu)不僅減少了運算量,同時減少了圖片底層特征和高層語義的鴻溝。
【關(guān)鍵詞】:Autoencoder 特征融合 半監(jiān)督 加速隨機對偶坐標上升 重排序
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.41
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 符號說明9-10
- 第一章 緒論10-18
- 1.1. 課題研究背景及意義10-12
- 1.2. 基于內(nèi)容的圖像檢索目前的研究現(xiàn)狀及相關(guān)技術(shù)12-16
- 1.2.1. 特征融合的相關(guān)技術(shù)12-13
- 1.2.2. 重排序的相關(guān)技術(shù)13-16
- 1.3. 圖像檢索重排序的研究意義16
- 1.4. 論文的研究內(nèi)容和組織結(jié)構(gòu)16-18
- 第二章 基于Autoencoder的非線性特征融合18-34
- 2.1 基于內(nèi)容的視覺特征18-26
- 2.1.1 局部特征18-22
- 2.1.2 全局特征22-26
- 2.2 特征融合的關(guān)鍵技術(shù)26-28
- 2.2.1 主成分分析(PCA)26-27
- 2.2.2 Autoencoder27-28
- 2.3 基于Autoencoder的非線性特征融合的基本框架28-29
- 2.4 實驗結(jié)果與分析29-33
- 2.4.2 實驗數(shù)據(jù)與評價準則29-30
- 2.4.3 實驗結(jié)果與分析30-33
- 2.5 本章小結(jié)33-34
- 第三章 半監(jiān)督的重排序算法34-51
- 3.1 查詢模型34-36
- 3.1.1 檢索結(jié)構(gòu)34-35
- 3.1.2 幾何校驗35-36
- 3.2 重排序模型36-45
- 3.2.1 重排序的關(guān)鍵技術(shù)37-39
- 3.2.2 檢測置信集的系統(tǒng)框架39-43
- 3.2.3 訓練打分器的系統(tǒng)框架43-45
- 3.3 實驗結(jié)果與分析45-49
- 3.3.1 實驗數(shù)據(jù)與評價準則45
- 3.3.2 實驗結(jié)果與分析45-49
- 3.4 本章小結(jié)49-51
- 第四章 總結(jié)與展望51-53
- 4.1 論文總結(jié)51-52
- 4.2 工作展望52-53
- 參考文獻53-58
- 致謝58-59
- 作者攻讀學位期間發(fā)表的學術(shù)論文目錄59
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 杜慧茜;郭林楠;梅文博;任彥芳;;基于B樣條函數(shù)的偏微分方程圖像去噪[J];兵工學報;2008年08期
2 陳冰;趙亦工;李欣;;基于高斯尺度空間的末制導目標跟蹤方法[J];兵工學報;2009年05期
3 張少輝;沈曉蓉;范耀祖;;一種基于圖像特征點提取及匹配的方法[J];北京航空航天大學學報;2008年05期
4 李志成;秦世引;Itti Laurent;;遙感圖像的顯著-概要特征提取與目標檢測[J];北京航空航天大學學報;2010年06期
5 高鑫,劉來福;基于水平集曲率的圖像濾噪與增強[J];北京師范大學學報(自然科學版);2001年01期
6 郇中丹,孔令海,黃海洋;圖像強化去噪的一種偏微模型[J];北京師范大學學報(自然科學版);2003年06期
7 ;Natural Scene Classification Inspired by Visual Perception and Cognition Mechanisms[J];重慶理工大學學報(自然科學);2011年07期
8 曲福恒;楊勇;胡雅婷;陳學廣;;硬度圖像角點檢測算法[J];長春理工大學學報(自然科學版);2011年03期
9 騫森;朱劍英;;圖像的退化不變量研究[J];傳感器與微系統(tǒng);2007年12期
10 梁艷菊;李慶;林蓁蓁;陳大鵬;;一種基于SURF的全景圖像配準算法[J];傳感器與微系統(tǒng);2012年05期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 ;Rapid Target Recognition and Tracking under Large Scale Variation Using Semi-Naive Bayesian[A];第二十九屆中國控制會議論文集[C];2010年
2 ;Regression Based Profile Face Annotation From a Frontal Image[A];中國自動化學會控制理論專業(yè)委員會A卷[C];2011年
3 汪巍;蔡志祥;;基于asift算法的人臉識別[A];2011下一代自動測試系統(tǒng)學術(shù)研討會論文集[C];2011年
4 李姍琦;孫永宣;高雋;謝昭;;層次Dirichlet過程模型下的目標分析與識別[A];2011中國儀器儀表與測控技術(shù)大會論文集[C];2011年
5 郭武;李文輝;張振花;韓東峰;易榮慶;;一種基于局部特征的魯棒的盲數(shù)字水印算法[A];第八屆全國信息隱藏與多媒體安全學術(shù)大會湖南省計算機學會第十一屆學術(shù)年會論文集[C];2009年
6 張潔琳;林秉雄;;Gabor-SIFT:一種新的特征點匹配方法[A];第六屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2010)、第19屆全國多媒體學術(shù)會議(NCMT2010)、第6屆全國人機交互學術(shù)會議(CHCI2010)、第5屆全國普適計算學術(shù)會議(PCC2010)論文集[C];2010年
7 王晗;滕鵬;梁瑋;;使用稠密興趣點包的非對稱風景圖像檢索[A];第七屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2011)論文集【poster】[C];2011年
8 溫文雅;陳建華;;一種基于特征點的圖像匹配算法[A];2009系統(tǒng)仿真技術(shù)及其應用學術(shù)會議論文集[C];2009年
9 李竹林;趙宗濤;王文發(fā);馬燕;;一種缺失攝像機標定參數(shù)圖像的立體匹配方法[A];第十三屆全國圖象圖形學學術(shù)會議論文集[C];2006年
10 張相芬;陳武凡;王沛;陳勝;何宏;;基于組合濾波器的圖像噪聲去除方法[A];第十五屆全國圖象圖形學學術(shù)會議論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 王玉全;基于全景視覺的移動機器人同時定位與地圖創(chuàng)建方法研究[D];哈爾濱工程大學;2010年
2 任楨;圖像分類任務(wù)的關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2010年
3 沈鄭燕;聲納圖像去噪與分割技術(shù)研究[D];哈爾濱工程大學;2010年
4 孔凡芝;引線鍵合視覺檢測關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2009年
5 肖潔;視覺注意模型及其在目標感知中的應用研究[D];華中科技大學;2010年
6 朱清波;序列圖像三維重建方法研究[D];華中科技大學;2010年
7 田文;多視圖圖像的快速三維場景重建[D];華中科技大學;2010年
8 涂虬;智能視覺監(jiān)視中目標檢測與跟蹤算法研究[D];華中科技大學;2010年
9 章鵬;多尺度特征檢測:方法和應用研究[D];中國科學技術(shù)大學;2010年
10 鹿瑞;自然圖像的顏色恒常性計算研究[D];北京交通大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 倪希亮;基于尺度不變特征的多源遙感影像配準[D];山東科技大學;2010年
2 韓寧;魯棒性圖像水印算法研究[D];遼寧師范大學;2010年
3 婁錚錚;sIB算法在圖像無監(jiān)督分類中的應用研究[D];鄭州大學;2010年
4 金甲;全景視覺圖像去噪與增強方法的研究[D];哈爾濱工程大學;2010年
5 周秋紅;基于多示例學習的運動目標跟蹤算法研究[D];大連理工大學;2010年
6 何昌欽;圖像檢索方法研究[D];大連理工大學;2010年
7 林秉雄;SIFT特征匹配標準與匹配方式的改進與應用[D];大連理工大學;2010年
8 李磊;分裂Bregman方法在圖像處理中的應用[D];大連理工大學;2010年
9 藍國寧;基于變分偏微分方程的細胞神經(jīng)網(wǎng)絡(luò)水下圖像噪聲抑制[D];中國海洋大學;2010年
10 羅佳;基于SIFT的人臉識別研究[D];湘潭大學;2010年
本文關(guān)鍵詞:基于內(nèi)容的半監(jiān)督圖像檢索,,由筆耕文化傳播整理發(fā)布。
本文編號:320795
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/320795.html