面向圖像檢索的視覺(jué)特征提取及語(yǔ)義標(biāo)注
本文關(guān)鍵詞:面向圖像檢索的視覺(jué)特征提取及語(yǔ)義標(biāo)注,由筆耕文化傳播整理發(fā)布。
【摘要】:目前面向圖像的搜索引擎主要有兩種:一是基于文本信息的圖像檢索系統(tǒng),根據(jù)圖像信息通過(guò)人工進(jìn)行文本描述,該方式是在早期圖像量不大的時(shí)候提出的,F(xiàn)在面對(duì)浩如煙海的圖片量,手工標(biāo)注的方式,勞力耗費(fèi)太大,并且具有較強(qiáng)的主觀性,標(biāo)注的人根據(jù)自己的認(rèn)知進(jìn)行判斷,圖片反饋的信息很大程度上跟人的心理活動(dòng)有關(guān),因此這種檢索方式已經(jīng)越來(lái)越不能滿足現(xiàn)在的要求。二是基于圖像視覺(jué)內(nèi)容的圖像檢索系統(tǒng)。主要是通過(guò)提取穩(wěn)定的圖像視覺(jué)特征并形成描述子,構(gòu)建以距離相似度為索引方式進(jìn)行檢索,返回按照底層特征相似度大小排序的圖像。但是人們檢索的思維習(xí)慣是在語(yǔ)義基礎(chǔ)上,視覺(jué)底層相似的圖像可能表達(dá)不同的語(yǔ)義信息,視覺(jué)特征不相同的圖像的語(yǔ)義信息有可能是相同的。這就是通常意義上基于內(nèi)容圖像檢索帶來(lái)的“語(yǔ)義鴻溝”。本文就此展開(kāi)研究,在機(jī)器學(xué)習(xí)的基礎(chǔ)上,將圖像底層視覺(jué)特征與高層語(yǔ)義建立映射關(guān)系,結(jié)合監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩種方式構(gòu)建語(yǔ)義標(biāo)注模型。選用Dense SIFT采樣形成SIFT局部描述符,完成對(duì)圖像的特征提取和描述。由于特征維數(shù)較大,對(duì)每個(gè)描述符進(jìn)行降維,接下來(lái)對(duì)特征進(jìn)一步表達(dá),分別選用詞袋(Bag of Word, BOW)、局部特征聚合描述符(Vector of Locally Aggregated Descriptors, VLAD)、Fisher向量(Fisher Vector, FV)。FV相對(duì)BOW具有較大的數(shù)據(jù)編碼優(yōu)勢(shì),用較少的視覺(jué)詞典形成更加細(xì)致的中間表達(dá)。為了彌補(bǔ)特征描述子的不足,引入了空間金字塔的特征表示方法,豐富了圖像特征空間信息,最后使用支持向量機(jī)標(biāo)注圖像語(yǔ)義。圖像語(yǔ)義標(biāo)注模型被建立,圖像檢索可通過(guò)語(yǔ)義特征實(shí)現(xiàn)。但語(yǔ)義空間內(nèi)相似圖像太多,有時(shí)仍不能滿足用戶的需求。因此在此基礎(chǔ)上,本文在圖像檢索系統(tǒng)上加入圖像底層視覺(jué)特征的直接索引作為輔助檢索,能夠按照用戶視覺(jué)上相似度進(jìn)行排序,進(jìn)一步實(shí)現(xiàn)精確查找。該實(shí)現(xiàn)方法兼顧了由有監(jiān)督學(xué)習(xí)的方式得到的圖像語(yǔ)義特征和由無(wú)監(jiān)督學(xué)習(xí)的方式得到的底層視覺(jué)特征兩種方式的優(yōu)點(diǎn),不僅實(shí)現(xiàn)了更符合人思維習(xí)慣的圖像檢索方式,通過(guò)自然語(yǔ)言描述的視覺(jué)概念查找,而且極大的提高了圖像檢索系統(tǒng)的有效性和準(zhǔn)確性。
【關(guān)鍵詞】:圖像檢索 特征提取 空間金字塔 圖像語(yǔ)義
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41
【目錄】:
- 摘要2-3
- Abstract3-7
- 第一章 緒論7-11
- 1.1 課題的研究背景及意義7-8
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀8-9
- 1.3 本文的主要研究?jī)?nèi)容及各章節(jié)的安排9-11
- 第二章 圖像檢索的視覺(jué)特征提取方法11-24
- 2.1 顏色特征11-15
- 2.1.1 顏色直方圖13-14
- 2.1.2 顏色相關(guān)圖14-15
- 2.1.3 顏色矩15
- 2.2 空間/頻率域的紋理特征15-18
- 2.2.1 基于Gabor小波紋理特征提取15-17
- 2.2.2 離散小波變換的紋理特征提取17-18
- 2.3 形狀特征18-19
- 2.3.1 傅立葉形狀描述子18-19
- 2.3.2 形狀無(wú)關(guān)矩19
- 2.4 SIFT特征描述子19-23
- 2.4.1 DoG尺度空間生成19-20
- 2.4.2 特征點(diǎn)的搜索20-21
- 2.4.3 確定關(guān)鍵點(diǎn)位置及尺度21-22
- 2.4.4 確定關(guān)鍵點(diǎn)方向22
- 2.4.5 生成特征描述子22-23
- 2.5 小結(jié)23-24
- 第三章 圖像語(yǔ)義提取24-33
- 3.1 主成分分析(Principal Components Analysis,PCA)24-26
- 3.2 K-Means聚類算法26-27
- 3.3 高斯混合模型(Gaussian Mixture Model,GMM)27-28
- 3.4 支持向量機(jī)(SVM)28-32
- 3.4.1 線性支持向量30-31
- 3.4.2 非線性支持向量31-32
- 3.5 小結(jié)32-33
- 第四章 基于不同特征表達(dá)的圖像語(yǔ)義標(biāo)注33-45
- 4.1 圖像的密集采樣SIFT33-34
- 4.2 圖像表示模型34-40
- 4.2.1 視覺(jué)詞袋(Bag of Visual Words)34-36
- 4.2.2 Fisher Vector特征36-37
- 4.2.3 局部特征聚合描述符37-38
- 4.2.4 空間金字塔(Spatial Pyramid)38-40
- 4.3 支持向量機(jī)的核函數(shù)40-42
- 4.3.1 徑向基函數(shù)RBF(Radial Basis Function)40-41
- 4.3.2 直方圖交叉核函數(shù)(Histogram Intersection Kernel Function)41-42
- 4.4 實(shí)驗(yàn)及結(jié)果分析42-43
- 4.5 小結(jié)43-45
- 第五章 圖像檢索系統(tǒng)設(shè)計(jì)與仿真45-54
- 5.1 圖像檢索的索引45
- 5.2 綜合多特征和語(yǔ)義的圖像檢索45-47
- 5.3 系統(tǒng)評(píng)價(jià)參數(shù)47-48
- 5.4 實(shí)驗(yàn)結(jié)果48-52
- 5.5 小結(jié)52-54
- 第六章 總結(jié)和展望54-56
- 6.1 研究工作總結(jié)54-55
- 6.2 展望55-56
- 致謝56-57
- 參考文獻(xiàn)57-62
- 作者簡(jiǎn)介62
- 攻讀碩士學(xué)位期間研究成果62-63
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 丁世飛;齊丙娟;譚紅艷;;支持向量機(jī)理論與算法研究綜述[J];電子科技大學(xué)學(xué)報(bào);2011年01期
2 劉現(xiàn)平;宋良圖;;綜合顏色和空間信息的圖像檢索[J];計(jì)算機(jī)工程與應(yīng)用;2005年35期
3 張?jiān)?包駿杰;況夯;鐘洪;;基于貝葉斯理論的圖像標(biāo)注和檢索[J];計(jì)算機(jī)科學(xué);2008年08期
4 阿卜杜如蘇力·奧斯曼;吐?tīng)柡榻ぐ⒉级伎肆δ?馬麗亞木·阿布來(lái)孜;;綜合顏色特征與形狀特征的圖像檢索算法[J];計(jì)算機(jī)工程與應(yīng)用;2013年07期
5 周書(shū)仁;殷建平;;基于Haar特性的LBP紋理特征[J];軟件學(xué)報(bào);2013年08期
6 徐慶;楊維維;陳生潭;;基于內(nèi)容的圖像檢索技術(shù)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年01期
7 孟繁杰;郭寶龍;;使用興趣點(diǎn)局部分布特征及多示例學(xué)習(xí)的圖像檢索方法[J];西安電子科技大學(xué)學(xué)報(bào);2011年02期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 張磊;圖像分類和圖像語(yǔ)義標(biāo)注的研究[D];山東大學(xué);2008年
本文關(guān)鍵詞:面向圖像檢索的視覺(jué)特征提取及語(yǔ)義標(biāo)注,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):353684
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/353684.html