基于多模態(tài)監(jiān)督學習的圖像重排序算法研究
發(fā)布時間:2017-08-01 09:21
本文關鍵詞:基于多模態(tài)監(jiān)督學習的圖像重排序算法研究
更多相關文章: 圖像檢索重序 監(jiān)督學習 多模態(tài)學習
【摘要】:伴隨著網(wǎng)絡技術的迅猛發(fā)展,伴隨著“互聯(lián)網(wǎng)+”的概念的提出,網(wǎng)絡上涌現(xiàn)出了大量的圖像,人們也期待能夠從這些海量的圖像中快速找尋到自己需要的圖像。由于目前的圖像檢索系統(tǒng)返回的檢索結果不能夠滿足大部分人的要求,因此提出了圖像檢索的重排序算法,以此來提高圖像檢索系統(tǒng)的性能。圖像檢索的重排序是指對由傳統(tǒng)的基于文本檢索的檢索系統(tǒng)中返回的檢索結果中的圖像進行重新的排序,來達到提高圖像檢索的精確度,多樣性等的目的。現(xiàn)在的圖像重排序的方法大部分是基于一種模態(tài)的,由于很難能夠找到一種適合所有查詢的模態(tài),因此提出了多模態(tài)的概念。基于多模態(tài)的圖像重排序是指融合從初始化列表中圖像的多種視覺特征中學習得到的重排序特征進行圖像檢索的重排序。本文圍繞著如何更加高效的利用多模態(tài)來提高圖像檢索的重排序性能,主要討論了圖像視覺特征的選擇、圖像相似度計算、圖像生成特征的計算和圖像生成特征權重的計算這四個方面的問題。論文的主要工作歸納如下:(1)對于由基于文本檢索的搜索引擎返回的初始化列表中的每一幅圖像提取以下六種視覺特征:HSV顏色直方圖特征、RGB顏色直方圖特征、基于分塊的顏色矩特征、顏色相關圖特征、邊緣方向直方圖特征、基于小波變換的紋理特征。(2)根據(jù)不同的模態(tài)建立不同的相似圖,其中圖中頂點是指初始列表中的圖像,頂點之間的權重是指圖像之間相似度。不同的相似圖是根據(jù)不同的模態(tài)建立的,為了更加準確的計算圖像之間的相似度,對于不同的模態(tài),我們采用不同的相似度計算方法。(3)在相似圖和圖像的初始化排名的基礎上,我們將多模態(tài)的圖像視覺特征轉化為獨立于查詢的幾種圖像重排序特征,分別叫做基于PageRank的偽相關反饋特征、密度特征以及根據(jù)初始化排名計算得到的初始化得分特征,并將它們?nèi)诤系揭粋19維的特征向量,因此我們就可以將初始化列表中的每一幅圖像利用一個19維的特征向量來進行表示。(4)我們利用監(jiān)督學習的方法來學習(3)中得到的每一維圖像重排序特征的權重。(5)在實驗中,我們在由微軟亞洲研究院提供的數(shù)據(jù)集:MSRA-MM上對本文提出的算法進行評價,并且利用NDCG作為評價指標。我們將本文提出的圖像重排序算法與已有的較完善的圖像重排序算法進行比較,主要有以下幾種:基于貝葉斯的圖像重排序算法、基于偽相關反饋的圖像重排序算法。實驗結果顯示,本文提出的方法在評測指標NDCG上較其他方法有了較大的提高。并且本文還比較了不同的初始化排名對于圖像重排序結果的影響,結果顯示本文提出的方法受初始化排名的影響最小,以此證明了該方法的穩(wěn)定性。
【關鍵詞】:圖像檢索重序 監(jiān)督學習 多模態(tài)學習
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要8-10
- Abstract10-12
- 第一章 緒論12-16
- 1.1 研究背景12-13
- 1.2 研究意義13-14
- 1.3 主要貢獻14
- 1.4 本文的組織結構14-16
- 第二章 相關研究現(xiàn)狀16-20
- 2.1 圖像檢索的重排序簡介16
- 2.2 圖像檢索的重排序框架16-17
- 2.3 圖像重排序常用方法17-19
- 2.3.1 監(jiān)督學習方法17-18
- 2.3.2 非監(jiān)督學習方法18-19
- 2.4 本章小結19-20
- 第三章 基于多模態(tài)監(jiān)督學習的圖像重排序算法20-38
- 3.1 引言20-22
- 3.2 基于多模態(tài)監(jiān)督學習的圖像重排序算法22-25
- 3.3 圖像的視覺特征25-29
- 3.3.1 HSV顏色直方圖(HCH)25-26
- 3.3.2 RGB顏色直方圖(RCH)26
- 3.3.3 基于分塊的顏色矩(BCM)26-27
- 3.3.4 顏色相關圖(CC)27
- 3.3.5 邊緣方向直方圖(EDH)27-28
- 3.3.6 基于小波變換的紋理特征(WT)28-29
- 3.4 圖像的生成特征29-34
- 3.4.1 基于PageRank的偽相關反饋(PPRF)29-32
- 3.4.2 密度特征(DF)32
- 3.4.3 初始化得分特征(IRS)32-34
- 3.5 圖像的相似度計算34-35
- 3.5.1 Jensen-Shannon散度34
- 3.5.2 徑向基函數(shù)34-35
- 3.5.3 交距離35
- 3.6 特征權重的學習——RankSVM35-37
- 3.6.1 SVM35-36
- 3.6.2 RankSVM36-37
- 3.7 本章小結37-38
- 第四章 實驗結果與分析38-46
- 4.1 數(shù)據(jù)集38-39
- 4.2 評價準則39-41
- 4.3 對比方法41-42
- 4.4 實驗結果42-45
- 4.4.1 所有查詢上的性能比較42-43
- 4.4.2 不同初始化列表上的性能比較43-45
- 4.5 本章小結45-46
- 第五章 總結與展望46-48
- 5.1 工作總結46-47
- 5.2 展望未來47-48
- 參考文獻48-51
- 致謝51-52
- 攻讀學位期間發(fā)表的學術論文目錄52-53
- 攻讀學位期間參加的科研項目情況53-54
- 攻讀學位期間獲獎情況54-55
- 學位論文評閱及答辯情況表55
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孟勇,洪丹輝,毛丹;測度熵在圖像紋理分析中的應用[J];計算機應用與軟件;2000年08期
2 吳濤;秦昆;;圖像紋理特征數(shù)據(jù)挖掘的理論與方法探討[J];計算機時代;2006年08期
3 方玲玲;王相海;;圖像挖掘研究[J];計算機科學;2009年08期
4 高振宇;楊曉梅;龔劍明;金海;;圖像復雜度描述方法研究[J];中國圖象圖形學報;2010年01期
5 劉勇,施萬昌,徐玉蘭;圖像差異的分析與識別[J];復旦學報(自然科學版);2000年05期
6 羅l,
本文編號:603565
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/603565.html
最近更新
教材專著