圖像檢索中自動標注、標簽處理和重排序問題的研究
發(fā)布時間:2017-09-20 14:11
本文關(guān)鍵詞:圖像檢索中自動標注、標簽處理和重排序問題的研究
更多相關(guān)文章: 圖像檢索 圖像標注 標簽相關(guān)度學習 標簽推薦 圖像重排序 排序?qū)W習 結(jié)構(gòu)化學習
【摘要】:近年來,隨著數(shù)碼拍照設(shè)備的普及以及網(wǎng)絡和存儲技術(shù)的發(fā)展,網(wǎng)絡中圖像的數(shù)量呈現(xiàn)出爆炸式的增長趨勢。特別是伴隨Web 2.0技術(shù)的出現(xiàn),海量用戶產(chǎn)生的圖像得以通過社交分享網(wǎng)站(如Flickr和Instagram)被分享和傳播。與此同時,互聯(lián)網(wǎng)中圖像資源的快速增長也催生了對高效的圖像檢索系統(tǒng)的需求,F(xiàn)有的商用圖像檢索系統(tǒng)需要依賴圖像附加的文本信息來為用戶提供檢索服務。但是,人工進行圖像標注的過程費時費力,因此自動圖像標注技術(shù)受到圖像檢索領(lǐng)域的廣泛研究。另一方面,對于社交分享網(wǎng)站中的圖像,用戶提供的標簽往往不能準確且全面地描述圖像的真實內(nèi)容,因而也難以作為圖像檢索中可靠的索引關(guān)鍵字。因此,圖像檢索研究中的一項基礎(chǔ)研究是來處理圖像的標簽信息,特別是提高標簽對圖像內(nèi)容的描述能力。除此之外,由于僅利用了圖像的文本信息,現(xiàn)有的圖像檢索系統(tǒng)返回的結(jié)果往往并不能令人滿意。因此,如何基于圖像的視覺信息對原始的檢索結(jié)果進行重排序也是圖像檢索領(lǐng)域的重要問題之一。本文展開了一系列研究工作來提高當前圖像檢索系統(tǒng)的性能,詳細討論了圖像標注、標簽相關(guān)度學習、標簽推薦和圖像重排序這四個重要問題。論文的主要工作和創(chuàng)新性可以歸納為以下幾個方面:(1)本文提出了一種新穎的圖像標注方法,該方法同時改進了基于近鄰的方法中的兩個階段。在近鄰搜索階段,不同于現(xiàn)有的方法通過預測距離來發(fā)現(xiàn)視覺近鄰,我們介紹了一種面向排序的近鄰搜索機制,采用排序?qū)W習框架來直接優(yōu)化已標注圖像相對于待標注圖像的相對順序,而非它們之間的絕對距離。在排序過程中,我們利用了已標注圖像中隱含的偏序信息并強調(diào)高位置的排序結(jié)果的準確性。在關(guān)鍵詞傳遞階段,不同于現(xiàn)有的方法采用簡單的啟發(fā)式規(guī)則來選擇傳遞關(guān)鍵詞,我們介紹了一種基于學習的關(guān)鍵詞傳遞策略,利用監(jiān)督學習技術(shù)來學習一個可以評估候選關(guān)鍵詞相關(guān)度的得分函數(shù)。關(guān)鍵詞的相關(guān)度是根據(jù)它與待標注圖像的視覺近鄰之間的不同關(guān)系來決定的。在Corel 5K和MIRFlickr數(shù)據(jù)集上的大量實驗證明了該方法的有效性。(2)本文提出了一種面向排序的標簽相關(guān)度學習方法,該方法從排序?qū)W習的角度來解決標簽相關(guān)度學習這一問題,并在學習過程中直接優(yōu)化基于標簽的圖像檢索的排序性能。具體來說,我們將監(jiān)督學習的步驟引入到近鄰投票策略中,該策略通過累積視覺近鄰的投票來估計一個標簽的相關(guān)度。通過明確地建模視覺近鄰的權(quán)重以及標簽之間的相關(guān)系數(shù),我們的方法有效地避免了傳統(tǒng)的非監(jiān)督學習方法中進行啟發(fā)式假設(shè)的風險。此外,我們的方法也解決了傳統(tǒng)的監(jiān)督學習方法中的可擴展性問題。通過在兩個基準數(shù)據(jù)集上與其他先進的方法進行比較,我們證明了本文的方法的有效性。(3)本文提出了一種結(jié)合相關(guān)性和多樣性的圖像標簽推薦方法。以往的圖像標簽推薦方法往往利用標簽間的共現(xiàn)信息來進行標簽推薦。但是,由于忽略了圖像的視覺信息以及被推薦標簽之間的語義多樣性,以往方法的推薦結(jié)果常存在標簽歧義和標簽冗余的問題。為了解決上述問題,我們的方法在推薦時綜合考慮了被推薦標簽的相關(guān)性和多樣性。首先,方法建模每一個標簽的視覺語言模型,并利用它來分別計算標簽和圖像的相關(guān)性以及標簽之間的視覺距離。然后,基于上述計算,我們提出了一個貪心選擇算法來找到能合理地平衡相關(guān)性和多樣性的標簽集合,將該集合作為最終的推薦。在Flickr數(shù)據(jù)集上的實驗表明,本文的方法在準確率、主題覆蓋率和F1測度上均優(yōu)于其他先進的方法。(4)本文提出了一種結(jié)合相關(guān)性和多樣性的圖像重排序方法,該方法是一個基于聚類的重排序方法,綜合了已有的相互投票算法和貪心選擇算法的優(yōu)點。我們的方法利用相互投票算法在原始搜索結(jié)果中選擇一些圖像作為候選代表圖像,并利用一個受限制的貪心選擇算法來選擇最相關(guān)且最有新鮮感的圖像作為聚類中心。為了計算圖像間相似度,我們結(jié)合了包括顏色、形狀特別是潛在主題模型在內(nèi)的多種特征,并詳細討論了結(jié)合不同特征的好處。我們在真實的Web圖像數(shù)據(jù)集上對本文的方法進行評估,實驗結(jié)果表明本文的方法可以從聚類召回率、NDCG和F1值等不同方面來提高用戶滿意度。
【關(guān)鍵詞】:圖像檢索 圖像標注 標簽相關(guān)度學習 標簽推薦 圖像重排序 排序?qū)W習 結(jié)構(gòu)化學習
【學位授予單位】:山東大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 摘要13-15
- ABSTRACT15-18
- 第1章 緒論18-24
- 1.1 研究背景18-20
- 1.2 本文的研究內(nèi)容及意義20-21
- 1.3 本文的貢獻及創(chuàng)新點21-23
- 1.4 本文的組織結(jié)構(gòu)23-24
- 第2章 相關(guān)研究工作現(xiàn)狀24-33
- 2.1 圖像標注24-27
- 2.1.1 模型驅(qū)動的方法24-26
- 2.1.2 數(shù)據(jù)驅(qū)動的方法26-27
- 2.2 圖像標簽處理27-30
- 2.2.1 標簽修正28
- 2.2.2 標簽排序28-29
- 2.2.3 標簽相關(guān)度學習29
- 2.2.4 標簽推薦29-30
- 2.3 圖像重排序30-32
- 2.3.1 相關(guān)性重排序30-31
- 2.3.2 多樣性重排序31-32
- 2.4 本章小結(jié)32-33
- 第3章 本文涉及的基礎(chǔ)知識33-45
- 3.1 圖像視覺特征提取33-36
- 3.1.1 顏色直方圖33
- 3.1.2 顏色矩33-34
- 3.1.3 顏色相關(guān)圖34
- 3.1.4 可伸縮顏色描述子34
- 3.1.5 基于小波變換的紋理特征34
- 3.1.6 邊緣方向直方圖34-35
- 3.1.7 GIST特征描述子35
- 3.1.8 SIFT特征描述子35
- 3.1.9 視覺詞袋模型35-36
- 3.2 視覺語言模型36-38
- 3.3 概率主題模型38-40
- 3.4 排序?qū)W習40-42
- 3.5 結(jié)構(gòu)化支持向量機42-43
- 3.6 本章小節(jié)43-45
- 第4章 改進的基于近鄰的圖像標注方法45-69
- 4.1 概述45-47
- 4.2 面向排序的近鄰搜索機制47-52
- 4.2.1 隱式偏序信息挖掘48-50
- 4.2.2 關(guān)注Top-K的排序算法50-52
- 4.3 基于學習的關(guān)鍵詞傳遞策略52-58
- 4.3.1 聯(lián)合特征表示53-55
- 4.3.2 基于Structural SVM的學習55-58
- 4.4 實驗評估58-68
- 4.4.1 數(shù)據(jù)集58-60
- 4.4.2 評價指標60-61
- 4.4.3 參數(shù)設(shè)置61-63
- 4.4.4 與其他方法的比較63-65
- 4.4.5 方法組件的有效性65-67
- 4.4.6 計算時間花費67-68
- 4.5 本章小結(jié)68-69
- 第5章 面向排序的標簽相關(guān)度學習方法69-91
- 5.1 概述69-71
- 5.2 標簽相關(guān)度形式化推導71-74
- 5.2.1 視覺近鄰搜索71-72
- 5.2.2 標簽相關(guān)度函數(shù)72-74
- 5.3 面向排序的學習過程74-79
- 5.3.1 問題轉(zhuǎn)換74-75
- 5.3.2 優(yōu)化問題定義75-77
- 5.3.3 學習算法77-79
- 5.4 實驗配置79-82
- 5.4.1 數(shù)據(jù)集79-80
- 5.4.2 評價方法及指標80-81
- 5.4.3 對比方法81-82
- 5.4.4 參數(shù)設(shè)置82
- 5.5 實驗結(jié)果82-90
- 5.5.1 圖像檢索任務上的結(jié)果分析82-84
- 5.5.2 標簽推薦任務上的結(jié)果分析84-85
- 5.5.3 訓練效率比較85-86
- 5.5.4 模型參數(shù)帶來的好處86-88
- 5.5.5 模型參數(shù)可視化88-89
- 5.5.6 潛在語義空間維度的影響89-90
- 5.6 本章小結(jié)90-91
- 第6章 結(jié)合相關(guān)性和多樣性的圖像標簽推薦方法91-105
- 6.1 概述91-94
- 6.2 標簽的相關(guān)性和標簽間的視覺距離94-96
- 6.2.1 標簽與圖像的相關(guān)性94-95
- 6.2.2 標簽間的視覺距離95-96
- 6.3 圖像標簽推薦方法96-98
- 6.3.1 標簽集合的相關(guān)性與多樣性96-97
- 6.3.2 推薦算法描述及時間復雜性分析97-98
- 6.4 實驗評估98-104
- 6.4.1 實驗設(shè)置98-100
- 6.4.2 評價指標100-101
- 6.4.3 實驗結(jié)果分析101-104
- 6.5 本章小結(jié)104-105
- 第7章 結(jié)合相關(guān)性和多樣性的圖像重排序方法105-121
- 7.1 概述105-106
- 7.2 圖像間距離計算106-107
- 7.3 圖像重排序方法107-111
- 7.3.1 相互投票算法108-109
- 7.3.2 貪心選擇算法109
- 7.3.3 圖像重排序算法109-111
- 7.4 實驗評估111-120
- 7.4.1 數(shù)據(jù)集獲取111-113
- 7.4.2 實驗細節(jié)113
- 7.4.3 評價指標113-114
- 7.4.4 參數(shù)選擇114-116
- 7.4.5 實驗結(jié)果116-120
- 7.5 本章小結(jié)120-121
- 第8章 總結(jié)與展望121-123
- 8.1 主要工作總結(jié)121-122
- 8.2 未來工作展望122-123
- 參考文獻123-136
- 致謝136-137
- 攻讀學位期間發(fā)表的學術(shù)論文目錄137-139
- 攻讀學位期間參與科研項目情況139-140
- 攻讀學位期間獲獎情況140-141
- 外文論文141-208
- 附表208
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 崔超然;馬軍;;一種結(jié)合相關(guān)性和多樣性的圖像標簽推薦方法[J];計算機學報;2013年03期
,本文編號:888519
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/888519.html
最近更新
教材專著