基于弱監(jiān)督的圖像區(qū)域自動(dòng)標(biāo)注算法研究
本文關(guān)鍵詞:基于弱監(jiān)督的圖像區(qū)域自動(dòng)標(biāo)注算法研究
更多相關(guān)文章: 弱監(jiān)督 圖像區(qū)域標(biāo)注 判別語義圖
【摘要】:在本文中,我們關(guān)注一個(gè)挑戰(zhàn)性的問題—基于弱監(jiān)督的圖像區(qū)域標(biāo)注,即在數(shù)據(jù)集中只有圖像層標(biāo)簽這種弱監(jiān)督信息可以使用。圖像區(qū)域標(biāo)注在計(jì)算機(jī)視覺以及圖像信息檢索領(lǐng)域中有廣闊的應(yīng)用場景,并且能夠在一定程度上打破高層語義和在計(jì)算機(jī)中圖像的低層像素表示之間的語義鴻溝。傳統(tǒng)的圖像區(qū)域標(biāo)注問題需要大量的帶有區(qū)域標(biāo)簽的數(shù)據(jù),但是標(biāo)注這些數(shù)據(jù)是非常耗時(shí)耗力的。圖像層的標(biāo)簽,對于圖像區(qū)域標(biāo)注這較為細(xì)粒度任務(wù)具有非常的不確定性,但是圖像層標(biāo)簽非常容易獲得。各種互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式產(chǎn)生也為弱監(jiān)督問題提供了大量的初始數(shù)據(jù)。弱監(jiān)督圖像區(qū)域標(biāo)注目前僅有較少的研究工作,本文主要有以下貢獻(xiàn):一、對弱監(jiān)督學(xué)習(xí)的解決方法進(jìn)行了完整的綜合性介紹。在弱監(jiān)督學(xué)習(xí)過程中,由于數(shù)據(jù)具有不確定性,通常情況下,需要借助上下文的信息來降低樣本標(biāo)簽的不確定性,我們稱為協(xié)同標(biāo)注。我們首先介紹了KNN和稀疏編碼兩種方式來尋找目標(biāo)的上下文信息,同時(shí)我們介紹了如何使用這種上下文信息構(gòu)建語義圖以及如何在圖上進(jìn)行標(biāo)簽的傳播,本文中我們介紹了兩種標(biāo)簽傳播的方法,馬爾科夫隨機(jī)游走以及譜聚類。二、提出了基于判別語義的構(gòu)建上下文的方法。我們注意到,弱監(jiān)督的圖像區(qū)域的標(biāo)注傳播主要問題在于如何找到有效的上下文信息進(jìn)行協(xié)同標(biāo)注,而傳統(tǒng)的完全基于相似性的上下文獲取方式容易導(dǎo)致過同質(zhì)化問題,即上下文超像素中的視覺信息以及圖像層標(biāo)簽都非常相似,各種語義標(biāo)簽共現(xiàn)現(xiàn)象導(dǎo)致目標(biāo)超像素的標(biāo)簽具有不確定性。所以我們提出了基于判別語義的上下文查詢方式,我們對判別語義進(jìn)行了定義,在上下文查詢中,不僅僅考慮視覺相似性和語義相關(guān)性,還考慮判別語義(Discriminative Semantics)的信息。我們提出了如何根據(jù)判別語義信息構(gòu)建判別語義圖(Discriminatively Semantic Graph,DSG)。三、我們提出了如何在構(gòu)建的判別語義圖上面進(jìn)行標(biāo)簽的傳播。我們通過構(gòu)建兩種語義圖將標(biāo)簽傳播分為兩個(gè)部分,在inter-image圖(DSG)上我們考慮不同圖像間的上下文信息來得到超像素的標(biāo)簽分布概率。在每個(gè)intra-image圖上我們考慮每張圖像的相鄰超像素節(jié)點(diǎn)的視覺信息和語義標(biāo)簽來建立能量函數(shù),通過Graph Cuts方法求解能力函數(shù)得到最終超像素的標(biāo)簽分配。我們的實(shí)驗(yàn)是在兩個(gè)數(shù)據(jù)集MSRC-21以及PASCAL VOC 2007上進(jìn)行的,使用平均類別準(zhǔn)確率以及單一類別準(zhǔn)確率作為評測的指標(biāo)。我們的方法在兩個(gè)數(shù)據(jù)集的多個(gè)單一類別以及平均類別準(zhǔn)確率都取得了較高的準(zhǔn)確率,進(jìn)而證明了我們方法的有效性。
【關(guān)鍵詞】:弱監(jiān)督 圖像區(qū)域標(biāo)注 判別語義圖
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要8-10
- ABSTRACT10-12
- 第一章 緒論12-17
- 1.1 研究背景12-13
- 1.2 相關(guān)工作13-14
- 1.3 我們的方法14-17
- 第二章 圖像區(qū)域的獲取和表示17-27
- 2.1 圖像區(qū)域獲取17-23
- 2.1.1 SLIC分割17-20
- 2.1.2 基于譜聚類的圖像分割20-23
- 2.2 圖像區(qū)域的描述23-26
- 2.2.1 顏色直方圖23-24
- 2.2.2 基于視覺詞袋的視覺描述24-26
- 2.3 本章小結(jié)26-27
- 第三章 弱監(jiān)督圖像區(qū)域標(biāo)注相關(guān)方法27-38
- 3.1 常用符號27-29
- 3.2 弱監(jiān)督中圖像區(qū)域的協(xié)同標(biāo)注29-33
- 3.2.1 KNN上下文搜索30-31
- 3.2.2 Sparsity Coding上下文搜索31-33
- 3.3 基于圖的標(biāo)簽傳播方法33-37
- 3.3.1 隨機(jī)游走方法34-35
- 3.3.2 譜聚類方法35-37
- 3.5 本章小結(jié)37-38
- 第四章 基于判別語義圖方法38-46
- 4.1 判別語義圖的構(gòu)建38-42
- 4.2 判別式標(biāo)簽傳播42-43
- 4.3 標(biāo)簽推斷分配43-44
- 4.4 本章小結(jié)44-46
- 第五章 實(shí)驗(yàn)與分析46-50
- 5.1 數(shù)據(jù)集合實(shí)驗(yàn)設(shè)置46-47
- 5.2 評測標(biāo)準(zhǔn)分析47
- 5.3 標(biāo)注結(jié)果47-49
- 5.4 時(shí)間復(fù)雜度分析49
- 5.5 本章小結(jié)49-50
- 第六章 結(jié)論與展望50-52
- 6.1 結(jié)論50-51
- 6.2 展望51-52
- 參考文獻(xiàn)52-55
- 致謝55-56
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄56-57
- 攻讀學(xué)位期間參加的科研項(xiàng)目57-58
- 附件58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊根福;;圖像區(qū)域選擇方法與技巧[J];印刷雜志;2009年12期
2 王俊文;劉光杰;張湛;戴躍偉;王執(zhí)銓;;圖像區(qū)域復(fù)制篡改快速魯棒取證[J];自動(dòng)化學(xué)報(bào);2009年12期
3 胡衛(wèi)平,邱靜,陸菊康;一種數(shù)字圖像區(qū)域處理技術(shù)的設(shè)計(jì)與應(yīng)用[J];微計(jì)算機(jī)應(yīng)用;2000年06期
4 史進(jìn)玲;;一種度量圖像區(qū)域相似性的粒計(jì)算方法[J];科技信息;2012年26期
5 趙勇;方宗德;田麗麗;;列車車輪踏面缺陷的圖像區(qū)域提取[J];光學(xué)精密工程;2009年04期
6 佟強(qiáng);;圖像區(qū)域粗糙分割情況下的區(qū)域物體分類[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2010年07期
7 余紹鵬;胡永健;譚莉玲;;基于模式分類的圖像區(qū)域作偽檢測[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年02期
8 林意;吳錫生;;一種圖像區(qū)域邊緣表達(dá)方法[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年07期
9 李峰;劉運(yùn)松;馬婷婷;;一種圖像區(qū)域復(fù)制篡改的檢測算法[J];微計(jì)算機(jī)信息;2011年11期
10 王滌瓊,張薇,顧國慶;用頂點(diǎn)鏈編碼計(jì)算圖像區(qū)域密集度和體態(tài)比[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 佟強(qiáng);;圖像區(qū)域粗糙分割情況下的區(qū)域物體分類[A];第四屆全國幾何設(shè)計(jì)與計(jì)算學(xué)術(shù)會(huì)議論文集[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 郭喬進(jìn);基于上下文的圖像區(qū)域標(biāo)注關(guān)鍵技術(shù)研究[D];南京大學(xué);2013年
2 趙潔;數(shù)字圖像區(qū)域復(fù)制篡改的被動(dòng)取證方法研究[D];天津大學(xué);2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 徐小程;基于弱監(jiān)督的圖像區(qū)域自動(dòng)標(biāo)注算法研究[D];山東大學(xué);2016年
2 聶云英;數(shù)字圖像區(qū)域復(fù)制篡改被動(dòng)盲取證新方法研究[D];湖南大學(xué);2011年
3 丁軼;基于LDA的圖像區(qū)域標(biāo)注模型的研究[D];南京大學(xué);2012年
4 歐佳佳;圖像區(qū)域復(fù)制粘貼篡改檢測研究[D];長沙理工大學(xué);2012年
5 徐萍;基于JPEG的感興趣圖像區(qū)域壓縮算法的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2011年
6 梁爽爽;抗自然干擾的圖像區(qū)域復(fù)制篡改盲檢測算法研究[D];沈陽工業(yè)大學(xué);2015年
7 滕舟;基于多標(biāo)簽學(xué)習(xí)的圖像區(qū)域語義自動(dòng)標(biāo)注算法研究[D];復(fù)旦大學(xué);2011年
8 楊素娣;圖像區(qū)域個(gè)數(shù)統(tǒng)計(jì)、圖像重現(xiàn)和圖像旋轉(zhuǎn)算法的研究[D];華東師范大學(xué);2007年
,本文編號:723436
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/723436.html