圖像語義分割算法研究
本文關(guān)鍵詞:圖像語義分割算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)的普及和多媒體技術(shù)的飛速發(fā)展,造就了以圖像為代表的多媒體信息呈現(xiàn)爆炸式的增長。海量的數(shù)據(jù)帶來了存儲(chǔ)、檢索、管理等多方面的挑戰(zhàn),F(xiàn)行主要搜索引擎均是基于把圖像數(shù)據(jù)的文本描述,缺乏準(zhǔn)確性,不僅如此,在大規(guī)模網(wǎng)絡(luò)圖像的背景下,大量多媒體數(shù)據(jù)缺乏文本描述。因此如何自動(dòng)對(duì)海量圖像數(shù)據(jù)進(jìn)行有效的組織和管理,以及如何對(duì)于每幅圖像產(chǎn)生有效的結(jié)構(gòu)化描述信息就成為了亟待解決的問題。在本文中,我們研究大規(guī)模圖像檢索和理解中的兩個(gè)重要任務(wù):圖像自動(dòng)標(biāo)注和圖像語義分割;深入理解其中存在的問題并提出了全新的解決方案。圖像自動(dòng)標(biāo)注方法使用人工標(biāo)注的圖像對(duì)計(jì)算機(jī)進(jìn)行訓(xùn)練,主要目的是使得計(jì)算機(jī)能夠自動(dòng)對(duì)沒有標(biāo)注的圖像添加語義標(biāo)簽,列出其中存在的語義類別。傳統(tǒng)的基于內(nèi)容的圖像檢索系統(tǒng)需要實(shí)時(shí)根據(jù)圖像內(nèi)容提取的特征來計(jì)算兩幅圖像的相似程度,相比而言,僅基于文本的語義標(biāo)簽檢索復(fù)雜度則低得多。網(wǎng)絡(luò)圖像的激增極大地豐富了人工標(biāo)注圖像的數(shù)量,因此自動(dòng)圖像標(biāo)注的研究對(duì)于當(dāng)前環(huán)境下大規(guī)模圖像檢索和理解有著非常重要的應(yīng)用意義。然而自動(dòng)圖像標(biāo)注模型主要基于圖像層面的特征和標(biāo)簽,其局限性在于無法提供每個(gè)標(biāo)簽的位置,造成了不準(zhǔn)確的結(jié)果。近年來,以獲得每個(gè)區(qū)域乃至于像素的語義類別為目標(biāo)的語義分割引起了全新的研究熱潮。為了更全面地學(xué)習(xí)圖像及其區(qū)域中的語義,本文提出了一個(gè)基于多圖學(xué)習(xí)和塊對(duì)角化約束的全監(jiān)督語義分割方法。由于每種特征均從一個(gè)或者多個(gè)角度對(duì)圖像進(jìn)行描述,很難確定對(duì)于每個(gè)語義類別時(shí),哪種特征是更為有效的。本文提出的全監(jiān)督語義分割方法首先通過塊對(duì)角化約束各個(gè)特征關(guān)系矩陣,隨后建立各個(gè)特征下超像素之間的相似度和其語義相似度的一致性,進(jìn)而學(xué)習(xí)超像素之間的多角度相似度。我們將上述過程定義為凸優(yōu)化問題并提出了高效的解決方案。最終的超像素標(biāo)簽預(yù)測通過學(xué)習(xí)得到的多角度相似度關(guān)系圖確定。傳統(tǒng)方法依賴于對(duì)每一個(gè)像素精確標(biāo)注的圖像來進(jìn)行模型的訓(xùn)練,資源十分有限。相比之下,如果嘗試只利用圖像層面的標(biāo)簽來訓(xùn)練語義分割模型,則監(jiān)督信息大大弱化,這類問題被稱為弱監(jiān)督的語義分割問題。擁有充分的有標(biāo)簽圖像作為資源的同時(shí),該類問題的困難也是十分明顯的:沒有準(zhǔn)確的區(qū)域語義信息,使用圖像的標(biāo)簽很難訓(xùn)練區(qū)域的分類器。不同于已有的弱監(jiān)督語義分割方法嘗試用不準(zhǔn)確的信息訓(xùn)練分類器,我們提出了一種全新的基于高維特征子空間分布的分類器評(píng)估方法來解決該問題。對(duì)于每個(gè)語義類別,我們隨機(jī)采樣產(chǎn)生若干個(gè)候選分類器,并利用稀疏重構(gòu)的方法獲得每個(gè)分類器對(duì)應(yīng)子空間的基。利用該組基重構(gòu)該類別的正負(fù)樣本,將二者之間的差異作為評(píng)估準(zhǔn)則,最終選出較優(yōu)的分類器對(duì)測試集合進(jìn)行分類。為了提升方法的效率,避免隨機(jī)采樣在高維空間產(chǎn)生的高昂代價(jià),我們還提出了一個(gè)基于高斯混合模型的迭代合并更新算法來擬合參數(shù)及其對(duì)應(yīng)得分的條件分布以確定最優(yōu)分類器的可能區(qū)域。本文提出的全監(jiān)督與弱監(jiān)督語義分割方法分別在當(dāng)前研究領(lǐng)域的主流數(shù)據(jù)集上進(jìn)行了運(yùn)行和測試,均取得了較好的效果。尤其值得一提的是,即使在弱監(jiān)督環(huán)境下,本文所提出的方法的分類精度依然超過了一些全監(jiān)督的方法。
【關(guān)鍵詞】:計(jì)算機(jī)視覺 機(jī)器學(xué)習(xí) 圖像標(biāo)注 語義分割 模型評(píng)估
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.41
【目錄】:
- 摘要7-9
- Abstract9-11
- 第1章 緒論11-19
- 1.1 研究背景及意義11-16
- 1.2 論文主要貢獻(xiàn)16-17
- 1.3 論文結(jié)構(gòu)17-19
- 第2章 相關(guān)工作19-25
- 2.1 自動(dòng)圖像標(biāo)注技術(shù)19-20
- 2.1.1 生成模型19
- 2.1.2 判別模型19-20
- 2.2 語義分割20-25
- 2.2.1 全監(jiān)督語義分割20-22
- 2.2.2 弱監(jiān)督語義分割22-23
- 2.2.3 語義分割常用數(shù)據(jù)集23
- 2.2.4 語義分割評(píng)估標(biāo)準(zhǔn)23-25
- 第3章 基于多圖學(xué)習(xí)與塊對(duì)角約束的全監(jiān)督語義分割方法25-35
- 3.1 多角度相似度關(guān)系圖學(xué)習(xí)25-27
- 3.2 凸優(yōu)化問題求解27-29
- 3.3 超像素標(biāo)簽預(yù)測29-30
- 3.4 實(shí)驗(yàn)評(píng)測30-35
- 3.4.1 基于MSRC數(shù)據(jù)集的實(shí)驗(yàn)效果評(píng)測30-31
- 3.4.2 基于VOC2007數(shù)據(jù)集的實(shí)驗(yàn)效果評(píng)測31-34
- 3.4.3 性能分析34-35
- 第4章 基于模型評(píng)估的弱監(jiān)督語義分割方法35-57
- 4.1 弱監(jiān)督語義分割方法35-41
- 4.1.1 基于子空間稀疏重構(gòu)的權(quán)重學(xué)習(xí)36-37
- 4.1.2 二次規(guī)劃加速求解37-39
- 4.1.3 學(xué)習(xí)基向量39-41
- 4.2 迭代合并更新算法41-44
- 4.2.1 擬合參數(shù)和得分的條件概率分布41-42
- 4.2.2 基于高斯混合模型的迭代合并更新算法42-44
- 4.3 實(shí)驗(yàn)評(píng)測44-57
- 4.3.1 特征與子空間結(jié)構(gòu)44-45
- 4.3.2 稀疏子空間重構(gòu)45-48
- 4.3.3 IMU的有效性證明48-49
- 4.3.4 基于MSRC數(shù)據(jù)集的實(shí)驗(yàn)效果評(píng)測49-54
- 4.3.5 基于VOC2007數(shù)據(jù)集的實(shí)驗(yàn)效果評(píng)測54-55
- 4.3.6 基于SIFT-flow數(shù)據(jù)集的實(shí)驗(yàn)效果評(píng)測55
- 4.3.7 性能分析55-57
- 第5章 總結(jié)與展望57-59
- 參考文獻(xiàn)59-67
- 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況67-69
- 致謝69-70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 駱玉霞,陳煥偉;角度分類器與距離分類器比較研究——以鹽漬土分類為例[J];國土資源遙感;2002年02期
2 孫加慶;具有自學(xué)習(xí)功能的分類器的自動(dòng)生成[J];計(jì)算機(jī)時(shí)代;2002年12期
3 潘翔,姚明海,陳國華;多分類器的一種動(dòng)態(tài)聯(lián)合方法[J];計(jì)算機(jī)工程與應(yīng)用;2002年12期
4 馬耀華,何瑗;Augmented Bayes分類器的一種學(xué)習(xí)方法[J];計(jì)算機(jī)工程與應(yīng)用;2002年17期
5 王正群,孫興華,楊靜宇;多分類器組合研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年20期
6 馮彥杰,王浣塵;學(xué)習(xí)分類器在績效尋優(yōu)中的應(yīng)用及其組織決策意義[J];控制理論與應(yīng)用;2003年03期
7 唐春生,金以慧;基于全信息矩陣的多分類器集成方法[J];軟件學(xué)報(bào);2003年06期
8 唐春生;金以慧;;權(quán)重自適應(yīng)調(diào)整的多分類器集成判決及其在文本分類中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2003年01期
9 劉寧鐘;楊靜宇;;基于遺傳算法的組合式分類器選擇[J];模式識(shí)別與人工智能;2003年03期
10 柏延臣,王勁峰;結(jié)合多分類器的遙感數(shù)據(jù)專題分類方法研究[J];遙感學(xué)報(bào);2005年05期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 王占一;徐蔚然;劉東鑫;郭軍;;一種基于兩級(jí)分類器的垃圾短信過濾方法[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 翟靜;李海宏;唐常杰;陳敏敏;李智;;可驗(yàn)證對(duì)象集分類器的再訓(xùn)練演進(jìn)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 穆明生;;基于特征集的多種分類器模型的在線筆跡認(rèn)證[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
4 陳繼航;劉家鋒;趙巍;唐降龍;;聯(lián)機(jī)手寫識(shí)別筆段特征分類器的學(xué)習(xí)方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年
5 彭濤;左萬利;赫楓齡;;基于鏈接上下文的分類器主題爬行技術(shù)(英文)[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
6 王嵐;陳珂;遲惠生;;基于多特征組合多分類器的方法用于“與文本無關(guān)”的說話人辨認(rèn)[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
7 邵小健;段華;賀國平;;一種改進(jìn)的最少核分類器[A];中國運(yùn)籌學(xué)會(huì)第七屆學(xué)術(shù)交流會(huì)論文集(上卷)[C];2004年
8 謝秋玲;;應(yīng)用于心電圖分類的KNN-SVM分類器研究[A];2006中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2006年
9 胡瓊;汪榮貴;胡韋偉;孫見青;;基于級(jí)聯(lián)分類器的快速人臉檢測方法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
10 李蘭春;王雙成;杜瑞杰;;認(rèn)知結(jié)構(gòu)評(píng)估的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)分類器方法[A];2011年中國智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第一分冊)[C];2011年
中國重要報(bào)紙全文數(shù)據(jù)庫 前1條
1 黃明;精子分類器決定生男生女[N];廣東科技報(bào);2000年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄒金鳳;基于綜合評(píng)價(jià)理論的多分類器容器[D];大連理工大學(xué);2005年
2 高鳳娥;分布式環(huán)境下多分類器識(shí)別和應(yīng)用[D];西安電子科技大學(xué);2006年
3 郭霞;一種高效集成分類器及其在蛋白質(zhì)折疊識(shí)別中的應(yīng)用研究[D];湘潭大學(xué);2007年
4 王國林;基于分類器融合的人臉識(shí)別研究[D];江蘇科技大學(xué);2011年
5 張晨;多維約束下代價(jià)敏感集成分類器的研究[D];廣西師范大學(xué);2009年
6 郭瑜;鑄坯冷酸蝕圖像分類器的設(shè)計(jì)及研究[D];華中科技大學(xué);2009年
7 孫利;基于多分類器和雙視角信息融合的乳腺鉬靶圖像病灶分類算法研究[D];杭州電子科技大學(xué);2011年
8 強(qiáng)琦;基于統(tǒng)計(jì)學(xué)習(xí)的多類別分類器研究[D];浙江大學(xué);2006年
9 孫麗娜;集成異種分類器分類稀有類[D];鄭州大學(xué);2007年
10 范瑩;基于進(jìn)化計(jì)算和模糊聚類技術(shù)的多分類器聯(lián)合研究[D];山東師范大學(xué);2008年
本文關(guān)鍵詞:圖像語義分割算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):381178
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/381178.html