天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于弱監(jiān)督學習的物體檢測及其在圖像分類中的應用

發(fā)布時間:2020-10-11 03:15
   物體檢測,即對自然圖像中的物體進行分類并找出物體位置包圍盒,是計算機視覺中最基本的問題之一。它在實際問題中有著極為廣泛的應用,如相機自動聚焦、自動駕駛、機器人導航、圖像檢索等。傳統(tǒng)的物體檢測需要使用大量有詳細物體位置和類別標注信息的圖像數(shù)據(jù)來進行訓練。然而,收集這些詳細的標注是十分費時費力的。與之相比,基于弱監(jiān)督學習的物體檢測(簡稱弱監(jiān)督物體檢測)只需要使用有圖像級別標注信息(即標注圖像是包含某種物體類別)的圖像數(shù)據(jù)進行訓練,而獲取這些數(shù)據(jù)無疑更加容易,如從互聯(lián)網(wǎng)上使用關(guān)鍵詞搜索。因此,大量研究關(guān)注在弱監(jiān)督物體檢測。然而,由于自然圖像的復雜性,包括物體大小、位置、視角、形狀等的變化,以及物體位置標注的缺失,使得弱監(jiān)督物體檢測面臨極大挑戰(zhàn)。近年來,許多工作將弱監(jiān)督學習中的經(jīng)典方法多示例學習引入到弱監(jiān)督物體檢測中,并取得了很好的效果。此外,深度學習的進步極大地促進了計算機視覺的發(fā)展,并在弱監(jiān)督物體檢測中取得了突破。本文基于多示例學習和深度學習,對弱監(jiān)督物體檢測存在的問題展開一系列研究,并提出了三種不同的弱監(jiān)督物體檢測網(wǎng)絡(luò),其中第一種網(wǎng)絡(luò)關(guān)注于將弱監(jiān)督物體檢測后兩步進行端到端聯(lián)合訓練,第二種網(wǎng)絡(luò)關(guān)注于如何更好地學習弱監(jiān)督物體檢測器,第三種網(wǎng)絡(luò)關(guān)注于如何將候選區(qū)域提取步驟整合到網(wǎng)絡(luò)中,且后面網(wǎng)絡(luò)是前面網(wǎng)絡(luò)的延伸和擴展。此外,本文還探索了弱監(jiān)督物體檢測的應用。本文的主要貢獻有:(1)提出了一種深度區(qū)域?qū)W習算法以實現(xiàn)基于多示例學習的弱監(jiān)督物體檢測網(wǎng)絡(luò)。該網(wǎng)絡(luò)使用基于示例空間的多示例學習方法將候選區(qū)域分類結(jié)果進行聚合,使得網(wǎng)絡(luò)可以直接使用圖像級別標注作為訓練目標;通過基于嵌入空間的多示例學習方法引入新的物體分類任務,并同時訓練弱監(jiān)督物體檢測任務和物體分類任務,通過多任務學習來輔助弱監(jiān)督物體檢測;此外,該網(wǎng)絡(luò)能對候選區(qū)域特征提取、候選區(qū)域分類、物體分類進行端到端聯(lián)合訓練。在PASCAL VOC 2007和PASCAL VOC 2012數(shù)據(jù)集上,該網(wǎng)絡(luò)在弱監(jiān)督物體檢測上取得了高于之前多示例學習方法超過5%的性能,在圖像物體分類上得到了高于之前方法約2%的性能。(2)提出了一種候選區(qū)域聚類學習算法。該算法對每張圖像中的候選區(qū)域進行聚類,使得每個聚類對應于一個物體,并將不同聚類看成不同的多示例學習小包,對每個小包再使用基于示例空間的多示例學習方法來學習弱監(jiān)督物體檢測器。此外,該算法也與神經(jīng)網(wǎng)絡(luò)結(jié)合,能夠?qū)蜻x區(qū)域特征提取和候選區(qū)域分類進行端到端聯(lián)合訓練。該算法能極大改善之前方法傾向于檢測局部物體的問題,并對復雜圖像中的物體大小、位置、視角等變化魯棒。在PASCAL VOC 2007/2012、ImageNet Detection、COCO數(shù)據(jù)集上,該算法取得了高于之前最好方法平均5%的弱監(jiān)督物體檢測性能。(3)提出了一種弱監(jiān)督候選區(qū)域提取網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含粗糙候選區(qū)域提取與候選區(qū)域重打分兩個階段,能在弱監(jiān)督的情況下訓練基于神經(jīng)網(wǎng)絡(luò)的候選區(qū)域提取器。此外,本文還將該網(wǎng)絡(luò)與之前弱監(jiān)督物體檢測網(wǎng)絡(luò)整合到一個統(tǒng)一的弱監(jiān)督候選區(qū)域提取及物體檢測網(wǎng)絡(luò)中,使得弱監(jiān)督物體檢測的所有步驟能夠通過一個網(wǎng)絡(luò)完成,在弱監(jiān)督物體檢測中極具意義。在PASCAL VOC 2007/2012和ImageNet Detection數(shù)據(jù)集上,該網(wǎng)絡(luò)都取得了高于之前方法超過2%的弱監(jiān)督物體檢測性能。(4)探索了弱監(jiān)督物體檢測在圖像分類上的應用。本文將弱監(jiān)督物體檢測中的單模式學習拓展到多模式學習,以尋找每一類圖像中多種共有的模式,并將這些模式作為詞袋模型中的視覺詞匯,從而得到圖像表示,這些圖像表示被用來作為圖像分類器的特征輸入。該方法在圖像中的行為分類數(shù)據(jù)集Action 40、物體分類數(shù)據(jù)集Caltech101、場景分類數(shù)據(jù)集Scene 15、MIT-Indoor 67、SUN 397上都取得了很好的性能,其中,在行為分類數(shù)據(jù)集Action 40上,該方法取得了高于之前方法16.41%的性能。綜上,本文基于多示例學習和深度學習,提出了一系列弱監(jiān)督物體檢測解決方案,并探索了弱監(jiān)督物體檢測在圖像分類中的應用,為后續(xù)弱監(jiān)督物體檢測相關(guān)研究奠定了基礎(chǔ)。
【學位單位】:華中科技大學
【學位級別】:博士
【學位年份】:2019
【中圖分類】:TP391.41;TP181
【部分圖文】:

物體檢測,物體位置,圖像,包圍盒


華 中 科 技 大 學 博 士 學 位 論 文1 緒論1.1 選題背景隨著移動終端及互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,人類社會已經(jīng)進入信息化時代。目前,隨著圖像與視頻的采集與傳播越來越普及,每時每刻都有大量的圖像和視頻數(shù)據(jù)產(chǎn)生,網(wǎng)絡(luò)上圖像與視頻等媒體數(shù)據(jù)呈指數(shù)級增長,圖像和視頻逐漸取代文本成為互聯(lián)網(wǎng)上的主流內(nèi)容。一方面,人們能夠很方便快速地獲取到大量圖像視頻信息,享受信息化帶來的巨大便利;另一方面,圖像視頻數(shù)據(jù)的泛濫使人難以準確迅速地找到所需的信息。因此,如何組織管理海量的圖像視頻數(shù)據(jù),使人能夠快速地搜尋到所需的信息變得至關(guān)重要。

流程圖,物體檢測,流程,標注信息


圖 1.2 (a)傳統(tǒng)的物體檢測需要使用有詳細標注信息的圖像來進行訓練;(b)基于弱監(jiān)督學習的物體檢測只需要使用有圖像級別標注信息的圖像來進行訓練傳統(tǒng)的物體檢測需要使用有詳細標注信息(即標注每個物體的位置包圍盒和類別)的圖像來進行訓練,如圖 1.2(a)所示。然而,對所有圖像進行詳細標注是非常費時費力的。與之相比,如圖 1.2(b)所示,基于弱監(jiān)督學習的物體檢測(簡稱弱監(jiān)督物體檢測)只需要使用有圖像級別標注信息(即不需要標注物體位置包圍盒)的圖像數(shù)據(jù)進行訓練,而這些數(shù)據(jù)我們很容易就可以得到。例如,我們可以從互聯(lián)網(wǎng)上使用關(guān)鍵詞進行搜索獲得圖像,關(guān)鍵詞即為對應圖像級別標注。因此,研究基于弱監(jiān)督學習的物體檢測成為必要。

物體檢測,標注信息,圖像,級別


a)傳統(tǒng)的物體檢測需要使用有詳細標注信息的圖像來進行訓練;(b)基于弱監(jiān)物體檢測只需要使用有圖像級別標注信息的圖像來進行訓練的物體檢測需要使用有詳細標注信息(即標注每個物體的位置包像來進行訓練,如圖 1.2(a)所示。然而,對所有圖像進行詳細標的。與之相比,如圖 1.2(b)所示,基于弱監(jiān)督學習的物體檢測(測)只需要使用有圖像級別標注信息(即不需要標注物體位置包圍行訓練,而這些數(shù)據(jù)我們很容易就可以得到。例如,我們可以從互進行搜索獲得圖像,關(guān)鍵詞即為對應圖像級別標注。因此,研究基體檢測成為必要。
【相似文獻】

相關(guān)期刊論文 前10條

1 陶筱嬌;王鑫;;基于深度學習算法的圖像分類方法[J];微型電腦應用;2019年03期

2 李會民;馬桂英;王延倉;;基于深度學習網(wǎng)絡(luò)的水質(zhì)圖像分類[J];北華航天工業(yè)學院學報;2018年04期

3 彭娟;;特征選擇和聚類分析的圖像分類模型[J];現(xiàn)代電子技術(shù);2017年19期

4 田凱;杜鵬;;基于C#的圖像分類系統(tǒng)實現(xiàn)[J];數(shù)碼世界;2017年08期

5 王科平;張志剛;;基于特征加權(quán)的自動圖像分類方法[J];微型電腦應用;2014年01期

6 汪煜浩;華瑞林;;山地衛(wèi)星圖像分類制圖方法研究[J];遙感信息;1987年04期

7 吳健;賈宏宇;;基于遷移學習的圖像分類方法研究[J];河南科技;2018年31期

8 武慧瓊;張素蘭;張繼福;胡立華;;一種基于三支決策的花卉圖像分類[J];小型微型計算機系統(tǒng);2019年07期

9 林澤文;;深度學習及其在圖像分類識別中的運用探討[J];信息與電腦(理論版);2018年12期

10 李舒;吳磊;;數(shù)據(jù)挖掘在醫(yī)學圖像分類中的應用[J];醫(yī)學信息學雜志;2014年08期


相關(guān)博士學位論文 前10條

1 張璐;基于深度空間特征學習的極化SAR圖像分類[D];西安電子科技大學;2019年

2 楊寶慶;基于字典學習的圖像分類算法及應用研究[D];上海交通大學;2017年

3 唐芃;基于弱監(jiān)督學習的物體檢測及其在圖像分類中的應用[D];華中科技大學;2019年

4 鄭昱;面向大規(guī)模圖像分類的層次化多任務學習算法研究[D];西安電子科技大學;2017年

5 郭雨薇;基于超像素表征和模糊特征學習的圖像分類與識別[D];西安電子科技大學;2017年

6 李曉;基于遷移學習的跨域圖像分類方法研究[D];西安電子科技大學;2017年

7 滑文強;小樣本下的極化SAR圖像分類問題研究[D];西安電子科技大學;2018年

8 張姝茵;基于判別性特征學習的極化SAR圖像分類[D];西安電子科技大學;2018年

9 丁擁科;基于先驗信息輔助的高分辨率SAR圖像分類方法研究[D];上海交通大學;2017年

10 侯賽輝;圖像物體的精細化分類方法研究[D];中國科學技術(shù)大學;2019年


相關(guān)碩士學位論文 前10條

1 梁澤志;基于CNN-ELM的冷凍電鏡單顆粒圖像分類研究[D];湘潭大學;2019年

2 邰旭鳴;基于深度學習的多標簽圖像分類系統(tǒng)設(shè)計與實現(xiàn)[D];南京師范大學;2019年

3 張燁;基于風格遷移的圖像分類技術(shù)研究[D];哈爾濱工業(yè)大學;2019年

4 艾爾(ARERO WARIYO GODANA);基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)在SAR圖像分類中的應用[D];哈爾濱工業(yè)大學;2019年

5 付琰;基于樣本生成的多任務圖像分類方法研究[D];哈爾濱工業(yè)大學;2018年

6 林開東;基于網(wǎng)絡(luò)涉恐數(shù)據(jù)Logo識別技術(shù)的研究與實現(xiàn)[D];重慶郵電大學;2019年

7 萬博洋;基于深度學習的煙霧檢測算法研究[D];江西科技師范大學;2018年

8 李明;基于深度學習的工業(yè)圖像分類與檢測系統(tǒng)設(shè)計[D];西安工程大學;2019年

9 張宇維;城市排水管內(nèi)窺圖像分類與病害智能檢測研究[D];廣東工業(yè)大學;2019年

10 葛可適;基于神經(jīng)網(wǎng)絡(luò)和密度峰值聚類的單顆粒冷凍電鏡圖像分類技術(shù)研究[D];國防科技大學;2017年



本文編號:2835972

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2835972.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b1b7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com