天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于弱監(jiān)督學(xué)習(xí)的物體檢測及其在圖像分類中的應(yīng)用

發(fā)布時間:2020-10-11 03:15
   物體檢測,即對自然圖像中的物體進(jìn)行分類并找出物體位置包圍盒,是計算機視覺中最基本的問題之一。它在實際問題中有著極為廣泛的應(yīng)用,如相機自動聚焦、自動駕駛、機器人導(dǎo)航、圖像檢索等。傳統(tǒng)的物體檢測需要使用大量有詳細(xì)物體位置和類別標(biāo)注信息的圖像數(shù)據(jù)來進(jìn)行訓(xùn)練。然而,收集這些詳細(xì)的標(biāo)注是十分費時費力的。與之相比,基于弱監(jiān)督學(xué)習(xí)的物體檢測(簡稱弱監(jiān)督物體檢測)只需要使用有圖像級別標(biāo)注信息(即標(biāo)注圖像是包含某種物體類別)的圖像數(shù)據(jù)進(jìn)行訓(xùn)練,而獲取這些數(shù)據(jù)無疑更加容易,如從互聯(lián)網(wǎng)上使用關(guān)鍵詞搜索。因此,大量研究關(guān)注在弱監(jiān)督物體檢測。然而,由于自然圖像的復(fù)雜性,包括物體大小、位置、視角、形狀等的變化,以及物體位置標(biāo)注的缺失,使得弱監(jiān)督物體檢測面臨極大挑戰(zhàn)。近年來,許多工作將弱監(jiān)督學(xué)習(xí)中的經(jīng)典方法多示例學(xué)習(xí)引入到弱監(jiān)督物體檢測中,并取得了很好的效果。此外,深度學(xué)習(xí)的進(jìn)步極大地促進(jìn)了計算機視覺的發(fā)展,并在弱監(jiān)督物體檢測中取得了突破。本文基于多示例學(xué)習(xí)和深度學(xué)習(xí),對弱監(jiān)督物體檢測存在的問題展開一系列研究,并提出了三種不同的弱監(jiān)督物體檢測網(wǎng)絡(luò),其中第一種網(wǎng)絡(luò)關(guān)注于將弱監(jiān)督物體檢測后兩步進(jìn)行端到端聯(lián)合訓(xùn)練,第二種網(wǎng)絡(luò)關(guān)注于如何更好地學(xué)習(xí)弱監(jiān)督物體檢測器,第三種網(wǎng)絡(luò)關(guān)注于如何將候選區(qū)域提取步驟整合到網(wǎng)絡(luò)中,且后面網(wǎng)絡(luò)是前面網(wǎng)絡(luò)的延伸和擴(kuò)展。此外,本文還探索了弱監(jiān)督物體檢測的應(yīng)用。本文的主要貢獻(xiàn)有:(1)提出了一種深度區(qū)域?qū)W習(xí)算法以實現(xiàn)基于多示例學(xué)習(xí)的弱監(jiān)督物體檢測網(wǎng)絡(luò)。該網(wǎng)絡(luò)使用基于示例空間的多示例學(xué)習(xí)方法將候選區(qū)域分類結(jié)果進(jìn)行聚合,使得網(wǎng)絡(luò)可以直接使用圖像級別標(biāo)注作為訓(xùn)練目標(biāo);通過基于嵌入空間的多示例學(xué)習(xí)方法引入新的物體分類任務(wù),并同時訓(xùn)練弱監(jiān)督物體檢測任務(wù)和物體分類任務(wù),通過多任務(wù)學(xué)習(xí)來輔助弱監(jiān)督物體檢測;此外,該網(wǎng)絡(luò)能對候選區(qū)域特征提取、候選區(qū)域分類、物體分類進(jìn)行端到端聯(lián)合訓(xùn)練。在PASCAL VOC 2007和PASCAL VOC 2012數(shù)據(jù)集上,該網(wǎng)絡(luò)在弱監(jiān)督物體檢測上取得了高于之前多示例學(xué)習(xí)方法超過5%的性能,在圖像物體分類上得到了高于之前方法約2%的性能。(2)提出了一種候選區(qū)域聚類學(xué)習(xí)算法。該算法對每張圖像中的候選區(qū)域進(jìn)行聚類,使得每個聚類對應(yīng)于一個物體,并將不同聚類看成不同的多示例學(xué)習(xí)小包,對每個小包再使用基于示例空間的多示例學(xué)習(xí)方法來學(xué)習(xí)弱監(jiān)督物體檢測器。此外,該算法也與神經(jīng)網(wǎng)絡(luò)結(jié)合,能夠?qū)蜻x區(qū)域特征提取和候選區(qū)域分類進(jìn)行端到端聯(lián)合訓(xùn)練。該算法能極大改善之前方法傾向于檢測局部物體的問題,并對復(fù)雜圖像中的物體大小、位置、視角等變化魯棒。在PASCAL VOC 2007/2012、ImageNet Detection、COCO數(shù)據(jù)集上,該算法取得了高于之前最好方法平均5%的弱監(jiān)督物體檢測性能。(3)提出了一種弱監(jiān)督候選區(qū)域提取網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含粗糙候選區(qū)域提取與候選區(qū)域重打分兩個階段,能在弱監(jiān)督的情況下訓(xùn)練基于神經(jīng)網(wǎng)絡(luò)的候選區(qū)域提取器。此外,本文還將該網(wǎng)絡(luò)與之前弱監(jiān)督物體檢測網(wǎng)絡(luò)整合到一個統(tǒng)一的弱監(jiān)督候選區(qū)域提取及物體檢測網(wǎng)絡(luò)中,使得弱監(jiān)督物體檢測的所有步驟能夠通過一個網(wǎng)絡(luò)完成,在弱監(jiān)督物體檢測中極具意義。在PASCAL VOC 2007/2012和ImageNet Detection數(shù)據(jù)集上,該網(wǎng)絡(luò)都取得了高于之前方法超過2%的弱監(jiān)督物體檢測性能。(4)探索了弱監(jiān)督物體檢測在圖像分類上的應(yīng)用。本文將弱監(jiān)督物體檢測中的單模式學(xué)習(xí)拓展到多模式學(xué)習(xí),以尋找每一類圖像中多種共有的模式,并將這些模式作為詞袋模型中的視覺詞匯,從而得到圖像表示,這些圖像表示被用來作為圖像分類器的特征輸入。該方法在圖像中的行為分類數(shù)據(jù)集Action 40、物體分類數(shù)據(jù)集Caltech101、場景分類數(shù)據(jù)集Scene 15、MIT-Indoor 67、SUN 397上都取得了很好的性能,其中,在行為分類數(shù)據(jù)集Action 40上,該方法取得了高于之前方法16.41%的性能。綜上,本文基于多示例學(xué)習(xí)和深度學(xué)習(xí),提出了一系列弱監(jiān)督物體檢測解決方案,并探索了弱監(jiān)督物體檢測在圖像分類中的應(yīng)用,為后續(xù)弱監(jiān)督物體檢測相關(guān)研究奠定了基礎(chǔ)。
【學(xué)位單位】:華中科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:TP391.41;TP181
【部分圖文】:

物體檢測,物體位置,圖像,包圍盒


華 中 科 技 大 學(xué) 博 士 學(xué) 位 論 文1 緒論1.1 選題背景隨著移動終端及互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,人類社會已經(jīng)進(jìn)入信息化時代。目前,隨著圖像與視頻的采集與傳播越來越普及,每時每刻都有大量的圖像和視頻數(shù)據(jù)產(chǎn)生,網(wǎng)絡(luò)上圖像與視頻等媒體數(shù)據(jù)呈指數(shù)級增長,圖像和視頻逐漸取代文本成為互聯(lián)網(wǎng)上的主流內(nèi)容。一方面,人們能夠很方便快速地獲取到大量圖像視頻信息,享受信息化帶來的巨大便利;另一方面,圖像視頻數(shù)據(jù)的泛濫使人難以準(zhǔn)確迅速地找到所需的信息。因此,如何組織管理海量的圖像視頻數(shù)據(jù),使人能夠快速地搜尋到所需的信息變得至關(guān)重要。

流程圖,物體檢測,流程,標(biāo)注信息


圖 1.2 (a)傳統(tǒng)的物體檢測需要使用有詳細(xì)標(biāo)注信息的圖像來進(jìn)行訓(xùn)練;(b)基于弱監(jiān)督學(xué)習(xí)的物體檢測只需要使用有圖像級別標(biāo)注信息的圖像來進(jìn)行訓(xùn)練傳統(tǒng)的物體檢測需要使用有詳細(xì)標(biāo)注信息(即標(biāo)注每個物體的位置包圍盒和類別)的圖像來進(jìn)行訓(xùn)練,如圖 1.2(a)所示。然而,對所有圖像進(jìn)行詳細(xì)標(biāo)注是非常費時費力的。與之相比,如圖 1.2(b)所示,基于弱監(jiān)督學(xué)習(xí)的物體檢測(簡稱弱監(jiān)督物體檢測)只需要使用有圖像級別標(biāo)注信息(即不需要標(biāo)注物體位置包圍盒)的圖像數(shù)據(jù)進(jìn)行訓(xùn)練,而這些數(shù)據(jù)我們很容易就可以得到。例如,我們可以從互聯(lián)網(wǎng)上使用關(guān)鍵詞進(jìn)行搜索獲得圖像,關(guān)鍵詞即為對應(yīng)圖像級別標(biāo)注。因此,研究基于弱監(jiān)督學(xué)習(xí)的物體檢測成為必要。

物體檢測,標(biāo)注信息,圖像,級別


a)傳統(tǒng)的物體檢測需要使用有詳細(xì)標(biāo)注信息的圖像來進(jìn)行訓(xùn)練;(b)基于弱監(jiān)物體檢測只需要使用有圖像級別標(biāo)注信息的圖像來進(jìn)行訓(xùn)練的物體檢測需要使用有詳細(xì)標(biāo)注信息(即標(biāo)注每個物體的位置包像來進(jìn)行訓(xùn)練,如圖 1.2(a)所示。然而,對所有圖像進(jìn)行詳細(xì)標(biāo)的。與之相比,如圖 1.2(b)所示,基于弱監(jiān)督學(xué)習(xí)的物體檢測(測)只需要使用有圖像級別標(biāo)注信息(即不需要標(biāo)注物體位置包圍行訓(xùn)練,而這些數(shù)據(jù)我們很容易就可以得到。例如,我們可以從互進(jìn)行搜索獲得圖像,關(guān)鍵詞即為對應(yīng)圖像級別標(biāo)注。因此,研究基體檢測成為必要。
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陶筱嬌;王鑫;;基于深度學(xué)習(xí)算法的圖像分類方法[J];微型電腦應(yīng)用;2019年03期

2 李會民;馬桂英;王延倉;;基于深度學(xué)習(xí)網(wǎng)絡(luò)的水質(zhì)圖像分類[J];北華航天工業(yè)學(xué)院學(xué)報;2018年04期

3 彭娟;;特征選擇和聚類分析的圖像分類模型[J];現(xiàn)代電子技術(shù);2017年19期

4 田凱;杜鵬;;基于C#的圖像分類系統(tǒng)實現(xiàn)[J];數(shù)碼世界;2017年08期

5 王科平;張志剛;;基于特征加權(quán)的自動圖像分類方法[J];微型電腦應(yīng)用;2014年01期

6 汪煜浩;華瑞林;;山地衛(wèi)星圖像分類制圖方法研究[J];遙感信息;1987年04期

7 吳健;賈宏宇;;基于遷移學(xué)習(xí)的圖像分類方法研究[J];河南科技;2018年31期

8 武慧瓊;張素蘭;張繼福;胡立華;;一種基于三支決策的花卉圖像分類[J];小型微型計算機系統(tǒng);2019年07期

9 林澤文;;深度學(xué)習(xí)及其在圖像分類識別中的運用探討[J];信息與電腦(理論版);2018年12期

10 李舒;吳磊;;數(shù)據(jù)挖掘在醫(yī)學(xué)圖像分類中的應(yīng)用[J];醫(yī)學(xué)信息學(xué)雜志;2014年08期


相關(guān)博士學(xué)位論文 前10條

1 張璐;基于深度空間特征學(xué)習(xí)的極化SAR圖像分類[D];西安電子科技大學(xué);2019年

2 楊寶慶;基于字典學(xué)習(xí)的圖像分類算法及應(yīng)用研究[D];上海交通大學(xué);2017年

3 唐芃;基于弱監(jiān)督學(xué)習(xí)的物體檢測及其在圖像分類中的應(yīng)用[D];華中科技大學(xué);2019年

4 鄭昱;面向大規(guī)模圖像分類的層次化多任務(wù)學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2017年

5 郭雨薇;基于超像素表征和模糊特征學(xué)習(xí)的圖像分類與識別[D];西安電子科技大學(xué);2017年

6 李曉;基于遷移學(xué)習(xí)的跨域圖像分類方法研究[D];西安電子科技大學(xué);2017年

7 滑文強;小樣本下的極化SAR圖像分類問題研究[D];西安電子科技大學(xué);2018年

8 張姝茵;基于判別性特征學(xué)習(xí)的極化SAR圖像分類[D];西安電子科技大學(xué);2018年

9 丁擁科;基于先驗信息輔助的高分辨率SAR圖像分類方法研究[D];上海交通大學(xué);2017年

10 侯賽輝;圖像物體的精細(xì)化分類方法研究[D];中國科學(xué)技術(shù)大學(xué);2019年


相關(guān)碩士學(xué)位論文 前10條

1 梁澤志;基于CNN-ELM的冷凍電鏡單顆粒圖像分類研究[D];湘潭大學(xué);2019年

2 邰旭鳴;基于深度學(xué)習(xí)的多標(biāo)簽圖像分類系統(tǒng)設(shè)計與實現(xiàn)[D];南京師范大學(xué);2019年

3 張燁;基于風(fēng)格遷移的圖像分類技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2019年

4 艾爾(ARERO WARIYO GODANA);基于區(qū)域的卷積神經(jīng)網(wǎng)絡(luò)在SAR圖像分類中的應(yīng)用[D];哈爾濱工業(yè)大學(xué);2019年

5 付琰;基于樣本生成的多任務(wù)圖像分類方法研究[D];哈爾濱工業(yè)大學(xué);2018年

6 林開東;基于網(wǎng)絡(luò)涉恐?jǐn)?shù)據(jù)Logo識別技術(shù)的研究與實現(xiàn)[D];重慶郵電大學(xué);2019年

7 萬博洋;基于深度學(xué)習(xí)的煙霧檢測算法研究[D];江西科技師范大學(xué);2018年

8 李明;基于深度學(xué)習(xí)的工業(yè)圖像分類與檢測系統(tǒng)設(shè)計[D];西安工程大學(xué);2019年

9 張宇維;城市排水管內(nèi)窺圖像分類與病害智能檢測研究[D];廣東工業(yè)大學(xué);2019年

10 葛可適;基于神經(jīng)網(wǎng)絡(luò)和密度峰值聚類的單顆粒冷凍電鏡圖像分類技術(shù)研究[D];國防科技大學(xué);2017年



本文編號:2835972

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2835972.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b1b7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com