基于卷積神經(jīng)網(wǎng)絡(luò)和上下文模型的目標(biāo)檢測(cè)
發(fā)布時(shí)間:2017-09-16 16:02
本文關(guān)鍵詞:基于卷積神經(jīng)網(wǎng)絡(luò)和上下文模型的目標(biāo)檢測(cè)
更多相關(guān)文章: 卷積神經(jīng)網(wǎng)絡(luò) R-CNN 非極大值抑制 上下文模型
【摘要】:目標(biāo)檢測(cè)的任務(wù)是要識(shí)別出圖像中的各個(gè)物體,并給定它們的位置。目標(biāo)檢測(cè)的經(jīng)典算法是DPM(Deformable Parts Model)算法,它采用了滑動(dòng)窗口法(Sliding Window)來生成候選窗口,然后用HOG特征(Histogrrams of Oriented Gradients)和支持向量機(jī)SVM(Support Vector Machine)分類器對(duì)候選窗口進(jìn)行分類。DPM算法檢測(cè)時(shí)的計(jì)算量較大,采用的淺層HOG特征也使其正確率有限。2014年Ross Girshick提出了R-CNN(Region Convolutional Neural Networks)目標(biāo)檢測(cè)方法,其采用選擇搜索(Selective Search)來生成候選窗口,然后應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Networks)對(duì)各個(gè)候選窗口進(jìn)行特征提取,再用線性支持向量機(jī)對(duì)候選窗口進(jìn)行分類。R-CNN算法在PASCAL VOC數(shù)據(jù)集上取得了比DPM算法明顯要高的正確率。本論文在R-CNN算法的基礎(chǔ)上進(jìn)行了改進(jìn),R-CNN算法雖然在預(yù)處理方面巧妙的引入了選擇搜索,開辟了目標(biāo)檢測(cè)的新框架,即“選擇搜索+卷積神經(jīng)網(wǎng)絡(luò)”。但是,R-CNN算法在后處理階段,即用線性SVM分類器對(duì)各個(gè)候選窗口分類之后,選擇最優(yōu)候選窗口的階段,采用的是傳統(tǒng)的非極大值抑制NMS(Non-Maximun Supperssinon)算法。非極大值抑制算法存在兩方面缺點(diǎn):一方面,NMS算法中如何選擇合適的閾值是一件困難的事;另一方面,NMS算法沒有考慮圖像中物體與物體之間的共存與空間位置關(guān)系。針對(duì)NMS算法的這些缺點(diǎn),本論文提出了一種基于R-CNN并結(jié)合了上下文的目標(biāo)檢測(cè)算法。引入了一個(gè)上下文的學(xué)習(xí)模型,來刻畫各類物體之間(可以是同類別也可以是不同類別)存在的空間位置關(guān)系,并詳細(xì)給出了其學(xué)習(xí)和推理過程。然后在選擇最優(yōu)候選窗口時(shí),用其代替NMS算法。在PASCAL VOC 2011數(shù)據(jù)集上對(duì)本文算法進(jìn)行了訓(xùn)練和測(cè)試,并與采用NMS的R-CNN算法進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,對(duì)于經(jīng)常同時(shí)出現(xiàn)在一幅圖像中并存在特定空間位置關(guān)系的物體類別,本文方法的正確率比R-CNN算法有了較明顯的提高。
【關(guān)鍵詞】:卷積神經(jīng)網(wǎng)絡(luò) R-CNN 非極大值抑制 上下文模型
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41;TP183
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 研究背景與意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-11
- 1.3 本文概述11-12
- 1.4 本文組織結(jié)構(gòu)12-13
- 1.5 本章小結(jié)13-15
- 第2章 相關(guān)技術(shù)介紹15-25
- 2.1 R-CNN算法的網(wǎng)絡(luò)結(jié)構(gòu)15-19
- 2.1.1 激活函數(shù)16-17
- 2.1.2 局部響應(yīng)歸一化17
- 2.1.3 解決過擬合問題17-19
- 2.2 選擇搜索算法19-22
- 2.2.1 選擇搜索算法的原理19-21
- 2.2.2 選擇搜索算法的實(shí)現(xiàn)21-22
- 2.3 線性支持向量機(jī)22-24
- 2.4 本章小結(jié)24-25
- 第3章 上下文模型25-33
- 3.1 非極大值抑制算法及其缺點(diǎn)25-27
- 3.2 上下文模型的介紹27-31
- 3.2.1 上下文模型的構(gòu)造28
- 3.2.2 上下文模型的推理28-29
- 3.2.3 上下文模型的優(yōu)化29-31
- 3.3 本章小結(jié)31-33
- 第4章 在R-CNN中應(yīng)用上下文模型33-41
- 4.1 R-CNN網(wǎng)絡(luò)結(jié)構(gòu)的訓(xùn)練33-35
- 4.2 上下文模型的訓(xùn)練35-40
- 4.2.1 預(yù)處理35-40
- 4.2.2 割平面最優(yōu)化40
- 4.3 本章小結(jié)40-41
- 第5章 實(shí)驗(yàn)結(jié)果與分析41-47
- 5.1 實(shí)驗(yàn)數(shù)據(jù)及流程41-43
- 5.2 實(shí)驗(yàn)結(jié)果分析43-46
- 5.3 本章小結(jié)46-47
- 結(jié)論47-49
- 參考文獻(xiàn)49-53
- 攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文53-55
- 致謝55
本文編號(hào):864010
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/864010.html
最近更新
教材專著