天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

子類敏感卷積神經(jīng)網(wǎng)絡(luò)研究:目標(biāo)檢測(cè)與姿態(tài)估計(jì)

發(fā)布時(shí)間:2021-01-15 10:39
  目標(biāo)檢測(cè)是計(jì)算機(jī)視覺中的重要基礎(chǔ)研究課題之一。其應(yīng)用領(lǐng)域十分廣泛,包括智能安防、智能家居、智能交通、醫(yī)學(xué)圖像等。隨著近幾年深度學(xué)習(xí)的飛速發(fā)展,目標(biāo)檢測(cè)的性能已經(jīng)取得了重大的突破,在眾多公開數(shù)據(jù)集上超越了傳統(tǒng)方法。姿態(tài)估計(jì)也是基礎(chǔ)課題之一,特別是頭部姿態(tài)估計(jì),可以應(yīng)用在三維人臉建模、人機(jī)交互協(xié)作、虛擬現(xiàn)實(shí)等領(lǐng)域。自動(dòng)駕駛技術(shù)的發(fā)展更離不開上述兩個(gè)技術(shù):行人、車輛檢測(cè)、行人行走路線預(yù)測(cè)等。傳統(tǒng)的目標(biāo)檢測(cè)是利用滑動(dòng)窗口進(jìn)行區(qū)域選擇,該策略沒有利用先驗(yàn)知識(shí),導(dǎo)致時(shí)間復(fù)雜度很高,產(chǎn)生許多冗余窗口;其手工設(shè)計(jì)的特征對(duì)于目標(biāo)的變化不夠魯棒。基于卷積神經(jīng)網(wǎng)絡(luò)的方法很好的解決了上述兩個(gè)問(wèn)題。但是現(xiàn)有技術(shù)在一些常用數(shù)據(jù)集上卻沒有很好的表現(xiàn),主要原因在于對(duì)于遮擋、截?cái)嗟葟?fù)雜情況下的目標(biāo)檢測(cè)不夠精準(zhǔn)。同時(shí),具有較高精度的基于區(qū)域提名的方法一般速度都很慢。本文提出了一種利用子類信息的卷積神經(jīng)網(wǎng)絡(luò)的精確快速的目標(biāo)檢測(cè)方法,在保證檢測(cè)精度的同時(shí),提升原有檢測(cè)方法的速度。其速度和精度在多個(gè)數(shù)據(jù)集上達(dá)到了很好的平衡。頭部姿態(tài)估計(jì)研究如何從圖像推斷頭部朝向的問(wèn)題,即求出俯仰角、偏航角、翻滾角三個(gè)姿態(tài)角。本文利用子類信息,... 

【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:98 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

子類敏感卷積神經(jīng)網(wǎng)絡(luò)研究:目標(biāo)檢測(cè)與姿態(tài)估計(jì)


–2mlp卷積層和一般卷積層的比較

曲線,數(shù)據(jù)集,目標(biāo)檢測(cè),圖片


包括 5011 張訓(xùn)練集圖片和 4952 張測(cè)試集圖片?偣灿 20 個(gè)類別,各類別的統(tǒng)計(jì)數(shù)據(jù)如表3–4所示,其中第一排為 KITTI 數(shù)據(jù)集中的圖片,第二排為 PascalVOC 2007 數(shù)據(jù)集中的圖片。兩個(gè)數(shù)據(jù)集的示例圖片如圖3–9所示,其中第一排和第二排分別為 KITTI 和 Pascal VOC 2007 數(shù)據(jù)集示例。表 3–4 Pascal VOC 2007 數(shù)據(jù)集統(tǒng)計(jì)數(shù)據(jù)Table 3–4 Statistics on the Pascal VOC 2007物體圖像數(shù) 飛機(jī) 單車 鳥 船 瓶子 公車 汽車 貓 椅子 牛 餐桌 狗 馬 摩托車 人 盆栽 綿羊 沙發(fā) 火車 電視訓(xùn)練集 238 243 330 181 244 186 713 337 445 141 200 421 287 245 2008 245 96 229 261 256驗(yàn)證集 204 239 282 172 212 174 721 322 417 127 190 418 274 222 2007 224 97 223 259 229總共 442 482 612 353 456 360 1434 659 862 268 390 839 561 467 4015 469 193 452 520 4852) 評(píng)價(jià)指標(biāo)實(shí)驗(yàn)使用平均精度(Average Precision, AP)[69]作為評(píng)價(jià)指標(biāo),輸出檢測(cè)到的物體類別同時(shí)給出置信度,并根據(jù)分?jǐn)?shù)計(jì)算各類別的平均精度。該指標(biāo)計(jì)算的是召回率和準(zhǔn)確率曲線下的面積。在 KITTI 數(shù)據(jù)集上,對(duì)于車輛、行人和騎行者的覆蓋率閾值分別為 70%、50%、50%,在 Pascal VOC 2007 數(shù)據(jù)集上所有類的覆蓋率閾值均為 50%

模型圖,混合樹,模型,部件模板


的混合模型共享部件模板。據(jù)此可以只用低復(fù)雜度的模型對(duì)大量的視角建模。最后,所有的模型參數(shù),包括部件模板、彈性形變模式、基于視角的拓?fù)洌寄苡袇^(qū)別的在最大間隔框架上訓(xùn)練。圖4–2為利用混合模型來(lái)對(duì)由視角產(chǎn)生的拓?fù)湫巫冞M(jìn)行建模的示意圖。4.2 人臉檢測(cè)相關(guān)工作作為人臉?lè)治龅囊粋(gè)基本問(wèn)題,人臉檢測(cè)已經(jīng)被研究了很多年。在眾多工作中,主要存在兩類方法:基于剛性模板的方法和基于可形變部件模型(DPM)[87]的— 50 —

【參考文獻(xiàn)】:
期刊論文
[1]圖像物體分類與檢測(cè)算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛.  計(jì)算機(jī)學(xué)報(bào). 2014(06)



本文編號(hào):2978754

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2978754.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6c02d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com