基于深度學(xué)習(xí)的物體間關(guān)系檢測(cè)算法研究
【學(xué)位單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.41;TP181
【部分圖文】:
逑圖丨-1傳統(tǒng)物體檢測(cè)算法流程逡逑傳統(tǒng)的物體檢測(cè)流程如圖1-1所示,給定一張圖片,候選框生成模塊找出圖逡逑像中可能包含物體的方框,隨后分類器依據(jù)這些方框的圖像特征進(jìn)行分類,得到逡逑方框所屬的物體類別。從檢測(cè)流程可以看出,傳統(tǒng)的物體檢測(cè)算法主要包括三部逡逑分內(nèi)容:候選框生成、圖像特征設(shè)計(jì)和分類器。下面將依次介紹這三個(gè)部分:逡逑(1)
這類算法的檢測(cè)速度更快,但檢測(cè)準(zhǔn)確率較差。YOLO算法的主要思逡逑路是先將圖像分成7X7的網(wǎng)格,并在每個(gè)網(wǎng)格內(nèi)預(yù)估出兩個(gè)物體,隨后根據(jù)閾逡逑值去除可能性比較低的物體方框得到最終的檢測(cè)結(jié)果,整體流程如圖1-3所示。逡逑YOLO算法沒有候選框機(jī)制,直接在7x7的網(wǎng)格上回歸物體邊框,這使得物體逡逑的定位不是非常準(zhǔn)確。針對(duì)YOL?算法存在的問題,SSD算法借鑒了邋Faster邋R-逡逑CNN中描點(diǎn)(anchor)的理念,為每一個(gè)網(wǎng)格單兀預(yù)設(shè)大小、比例各不相同的多逡逑個(gè)先驗(yàn)框,在先驗(yàn)框的基礎(chǔ)上回歸物體邊框。SSD算法的這一設(shè)計(jì)使得其對(duì)物體逡逑的定位更加準(zhǔn)確。逡逑《8!洌澹睿悖濉罚惧遑铄义希殄澹殄澹边姡坼澹椋义希鳎欤у澹椋卞澹В椋檫娖阶渝澹欤麇义希渝澹澹渝澹纾颍椋溴澹铮铄澹椋睿穑酰暨姡儒澹冗姡疲椋睿幔戾澹洌澹簦澹悖簦椋铮睿箦义希茫欤幔螅箦澹穑颍铮猓幔猓椋欤椋簦澹恚幔疱义蠄D1-3邋YOLO算法流程[12】逡逑1.2.2謂語檢測(cè)研究現(xiàn)狀逡逑謂語檢測(cè)的目標(biāo)是預(yù)估出兩個(gè)物體間最可能的謂語類別,目前效果比較好的逡逑謂語檢測(cè)算法是李飛飛提出的含有語言先驗(yàn)的檢測(cè)方法W以及視覺轉(zhuǎn)換嵌入模逡逑型[|5]邋(VisualTranslationEmbedding,邋VTransE),下面將分別對(duì)這兩種方法進(jìn)行介逡逑紹。逡逑含有語言先驗(yàn)的檢測(cè)方法的主要思路是先使用R-CNN模型檢測(cè)出一張圖片逡逑中所有的物體,并將這些物體兩兩組合構(gòu)成物體對(duì),隨后使用視覺和語言兩個(gè)模逡逑塊判斷兩個(gè)物體間最可能的謂語類別。模型的語言模塊使用預(yù)訓(xùn)練好的WOTd2vec逡逑模型[%將兩個(gè)物體的類別轉(zhuǎn)化為向量并進(jìn)行拼接
(?lA3j逡逑圖2-1神經(jīng)元模型結(jié)構(gòu)圖逡逑以圖2-1中的神經(jīng)元模型為例說明神經(jīng)元模型的計(jì)算流程:神經(jīng)元接收三個(gè)逡逑輸入變量々,X2,邋X3,這些輸入變量分別與權(quán)重Wi,w2,相乘并作和,隨后逡逑非線性函數(shù)(也叫激活函數(shù))對(duì)求和值進(jìn)行轉(zhuǎn)換得到神經(jīng)元的最終輸出。神經(jīng)元逡逑模型的完整計(jì)算邏輯如式2-1所示,其中w,?表示權(quán)值,A表示輸入,/表示激活函逡逑數(shù)。逡逑y邋=邐w^i)邐(2-1)逡逑理想的激活函數(shù)是圖2-2所示的階躍函數(shù),它能將輸入值映射為0或者1(對(duì)逡逑應(yīng)于生物神經(jīng)元,1表示興奮,0表示抑制)。然而,階躍函數(shù)具有不連續(xù)、不光逡逑滑等缺點(diǎn),因此實(shí)際中一般使用Sigmoid[231和修正線性單兀[241邋(Rectified邋Linear逡逑Unit,ReLU)作為激活函數(shù)。逡逑1.5|逡逑1.0邐逡逑0.5邋-逡逑I邐L...邋.邋邋邋—邋1邐邐!邐!邐>逡逑-3-2-10123逡逑圖2-2階躍函數(shù)逡逑2.1.2邋BP神經(jīng)網(wǎng)絡(luò)逡逑上面介紹的yL經(jīng)元模型結(jié)構(gòu)非常簡(jiǎn)單,只是對(duì)輸入數(shù)據(jù)做了一次加權(quán)求和以逡逑及一次非線性變換
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王三虎;強(qiáng)彥;;基于混沌粒子優(yōu)化匹配的無線傳感網(wǎng)簇區(qū)域生成算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2016年11期
2 李忠東;;你快樂不快樂[J];檢察風(fēng)云;2019年09期
3 胡乾;;數(shù)字圖像處理的區(qū)域分割淺析[J];電子世界;2016年07期
4 日月光;;圖像模糊也玩花樣[J];電腦迷;2005年16期
5 王宸昊;黃輝先;吳翼;湯紅忠;;彩色汽車牌照的定位方法[J];兵工自動(dòng)化;2006年06期
6 周敬;;圖像分割中閾值法的研究[J];機(jī)電技術(shù);2010年01期
7 徐紅云;許雋;龔羽菁;徐夢(mèng)真;;基于空間混淆位置隱私保護(hù)的位置隱私區(qū)域生成算法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
8 楊師帆;建設(shè)文化大省戰(zhàn)略中的廣東音樂[J];探求;2005年03期
9 劉佳;方賢進(jìn);康佳;;社交網(wǎng)絡(luò)中的位置隱私保護(hù)研究[J];電腦知識(shí)與技術(shù);2014年28期
10 王旭初;翟隨強(qiáng);牛彥敏;葛永新;;結(jié)合候選區(qū)域距離度量學(xué)習(xí)與CNN分類回歸聯(lián)合的左心室檢測(cè)[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2019年03期
相關(guān)博士學(xué)位論文 前1條
1 任少卿;基于特征共享的高效物體檢測(cè)[D];中國科學(xué)技術(shù)大學(xué);2016年
相關(guān)碩士學(xué)位論文 前7條
1 董亞輝;基于深度學(xué)習(xí)的物體間關(guān)系檢測(cè)算法研究[D];北京郵電大學(xué);2019年
2 王田雨;目標(biāo)檢測(cè)中候選區(qū)域生成算法的研究與改進(jìn)[D];哈爾濱工業(yè)大學(xué);2018年
3 劉曉龍;基于圖像的行人檢測(cè)算法研究[D];國防科學(xué)技術(shù)大學(xué);2017年
4 王賓;基于區(qū)域生成網(wǎng)絡(luò)的自動(dòng)駕駛系統(tǒng)行人檢測(cè)算法實(shí)現(xiàn)[D];西南交通大學(xué);2018年
5 趙晶晶;CoMP系統(tǒng)協(xié)作區(qū)域生成與調(diào)度算法研究[D];北京郵電大學(xué);2013年
6 代慧;高分辨SAR圖像目標(biāo)區(qū)域提取方法研究[D];西安電子科技大學(xué);2017年
7 徐曉濤;車牌識(shí)別中關(guān)鍵技術(shù)的研究[D];東華大學(xué);2012年
本文編號(hào):2831671
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2831671.html