無(wú)人機(jī)系統(tǒng)下基于學(xué)習(xí)的道路車輛檢測(cè)跟蹤技術(shù)
發(fā)布時(shí)間:2021-01-16 15:31
無(wú)人機(jī)因其體積小、重量輕、易隱蔽、靈活控制等優(yōu)點(diǎn)開(kāi)始在民用領(lǐng)域得到廣泛應(yīng)用。目前,傳統(tǒng)目標(biāo)檢測(cè)與跟蹤技術(shù)無(wú)法滿足無(wú)人機(jī)平臺(tái)下復(fù)雜動(dòng)態(tài)的視頻目標(biāo)檢測(cè)與跟蹤任務(wù)需求。本文以道路車輛為被測(cè)對(duì)象,利用深度學(xué)習(xí)技術(shù),對(duì)無(wú)人機(jī)系統(tǒng)下的道路車輛檢測(cè)與跟蹤方法進(jìn)行深入研究,論文的主要工作反映如下:(1)基于YOLO(You Only Look Once)網(wǎng)絡(luò)的車輛檢測(cè)改進(jìn)方法研究。結(jié)合不同連接方式的特征提取網(wǎng)絡(luò),重構(gòu)了一種基于YOLO的網(wǎng)絡(luò)模型,用于實(shí)時(shí)檢測(cè)無(wú)人機(jī)航拍圖像下小目標(biāo)的道路車輛。首先,為保留小目標(biāo)在水平方向上的細(xì)粒度特征,通過(guò)調(diào)整網(wǎng)格數(shù)量設(shè)置來(lái)增加特征圖橫向分辨率。其次,利用K-means聚類方法確定網(wǎng)絡(luò)中Anchor boxes的大小和數(shù)量,用于匹配所需檢測(cè)車輛目標(biāo)的尺寸,以便減少計(jì)算復(fù)雜度,提高網(wǎng)絡(luò)預(yù)測(cè)能力。然后,針對(duì)隨機(jī)初始化網(wǎng)絡(luò)訓(xùn)練慢、難收斂的問(wèn)題,選取ResNet-v1-50預(yù)訓(xùn)練模型來(lái)替換原模型的淺層結(jié)構(gòu)。在網(wǎng)絡(luò)深層結(jié)構(gòu)中,采用不同連接方式的密集拓?fù)浣Y(jié)構(gòu),強(qiáng)化網(wǎng)絡(luò)的小目標(biāo)特征提取能力。此外,為提高網(wǎng)絡(luò)池化效率,采用可學(xué)習(xí)的權(quán)重參數(shù)來(lái)平衡最大值池化和平均池化的使用比例。不同天氣、...
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一階檢測(cè)方法結(jié)構(gòu)圖
圖 1. 2 二階檢測(cè)方法結(jié)構(gòu)圖目標(biāo)檢測(cè)方法中具有代表性的是 R-CNN 系列檢測(cè)方法。Ross Girshick 等人相]和 Fast R-CNN[12]方法,這兩種方法都是通過(guò)選擇性搜索方式(Selective Search標(biāo)檢測(cè)的感興趣區(qū)域。在 SS 中,通過(guò)從每個(gè)單獨(dú)的像素開(kāi)始作為一個(gè)組,然紋理并合并兩個(gè)最相近的組。但為了避免單個(gè)區(qū)域吞噬其他區(qū)域,SS 更傾向于進(jìn)行合并,然后繼續(xù)合并區(qū)域直到所有內(nèi)容組合在一起。R-CNN 利用 SS 方法0 個(gè)感興趣區(qū)域框,然后將這些區(qū)域歸一化到固定大小的圖像并單獨(dú)饋送到神于 R-CNN 方法,F(xiàn)ast R-CNN 則采用在整張圖上用特征提取器來(lái)提取特征,然將感興趣區(qū)域應(yīng)用在特征圖上,這樣的做法就不需要做重復(fù)的特征提取。此外oling 方式來(lái)將這些區(qū)域歸一化到固定大小的圖像。后來(lái),Ross Girshick 等人[13]R-CNN 方法。除了使用內(nèi)嵌的區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN),用了與 Fast R-CNN 相同的設(shè)計(jì)。RPN 網(wǎng)絡(luò)相對(duì) SS 方法更高效,在每張圖上僅需要 10ms 的時(shí)間。此外,何凱明等人[14]提出的 Mask R-CNN 方法不僅可以,也可以用于圖像目標(biāo)檢測(cè)。針對(duì)于目標(biāo)檢測(cè),這個(gè)方法的亮點(diǎn)在于對(duì) ROI 進(jìn)。他提出了新的 ROI Align 操作,即加入了雙線性插值的方法來(lái)精煉感興趣
(2)目標(biāo)表觀信息變化由于光照強(qiáng)度,拍攝角度等客觀因素存在使得目標(biāo)的表觀信息發(fā)生變化,容易造成跟蹤器發(fā)生誤判情況。(3)目標(biāo)部分遮擋或全遮擋針對(duì)視頻序列中的運(yùn)動(dòng)目標(biāo),容易發(fā)生目標(biāo)部分遮擋或全遮擋情況。對(duì)于部分遮擋情況,目標(biāo)信息量的減少容易使得目標(biāo)跟蹤丟失。對(duì)于全遮擋情況,短暫的目標(biāo)消失需要跟蹤器具有一定的預(yù)測(cè)能力。如果期間目標(biāo)的實(shí)際運(yùn)動(dòng)狀態(tài)發(fā)生變化,極容易產(chǎn)生大偏差的預(yù)測(cè)結(jié)果。對(duì)于多目標(biāo)跟蹤方法,其根據(jù)跟蹤軌跡的生成順序主要分為在線多目標(biāo)跟蹤算法和離線多目標(biāo)跟蹤算法。在離線多目標(biāo)跟蹤算法[23-25]中,一般在目標(biāo)檢測(cè)關(guān)系中構(gòu)建相應(yīng)的圖模型,對(duì)于設(shè)計(jì)檢測(cè)框之間的匹配性或距離度量是決定圖模型構(gòu)建正確與否的關(guān)鍵。而對(duì)于在線多目標(biāo)跟蹤算法[26-28]則是根據(jù)當(dāng)前檢測(cè)的結(jié)果,計(jì)算出當(dāng)前檢測(cè)框與已有軌跡的匹配度,以確定匹配的正確性。因此,無(wú)論是在線多目標(biāo)跟蹤還是離線多目標(biāo)跟蹤,如何學(xué)習(xí)基于檢測(cè)結(jié)果的特征計(jì)算匹配的相似度或距離度量都是多目標(biāo)跟蹤方法的重要步驟。本文主要研究深度學(xué)習(xí)方法在目標(biāo)跟蹤領(lǐng)域的應(yīng)用技術(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于并行跟蹤檢測(cè)框架與深度學(xué)習(xí)的目標(biāo)跟蹤算法[J]. 閆若怡,熊丹,于清華,肖軍浩,盧惠民. 計(jì)算機(jī)應(yīng)用. 2019(02)
本文編號(hào):2981074
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一階檢測(cè)方法結(jié)構(gòu)圖
圖 1. 2 二階檢測(cè)方法結(jié)構(gòu)圖目標(biāo)檢測(cè)方法中具有代表性的是 R-CNN 系列檢測(cè)方法。Ross Girshick 等人相]和 Fast R-CNN[12]方法,這兩種方法都是通過(guò)選擇性搜索方式(Selective Search標(biāo)檢測(cè)的感興趣區(qū)域。在 SS 中,通過(guò)從每個(gè)單獨(dú)的像素開(kāi)始作為一個(gè)組,然紋理并合并兩個(gè)最相近的組。但為了避免單個(gè)區(qū)域吞噬其他區(qū)域,SS 更傾向于進(jìn)行合并,然后繼續(xù)合并區(qū)域直到所有內(nèi)容組合在一起。R-CNN 利用 SS 方法0 個(gè)感興趣區(qū)域框,然后將這些區(qū)域歸一化到固定大小的圖像并單獨(dú)饋送到神于 R-CNN 方法,F(xiàn)ast R-CNN 則采用在整張圖上用特征提取器來(lái)提取特征,然將感興趣區(qū)域應(yīng)用在特征圖上,這樣的做法就不需要做重復(fù)的特征提取。此外oling 方式來(lái)將這些區(qū)域歸一化到固定大小的圖像。后來(lái),Ross Girshick 等人[13]R-CNN 方法。除了使用內(nèi)嵌的區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN),用了與 Fast R-CNN 相同的設(shè)計(jì)。RPN 網(wǎng)絡(luò)相對(duì) SS 方法更高效,在每張圖上僅需要 10ms 的時(shí)間。此外,何凱明等人[14]提出的 Mask R-CNN 方法不僅可以,也可以用于圖像目標(biāo)檢測(cè)。針對(duì)于目標(biāo)檢測(cè),這個(gè)方法的亮點(diǎn)在于對(duì) ROI 進(jìn)。他提出了新的 ROI Align 操作,即加入了雙線性插值的方法來(lái)精煉感興趣
(2)目標(biāo)表觀信息變化由于光照強(qiáng)度,拍攝角度等客觀因素存在使得目標(biāo)的表觀信息發(fā)生變化,容易造成跟蹤器發(fā)生誤判情況。(3)目標(biāo)部分遮擋或全遮擋針對(duì)視頻序列中的運(yùn)動(dòng)目標(biāo),容易發(fā)生目標(biāo)部分遮擋或全遮擋情況。對(duì)于部分遮擋情況,目標(biāo)信息量的減少容易使得目標(biāo)跟蹤丟失。對(duì)于全遮擋情況,短暫的目標(biāo)消失需要跟蹤器具有一定的預(yù)測(cè)能力。如果期間目標(biāo)的實(shí)際運(yùn)動(dòng)狀態(tài)發(fā)生變化,極容易產(chǎn)生大偏差的預(yù)測(cè)結(jié)果。對(duì)于多目標(biāo)跟蹤方法,其根據(jù)跟蹤軌跡的生成順序主要分為在線多目標(biāo)跟蹤算法和離線多目標(biāo)跟蹤算法。在離線多目標(biāo)跟蹤算法[23-25]中,一般在目標(biāo)檢測(cè)關(guān)系中構(gòu)建相應(yīng)的圖模型,對(duì)于設(shè)計(jì)檢測(cè)框之間的匹配性或距離度量是決定圖模型構(gòu)建正確與否的關(guān)鍵。而對(duì)于在線多目標(biāo)跟蹤算法[26-28]則是根據(jù)當(dāng)前檢測(cè)的結(jié)果,計(jì)算出當(dāng)前檢測(cè)框與已有軌跡的匹配度,以確定匹配的正確性。因此,無(wú)論是在線多目標(biāo)跟蹤還是離線多目標(biāo)跟蹤,如何學(xué)習(xí)基于檢測(cè)結(jié)果的特征計(jì)算匹配的相似度或距離度量都是多目標(biāo)跟蹤方法的重要步驟。本文主要研究深度學(xué)習(xí)方法在目標(biāo)跟蹤領(lǐng)域的應(yīng)用技術(shù)。
【參考文獻(xiàn)】:
期刊論文
[1]基于并行跟蹤檢測(cè)框架與深度學(xué)習(xí)的目標(biāo)跟蹤算法[J]. 閆若怡,熊丹,于清華,肖軍浩,盧惠民. 計(jì)算機(jī)應(yīng)用. 2019(02)
本文編號(hào):2981074
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2981074.html
最近更新
教材專著