面向無(wú)人機(jī)視覺(jué)的圖像語(yǔ)義分割技術(shù)研究
發(fā)布時(shí)間:2022-02-10 10:24
隨著通信技術(shù)、計(jì)算機(jī)硬件技術(shù)近年來(lái)的快速發(fā)展,無(wú)人機(jī)由于其體積小、靈活性高、適應(yīng)力強(qiáng)等優(yōu)點(diǎn),無(wú)論是在軍用的偵察、攻擊、預(yù)警領(lǐng)域,還是在民用的交通、氣象、農(nóng)業(yè)、救災(zāi)、娛樂(lè)等領(lǐng)域都有了廣泛的應(yīng)用。在無(wú)人機(jī)自主飛行時(shí),需要自動(dòng)完成導(dǎo)航、避障、定位等;在救災(zāi)現(xiàn)場(chǎng)使用無(wú)人機(jī)進(jìn)行偵察時(shí),需要迅速對(duì)災(zāi)情進(jìn)行判斷然后再做決策;在無(wú)人機(jī)自動(dòng)落地時(shí),需要精準(zhǔn)地找到落地點(diǎn);這些都需要依靠無(wú)人機(jī)視覺(jué)來(lái)實(shí)現(xiàn)自動(dòng)環(huán)境感知。因此如何在復(fù)雜場(chǎng)景下高效準(zhǔn)確地實(shí)現(xiàn)環(huán)境感知是無(wú)人機(jī)視覺(jué)領(lǐng)域的技術(shù)熱點(diǎn)。當(dāng)前飛速發(fā)展的深度學(xué)習(xí)技術(shù)為無(wú)人機(jī)環(huán)境感知提供了良好的解決方案,使用像素級(jí)的圖像語(yǔ)義分割技術(shù)為使得無(wú)人機(jī)自主圖像理解成為可能。但是現(xiàn)有的圖像語(yǔ)義分割算法通常致力于提升精度,在實(shí)時(shí)性方面表現(xiàn)并不好,無(wú)法直接適用于無(wú)人機(jī)環(huán)境感知場(chǎng)景。本文重點(diǎn)針對(duì)上述問(wèn)題,面向復(fù)雜場(chǎng)景下的無(wú)人機(jī)視覺(jué)開(kāi)展了基于深度學(xué)習(xí)的高效實(shí)時(shí)圖像語(yǔ)義分割算法研究。設(shè)計(jì)了算法流程,構(gòu)建了分模塊的網(wǎng)絡(luò)結(jié)構(gòu);鶞(zhǔn)網(wǎng)絡(luò)部分針對(duì)精度較低問(wèn)題引入殘差結(jié)構(gòu)來(lái)加深網(wǎng)絡(luò)層數(shù)、引入空洞卷積來(lái)增大感受野,同時(shí)使用深度可分離卷積替代普通卷積來(lái)分離通道降低計(jì)算量從而解決實(shí)時(shí)性問(wèn)題。特征增強(qiáng)...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省211工程院校985工程院校
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
全連接(上)和局部連接(下)
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-10-向、縱向的邊緣,或者顏色特征等,而對(duì)于相同兩層之間的卷積計(jì)算,雖然由于局部連接機(jī)制不同位置獨(dú)立計(jì)算,但是可以使用一樣的卷積和來(lái)完成運(yùn)算,這樣同層可以提取到同樣的特征,通過(guò)卷積核的共用大大減少了參數(shù)量,也提升了學(xué)習(xí)時(shí)的效率。卷積神經(jīng)網(wǎng)絡(luò)的組件和感受野卷積神經(jīng)網(wǎng)絡(luò)通常由卷積層、激活層、池化層和全連接層組成。這些層級(jí)結(jié)構(gòu)通過(guò)正向傳播和反向傳播構(gòu)成了完整的CNN模型,以下將對(duì)這幾個(gè)部分進(jìn)行分別講解。(1)卷積層卷積層是CNN結(jié)構(gòu)中最基本、最核心的單元,因?yàn)樗瓿闪擞?jì)算機(jī)視覺(jué)任務(wù)中最為重要的特征提取的部分。在信號(hào)領(lǐng)域的線性系統(tǒng)中的卷積運(yùn)算描述了輸入信號(hào)在脈沖響應(yīng)下的輸出信號(hào),圖像領(lǐng)域中的卷積也是類似的操作,其運(yùn)算如圖2-2所示。圖2-2卷積操作示意圖這是一個(gè)輸入為5×5的圖像,對(duì)其使用一個(gè)3×3的卷積核,卷積核在9個(gè)點(diǎn)的權(quán)值為步長(zhǎng)為2,通道數(shù)為1,不使用填充操作,就可以得到一張2×2的輸出特征圖,其中每個(gè)點(diǎn)的卷積運(yùn)算如式(2-1)所示。(2-1)其中,表示在卷積核覆蓋內(nèi)的輸入圖像在該點(diǎn)的像素值,則表示經(jīng)過(guò)該卷積運(yùn)算,在該點(diǎn)得到的最終特征值。步長(zhǎng)為2意為著卷積操作在進(jìn)行滑動(dòng)窗卷積時(shí),每次移動(dòng)的步長(zhǎng)為2。通道數(shù)表示卷積核的個(gè)數(shù),及濾波器的個(gè)數(shù),使用多個(gè)通道數(shù)可以在一次卷積層操作后提取不同類型的特征,提高體特征的效率。在實(shí)際使用中,邊界在多層卷積后信息逐漸丟失,通常會(huì)在圖像中加入填充操作,對(duì)于步長(zhǎng)為1的卷積操作,引入填充操作可以保證經(jīng)過(guò)一層卷積后
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-11-獲得相同尺度的特征圖。(2)池化層卷積層通過(guò)卷積操作可以得到大量的特征,假如一直使用卷積層來(lái)連接不同層的神經(jīng)元,那會(huì)由于特征圖的尺度很大造成計(jì)算量很大而且特征冗余的問(wèn)題,針對(duì)這一問(wèn)題池化層就是很好的解決方案。圖2-3最大池化操作示意圖圖2-3是一個(gè)最大池化的示意圖,輸入是一個(gè)4×4的特征圖像,對(duì)其進(jìn)行步長(zhǎng)為2,尺度為2的最大池化操作,得到一個(gè)輸出為2×2的特征圖,對(duì)于輸出的每一點(diǎn),其運(yùn)算過(guò)程如式(2-2)。(2-2)其中,表示該點(diǎn)池化時(shí)所覆蓋的原特征圖像素值。池化方式還有均值池化、中值池化等。池化操作能夠?qū)崿F(xiàn)下采樣的目的,如圖2-2中,經(jīng)過(guò)池化操作特征圖尺寸減半,減小的幅度由池化的步長(zhǎng)和模板的尺度共同決定。經(jīng)過(guò)池化層后,特征冗余被減弱,而且削弱了特征的位置性,使得不同位置的特征經(jīng)過(guò)池化操作都可以出現(xiàn)在特征圖中,增強(qiáng)了網(wǎng)絡(luò)的魯棒性和泛化能力。(3)全連接層全連接層顧名思義就是將上層神經(jīng)元與該層全部相連,不同于卷積層參數(shù)數(shù)量取決于卷積核的大小,全連接層的參數(shù)數(shù)量由上層決定,通常位于分類任務(wù)最后的層級(jí),來(lái)完成對(duì)前序特征的全部整合,以經(jīng)過(guò)最后的判定得到輸出結(jié)果。其結(jié)構(gòu)如圖2-4所示。但是對(duì)于含有全連接層的網(wǎng)絡(luò),該層的參數(shù)幾乎占據(jù)了整個(gè)網(wǎng)絡(luò)的參數(shù)量,通常為了考慮網(wǎng)絡(luò)的性能都會(huì)進(jìn)行選擇性替代,例如卷積層,但是在精度上也會(huì)有一定的損失。圖2-4全連接層結(jié)構(gòu)示意圖
【參考文獻(xiàn)】:
期刊論文
[1]無(wú)人機(jī)視覺(jué)導(dǎo)航研究綜述[J]. 吳顯亮,石宗英,鐘宜生. 系統(tǒng)仿真學(xué)報(bào). 2010(S1)
本文編號(hào):3618733
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省211工程院校985工程院校
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
全連接(上)和局部連接(下)
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-10-向、縱向的邊緣,或者顏色特征等,而對(duì)于相同兩層之間的卷積計(jì)算,雖然由于局部連接機(jī)制不同位置獨(dú)立計(jì)算,但是可以使用一樣的卷積和來(lái)完成運(yùn)算,這樣同層可以提取到同樣的特征,通過(guò)卷積核的共用大大減少了參數(shù)量,也提升了學(xué)習(xí)時(shí)的效率。卷積神經(jīng)網(wǎng)絡(luò)的組件和感受野卷積神經(jīng)網(wǎng)絡(luò)通常由卷積層、激活層、池化層和全連接層組成。這些層級(jí)結(jié)構(gòu)通過(guò)正向傳播和反向傳播構(gòu)成了完整的CNN模型,以下將對(duì)這幾個(gè)部分進(jìn)行分別講解。(1)卷積層卷積層是CNN結(jié)構(gòu)中最基本、最核心的單元,因?yàn)樗瓿闪擞?jì)算機(jī)視覺(jué)任務(wù)中最為重要的特征提取的部分。在信號(hào)領(lǐng)域的線性系統(tǒng)中的卷積運(yùn)算描述了輸入信號(hào)在脈沖響應(yīng)下的輸出信號(hào),圖像領(lǐng)域中的卷積也是類似的操作,其運(yùn)算如圖2-2所示。圖2-2卷積操作示意圖這是一個(gè)輸入為5×5的圖像,對(duì)其使用一個(gè)3×3的卷積核,卷積核在9個(gè)點(diǎn)的權(quán)值為步長(zhǎng)為2,通道數(shù)為1,不使用填充操作,就可以得到一張2×2的輸出特征圖,其中每個(gè)點(diǎn)的卷積運(yùn)算如式(2-1)所示。(2-1)其中,表示在卷積核覆蓋內(nèi)的輸入圖像在該點(diǎn)的像素值,則表示經(jīng)過(guò)該卷積運(yùn)算,在該點(diǎn)得到的最終特征值。步長(zhǎng)為2意為著卷積操作在進(jìn)行滑動(dòng)窗卷積時(shí),每次移動(dòng)的步長(zhǎng)為2。通道數(shù)表示卷積核的個(gè)數(shù),及濾波器的個(gè)數(shù),使用多個(gè)通道數(shù)可以在一次卷積層操作后提取不同類型的特征,提高體特征的效率。在實(shí)際使用中,邊界在多層卷積后信息逐漸丟失,通常會(huì)在圖像中加入填充操作,對(duì)于步長(zhǎng)為1的卷積操作,引入填充操作可以保證經(jīng)過(guò)一層卷積后
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-11-獲得相同尺度的特征圖。(2)池化層卷積層通過(guò)卷積操作可以得到大量的特征,假如一直使用卷積層來(lái)連接不同層的神經(jīng)元,那會(huì)由于特征圖的尺度很大造成計(jì)算量很大而且特征冗余的問(wèn)題,針對(duì)這一問(wèn)題池化層就是很好的解決方案。圖2-3最大池化操作示意圖圖2-3是一個(gè)最大池化的示意圖,輸入是一個(gè)4×4的特征圖像,對(duì)其進(jìn)行步長(zhǎng)為2,尺度為2的最大池化操作,得到一個(gè)輸出為2×2的特征圖,對(duì)于輸出的每一點(diǎn),其運(yùn)算過(guò)程如式(2-2)。(2-2)其中,表示該點(diǎn)池化時(shí)所覆蓋的原特征圖像素值。池化方式還有均值池化、中值池化等。池化操作能夠?qū)崿F(xiàn)下采樣的目的,如圖2-2中,經(jīng)過(guò)池化操作特征圖尺寸減半,減小的幅度由池化的步長(zhǎng)和模板的尺度共同決定。經(jīng)過(guò)池化層后,特征冗余被減弱,而且削弱了特征的位置性,使得不同位置的特征經(jīng)過(guò)池化操作都可以出現(xiàn)在特征圖中,增強(qiáng)了網(wǎng)絡(luò)的魯棒性和泛化能力。(3)全連接層全連接層顧名思義就是將上層神經(jīng)元與該層全部相連,不同于卷積層參數(shù)數(shù)量取決于卷積核的大小,全連接層的參數(shù)數(shù)量由上層決定,通常位于分類任務(wù)最后的層級(jí),來(lái)完成對(duì)前序特征的全部整合,以經(jīng)過(guò)最后的判定得到輸出結(jié)果。其結(jié)構(gòu)如圖2-4所示。但是對(duì)于含有全連接層的網(wǎng)絡(luò),該層的參數(shù)幾乎占據(jù)了整個(gè)網(wǎng)絡(luò)的參數(shù)量,通常為了考慮網(wǎng)絡(luò)的性能都會(huì)進(jìn)行選擇性替代,例如卷積層,但是在精度上也會(huì)有一定的損失。圖2-4全連接層結(jié)構(gòu)示意圖
【參考文獻(xiàn)】:
期刊論文
[1]無(wú)人機(jī)視覺(jué)導(dǎo)航研究綜述[J]. 吳顯亮,石宗英,鐘宜生. 系統(tǒng)仿真學(xué)報(bào). 2010(S1)
本文編號(hào):3618733
本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/3618733.html
最近更新
教材專著