基于深層網(wǎng)絡(luò)的城市街道場景的語義分割的方法研究
發(fā)布時間:2021-01-26 06:57
隨著人工智能技術(shù)的高速發(fā)展,“感知城市”這一詞匯漸漸被人們關(guān)注并熟知。圖像語義分割技術(shù)是實現(xiàn)“感知城市”的一種效率高、成本低的手段,在許多領(lǐng)域得到廣泛應(yīng)用。比如,通過對飛機的航拍圖像進(jìn)行語義分割以輔助飛行員確定安全著陸點;對行車記錄儀傳輸圖像進(jìn)行語義分割以幫助駕駛員規(guī)劃安全可靠的行車路線。近年來,基于深層卷積神經(jīng)網(wǎng)絡(luò)的方法在語義分割問題上取得了一系列的突破。但實際中,訓(xùn)練所得的分割模型往往參數(shù)量過于龐大,可移植性差,不利于實際工程應(yīng)用;同時由于城市街道場景圖像復(fù)雜導(dǎo)致網(wǎng)絡(luò)整體的分割結(jié)果不夠理想。本文針對上述問題,深入研究了城市街道場景下的圖像語義分割方法,主要工作如下:從模型輕量化的角度出發(fā),提出一種針對復(fù)雜場景下的輕量多通道特征融合的語義分割模型。首先,本文在Deeplab V2的基礎(chǔ)上進(jìn)行了改進(jìn),將Deeplab V2網(wǎng)絡(luò)與多通道特征融合結(jié)構(gòu)RefineNet結(jié)合,有效改善了模型的分割細(xì)節(jié)。然后,在此基礎(chǔ)上提出輕量化改進(jìn),將深度可分離卷積引入空洞空間金字塔池化模型(ASPP)與RefineNet并提出輕量化結(jié)構(gòu)Light-ASPP與Light-RefineNet(V1、V2),有效...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割圖示
在其他條件相同的情況下,單個傳統(tǒng)卷積的感受野是 3,單個空洞卷積的感受野是 5。圖2.3 不同空洞率的空洞卷積圖 2.3 是不同空洞率下的大小為3 3的空洞卷積核,可以看出,隨著空洞率的增加,空洞卷積捕獲的感受野也會隨之增加,但卷積核的權(quán)重參數(shù)保持不變,計算復(fù)雜度不會增加。對于空洞卷積,不同的空洞率所捕獲的感受野也會不同?斩绰蔬^小,感受野隨之減小,提取到的局部信息較多,全局信息較少,不利于對全局分割的整體把控;空洞率過大,感受野隨之增大,提取到的全局信息較多,局部信息較少,不利于改善邊緣細(xì)節(jié)信息。因此選用合適空洞率的空洞卷積在圖像語義分割領(lǐng)域至關(guān)重要。(2)池化層卷積層是由一系列的卷積運算所組成的網(wǎng)絡(luò)層。池化操作同樣通過滑動窗口的方式提取特征,這一點與卷積的運算方式相同。但與卷積不同的是池化過程中沒有可以學(xué)習(xí)的參數(shù),它通過池化函數(shù)(pooling function)來使池化窗某一個位置的特征代替所有位置的統(tǒng)計特征作為輸出。常用在語義分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三種激活函數(shù)示意圖
本文編號:3000675
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割圖示
在其他條件相同的情況下,單個傳統(tǒng)卷積的感受野是 3,單個空洞卷積的感受野是 5。圖2.3 不同空洞率的空洞卷積圖 2.3 是不同空洞率下的大小為3 3的空洞卷積核,可以看出,隨著空洞率的增加,空洞卷積捕獲的感受野也會隨之增加,但卷積核的權(quán)重參數(shù)保持不變,計算復(fù)雜度不會增加。對于空洞卷積,不同的空洞率所捕獲的感受野也會不同?斩绰蔬^小,感受野隨之減小,提取到的局部信息較多,全局信息較少,不利于對全局分割的整體把控;空洞率過大,感受野隨之增大,提取到的全局信息較多,局部信息較少,不利于改善邊緣細(xì)節(jié)信息。因此選用合適空洞率的空洞卷積在圖像語義分割領(lǐng)域至關(guān)重要。(2)池化層卷積層是由一系列的卷積運算所組成的網(wǎng)絡(luò)層。池化操作同樣通過滑動窗口的方式提取特征,這一點與卷積的運算方式相同。但與卷積不同的是池化過程中沒有可以學(xué)習(xí)的參數(shù),它通過池化函數(shù)(pooling function)來使池化窗某一個位置的特征代替所有位置的統(tǒng)計特征作為輸出。常用在語義分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三種激活函數(shù)示意圖
本文編號:3000675
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3000675.html
最近更新
教材專著