基于深層網(wǎng)絡(luò)的城市街道場(chǎng)景的語(yǔ)義分割的方法研究
發(fā)布時(shí)間:2021-01-26 06:57
隨著人工智能技術(shù)的高速發(fā)展,“感知城市”這一詞匯漸漸被人們關(guān)注并熟知。圖像語(yǔ)義分割技術(shù)是實(shí)現(xiàn)“感知城市”的一種效率高、成本低的手段,在許多領(lǐng)域得到廣泛應(yīng)用。比如,通過對(duì)飛機(jī)的航拍圖像進(jìn)行語(yǔ)義分割以輔助飛行員確定安全著陸點(diǎn);對(duì)行車記錄儀傳輸圖像進(jìn)行語(yǔ)義分割以幫助駕駛員規(guī)劃安全可靠的行車路線。近年來,基于深層卷積神經(jīng)網(wǎng)絡(luò)的方法在語(yǔ)義分割問題上取得了一系列的突破。但實(shí)際中,訓(xùn)練所得的分割模型往往參數(shù)量過于龐大,可移植性差,不利于實(shí)際工程應(yīng)用;同時(shí)由于城市街道場(chǎng)景圖像復(fù)雜導(dǎo)致網(wǎng)絡(luò)整體的分割結(jié)果不夠理想。本文針對(duì)上述問題,深入研究了城市街道場(chǎng)景下的圖像語(yǔ)義分割方法,主要工作如下:從模型輕量化的角度出發(fā),提出一種針對(duì)復(fù)雜場(chǎng)景下的輕量多通道特征融合的語(yǔ)義分割模型。首先,本文在Deeplab V2的基礎(chǔ)上進(jìn)行了改進(jìn),將Deeplab V2網(wǎng)絡(luò)與多通道特征融合結(jié)構(gòu)RefineNet結(jié)合,有效改善了模型的分割細(xì)節(jié)。然后,在此基礎(chǔ)上提出輕量化改進(jìn),將深度可分離卷積引入空洞空間金字塔池化模型(ASPP)與RefineNet并提出輕量化結(jié)構(gòu)Light-ASPP與Light-RefineNet(V1、V2),有效...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)義分割圖示
在其他條件相同的情況下,單個(gè)傳統(tǒng)卷積的感受野是 3,單個(gè)空洞卷積的感受野是 5。圖2.3 不同空洞率的空洞卷積圖 2.3 是不同空洞率下的大小為3 3的空洞卷積核,可以看出,隨著空洞率的增加,空洞卷積捕獲的感受野也會(huì)隨之增加,但卷積核的權(quán)重參數(shù)保持不變,計(jì)算復(fù)雜度不會(huì)增加。對(duì)于空洞卷積,不同的空洞率所捕獲的感受野也會(huì)不同?斩绰蔬^小,感受野隨之減小,提取到的局部信息較多,全局信息較少,不利于對(duì)全局分割的整體把控;空洞率過大,感受野隨之增大,提取到的全局信息較多,局部信息較少,不利于改善邊緣細(xì)節(jié)信息。因此選用合適空洞率的空洞卷積在圖像語(yǔ)義分割領(lǐng)域至關(guān)重要。(2)池化層卷積層是由一系列的卷積運(yùn)算所組成的網(wǎng)絡(luò)層。池化操作同樣通過滑動(dòng)窗口的方式提取特征,這一點(diǎn)與卷積的運(yùn)算方式相同。但與卷積不同的是池化過程中沒有可以學(xué)習(xí)的參數(shù),它通過池化函數(shù)(pooling function)來使池化窗某一個(gè)位置的特征代替所有位置的統(tǒng)計(jì)特征作為輸出。常用在語(yǔ)義分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三種激活函數(shù)示意圖
本文編號(hào):3000675
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
語(yǔ)義分割圖示
在其他條件相同的情況下,單個(gè)傳統(tǒng)卷積的感受野是 3,單個(gè)空洞卷積的感受野是 5。圖2.3 不同空洞率的空洞卷積圖 2.3 是不同空洞率下的大小為3 3的空洞卷積核,可以看出,隨著空洞率的增加,空洞卷積捕獲的感受野也會(huì)隨之增加,但卷積核的權(quán)重參數(shù)保持不變,計(jì)算復(fù)雜度不會(huì)增加。對(duì)于空洞卷積,不同的空洞率所捕獲的感受野也會(huì)不同?斩绰蔬^小,感受野隨之減小,提取到的局部信息較多,全局信息較少,不利于對(duì)全局分割的整體把控;空洞率過大,感受野隨之增大,提取到的全局信息較多,局部信息較少,不利于改善邊緣細(xì)節(jié)信息。因此選用合適空洞率的空洞卷積在圖像語(yǔ)義分割領(lǐng)域至關(guān)重要。(2)池化層卷積層是由一系列的卷積運(yùn)算所組成的網(wǎng)絡(luò)層。池化操作同樣通過滑動(dòng)窗口的方式提取特征,這一點(diǎn)與卷積的運(yùn)算方式相同。但與卷積不同的是池化過程中沒有可以學(xué)習(xí)的參數(shù),它通過池化函數(shù)(pooling function)來使池化窗某一個(gè)位置的特征代替所有位置的統(tǒng)計(jì)特征作為輸出。常用在語(yǔ)義分割的池化方式有最大池化(maxpooling)和全局平均池化(global average pooling
三種激活函數(shù)示意圖
本文編號(hào):3000675
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3000675.html
最近更新
教材專著