面向圖像語義分割的新型卷積神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究
發(fā)布時間:2017-12-08 00:02
本文關(guān)鍵詞:面向圖像語義分割的新型卷積神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究
更多相關(guān)文章: 卷積神經(jīng)網(wǎng)絡(luò) 反卷積 池化 升頻 二值化
【摘要】:在過去的若干年中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在圖像分類和對象檢測領(lǐng)域表現(xiàn)出眾,并且具備良好的應(yīng)用價值,尤其在計算機視覺方面的應(yīng)用已經(jīng)取得了一系列顯著的成果。從生物識別系統(tǒng)到實時應(yīng)用程序,都受到深度神經(jīng)網(wǎng)絡(luò)(DNN)的深刻影響。而卷積神經(jīng)網(wǎng)絡(luò)作為使分類和學(xué)習(xí)更容易和更可行的關(guān)鍵技術(shù)工具之一,極大地提升了對象識別應(yīng)用程序中的識別率。在GPU技術(shù)的支持下,CNN被證明非常適用于基于視覺的應(yīng)用程序。然而CNN需要消耗大量內(nèi)存和計算資源,在傳統(tǒng)CPU上運行極慢,不適合進行訓(xùn)練。因此,想要在存儲和計算能力有限的實時系統(tǒng)上實現(xiàn)非常高效的CNN幾乎不可能。在這種情況下,需要一些改進的CNN解決方案,以提供更簡單的結(jié)構(gòu),更好的性能和更高的準(zhǔn)確性。本論文圍繞兩個核心課題展開研究:提出一種具有高精度的新型CNN架構(gòu);降低傳統(tǒng)CNN架構(gòu)的計算資源消耗。本文的研究內(nèi)容和貢獻如下:1)針對當(dāng)前視覺應(yīng)用對架構(gòu)擴展性的需求,提出了一種面向?qū)崟r系統(tǒng)的可擴展神經(jīng)網(wǎng)絡(luò)架構(gòu),該架構(gòu)使用卷積神經(jīng)網(wǎng)絡(luò)來設(shè)計資源節(jié)約型視覺應(yīng)用系統(tǒng),并介紹了該架構(gòu)的理論和設(shè)計方法。2)針對輔助駕駛系統(tǒng)中道路場景理解缺少足夠帶標(biāo)注訓(xùn)練數(shù)據(jù)的問題,提出了解耦卷積神經(jīng)網(wǎng)絡(luò)DCNN(Decoupled CNN),從而能夠用較少的或半標(biāo)注的數(shù)據(jù)來訓(xùn)練CNN。DCNN使用了不均勻標(biāo)注的方式,包含少量帶標(biāo)注數(shù)據(jù)以及大量弱標(biāo)注數(shù)據(jù)。3)針對語義像素分割應(yīng)用中CNN模型過于復(fù)雜的問題,提出了一種簡化的全卷積神經(jīng)網(wǎng)絡(luò)模型。該模型與傳統(tǒng)CNN流水線的不同之處在于,只使用了卷積層,而沒有池化層4)針對CNN在實時語義分割應(yīng)用中過分參數(shù)化及網(wǎng)絡(luò)模型冗余問題,提出了一種用于像素級分割的資源節(jié)約型語義分割模型。該模型是一種編碼器-解碼器結(jié)構(gòu),編碼器建立在VGG-16網(wǎng)絡(luò)基礎(chǔ)上,而解碼器則來自于SegNet。該模型能夠預(yù)測給定輸入圖像的像素級分類標(biāo)簽。該模型旨在用于道路場景理解,適用于基于視頻流的輔助駕駛系統(tǒng)。5)針對CNN計算復(fù)雜性較高導(dǎo)致難以在便攜式設(shè)備和實時系統(tǒng)上使用的問題,提出了一種壓縮CNN以降低存儲和處理需求的解決方案。論文中介紹了各種網(wǎng)絡(luò)架構(gòu)的實驗。所提出的編碼器-解碼器架構(gòu)旨在減少可訓(xùn)練參數(shù)的數(shù)量。通過嘗試不同的層和網(wǎng)絡(luò)組件,利用減少的網(wǎng)絡(luò)結(jié)構(gòu)來分析最佳性能。關(guān)鍵思想是減少整體網(wǎng)絡(luò)存儲和計算需求。另一方面,二值化分割網(wǎng)絡(luò)可以大大減少處理和存儲要求,通過排除CNN訓(xùn)練中的關(guān)鍵乘法運算,并用更多的計算友好運算(加法,減法)代替,這種二值化過程將大大改進模型的性能。文中所提出的網(wǎng)絡(luò)模型在CamVid和Pascle-Vocl2數(shù)據(jù)集進行實驗。所提出的網(wǎng)絡(luò)模型也可從 www.github.com/robail/獲取。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:TP391.41;TP183
,
本文編號:1264267
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1264267.html
最近更新
教材專著