天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向圖像語義分割的新型卷積神經(jīng)網(wǎng)絡及其應用研究

發(fā)布時間:2017-12-08 00:02

  本文關鍵詞:面向圖像語義分割的新型卷積神經(jīng)網(wǎng)絡及其應用研究


  更多相關文章: 卷積神經(jīng)網(wǎng)絡 反卷積 池化 升頻 二值化


【摘要】:在過去的若干年中,卷積神經(jīng)網(wǎng)絡(CNN)在圖像分類和對象檢測領域表現(xiàn)出眾,并且具備良好的應用價值,尤其在計算機視覺方面的應用已經(jīng)取得了一系列顯著的成果。從生物識別系統(tǒng)到實時應用程序,都受到深度神經(jīng)網(wǎng)絡(DNN)的深刻影響。而卷積神經(jīng)網(wǎng)絡作為使分類和學習更容易和更可行的關鍵技術(shù)工具之一,極大地提升了對象識別應用程序中的識別率。在GPU技術(shù)的支持下,CNN被證明非常適用于基于視覺的應用程序。然而CNN需要消耗大量內(nèi)存和計算資源,在傳統(tǒng)CPU上運行極慢,不適合進行訓練。因此,想要在存儲和計算能力有限的實時系統(tǒng)上實現(xiàn)非常高效的CNN幾乎不可能。在這種情況下,需要一些改進的CNN解決方案,以提供更簡單的結(jié)構(gòu),更好的性能和更高的準確性。本論文圍繞兩個核心課題展開研究:提出一種具有高精度的新型CNN架構(gòu);降低傳統(tǒng)CNN架構(gòu)的計算資源消耗。本文的研究內(nèi)容和貢獻如下:1)針對當前視覺應用對架構(gòu)擴展性的需求,提出了一種面向?qū)崟r系統(tǒng)的可擴展神經(jīng)網(wǎng)絡架構(gòu),該架構(gòu)使用卷積神經(jīng)網(wǎng)絡來設計資源節(jié)約型視覺應用系統(tǒng),并介紹了該架構(gòu)的理論和設計方法。2)針對輔助駕駛系統(tǒng)中道路場景理解缺少足夠帶標注訓練數(shù)據(jù)的問題,提出了解耦卷積神經(jīng)網(wǎng)絡DCNN(Decoupled CNN),從而能夠用較少的或半標注的數(shù)據(jù)來訓練CNN。DCNN使用了不均勻標注的方式,包含少量帶標注數(shù)據(jù)以及大量弱標注數(shù)據(jù)。3)針對語義像素分割應用中CNN模型過于復雜的問題,提出了一種簡化的全卷積神經(jīng)網(wǎng)絡模型。該模型與傳統(tǒng)CNN流水線的不同之處在于,只使用了卷積層,而沒有池化層4)針對CNN在實時語義分割應用中過分參數(shù)化及網(wǎng)絡模型冗余問題,提出了一種用于像素級分割的資源節(jié)約型語義分割模型。該模型是一種編碼器-解碼器結(jié)構(gòu),編碼器建立在VGG-16網(wǎng)絡基礎上,而解碼器則來自于SegNet。該模型能夠預測給定輸入圖像的像素級分類標簽。該模型旨在用于道路場景理解,適用于基于視頻流的輔助駕駛系統(tǒng)。5)針對CNN計算復雜性較高導致難以在便攜式設備和實時系統(tǒng)上使用的問題,提出了一種壓縮CNN以降低存儲和處理需求的解決方案。論文中介紹了各種網(wǎng)絡架構(gòu)的實驗。所提出的編碼器-解碼器架構(gòu)旨在減少可訓練參數(shù)的數(shù)量。通過嘗試不同的層和網(wǎng)絡組件,利用減少的網(wǎng)絡結(jié)構(gòu)來分析最佳性能。關鍵思想是減少整體網(wǎng)絡存儲和計算需求。另一方面,二值化分割網(wǎng)絡可以大大減少處理和存儲要求,通過排除CNN訓練中的關鍵乘法運算,并用更多的計算友好運算(加法,減法)代替,這種二值化過程將大大改進模型的性能。文中所提出的網(wǎng)絡模型在CamVid和Pascle-Vocl2數(shù)據(jù)集進行實驗。所提出的網(wǎng)絡模型也可從 www.github.com/robail/獲取。
【學位授予單位】:中國科學技術(shù)大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TP391.41;TP183
,

本文編號:1264267

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1264267.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f3969***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com