基于卷積神經(jīng)網(wǎng)絡(luò)的道路場景分割方法研究
發(fā)布時間:2020-12-21 12:26
圖像語義分割是計算機視覺中的一個重要研究課題,是場景理解的關(guān)鍵技術(shù)之一,它在自動駕駛、醫(yī)療圖像分割、可穿戴式設(shè)備等諸多領(lǐng)域有著廣泛的應(yīng)用。傳統(tǒng)的分割方法受限于對圖像特征的提取能力,無法滿足復(fù)雜場景中語義分割任務(wù)的精度要求。隨著深度學(xué)習(xí)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)開始應(yīng)用到計算機視覺的諸多領(lǐng)域。而全卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn)則使深度學(xué)習(xí)中對目標(biāo)的分類細化到像素級別,極大地提升了語義分割任務(wù)的精度和速度。圖像語義分割應(yīng)用于道路場景主要可分為兩種:對圖像中不同物體的分割以及更精細地對同一類物體的不同目標(biāo)實現(xiàn)實例分割。本文中所研究的道路場景分割問題是實現(xiàn)對道路場景不同類別物體的多重分割,具體可分為道路、人行道、樹木、建筑、行人、汽車等19類。要求在不降低檢測精準(zhǔn)度的同時,盡量加快網(wǎng)絡(luò)的檢測速度。針對以上問題,本文通過對各種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和語義分割模型展開深入研究,提出了兩種基于編碼器-解碼器結(jié)構(gòu)的語義分割模型。這兩種網(wǎng)絡(luò)結(jié)構(gòu)是對經(jīng)典語義分割網(wǎng)絡(luò)UNet的改進,具體工作和貢獻如下:1、使用線性插值對圖像特征矩陣上采樣以降低訓(xùn)練難度,并通過引入1x1卷積結(jié)構(gòu)平衡跳躍連接中低層特征和上采樣結(jié)果的權(quán)重;2、通過引入深度...
【文章來源】:中國地質(zhì)大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割示例圖
第2章 語義分割相關(guān)內(nèi)容研究網(wǎng)絡(luò)是受生物的神經(jīng)系統(tǒng)啟發(fā),模仿生物神經(jīng)網(wǎng)絡(luò)的經(jīng)元,神經(jīng)元相互連接構(gòu)建的網(wǎng)狀模型。原始數(shù)據(jù)經(jīng)最終會轉(zhuǎn)化成人可以理解的有意義的信息。初期的神層與層之間的相互連接,如圖 2-1 中,后一層神經(jīng)元神經(jīng)元相連。假設(shè)某一層神經(jīng)網(wǎng)絡(luò)具有 m 個神經(jīng)元作為輸入,前后層兩個神經(jīng)元間信息傳遞的公式為 要m×n個權(quán)值w,網(wǎng)絡(luò)需要調(diào)整的參數(shù)數(shù)量將遠遠大計算量過大,難以訓(xùn)練。
之間距離的增加而減小,像素之間的距離越遠,則相關(guān)性越弱。因此先通過連接獲取圖像的局部特征,在高層連接這些局部特征得到圖像的全局信息是的;權(quán)值共享是指對圖像不同位置進行局部連接時,使用相同權(quán)值的卷積值共享是基于這樣的考慮:圖像特征與其所在圖像中的位置是無關(guān)的,因此使用相同的卷積核對全圖進行掃描以獲取相同的特征。如圖 2-2所示,對于512×3 尺寸的圖像,采用全連接操作輸出每一個像素點的值需要 512×512權(quán)值 w,每一層輸出矩陣則需要 512×512×512×512×3 個權(quán)值 w,這已經(jīng)超出了圖像原本的大小,使得網(wǎng)絡(luò)變得難以計算;如果采用 3×3×3 的卷積提取該特征圖,并采用權(quán)值共享策略,需要訓(xùn)練的參數(shù)則下降到了 27.可以積操作相比于全連接操作極大減少了網(wǎng)絡(luò)訓(xùn)練時所需調(diào)整參數(shù)的數(shù)量,同時低了網(wǎng)絡(luò)過擬合的概率,使網(wǎng)絡(luò)的訓(xùn)練變得更為簡單可行。
【參考文獻】:
期刊論文
[1]改進的自適應(yīng)Canny邊緣檢測算法[J]. 段鎖林,殷聰聰,李大偉. 計算機工程與設(shè)計. 2018(06)
[2]基于分裂合并的多模型擬合方法在點云分割中的應(yīng)用[J]. 張良培,張云,陳震中,肖佩珮,羅斌. 測繪學(xué)報. 2018(06)
[3]Nesterov加速梯度無人機姿態(tài)融合算法[J]. 李瑞涵,王耀南,譚建豪. 機器人. 2018(06)
[4]基于最大類間方差法和數(shù)學(xué)形態(tài)學(xué)的遙感圖像潮溝提取方法[J]. 朱言江,韓震,和思海,胡旭冉,陳佩達. 上海海洋大學(xué)學(xué)報. 2017(01)
[5]改進的Roberts圖像邊緣檢測算法[J]. 王方超,張旻,宮麗美. 探測與控制學(xué)報. 2016(02)
[6]基于Laplace算子和灰色理論的熱紅外影像邊緣檢測[J]. 夏清,陳亞凱,張振鑫,杜翔宇,王海娟,許立江. 紅外技術(shù). 2014(05)
本文編號:2929824
【文章來源】:中國地質(zhì)大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
語義分割示例圖
第2章 語義分割相關(guān)內(nèi)容研究網(wǎng)絡(luò)是受生物的神經(jīng)系統(tǒng)啟發(fā),模仿生物神經(jīng)網(wǎng)絡(luò)的經(jīng)元,神經(jīng)元相互連接構(gòu)建的網(wǎng)狀模型。原始數(shù)據(jù)經(jīng)最終會轉(zhuǎn)化成人可以理解的有意義的信息。初期的神層與層之間的相互連接,如圖 2-1 中,后一層神經(jīng)元神經(jīng)元相連。假設(shè)某一層神經(jīng)網(wǎng)絡(luò)具有 m 個神經(jīng)元作為輸入,前后層兩個神經(jīng)元間信息傳遞的公式為 要m×n個權(quán)值w,網(wǎng)絡(luò)需要調(diào)整的參數(shù)數(shù)量將遠遠大計算量過大,難以訓(xùn)練。
之間距離的增加而減小,像素之間的距離越遠,則相關(guān)性越弱。因此先通過連接獲取圖像的局部特征,在高層連接這些局部特征得到圖像的全局信息是的;權(quán)值共享是指對圖像不同位置進行局部連接時,使用相同權(quán)值的卷積值共享是基于這樣的考慮:圖像特征與其所在圖像中的位置是無關(guān)的,因此使用相同的卷積核對全圖進行掃描以獲取相同的特征。如圖 2-2所示,對于512×3 尺寸的圖像,采用全連接操作輸出每一個像素點的值需要 512×512權(quán)值 w,每一層輸出矩陣則需要 512×512×512×512×3 個權(quán)值 w,這已經(jīng)超出了圖像原本的大小,使得網(wǎng)絡(luò)變得難以計算;如果采用 3×3×3 的卷積提取該特征圖,并采用權(quán)值共享策略,需要訓(xùn)練的參數(shù)則下降到了 27.可以積操作相比于全連接操作極大減少了網(wǎng)絡(luò)訓(xùn)練時所需調(diào)整參數(shù)的數(shù)量,同時低了網(wǎng)絡(luò)過擬合的概率,使網(wǎng)絡(luò)的訓(xùn)練變得更為簡單可行。
【參考文獻】:
期刊論文
[1]改進的自適應(yīng)Canny邊緣檢測算法[J]. 段鎖林,殷聰聰,李大偉. 計算機工程與設(shè)計. 2018(06)
[2]基于分裂合并的多模型擬合方法在點云分割中的應(yīng)用[J]. 張良培,張云,陳震中,肖佩珮,羅斌. 測繪學(xué)報. 2018(06)
[3]Nesterov加速梯度無人機姿態(tài)融合算法[J]. 李瑞涵,王耀南,譚建豪. 機器人. 2018(06)
[4]基于最大類間方差法和數(shù)學(xué)形態(tài)學(xué)的遙感圖像潮溝提取方法[J]. 朱言江,韓震,和思海,胡旭冉,陳佩達. 上海海洋大學(xué)學(xué)報. 2017(01)
[5]改進的Roberts圖像邊緣檢測算法[J]. 王方超,張旻,宮麗美. 探測與控制學(xué)報. 2016(02)
[6]基于Laplace算子和灰色理論的熱紅外影像邊緣檢測[J]. 夏清,陳亞凱,張振鑫,杜翔宇,王海娟,許立江. 紅外技術(shù). 2014(05)
本文編號:2929824
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2929824.html
最近更新
教材專著