基于深度特征學(xué)習(xí)的人像精細(xì)分割研究
發(fā)布時間:2022-01-20 16:21
人像語義精細(xì)分割作為計算機(jī)視覺與模式識別領(lǐng)域中非常重要的一個研究方向,廣泛應(yīng)用于無人駕駛、醫(yī)學(xué)圖像等領(lǐng)域,傳統(tǒng)的人像分割方法基于人工特征設(shè)計,提取方法單一,特征的魯棒性不強(qiáng),并且傳統(tǒng)的特征方式提取速度慢。深度學(xué)習(xí)可以對特征自動表征和學(xué)習(xí),并且深度學(xué)習(xí)在并行計算平臺的支撐之下,分割識別速度快。本文針對人像分割領(lǐng)域存在的邊界模糊問題,設(shè)計了兩種基于深度學(xué)習(xí)的人像精細(xì)分割方法,實現(xiàn)了對人像自然數(shù)據(jù)集的高效分割。本文的主要研究內(nèi)容及成果如下。針對深度學(xué)習(xí)卷積特征感受野單一問題,和人像分割的多尺度問題,設(shè)計了一種基于深度特征集成融合的人像精細(xì)分割方法,該方法提出了將多尺度特征進(jìn)行集成學(xué)習(xí)的融合方式。首先通過深度學(xué)習(xí)的遷移學(xué)習(xí)方法,采用基于cityscapes數(shù)據(jù)集訓(xùn)練的PspNet語義分割模型進(jìn)行權(quán)重初始化,對后面的特征進(jìn)行特征集成融合,增強(qiáng)了模型特征的魯棒性,并且整個模型是端到端學(xué)習(xí)和優(yōu)化的。將所設(shè)計的集成特征融合模型與現(xiàn)有的深度檢測算法進(jìn)行對比,從實驗結(jié)果可以看出本方法相比其它方法精度更加高。在特征集成融合模型的基礎(chǔ)上,針對自然圖像分割邊界模糊問題,設(shè)計了一種深度特征增強(qiáng)機(jī)制的人像精細(xì)分割方...
【文章來源】:大連交通大學(xué)遼寧省
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1深度卷積神經(jīng)網(wǎng)絡(luò)分類示意圖??Fig.?2.1?Classification?of?Deep?Convolution?Neural?Network?Manner??
????第二章基于深度學(xué)習(xí)的人像語義分割???得到更加稀疏的特征;最大池化還有額外的功能,即得到的特征具有平移不變性,即對??于圖像分類任務(wù)來說,一張圖片分類的結(jié)果為貓,但是對于神經(jīng)網(wǎng)絡(luò)模型來說,貓在圖??像中的位置不是很重要,不管貓的關(guān)鍵點特征平移到了什么位置。最大池化示意圖如下??圖2.2所示,池化核大小為2*2,步長為2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步長:2x2??12?3?4??y?,??圖2.2最大池化示意圖??Fig.?2.2?Maximum?pooling?indication??除了卷積核池化,激活函數(shù)的功能主要是將特征進(jìn)行非線性映射,現(xiàn)有的激活函數(shù)??主要為Sigmod、Tanh、Hadlim、ReLU等。Sigmod函數(shù)和Tanh導(dǎo)數(shù)比較小,都會導(dǎo)致??模型在訓(xùn)練過程中導(dǎo)致的梯度彌散問題,即梯度消失問題,ReLU在輸入為正數(shù)的時候,??激活輸出同輸入為線性關(guān)系,而在輸入為負(fù)數(shù)的時候,激活輸出為0,如下圖2.3所示,??ReLU函數(shù)的提出緩解了梯度消失問題,缺點在于祌經(jīng)元死掉問題。PReLU激活函數(shù)在??輸入為負(fù)數(shù)的時候,在負(fù)數(shù)區(qū)域內(nèi)提供一個線性運(yùn)算,防止神經(jīng)元的壞死情況。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??圖2.3ReliT激活函數(shù)示意圖??Fig.?2.3?Relu?activation?function??9??
????第二章基于深度學(xué)習(xí)的人像語義分割???得到更加稀疏的特征;最大池化還有額外的功能,即得到的特征具有平移不變性,即對??于圖像分類任務(wù)來說,一張圖片分類的結(jié)果為貓,但是對于神經(jīng)網(wǎng)絡(luò)模型來說,貓在圖??像中的位置不是很重要,不管貓的關(guān)鍵點特征平移到了什么位置。最大池化示意圖如下??圖2.2所示,池化核大小為2*2,步長為2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步長:2x2??12?3?4??y?,??圖2.2最大池化示意圖??Fig.?2.2?Maximum?pooling?indication??除了卷積核池化,激活函數(shù)的功能主要是將特征進(jìn)行非線性映射,現(xiàn)有的激活函數(shù)??主要為Sigmod、Tanh、Hadlim、ReLU等。Sigmod函數(shù)和Tanh導(dǎo)數(shù)比較小,都會導(dǎo)致??模型在訓(xùn)練過程中導(dǎo)致的梯度彌散問題,即梯度消失問題,ReLU在輸入為正數(shù)的時候,??激活輸出同輸入為線性關(guān)系,而在輸入為負(fù)數(shù)的時候,激活輸出為0,如下圖2.3所示,??ReLU函數(shù)的提出緩解了梯度消失問題,缺點在于祌經(jīng)元死掉問題。PReLU激活函數(shù)在??輸入為負(fù)數(shù)的時候,在負(fù)數(shù)區(qū)域內(nèi)提供一個線性運(yùn)算,防止神經(jīng)元的壞死情況。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??圖2.3ReliT激活函數(shù)示意圖??Fig.?2.3?Relu?activation?function??9??
【參考文獻(xiàn)】:
期刊論文
[1]基于語義分割-對抗的圖像語義分割模型[J]. 王鑫,于重重,馬先欽,陳秀新. 計算機(jī)仿真. 2019(02)
[2]類別非均衡遙感圖像語義分割的全卷積網(wǎng)絡(luò)方法[J]. 吳止鍰,高永明,李磊,薛俊詩. 光學(xué)學(xué)報. 2019(04)
[3]深度殘差網(wǎng)絡(luò)的多光譜遙感圖像顯著目標(biāo)檢測[J]. 戴玉超,張靜,Fatih PORIKLI,何明一. 測繪學(xué)報. 2018(06)
[4]結(jié)合深度學(xué)習(xí)與條件隨機(jī)場的遙感圖像分類[J]. 夏夢,曹國,汪光亞,尚巖峰. 中國圖象圖形學(xué)報. 2017(09)
[5]一種多尺度CNN的圖像語義分割算法[J]. 劉丹,劉學(xué)軍,王美珍. 遙感信息. 2017(01)
[6]基于內(nèi)容的圖像分割方法綜述[J]. 姜楓,顧慶,郝慧珍,李娜,郭延文,陳道蓄. 軟件學(xué)報. 2017(01)
[7]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[8]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割[D]. 陳鴻翔.浙江大學(xué) 2016
本文編號:3599145
【文章來源】:大連交通大學(xué)遼寧省
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1深度卷積神經(jīng)網(wǎng)絡(luò)分類示意圖??Fig.?2.1?Classification?of?Deep?Convolution?Neural?Network?Manner??
????第二章基于深度學(xué)習(xí)的人像語義分割???得到更加稀疏的特征;最大池化還有額外的功能,即得到的特征具有平移不變性,即對??于圖像分類任務(wù)來說,一張圖片分類的結(jié)果為貓,但是對于神經(jīng)網(wǎng)絡(luò)模型來說,貓在圖??像中的位置不是很重要,不管貓的關(guān)鍵點特征平移到了什么位置。最大池化示意圖如下??圖2.2所示,池化核大小為2*2,步長為2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步長:2x2??12?3?4??y?,??圖2.2最大池化示意圖??Fig.?2.2?Maximum?pooling?indication??除了卷積核池化,激活函數(shù)的功能主要是將特征進(jìn)行非線性映射,現(xiàn)有的激活函數(shù)??主要為Sigmod、Tanh、Hadlim、ReLU等。Sigmod函數(shù)和Tanh導(dǎo)數(shù)比較小,都會導(dǎo)致??模型在訓(xùn)練過程中導(dǎo)致的梯度彌散問題,即梯度消失問題,ReLU在輸入為正數(shù)的時候,??激活輸出同輸入為線性關(guān)系,而在輸入為負(fù)數(shù)的時候,激活輸出為0,如下圖2.3所示,??ReLU函數(shù)的提出緩解了梯度消失問題,缺點在于祌經(jīng)元死掉問題。PReLU激活函數(shù)在??輸入為負(fù)數(shù)的時候,在負(fù)數(shù)區(qū)域內(nèi)提供一個線性運(yùn)算,防止神經(jīng)元的壞死情況。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??圖2.3ReliT激活函數(shù)示意圖??Fig.?2.3?Relu?activation?function??9??
????第二章基于深度學(xué)習(xí)的人像語義分割???得到更加稀疏的特征;最大池化還有額外的功能,即得到的特征具有平移不變性,即對??于圖像分類任務(wù)來說,一張圖片分類的結(jié)果為貓,但是對于神經(jīng)網(wǎng)絡(luò)模型來說,貓在圖??像中的位置不是很重要,不管貓的關(guān)鍵點特征平移到了什么位置。最大池化示意圖如下??圖2.2所示,池化核大小為2*2,步長為2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步長:2x2??12?3?4??y?,??圖2.2最大池化示意圖??Fig.?2.2?Maximum?pooling?indication??除了卷積核池化,激活函數(shù)的功能主要是將特征進(jìn)行非線性映射,現(xiàn)有的激活函數(shù)??主要為Sigmod、Tanh、Hadlim、ReLU等。Sigmod函數(shù)和Tanh導(dǎo)數(shù)比較小,都會導(dǎo)致??模型在訓(xùn)練過程中導(dǎo)致的梯度彌散問題,即梯度消失問題,ReLU在輸入為正數(shù)的時候,??激活輸出同輸入為線性關(guān)系,而在輸入為負(fù)數(shù)的時候,激活輸出為0,如下圖2.3所示,??ReLU函數(shù)的提出緩解了梯度消失問題,缺點在于祌經(jīng)元死掉問題。PReLU激活函數(shù)在??輸入為負(fù)數(shù)的時候,在負(fù)數(shù)區(qū)域內(nèi)提供一個線性運(yùn)算,防止神經(jīng)元的壞死情況。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??圖2.3ReliT激活函數(shù)示意圖??Fig.?2.3?Relu?activation?function??9??
【參考文獻(xiàn)】:
期刊論文
[1]基于語義分割-對抗的圖像語義分割模型[J]. 王鑫,于重重,馬先欽,陳秀新. 計算機(jī)仿真. 2019(02)
[2]類別非均衡遙感圖像語義分割的全卷積網(wǎng)絡(luò)方法[J]. 吳止鍰,高永明,李磊,薛俊詩. 光學(xué)學(xué)報. 2019(04)
[3]深度殘差網(wǎng)絡(luò)的多光譜遙感圖像顯著目標(biāo)檢測[J]. 戴玉超,張靜,Fatih PORIKLI,何明一. 測繪學(xué)報. 2018(06)
[4]結(jié)合深度學(xué)習(xí)與條件隨機(jī)場的遙感圖像分類[J]. 夏夢,曹國,汪光亞,尚巖峰. 中國圖象圖形學(xué)報. 2017(09)
[5]一種多尺度CNN的圖像語義分割算法[J]. 劉丹,劉學(xué)軍,王美珍. 遙感信息. 2017(01)
[6]基于內(nèi)容的圖像分割方法綜述[J]. 姜楓,顧慶,郝慧珍,李娜,郭延文,陳道蓄. 軟件學(xué)報. 2017(01)
[7]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動化學(xué)報. 2016(09)
[8]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像語義分割[D]. 陳鴻翔.浙江大學(xué) 2016
本文編號:3599145
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3599145.html
最近更新
教材專著