基于深度學(xué)習(xí)的弱監(jiān)督圖像分割方法研究
發(fā)布時(shí)間:2021-06-26 06:38
圖像分割技術(shù)作為其他圖像處理方法的基礎(chǔ),一直是計(jì)算視覺研究的熱點(diǎn)與難點(diǎn),其在場(chǎng)景解析、自動(dòng)駕駛等領(lǐng)域發(fā)揮著重要的作用。隨著人工智能的興起,基于深度學(xué)習(xí)的圖像分割方法與早期方法相比有了質(zhì)的飛越,F(xiàn)有基于深度卷積神經(jīng)網(wǎng)絡(luò)的全監(jiān)督圖像分割方法均需要大量的像素級(jí)標(biāo)注來提升分割準(zhǔn)確率。因此該類方法需要耗費(fèi)大量的時(shí)間和經(jīng)濟(jì)代價(jià)來獲取像素級(jí)標(biāo)注,從而制約分割性能的進(jìn)一步提升和模型的泛化能力。為解決這一問題,國(guó)內(nèi)外很多學(xué)者嘗試放寬標(biāo)注的精確度,提出基于圖像級(jí)標(biāo)注的弱監(jiān)督圖像分割方法。圖像級(jí)標(biāo)注只包含圖像的類別信息,對(duì)于目標(biāo)的位置、輪廓等信息無任何指導(dǎo)性。本文從該研究的重點(diǎn)和難點(diǎn)入手,針對(duì)1)如何利用圖像級(jí)標(biāo)注獲取目標(biāo)的位置信息;2)如何獲取目標(biāo)的輪廓/形狀先驗(yàn);3)如何利用圖像級(jí)標(biāo)注訓(xùn)練分割網(wǎng)絡(luò)等問題展開深入的研究,各部分研究?jī)?nèi)容及創(chuàng)新工作如下:針對(duì)傳統(tǒng)圖像分割方法只利用圖像底層特征,缺乏形狀先驗(yàn)造成分割結(jié)果不理想的問題,提出基于形狀先驗(yàn)的圖像前景目標(biāo)分割方法。該方法首先提出使用形狀的線性表示和FDCM(fast directional chamfer matching)形狀匹配算法生成更加準(zhǔn)確的且具...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:138 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
目標(biāo)輪廓及超像素
圖像語義分割是對(duì)圖像分割技術(shù)的一種提升。與傳統(tǒng)圖像分割相比,語義分割需要為圖像分割出的目標(biāo)或前景賦予預(yù)先定義的語義標(biāo)簽,從而實(shí)現(xiàn)圖像高層抽象語義信息表達(dá)的任務(wù)。隨著人工智能技術(shù)迅猛發(fā)展,深度卷積神經(jīng)網(wǎng)絡(luò)模型在圖像語義分割任務(wù)中也取得了較大的進(jìn)步。本節(jié)將詳細(xì)介紹深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀;然后介紹全監(jiān)督條件下基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割各方法的優(yōu)缺點(diǎn);最后給出弱監(jiān)督條件下的語義分割方法研究現(xiàn)狀。1.3.1 深度卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)是眾多深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的一種,受生物視覺的認(rèn)知機(jī)制啟發(fā)而生,在計(jì)算機(jī)視覺問題上表現(xiàn)出優(yōu)秀的性能。1989年,LeCun等人確定了卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并且應(yīng)用到手寫字符識(shí)別中。DCNN是包含卷積運(yùn)算的前饋神經(jīng)網(wǎng)絡(luò),通常由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成[68],而卷積層、池化層、全連接層被稱為隱含層。DCNN由輸入層輸入數(shù)據(jù),通過卷積層的共享權(quán)重進(jìn)行卷積特征提取,輸出給池化層并進(jìn)行池化運(yùn)算,逐步得到各層特征,最后經(jīng)由全連接層和輸出層做針對(duì)任務(wù)的特征映射,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1-4。卷積層(convolutional layer)為DCNN的核心,每個(gè)卷積層由若干個(gè)卷積核構(gòu)成,而卷積核的參數(shù)可以通過反向傳遞算法優(yōu)化得到。假設(shè)第l卷積層的特征輸入為xl-1,卷積核為kl,那么經(jīng)過卷積運(yùn)算輸出的第j個(gè)通道的特征為:
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的場(chǎng)景分割算法研究綜述[J]. 張蕊,李錦濤. 計(jì)算機(jī)研究與發(fā)展. 2020(04)
[2]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報(bào). 2019(02)
[3]基于局部-全局一致性學(xué)習(xí)的弱監(jiān)督人手分割[J]. 謝志堅(jiān),李寅霖,鄭碎武. 計(jì)算機(jī)應(yīng)用與軟件. 2019(01)
[4]醫(yī)學(xué)圖像分析深度學(xué)習(xí)方法研究與挑戰(zhàn)[J]. 田娟秀,劉國(guó)才,谷珊珊,鞠忠建,劉勁光,顧冬冬. 自動(dòng)化學(xué)報(bào). 2018(03)
[5]面向大規(guī)模圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化[J]. 白琮,黃玲,陳佳楠,潘翔,陳勝勇. 軟件學(xué)報(bào). 2018(04)
[6]深度學(xué)習(xí)認(rèn)知計(jì)算綜述[J]. 陳偉宏,安吉堯,李仁發(fā),李萬里. 自動(dòng)化學(xué)報(bào). 2017(11)
[7]深度學(xué)習(xí)在高光譜圖像分類領(lǐng)域的研究現(xiàn)狀與展望[J]. 張?zhí)栧?李映,姜曄楠. 自動(dòng)化學(xué)報(bào). 2018(06)
[8]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進(jìn)軍. 計(jì)算機(jī)學(xué)報(bào). 2019(03)
[9]面向知識(shí)自動(dòng)化的自動(dòng)問答研究進(jìn)展[J]. 曾帥,王帥,袁勇,倪曉春,歐陽永基. 自動(dòng)化學(xué)報(bào). 2017(09)
[10]深度學(xué)習(xí)在目標(biāo)視覺檢測(cè)中的應(yīng)用進(jìn)展與展望[J]. 張慧,王坤峰,王飛躍. 自動(dòng)化學(xué)報(bào). 2017(08)
本文編號(hào):3250832
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:138 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
目標(biāo)輪廓及超像素
圖像語義分割是對(duì)圖像分割技術(shù)的一種提升。與傳統(tǒng)圖像分割相比,語義分割需要為圖像分割出的目標(biāo)或前景賦予預(yù)先定義的語義標(biāo)簽,從而實(shí)現(xiàn)圖像高層抽象語義信息表達(dá)的任務(wù)。隨著人工智能技術(shù)迅猛發(fā)展,深度卷積神經(jīng)網(wǎng)絡(luò)模型在圖像語義分割任務(wù)中也取得了較大的進(jìn)步。本節(jié)將詳細(xì)介紹深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀;然后介紹全監(jiān)督條件下基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割各方法的優(yōu)缺點(diǎn);最后給出弱監(jiān)督條件下的語義分割方法研究現(xiàn)狀。1.3.1 深度卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)是眾多深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的一種,受生物視覺的認(rèn)知機(jī)制啟發(fā)而生,在計(jì)算機(jī)視覺問題上表現(xiàn)出優(yōu)秀的性能。1989年,LeCun等人確定了卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并且應(yīng)用到手寫字符識(shí)別中。DCNN是包含卷積運(yùn)算的前饋神經(jīng)網(wǎng)絡(luò),通常由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成[68],而卷積層、池化層、全連接層被稱為隱含層。DCNN由輸入層輸入數(shù)據(jù),通過卷積層的共享權(quán)重進(jìn)行卷積特征提取,輸出給池化層并進(jìn)行池化運(yùn)算,逐步得到各層特征,最后經(jīng)由全連接層和輸出層做針對(duì)任務(wù)的特征映射,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1-4。卷積層(convolutional layer)為DCNN的核心,每個(gè)卷積層由若干個(gè)卷積核構(gòu)成,而卷積核的參數(shù)可以通過反向傳遞算法優(yōu)化得到。假設(shè)第l卷積層的特征輸入為xl-1,卷積核為kl,那么經(jīng)過卷積運(yùn)算輸出的第j個(gè)通道的特征為:
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的場(chǎng)景分割算法研究綜述[J]. 張蕊,李錦濤. 計(jì)算機(jī)研究與發(fā)展. 2020(04)
[2]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報(bào). 2019(02)
[3]基于局部-全局一致性學(xué)習(xí)的弱監(jiān)督人手分割[J]. 謝志堅(jiān),李寅霖,鄭碎武. 計(jì)算機(jī)應(yīng)用與軟件. 2019(01)
[4]醫(yī)學(xué)圖像分析深度學(xué)習(xí)方法研究與挑戰(zhàn)[J]. 田娟秀,劉國(guó)才,谷珊珊,鞠忠建,劉勁光,顧冬冬. 自動(dòng)化學(xué)報(bào). 2018(03)
[5]面向大規(guī)模圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化[J]. 白琮,黃玲,陳佳楠,潘翔,陳勝勇. 軟件學(xué)報(bào). 2018(04)
[6]深度學(xué)習(xí)認(rèn)知計(jì)算綜述[J]. 陳偉宏,安吉堯,李仁發(fā),李萬里. 自動(dòng)化學(xué)報(bào). 2017(11)
[7]深度學(xué)習(xí)在高光譜圖像分類領(lǐng)域的研究現(xiàn)狀與展望[J]. 張?zhí)栧?李映,姜曄楠. 自動(dòng)化學(xué)報(bào). 2018(06)
[8]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進(jìn)軍. 計(jì)算機(jī)學(xué)報(bào). 2019(03)
[9]面向知識(shí)自動(dòng)化的自動(dòng)問答研究進(jìn)展[J]. 曾帥,王帥,袁勇,倪曉春,歐陽永基. 自動(dòng)化學(xué)報(bào). 2017(09)
[10]深度學(xué)習(xí)在目標(biāo)視覺檢測(cè)中的應(yīng)用進(jìn)展與展望[J]. 張慧,王坤峰,王飛躍. 自動(dòng)化學(xué)報(bào). 2017(08)
本文編號(hào):3250832
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3250832.html
最近更新
教材專著