基于空間深度信息和級(jí)聯(lián)CRFs的語(yǔ)義分割方法研究
發(fā)布時(shí)間:2021-06-29 17:09
作為計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要研究課題,圖像語(yǔ)義分割的目標(biāo)是將語(yǔ)義標(biāo)簽分配給圖像中的每個(gè)像素,使彩色圖像轉(zhuǎn)化為語(yǔ)義標(biāo)注圖像。盡管深度學(xué)習(xí)方法的出現(xiàn)使得圖像語(yǔ)義分割得到了明顯改善,但仍存在一些問(wèn)題:在某些復(fù)雜場(chǎng)景中,由于拍攝角度不同和光照不均勻,圖像中包含許多不同目標(biāo)相互重疊、低層視覺(jué)特征不明顯等現(xiàn)象,因此常常出現(xiàn)一些因目標(biāo)外貌特征相似而產(chǎn)生的語(yǔ)義混淆問(wèn)題;除此之外,由于卷積神經(jīng)網(wǎng)絡(luò)中的下采樣操作丟棄了大量圖像信息,導(dǎo)致分割結(jié)果中物體間上下文關(guān)系模糊以及目標(biāo)物體邊界信息不清晰。因此,為了增強(qiáng)模型分辨外貌特征相似的物體的能力以及增強(qiáng)對(duì)物體邊界定位的能力,本文提出了兩種圖像語(yǔ)義分割方法:基于空間深度信息的語(yǔ)義分割方法和基于級(jí)聯(lián)CRFs的語(yǔ)義分割方法。兩種方法的具體介紹如下:(1)考慮到深度圖像的特性,本文提出了一種引入空間深度信息的語(yǔ)義分割方法,主要是向RGB支路疊加深度圖像,以加入額外的場(chǎng)景空間信息,從而緩解模型混淆相似目標(biāo)的問(wèn)題。考慮到編碼器-解碼器模型和空間金字塔結(jié)構(gòu)在語(yǔ)義分割中的優(yōu)勢(shì),首先建立一個(gè)基于空間金字塔池化的編碼器-解碼器語(yǔ)義分割模型:Basic Net,然后在該模型基礎(chǔ)上引入...
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SegNet模型示意圖
空間金字塔池化模型(ASPP),可以近似的認(rèn)為 ASPP 是 SPP 的帶孔卷積版本。由于引入了帶孔卷積,可以擴(kuò)大特征圖的感受野,進(jìn)一步提升語(yǔ)義分割的準(zhǔn)確率。圖2.7 空間金字塔池化結(jié)構(gòu)示意圖[38]在 SPP 模塊中,不同尺寸的池化操作將輸入特征圖劃分為多個(gè)子區(qū)域并生成對(duì)應(yīng)的池化特征,這些局部區(qū)域之間存在一定的聯(lián)系卻各有不同,在提取自身局部語(yǔ)義信息的同時(shí)又和其他區(qū)域間有語(yǔ)義信息聯(lián)系,增加了上下文聯(lián)系。不僅如此,空間金字塔池化模型中使用了平均池化操作,將一個(gè)區(qū)域內(nèi)的值進(jìn)行加權(quán)平均,這樣可以更好地反映當(dāng)前區(qū)域內(nèi)包含的特征信息。因此,在本文工作中將使用 SPP 結(jié)構(gòu)實(shí)現(xiàn)對(duì)輸入特征的多尺度學(xué)習(xí)。2.3 全連接條件隨機(jī)場(chǎng)CRF 是 Lafferty 等人[47]于 21 世紀(jì)初期提出的一種概率無(wú)向圖學(xué)習(xí)模型,通常表示為 G={V,E}
【參考文獻(xiàn)】:
期刊論文
[1]融合語(yǔ)義知識(shí)的深度表達(dá)學(xué)習(xí)及在視覺(jué)理解中的應(yīng)用[J]. 張瑞茂,彭杰鋒,吳恙,林倞. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]圖像分割綜述[J]. 趙春燕,閆長(zhǎng)青,時(shí)秀芳. 中國(guó)科技信息. 2009(01)
[4]圖像分割的常用方法及其應(yīng)用[J]. 石榮剛,李志遠(yuǎn),江濤. 現(xiàn)代電子技術(shù). 2007(12)
本文編號(hào):3256819
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:80 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SegNet模型示意圖
空間金字塔池化模型(ASPP),可以近似的認(rèn)為 ASPP 是 SPP 的帶孔卷積版本。由于引入了帶孔卷積,可以擴(kuò)大特征圖的感受野,進(jìn)一步提升語(yǔ)義分割的準(zhǔn)確率。圖2.7 空間金字塔池化結(jié)構(gòu)示意圖[38]在 SPP 模塊中,不同尺寸的池化操作將輸入特征圖劃分為多個(gè)子區(qū)域并生成對(duì)應(yīng)的池化特征,這些局部區(qū)域之間存在一定的聯(lián)系卻各有不同,在提取自身局部語(yǔ)義信息的同時(shí)又和其他區(qū)域間有語(yǔ)義信息聯(lián)系,增加了上下文聯(lián)系。不僅如此,空間金字塔池化模型中使用了平均池化操作,將一個(gè)區(qū)域內(nèi)的值進(jìn)行加權(quán)平均,這樣可以更好地反映當(dāng)前區(qū)域內(nèi)包含的特征信息。因此,在本文工作中將使用 SPP 結(jié)構(gòu)實(shí)現(xiàn)對(duì)輸入特征的多尺度學(xué)習(xí)。2.3 全連接條件隨機(jī)場(chǎng)CRF 是 Lafferty 等人[47]于 21 世紀(jì)初期提出的一種概率無(wú)向圖學(xué)習(xí)模型,通常表示為 G={V,E}
【參考文獻(xiàn)】:
期刊論文
[1]融合語(yǔ)義知識(shí)的深度表達(dá)學(xué)習(xí)及在視覺(jué)理解中的應(yīng)用[J]. 張瑞茂,彭杰鋒,吳恙,林倞. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]圖像分割綜述[J]. 趙春燕,閆長(zhǎng)青,時(shí)秀芳. 中國(guó)科技信息. 2009(01)
[4]圖像分割的常用方法及其應(yīng)用[J]. 石榮剛,李志遠(yuǎn),江濤. 現(xiàn)代電子技術(shù). 2007(12)
本文編號(hào):3256819
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3256819.html
最近更新
教材專(zhuān)著