基于全卷積神經(jīng)網(wǎng)絡(luò)的全向場景分割研究與算法實(shí)現(xiàn)
發(fā)布時間:2017-12-11 13:38
本文關(guān)鍵詞:基于全卷積神經(jīng)網(wǎng)絡(luò)的全向場景分割研究與算法實(shí)現(xiàn)
更多相關(guān)文章: 深度學(xué)習(xí) 全景圖像 全卷積網(wǎng)絡(luò) 場景分割
【摘要】:隨著計算機(jī)性能的跨越式提高和大數(shù)據(jù)時代的來臨,深度學(xué)習(xí)受到了各界越來越廣泛的關(guān)注。它能夠?qū)⒌图壧卣鬟M(jìn)行組合,形成更為抽象的高級特征,對數(shù)據(jù)進(jìn)行更為本質(zhì)的刻畫,因此被廣泛應(yīng)用到了計算機(jī)視覺、文本翻譯、模式識別、搜索推薦等各個領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度神經(jīng)網(wǎng)絡(luò)的一種,它具有稀疏連接、參數(shù)共享的特點(diǎn),可以自動提取特征,主要應(yīng)用于二維圖像的識別,能夠?qū)崿F(xiàn)圖像級別的分類。而全卷積網(wǎng)絡(luò)(FCN)是CNN的發(fā)展和延伸,它除了具有卷積神經(jīng)網(wǎng)絡(luò)的一般特點(diǎn)外,還有全卷積化、上采樣、跳躍結(jié)構(gòu)等一系列特征。全卷積網(wǎng)絡(luò)能夠預(yù)測每個像素點(diǎn)的語義標(biāo)簽,可以實(shí)現(xiàn)像素級別的分類,從而對圖像進(jìn)行場景分割。論文探討了 CNN與FCN的網(wǎng)絡(luò)結(jié)構(gòu),工作原理以及各自特點(diǎn),比較了兩種網(wǎng)絡(luò)之間的區(qū)別。為了實(shí)現(xiàn)全向場景的分割,本文在原有的FCN圖像分割的基礎(chǔ)上引入了全景圖像,詳細(xì)分析了全景圖像的種類、特點(diǎn)、應(yīng)用場景以及對分割效果的影響,并論述了由普通圖像合成球面全景圖像的具體方法;為了進(jìn)一步地提高全向場景分割的效果,我們對基于FCN的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),最終將全景圖像與改進(jìn)網(wǎng)絡(luò)相結(jié)合,提高了網(wǎng)絡(luò)對邊緣和細(xì)節(jié)部分的處理能力,實(shí)現(xiàn)了更準(zhǔn)確的全向場景分割。本文的主要創(chuàng)新點(diǎn)在于:一是引入全景圖像,將同一場景的普通圖像合成為球面全景圖,作為神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。球面全景圖像具有更為廣闊的視野,能夠完全覆蓋周邊環(huán)境,在提供全向場景信息的同時,增強(qiáng)了圖像中物體的整體性,有助于網(wǎng)絡(luò)提取更具有代表性的特征。二是在FCN的基礎(chǔ)上對網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行改進(jìn),設(shè)計上下兩層網(wǎng)絡(luò),并行輸入RGB圖像和深度圖像。上層對RGB圖像進(jìn)行處理,獲得整體空間架構(gòu);下層將深度圖像作為約束,充分利用深度圖像簡潔,輪廓特征明顯的特點(diǎn),通過卷積網(wǎng)絡(luò)提取相對精細(xì)的外部幾何特征。將同一場景、不同類型、不同層次的特征圖相結(jié)合,提高圖像場景分割的精確度。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41;TP183
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王學(xué)軍;丁紅濤;陳賀新;;一種基于鏡頭聚類的視頻場景分割方法[J];中國圖象圖形學(xué)報;2007年12期
2 張浩峰;業(yè)巧林;趙春霞;楊靜宇;;一種非監(jiān)督道路場景分割方法[J];南京理工大學(xué)學(xué)報;2012年02期
3 曹建榮;;一種基于語義的視頻場景分割算法[J];中國圖象圖形學(xué)報;2006年11期
4 郭小川;劉明杰;王婧璐;董道國;萬乾榮;;基于頻繁鏡頭集合的視頻場景分割方法[J];計算機(jī)應(yīng)用與軟件;2011年06期
5 劉曉杰;晉卓;宋占偉;張e,
本文編號:1278680
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1278680.html
最近更新
教材專著