室內(nèi)動(dòng)態(tài)場景視覺SLAM系統(tǒng)中的弱監(jiān)督語義分割方法研究
發(fā)布時(shí)間:2021-12-10 14:00
視覺SLAM(Visual Simultaneous Localization and Mapping,VSLAM)是移動(dòng)機(jī)器人領(lǐng)域的重要技術(shù),使得移動(dòng)機(jī)器人更具智能化。目前的視覺SLAM算法大多是基于靜態(tài)環(huán)境實(shí)現(xiàn)的,如果場景中出現(xiàn)了動(dòng)態(tài)物體,則會(huì)導(dǎo)致視覺SLAM系統(tǒng)不再穩(wěn)定。針對(duì)室內(nèi)動(dòng)態(tài)場景中視覺SLAM系統(tǒng)不穩(wěn)定的問題,本文使用弱監(jiān)督語義分割與視覺SLAM系統(tǒng)結(jié)合的方式,通過剔除SLAM系統(tǒng)中的動(dòng)態(tài)因素,提升視覺SLAM系統(tǒng)的準(zhǔn)確性和魯棒性,同時(shí)利用系統(tǒng)中的語義分割結(jié)果,生成靜態(tài)的八叉樹地圖。本文使用ORB-SLAM2作為視覺SLAM系統(tǒng)的基本框架,對(duì)輸入圖像進(jìn)行特征提取,并使用LK光流場判別動(dòng)態(tài)特征點(diǎn)。同時(shí)將輸入圖像傳入語義分割模塊,分割出動(dòng)態(tài)目標(biāo)區(qū)域。然后結(jié)合LK光流檢測結(jié)果與語義分割結(jié)果對(duì)動(dòng)態(tài)特征點(diǎn)進(jìn)行剔除,隨后系統(tǒng)利用穩(wěn)定的ORB特征點(diǎn)對(duì)移動(dòng)機(jī)器人進(jìn)行位姿估計(jì),得到一個(gè)相對(duì)穩(wěn)定的視覺SLAM系統(tǒng)。在視覺SLAM系統(tǒng)的語義分割部分,本文使用了弱監(jiān)督語義分割方式,極大地減少了訓(xùn)練數(shù)據(jù)的標(biāo)注成本。并且針對(duì)弱監(jiān)督語義分割中,定位種子稀疏的問題,本文應(yīng)用了顯著性引導(dǎo)的自注意網(wǎng)絡(luò)模塊,...
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:76 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
掃地機(jī)器人Fig.1.2Sweepingrobot
據(jù)。弱監(jiān)督學(xué)習(xí)方式與全監(jiān)督學(xué)習(xí)方式相比較,它的圖像標(biāo)注數(shù)據(jù)更容易獲取,標(biāo)注成本較低。弱監(jiān)督學(xué)習(xí)方式在語義分割領(lǐng)域中扮演著重要的角色,比如Papandreou等[29]以圖像級(jí)類標(biāo)簽結(jié)合邊界框標(biāo)注的方式對(duì)分割網(wǎng)絡(luò)進(jìn)行訓(xùn)練,Lin[30]等人使用“涂鴉線條”式標(biāo)注數(shù)據(jù)作為弱監(jiān)督信息進(jìn)行分割網(wǎng)絡(luò)的訓(xùn)練,Russakovsky[31]等人使用點(diǎn)標(biāo)注進(jìn)行分割網(wǎng)絡(luò)的訓(xùn)練。Kolesnikov[32]等人提出弱監(jiān)督語義分割網(wǎng)絡(luò)SEC,該網(wǎng)絡(luò)利用種子定位(Seed)、種子生長(Expand)以及生長約束(Constrain)三部分來完成圖像的分割,SEC模型框架如圖1.3所示。圖1.3SEC模型框架圖Fig.1.3TheframeworkofSECmodel
室內(nèi)動(dòng)態(tài)場景視覺SLAM系統(tǒng)中的弱監(jiān)督語義分割方法研究82視覺SLAM與深度學(xué)習(xí)理論基礎(chǔ)視覺SLAM是指移動(dòng)機(jī)器人在未知環(huán)境下,利用自身的視覺傳感器獲取環(huán)境信息,估計(jì)所在的位置并構(gòu)建環(huán)境地圖。視覺傳感器是視覺SLAM系統(tǒng)中非常重要的信息采集器,所以在本章節(jié)先介紹相機(jī)的相關(guān)知識(shí),然后再詳細(xì)介紹視覺SLAM各模塊的基礎(chǔ)知識(shí),最后介紹深度學(xué)習(xí)與弱監(jiān)督語義分割方面的內(nèi)容。2.1相機(jī)模型2.1.1SLAM中的深度相機(jī)在視覺SLAM中,移動(dòng)機(jī)器人需要通過相機(jī)獲取環(huán)境信息,而在眾多相機(jī)類型中,深度相機(jī)展現(xiàn)了它的獨(dú)特優(yōu)勢。深度相機(jī)是近年來新興的技術(shù),它能夠同時(shí)獲取彩色圖像和深度信息,可以更為準(zhǔn)確地感知環(huán)境變化,為SLAM系統(tǒng)提供更為可靠的原始數(shù)據(jù),因此,深度相機(jī)在視覺SLAM領(lǐng)域中應(yīng)用十分廣泛。(a)KinectV1(b)KinectV2圖2.1Kinect相機(jī)Fig.2.1Kinectcamera深度相機(jī)按照實(shí)現(xiàn)原理的不同,分為紅外結(jié)構(gòu)光原理攝像頭和飛行時(shí)間(TOF)原理攝像頭。圖2.1(a)所示的KinectV1[46]相機(jī)是典型的紅外結(jié)構(gòu)光相機(jī),它使用紅外投射器向環(huán)境中發(fā)射出紅外線,紅外接收器接收由物體反射回來的光線,計(jì)算圖像的深度信息。圖2.1(b)中的KinectV2[47]是一款經(jīng)典的TOF相機(jī),它發(fā)送的脈沖光經(jīng)物體反射后返回相機(jī),根據(jù)光束飛行時(shí)間計(jì)算相機(jī)與物體的距離。因?yàn)镵ineticV2在圖像處理時(shí),對(duì)光照條件要求不高,使用方法簡單,所以在本文中采用了KinectV2深度相機(jī)進(jìn)行實(shí)驗(yàn)。2.1.2針孔相機(jī)模型視覺SLAM系統(tǒng)利用輸入圖像之間的匹配關(guān)系來估計(jì)移動(dòng)機(jī)器人的位姿狀態(tài)。為了能更充分地描述動(dòng)態(tài)環(huán)境對(duì)移動(dòng)機(jī)器人位姿估計(jì)的影響,本文將從相機(jī)與圖像之間的關(guān)系開始分析。由圖2.2所示的針孔相機(jī)成像模型能夠清晰地描述視覺SLAM系統(tǒng)將三維
【參考文獻(xiàn)】:
期刊論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割研究綜述[J]. 景莊偉,管海燕,彭代峰,于永濤. 計(jì)算機(jī)工程. 2020(10)
[2]基于語義分割的室內(nèi)動(dòng)態(tài)場景同步定位與語義建圖[J]. 席志紅,韓雙全,王洪旭. 計(jì)算機(jī)應(yīng)用. 2019(10)
[3]動(dòng)態(tài)環(huán)境下結(jié)合語義的魯棒視覺SLAM[J]. 王金戈,鄒旭東,仇曉松,蔡浩原. 傳感器與微系統(tǒng). 2019(05)
[4]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報(bào). 2019(02)
[5]基于視覺側(cè)抑制特性的自動(dòng)色彩均衡算法[J]. 蘇俊銘,劉立龍,黃良珂. 科學(xué)技術(shù)與工程. 2019(01)
[6]動(dòng)態(tài)場景下一種魯棒的立體視覺里程計(jì)算法[J]. 張合新,徐慧,姚二亮,宋海濤,趙欣. 儀器儀表學(xué)報(bào). 2018(09)
[7]基于VI-SLAM的四旋翼自主飛行與三維稠密重構(gòu)[J]. 林輝燦,呂強(qiáng),衛(wèi)恒,王陽,梁冰. 光學(xué)學(xué)報(bào). 2018(07)
[8]基于VSLAM的自主移動(dòng)機(jī)器人三維同時(shí)定位與地圖構(gòu)建[J]. 林輝燦,呂強(qiáng),王國勝,張洋,梁冰. 計(jì)算機(jī)應(yīng)用. 2017(10)
[9]動(dòng)態(tài)場景下基于運(yùn)動(dòng)物體檢測的立體視覺里程計(jì)[J]. 林志林,張國良,姚二亮,徐慧. 光學(xué)學(xué)報(bào). 2017(11)
[10]基于ORB-SLAM的室內(nèi)機(jī)器人定位和三維稠密地圖構(gòu)建[J]. 侯榮波,魏武,黃婷,鄧超鋒. 計(jì)算機(jī)應(yīng)用. 2017(05)
碩士論文
[1]動(dòng)態(tài)環(huán)境下基于語義分割的視覺SLAM方法研究[D]. 張建波.哈爾濱工業(yè)大學(xué) 2019
[2]室內(nèi)動(dòng)態(tài)環(huán)境下的移動(dòng)機(jī)器人視覺SLAM研究[D]. 胡萬里.華中科技大學(xué) 2019
[3]基于種子生長及邊界約束的弱監(jiān)督圖像語義分割算法研究[D]. 華梅芳.華南理工大學(xué) 2019
[4]自動(dòng)色彩均衡算法的優(yōu)化[D]. 劉瀟.華中師范大學(xué) 2015
本文編號(hào):3532759
【文章來源】:西華大學(xué)四川省
【文章頁數(shù)】:76 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
掃地機(jī)器人Fig.1.2Sweepingrobot
據(jù)。弱監(jiān)督學(xué)習(xí)方式與全監(jiān)督學(xué)習(xí)方式相比較,它的圖像標(biāo)注數(shù)據(jù)更容易獲取,標(biāo)注成本較低。弱監(jiān)督學(xué)習(xí)方式在語義分割領(lǐng)域中扮演著重要的角色,比如Papandreou等[29]以圖像級(jí)類標(biāo)簽結(jié)合邊界框標(biāo)注的方式對(duì)分割網(wǎng)絡(luò)進(jìn)行訓(xùn)練,Lin[30]等人使用“涂鴉線條”式標(biāo)注數(shù)據(jù)作為弱監(jiān)督信息進(jìn)行分割網(wǎng)絡(luò)的訓(xùn)練,Russakovsky[31]等人使用點(diǎn)標(biāo)注進(jìn)行分割網(wǎng)絡(luò)的訓(xùn)練。Kolesnikov[32]等人提出弱監(jiān)督語義分割網(wǎng)絡(luò)SEC,該網(wǎng)絡(luò)利用種子定位(Seed)、種子生長(Expand)以及生長約束(Constrain)三部分來完成圖像的分割,SEC模型框架如圖1.3所示。圖1.3SEC模型框架圖Fig.1.3TheframeworkofSECmodel
室內(nèi)動(dòng)態(tài)場景視覺SLAM系統(tǒng)中的弱監(jiān)督語義分割方法研究82視覺SLAM與深度學(xué)習(xí)理論基礎(chǔ)視覺SLAM是指移動(dòng)機(jī)器人在未知環(huán)境下,利用自身的視覺傳感器獲取環(huán)境信息,估計(jì)所在的位置并構(gòu)建環(huán)境地圖。視覺傳感器是視覺SLAM系統(tǒng)中非常重要的信息采集器,所以在本章節(jié)先介紹相機(jī)的相關(guān)知識(shí),然后再詳細(xì)介紹視覺SLAM各模塊的基礎(chǔ)知識(shí),最后介紹深度學(xué)習(xí)與弱監(jiān)督語義分割方面的內(nèi)容。2.1相機(jī)模型2.1.1SLAM中的深度相機(jī)在視覺SLAM中,移動(dòng)機(jī)器人需要通過相機(jī)獲取環(huán)境信息,而在眾多相機(jī)類型中,深度相機(jī)展現(xiàn)了它的獨(dú)特優(yōu)勢。深度相機(jī)是近年來新興的技術(shù),它能夠同時(shí)獲取彩色圖像和深度信息,可以更為準(zhǔn)確地感知環(huán)境變化,為SLAM系統(tǒng)提供更為可靠的原始數(shù)據(jù),因此,深度相機(jī)在視覺SLAM領(lǐng)域中應(yīng)用十分廣泛。(a)KinectV1(b)KinectV2圖2.1Kinect相機(jī)Fig.2.1Kinectcamera深度相機(jī)按照實(shí)現(xiàn)原理的不同,分為紅外結(jié)構(gòu)光原理攝像頭和飛行時(shí)間(TOF)原理攝像頭。圖2.1(a)所示的KinectV1[46]相機(jī)是典型的紅外結(jié)構(gòu)光相機(jī),它使用紅外投射器向環(huán)境中發(fā)射出紅外線,紅外接收器接收由物體反射回來的光線,計(jì)算圖像的深度信息。圖2.1(b)中的KinectV2[47]是一款經(jīng)典的TOF相機(jī),它發(fā)送的脈沖光經(jīng)物體反射后返回相機(jī),根據(jù)光束飛行時(shí)間計(jì)算相機(jī)與物體的距離。因?yàn)镵ineticV2在圖像處理時(shí),對(duì)光照條件要求不高,使用方法簡單,所以在本文中采用了KinectV2深度相機(jī)進(jìn)行實(shí)驗(yàn)。2.1.2針孔相機(jī)模型視覺SLAM系統(tǒng)利用輸入圖像之間的匹配關(guān)系來估計(jì)移動(dòng)機(jī)器人的位姿狀態(tài)。為了能更充分地描述動(dòng)態(tài)環(huán)境對(duì)移動(dòng)機(jī)器人位姿估計(jì)的影響,本文將從相機(jī)與圖像之間的關(guān)系開始分析。由圖2.2所示的針孔相機(jī)成像模型能夠清晰地描述視覺SLAM系統(tǒng)將三維
【參考文獻(xiàn)】:
期刊論文
[1]基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割研究綜述[J]. 景莊偉,管海燕,彭代峰,于永濤. 計(jì)算機(jī)工程. 2020(10)
[2]基于語義分割的室內(nèi)動(dòng)態(tài)場景同步定位與語義建圖[J]. 席志紅,韓雙全,王洪旭. 計(jì)算機(jī)應(yīng)用. 2019(10)
[3]動(dòng)態(tài)環(huán)境下結(jié)合語義的魯棒視覺SLAM[J]. 王金戈,鄒旭東,仇曉松,蔡浩原. 傳感器與微系統(tǒng). 2019(05)
[4]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報(bào). 2019(02)
[5]基于視覺側(cè)抑制特性的自動(dòng)色彩均衡算法[J]. 蘇俊銘,劉立龍,黃良珂. 科學(xué)技術(shù)與工程. 2019(01)
[6]動(dòng)態(tài)場景下一種魯棒的立體視覺里程計(jì)算法[J]. 張合新,徐慧,姚二亮,宋海濤,趙欣. 儀器儀表學(xué)報(bào). 2018(09)
[7]基于VI-SLAM的四旋翼自主飛行與三維稠密重構(gòu)[J]. 林輝燦,呂強(qiáng),衛(wèi)恒,王陽,梁冰. 光學(xué)學(xué)報(bào). 2018(07)
[8]基于VSLAM的自主移動(dòng)機(jī)器人三維同時(shí)定位與地圖構(gòu)建[J]. 林輝燦,呂強(qiáng),王國勝,張洋,梁冰. 計(jì)算機(jī)應(yīng)用. 2017(10)
[9]動(dòng)態(tài)場景下基于運(yùn)動(dòng)物體檢測的立體視覺里程計(jì)[J]. 林志林,張國良,姚二亮,徐慧. 光學(xué)學(xué)報(bào). 2017(11)
[10]基于ORB-SLAM的室內(nèi)機(jī)器人定位和三維稠密地圖構(gòu)建[J]. 侯榮波,魏武,黃婷,鄧超鋒. 計(jì)算機(jī)應(yīng)用. 2017(05)
碩士論文
[1]動(dòng)態(tài)環(huán)境下基于語義分割的視覺SLAM方法研究[D]. 張建波.哈爾濱工業(yè)大學(xué) 2019
[2]室內(nèi)動(dòng)態(tài)環(huán)境下的移動(dòng)機(jī)器人視覺SLAM研究[D]. 胡萬里.華中科技大學(xué) 2019
[3]基于種子生長及邊界約束的弱監(jiān)督圖像語義分割算法研究[D]. 華梅芳.華南理工大學(xué) 2019
[4]自動(dòng)色彩均衡算法的優(yōu)化[D]. 劉瀟.華中師范大學(xué) 2015
本文編號(hào):3532759
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3532759.html
最近更新
教材專著