室內(nèi)動(dòng)態(tài)場(chǎng)景下移動(dòng)機(jī)器人的視覺SLAM算法研究
發(fā)布時(shí)間:2021-08-07 20:49
基于視覺的同時(shí)定位與地圖構(gòu)建(Simultaneous Localization and Mapping,SLAM),是自主移動(dòng)機(jī)器人的核心功能之一。然而,現(xiàn)有視覺SLAM算法大多為了計(jì)算方便,常將外部場(chǎng)景作為靜態(tài)假設(shè),其所構(gòu)建的靜態(tài)系統(tǒng)模型對(duì)外部環(huán)境獨(dú)立運(yùn)動(dòng)物體敏感,導(dǎo)致SLAM系統(tǒng)在動(dòng)態(tài)場(chǎng)景中具有較大誤差而無(wú)法應(yīng)用于實(shí)際生產(chǎn)生活。鑒于此,本文以O(shè)RB-SLAM2 RGB-D框架為基礎(chǔ),研究一種針對(duì)室內(nèi)動(dòng)態(tài)場(chǎng)景下的魯棒視覺SLAM算法,涉及的核心問(wèn)題有ORB特征點(diǎn)均勻化提取、動(dòng)態(tài)特征點(diǎn)檢測(cè)及濾除和靜態(tài)三維地圖構(gòu)建;贠RB-SLAM2構(gòu)建了一種多線程SLAM框架。添加了語(yǔ)義檢測(cè)線程,用于識(shí)別場(chǎng)景中的先驗(yàn)動(dòng)態(tài)目標(biāo)。新增三維地圖構(gòu)建線程,用于構(gòu)建場(chǎng)景中的靜態(tài)三維點(diǎn)云和八叉樹地圖。在跟蹤線程中,改進(jìn)了原始系統(tǒng)特征提取模塊,新添加特征濾除模塊用于濾除場(chǎng)景中的動(dòng)態(tài)特征。針對(duì) ORB-SLAM2 中基于四叉樹的 ORB 算法(Quadtree-based ORB algorithm,QtreeORB)存在對(duì)提取的特征點(diǎn)過(guò)均勻化現(xiàn)象,提出一種改進(jìn)四叉樹ORB特征點(diǎn)提取算法。...
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
經(jīng)典視覺SLAM框架
1緒論5等[37]基于HOG特征提出一種目標(biāo)檢測(cè)器DPM,該檢測(cè)器對(duì)目標(biāo)形變及尺度變化等有較好魯棒性,是目標(biāo)檢測(cè)研究歷史中最經(jīng)典的方法之一。隨后有國(guó)內(nèi)外學(xué)者先后對(duì)DPM在精度和效率方面提出一些改進(jìn)方法[38][39][40],但這些檢測(cè)器大為通過(guò)人為設(shè)定特征完成目標(biāo)檢測(cè)。這些特征對(duì)噪聲以及環(huán)境干擾敏感,且人為設(shè)定的特征難以表達(dá)目標(biāo)全面信息。此外,通過(guò)設(shè)定復(fù)雜特征可提升檢測(cè)器精度,但同時(shí)增加了檢測(cè)器的處理負(fù)擔(dān),實(shí)時(shí)性能大幅降低。因此,難以權(quán)衡檢測(cè)精度和實(shí)時(shí)性能。圖1-2經(jīng)典目標(biāo)檢測(cè)系統(tǒng)框架Fig.1-2Classictargetdetectionsystemframework近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)的快速發(fā)展,為運(yùn)動(dòng)目標(biāo)檢測(cè)方案提供了新的研究思路。R-CNN[41]、FastR-CNN[42]、FasterR-CNN[43]相繼提出將目標(biāo)檢測(cè)算法推上一個(gè)新高度。這些網(wǎng)絡(luò)使用候選區(qū)域預(yù)測(cè)來(lái)提高網(wǎng)絡(luò)檢測(cè)精度,但候選區(qū)域的檢測(cè)時(shí)間影響了算法的效率。隨后,YOLO[44]、SSD[45]等網(wǎng)絡(luò)采用回歸思想優(yōu)化實(shí)時(shí)性。YOLO可對(duì)復(fù)雜場(chǎng)景目標(biāo)實(shí)時(shí)檢測(cè),但存在對(duì)小目標(biāo)不敏感缺陷。SSD相對(duì)于YOLO提高了目標(biāo)檢測(cè)進(jìn)度,同時(shí)保證了較好實(shí)時(shí)性。此外,還有很多優(yōu)秀的目標(biāo)檢測(cè)網(wǎng)絡(luò),如FCN[45]、SegNet[47]和DeepLab[48]。雖然使用深度學(xué)習(xí)方法可以更好的適應(yīng)環(huán)境變化,但大部分網(wǎng)絡(luò)實(shí)時(shí)性較差,且需要幾何方法來(lái)判斷目標(biāo)狀態(tài)。1.2.3動(dòng)態(tài)環(huán)境中SLAM問(wèn)題研究現(xiàn)狀在靜態(tài)環(huán)境下,SLAM系統(tǒng)根據(jù)靜態(tài)路標(biāo)點(diǎn)可得到全局一致高精度地圖。但現(xiàn)實(shí)環(huán)境不可能永遠(yuǎn)保持靜態(tài),如圖1-3所示為SLAM系統(tǒng)在場(chǎng)景中的位姿估計(jì)示意,當(dāng)場(chǎng)景中出現(xiàn)運(yùn)動(dòng)目標(biāo)(圖1-3(b)中紅點(diǎn)),會(huì)使相鄰幀出現(xiàn)較大的不一致,使SLAM系統(tǒng)的位姿估計(jì)精度降低,影響SLAM系統(tǒng)的實(shí)際應(yīng)用。在動(dòng)態(tài)環(huán)境中提高SLAM系統(tǒng)魯棒性的核心
文6出了一種使用深度信息和視覺測(cè)距法檢測(cè)場(chǎng)景中的運(yùn)動(dòng)物體。通過(guò)將檢測(cè)到的外點(diǎn)信息和視覺傳感器的深度信息相融合可容易獲得場(chǎng)景中的運(yùn)動(dòng)目標(biāo)位置。但是由于深度信息的不確定性和相鄰幀間的變換矩陣計(jì)算誤差,該算法目標(biāo)檢測(cè)分割精度較低。Yi[56]等使用雙單高斯模型(SingleGaussianmodel,SGM)來(lái)構(gòu)建前景和背景模型,通過(guò)濾除從前景上提取到的動(dòng)態(tài)特征來(lái)提升SLAM系統(tǒng)的定位精度。Derome[57]等提出一種立體匹配和光流結(jié)合的方法,通過(guò)考慮各種估算誤差,得出了一種綜合的不確定性模型,可以很好的檢測(cè)場(chǎng)景中的動(dòng)態(tài)目標(biāo)。圖1-3動(dòng)態(tài)場(chǎng)景下的SLAM問(wèn)題Fig.1-3TheSLAMproblemunderdynamicscenarios近年來(lái),深度學(xué)習(xí)方法發(fā)展迅速,學(xué)者們開始使用其解決SLAM問(wèn)題。ChaoYu[16]等人基于ORB-SLAM2框架提出DS-SLAM,該框架在獨(dú)立線程使用SegNet網(wǎng)絡(luò)檢測(cè)場(chǎng)景中的語(yǔ)義信息,通過(guò)RANSAC算法估算幀間變換矩陣,然后使用極線幾何判斷特征點(diǎn)狀態(tài)。當(dāng)某一目標(biāo)上的動(dòng)態(tài)特征點(diǎn)的數(shù)量大于閾值,則該目標(biāo)被認(rèn)為動(dòng)態(tài),濾除其所有特征點(diǎn)。該算法在TUM數(shù)據(jù)集上表現(xiàn)優(yōu)秀,但因其在對(duì)極約束中使用的基本矩陣是基于所有特征點(diǎn)推算,當(dāng)圖像中異常特征點(diǎn)較多時(shí),會(huì)導(dǎo)致所估算基本矩陣出現(xiàn)嚴(yán)重偏差。同樣地,BertaBescos[17]等人提出一種DynaSLAM算法,其在ORB-SLAM2的基礎(chǔ)上通過(guò)結(jié)合幾何和深度學(xué)習(xí)來(lái)濾除場(chǎng)景中的動(dòng)態(tài)特征點(diǎn)。該算法在TUM數(shù)據(jù)集上取得了優(yōu)秀的成績(jī),但其采用的Mask-RCNN網(wǎng)絡(luò)不能實(shí)時(shí),影響其在現(xiàn)實(shí)中的應(yīng)用。最近,Han和Xi[58]提出一種PSPNet-SLAM(PyramidSceneParsingNetwork-SLAM)來(lái)改進(jìn)ORB-SLAM2,其中PSPNet和光流用于檢測(cè)動(dòng)態(tài)特征。從標(biāo)記為動(dòng)態(tài)對(duì)象上提取的特征和具有較大光流值的特征均被濾除,其余特征用于跟蹤。該方法在TUM數(shù)據(jù)集中實(shí)現(xiàn)了較高定位精?
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)ORB算法的移動(dòng)機(jī)器人視覺SLAM方法研究[J]. 成怡,佟曉宇. 電子技術(shù)應(yīng)用. 2019(01)
[2]移動(dòng)機(jī)器人SLAM關(guān)鍵問(wèn)題和解決方法綜述[J]. 楊雪夢(mèng),姚敏茹,曹凱. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(07)
[3]視覺SLAM綜述[J]. 權(quán)美香,樸松昊,李國(guó). 智能系統(tǒng)學(xué)報(bào). 2016(06)
本文編號(hào):3328517
【文章來(lái)源】:西安理工大學(xué)陜西省
【文章頁(yè)數(shù)】:89 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
經(jīng)典視覺SLAM框架
1緒論5等[37]基于HOG特征提出一種目標(biāo)檢測(cè)器DPM,該檢測(cè)器對(duì)目標(biāo)形變及尺度變化等有較好魯棒性,是目標(biāo)檢測(cè)研究歷史中最經(jīng)典的方法之一。隨后有國(guó)內(nèi)外學(xué)者先后對(duì)DPM在精度和效率方面提出一些改進(jìn)方法[38][39][40],但這些檢測(cè)器大為通過(guò)人為設(shè)定特征完成目標(biāo)檢測(cè)。這些特征對(duì)噪聲以及環(huán)境干擾敏感,且人為設(shè)定的特征難以表達(dá)目標(biāo)全面信息。此外,通過(guò)設(shè)定復(fù)雜特征可提升檢測(cè)器精度,但同時(shí)增加了檢測(cè)器的處理負(fù)擔(dān),實(shí)時(shí)性能大幅降低。因此,難以權(quán)衡檢測(cè)精度和實(shí)時(shí)性能。圖1-2經(jīng)典目標(biāo)檢測(cè)系統(tǒng)框架Fig.1-2Classictargetdetectionsystemframework近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)的快速發(fā)展,為運(yùn)動(dòng)目標(biāo)檢測(cè)方案提供了新的研究思路。R-CNN[41]、FastR-CNN[42]、FasterR-CNN[43]相繼提出將目標(biāo)檢測(cè)算法推上一個(gè)新高度。這些網(wǎng)絡(luò)使用候選區(qū)域預(yù)測(cè)來(lái)提高網(wǎng)絡(luò)檢測(cè)精度,但候選區(qū)域的檢測(cè)時(shí)間影響了算法的效率。隨后,YOLO[44]、SSD[45]等網(wǎng)絡(luò)采用回歸思想優(yōu)化實(shí)時(shí)性。YOLO可對(duì)復(fù)雜場(chǎng)景目標(biāo)實(shí)時(shí)檢測(cè),但存在對(duì)小目標(biāo)不敏感缺陷。SSD相對(duì)于YOLO提高了目標(biāo)檢測(cè)進(jìn)度,同時(shí)保證了較好實(shí)時(shí)性。此外,還有很多優(yōu)秀的目標(biāo)檢測(cè)網(wǎng)絡(luò),如FCN[45]、SegNet[47]和DeepLab[48]。雖然使用深度學(xué)習(xí)方法可以更好的適應(yīng)環(huán)境變化,但大部分網(wǎng)絡(luò)實(shí)時(shí)性較差,且需要幾何方法來(lái)判斷目標(biāo)狀態(tài)。1.2.3動(dòng)態(tài)環(huán)境中SLAM問(wèn)題研究現(xiàn)狀在靜態(tài)環(huán)境下,SLAM系統(tǒng)根據(jù)靜態(tài)路標(biāo)點(diǎn)可得到全局一致高精度地圖。但現(xiàn)實(shí)環(huán)境不可能永遠(yuǎn)保持靜態(tài),如圖1-3所示為SLAM系統(tǒng)在場(chǎng)景中的位姿估計(jì)示意,當(dāng)場(chǎng)景中出現(xiàn)運(yùn)動(dòng)目標(biāo)(圖1-3(b)中紅點(diǎn)),會(huì)使相鄰幀出現(xiàn)較大的不一致,使SLAM系統(tǒng)的位姿估計(jì)精度降低,影響SLAM系統(tǒng)的實(shí)際應(yīng)用。在動(dòng)態(tài)環(huán)境中提高SLAM系統(tǒng)魯棒性的核心
文6出了一種使用深度信息和視覺測(cè)距法檢測(cè)場(chǎng)景中的運(yùn)動(dòng)物體。通過(guò)將檢測(cè)到的外點(diǎn)信息和視覺傳感器的深度信息相融合可容易獲得場(chǎng)景中的運(yùn)動(dòng)目標(biāo)位置。但是由于深度信息的不確定性和相鄰幀間的變換矩陣計(jì)算誤差,該算法目標(biāo)檢測(cè)分割精度較低。Yi[56]等使用雙單高斯模型(SingleGaussianmodel,SGM)來(lái)構(gòu)建前景和背景模型,通過(guò)濾除從前景上提取到的動(dòng)態(tài)特征來(lái)提升SLAM系統(tǒng)的定位精度。Derome[57]等提出一種立體匹配和光流結(jié)合的方法,通過(guò)考慮各種估算誤差,得出了一種綜合的不確定性模型,可以很好的檢測(cè)場(chǎng)景中的動(dòng)態(tài)目標(biāo)。圖1-3動(dòng)態(tài)場(chǎng)景下的SLAM問(wèn)題Fig.1-3TheSLAMproblemunderdynamicscenarios近年來(lái),深度學(xué)習(xí)方法發(fā)展迅速,學(xué)者們開始使用其解決SLAM問(wèn)題。ChaoYu[16]等人基于ORB-SLAM2框架提出DS-SLAM,該框架在獨(dú)立線程使用SegNet網(wǎng)絡(luò)檢測(cè)場(chǎng)景中的語(yǔ)義信息,通過(guò)RANSAC算法估算幀間變換矩陣,然后使用極線幾何判斷特征點(diǎn)狀態(tài)。當(dāng)某一目標(biāo)上的動(dòng)態(tài)特征點(diǎn)的數(shù)量大于閾值,則該目標(biāo)被認(rèn)為動(dòng)態(tài),濾除其所有特征點(diǎn)。該算法在TUM數(shù)據(jù)集上表現(xiàn)優(yōu)秀,但因其在對(duì)極約束中使用的基本矩陣是基于所有特征點(diǎn)推算,當(dāng)圖像中異常特征點(diǎn)較多時(shí),會(huì)導(dǎo)致所估算基本矩陣出現(xiàn)嚴(yán)重偏差。同樣地,BertaBescos[17]等人提出一種DynaSLAM算法,其在ORB-SLAM2的基礎(chǔ)上通過(guò)結(jié)合幾何和深度學(xué)習(xí)來(lái)濾除場(chǎng)景中的動(dòng)態(tài)特征點(diǎn)。該算法在TUM數(shù)據(jù)集上取得了優(yōu)秀的成績(jī),但其采用的Mask-RCNN網(wǎng)絡(luò)不能實(shí)時(shí),影響其在現(xiàn)實(shí)中的應(yīng)用。最近,Han和Xi[58]提出一種PSPNet-SLAM(PyramidSceneParsingNetwork-SLAM)來(lái)改進(jìn)ORB-SLAM2,其中PSPNet和光流用于檢測(cè)動(dòng)態(tài)特征。從標(biāo)記為動(dòng)態(tài)對(duì)象上提取的特征和具有較大光流值的特征均被濾除,其余特征用于跟蹤。該方法在TUM數(shù)據(jù)集中實(shí)現(xiàn)了較高定位精?
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)ORB算法的移動(dòng)機(jī)器人視覺SLAM方法研究[J]. 成怡,佟曉宇. 電子技術(shù)應(yīng)用. 2019(01)
[2]移動(dòng)機(jī)器人SLAM關(guān)鍵問(wèn)題和解決方法綜述[J]. 楊雪夢(mèng),姚敏茹,曹凱. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(07)
[3]視覺SLAM綜述[J]. 權(quán)美香,樸松昊,李國(guó). 智能系統(tǒng)學(xué)報(bào). 2016(06)
本文編號(hào):3328517
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3328517.html
最近更新
教材專著