基于深度學(xué)習(xí)的視覺SLAM語義地圖構(gòu)建
發(fā)布時間:2022-01-25 15:28
近年來隨著科學(xué)技術(shù)快速發(fā)展,智能機器人的研究受到人們越來越多的關(guān)注。在智能機器人研究中,SLAM(Simultaneous Localization and Mapping)是需要解決的基礎(chǔ)性問題。現(xiàn)在大多數(shù)視覺SLAM系統(tǒng)通過檢測和匹配視覺特征點來進行定位和建圖,這使得機器人SLAM系統(tǒng)只能利用環(huán)境中的幾何信息,而無法利用環(huán)境中豐富的語義信息。RGBD相機因為可以直接獲取到物體的距離信息,基于RGBD傳感器的機器人視覺研究引起了眾多學(xué)者的關(guān)注。一般利用RGBD數(shù)據(jù)可以重建出環(huán)境的三維點云地圖,點云地圖中一般含有較為豐富的空間幾何信息。然而點云數(shù)據(jù)通常是不規(guī)則的空間離散點,從中獲取語義信息較為困難。因此,如何讓機器人獲取周圍環(huán)境語義信息,讓機器人擁有感知能力,已經(jīng)成為視覺SLAM的研究熱點。本文基于ORB-SLAM2系統(tǒng)在RGBD圖像序列構(gòu)建稠密點云地圖,在建圖過程中使用深度卷積神經(jīng)網(wǎng)絡(luò)提取環(huán)境語義信息,然后使用基于圖論的切割算法將點云地圖進行切割,最后將語義信息投影到點云集簇,實現(xiàn)了3D稠密語義地圖構(gòu)建。本文在流行的公共數(shù)據(jù)集上驗證了3D稠密語義地圖構(gòu)建算法的有效性。本文主要工作和貢...
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
結(jié)合2D圖像和3D點云的語義地圖構(gòu)建
國防科技大學(xué)研究生院碩士學(xué)位論文第12頁第二章基于視覺SLAM的語義地圖構(gòu)建框架本章介紹了基于視覺SLAM的語義地圖構(gòu)建所用的相關(guān)技術(shù),并提出了語義地圖構(gòu)建總體結(jié)構(gòu)設(shè)計。首先梳理了ORB-SLAM的研究流程,然后列舉了卷積神經(jīng)網(wǎng)絡(luò)基本原理和核心模塊,最后介紹了YOLO目標(biāo)檢測算法的演變流程和YOLOv3算法的具體實現(xiàn)細節(jié)。2.1基于RGBD數(shù)據(jù)的視覺SLAM框架RGBD相機又稱深度相機,可同時獲取RGB圖和深度圖。它利用紅外結(jié)構(gòu)光或Time-of-Flight原理來直接得到圖像中各像素離相機的距離,相比于雙目相機能節(jié)省大量的計算。但RGBD相機大多用在室內(nèi)場景,也存在一些諸如測量范圍窄、噪聲大、視野小和易受日光影響等缺陷,不太適用于室外SLAM。RGBDSLAM屬于視覺SLAM的一種,基本框架(除去傳感器數(shù)據(jù)讀取階段)也和視覺SLAM框架保持一致,也有前端、后端、回環(huán)檢測、建圖四個基本模塊。圖2.1SLAM模塊2.1.1傳感器數(shù)據(jù)讀取在視覺SLAM中一般是相機圖像數(shù)據(jù)的采集、讀取和預(yù)處理。如果在無人車或者機器人中,還有碼盤、慣性傳感器等信息的讀取和同步。一般而言,SLAM的研究流程從數(shù)據(jù)讀取完成后開始,所以傳感器信息讀取階段并不屬于SLAM流程,它為正式的SLAM流程做了數(shù)據(jù)準(zhǔn)備。2.1.2前端前端是指視覺里程計(VisualOdometry,VO),是通過估算兩張圖片之間的關(guān)系,來計算相機發(fā)生的運動。視覺里程計的主要方式分為特征點法和直接法,目前基于特征點的方法占據(jù)了主流。特征點法能夠在噪聲較大、相機運動較快時工作,但建圖較為稀疏;直接法不需要提特征,能夠建立稠密地圖,但也存在著計算量
國防科技大學(xué)研究生院碩士學(xué)位論文第13頁大、魯棒性不好等缺陷。求解相機位姿變化需要兩個前提:特征點的檢測和特征點的匹配。就特征點的檢測算法來說,目前使用的特征有很多種,比較知名的有SIFT[59]、SURF[60]、FAST[61]和ORB[62]等。下圖就是就是使用ORB特征進行特征點檢測和匹配的結(jié)果。圖2.2ORB特征點匹配在匹配好特征點后就可以得到兩個一一對應(yīng)的像素點集。接下來就可以根據(jù)兩組匹配好的點集,計算相機的運動。最常用的相機姿態(tài)方式有估計對極幾何[63]、PnP[64]和ICP[65]三種。前端是SLAM的關(guān)鍵問題,它估計了關(guān)鍵幀之間的相機運動。只要把多個相鄰時刻的相機運動串聯(lián)起來,就可以得到機器人的運動軌跡,從而解決了SLAM的定位問題。但是,由于前端對相機運動的每一次估計都會產(chǎn)生誤差,同時先前時刻的誤差會傳遞到下一時刻,導(dǎo)致經(jīng)過了一段時間后,估計的軌跡由于“累計漂移”將不再準(zhǔn)確,如下圖所示。這就導(dǎo)致SLAM系統(tǒng)無法建立一致的地圖。為了解決“漂移”的問題,需要后端優(yōu)化和回環(huán)檢測這兩種技術(shù)。真實軌跡預(yù)估軌跡圖2.3軌跡漂移
【參考文獻】:
期刊論文
[1]一種融合全局及顯著性區(qū)域特征的室內(nèi)場景識別方法[J]. 牛杰,卜雄洙,錢堃,李眾. 機器人. 2015(01)
[2]迎接第三次工業(yè)革命的關(guān)鍵在于發(fā)展模式的革命——我國光伏產(chǎn)業(yè)和機器人產(chǎn)業(yè)的案例研究與反思[J]. 賈根良. 經(jīng)濟理論與經(jīng)濟管理. 2013(05)
[3]未知環(huán)境下移動機器人同步地圖創(chuàng)建與定位研究進展[J]. 王耀南,余洪山. 控制理論與應(yīng)用. 2008(01)
本文編號:3608783
【文章來源】:國防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
結(jié)合2D圖像和3D點云的語義地圖構(gòu)建
國防科技大學(xué)研究生院碩士學(xué)位論文第12頁第二章基于視覺SLAM的語義地圖構(gòu)建框架本章介紹了基于視覺SLAM的語義地圖構(gòu)建所用的相關(guān)技術(shù),并提出了語義地圖構(gòu)建總體結(jié)構(gòu)設(shè)計。首先梳理了ORB-SLAM的研究流程,然后列舉了卷積神經(jīng)網(wǎng)絡(luò)基本原理和核心模塊,最后介紹了YOLO目標(biāo)檢測算法的演變流程和YOLOv3算法的具體實現(xiàn)細節(jié)。2.1基于RGBD數(shù)據(jù)的視覺SLAM框架RGBD相機又稱深度相機,可同時獲取RGB圖和深度圖。它利用紅外結(jié)構(gòu)光或Time-of-Flight原理來直接得到圖像中各像素離相機的距離,相比于雙目相機能節(jié)省大量的計算。但RGBD相機大多用在室內(nèi)場景,也存在一些諸如測量范圍窄、噪聲大、視野小和易受日光影響等缺陷,不太適用于室外SLAM。RGBDSLAM屬于視覺SLAM的一種,基本框架(除去傳感器數(shù)據(jù)讀取階段)也和視覺SLAM框架保持一致,也有前端、后端、回環(huán)檢測、建圖四個基本模塊。圖2.1SLAM模塊2.1.1傳感器數(shù)據(jù)讀取在視覺SLAM中一般是相機圖像數(shù)據(jù)的采集、讀取和預(yù)處理。如果在無人車或者機器人中,還有碼盤、慣性傳感器等信息的讀取和同步。一般而言,SLAM的研究流程從數(shù)據(jù)讀取完成后開始,所以傳感器信息讀取階段并不屬于SLAM流程,它為正式的SLAM流程做了數(shù)據(jù)準(zhǔn)備。2.1.2前端前端是指視覺里程計(VisualOdometry,VO),是通過估算兩張圖片之間的關(guān)系,來計算相機發(fā)生的運動。視覺里程計的主要方式分為特征點法和直接法,目前基于特征點的方法占據(jù)了主流。特征點法能夠在噪聲較大、相機運動較快時工作,但建圖較為稀疏;直接法不需要提特征,能夠建立稠密地圖,但也存在著計算量
國防科技大學(xué)研究生院碩士學(xué)位論文第13頁大、魯棒性不好等缺陷。求解相機位姿變化需要兩個前提:特征點的檢測和特征點的匹配。就特征點的檢測算法來說,目前使用的特征有很多種,比較知名的有SIFT[59]、SURF[60]、FAST[61]和ORB[62]等。下圖就是就是使用ORB特征進行特征點檢測和匹配的結(jié)果。圖2.2ORB特征點匹配在匹配好特征點后就可以得到兩個一一對應(yīng)的像素點集。接下來就可以根據(jù)兩組匹配好的點集,計算相機的運動。最常用的相機姿態(tài)方式有估計對極幾何[63]、PnP[64]和ICP[65]三種。前端是SLAM的關(guān)鍵問題,它估計了關(guān)鍵幀之間的相機運動。只要把多個相鄰時刻的相機運動串聯(lián)起來,就可以得到機器人的運動軌跡,從而解決了SLAM的定位問題。但是,由于前端對相機運動的每一次估計都會產(chǎn)生誤差,同時先前時刻的誤差會傳遞到下一時刻,導(dǎo)致經(jīng)過了一段時間后,估計的軌跡由于“累計漂移”將不再準(zhǔn)確,如下圖所示。這就導(dǎo)致SLAM系統(tǒng)無法建立一致的地圖。為了解決“漂移”的問題,需要后端優(yōu)化和回環(huán)檢測這兩種技術(shù)。真實軌跡預(yù)估軌跡圖2.3軌跡漂移
【參考文獻】:
期刊論文
[1]一種融合全局及顯著性區(qū)域特征的室內(nèi)場景識別方法[J]. 牛杰,卜雄洙,錢堃,李眾. 機器人. 2015(01)
[2]迎接第三次工業(yè)革命的關(guān)鍵在于發(fā)展模式的革命——我國光伏產(chǎn)業(yè)和機器人產(chǎn)業(yè)的案例研究與反思[J]. 賈根良. 經(jīng)濟理論與經(jīng)濟管理. 2013(05)
[3]未知環(huán)境下移動機器人同步地圖創(chuàng)建與定位研究進展[J]. 王耀南,余洪山. 控制理論與應(yīng)用. 2008(01)
本文編號:3608783
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3608783.html
最近更新
教材專著