基于RGBD的無人機語義SLAM系統(tǒng)原型設(shè)計及實現(xiàn)
發(fā)布時間:2022-01-08 18:33
隨著計算機視覺和無人機相關(guān)技術(shù)的迅速發(fā)展,構(gòu)建智能無人機系統(tǒng)成為當前機器人研究領(lǐng)域的熱點方向,而高效的語義SLAM(Simultaneously Localization And Mapping,即時定位與建圖)是智能無人機系統(tǒng)實現(xiàn)在未知環(huán)境下進行自主定位、環(huán)境導航和智能搜索等高級任務的基礎(chǔ)。但是現(xiàn)有語義SLAM的發(fā)展并不成熟,且其實現(xiàn)過于依賴對算力要求較高的深度學習理論,并不適用于存在一定載荷限制的多旋翼無人機。因此,本文在具有高準確性跟蹤精度的RGBD-SLAM基礎(chǔ)上,采用輕量化的目標檢測模塊和三維語義地圖構(gòu)建方法進行改進,設(shè)計基于RGBD的無人機語義SLAM原型系統(tǒng),完成無人機軌跡估計的同時,構(gòu)建環(huán)境三維語義地圖。首先,選擇RGBD相機作為無人機語義SLAM系統(tǒng)的唯一視覺傳感器,并通過分析經(jīng)典視覺SLAM的實現(xiàn)原理和優(yōu)缺點,結(jié)合無人機應用平臺,在ORBSLAM框架的基礎(chǔ)上融合高效的目標檢測算法和三維目標分割方法,進行無人機軌跡估計的同時,感知環(huán)境物體語義信息,構(gòu)建三維語義地圖,并基于此提出了無人機語義SLAM原型系統(tǒng)的方案。其次,針對目前基于深度學習的目標檢...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
各行各業(yè)中的無人機應用
中,常見的視覺傳感器包括單目相機,雙目相機和RGBD相機。沒有深度信息的單目相機雖然速度快,但是應用起來依賴的數(shù)學計算過程相對復雜;而雙目相機在近處應用雙目測距原理生成深度圖比單目相機相對便利一點,但是無法擺脫隨著距離增大,雙目效果嚴重退化的缺點;而RGBD相機利用結(jié)構(gòu)光或TOF來獲取深度,省去了深度的計算過程[3],計算量小,逐漸成為了視覺SLAM的主流傳感器。傳統(tǒng)的視覺SLAM系統(tǒng)用來建立未知環(huán)境空間結(jié)構(gòu)和占據(jù)信息,為智能機器人實現(xiàn)路徑規(guī)劃、自主導航和避障。視覺SLAM系統(tǒng)可以分為前端和后端,其結(jié)構(gòu)如圖1-2所示。圖1-2視覺SLAM結(jié)構(gòu)前端完成數(shù)據(jù)關(guān)聯(lián),相當于VO(視覺里程計),估算相鄰關(guān)鍵幀間的相機運動;后端主要對每個時刻視覺里程計的輸出結(jié)果進行優(yōu)化,得到最優(yōu)的位姿估計和地圖。語義SLAM以視覺SLAM技術(shù)為基礎(chǔ),將目標語義信息融入到視覺SLAM的各個環(huán)節(jié)中,前端VO部分利用語義信息代替特征點信息,簡化計算流程;而后端優(yōu)化部分則可以添加語義信息為新的系統(tǒng)觀測點,進行更全面的地圖點和軌跡優(yōu)化;在建圖環(huán)節(jié)則可以利用語義信息配合三維目標分割進行語義地圖的構(gòu)建,更好地指導機器人的后續(xù)路徑規(guī)劃和導航等功能。至今為止,視覺SLAM技術(shù)的相關(guān)發(fā)展已經(jīng)較為成熟,而語義SLAM因為提出時間較短,相關(guān)研究相對比較初步,但是對于旨在實現(xiàn)更高難度復雜任務的機器人系統(tǒng)而言,語義SLAM的實現(xiàn)是必不可少的。依靠精準的語義SLAM,機器人系統(tǒng)可以自主地實現(xiàn)更多更復雜的人機交互任務,對于實現(xiàn)機器人的全面智能化具有重大的研究意義和價值。從
第二章基于RGBD的無人機語義SLAM原型系統(tǒng)方案9第二章基于RGBD的無人機語義SLAM原型系統(tǒng)方案語義SLAM是由視覺SLAM引申而來,將目標檢測模塊獲取的環(huán)境物體語義信息融入到視覺SLAM的前端VO、重定位、后端優(yōu)化、回環(huán)檢測和建圖環(huán)節(jié)中,并對其中一個或者多個環(huán)節(jié)進行改進,從而提高視覺SLAM系統(tǒng)的性能。語義SLAM的模塊主要包括視覺SLAM算法、環(huán)境語義信息提娶三維目標分割和三維地圖生成模塊等,下面從視覺傳感器的選擇入手,闡述本文無人機語義SLAM系統(tǒng)的基礎(chǔ)方案。2.1視覺SLAM傳感器選擇視覺SLAM以各式各樣的視覺相機為主要傳感器來獲取環(huán)境中的信息。視覺傳感器相較于激光傳感器而言,性價比更高。至今為止,視覺SLAM系統(tǒng)中所用到的視覺傳感器主要分為三種,分別是單目、雙目和RGBD相機,不同種類的相機工作原理不同,性能也不同,所以適用的環(huán)境也不盡相同。單目相機根據(jù)小孔成像原理對環(huán)境中的視覺信息進行采集。單目相機結(jié)構(gòu)簡單,使用便捷,成本也最低,但是缺乏真實世界的尺度信息,并且會產(chǎn)生畸變,所以在使用之前常常需要事先進行標定,獲取相機的內(nèi)參對采集的圖像進行矯正。此外,對于視覺SLAM而言,除了進行標定之外,還需要通過三角測量等方法才能獲取圖點的深度距離信息,從一定程度上消耗了計算平臺的算力,不太適用于性能受限的嵌入式平臺。圖2-1單目相機帶來的尺度誤差雙目相機從結(jié)構(gòu)上類似于人類的雙目視覺結(jié)構(gòu),從實現(xiàn)原理上消除了單目相機的尺度不確定性。雙目相機可以理解為將兩個單目相機按照統(tǒng)一的幾何規(guī)則集成在了一起,其計算圖像深度信息的方式與單目相機有所不同,雙目相機通過兩
【參考文獻】:
期刊論文
[1]基于SSD算法的人臉目標檢測的研究[J]. 楊璐,吳陳. 計算機技術(shù)與發(fā)展. 2019(10)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的手勢識別初探[J]. 蔡娟,蔡堅勇,廖曉東,黃海濤,丁僑俊. 計算機系統(tǒng)應用. 2015(04)
碩士論文
[1]基于AKAZE算法的三維重建研究[D]. 夏宇.南京郵電大學 2019
[2]基于ROS與RGBD傳感器的地圖構(gòu)建方法研究[D]. 富裕.沈陽工業(yè)大學 2019
[3]基于計算機視覺的同步定位與三維建圖方法研究[D]. 李凈霖.哈爾濱工業(yè)大學 2019
[4]服務機器人室內(nèi)三維環(huán)境熱場建模及感知技術(shù)研究[D]. 劉雨.哈爾濱工業(yè)大學 2019
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像去噪和目標檢測與識別[D]. 王琪.西安電子科技大學 2019
[6]基于稠密視覺SLAM的無人機三維地圖快速重建研究[D]. 彭思遠.電子科技大學 2019
[7]基于視覺SLAM的語義地圖研究[D]. 常思雨.哈爾濱工業(yè)大學 2018
[8]基于深度學習的短視頻內(nèi)容分析算法研究[D]. 李夏南.哈爾濱工業(yè)大學 2018
[9]基于單目視覺與IMU結(jié)合的SLAM技術(shù)研究[D]. 李建禹.哈爾濱工業(yè)大學 2018
[10]基于環(huán)境語義信息的SLAM算法研究與實現(xiàn)[D]. 魏樂麒.西安電子科技大學 2018
本文編號:3577067
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
各行各業(yè)中的無人機應用
中,常見的視覺傳感器包括單目相機,雙目相機和RGBD相機。沒有深度信息的單目相機雖然速度快,但是應用起來依賴的數(shù)學計算過程相對復雜;而雙目相機在近處應用雙目測距原理生成深度圖比單目相機相對便利一點,但是無法擺脫隨著距離增大,雙目效果嚴重退化的缺點;而RGBD相機利用結(jié)構(gòu)光或TOF來獲取深度,省去了深度的計算過程[3],計算量小,逐漸成為了視覺SLAM的主流傳感器。傳統(tǒng)的視覺SLAM系統(tǒng)用來建立未知環(huán)境空間結(jié)構(gòu)和占據(jù)信息,為智能機器人實現(xiàn)路徑規(guī)劃、自主導航和避障。視覺SLAM系統(tǒng)可以分為前端和后端,其結(jié)構(gòu)如圖1-2所示。圖1-2視覺SLAM結(jié)構(gòu)前端完成數(shù)據(jù)關(guān)聯(lián),相當于VO(視覺里程計),估算相鄰關(guān)鍵幀間的相機運動;后端主要對每個時刻視覺里程計的輸出結(jié)果進行優(yōu)化,得到最優(yōu)的位姿估計和地圖。語義SLAM以視覺SLAM技術(shù)為基礎(chǔ),將目標語義信息融入到視覺SLAM的各個環(huán)節(jié)中,前端VO部分利用語義信息代替特征點信息,簡化計算流程;而后端優(yōu)化部分則可以添加語義信息為新的系統(tǒng)觀測點,進行更全面的地圖點和軌跡優(yōu)化;在建圖環(huán)節(jié)則可以利用語義信息配合三維目標分割進行語義地圖的構(gòu)建,更好地指導機器人的后續(xù)路徑規(guī)劃和導航等功能。至今為止,視覺SLAM技術(shù)的相關(guān)發(fā)展已經(jīng)較為成熟,而語義SLAM因為提出時間較短,相關(guān)研究相對比較初步,但是對于旨在實現(xiàn)更高難度復雜任務的機器人系統(tǒng)而言,語義SLAM的實現(xiàn)是必不可少的。依靠精準的語義SLAM,機器人系統(tǒng)可以自主地實現(xiàn)更多更復雜的人機交互任務,對于實現(xiàn)機器人的全面智能化具有重大的研究意義和價值。從
第二章基于RGBD的無人機語義SLAM原型系統(tǒng)方案9第二章基于RGBD的無人機語義SLAM原型系統(tǒng)方案語義SLAM是由視覺SLAM引申而來,將目標檢測模塊獲取的環(huán)境物體語義信息融入到視覺SLAM的前端VO、重定位、后端優(yōu)化、回環(huán)檢測和建圖環(huán)節(jié)中,并對其中一個或者多個環(huán)節(jié)進行改進,從而提高視覺SLAM系統(tǒng)的性能。語義SLAM的模塊主要包括視覺SLAM算法、環(huán)境語義信息提娶三維目標分割和三維地圖生成模塊等,下面從視覺傳感器的選擇入手,闡述本文無人機語義SLAM系統(tǒng)的基礎(chǔ)方案。2.1視覺SLAM傳感器選擇視覺SLAM以各式各樣的視覺相機為主要傳感器來獲取環(huán)境中的信息。視覺傳感器相較于激光傳感器而言,性價比更高。至今為止,視覺SLAM系統(tǒng)中所用到的視覺傳感器主要分為三種,分別是單目、雙目和RGBD相機,不同種類的相機工作原理不同,性能也不同,所以適用的環(huán)境也不盡相同。單目相機根據(jù)小孔成像原理對環(huán)境中的視覺信息進行采集。單目相機結(jié)構(gòu)簡單,使用便捷,成本也最低,但是缺乏真實世界的尺度信息,并且會產(chǎn)生畸變,所以在使用之前常常需要事先進行標定,獲取相機的內(nèi)參對采集的圖像進行矯正。此外,對于視覺SLAM而言,除了進行標定之外,還需要通過三角測量等方法才能獲取圖點的深度距離信息,從一定程度上消耗了計算平臺的算力,不太適用于性能受限的嵌入式平臺。圖2-1單目相機帶來的尺度誤差雙目相機從結(jié)構(gòu)上類似于人類的雙目視覺結(jié)構(gòu),從實現(xiàn)原理上消除了單目相機的尺度不確定性。雙目相機可以理解為將兩個單目相機按照統(tǒng)一的幾何規(guī)則集成在了一起,其計算圖像深度信息的方式與單目相機有所不同,雙目相機通過兩
【參考文獻】:
期刊論文
[1]基于SSD算法的人臉目標檢測的研究[J]. 楊璐,吳陳. 計算機技術(shù)與發(fā)展. 2019(10)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計算機學報. 2017(06)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的手勢識別初探[J]. 蔡娟,蔡堅勇,廖曉東,黃海濤,丁僑俊. 計算機系統(tǒng)應用. 2015(04)
碩士論文
[1]基于AKAZE算法的三維重建研究[D]. 夏宇.南京郵電大學 2019
[2]基于ROS與RGBD傳感器的地圖構(gòu)建方法研究[D]. 富裕.沈陽工業(yè)大學 2019
[3]基于計算機視覺的同步定位與三維建圖方法研究[D]. 李凈霖.哈爾濱工業(yè)大學 2019
[4]服務機器人室內(nèi)三維環(huán)境熱場建模及感知技術(shù)研究[D]. 劉雨.哈爾濱工業(yè)大學 2019
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的SAR圖像去噪和目標檢測與識別[D]. 王琪.西安電子科技大學 2019
[6]基于稠密視覺SLAM的無人機三維地圖快速重建研究[D]. 彭思遠.電子科技大學 2019
[7]基于視覺SLAM的語義地圖研究[D]. 常思雨.哈爾濱工業(yè)大學 2018
[8]基于深度學習的短視頻內(nèi)容分析算法研究[D]. 李夏南.哈爾濱工業(yè)大學 2018
[9]基于單目視覺與IMU結(jié)合的SLAM技術(shù)研究[D]. 李建禹.哈爾濱工業(yè)大學 2018
[10]基于環(huán)境語義信息的SLAM算法研究與實現(xiàn)[D]. 魏樂麒.西安電子科技大學 2018
本文編號:3577067
本文鏈接:http://sikaile.net/kejilunwen/hangkongsky/3577067.html
最近更新
教材專著