基于激光點云的復(fù)雜三維場景多態(tài)目標(biāo)語義分割技術(shù)研究
發(fā)布時間:2020-12-06 06:32
三維激光掃描系統(tǒng)以其穩(wěn)定的環(huán)境感知能力已成為獲取三維空間信息的一種重要手段,它能夠快速獲取大規(guī)模自然場景的三維點云數(shù)據(jù)。激光點云含有被測場景物體表面豐富的語義信息,具有海量、高密度以及高精度等特性,已成為用來理解、分析和語義解譯三維自然場景的一種主要數(shù)據(jù)類型,被廣泛應(yīng)用于城市規(guī)劃、無人駕駛、全球制圖、智慧交通、文物保護、虛擬現(xiàn)實以及基礎(chǔ)測繪等領(lǐng)域。近年來,基于三維點云數(shù)據(jù)的復(fù)雜場景多態(tài)目標(biāo)語義分割技術(shù)的研究也已取得長足的發(fā)展;然而,現(xiàn)有算法還存在如下幾個方面的問題:(1)過度依賴于人工定義的特征,提取語義類別單一;(2)數(shù)據(jù)預(yù)處理復(fù)雜,計算量大,算法復(fù)雜度高,自動化、智能化程度較低;(3)跨平臺性差,公開基準(zhǔn)數(shù)據(jù)集短缺;(4)激光點云通常只包括三維坐標(biāo)和反射強度信息,缺少豐富的光譜信息以及點與點之間的空間拓撲關(guān)系。另外,由于真實自然場景復(fù)雜,三維目標(biāo)之間存在不同程度的重疊、遮擋等現(xiàn)象,研究自動化、智能化、魯棒的復(fù)雜三維場景多態(tài)目標(biāo)語義分割技術(shù)及其在各個領(lǐng)域的應(yīng)用具有重要的理論價值和現(xiàn)實意義。本文針對復(fù)雜場景多態(tài)目標(biāo)的快速、高精度、自動語義分割技術(shù)展開研究,主要包括以下四個方面的內(nèi)容:1...
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:149 頁
【學(xué)位級別】:博士
【部分圖文】:
HuangJ-3DCNN卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
LiDAR 點云數(shù)據(jù)集(包括一個機載掃描數(shù)據(jù)和四個車載掃描數(shù)據(jù))均沒有公開,后續(xù)研究者無法對文中呈現(xiàn)的各位目標(biāo)的精度進行驗證。因此,不同的研究人員都致力于創(chuàng)建能夠直接使用非結(jié)構(gòu)化 3D 點云或網(wǎng)格的深層體系結(jié)構(gòu)。比如下面要介紹的 PointNet 和PointNet++。(2)PointNetPointnet 由斯坦福大學(xué)的 Charles 等人于 2017 年 4 月提出,屬于深度學(xué)習(xí)成功應(yīng)用于三維點云的一項開創(chuàng)性的工作,以原始點云為深度神經(jīng)網(wǎng)絡(luò)的輸入,為分類(classification)、構(gòu)件分割(part segmentation)和場景語義分割(semantic segmentation)提供了統(tǒng)一的體系結(jié)構(gòu)。圖 1.2 顯示了其網(wǎng)絡(luò)結(jié)構(gòu),包含分類和分割兩個子結(jié)構(gòu)。網(wǎng)絡(luò)輸入 n*3 的數(shù)據(jù),n就是采樣點的個數(shù),3 表示三維坐標(biāo)。經(jīng)過幾步多層感知器(Multi Layer Perceptrons, MLP)獲得 n*1024 維的采樣點特征,然后使用 max pooling 進行對稱操作得到 1024 維的整體特征(global feature)。其中在分類模型(Classification)中直接經(jīng)過幾層降維輸出 softmax 分類概率,而分割模型(Segmentation)中要將整體特征串接到采樣點特征之后再進行多層網(wǎng)絡(luò)輸出。
PointNet++是一種分層神經(jīng)網(wǎng)絡(luò),先對點云進行采樣(sampling)和區(qū)域劃分(grouping)然后在各個小區(qū)域內(nèi)遞歸地采用 PointNet 網(wǎng)絡(luò)進行特征提取,最后對點云的全局和局部特征進行融合(把全局特征矩陣與局部特征矩陣累加)。由于點云通常是在不同密度下采樣的,從而導(dǎo)致在均勻密度上訓(xùn)練的網(wǎng)絡(luò)的性能大大降低,為了解決非均勻點采樣問題,PointNet++提出了兩個新的集合抽象層,根據(jù)局部點密度智能地學(xué)習(xí)多尺度的特征,模型結(jié)構(gòu)如圖 1.3 所示。其重點就在于區(qū)域的劃分,即確定每個區(qū)域的中心位置和區(qū)域的半徑關(guān)于區(qū)域中心位置的選擇,采用了一種名為 farthest point sampling (FPS) algorithm 的采樣方法。而關(guān)于區(qū)域的半徑,提出了多尺度劃分(Multi-scale grouping, MSG)和多分辨率劃分(Multi-resolution grouping, MRG)兩種方法。前者計算量極大,因為點云數(shù)據(jù)本身屬于海量數(shù)據(jù),若一直變尺度地提取特征,特別是尺度較小時,時間成本會過高。而后者將從較低層提取的特征與通過 PointNet 處理局部區(qū)域中的原始點獲得的特征進行融合,這樣不但可以避免這種昂貴的計算,同時還保留了根據(jù)點的分布特性自適應(yīng)地聚合信息的能力。PointNet++在 ScanNet 數(shù)據(jù)集上取得了 73.9%的準(zhǔn)確率,但 ScanNet 為大規(guī)模 3D 室內(nèi)場景RGB-D 數(shù)據(jù)集,而非點云數(shù)據(jù)集,該模型沒有提供在 Stanford 2D-3D-S 上的分割結(jié)果。
本文編號:2900900
【文章來源】:戰(zhàn)略支援部隊信息工程大學(xué)河南省
【文章頁數(shù)】:149 頁
【學(xué)位級別】:博士
【部分圖文】:
HuangJ-3DCNN卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
LiDAR 點云數(shù)據(jù)集(包括一個機載掃描數(shù)據(jù)和四個車載掃描數(shù)據(jù))均沒有公開,后續(xù)研究者無法對文中呈現(xiàn)的各位目標(biāo)的精度進行驗證。因此,不同的研究人員都致力于創(chuàng)建能夠直接使用非結(jié)構(gòu)化 3D 點云或網(wǎng)格的深層體系結(jié)構(gòu)。比如下面要介紹的 PointNet 和PointNet++。(2)PointNetPointnet 由斯坦福大學(xué)的 Charles 等人于 2017 年 4 月提出,屬于深度學(xué)習(xí)成功應(yīng)用于三維點云的一項開創(chuàng)性的工作,以原始點云為深度神經(jīng)網(wǎng)絡(luò)的輸入,為分類(classification)、構(gòu)件分割(part segmentation)和場景語義分割(semantic segmentation)提供了統(tǒng)一的體系結(jié)構(gòu)。圖 1.2 顯示了其網(wǎng)絡(luò)結(jié)構(gòu),包含分類和分割兩個子結(jié)構(gòu)。網(wǎng)絡(luò)輸入 n*3 的數(shù)據(jù),n就是采樣點的個數(shù),3 表示三維坐標(biāo)。經(jīng)過幾步多層感知器(Multi Layer Perceptrons, MLP)獲得 n*1024 維的采樣點特征,然后使用 max pooling 進行對稱操作得到 1024 維的整體特征(global feature)。其中在分類模型(Classification)中直接經(jīng)過幾層降維輸出 softmax 分類概率,而分割模型(Segmentation)中要將整體特征串接到采樣點特征之后再進行多層網(wǎng)絡(luò)輸出。
PointNet++是一種分層神經(jīng)網(wǎng)絡(luò),先對點云進行采樣(sampling)和區(qū)域劃分(grouping)然后在各個小區(qū)域內(nèi)遞歸地采用 PointNet 網(wǎng)絡(luò)進行特征提取,最后對點云的全局和局部特征進行融合(把全局特征矩陣與局部特征矩陣累加)。由于點云通常是在不同密度下采樣的,從而導(dǎo)致在均勻密度上訓(xùn)練的網(wǎng)絡(luò)的性能大大降低,為了解決非均勻點采樣問題,PointNet++提出了兩個新的集合抽象層,根據(jù)局部點密度智能地學(xué)習(xí)多尺度的特征,模型結(jié)構(gòu)如圖 1.3 所示。其重點就在于區(qū)域的劃分,即確定每個區(qū)域的中心位置和區(qū)域的半徑關(guān)于區(qū)域中心位置的選擇,采用了一種名為 farthest point sampling (FPS) algorithm 的采樣方法。而關(guān)于區(qū)域的半徑,提出了多尺度劃分(Multi-scale grouping, MSG)和多分辨率劃分(Multi-resolution grouping, MRG)兩種方法。前者計算量極大,因為點云數(shù)據(jù)本身屬于海量數(shù)據(jù),若一直變尺度地提取特征,特別是尺度較小時,時間成本會過高。而后者將從較低層提取的特征與通過 PointNet 處理局部區(qū)域中的原始點獲得的特征進行融合,這樣不但可以避免這種昂貴的計算,同時還保留了根據(jù)點的分布特性自適應(yīng)地聚合信息的能力。PointNet++在 ScanNet 數(shù)據(jù)集上取得了 73.9%的準(zhǔn)確率,但 ScanNet 為大規(guī)模 3D 室內(nèi)場景RGB-D 數(shù)據(jù)集,而非點云數(shù)據(jù)集,該模型沒有提供在 Stanford 2D-3D-S 上的分割結(jié)果。
本文編號:2900900
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/2900900.html
最近更新
教材專著