基于激光點云的復(fù)雜三維場景多態(tài)目標(biāo)語義分割技術(shù)研究

發(fā)布時間：2020-12-06 06:32

　　三維激光掃描系統(tǒng)以其穩(wěn)定的環(huán)境感知能力已成為獲取三維空間信息的一種重要手段,它能夠快速獲取大規(guī)模自然場景的三維點云數(shù)據(jù)。激光點云含有被測場景物體表面豐富的語義信息,具有海量、高密度以及高精度等特性,已成為用來理解、分析和語義解譯三維自然場景的一種主要數(shù)據(jù)類型,被廣泛應(yīng)用于城市規(guī)劃、無人駕駛、全球制圖、智慧交通、文物保護、虛擬現(xiàn)實以及基礎(chǔ)測繪等領(lǐng)域。近年來,基于三維點云數(shù)據(jù)的復(fù)雜場景多態(tài)目標(biāo)語義分割技術(shù)的研究也已取得長足的發(fā)展;然而,現(xiàn)有算法還存在如下幾個方面的問題:（1）過度依賴于人工定義的特征,提取語義類別單一;（2）數(shù)據(jù)預(yù)處理復(fù)雜,計算量大,算法復(fù)雜度高,自動化、智能化程度較低;（3）跨平臺性差,公開基準(zhǔn)數(shù)據(jù)集短缺;（4）激光點云通常只包括三維坐標(biāo)和反射強度信息,缺少豐富的光譜信息以及點與點之間的空間拓撲關(guān)系。另外,由于真實自然場景復(fù)雜,三維目標(biāo)之間存在不同程度的重疊、遮擋等現(xiàn)象,研究自動化、智能化、魯棒的復(fù)雜三維場景多態(tài)目標(biāo)語義分割技術(shù)及其在各個領(lǐng)域的應(yīng)用具有重要的理論價值和現(xiàn)實意義。本文針對復(fù)雜場景多態(tài)目標(biāo)的快速、高精度、自動語義分割技術(shù)展開研究,主要包括以下四個方面的內(nèi)容:1...

【文章來源】：戰(zhàn)略支援部隊信息工程大學(xué)河南省

【文章頁數(shù)】：149 頁

【學(xué)位級別】：博士

【部分圖文】：

HuangJ-3DCNN卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

架構(gòu)圖,架構(gòu)

LiDAR 點云數(shù)據(jù)集（包括一個機載掃描數(shù)據(jù)和四個車載掃描數(shù)據(jù)）均沒有公開，后續(xù)研究者無法對文中呈現(xiàn)的各位目標(biāo)的精度進行驗證。因此，不同的研究人員都致力于創(chuàng)建能夠直接使用非結(jié)構(gòu)化 3D 點云或網(wǎng)格的深層體系結(jié)構(gòu)。比如下面要介紹的 PointNet 和PointNet++。（2）PointNetPointnet 由斯坦福大學(xué)的 Charles 等人于 2017 年 4 月提出，屬于深度學(xué)習(xí)成功應(yīng)用于三維點云的一項開創(chuàng)性的工作，以原始點云為深度神經(jīng)網(wǎng)絡(luò)的輸入，為分類（classification）、構(gòu)件分割（part segmentation）和場景語義分割（semantic segmentation）提供了統(tǒng)一的體系結(jié)構(gòu)。圖 1.2 顯示了其網(wǎng)絡(luò)結(jié)構(gòu)，包含分類和分割兩個子結(jié)構(gòu)。網(wǎng)絡(luò)輸入 n*3 的數(shù)據(jù)，n就是采樣點的個數(shù)，3 表示三維坐標(biāo)。經(jīng)過幾步多層感知器(Multi Layer Perceptrons, MLP)獲得 n*1024 維的采樣點特征，然后使用 max pooling 進行對稱操作得到 1024 維的整體特征（global feature）。其中在分類模型（Classification）中直接經(jīng)過幾層降維輸出 softmax 分類概率，而分割模型（Segmentation）中要將整體特征串接到采樣點特征之后再進行多層網(wǎng)絡(luò)輸出。

網(wǎng)絡(luò)結(jié)構(gòu)圖,網(wǎng)絡(luò)結(jié)構(gòu)

PointNet++是一種分層神經(jīng)網(wǎng)絡(luò)，先對點云進行采樣(sampling)和區(qū)域劃分(grouping)然后在各個小區(qū)域內(nèi)遞歸地采用 PointNet 網(wǎng)絡(luò)進行特征提取，最后對點云的全局和局部特征進行融合（把全局特征矩陣與局部特征矩陣累加）。由于點云通常是在不同密度下采樣的，從而導(dǎo)致在均勻密度上訓(xùn)練的網(wǎng)絡(luò)的性能大大降低，為了解決非均勻點采樣問題，PointNet++提出了兩個新的集合抽象層，根據(jù)局部點密度智能地學(xué)習(xí)多尺度的特征，模型結(jié)構(gòu)如圖 1.3 所示。其重點就在于區(qū)域的劃分，即確定每個區(qū)域的中心位置和區(qū)域的半徑關(guān)于區(qū)域中心位置的選擇，采用了一種名為 farthest point sampling (FPS) algorithm 的采樣方法。而關(guān)于區(qū)域的半徑，提出了多尺度劃分（Multi-scale grouping, MSG）和多分辨率劃分（Multi-resolution grouping, MRG）兩種方法。前者計算量極大，因為點云數(shù)據(jù)本身屬于海量數(shù)據(jù)，若一直變尺度地提取特征，特別是尺度較小時，時間成本會過高。而后者將從較低層提取的特征與通過 PointNet 處理局部區(qū)域中的原始點獲得的特征進行融合，這樣不但可以避免這種昂貴的計算，同時還保留了根據(jù)點的分布特性自適應(yīng)地聚合信息的能力。PointNet++在 ScanNet 數(shù)據(jù)集上取得了 73.9%的準(zhǔn)確率，但 ScanNet 為大規(guī)模 3D 室內(nèi)場景RGB-D 數(shù)據(jù)集，而非點云數(shù)據(jù)集，該模型沒有提供在 Stanford 2D-3D-S 上的分割結(jié)果。

本文編號：2900900

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/dianzigongchenglunwen/2900900.html

上一篇：外場條件下InAs/GaAs量子點的熒光光譜研究
下一篇：像散激光擴束準(zhǔn)直光學(xué)系統(tǒng)設(shè)計研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于激光點云的復(fù)雜三維場景多態(tài)目標(biāo)語義分割技術(shù)研究