基于雙目視覺的三維語義地圖構(gòu)建
發(fā)布時間:2021-10-07 23:55
近年來,隨著計算機硬件水平的提高和人工智能技術(shù)的發(fā)展,智能機器人在多種場景中得到應用,如工業(yè)機器人、掃地機器人等。對環(huán)境的感知與理解是智能機器人進行自主探索、行為決策、人機交互等任務的基礎(chǔ)。機器人一般通過激光雷達、攝像機等傳感器捕捉周邊環(huán)境信息,使用算法進行分析,最后實現(xiàn)對環(huán)境的理解。如何利用圖像中視覺數(shù)據(jù)使機器人擬人化地感知環(huán)境且進行決策是計算機視覺領(lǐng)域中熱門的研究問題,針對這個問題,本文提出了結(jié)合雙目視覺SLAM技術(shù)與語義分割技術(shù)的三維語義地圖構(gòu)建方法,使智能機器人可以根據(jù)相機圖片構(gòu)建三維語義地圖,幫助其更好地理解環(huán)境信息,更智能化地進行自主工作。本文以基于雙目視覺信息的三維語義地圖構(gòu)建方法為研究目標,首先對語義分割技術(shù)進行研究,針對傳統(tǒng)語義分割神經(jīng)網(wǎng)絡(luò)模型在分割效率和精度方面存在的不足,分析了高效神經(jīng)網(wǎng)絡(luò)的設(shè)計方法。結(jié)合分解卷積、殘差連接、卷積通道重排序和多尺度膨脹卷積的方法設(shè)計了網(wǎng)絡(luò)卷積單元,利用多尺度金字塔級聯(lián)結(jié)構(gòu)構(gòu)建基于注意力機制的解碼器,組成實時語義分割神經(jīng)網(wǎng)絡(luò)模型。通過實驗對比分析,證明了該語義分割網(wǎng)絡(luò)在參數(shù)量、分割精度和運行速度上都有較好的表現(xiàn),在語義分割任務的精度要...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
實例語義地圖[25]
哈爾濱工業(yè)大學工程碩士學位論文-9-圖像進行處理,面對高分辨率圖像會導致網(wǎng)絡(luò)無法進行有效的運算處理,計算緩慢。卷積神經(jīng)網(wǎng)絡(luò)是在計算機視覺和圖像處理領(lǐng)域中應用最為廣泛和成功的模型,最開始在手寫數(shù)字的研究中取得了較高的識別準確率,后續(xù)被推廣到其他分割、識別、跟蹤等領(lǐng)域廣泛應用。與傳統(tǒng)的神經(jīng)元不同,傳統(tǒng)神經(jīng)元的計算通常是二維的,卷積輸出也是二維的向量,而卷積神經(jīng)元多了卷積通道的維度,可以將多通道的輸入的二維圖像進行卷積,得到多通道的卷積特征圖。卷積神經(jīng)網(wǎng)絡(luò)通常包含有輸入層、卷積層、下采樣層、全連接層、輸出層等,其結(jié)構(gòu)組成如圖2-1所示。圖2-1卷積神經(jīng)網(wǎng)絡(luò)圖2-1各層網(wǎng)絡(luò)作用如下:(1)卷積層:在卷積層中,卷積核對上一層傳來的特征圖進行操作,得到輸出的特征圖,卷積操作如圖2-2所示。圖2-2卷積操作卷積核中的參數(shù)值是網(wǎng)絡(luò)訓練的核心,不同參數(shù)的卷積核對特征圖進行卷積后得到的特征圖也完全不同,因此參數(shù)的訓練調(diào)整的過程就是網(wǎng)絡(luò)學習的過程。卷積核卷積會導致圖片維度發(fā)生變化,為此通常在輸入的特征圖周圍加上和卷積核寬度大小相對應的值進行擴充,稱為padding。卷積核的卷積操作體現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的不同之處,由于卷積核大小通常是固定的并且遠遠小于輸入的特征圖的分辨率,因此每次卷積中上一層的特征圖中只有部分區(qū)域的特征會被聚集且傳到下一層的對應位置,實現(xiàn)了神經(jīng)網(wǎng)絡(luò)的局部連接,有效保證了網(wǎng)絡(luò)信息的傳遞,對比全連接的方法計算量和參數(shù)量都大大
哈爾濱工業(yè)大學工程碩士學位論文-9-圖像進行處理,面對高分辨率圖像會導致網(wǎng)絡(luò)無法進行有效的運算處理,計算緩慢。卷積神經(jīng)網(wǎng)絡(luò)是在計算機視覺和圖像處理領(lǐng)域中應用最為廣泛和成功的模型,最開始在手寫數(shù)字的研究中取得了較高的識別準確率,后續(xù)被推廣到其他分割、識別、跟蹤等領(lǐng)域廣泛應用。與傳統(tǒng)的神經(jīng)元不同,傳統(tǒng)神經(jīng)元的計算通常是二維的,卷積輸出也是二維的向量,而卷積神經(jīng)元多了卷積通道的維度,可以將多通道的輸入的二維圖像進行卷積,得到多通道的卷積特征圖。卷積神經(jīng)網(wǎng)絡(luò)通常包含有輸入層、卷積層、下采樣層、全連接層、輸出層等,其結(jié)構(gòu)組成如圖2-1所示。圖2-1卷積神經(jīng)網(wǎng)絡(luò)圖2-1各層網(wǎng)絡(luò)作用如下:(1)卷積層:在卷積層中,卷積核對上一層傳來的特征圖進行操作,得到輸出的特征圖,卷積操作如圖2-2所示。圖2-2卷積操作卷積核中的參數(shù)值是網(wǎng)絡(luò)訓練的核心,不同參數(shù)的卷積核對特征圖進行卷積后得到的特征圖也完全不同,因此參數(shù)的訓練調(diào)整的過程就是網(wǎng)絡(luò)學習的過程。卷積核卷積會導致圖片維度發(fā)生變化,為此通常在輸入的特征圖周圍加上和卷積核寬度大小相對應的值進行擴充,稱為padding。卷積核的卷積操作體現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的不同之處,由于卷積核大小通常是固定的并且遠遠小于輸入的特征圖的分辨率,因此每次卷積中上一層的特征圖中只有部分區(qū)域的特征會被聚集且傳到下一層的對應位置,實現(xiàn)了神經(jīng)網(wǎng)絡(luò)的局部連接,有效保證了網(wǎng)絡(luò)信息的傳遞,對比全連接的方法計算量和參數(shù)量都大大
本文編號:3423027
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
實例語義地圖[25]
哈爾濱工業(yè)大學工程碩士學位論文-9-圖像進行處理,面對高分辨率圖像會導致網(wǎng)絡(luò)無法進行有效的運算處理,計算緩慢。卷積神經(jīng)網(wǎng)絡(luò)是在計算機視覺和圖像處理領(lǐng)域中應用最為廣泛和成功的模型,最開始在手寫數(shù)字的研究中取得了較高的識別準確率,后續(xù)被推廣到其他分割、識別、跟蹤等領(lǐng)域廣泛應用。與傳統(tǒng)的神經(jīng)元不同,傳統(tǒng)神經(jīng)元的計算通常是二維的,卷積輸出也是二維的向量,而卷積神經(jīng)元多了卷積通道的維度,可以將多通道的輸入的二維圖像進行卷積,得到多通道的卷積特征圖。卷積神經(jīng)網(wǎng)絡(luò)通常包含有輸入層、卷積層、下采樣層、全連接層、輸出層等,其結(jié)構(gòu)組成如圖2-1所示。圖2-1卷積神經(jīng)網(wǎng)絡(luò)圖2-1各層網(wǎng)絡(luò)作用如下:(1)卷積層:在卷積層中,卷積核對上一層傳來的特征圖進行操作,得到輸出的特征圖,卷積操作如圖2-2所示。圖2-2卷積操作卷積核中的參數(shù)值是網(wǎng)絡(luò)訓練的核心,不同參數(shù)的卷積核對特征圖進行卷積后得到的特征圖也完全不同,因此參數(shù)的訓練調(diào)整的過程就是網(wǎng)絡(luò)學習的過程。卷積核卷積會導致圖片維度發(fā)生變化,為此通常在輸入的特征圖周圍加上和卷積核寬度大小相對應的值進行擴充,稱為padding。卷積核的卷積操作體現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的不同之處,由于卷積核大小通常是固定的并且遠遠小于輸入的特征圖的分辨率,因此每次卷積中上一層的特征圖中只有部分區(qū)域的特征會被聚集且傳到下一層的對應位置,實現(xiàn)了神經(jīng)網(wǎng)絡(luò)的局部連接,有效保證了網(wǎng)絡(luò)信息的傳遞,對比全連接的方法計算量和參數(shù)量都大大
哈爾濱工業(yè)大學工程碩士學位論文-9-圖像進行處理,面對高分辨率圖像會導致網(wǎng)絡(luò)無法進行有效的運算處理,計算緩慢。卷積神經(jīng)網(wǎng)絡(luò)是在計算機視覺和圖像處理領(lǐng)域中應用最為廣泛和成功的模型,最開始在手寫數(shù)字的研究中取得了較高的識別準確率,后續(xù)被推廣到其他分割、識別、跟蹤等領(lǐng)域廣泛應用。與傳統(tǒng)的神經(jīng)元不同,傳統(tǒng)神經(jīng)元的計算通常是二維的,卷積輸出也是二維的向量,而卷積神經(jīng)元多了卷積通道的維度,可以將多通道的輸入的二維圖像進行卷積,得到多通道的卷積特征圖。卷積神經(jīng)網(wǎng)絡(luò)通常包含有輸入層、卷積層、下采樣層、全連接層、輸出層等,其結(jié)構(gòu)組成如圖2-1所示。圖2-1卷積神經(jīng)網(wǎng)絡(luò)圖2-1各層網(wǎng)絡(luò)作用如下:(1)卷積層:在卷積層中,卷積核對上一層傳來的特征圖進行操作,得到輸出的特征圖,卷積操作如圖2-2所示。圖2-2卷積操作卷積核中的參數(shù)值是網(wǎng)絡(luò)訓練的核心,不同參數(shù)的卷積核對特征圖進行卷積后得到的特征圖也完全不同,因此參數(shù)的訓練調(diào)整的過程就是網(wǎng)絡(luò)學習的過程。卷積核卷積會導致圖片維度發(fā)生變化,為此通常在輸入的特征圖周圍加上和卷積核寬度大小相對應的值進行擴充,稱為padding。卷積核的卷積操作體現(xiàn)了卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的不同之處,由于卷積核大小通常是固定的并且遠遠小于輸入的特征圖的分辨率,因此每次卷積中上一層的特征圖中只有部分區(qū)域的特征會被聚集且傳到下一層的對應位置,實現(xiàn)了神經(jīng)網(wǎng)絡(luò)的局部連接,有效保證了網(wǎng)絡(luò)信息的傳遞,對比全連接的方法計算量和參數(shù)量都大大
本文編號:3423027
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3423027.html
最近更新
教材專著