基于特征融合與機(jī)器學(xué)習(xí)的RGB-D圖像識別技術(shù)研究
發(fā)布時(shí)間:2022-01-09 00:10
與傳統(tǒng)的基于二維圖像的識別相比,三維的圖像識別由于其引入的深度信息,使得其具有更高的準(zhǔn)確率和魯棒性。這是因?yàn)槿S的RGB-D圖像不僅包含了二維圖像的顏色、紋理信息,其中的深度圖像還包含了目標(biāo)的表面幾何信息。隨著Kinect、Xtion等三維體感設(shè)備的興起,RGB-D圖像的獲取越來越便捷,RGB-D圖像的識別技術(shù)也越來越成為機(jī)器視覺領(lǐng)域的研究熱點(diǎn)。另一方面,近年來機(jī)器學(xué)習(xí)在圖像識別領(lǐng)域取得了令人矚目的成績,特別是卷積神經(jīng)網(wǎng)絡(luò),在大規(guī)模數(shù)據(jù)集的圖像識別任務(wù)中取得了突破性的進(jìn)展;跈C(jī)器學(xué)習(xí)算法的RGB-D圖像識別成為了機(jī)器視覺中的熱點(diǎn)問題。針對以往RGB-D圖像的特征提取算法存在計(jì)算復(fù)雜、特征提取不充分以及特征信息冗余等問題,本文提出了一種RGB-D圖像的彩色-深度局部Gist特征提取算法。首先將RGB圖分解為R、G、B三個(gè)通道的圖,分別提取三個(gè)通道圖的局部Gist特征,同時(shí)提取深度圖的局部Gist特征,通過按行融合的方式組成RGB-D圖像的彩色-深度局部Gist特征。對彩色-深度局部Gist特征使用主成分分析法降維后,用K-means++算法聚類構(gòu)建RGB-D圖像的視覺詞典,最后基于支持...
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
橋梁的點(diǎn)云圖
Kinect獲取的RGB-D圖
GB-D 圖像的獲取與表示GB-D 圖像是由彩色的 RGB 圖像與深度圖像組合而成,其中 RGB 圖像是一種,RGB 表示一種紅、綠、藍(lán)三通道的映射空間[30]。三個(gè)顏色通道的定的函數(shù)關(guān)系,疊加組合可以產(chǎn)生豐富的色彩顯示。RGB 圖像中包含豐理、邊緣、色彩等信息,目前基于 RGB 圖像的識別算法也取得了很高的,但是由于 RGB 圖像的獲取方式限制,導(dǎo)致其成像時(shí)受光照明暗、顏色很大,在不同環(huán)境下對同一物體獲取的 RGB 圖像差別可能很大,這就導(dǎo)GB 圖像的識別算法魯棒性不高,抗干擾能力弱。GB-D 圖像的另一組成對象是深度圖,深度圖像的存儲形式是二維圖像,點(diǎn)的值是圖像中每點(diǎn)到深度傳感器的實(shí)際距離的映射。深度圖不包含物息,而是包含著物體表面的幾何信息與物體在場景的位置信息,通過深很快地將幾何結(jié)構(gòu)較復(fù)雜的物體區(qū)分開來,深度圖像是一種與彩色圖像。如下圖 2-1 是某茶杯的 RGB-D 圖中彩色圖與深度圖。
【參考文獻(xiàn)】:
期刊論文
[1]基于深度圖像與三維柵格離線映射的機(jī)械臂環(huán)境建模方法[J]. 李英立,趙憶文,王爭,張道輝,趙新剛. 控制與決策. 2020(07)
[2]機(jī)器學(xué)習(xí)中的PCA降維方法研究及其應(yīng)用[J]. 孫平安,王備戰(zhàn). 湖南工業(yè)大學(xué)學(xué)報(bào). 2019(01)
[3]基于Kinect傳感器的移動(dòng)機(jī)器人環(huán)境檢測方法[J]. 張博. 電子科技. 2018(07)
[4]基于SVM多分類的車牌相似字符識別方法研究[J]. 方玲玉,龔文友. 計(jì)算機(jī)與數(shù)字工程. 2017(07)
[5]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[6]基于機(jī)器視覺的圖像目標(biāo)識別方法綜述[J]. 張中良. 科技與創(chuàng)新. 2016(14)
[7]工業(yè)4.0讓智慧城市成為智能社會(huì)的載體[J]. 王喜文. 物聯(lián)網(wǎng)技術(shù). 2016(07)
[8]基于RGB特征與深度特征融合的物體識別算法[J]. 盧良鋒,謝志軍,葉宏武. 計(jì)算機(jī)工程. 2016(05)
[9]基于結(jié)構(gòu)光的三維點(diǎn)云重建方法研究[J]. 孫慶科,何云濤,陳瑞強(qiáng),江月松. 計(jì)算機(jī)應(yīng)用研究. 2016(09)
[10]面向智能交互的圖像識別技術(shù)綜述與展望[J]. 蔣樹強(qiáng),閔巍慶,王樹徽. 計(jì)算機(jī)研究與發(fā)展. 2016(01)
本文編號:3577545
【文章來源】:燕山大學(xué)河北省
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
橋梁的點(diǎn)云圖
Kinect獲取的RGB-D圖
GB-D 圖像的獲取與表示GB-D 圖像是由彩色的 RGB 圖像與深度圖像組合而成,其中 RGB 圖像是一種,RGB 表示一種紅、綠、藍(lán)三通道的映射空間[30]。三個(gè)顏色通道的定的函數(shù)關(guān)系,疊加組合可以產(chǎn)生豐富的色彩顯示。RGB 圖像中包含豐理、邊緣、色彩等信息,目前基于 RGB 圖像的識別算法也取得了很高的,但是由于 RGB 圖像的獲取方式限制,導(dǎo)致其成像時(shí)受光照明暗、顏色很大,在不同環(huán)境下對同一物體獲取的 RGB 圖像差別可能很大,這就導(dǎo)GB 圖像的識別算法魯棒性不高,抗干擾能力弱。GB-D 圖像的另一組成對象是深度圖,深度圖像的存儲形式是二維圖像,點(diǎn)的值是圖像中每點(diǎn)到深度傳感器的實(shí)際距離的映射。深度圖不包含物息,而是包含著物體表面的幾何信息與物體在場景的位置信息,通過深很快地將幾何結(jié)構(gòu)較復(fù)雜的物體區(qū)分開來,深度圖像是一種與彩色圖像。如下圖 2-1 是某茶杯的 RGB-D 圖中彩色圖與深度圖。
【參考文獻(xiàn)】:
期刊論文
[1]基于深度圖像與三維柵格離線映射的機(jī)械臂環(huán)境建模方法[J]. 李英立,趙憶文,王爭,張道輝,趙新剛. 控制與決策. 2020(07)
[2]機(jī)器學(xué)習(xí)中的PCA降維方法研究及其應(yīng)用[J]. 孫平安,王備戰(zhàn). 湖南工業(yè)大學(xué)學(xué)報(bào). 2019(01)
[3]基于Kinect傳感器的移動(dòng)機(jī)器人環(huán)境檢測方法[J]. 張博. 電子科技. 2018(07)
[4]基于SVM多分類的車牌相似字符識別方法研究[J]. 方玲玉,龔文友. 計(jì)算機(jī)與數(shù)字工程. 2017(07)
[5]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[6]基于機(jī)器視覺的圖像目標(biāo)識別方法綜述[J]. 張中良. 科技與創(chuàng)新. 2016(14)
[7]工業(yè)4.0讓智慧城市成為智能社會(huì)的載體[J]. 王喜文. 物聯(lián)網(wǎng)技術(shù). 2016(07)
[8]基于RGB特征與深度特征融合的物體識別算法[J]. 盧良鋒,謝志軍,葉宏武. 計(jì)算機(jī)工程. 2016(05)
[9]基于結(jié)構(gòu)光的三維點(diǎn)云重建方法研究[J]. 孫慶科,何云濤,陳瑞強(qiáng),江月松. 計(jì)算機(jī)應(yīng)用研究. 2016(09)
[10]面向智能交互的圖像識別技術(shù)綜述與展望[J]. 蔣樹強(qiáng),閔巍慶,王樹徽. 計(jì)算機(jī)研究與發(fā)展. 2016(01)
本文編號:3577545
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3577545.html
最近更新
教材專著