神經(jīng)網(wǎng)絡(luò)算法在物體姿態(tài)估計(jì)與圖像閾值分割中的應(yīng)用研究
發(fā)布時間:2021-08-27 18:16
隨著計(jì)算機(jī)科學(xué)的不斷進(jìn)步,神經(jīng)網(wǎng)絡(luò)算法已經(jīng)被應(yīng)用于社會發(fā)展的各個領(lǐng)域中。物體姿態(tài)估計(jì)和圖像閾值分割問題一直是人工智能領(lǐng)域的基本問題,使用神經(jīng)網(wǎng)絡(luò)算法對它們進(jìn)行研究是一個非常活躍的研究領(lǐng)域。在物體姿態(tài)估計(jì)問題中,獲取物體的類別和準(zhǔn)確的姿態(tài)信息是機(jī)器人完成與環(huán)境交互的重要前提;在圖像閾值分割問題中,精確的選取圖像分割的閾值,可以更好的把圖像的前景與背景分離,以便于對圖像進(jìn)行下一步操作。本文的研究內(nèi)容主要包括:1、物體姿態(tài)估計(jì)在近十年取得了令人矚目的進(jìn)展。但是,對于復(fù)雜場景下物體的姿態(tài)識別問題仍具有挑戰(zhàn)性。本文在VGG網(wǎng)絡(luò)的基礎(chǔ)上,提出一種改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)模型,采用多階段的方式對數(shù)據(jù)進(jìn)行特征提取。對于基于學(xué)習(xí)的方法而言,大量的數(shù)據(jù)是必要的,本文采用一種快速合成圖像數(shù)據(jù)的方法,可以在短時間內(nèi)生成大量合格的訓(xùn)練數(shù)據(jù)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的網(wǎng)絡(luò)模型可以更好的提取數(shù)據(jù)特征,獲得更加準(zhǔn)確的物體姿態(tài)估計(jì)結(jié)果。2、針對圖像閾值分割問題,提出了一種協(xié)作神經(jīng)動力學(xué)優(yōu)化算法,實(shí)現(xiàn)了二值優(yōu)化在圖像分割中的應(yīng)用。首先將基于閾值的圖像分割問題轉(zhuǎn)化為帶約束的二值優(yōu)化問題。在此基礎(chǔ)上,提出了一種結(jié)合反饋神經(jīng)網(wǎng)絡(luò)和粒子群算...
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖
西南大學(xué)碩士學(xué)位論文圖2.5卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖該算法包括七層的網(wǎng)絡(luò)架構(gòu),包含輸入、兩層卷積、兩層池化、一個全連接層和一個輸出層,其中的卷積層是最核心的部分用于提取數(shù)據(jù)特征,池化層可以降低數(shù)據(jù)維度及減少訓(xùn)練過程中的參數(shù),全連接層作為分類使用一般放在網(wǎng)絡(luò)的尾部。在該網(wǎng)絡(luò)中,輸入數(shù)據(jù)是一個32×32大小的數(shù)據(jù),利用6個5×5的卷積核獲得6圖2.6LeNet-5架構(gòu)圖.個規(guī)模是28×28的特征圖,即C1層;接下來利用池化進(jìn)行下采樣,采樣核的尺寸大小為2×2,從而得到S2,大小為14×14的特征圖;C3層利用為16個5×5的卷積核,獲得16個特征圖規(guī)模為10×10;接著仍然使用2×2大小的池化核來下采樣,運(yùn)算結(jié)果是16個5×5的特征圖,即S4層;C5層再次使用5×5的卷積,得到的特征圖尺寸為1×1,這樣采用120個卷積核,得到120×1的一維向量,再通過全連接層F6,可得到輸出層的10個分類單元。根據(jù)這個十個節(jié)點(diǎn)數(shù)值響應(yīng)大小,可以判斷輸入數(shù)據(jù)對應(yīng)是哪個數(shù)字。2.1.4池化層池化是卷積神經(jīng)網(wǎng)絡(luò)中一個重要操作,也可以稱之為下采樣。在卷積進(jìn)行特征提取得到的特征圖中,目標(biāo)任務(wù)的特征是有限的,而大多數(shù)是一些冗余的信息,14
西南大學(xué)碩士學(xué)位論文YCB[93]數(shù)據(jù)集是一個包含21個物體模型信息的位姿數(shù)據(jù)集,我們制作的數(shù)據(jù)集從YCB子集中選取八個物體進(jìn)行數(shù)據(jù)合成,挑選的物體如下圖3.2所示。為圖3.2數(shù)據(jù)合成選擇的YCB對象了避免人工的方式手動采集數(shù)據(jù),這里使用Blender工具進(jìn)行數(shù)據(jù)合成的操作。Blender是一個功能強(qiáng)大的三維建模軟件,可以很輕松的對物體的三維模型進(jìn)行渲染,從而可以實(shí)現(xiàn)模擬攝像機(jī)各個視角的功能,滿足實(shí)驗(yàn)數(shù)據(jù)的要求。合成結(jié)果如下圖3.3a所示。在實(shí)驗(yàn)階段,我們應(yīng)用了一個更簡單的策略,以HDR格式的圖片作為背景圖像,然后將物體對象的三維模型連同HDR圖像一起導(dǎo)入Blender,合成物體在復(fù)雜背景下的數(shù)據(jù),如下圖3.3b。(a)椅子和物體合成的示意圖(b)復(fù)雜背景下數(shù)據(jù)合成示意圖圖3.3Blender數(shù)據(jù)合成示意圖26
【參考文獻(xiàn)】:
期刊論文
[1]人工智能的學(xué)科定位與發(fā)展戰(zhàn)略[J]. 陳·巴特爾,蘇明. 國家教育行政學(xué)院學(xué)報(bào). 2019(08)
[2]關(guān)于圖像分割算法的研究[J]. 齊千慧,田益民,韓利利,張?zhí)旆f. 北京印刷學(xué)院學(xué)報(bào). 2019(07)
[3]圖像區(qū)域分割算法綜述及比較[J]. 王媛媛. 產(chǎn)業(yè)與科技論壇. 2019(13)
[4]深度學(xué)習(xí)方法研究綜述[J]. 高明旭,李靖,朱緒平,常延輝. 中國科技信息. 2019(10)
[5]人工智能藝術(shù)芻議[J]. 蘇露露,蘇峰. 大眾文藝. 2018(05)
[6]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[7]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[8]基于0-1規(guī)劃的快速圖像閾值分割算法[J]. 陳露晨. 計(jì)算機(jī)工程與應(yīng)用. 2012(10)
[9]人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展綜述[J]. 王輝. 電腦知識與技術(shù). 2008(30)
[10]通用并行神經(jīng)網(wǎng)絡(luò)模擬系統(tǒng)GP2N2S2[J]. 陳國良,熊焰,方祥. 小型微型計(jì)算機(jī)系統(tǒng). 1992(12)
博士論文
[1]深度卷積神經(jīng)網(wǎng)絡(luò)中反饋機(jī)制的計(jì)算建模及應(yīng)用研究[D]. 曹春水.中國科學(xué)技術(shù)大學(xué) 2018
本文編號:3366851
【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖
西南大學(xué)碩士學(xué)位論文圖2.5卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)圖該算法包括七層的網(wǎng)絡(luò)架構(gòu),包含輸入、兩層卷積、兩層池化、一個全連接層和一個輸出層,其中的卷積層是最核心的部分用于提取數(shù)據(jù)特征,池化層可以降低數(shù)據(jù)維度及減少訓(xùn)練過程中的參數(shù),全連接層作為分類使用一般放在網(wǎng)絡(luò)的尾部。在該網(wǎng)絡(luò)中,輸入數(shù)據(jù)是一個32×32大小的數(shù)據(jù),利用6個5×5的卷積核獲得6圖2.6LeNet-5架構(gòu)圖.個規(guī)模是28×28的特征圖,即C1層;接下來利用池化進(jìn)行下采樣,采樣核的尺寸大小為2×2,從而得到S2,大小為14×14的特征圖;C3層利用為16個5×5的卷積核,獲得16個特征圖規(guī)模為10×10;接著仍然使用2×2大小的池化核來下采樣,運(yùn)算結(jié)果是16個5×5的特征圖,即S4層;C5層再次使用5×5的卷積,得到的特征圖尺寸為1×1,這樣采用120個卷積核,得到120×1的一維向量,再通過全連接層F6,可得到輸出層的10個分類單元。根據(jù)這個十個節(jié)點(diǎn)數(shù)值響應(yīng)大小,可以判斷輸入數(shù)據(jù)對應(yīng)是哪個數(shù)字。2.1.4池化層池化是卷積神經(jīng)網(wǎng)絡(luò)中一個重要操作,也可以稱之為下采樣。在卷積進(jìn)行特征提取得到的特征圖中,目標(biāo)任務(wù)的特征是有限的,而大多數(shù)是一些冗余的信息,14
西南大學(xué)碩士學(xué)位論文YCB[93]數(shù)據(jù)集是一個包含21個物體模型信息的位姿數(shù)據(jù)集,我們制作的數(shù)據(jù)集從YCB子集中選取八個物體進(jìn)行數(shù)據(jù)合成,挑選的物體如下圖3.2所示。為圖3.2數(shù)據(jù)合成選擇的YCB對象了避免人工的方式手動采集數(shù)據(jù),這里使用Blender工具進(jìn)行數(shù)據(jù)合成的操作。Blender是一個功能強(qiáng)大的三維建模軟件,可以很輕松的對物體的三維模型進(jìn)行渲染,從而可以實(shí)現(xiàn)模擬攝像機(jī)各個視角的功能,滿足實(shí)驗(yàn)數(shù)據(jù)的要求。合成結(jié)果如下圖3.3a所示。在實(shí)驗(yàn)階段,我們應(yīng)用了一個更簡單的策略,以HDR格式的圖片作為背景圖像,然后將物體對象的三維模型連同HDR圖像一起導(dǎo)入Blender,合成物體在復(fù)雜背景下的數(shù)據(jù),如下圖3.3b。(a)椅子和物體合成的示意圖(b)復(fù)雜背景下數(shù)據(jù)合成示意圖圖3.3Blender數(shù)據(jù)合成示意圖26
【參考文獻(xiàn)】:
期刊論文
[1]人工智能的學(xué)科定位與發(fā)展戰(zhàn)略[J]. 陳·巴特爾,蘇明. 國家教育行政學(xué)院學(xué)報(bào). 2019(08)
[2]關(guān)于圖像分割算法的研究[J]. 齊千慧,田益民,韓利利,張?zhí)旆f. 北京印刷學(xué)院學(xué)報(bào). 2019(07)
[3]圖像區(qū)域分割算法綜述及比較[J]. 王媛媛. 產(chǎn)業(yè)與科技論壇. 2019(13)
[4]深度學(xué)習(xí)方法研究綜述[J]. 高明旭,李靖,朱緒平,常延輝. 中國科技信息. 2019(10)
[5]人工智能藝術(shù)芻議[J]. 蘇露露,蘇峰. 大眾文藝. 2018(05)
[6]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[7]深度學(xué)習(xí)研究綜述[J]. 孫志軍,薛磊,許陽明,王正. 計(jì)算機(jī)應(yīng)用研究. 2012(08)
[8]基于0-1規(guī)劃的快速圖像閾值分割算法[J]. 陳露晨. 計(jì)算機(jī)工程與應(yīng)用. 2012(10)
[9]人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展綜述[J]. 王輝. 電腦知識與技術(shù). 2008(30)
[10]通用并行神經(jīng)網(wǎng)絡(luò)模擬系統(tǒng)GP2N2S2[J]. 陳國良,熊焰,方祥. 小型微型計(jì)算機(jī)系統(tǒng). 1992(12)
博士論文
[1]深度卷積神經(jīng)網(wǎng)絡(luò)中反饋機(jī)制的計(jì)算建模及應(yīng)用研究[D]. 曹春水.中國科學(xué)技術(shù)大學(xué) 2018
本文編號:3366851
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3366851.html
最近更新
教材專著