物體分割與識別方法的研究和實(shí)現(xiàn)
本文選題:物體分割 切入點(diǎn):物體識別 出處:《南京大學(xué)》2017年碩士論文
【摘要】:靜態(tài)圖片中物體的分割和識別是計(jì)算機(jī)視覺任務(wù)中兩個(gè)非常重要的話題,二者之間緊密聯(lián)系,彼此可以相互利用。然而對靜態(tài)圖片進(jìn)行像素級的分割是一件很有難度的任務(wù),這是因?yàn)楝F(xiàn)實(shí)中拍攝的照片往往受到光照和噪聲的影響,除此以外,圖片的背景有時(shí)也會(huì)很復(fù)雜,可能會(huì)和要分割的物體在顏色和紋理上相似。另一方面,對于靜態(tài)圖片的物體識別,目前很多方法都是基于滑動(dòng)窗口+物體特征+分類器這種組合,該方法主要的缺點(diǎn)在于需要不斷通過滑動(dòng)窗口來掃描整張圖片,然后對每一個(gè)窗口進(jìn)行分類,所以會(huì)導(dǎo)致速度很慢。為了解決這些問題,我們先后設(shè)計(jì)了幾種能夠?qū)o態(tài)圖片中物體進(jìn)行分割和識別的解決方案并進(jìn)行了實(shí)驗(yàn)和對比分析。我們首先提出一個(gè)交互的分割方法,該方法基于Adaboost的分類思想,把超像素作為被處理的單元進(jìn)行分類,而不再是單個(gè)像素,用戶只需要提供少量的樣本種子點(diǎn)即可。在該方法的基礎(chǔ)上,我們結(jié)合了人體的姿勢信息,從而可以對靜態(tài)圖片中的人體進(jìn)行自動(dòng)化分割,它可以對圖片中人體的任意姿勢進(jìn)行分割,相較于一些需要通過人臉來定位人體位置再進(jìn)行人體分割的方法,我們的方法不僅可以處理人體正面,也可以處理側(cè)面和背面。此外,我們還利用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行物體分割,該框架由兩個(gè)神經(jīng)網(wǎng)絡(luò)組成,其中定位網(wǎng)絡(luò)負(fù)責(zé)定位圖片中物體的位置,分割網(wǎng)絡(luò)則負(fù)責(zé)對圖片進(jìn)行分割。對于以上得到的分割結(jié)果,往往會(huì)比較粗糙,我們使用了兩種方法來進(jìn)行優(yōu)化,分別是高斯背景建模和bayse matting,其中我們對bayse matting算法進(jìn)行了改進(jìn)。對于物體識別任務(wù),我們借鑒了基于區(qū)域的物體識別方法,即利用圖割先對圖片分割成多個(gè)區(qū)域,然后不斷合并相似的區(qū)域,最后對得到的每一個(gè)區(qū)域進(jìn)行分類。對于單個(gè)區(qū)域內(nèi)的物體分類,我們分別使用HOG和CNN兩種方式進(jìn)行特征提取,再用SVM來進(jìn)行訓(xùn)練,后者達(dá)到了更好的效果。但CNN提取特征的方式需要對每個(gè)區(qū)域進(jìn)行一次卷積過程,所以很耗費(fèi)時(shí)間,因此我們又參考了 FastRCNN的方法,在卷積層后面加入一個(gè)池化層,從而只需對整張圖片進(jìn)行一次卷積過程,該方法大大縮短了運(yùn)行時(shí)間。最后我們在多個(gè)廣泛使用的數(shù)據(jù)集上完成了物體分割和識別的多項(xiàng)實(shí)驗(yàn),我們的方法在準(zhǔn)確率和性能上都取得了不錯(cuò)的效果。
[Abstract]:The segmentation and recognition of objects in static images are two very important topics in the task of computer vision. They are closely related and can be used each other.However, it is a difficult task to segment static images at the pixel level, because the pictures taken in reality are often affected by illumination and noise. Besides, the background of the images is sometimes very complex.May be similar to the object to be segmented in color and texture.On the other hand, for the object recognition of static images, many methods are based on the combination of sliding window object feature classifier. The main disadvantage of this method is the need to scan the whole picture through sliding window.Each window is then sorted, so the speed is slow.In order to solve these problems, we have designed several solutions for segmentation and recognition of objects in static images, and carried out experiments and comparative analysis.We first propose an interactive segmentation method, which is based on the idea of Adaboost, and classifies super-pixels as processed units instead of single pixels. Users only need to provide a small number of sample seed points.On the basis of this method, we combine the posture information of human body, so we can automatically segment the human body in the static picture, and it can segment any pose of the human body in the picture.Compared with some methods which need to locate the position of human body by human face, our method can not only deal with the front of the human body, but also deal with the side and back.In addition, we use convolution neural network to segment objects. The framework consists of two neural networks, in which the location network is responsible for locating the position of the object in the picture, and the segmentation network is responsible for the image segmentation.For the above segmentation results, often rough, we use two methods to optimize, namely Gao Si background modeling and bayse matting, in which we improve the bayse matting algorithm.For the object recognition task, we draw lessons from the area-based object recognition method, that is, the image is divided into several regions by graph cutting, and then the similar regions are continuously merged, and finally each region is classified.For the classification of objects in a single region, we use HOG and CNN for feature extraction, and then use SVM for training, the latter achieves better results.But the way CNN extracts features requires a convolution process for each region, so it's time-consuming, so we refer to the FastRCNN method and add a pool layer after the convolution layer.Thus, only one convolution process is needed for the whole picture, and the running time is greatly reduced.Finally, we have completed many experiments of object segmentation and recognition on a number of widely used datasets, and our method has achieved good results in accuracy and performance.
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 代松;李偉生;;基于親和傳遞聚類的多類物體識別方法[J];計(jì)算機(jī)工程;2009年14期
2 鄒利華;;三種基于特征的物體識別算法對比與分析[J];軟件導(dǎo)刊;2010年05期
3 連靈;游旭群;;三維物體識別的心理表征:角度依賴還是角度獨(dú)立[J];心理學(xué)報(bào);2011年09期
4 王喜順;劉曦;史忠植;隋紅建;;一種基于特征整合理論的物體識別模型(英文)[J];中國科學(xué)院研究生院學(xué)報(bào);2012年03期
5 胡敏;齊梅;王曉華;許良鳳;;基于顯著區(qū)域詞袋模型的物體識別方法[J];電子測量與儀器學(xué)報(bào);2013年07期
6 余少波;鞠發(fā)平;肖英明;;物體識別不變性方法比較分析(Ⅱ)——解析方法[J];海軍工程學(xué)院學(xué)報(bào);1993年01期
7 曾建超,柳慧群,林學(xué);基于規(guī)則的物體識別定位方法[J];高技術(shù)通訊;1995年04期
8 李育賢,王洪波,趙莉;二維物體識別的暫態(tài)混沌神經(jīng)網(wǎng)絡(luò)方法[J];陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年01期
9 邵潔;董楠;;基于相關(guān)向量機(jī)的物體識別[J];上海電力學(xué)院學(xué)報(bào);2011年02期
10 楊雄;彭剛;徐濤;劉利;蘭遠(yuǎn)東;;物體識別的精神物理學(xué)實(shí)驗(yàn)測試[J];惠州學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年03期
相關(guān)會(huì)議論文 前10條
1 陳柘;趙榮椿;;幾何不變性及其在3D物體識別中的應(yīng)用[A];信號與信息處理技術(shù)——第一屆信號與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
2 連靈;張敏;;三維物體識別的心理表征:角度依賴還是角度獨(dú)立[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識和功能——中國心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
3 周程;吳飛;莊越挺;;基于層次反饋機(jī)制的物體識別[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
4 孫彥良;任衍具;;真實(shí)場景中朝向和背景對物體識別的影響[A];第十二屆全國心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
5 郭明瑋;朱明清;趙宇宙;王建;陳宗海;;基于生物視覺的物體識別方法研究現(xiàn)狀分析[A];第13屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會(huì)論文集[C];2011年
6 艾浩軍;朱榮;張敏;李俊;方禹;王紅霞;;基于SIFT尺度分量的兩級匹配物體識別算法研究[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
7 熊英;馬惠敏;;SIFT特征在三維物體識別中的應(yīng)用[A];圖像圖形技術(shù)研究與應(yīng)用2009——第四屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年
8 魯?shù)?姜志國;;基于圖元檢測的物體識別方法研究[A];全國第一屆信號處理學(xué)術(shù)會(huì)議暨中國高科技產(chǎn)業(yè)化研究會(huì)信號處理分會(huì)籌備工作委員會(huì)第三次工作會(huì)議?痆C];2007年
9 杜建洪;梁子長;;車輛走向定位技術(shù)的研究[A];通信理論與信號處理新進(jìn)展——2005年通信理論與信號處理年會(huì)論文集[C];2005年
10 宋廣青;高莉;孫秀萍;劉新民;;物體識別實(shí)驗(yàn)在東莨菪堿致大鼠學(xué)習(xí)記憶障礙中的應(yīng)用[A];2013年全國老年性癡呆與相關(guān)疾病學(xué)術(shù)會(huì)議論文匯編[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 陸王天宇;受生物啟發(fā)的物體識別算法研究[D];復(fù)旦大學(xué);2013年
2 王靜;視網(wǎng)膜假體中人工視覺信息處理及優(yōu)化表達(dá)研究[D];上海交通大學(xué);2014年
3 齊勇剛;基于草圖和邊緣的物體識別[D];北京郵電大學(xué);2015年
4 黃穎;基于圖理論的圖像處理與物體識別算法的研究[D];電子科技大學(xué);2012年
5 劉光燦;基于機(jī)器學(xué)習(xí)的物體識別[D];上海交通大學(xué);2013年
6 徐勝;三維物體識別研究[D];電子科技大學(xué);2010年
7 王興剛;物體識別中的形狀建模和弱監(jiān)督學(xué)習(xí)[D];華中科技大學(xué);2014年
8 王利明;機(jī)器視覺中物體識別方法的研究與探討[D];復(fù)旦大學(xué);2009年
9 彭紹武;基于形狀與語義建模的物體識別[D];華中科技大學(xué);2009年
10 陶維東;非面孔物體識別倒置效應(yīng)[D];西南大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 周淼;物體識別中與特征整合相關(guān)的腦電活動(dòng)研究[D];電子科技大學(xué);2012年
2 劉杰;小型地面移動(dòng)機(jī)器人視覺圖像特征提取[D];新疆大學(xué);2015年
3 王沁波;基于分層結(jié)構(gòu)的多物體圖像識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
4 李元輝;換墊料應(yīng)激損害大鼠新穎物體識別記憶再激活后提取及其膽堿能受體機(jī)制[D];南華大學(xué);2015年
5 李額;Apelin-13改善強(qiáng)迫游泳應(yīng)激誘導(dǎo)大鼠新穎物體識別記憶損傷[D];南華大學(xué);2015年
6 劉苗苗;基于2D和3D SIFT特征融合的一般物體識別算法研究[D];東南大學(xué);2015年
7 程玉立;面向工業(yè)應(yīng)用的機(jī)器人手眼標(biāo)定與物體定位[D];浙江大學(xué);2016年
8 周楠釗;基于SIFT特征的物體識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘭州大學(xué);2016年
9 陳佳洲;室內(nèi)場景物體同時(shí)識別與建模[D];廣東工業(yè)大學(xué);2016年
10 廉彬;長期母嬰分離對大鼠成年后新異性物體識別和社會(huì)性識別的影響[D];西南大學(xué);2016年
,本文編號:1724998
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1724998.html