基于卷積神經(jīng)網(wǎng)絡(luò)的電商圖片物體識(shí)別
本文選題:物體識(shí)別 + 卷積神經(jīng)網(wǎng)絡(luò); 參考:《電子科技大學(xué)》2016年碩士論文
【摘要】:電子商務(wù)自1999年在中國(guó)出現(xiàn)以來(lái),飛速發(fā)展。中國(guó)電子商務(wù)市場(chǎng)到2013年末,交易規(guī)模達(dá)到了10.2萬(wàn)億元,網(wǎng)絡(luò)零售市場(chǎng)在這個(gè)時(shí)間,交易規(guī)模達(dá)到了18851億元,F(xiàn)在人們可以隨時(shí)隨地地使用移動(dòng)終端設(shè)備,在電商平臺(tái)中選購(gòu)自己滿意的商品。如何讓用戶更快更方便地找尋到自己的想要的商品方式,在互聯(lián)網(wǎng)信息的電商平臺(tái)中顯得尤其重要。現(xiàn)有的也是較為傳統(tǒng)的商品搜索方式是利用關(guān)鍵字進(jìn)行查詢,查詢方便且快捷。相對(duì)于文字提供的信息而言,圖片有著其天然的優(yōu)勢(shì),它可以將信息高質(zhì)量的保存,移動(dòng)終端的智能設(shè)備提供了強(qiáng)大的截屏和拍照功能,使得人們可以方便地獲取商品圖片?梢灶A(yù)見(jiàn)的是,以圖搜物的方式將逐漸興起。在使用圖像來(lái)搜索電商商品時(shí),首先通過(guò)物體識(shí)別提取出物體中的商品信息,再?gòu)纳唐沸畔⒅谐槿〕鰣D像特征,最后使用圖像特征來(lái)搜索相似商品圖片。在搜索過(guò)程中使用物體識(shí)別技術(shù)能夠帶來(lái)大量好處,通過(guò)物體識(shí)別可以去除環(huán)境的干擾,讓系統(tǒng)只關(guān)注于用戶感興趣的部分。在用電商圖片搜索相似商品時(shí),用戶關(guān)心的是輸入圖片中的商品,而不是輸入圖片中的背景。在電商圖片的物體識(shí)別任務(wù)中,遇到的物體類別通常是鞋子、褲子、上衣等,這些物體通常由多個(gè)部分組成,比如鞋子通常由左右兩只鞋子組成,而傳統(tǒng)的物體識(shí)別算法并不能很好的處理這種情況。因此本文針對(duì)這種情況,設(shè)計(jì)了一個(gè)基于組合備選物體的物體識(shí)別算法。首先通過(guò)旋轉(zhuǎn)圖片,減小物體實(shí)例偏轉(zhuǎn)對(duì)物體識(shí)別的影響。然后將同一張輸入圖片旋轉(zhuǎn)之后的多張圖片,通過(guò)傳統(tǒng)的物體識(shí)別算法識(shí)別出其中的備選物體。每個(gè)備選物體可能對(duì)應(yīng)一個(gè)完整物體,也可能對(duì)應(yīng)一個(gè)完整物體的一個(gè)個(gè)組成部分。最后通過(guò)圖像特征聚類備選物體,找出圖片中有多少物體,每個(gè)備選物體屬于哪個(gè)物體,再通過(guò)能量函數(shù)確定每個(gè)物體的位置。從實(shí)驗(yàn)結(jié)果中可以看出本文模型在物體類別識(shí)別的精確度稍稍高于Faster R-CNN。而在物體位置的預(yù)測(cè)上,本文模型的表現(xiàn)要明顯優(yōu)于Faster R-CNN。考慮到圖像搜索對(duì)于物體位置的要求更高,綜合來(lái)說(shuō),本文模型要比Faster R-CNN更好。
[Abstract]:Since the emergence of electronic commerce in China in 1999, the rapid development.China's e-commerce market reached 10.2 trillion yuan by the end of 2013, compared with 1.8851 trillion yuan in the online retail market.Now people can use mobile terminal devices anytime, anywhere in e-commerce platform to choose their own satisfied goods.How to make users find their desired goods more quickly and conveniently is particularly important in the e-commerce platform of Internet information.The traditional commodity search method is to query by keyword, which is convenient and fast.Compared with the information provided by the text, the picture has its natural advantage, it can save the information with high quality, and the intelligent device of the mobile terminal provides the powerful function of screen capture and photo taking, which makes it convenient for people to obtain the commodity picture.Predictably, there will be a gradual rise in search methods.When using images to search for e-commerce commodities, first of all, the commodity information is extracted by object recognition, then image features are extracted from commodity information. Finally, image features are used to search similar commodity images.The use of object recognition technology in the search process can bring a lot of benefits, through object recognition can remove the interference of the environment, so that the system only focuses on the part of interest to the user.When consumers search for similar items, the user is concerned about the items in the input picture, not the background in the image.In the object recognition task of ecommerce images, the objects encountered are usually shoes, trousers, jackets, etc. These objects are usually made up of several parts, such as shoes, which are usually made up of two shoes left and right.But the traditional object recognition algorithm can not deal with this situation very well.In this paper, an object recognition algorithm based on combinatorial alternatives is proposed.Firstly, the effect of object deflection on object recognition is reduced by rotating images.Then, several images of the same input image are rotated, and the candidate objects are identified by the traditional object recognition algorithm.Each alternate object may correspond to a complete object, or it may correspond to a single component of a complete object.Finally, by clustering the candidate objects with image features, we find out how many objects are in the picture, which object each candidate belongs to, and then determine the position of each object by the energy function.It can be seen from the experimental results that the accuracy of this model in object classification recognition is slightly higher than that in Faster R-CNN.In the prediction of object position, the performance of this model is obviously better than that of Faster R-CNN.Considering that image search requires higher position of objects, the model is better than Faster R-CNN.
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41;TP183
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 代松;李偉生;;基于親和傳遞聚類的多類物體識(shí)別方法[J];計(jì)算機(jī)工程;2009年14期
2 鄒利華;;三種基于特征的物體識(shí)別算法對(duì)比與分析[J];軟件導(dǎo)刊;2010年05期
3 連靈;游旭群;;三維物體識(shí)別的心理表征:角度依賴還是角度獨(dú)立[J];心理學(xué)報(bào);2011年09期
4 王喜順;劉曦;史忠植;隋紅建;;一種基于特征整合理論的物體識(shí)別模型(英文)[J];中國(guó)科學(xué)院研究生院學(xué)報(bào);2012年03期
5 胡敏;齊梅;王曉華;許良鳳;;基于顯著區(qū)域詞袋模型的物體識(shí)別方法[J];電子測(cè)量與儀器學(xué)報(bào);2013年07期
6 余少波;鞠發(fā)平;肖英明;;物體識(shí)別不變性方法比較分析(Ⅱ)——解析方法[J];海軍工程學(xué)院學(xué)報(bào);1993年01期
7 曾建超,,柳慧群,林學(xué);基于規(guī)則的物體識(shí)別定位方法[J];高技術(shù)通訊;1995年04期
8 李育賢,王洪波,趙莉;二維物體識(shí)別的暫態(tài)混沌神經(jīng)網(wǎng)絡(luò)方法[J];陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年01期
9 邵潔;董楠;;基于相關(guān)向量機(jī)的物體識(shí)別[J];上海電力學(xué)院學(xué)報(bào);2011年02期
10 楊雄;彭剛;徐濤;劉利;蘭遠(yuǎn)東;;物體識(shí)別的精神物理學(xué)實(shí)驗(yàn)測(cè)試[J];惠州學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年03期
相關(guān)會(huì)議論文 前10條
1 陳柘;趙榮椿;;幾何不變性及其在3D物體識(shí)別中的應(yīng)用[A];信號(hào)與信息處理技術(shù)——第一屆信號(hào)與信息處理聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
2 連靈;張敏;;三維物體識(shí)別的心理表征:角度依賴還是角度獨(dú)立[A];增強(qiáng)心理學(xué)服務(wù)社會(huì)的意識(shí)和功能——中國(guó)心理學(xué)會(huì)成立90周年紀(jì)念大會(huì)暨第十四屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
3 周程;吳飛;莊越挺;;基于層次反饋機(jī)制的物體識(shí)別[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
4 孫彥良;任衍具;;真實(shí)場(chǎng)景中朝向和背景對(duì)物體識(shí)別的影響[A];第十二屆全國(guó)心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
5 郭明瑋;朱明清;趙宇宙;王建;陳宗海;;基于生物視覺(jué)的物體識(shí)別方法研究現(xiàn)狀分析[A];第13屆中國(guó)系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會(huì)論文集[C];2011年
6 艾浩軍;朱榮;張敏;李俊;方禹;王紅霞;;基于SIFT尺度分量的兩級(jí)匹配物體識(shí)別算法研究[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【poster】[C];2011年
7 熊英;馬惠敏;;SIFT特征在三維物體識(shí)別中的應(yīng)用[A];圖像圖形技術(shù)研究與應(yīng)用2009——第四屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年
8 魯?shù)?姜志國(guó);;基于圖元檢測(cè)的物體識(shí)別方法研究[A];全國(guó)第一屆信號(hào)處理學(xué)術(shù)會(huì)議暨中國(guó)高科技產(chǎn)業(yè)化研究會(huì)信號(hào)處理分會(huì)籌備工作委員會(huì)第三次工作會(huì)議?痆C];2007年
9 杜建洪;梁子長(zhǎng);;車輛走向定位技術(shù)的研究[A];通信理論與信號(hào)處理新進(jìn)展——2005年通信理論與信號(hào)處理年會(huì)論文集[C];2005年
10 宋廣青;高莉;孫秀萍;劉新民;;物體識(shí)別實(shí)驗(yàn)在東莨菪堿致大鼠學(xué)習(xí)記憶障礙中的應(yīng)用[A];2013年全國(guó)老年性癡呆與相關(guān)疾病學(xué)術(shù)會(huì)議論文匯編[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 陸王天宇;受生物啟發(fā)的物體識(shí)別算法研究[D];復(fù)旦大學(xué);2013年
2 王靜;視網(wǎng)膜假體中人工視覺(jué)信息處理及優(yōu)化表達(dá)研究[D];上海交通大學(xué);2014年
3 齊勇剛;基于草圖和邊緣的物體識(shí)別[D];北京郵電大學(xué);2015年
4 黃穎;基于圖理論的圖像處理與物體識(shí)別算法的研究[D];電子科技大學(xué);2012年
5 劉光燦;基于機(jī)器學(xué)習(xí)的物體識(shí)別[D];上海交通大學(xué);2013年
6 徐勝;三維物體識(shí)別研究[D];電子科技大學(xué);2010年
7 王興剛;物體識(shí)別中的形狀建模和弱監(jiān)督學(xué)習(xí)[D];華中科技大學(xué);2014年
8 王利明;機(jī)器視覺(jué)中物體識(shí)別方法的研究與探討[D];復(fù)旦大學(xué);2009年
9 彭紹武;基于形狀與語(yǔ)義建模的物體識(shí)別[D];華中科技大學(xué);2009年
10 陶維東;非面孔物體識(shí)別倒置效應(yīng)[D];西南大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 周淼;物體識(shí)別中與特征整合相關(guān)的腦電活動(dòng)研究[D];電子科技大學(xué);2012年
2 李慧霞;室內(nèi)智能移動(dòng)機(jī)器人規(guī)則物體識(shí)別與抓取[D];北京交通大學(xué);2016年
3 劉苗苗;基于2D和3D SIFT特征融合的一般物體識(shí)別算法研究[D];東南大學(xué);2015年
4 程玉立;面向工業(yè)應(yīng)用的機(jī)器人手眼標(biāo)定與物體定位[D];浙江大學(xué);2016年
5 周楠釗;基于SIFT特征的物體識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘭州大學(xué);2016年
6 陳佳洲;室內(nèi)場(chǎng)景物體同時(shí)識(shí)別與建模[D];廣東工業(yè)大學(xué);2016年
7 廉彬;長(zhǎng)期母嬰分離對(duì)大鼠成年后新異性物體識(shí)別和社會(huì)性識(shí)別的影響[D];西南大學(xué);2016年
8 胡耀;自然場(chǎng)景中物體識(shí)別算法研究[D];華南理工大學(xué);2016年
9 蔣哲翎;基于NAO機(jī)器人的物體識(shí)別與定位技術(shù)研究[D];南京大學(xué);2016年
10 孫俊;基于卷積神經(jīng)網(wǎng)絡(luò)的電商圖片物體識(shí)別[D];電子科技大學(xué);2016年
本文編號(hào):1758169
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1758169.html