基于B-CNN模型的細(xì)粒度分類算法研究
本文選題:細(xì)粒度分類 切入點(diǎn):分類錯(cuò)誤 出處:《中國(guó)地質(zhì)大學(xué)(北京)》2017年碩士論文
【摘要】:近年來伴隨著大數(shù)據(jù)的增長(zhǎng),圖像分類任務(wù)得到了迅猛發(fā)展,分類任務(wù)也由二分類發(fā)展為簡(jiǎn)單的粗分類進(jìn)而發(fā)展為細(xì)粒度分類。這里所說的粗分類大多數(shù)情況下是把不同的物體區(qū)分開來,比如把貓、狗、樹、車分開,它們之間有著顯著的差異,比較容易分類。而細(xì)粒度分類則是把同一個(gè)物體繼續(xù)細(xì)分,比如不同類別的鳥,不同型號(hào)的飛機(jī),人臉識(shí)別等等,它們之間的差異通常非常小,而且它們的拍照角度,光照,遮擋都會(huì)對(duì)分類造成更大的困擾,所以更加困難。隨著深度學(xué)習(xí)的發(fā)展,圖像分類任務(wù)變得越來越容易,人們對(duì)于圖像分類的要求也在不斷提高,細(xì)粒度分類任務(wù)應(yīng)運(yùn)而生,包括對(duì)花的品種、鳥的種類、人臉識(shí)別等;跈C(jī)器學(xué)習(xí)的圖像分類任務(wù)包含兩部分內(nèi)容:圖像特征提取,分類,特征提取的好壞直接關(guān)乎分類精度,特征維數(shù)越大,準(zhǔn)確率越高,然而當(dāng)特征維數(shù)太高時(shí),又會(huì)導(dǎo)致占用內(nèi)存較多,計(jì)算量大等問題。卷積神經(jīng)網(wǎng)絡(luò)常被人用來提取特征,一般而言,網(wǎng)絡(luò)越深,特征越好,隨著層數(shù)的加深,然而當(dāng)網(wǎng)絡(luò)到達(dá)一定深度后,通過增加深度提高準(zhǔn)確率變得越來越難。因此研究者們提出了很多種方法用來解決這個(gè)問題,例如基于部件的摸型,但它的缺點(diǎn)是效率低,人工標(biāo)記任務(wù)繁重;而B-CNN模型則同時(shí)解決了這兩個(gè)問題,它只需要訓(xùn)練集樣本的標(biāo)簽,不需要目標(biāo)的邊界框及部件的標(biāo)注,同時(shí)又有較高的準(zhǔn)確率。B-CNN模型雖然在一定程度上解決了細(xì)粒度分類任務(wù)的問題,但是它的訓(xùn)練和分類是針對(duì)所有樣本的,對(duì)于部分易混淆的類不能有針對(duì)的區(qū)分,本文在B-CNN模型的基礎(chǔ)上做了不同的改進(jìn)嘗試,其中,根據(jù)B-CNN模型得到的首次分類結(jié)果與真實(shí)標(biāo)簽做比對(duì),從而利用CLR聚類算法將易分錯(cuò)、易混淆的類別進(jìn)行聚類,再根據(jù)聚類后的結(jié)果將易混淆的類進(jìn)行單獨(dú)的再訓(xùn)練和再分類,取得了較好的效果。本文在CUB-200-2011、FGVC-Aircraft-2013b和Stanford-cars三個(gè)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),分類準(zhǔn)確率分別由B-CNN模型的84.35%,83.56%,89.45%提高到了84.67%,84.11%,89.78%,驗(yàn)證了本文算法的有效性。另外,本文也做了一些其它實(shí)驗(yàn),得到了一些結(jié)論,并提出了一些接下來可以繼續(xù)改進(jìn)的點(diǎn)。
[Abstract]:In recent years, with the growth of big data, the task of image classification has developed rapidly. The task of classification has also evolved from two categories to simple coarse classification and then to fine-grained classification. In most cases, the coarse classification is to separate different objects, such as cats, dogs, trees and cars. There are significant differences between them, which are easier to categorize, and fine-grained classification is about subdividing the same object, such as different types of birds, different types of aircraft, face recognition, and so on. The difference between them is usually very small. And their camera angle, illumination and occlusion all cause more trouble to classification, so it's more difficult. With the development of in-depth learning, the task of image classification becomes more and more easy, and people's requirements for image classification are also increasing. The task of fine-grained classification emerges as the times require, including the species of flowers, bird species, face recognition, etc. The task of image classification based on machine learning consists of two parts: image feature extraction, classification, and so on. The quality of feature extraction is directly related to the classification accuracy. The larger the feature dimension, the higher the accuracy. However, when the feature dimension is too high, it will lead to the problems of more memory and large computation. Convolution neural network is often used to extract features. Generally speaking, the deeper the network, the better the feature, as the number of layers deepens. However, when the network reaches a certain depth, it becomes more and more difficult to improve the accuracy by increasing the depth. For example, component-based modeling, but its disadvantages are low efficiency and heavy manual marking, while B-CNN model solves these two problems at the same time. It only needs the tag of training set samples, and does not need the boundary box of the target and the tagging of the parts. At the same time, there is a high accuracy. B-CNN model can solve the problem of fine-grained classification to some extent, but its training and classification are aimed at all samples, and some confusing classes can not be distinguished. On the basis of B-CNN model, this paper makes different improvement attempts, among which, according to the first classification result obtained by B-CNN model and the real label, the CLR clustering algorithm is used to cluster the easily error-prone and confusing categories. According to the clustering results, the confusing classes are retrained and reclassified separately, and good results are obtained. Experiments are carried out on the CUB-200-2011FGVC-Aircraft-2013b and Stanford-cars data sets. The classification accuracy is increased from 84.35% 83.56% of the B-CNN model to 84.67% 84.11% and 89.78% respectively, which verifies the validity of this algorithm. In addition, some other experiments are done, some conclusions are obtained, and some points that can be further improved are put forward.
【學(xué)位授予單位】:中國(guó)地質(zhì)大學(xué)(北京)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王寧;鈔柯;羅嬪;;實(shí)現(xiàn)細(xì)粒度訪問控制的元模型研究[J];大連理工大學(xué)學(xué)報(bào);2012年03期
2 孫偉;李艷靈;周文勇;;細(xì)粒度基于傳遞功能的約束委托模型[J];信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2013年03期
3 夏汛;陳玲;;基于攔截器的細(xì)粒度權(quán)限設(shè)計(jì)[J];福建電腦;2012年11期
4 歐陽(yáng)純萍;陽(yáng)小華;雷龍艷;徐強(qiáng);余穎;劉志明;;多策略中文微博細(xì)粒度情緒分析研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
5 史大偉;袁天偉;;一種粗細(xì)粒度結(jié)合的動(dòng)態(tài)污點(diǎn)分析方法[J];計(jì)算機(jī)工程;2014年03期
6 原子;于莉莉;劉超;;引入缺陷的細(xì)粒度軟件變更識(shí)別方法[J];北京航空航天大學(xué)學(xué)報(bào);2014年09期
7 戢彥泓,郭常杰,鐘玉琢,孫立峰;基于細(xì)粒度可擴(kuò)展編碼的多源視頻流化方案[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年04期
8 涂登彪;譚光明;孫凝暉;;無鎖同步的細(xì)粒度并行介度中心算法[J];軟件學(xué)報(bào);2011年05期
9 張宇軒;魏廷存;樊曉椏;張萌;;面向流體系的細(xì)粒度異步訪存調(diào)度[J];計(jì)算機(jī)應(yīng)用研究;2012年03期
10 王寬;;基于細(xì)粒度調(diào)整的同步播放控制算法[J];山西電子技術(shù);2008年05期
相關(guān)會(huì)議論文 前5條
1 葉蘊(yùn)芳;楊榆;羅鑫;徐國(guó)愛;;Appfuse系統(tǒng)中細(xì)粒度權(quán)限控制的研究與實(shí)現(xiàn)[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
2 江偉玉;高能;劉澤藝;林雪燕;;一種云計(jì)算中的多重身份認(rèn)證與授權(quán)方案[A];第27次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2012年
3 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細(xì)粒度并行結(jié)構(gòu)與實(shí)現(xiàn)[A];2010年第16屆全國(guó)信息存儲(chǔ)技術(shù)大會(huì)(IST2010)論文集[C];2010年
4 李俊青;謝圣獻(xiàn);劉廣亮;陳晨;;P2P網(wǎng)絡(luò)基于蟻群優(yōu)化的動(dòng)態(tài)細(xì)粒度訪問控制框架[A];2008年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
5 盛振華;吳羽;江錦華;壽黎但;陳剛;;InfoSigs:一種面向WEB對(duì)象的細(xì)粒度聚類算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
相關(guān)重要報(bào)紙文章 前2條
1 趙曉濤;巡展中的三大熱門[N];網(wǎng)絡(luò)世界;2007年
2 樂天邋編譯;編織一張更好的Web[N];計(jì)算機(jī)世界;2007年
相關(guān)博士學(xué)位論文 前4條
1 付興兵;基于屬性基加密的細(xì)粒度訪問控制機(jī)制研究[D];電子科技大學(xué);2016年
2 時(shí)杰;關(guān)系數(shù)據(jù)庫(kù)細(xì)粒度訪問控制研究[D];華中科技大學(xué);2010年
3 朱倩;面向自由文本的細(xì)粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年
4 余a\;基于Simulink模型的細(xì)粒度多線程技術(shù)研究[D];浙江大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 趙黎光;基于依存句法的句子級(jí)細(xì)粒度情感計(jì)算[D];華南理工大學(xué);2015年
2 李星宇;一種細(xì)粒度Cloud-RAN框架與關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年
3 酈麗珍;基于Open vSwitch虛擬網(wǎng)絡(luò)的細(xì)粒度訪問控制[D];復(fù)旦大學(xué);2013年
4 姚亮;數(shù)據(jù)訪問控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學(xué);2014年
5 占文平;面向產(chǎn)品評(píng)論的情感分析技術(shù)研究[D];浙江工商大學(xué);2015年
6 廖純;基于句法和語(yǔ)義的話題細(xì)粒度情感分析的研究[D];北京理工大學(xué);2016年
7 李毅;屬性層級(jí)觀點(diǎn)挖掘技術(shù)的研究與應(yīng)用[D];石家莊鐵道大學(xué);2016年
8 周志華;聊天系統(tǒng)文本情感細(xì)粒度分類研究與應(yīng)用[D];西南交通大學(xué);2015年
9 康海蒙;基于細(xì)粒度監(jiān)控的Spark優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2016年
10 張磊;細(xì)粒度意見挖掘研究[D];南京師范大學(xué);2016年
,本文編號(hào):1661580
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1661580.html