基于B-CNN模型的細粒度分類算法研究
本文選題:細粒度分類 切入點:分類錯誤 出處:《中國地質(zhì)大學(xué)(北京)》2017年碩士論文
【摘要】:近年來伴隨著大數(shù)據(jù)的增長,圖像分類任務(wù)得到了迅猛發(fā)展,分類任務(wù)也由二分類發(fā)展為簡單的粗分類進而發(fā)展為細粒度分類。這里所說的粗分類大多數(shù)情況下是把不同的物體區(qū)分開來,比如把貓、狗、樹、車分開,它們之間有著顯著的差異,比較容易分類。而細粒度分類則是把同一個物體繼續(xù)細分,比如不同類別的鳥,不同型號的飛機,人臉識別等等,它們之間的差異通常非常小,而且它們的拍照角度,光照,遮擋都會對分類造成更大的困擾,所以更加困難。隨著深度學(xué)習(xí)的發(fā)展,圖像分類任務(wù)變得越來越容易,人們對于圖像分類的要求也在不斷提高,細粒度分類任務(wù)應(yīng)運而生,包括對花的品種、鳥的種類、人臉識別等。基于機器學(xué)習(xí)的圖像分類任務(wù)包含兩部分內(nèi)容:圖像特征提取,分類,特征提取的好壞直接關(guān)乎分類精度,特征維數(shù)越大,準確率越高,然而當特征維數(shù)太高時,又會導(dǎo)致占用內(nèi)存較多,計算量大等問題。卷積神經(jīng)網(wǎng)絡(luò)常被人用來提取特征,一般而言,網(wǎng)絡(luò)越深,特征越好,隨著層數(shù)的加深,然而當網(wǎng)絡(luò)到達一定深度后,通過增加深度提高準確率變得越來越難。因此研究者們提出了很多種方法用來解決這個問題,例如基于部件的摸型,但它的缺點是效率低,人工標記任務(wù)繁重;而B-CNN模型則同時解決了這兩個問題,它只需要訓(xùn)練集樣本的標簽,不需要目標的邊界框及部件的標注,同時又有較高的準確率。B-CNN模型雖然在一定程度上解決了細粒度分類任務(wù)的問題,但是它的訓(xùn)練和分類是針對所有樣本的,對于部分易混淆的類不能有針對的區(qū)分,本文在B-CNN模型的基礎(chǔ)上做了不同的改進嘗試,其中,根據(jù)B-CNN模型得到的首次分類結(jié)果與真實標簽做比對,從而利用CLR聚類算法將易分錯、易混淆的類別進行聚類,再根據(jù)聚類后的結(jié)果將易混淆的類進行單獨的再訓(xùn)練和再分類,取得了較好的效果。本文在CUB-200-2011、FGVC-Aircraft-2013b和Stanford-cars三個數(shù)據(jù)集上進行了實驗,分類準確率分別由B-CNN模型的84.35%,83.56%,89.45%提高到了84.67%,84.11%,89.78%,驗證了本文算法的有效性。另外,本文也做了一些其它實驗,得到了一些結(jié)論,并提出了一些接下來可以繼續(xù)改進的點。
[Abstract]:In recent years, with the growth of big data, the task of image classification has developed rapidly. The task of classification has also evolved from two categories to simple coarse classification and then to fine-grained classification. In most cases, the coarse classification is to separate different objects, such as cats, dogs, trees and cars. There are significant differences between them, which are easier to categorize, and fine-grained classification is about subdividing the same object, such as different types of birds, different types of aircraft, face recognition, and so on. The difference between them is usually very small. And their camera angle, illumination and occlusion all cause more trouble to classification, so it's more difficult. With the development of in-depth learning, the task of image classification becomes more and more easy, and people's requirements for image classification are also increasing. The task of fine-grained classification emerges as the times require, including the species of flowers, bird species, face recognition, etc. The task of image classification based on machine learning consists of two parts: image feature extraction, classification, and so on. The quality of feature extraction is directly related to the classification accuracy. The larger the feature dimension, the higher the accuracy. However, when the feature dimension is too high, it will lead to the problems of more memory and large computation. Convolution neural network is often used to extract features. Generally speaking, the deeper the network, the better the feature, as the number of layers deepens. However, when the network reaches a certain depth, it becomes more and more difficult to improve the accuracy by increasing the depth. For example, component-based modeling, but its disadvantages are low efficiency and heavy manual marking, while B-CNN model solves these two problems at the same time. It only needs the tag of training set samples, and does not need the boundary box of the target and the tagging of the parts. At the same time, there is a high accuracy. B-CNN model can solve the problem of fine-grained classification to some extent, but its training and classification are aimed at all samples, and some confusing classes can not be distinguished. On the basis of B-CNN model, this paper makes different improvement attempts, among which, according to the first classification result obtained by B-CNN model and the real label, the CLR clustering algorithm is used to cluster the easily error-prone and confusing categories. According to the clustering results, the confusing classes are retrained and reclassified separately, and good results are obtained. Experiments are carried out on the CUB-200-2011FGVC-Aircraft-2013b and Stanford-cars data sets. The classification accuracy is increased from 84.35% 83.56% of the B-CNN model to 84.67% 84.11% and 89.78% respectively, which verifies the validity of this algorithm. In addition, some other experiments are done, some conclusions are obtained, and some points that can be further improved are put forward.
【學(xué)位授予單位】:中國地質(zhì)大學(xué)(北京)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41
【相似文獻】
相關(guān)期刊論文 前10條
1 王寧;鈔柯;羅嬪;;實現(xiàn)細粒度訪問控制的元模型研究[J];大連理工大學(xué)學(xué)報;2012年03期
2 孫偉;李艷靈;周文勇;;細粒度基于傳遞功能的約束委托模型[J];信陽師范學(xué)院學(xué)報(自然科學(xué)版);2013年03期
3 夏汛;陳玲;;基于攔截器的細粒度權(quán)限設(shè)計[J];福建電腦;2012年11期
4 歐陽純萍;陽小華;雷龍艷;徐強;余穎;劉志明;;多策略中文微博細粒度情緒分析研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
5 史大偉;袁天偉;;一種粗細粒度結(jié)合的動態(tài)污點分析方法[J];計算機工程;2014年03期
6 原子;于莉莉;劉超;;引入缺陷的細粒度軟件變更識別方法[J];北京航空航天大學(xué)學(xué)報;2014年09期
7 戢彥泓,郭常杰,鐘玉琢,孫立峰;基于細粒度可擴展編碼的多源視頻流化方案[J];清華大學(xué)學(xué)報(自然科學(xué)版);2004年04期
8 涂登彪;譚光明;孫凝暉;;無鎖同步的細粒度并行介度中心算法[J];軟件學(xué)報;2011年05期
9 張宇軒;魏廷存;樊曉椏;張萌;;面向流體系的細粒度異步訪存調(diào)度[J];計算機應(yīng)用研究;2012年03期
10 王寬;;基于細粒度調(diào)整的同步播放控制算法[J];山西電子技術(shù);2008年05期
相關(guān)會議論文 前5條
1 葉蘊芳;楊榆;羅鑫;徐國愛;;Appfuse系統(tǒng)中細粒度權(quán)限控制的研究與實現(xiàn)[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
2 江偉玉;高能;劉澤藝;林雪燕;;一種云計算中的多重身份認證與授權(quán)方案[A];第27次全國計算機安全學(xué)術(shù)交流會論文集[C];2012年
3 郭磊;唐玉華;周杰;董亞卓;;基于FPGA的Cholesky分解細粒度并行結(jié)構(gòu)與實現(xiàn)[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年
4 李俊青;謝圣獻;劉廣亮;陳晨;;P2P網(wǎng)絡(luò)基于蟻群優(yōu)化的動態(tài)細粒度訪問控制框架[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2008年
5 盛振華;吳羽;江錦華;壽黎但;陳剛;;InfoSigs:一種面向WEB對象的細粒度聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
相關(guān)重要報紙文章 前2條
1 趙曉濤;巡展中的三大熱門[N];網(wǎng)絡(luò)世界;2007年
2 樂天邋編譯;編織一張更好的Web[N];計算機世界;2007年
相關(guān)博士學(xué)位論文 前4條
1 付興兵;基于屬性基加密的細粒度訪問控制機制研究[D];電子科技大學(xué);2016年
2 時杰;關(guān)系數(shù)據(jù)庫細粒度訪問控制研究[D];華中科技大學(xué);2010年
3 朱倩;面向自由文本的細粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年
4 余a\;基于Simulink模型的細粒度多線程技術(shù)研究[D];浙江大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 趙黎光;基于依存句法的句子級細粒度情感計算[D];華南理工大學(xué);2015年
2 李星宇;一種細粒度Cloud-RAN框架與關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年
3 酈麗珍;基于Open vSwitch虛擬網(wǎng)絡(luò)的細粒度訪問控制[D];復(fù)旦大學(xué);2013年
4 姚亮;數(shù)據(jù)訪問控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學(xué);2014年
5 占文平;面向產(chǎn)品評論的情感分析技術(shù)研究[D];浙江工商大學(xué);2015年
6 廖純;基于句法和語義的話題細粒度情感分析的研究[D];北京理工大學(xué);2016年
7 李毅;屬性層級觀點挖掘技術(shù)的研究與應(yīng)用[D];石家莊鐵道大學(xué);2016年
8 周志華;聊天系統(tǒng)文本情感細粒度分類研究與應(yīng)用[D];西南交通大學(xué);2015年
9 康海蒙;基于細粒度監(jiān)控的Spark優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2016年
10 張磊;細粒度意見挖掘研究[D];南京師范大學(xué);2016年
,本文編號:1661580
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1661580.html