面向局部特征和特征表達(dá)的圖像分類算法研究
本文選題:圖像分類 + 樸素貝葉斯 ; 參考:《合肥工業(yè)大學(xué)》2016年博士論文
【摘要】:圖像分類是計(jì)算機(jī)視覺(jué)研究領(lǐng)域中的熱點(diǎn)內(nèi)容,在圖像檢索、圖像標(biāo)注、監(jiān)控視頻分析等應(yīng)用中起著重要的作用。近年來(lái),機(jī)器學(xué)習(xí)、人工智能及多媒體信息技術(shù)等學(xué)科的發(fā)展極大地推動(dòng)了圖像分類技術(shù)的研究與應(yīng)用。盡管圖像分類技術(shù)已經(jīng)形成一套成熟的流程,但設(shè)計(jì)具有性能良好且計(jì)算高效的分類算法仍然具有挑戰(zhàn)性。特別是在實(shí)際應(yīng)用中,圖像分類技術(shù)仍面臨著各種各樣的困難,如光照變化、姿態(tài)變化、遮擋、訓(xùn)練樣本不足以及樣本分布差異等等;谏鲜霰尘,針對(duì)圖像分類技術(shù)存在的一些問(wèn)題,本文運(yùn)用計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)中的相關(guān)方法與技術(shù),圍繞圖像分類中圖像表示模型和分類模型兩部分開(kāi)展研究,主要工作成果及創(chuàng)新點(diǎn)如下:1.提出基于樸素貝葉斯K近鄰的快速圖像分類算法;樸素貝葉斯最近鄰算法(NBNN)有效避免了視覺(jué)詞袋模型中特征量化所引起的量化誤差,但該方法運(yùn)行速度慢、易受噪聲信息干擾,并且僅利用特征的最近鄰進(jìn)行分類決策。針對(duì)上述問(wèn)題,本文在保留NBNN算法優(yōu)點(diǎn)的基礎(chǔ)上,提出一種基于樸素貝葉斯K近鄰的快速分類算法(NBKNN)。一方面,使用特征的K近鄰分類決策,并去除背景信息對(duì)分類性能的影響;另一方面,采用特征選擇的方式分別減少測(cè)試圖像和訓(xùn)練圖像集的特征數(shù)目,以提高算法的運(yùn)行速度、減少噪聲信息對(duì)分類性能的影響;并嘗試同時(shí)減少測(cè)試圖像和訓(xùn)練圖像集中的特征數(shù)目平衡分類正確率與分類時(shí)間之間的矛盾。2.在樸素貝葉斯最近鄰算法原理框架下,提出基于低秩稀疏分解與協(xié)作表示的圖像分類算法;當(dāng)前,大部分基于參數(shù)學(xué)習(xí)的圖像分類算法為了獲取較高的分類正確率,均需要大量的訓(xùn)練樣本進(jìn)行參數(shù)學(xué)習(xí)。然而在實(shí)際應(yīng)用中,往往存在訓(xùn)練樣本不足或獲取成本過(guò)高等問(wèn)題,并且噪聲、光照、遮擋、復(fù)雜背景等各種因素使得上述問(wèn)題更加突出。另一方面,盡管同類別的圖像存在一定的差異性,但它們之間同樣具有潛在的相似性和相關(guān)性,如果充分利用這種性質(zhì)將有益于最終的分類識(shí)別。為此,本文在NBNN算法原理下提出一種非參數(shù)化的圖像分類算法;诜秦(fù)稀疏編碼和最大值匯聚,將同類別的訓(xùn)練圖像表示為具有低秩性質(zhì)的特征矩陣;在此基礎(chǔ)上,利用帶有結(jié)構(gòu)不一致性約束的低秩稀疏分解構(gòu)建字典并學(xué)習(xí)低秩投影矩陣。分類過(guò)程中,使用低秩投影矩陣對(duì)測(cè)試圖像進(jìn)行投影,在NBNN算法原理的框架下,采用協(xié)作表示對(duì)其進(jìn)行分類。同時(shí),基于上述思想,假設(shè)一次性可以獲取同類別的多個(gè)測(cè)試圖像,本文也提出了一種圖像集分類算法。最后在不同的標(biāo)準(zhǔn)圖像分類集中對(duì)本文所提算法進(jìn)行了驗(yàn)證與實(shí)驗(yàn)分析。3.提出基于多稀疏表示和在線字典學(xué)習(xí)方式的域適應(yīng)圖像分類算法;傳統(tǒng)圖像分類算法的研究一般假設(shè)訓(xùn)練樣本和測(cè)試樣本源于同一個(gè)域(圖像集),具有相同的分布形式,然而這種假設(shè)在實(shí)際應(yīng)用中很難得到滿足。針對(duì)此問(wèn)題,本文提出一種基于特征表示的域適應(yīng)圖像分類算法。為了減小源域和目標(biāo)域中樣本分布的差異性,假設(shè)源域和目標(biāo)域之間存在若干個(gè)中間域。算法基于稀疏表示將圖像表示為具有固定長(zhǎng)度的BoVW特征向量,在中間域子空間建模時(shí)引入在線字典學(xué)習(xí)方法,一方面保證了樣本的重構(gòu)誤差最小,另一方面使得源域至目標(biāo)域的連接盡量光滑。最終基于源域、各中間域和目標(biāo)域子空間字典形成更具區(qū)分性能的增廣特征向量,并用于跨域分類識(shí)別。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法的有效性,并證實(shí)了當(dāng)訓(xùn)練樣本和測(cè)試樣本源于不同域時(shí),基于域適應(yīng)的圖像分類方法取得的分類正確率更優(yōu)。
[Abstract]:Image classification is a hot topic in the field of computer vision research , plays an important role in image retrieval , image labeling , monitoring video analysis and so on . In recent years , the development of machine learning , artificial intelligence and multimedia information technology has greatly promoted the research and application of image classification technology .
The simple Bayesian nearest neighbor algorithm ( NBNN ) effectively avoids the quantization error caused by feature quantization in the visual word bag model , but the method is slow in operation , easy to be interfered by the noise information , and only utilizes the nearest neighbor of the feature to make classification decision . Based on the advantages of the NBNN algorithm , this paper proposes a fast classification algorithm ( NBKNN ) based on naive Bayes K nearest neighbor . On the one hand , the K nearest neighbor classification decision is used and the influence of background information on the classification performance is removed .
On the other hand , the feature number of the test image and the training image set is reduced by adopting the feature selection method , so as to improve the running speed of the algorithm , reduce the influence of the noise information on the classification performance , and try to reduce the contradiction between the classification accuracy and the classification time of the feature number balance classification in the test image and the training image set .
At present , most of the image classification algorithms based on parameter learning require a large number of training samples for parameter learning in order to obtain higher classification accuracy . However , in practical applications , there are some problems such as insufficient training samples or too high acquisition cost , and the problems of noise , illumination , shielding and complex background make the above - mentioned problems more prominent .
In this paper , using low rank sparse decomposition to construct a dictionary and learning a low rank projection matrix , a low rank projection matrix is used to construct a low rank projection matrix . In the classification process , a low rank projection matrix is used to classify the test image .
This paper proposes a domain adaptive image classification algorithm based on feature representation . In order to reduce the difference of sample size distribution in source domain and target domain , this paper proposes a domain adaptive image classification algorithm based on feature representation . In order to reduce sample size distribution in source domain and target domain , an online dictionary learning method is proposed based on sparse representation .
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁曉蓮;周激流;李曉華;吳朋;;人臉識(shí)別率與圖像分辨率關(guān)系的比較分析[J];計(jì)算機(jī)工程;2009年11期
2 賈麗娟;;關(guān)于圖像分辨率的教學(xué)思考[J];印刷世界;2011年05期
3 張秀屏,,劉錫國(guó),叢玉良;提高彩電圖像分辨率的研討[J];光學(xué)精密工程;1994年02期
4 周中華;如何使拷屏圖像更清楚[J];桌面出版與設(shè)計(jì);1999年04期
5 林阿嵐;;如何取得完美圖像[J];電子測(cè)試;2001年08期
6 宋其華;郭根生;;解析計(jì)算機(jī)圖像分辨率[J];中國(guó)電化教育;2003年11期
7 馮金菊;;淺談分辨率[J];才智;2008年22期
8 江靜;蔡鶴;;小議分辨率與輸出圖像的關(guān)系[J];科教文匯(上旬刊);2008年03期
9 李春雨;李衛(wèi)平;;篡改圖像的識(shí)別技術(shù)研究與仿真[J];計(jì)算機(jī)仿真;2011年11期
10 ;教你詳細(xì)了解各種分辨率[J];計(jì)算機(jī)與網(wǎng)絡(luò);2011年24期
相關(guān)會(huì)議論文 前10條
1 王江寧;紀(jì)力強(qiáng);;昆蟲(chóng)圖像特征研究[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
2 楊德強(qiáng);蘇光大;徐天偉;;一種基于幻想臉的人臉圖像分辨率提升新技術(shù)[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
3 張莉;李佩臻;;用Photoshop對(duì)1:1萬(wàn)DRG入庫(kù)數(shù)據(jù)的處理[A];全國(guó)測(cè)繪科技信息網(wǎng)中南分網(wǎng)第二十一次學(xué)術(shù)信息交流會(huì)論文集[C];2007年
4 任曉暉;龔勇清;;體全息存儲(chǔ)再現(xiàn)圖像分辨率實(shí)驗(yàn)研究[A];第十一屆全國(guó)光學(xué)測(cè)試學(xué)術(shù)討論會(huì)論文(摘要集)[C];2006年
5 廖熠;趙榮椿;;一種基于小波分層模型的自然景物圖像表面恢復(fù)算法[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
6 劉達(dá);李樞平;;對(duì)DCI數(shù)字影院技術(shù)規(guī)范中圖像分級(jí)技術(shù)的理解[A];中國(guó)電影電視技術(shù)學(xué)會(huì)影視技術(shù)文集[C];2007年
7 湯敏;王惠南;;基于IDL語(yǔ)言的醫(yī)學(xué)圖像可視化初步研究[A];第十二屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2005年
8 趙源萌;鄧朝;張馨;張存林;;被動(dòng)式人體太赫茲安檢成像的分辨率增強(qiáng)算法研究[A];中國(guó)光學(xué)學(xué)會(huì)2011年學(xué)術(shù)大會(huì)摘要集[C];2011年
9 張尚軍;徐光;祁小江;;影響CR膠片質(zhì)量原因的探討[A];2009中華醫(yī)學(xué)會(huì)影像技術(shù)分會(huì)第十七次全國(guó)學(xué)術(shù)大會(huì)論文集[C];2009年
10 何東曉;隋守鑫;劉微;;高清透霧攝像機(jī)的研發(fā)及在交通領(lǐng)域的應(yīng)用[A];第八屆中國(guó)智能交通年會(huì)優(yōu)秀論文集——智能交通與安全[C];2013年
相關(guān)重要報(bào)紙文章 前10條
1 劉筱霞;陳永常;PHOTOSHOP中圖像分辨率的設(shè)置[N];中國(guó)包裝報(bào);2002年
2 王樹(shù)連;從購(gòu)買圖像到租用衛(wèi)星[N];中國(guó)測(cè)繪報(bào);2003年
3 楊興平;如何抓取指定分辨率的圖像[N];中國(guó)電腦教育報(bào);2003年
4 李鑫;飛利浦200BW8商務(wù)人士明智新寵[N];電子資訊時(shí)報(bào);2007年
5 記者 曾遺榮邋通訊員 冷承秋 實(shí)習(xí)生 向哲林;美國(guó)一高科技公司將落戶武漢[N];湖北日?qǐng)?bào);2007年
6 唐鳳碧;正確運(yùn)用數(shù)碼相機(jī)分辨率[N];中國(guó)攝影報(bào);2007年
7 ;創(chuàng)維TWH-43L(DLP)光顯背投圖像不良的檢修[N];電子報(bào);2008年
8 WLF;細(xì)說(shuō)分辨率[N];電腦報(bào);2003年
9 宏杉;感受專業(yè)動(dòng)力[N];中國(guó)計(jì)算機(jī)報(bào);2001年
10 宋連黨;家庭VCD像冊(cè)大制作[N];中國(guó)電腦教育報(bào);2003年
相關(guān)博士學(xué)位論文 前10條
1 吳輝群;慢性病信息管理系統(tǒng)中視網(wǎng)膜圖像的互操作性及其血管網(wǎng)絡(luò)定量分析研究[D];復(fù)旦大學(xué);2014年
2 田虎;單目圖像的深度估計(jì)[D];北京郵電大學(xué);2015年
3 唐玉芳;商品圖像分類算法研究[D];北京郵電大學(xué);2015年
4 賈勇;建筑物透視探測(cè)關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2014年
5 黃仁杰;非可控條件下人臉識(shí)別中的若干問(wèn)題研究[D];電子科技大學(xué);2015年
6 萬(wàn)方;基于多幅圖像的三維結(jié)構(gòu)化場(chǎng)景重建技術(shù)研究[D];武漢大學(xué);2013年
7 馬鐘;視覺(jué)感知啟發(fā)的對(duì)象發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];西北工業(yè)大學(xué);2015年
8 張旭;面向局部特征和特征表達(dá)的圖像分類算法研究[D];合肥工業(yè)大學(xué);2016年
9 王洪;航空光電平臺(tái)圖像穩(wěn)定技術(shù)研究[D];中國(guó)科學(xué)院研究生院(長(zhǎng)春光學(xué)精密機(jī)械與物理研究所);2012年
10 孫艷;基于內(nèi)容圖像檢索與敏感圖像過(guò)濾的若干算法研究[D];吉林大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 楊棟;面向CTA圖像的冠脈血管分割算法研究和血管狹窄度分析[D];浙江大學(xué);2015年
2 龔若皓;基于嵌入式移動(dòng)GPU的圖像編解碼并行優(yōu)化[D];西南交通大學(xué);2015年
3 曹福來(lái);發(fā)動(dòng)機(jī)燃油噴霧圖像篩選及處理方法的分析研究[D];長(zhǎng)安大學(xué);2015年
4 張弛;基于卷積神經(jīng)網(wǎng)絡(luò)的鞋印圖像分類算法研究[D];大連海事大學(xué);2016年
5 張貴平;圖像視點(diǎn)調(diào)整技術(shù)研究[D];南京大學(xué);2014年
6 李杰;高速圖像數(shù)據(jù)實(shí)時(shí)存儲(chǔ)與顯示關(guān)鍵技術(shù)研究[D];中北大學(xué);2016年
7 胡蓓蕾;基于圖像融合的水下圖像顏色恢復(fù)[D];中國(guó)海洋大學(xué);2015年
8 周黎;基于千兆網(wǎng)的高性能嵌入式圖像處理技術(shù)研究[D];中國(guó)科學(xué)院研究生院(光電技術(shù)研究所);2016年
9 顧幫忠;基于CCD的DR影像校正[D];東南大學(xué);2015年
10 張磊;鉚釘尺寸與表面缺陷在線檢測(cè)關(guān)鍵技術(shù)研究[D];西南交通大學(xué);2016年
本文編號(hào):2047421
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2047421.html