基于神經(jīng)反應(yīng)模型和稀疏表示的圖像分類算法研究
本文關(guān)鍵詞: 圖像分類 神經(jīng)反應(yīng)模型 稀疏表示 特征提取 多層結(jié)構(gòu) 半監(jiān)督學(xué)習(xí) 魯棒性 出處:《華中科技大學(xué)》2016年博士論文 論文類型:學(xué)位論文
【摘要】:圖像分類是機器學(xué)習(xí)和計算機視覺領(lǐng)域中一個非常重要的研究內(nèi)容,在國防安全、工業(yè)信息化、醫(yī)學(xué)工程和互聯(lián)網(wǎng)科技等方面均有廣泛的應(yīng)用。由于圖像易受光照條件、拍攝角度、復(fù)雜背景、旋轉(zhuǎn)變換或尺度放縮等因素的影響,從而對圖像進行分類是一個非常具有挑戰(zhàn)性的課題。因此,研究高效而具有魯棒性的圖像分類算法,具有重要的理論意義與實際應(yīng)用價值。提取圖像具有代表性的特征,是圖像分類過程中的一個關(guān)鍵部分。為了從復(fù)雜的圖像中提取有效的圖像特征,以及克服訓(xùn)練數(shù)據(jù)不足的現(xiàn)實問題,本文基于神經(jīng)反應(yīng)模型和稀疏表示方法,著重研究了具有魯棒性和區(qū)分性的圖像分類方法,提出了一系列算法,并取得了較好的分類效果。論文的主要內(nèi)容如下:首先,本文提出了一種基于稀疏表示的神經(jīng)反應(yīng)算法。該算法是一個多層的結(jié)構(gòu),試圖模擬人類大腦皮層中的視覺處理機制,通過交替進行非負稀疏表示和最大化聯(lián)合操作來構(gòu)建。非負稀疏表示能夠提取圖像中的顯著特征,而最大化聯(lián)合操作使得模型對于平移等變換具有不變性。為進一步提高算法的性能,本文依據(jù)算法的結(jié)構(gòu)特點,還設(shè)計了兩種簡單而有效的模板選取方法。通過仿真實驗,驗證了該算法能大幅提高原始的神經(jīng)反應(yīng)模型的性能,并在復(fù)雜圖像的分類問題中取得較好的效果。然后,通過引入ELM (extreme learning machine)的理論,,本文提出了一種基于神經(jīng)反應(yīng)模型的多層結(jié)構(gòu)算法。該算法主要包含兩個階段,即多層的ELM特征映射階段和ELM學(xué)習(xí)階段。其中,多層的ELM特征映射階段是一個多層的結(jié)構(gòu),它是以遞歸的方式通過交替進行特征圖構(gòu)建和最大化聯(lián)合操作來建立的。特別地,我們使用隨機生成的輸入權(quán)重構(gòu)建特征圖,且無需對權(quán)重參數(shù)進行優(yōu)化調(diào)節(jié),這使得模型的結(jié)構(gòu)更加簡單,有更高的計算效率。在ELM學(xué)習(xí)階段,本文提出了一種基于彈性網(wǎng)正則化約束的優(yōu)化模型,為ELM方法學(xué)習(xí)輸出權(quán)重,并相應(yīng)地設(shè)計了問題的優(yōu)化算法。彈性網(wǎng)正則化約束能夠為ELM方法學(xué)習(xí)更緊致和有選擇性的輸出權(quán)重,這將有益于ELM方法的特征學(xué)習(xí)過程。實驗結(jié)果顯示,與傳統(tǒng)的深度學(xué)習(xí)方法相比,該算法能夠在獲得更高分類精度的前提下,花費更少的計算時間。最后,針對實際問題中訓(xùn)練數(shù)據(jù)不足的情況,本文提出了一種半監(jiān)督的基于圖正則化約束的稀疏表示算法。該算法能夠充分利用已標記數(shù)據(jù)和未標記數(shù)據(jù)的信息,學(xué)習(xí)未標記數(shù)據(jù)的類別信息。學(xué)習(xí)得到的類別信息,不僅能夠保持與原始數(shù)據(jù)相同的流形結(jié)構(gòu),而且具有較好的區(qū)分性,有利于對圖像進行分類。為了充分挖掘未標記數(shù)據(jù)中隱含的結(jié)構(gòu)信息,通過賦予鄰域內(nèi)未標記數(shù)據(jù)額外的權(quán)重,定義了一種新的類間相似度矩陣和類內(nèi)相似度矩陣,從而可獲取數(shù)據(jù)中更具區(qū)分性的特征。為了處理線性不可分的圖像數(shù)據(jù),本文還提出了一種基于圖正則化約束的核稀疏表示方法,可在高維空間中對數(shù)據(jù)進行線性分類。相應(yīng)地,本文為提出的稀疏表示方法及其核方法,設(shè)計了兩種高效的優(yōu)化算法。實驗結(jié)果表明,算法在處理訓(xùn)練數(shù)據(jù)不足的圖像分類問題時,仍然能夠取得較好的效果。
[Abstract]:Image classification is a very important research field in computer vision and machine learning, in national security, information industry, has been widely used in medical engineering and Internet technology. The images are easily affected by illumination conditions, shooting angle, complex background, influence of rotation transform or scale factors, thus the image classification is a very challenging task. Therefore, the image classification algorithm based on efficient and robust, and has important theoretical meaning and practical value. With the representative feature extraction of image, is a key part of the image classification process. In order to extract the image feature effectively from complex in the image, and overcome the problem of insufficient training data, the neural response model and sparse representation method based on image, focuses on the robust and discriminative points Methods, put forward a series of algorithm, and achieved good classification results. The main contents of this paper are as follows: firstly, this article presents a neural response algorithm based on sparse representation. The algorithm is a multilayer structure, trying to simulate the human brain at the visual cortex of the mechanism, through alternating non negative the sparse representation and maximize the joint operation. To construct the non negative sparse representation can extract salient features of the image, and maximize the joint operation so that the model is invariant to translation. In order to further improve the performance of the algorithm, based on the structural characteristics of the algorithm, designs two kinds of simple and effective method. Through the template selection simulation results show that the algorithm can greatly improve the performance of the neural response of the original model, and achieved good results in the classification of complex images. Then, through the introduction of ELM (e Xtreme learning machine) theory, this paper proposes a multi-layer structure model based on the neural response algorithm. The algorithm mainly includes two stages, namely the multilayer ELM feature mapping stage and ELM learning stage. Among them, ELM feature mapping stage multilayer is a multi-layer structure, it is in a recursive way through alternate feature map construction and maximize the joint operation to establish. In particular, we use randomly generated input weights to construct the feature map and there is no need to optimize the adjustment of the weight parameter, which makes the model more simple structure and has high efficiency. The learning phase in ELM, this paper proposes an optimized model of elastic net regularization constraint based learning output weights for the ELM method, and the corresponding design optimization problem. The elastic net regularization constraint for ELM learning method is more compact and selective The output weights, which will feature learning is beneficial to ELM process. The experimental results show that compared with the traditional method, the algorithm can deep learning, while maintaining the higher classification accuracy, computational cost less time. Finally, according to the actual problems in the training data insufficiency, this paper proposes a semi supervised the sparse representation algorithm based on graph regularization constraint. The algorithm can make full use of data and unlabeled data information has been marked, unmarked categories learning information. Learning class information is obtained, which can not only keep the original data and the manifold structure of the same, but also has high discriminability to classify. In order to fully tap the image. The unmarked structure information hidden in the data, the unlabeled data additional weight to the neighborhood, we define a new similarity matrix between class and within class. The similarity matrix, which can obtain the data in more distinguishable features. In order to image data processing linear inseparable, this paper also proposes a representation method of kernel sparse graph regularization based on constraints, can be a linear classification of data in high dimensional space. Accordingly, the representation method and kernel method for the proposed sparse, two efficient optimization algorithm. The experimental results show that the algorithm in image classification problem of insufficient training data, still can achieve better results.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【相似文獻】
相關(guān)期刊論文 前10條
1 李映;張艷寧;許星;;基于信號稀疏表示的形態(tài)成分分析:進展和展望[J];電子學(xué)報;2009年01期
2 趙瑞珍;王飛;羅阿理;張彥霞;;基于稀疏表示的譜線自動提取方法[J];光譜學(xué)與光譜分析;2009年07期
3 楊蜀秦;寧紀鋒;何東健;;基于稀疏表示的大米品種識別[J];農(nóng)業(yè)工程學(xué)報;2011年03期
4 史加榮;楊威;魏宗田;;基于非負稀疏表示的人臉識別[J];計算機工程與設(shè)計;2012年05期
5 高志榮;熊承義;笪邦友;;改進的基于殘差加權(quán)的稀疏表示人臉識別[J];中南民族大學(xué)學(xué)報(自然科學(xué)版);2012年03期
6 朱杰;楊萬扣;唐振民;;基于字典學(xué)習(xí)的核稀疏表示人臉識別方法[J];模式識別與人工智能;2012年05期
7 耿耀君;張軍英;袁細國;;一種基于稀疏表示系數(shù)的特征相關(guān)性測度[J];模式識別與人工智能;2013年01期
8 張疆勤;廖海斌;李原;;基于因子分析與稀疏表示的多姿態(tài)人臉識別[J];計算機工程與應(yīng)用;2013年05期
9 李正周;王會改;劉梅;丁浩;金鋼;;基于形態(tài)成分稀疏表示的紅外小弱目標檢測[J];彈箭與制導(dǎo)學(xué)報;2013年04期
10 胡正平;趙淑歡;李靜;;基于塊稀疏遞推殘差分析的稀疏表示遮擋魯棒識別算法研究[J];模式識別與人工智能;2014年01期
相關(guān)會議論文 前3條
1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識別研究[A];虛擬運營與云計算——第十八屆全國青年通信學(xué)術(shù)年會論文集(上冊)[C];2013年
2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標識別[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年
3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號處理及其研究進展[A];中國聲學(xué)學(xué)會水聲學(xué)分會2013年全國水聲學(xué)學(xué)術(shù)會議論文集[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 李進明;基于稀疏表示的圖像超分辨率重建方法研究[D];重慶大學(xué);2015年
2 王亞寧;基于信號稀疏表示的電機故障診斷研究[D];河北工業(yè)大學(xué);2014年
3 姚明海;視頻異常事件檢測與認證方法研究[D];東北師范大學(xué);2015年
4 黃國華;蛋白質(zhì)翻譯后修飾位點與藥物適應(yīng)癥預(yù)測方法研究[D];上海大學(xué);2015年
5 王瑾;基于稀疏表示的數(shù)據(jù)收集、復(fù)原與壓縮研究[D];北京工業(yè)大學(xué);2015年
6 王文卿;基于融合框架與稀疏表示的遙感影像銳化[D];西安電子科技大學(xué);2015年
7 解虎;高維小樣本陣列自適應(yīng)信號處理方法研究[D];西安電子科技大學(xué);2015年
8 秦振濤;基于稀疏表示及字典學(xué)習(xí)遙感圖像處理關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2015年
9 薛明;基于稀疏表示的在線目標跟蹤研究[D];上海交通大學(xué);2014年
10 孫樂;空譜聯(lián)合先驗的高光譜圖像解混與分類方法[D];南京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 王道文;基于稀疏表示的目標跟蹤算法研究[D];華南理工大學(xué);2015年
2 李哲;基于稀疏表示和LS-SVM的心電信號分類[D];河北大學(xué);2015年
3 孫雪青;Shearlet變換和稀疏表示相結(jié)合的甲狀腺結(jié)節(jié)圖像融合[D];河北大學(xué);2015年
4 吳麗璇;基于稀疏表示的微聚焦X射線圖像去噪方法[D];華南理工大學(xué);2015年
5 趙孝磊;基于圖像分塊稀疏表示的人臉識別算法研究[D];南京信息工程大學(xué);2015年
6 黃志明;基于辨別式稀疏字典學(xué)習(xí)的視覺追蹤算法研究[D];華南理工大學(xué);2015年
7 張鈴華;非約束環(huán)境下的稀疏表示人臉識別算法研究[D];南京信息工程大學(xué);2015年
8 賀妍斐;基于稀疏表示與自適應(yīng)倒易晶胞的遙感圖像復(fù)原方法研究[D];南京信息工程大學(xué);2015年
9 楊爍;電能質(zhì)量擾動信號的稀疏表示/壓縮采樣研究[D];西南交通大學(xué);2015年
10 應(yīng)艷麗;基于低秩稀疏表示的目標跟蹤算法研究[D];西南交通大學(xué);2015年
本文編號:1503599
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1503599.html