基于機(jī)器視覺的行人檢測技術(shù)研究
本文選題:行人檢測 + 感興趣區(qū)域提取 ; 參考:《長春工業(yè)大學(xué)》2017年碩士論文
【摘要】:隨著智慧城市的建設(shè)需要,行人檢測技術(shù)的研究與發(fā)展備受關(guān)注。行人檢測技術(shù)是圖像處理、模式識別、機(jī)器學(xué)習(xí)等多學(xué)科交叉的研究課題。此外,行人檢測在智能汽車,安防等領(lǐng)域也具有廣闊的應(yīng)用空間。目前,行人檢測技術(shù)的研究已經(jīng)取得了很大的進(jìn)展,但是依然存在很多難點(diǎn)。例如,提取的感興趣區(qū)域窗口過多;提取的特征對行人描述不足;特征維度過高以及分類器等方面還有待進(jìn)一步的提高等。為了解決上述問題,本文從感興趣區(qū)域提取、特征提取和分類器三個方面對行人檢測技術(shù)開展相關(guān)研究。本文的主要研究內(nèi)容如下:(1)在感興趣區(qū)域的研究中,由于行人檢測中使用廣泛的多尺度滑動窗口法產(chǎn)生了過多的檢測窗口。本文提出了一種基于路面約束和圖像分割來提取感興趣區(qū)域的方法來減少待檢測窗口的數(shù)量。首先使用FCM算法對預(yù)處理之后的灰度圖像進(jìn)行分割,標(biāo)記處理之后的連通區(qū)域。另一方面通過區(qū)域生長、邊緣檢測、霍夫變換等算法對行人檢測圖像中的路面區(qū)域進(jìn)行提取,并根據(jù)生活中行人與路面的關(guān)系,利用所提取的路面對已標(biāo)記的連通區(qū)域進(jìn)行篩選,符合條件的連通區(qū)域即為感興趣區(qū)域。為了減弱光照的影響和突出行人區(qū)域,本文在預(yù)處理中加入了直方圖均衡化的方法。(2)在特征提取中,針對HOG等單一的特征對行人描述不足,融合特征維度過高等問題。本文提出了一種多尺度融合的稀疏特征對行人進(jìn)行描述,以此兼顧特征描述不足和特征維度過高的問題。首先提取行人檢測圖像的HOG特征和LBP特征,對提取的HOG和LBP特征分別進(jìn)行稀疏表示,然后將兩個稀疏特征進(jìn)行多尺度的融合。HOG特征的提取采用經(jīng)典的3780維特征,然后對其進(jìn)行稀疏表示。在LBP特征的提取中,首先將64*128的樣本分塊然后再提取塊內(nèi)的LBP特征,并對塊內(nèi)的特征進(jìn)行歸一化處理,并將所有塊內(nèi)的LBP特征組成圖像的LBP特征。通過實(shí)驗(yàn)研究發(fā)現(xiàn),當(dāng)塊大小為8*16像素時,提取的LBP特征檢測效果較好。在進(jìn)行稀疏特征融合的過程中,比較了在不同融合尺度下的行人檢測效果。最終完成多尺度稀疏特征的融合。(3)在分類器的研究中,本文首先將KNN分類器和行人檢測中經(jīng)常使用的支持向量機(jī)分類器作對比。并比較了未進(jìn)行參數(shù)優(yōu)化的RBF核函數(shù)和線性核函數(shù)的分類效果。為了進(jìn)一步提高基于RBF核函數(shù)支持向量機(jī)的分類效果,本文對RBF的參數(shù)進(jìn)行了兩次尋優(yōu)。首先利用網(wǎng)格搜索算法確定最優(yōu)參數(shù)的范圍,在此范圍的基礎(chǔ)上利用粒子群優(yōu)化算法進(jìn)行參數(shù)的精確優(yōu)化。將優(yōu)化后的RBF核函數(shù)的支持向量機(jī)與使用線性核函數(shù)的支持向量機(jī)進(jìn)行對比。
[Abstract]:With the construction of intelligent city, the research and development of pedestrian detection technology has attracted much attention. Pedestrian detection technology is an interdisciplinary research topic of image processing, pattern recognition, machine learning and so on. In addition, pedestrian detection in intelligent vehicles, security and other fields also has a wide range of applications. At present, the research of pedestrian detection technology has made great progress, but there are still many difficulties. For example, there are too many windows in the extracted region of interest; the extracted features are not enough to describe the pedestrian; the feature dimension is too high and the classifier still needs to be further improved. In order to solve the above problems, this paper studies pedestrian detection technology from three aspects: region of interest extraction, feature extraction and classifier. The main contents of this paper are as follows: (1) in the study of the region of interest, there are too many detection windows due to the extensive use of multi-scale sliding window method in pedestrian detection. In this paper, a method of extracting the region of interest based on road constraints and image segmentation is proposed to reduce the number of windows to be detected. Firstly, FCM algorithm is used to segment the preprocessed gray image and mark the connected region. On the other hand, the pavement area in pedestrian detection image is extracted by region growth, edge detection, Hough transform and so on, and based on the relationship between pedestrian and pavement in daily life, Using the extracted road surface to screen the marked connected region, the connected region that meets the conditions is the region of interest. In order to reduce the influence of illumination and highlight pedestrian area, histogram equalization method is added in this paper. In feature extraction, the single feature, such as HOG, is not enough to describe pedestrians, and the feature dimension is too high. In this paper, a multi-scale fusion sparse feature is proposed to describe pedestrians, which takes into account the insufficiency of feature description and the problem of high feature dimension. Firstly, the HOG feature and LBP feature of pedestrian detection image are extracted, and the extracted HOG and LBP features are represented sparsely respectively. Then, the two sparse features are extracted by multi-scale fusion .HOG feature using the classical 3780 dimension feature. Then it is represented sparsely. In the extraction of LBP features, the samples of 64T128 are first divided into blocks, then the LBP features in the blocks are extracted, and the features in the blocks are normalized, and all the LBP features in the blocks are formed into the LBP features of the image. The experimental results show that when the block size is 816 pixels, the LBP feature detection is better. In the process of sparse feature fusion, the pedestrian detection performance at different fusion scales is compared. Finally, the fusion of multi-scale sparse features. 3) in the research of classifier, this paper first compares the KNN classifier with the support vector machine classifier, which is often used in pedestrian detection. The classification effects of RBF kernel function and linear kernel function without parameter optimization are compared. In order to further improve the classification effect of support vector machine based on RBF kernel function, the parameters of RBF are optimized twice in this paper. Firstly, the range of the optimal parameters is determined by using the grid search algorithm, and on the basis of this range, the particle swarm optimization algorithm is used to precisely optimize the parameters. The support vector machine (SVM) of the optimized RBF kernel function is compared with the support vector machine (SVM) using linear kernel function.
【學(xué)位授予單位】:長春工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張新鵬;王朔中;;基于稀疏表示的密寫編碼[J];電子學(xué)報(bào);2007年10期
2 李映;張艷寧;許星;;基于信號稀疏表示的形態(tài)成分分析:進(jìn)展和展望[J];電子學(xué)報(bào);2009年01期
3 趙瑞珍;王飛;羅阿理;張彥霞;;基于稀疏表示的譜線自動提取方法[J];光譜學(xué)與光譜分析;2009年07期
4 楊蜀秦;寧紀(jì)鋒;何東健;;基于稀疏表示的大米品種識別[J];農(nóng)業(yè)工程學(xué)報(bào);2011年03期
5 史加榮;楊威;魏宗田;;基于非負(fù)稀疏表示的人臉識別[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年05期
6 高志榮;熊承義;笪邦友;;改進(jìn)的基于殘差加權(quán)的稀疏表示人臉識別[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
7 朱杰;楊萬扣;唐振民;;基于字典學(xué)習(xí)的核稀疏表示人臉識別方法[J];模式識別與人工智能;2012年05期
8 耿耀君;張軍英;袁細(xì)國;;一種基于稀疏表示系數(shù)的特征相關(guān)性測度[J];模式識別與人工智能;2013年01期
9 張疆勤;廖海斌;李原;;基于因子分析與稀疏表示的多姿態(tài)人臉識別[J];計(jì)算機(jī)工程與應(yīng)用;2013年05期
10 李正周;王會改;劉梅;丁浩;金鋼;;基于形態(tài)成分稀疏表示的紅外小弱目標(biāo)檢測[J];彈箭與制導(dǎo)學(xué)報(bào);2013年04期
相關(guān)會議論文 前3條
1 何愛香;劉玉春;魏廣芬;;基于稀疏表示的煤矸界面識別研究[A];虛擬運(yùn)營與云計(jì)算——第十八屆全國青年通信學(xué)術(shù)年會論文集(上冊)[C];2013年
2 樊亞翔;孫浩;周石琳;鄒煥新;;基于元樣本稀疏表示的多視角目標(biāo)識別[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年
3 葛鳳翔;任歲玲;郭鑫;郭良浩;孫波;;微弱信號處理及其研究進(jìn)展[A];中國聲學(xué)學(xué)會水聲學(xué)分會2013年全國水聲學(xué)學(xué)術(shù)會議論文集[C];2013年
相關(guān)博士學(xué)位論文 前10條
1 李進(jìn)明;基于稀疏表示的圖像超分辨率重建方法研究[D];重慶大學(xué);2015年
2 王亞寧;基于信號稀疏表示的電機(jī)故障診斷研究[D];河北工業(yè)大學(xué);2014年
3 姚明海;視頻異常事件檢測與認(rèn)證方法研究[D];東北師范大學(xué);2015年
4 黃國華;蛋白質(zhì)翻譯后修飾位點(diǎn)與藥物適應(yīng)癥預(yù)測方法研究[D];上海大學(xué);2015年
5 王瑾;基于稀疏表示的數(shù)據(jù)收集、復(fù)原與壓縮研究[D];北京工業(yè)大學(xué);2015年
6 王文卿;基于融合框架與稀疏表示的遙感影像銳化[D];西安電子科技大學(xué);2015年
7 解虎;高維小樣本陣列自適應(yīng)信號處理方法研究[D];西安電子科技大學(xué);2015年
8 秦振濤;基于稀疏表示及字典學(xué)習(xí)遙感圖像處理關(guān)鍵技術(shù)研究[D];成都理工大學(xué);2015年
9 薛明;基于稀疏表示的在線目標(biāo)跟蹤研究[D];上海交通大學(xué);2014年
10 孫樂;空譜聯(lián)合先驗(yàn)的高光譜圖像解混與分類方法[D];南京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 王道文;基于稀疏表示的目標(biāo)跟蹤算法研究[D];華南理工大學(xué);2015年
2 李哲;基于稀疏表示和LS-SVM的心電信號分類[D];河北大學(xué);2015年
3 孫雪青;Shearlet變換和稀疏表示相結(jié)合的甲狀腺結(jié)節(jié)圖像融合[D];河北大學(xué);2015年
4 吳麗璇;基于稀疏表示的微聚焦X射線圖像去噪方法[D];華南理工大學(xué);2015年
5 趙孝磊;基于圖像分塊稀疏表示的人臉識別算法研究[D];南京信息工程大學(xué);2015年
6 黃志明;基于辨別式稀疏字典學(xué)習(xí)的視覺追蹤算法研究[D];華南理工大學(xué);2015年
7 張鈴華;非約束環(huán)境下的稀疏表示人臉識別算法研究[D];南京信息工程大學(xué);2015年
8 賀妍斐;基于稀疏表示與自適應(yīng)倒易晶胞的遙感圖像復(fù)原方法研究[D];南京信息工程大學(xué);2015年
9 楊爍;電能質(zhì)量擾動信號的稀疏表示/壓縮采樣研究[D];西南交通大學(xué);2015年
10 應(yīng)艷麗;基于低秩稀疏表示的目標(biāo)跟蹤算法研究[D];西南交通大學(xué);2015年
,本文編號:1811694
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1811694.html