生物視覺感知啟發(fā)下的目標檢測與識別技術研究
本文選題:目標檢測與識別 + 視覺感知系統(tǒng)視覺感知雙通路結(jié)構(gòu); 參考:《華中科技大學》2015年博士論文
【摘要】:人類視覺感知系統(tǒng)能夠輕易地從外部復雜場景中感知靜止或運動的目標,然而該感知過程對計算機來說并非易事。作為計算機視覺領域中的研究熱點和難點之一,目標檢測與識別長期以來受到了眾多學者的關注,具有重要的學術研究價值。目標檢測與識別是視頻監(jiān)控、智能交通、遙感測繪等應用領域的核心技術,具有廣泛的應用前景。近年來,大量的自動目標檢測與識別算法被提出,一定程度上提高了機器視覺感知系統(tǒng)的智能化水平。然而,機器視覺感知水平還遠遠落后于人類視覺的感知能力。鑒于這一現(xiàn)狀,借鑒神經(jīng)科學和認知心理學的研究成果,模擬生物視覺感知過程來建立目標檢測與識別算法,是一個能極大程度提高目標檢測與識別性能的研究和探索方向。 在生物視覺感知特性啟發(fā)下,本文開展了一系列目標檢測與識別技術研究,著重研究了空間顯著目標檢測技術、時空顯著目標檢測技術、機載紅外運動目標檢測技術和無監(jiān)督層次化特征提取及其在分類識別中的應用技術,具體內(nèi)容如下: (1)基于選擇性視覺注意中的感覺增強理論,提出了一種基于柯西圖嵌入的目標空間顯著性計算方法。感覺增強理論表明目標的注意是注意焦點擴散的結(jié)果。基于這一理論,該方法以經(jīng)典注意焦點預測方法為輸入,利用基于柯西圖嵌入的平滑約束對輸入結(jié)果進行平滑、完成視覺組織過程,用以模擬注意焦點的擴散過程。實驗結(jié)果表明基于柯西圖嵌入的視覺組織優(yōu)于傳統(tǒng)的拉普拉斯圖嵌入,可以大大提高原輸入方法的顯著目標預測性能,并且最終結(jié)果達到與已有專注于顯著目標檢測的方法可比的性能。 (2)在視覺感知雙通路結(jié)構(gòu)啟發(fā)下,提出了一種基于混合特征核回歸模型的目標時空顯著性計算方法。視覺感知雙通路假設被普遍接受:視覺感知首先沿著腹部流通路和背部流通路分別進行,最終完成信息整合。在這一視覺感知流程啟發(fā)下,提出的時空顯著性計算方法包括三個主要模塊:空域顯著性計算對應腹部流通路的外觀感知功能;時域顯著性計算對應背部流通路的運動感知功能:時空顯著性融合對應雙通路的信息整合功能。為了應對時空顯著性的融合問題,首次提出混合特征空間核回歸模型誘導下的三種估計子,包括常數(shù)估計子、線性估計子和非線性估計子。結(jié)合三種估計子,創(chuàng)造性的提出了一種混合融合算法。實驗結(jié)果表明所提出的混合融合算法明顯優(yōu)于已有時空顯著性融合算法。得益于該混合融合算法,所提出的時空顯著性計算方法取得比已有方法更好的性能。 (3)在背部流感知通路反饋連接啟發(fā)下,提出了一種多級處理算法來解決機載紅外運動目標檢測問題。大量的神經(jīng)生理學實驗表明負責運動信息處理的背部流通路的處理速度遠遠快于負責外觀信息處理的腹部流通路,并且呈現(xiàn)出明顯的背部流通路反饋調(diào)節(jié)腹部流通路的特性。在這一不對稱連接特性啟發(fā)下,提出一種實時機載紅外運動目標檢測算法,主要包括三級處理流程:快速運動感知;候選運動焦點及運動窗獲;運動窗內(nèi)目標精確提取。實驗結(jié)果表明提出的多級處理算法在計算效率和檢測精度兩方面都優(yōu)于已有的算法。 (4)在視皮層層次化感知特性啟發(fā)下,提出了一種無監(jiān)督層次化特征提取方法并應用于目標和場景分類識別任務。大量的神經(jīng)生理學證據(jù)表明人類具有優(yōu)越的目標感知和判別能力是因為視皮層的不同皮層區(qū)域能夠響應由低級到高級不斷抽象的特征。具體來說,初級視皮層V1區(qū)細胞對類Gabor濾波器的低階邊緣比較敏感,而高級視皮層V2區(qū)細胞對高階的角點、連接點等特征比較敏感。從可視結(jié)果來看,所提出的層次化特征提取方法中的第一級特征表達的基函數(shù)類似于V1區(qū)細胞響應,并且第二級特征表達的基函數(shù)類似于V2區(qū)細胞響應。該特征提取方法在10類目標分類任務的CIFAR-10數(shù)據(jù)庫和21類遙感影像場景分類任務的UCM-21數(shù)據(jù)庫上,均取得了理想的分類效果。
[Abstract]:In recent years , a large number of automatic target detection and recognition algorithms have been put forward in order to improve the intelligence level of the machine vision perception system .
In the light of biovisual perception , a series of target detection and recognition techniques are studied in this paper , focusing on the research of the techniques of spatial salient object detection , space - time salient object detection , airborne infrared moving target detection and non - supervised hierarchical feature extraction and its application in classification recognition , which are as follows :
( 1 ) Based on the perception enhancement theory in selective visual attention , a method for calculating the target spatial significance based on Cauchy ' s embedding is presented . Based on this theory , the method is based on the classical focus prediction method , which is used to simulate the diffusion process of focus . The experimental results show that the embedded visual organization is superior to the traditional Laplacian image embedding , which can greatly improve the prediction performance of the original input method .
( 2 ) In the light of the visual perception double - path structure , a method for calculating the objective time - space significance based on the hybrid characteristic kernel regression model is proposed . The visual perception double - path assumption is generally accepted : the visual perception is firstly carried out along the abdomen flow path and the back flow path respectively , and finally the information integration is finished . Under the inspiration of this visual perception process , the proposed temporal and spatial significance calculation method comprises three main modules : the airspace significance calculation corresponds to the appearance perception function of the abdominal flow path ;
In order to solve the fusion problem of space - time significance , three kinds of estimation sub - parameters , including the constant estimator , the linear estimator and the non - linear estimator , are proposed for the first time in order to deal with the fusion problem of space - time significance . The results show that the proposed hybrid fusion algorithm is superior to the existing spatial - temporal significance fusion algorithm .
( 3 ) Inspired by the feedback connection of the back flow sensing path , a multi - level processing algorithm is proposed to solve the airborne infrared motion target detection problem . A large number of neurophysiology experiments show that the processing speed of the back flow path for the motion information processing is much faster than that of the abdominal flow path responsible for the appearance information processing .
candidate motion focus and motion window acquisition ;
The experimental results show that the proposed multi - level processing algorithm is superior to the existing algorithms in terms of efficiency and precision .
( 4 ) Based on the hierarchical cognitive characteristics of visual cortex , a hierarchical feature extraction method is proposed and applied to target and scene classification recognition tasks .
【學位授予單位】:華中科技大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.41
【相似文獻】
相關期刊論文 前10條
1 劉利剛;;打造學術一流的聯(lián)合實驗室——浙江大學視覺感知教育部-微軟重點實驗室[J];計算機教育;2007年11期
2 柯爾挺;厲力華;劉偉;徐偉棟;張娟;張凌男;ZHENG Bin;;基于視覺感知信息的乳腺鉬靶腫塊檢測分析與自動提取[J];中國生物醫(yī)學工程學報;2014年01期
3 魏政剛,袁杰輝,蔡元龍;一種基于視覺感知的圖像質(zhì)量評價方法[J];電子學報;1999年04期
4 楊建國,肖永劍,王兆安;交通微觀仿真中的駕駛員視覺感知模型[J];系統(tǒng)仿真學報;2005年10期
5 周靜;;富士施樂開發(fā)出基于人類視覺感知的全新圖像編輯技術[J];計算機與網(wǎng)絡;2014年14期
6 辜小花;;基于視覺感知和邊緣保持的光照不變?nèi)四樧R別[J];電子學報;2013年08期
7 劉明晶,葉懋冬,劉國棟,李澄清;一種基于視覺感知的圖像質(zhì)量評價方法[J];計算機工程與設計;2005年02期
8 畢雁冰;;可行區(qū)域視覺感知的一種設置方法[J];機電產(chǎn)品開發(fā)與創(chuàng)新;2008年01期
9 陶超;譚毅華;蔡華杰;田金文;;符合人類視覺感知的圖像對象分割方法[J];計算機工程;2010年24期
10 董天陽;范允易;范菁;;保持視覺感知的三維樹木葉片模型分治簡化方法[J];計算機輔助設計與圖形學學報;2013年05期
相關會議論文 前5條
1 王書榮;;眼睛運動及其對視覺感知的影響[A];第十一次中國生物物理學術大會暨第九屆全國會員代表大會摘要集[C];2009年
2 薛青;徐文超;鄭長偉;劉永紅;;基于有限理性的虛擬視覺感知因子分析[A];第13屆中國系統(tǒng)仿真技術及其應用學術年會論文集[C];2011年
3 楊敏;梁瑋;李善青;賈云得;;一種基于交互式學習的穿戴視覺感知方法[A];第七屆和諧人機環(huán)境聯(lián)合學術會議(HHME2011)論文集【oral】[C];2011年
4 蒲翠翠;孟放;姜秀華;高慧;;一種基于視覺感知的視頻質(zhì)量客觀評價方法[A];圖像圖形技術研究與應用2009——第四屆圖像圖形技術與應用學術會議論文集[C];2009年
5 廖毅;程志全;黨崗;;一種基于顯著性分析的網(wǎng)格分割算法[A];中國圖學新進展2007——第一屆中國圖學大會暨第十屆華東六省一市工程圖學學術年會論文集[C];2007年
相關重要報紙文章 前2條
1 田學科;原有記憶會降低視覺感知能力[N];科技日報;2011年
2 劉孝沅;用視覺感知的新聞[N];中國新聞出版報;2003年
相關博士學位論文 前10條
1 李彥勝;生物視覺感知啟發(fā)下的目標檢測與識別技術研究[D];華中科技大學;2015年
2 楊恒伏;結(jié)合視覺感知的圖像認證與數(shù)據(jù)隱藏算法研究[D];湖南大學;2009年
3 聶一鳴;高速公路自主駕駛汽車視覺感知算法研究[D];國防科學技術大學;2012年
4 鄭雅羽;基于視覺感知的H.264感興趣區(qū)域編碼研究[D];浙江大學;2008年
5 向遙;基于視覺感知的圖像處理方法研究[D];中南大學;2011年
6 楊文璐;視覺感知模型與編碼算法研究[D];上海交通大學;2008年
7 杜興;視覺感知機制啟發(fā)的人臉識別方法研究[D];重慶大學;2012年
8 于江波;視覺感知計算模型若干問題的研究及其應用[D];北京交通大學;2007年
9 沈云濤;基于視覺感知特性的圖像檢索研究[D];西北工業(yè)大學;2005年
10 李曉華;顯示系統(tǒng)分辨率和動態(tài)偽像測量評估研究[D];東南大學;2006年
相關碩士學位論文 前10條
1 肖燕霞;基于視覺感知的行為識別方法的研究與實現(xiàn)[D];電子科技大學;2014年
2 周圣云;基于視覺感知的室內(nèi)場景識別與理解[D];電子科技大學;2015年
3 范允易;輕量級的三維樹木構(gòu)建技術及應用[D];浙江工業(yè)大學;2012年
4 姜麗穎;生物視覺感知機制啟發(fā)下的圖像不變性特征表示方法研究[D];中國石油大學(華東);2014年
5 湯毓婧;基于人腦視覺感知機理的分類與識別研究[D];南京理工大學;2009年
6 李雙;乳腺鉬靶診斷中的視覺感知研究[D];杭州電子科技大學;2011年
7 林祥明;人類視覺感知經(jīng)驗的數(shù)學化表示及其在深度估算中的應用[D];復旦大學;2010年
8 宋磊;基于視覺感知的模型簡化算法研究與實現(xiàn)[D];大連理工大學;2006年
9 彭素靜;基于視覺感知機理的顯著區(qū)域研究[D];重慶大學;2009年
10 陳金龍;面向圖像處理應用的生物視覺感知計算模型研究[D];杭州電子科技大學;2014年
,本文編號:1754496
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1754496.html