天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于視覺認(rèn)知的目標(biāo)識別技術(shù)研究

發(fā)布時間:2017-03-17 15:07

  本文關(guān)鍵詞:基于視覺認(rèn)知的目標(biāo)識別技術(shù)研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:在機器學(xué)習(xí)、模式識別和計算機視覺等領(lǐng)域,目標(biāo)識別一直是最具挑戰(zhàn)性的難題之一。研究目標(biāo)識別技術(shù)是解決目標(biāo)跟蹤、行為理解和場景分析等復(fù)雜視覺任務(wù)的基礎(chǔ),具有重要的實用價值和理論指導(dǎo)意義,已成為非常重要的研究熱點和難點。目標(biāo)識別是利用計算機對圖像進行處理、分析和理解,獲取感興趣的目標(biāo)或區(qū)域相關(guān)信息的技術(shù)。研究目標(biāo)識別技術(shù)的最終目標(biāo)是,使計算機像人腦視皮層一樣快捷高效地“讀懂”圖片的內(nèi)容,引領(lǐng)我們進入更加智能的未來。這也促進了對生物視覺認(rèn)知機制及其智能性進行研究的興趣。尤其是在復(fù)雜惡劣環(huán)境下,需要處理視覺信息時,傳統(tǒng)的基于統(tǒng)計學(xué)習(xí)的計算機視覺方法遇到較大困難。鑒于此,如何從視覺認(rèn)知的角度去研究和設(shè)計計算機視覺算法成為一項迫切而又富有挑戰(zhàn)性的任務(wù)。本文主要針對生物視覺認(rèn)知系統(tǒng)的關(guān)鍵環(huán)節(jié)—分層最大化和學(xué)習(xí)機制開展研究工作,在深刻理解其運行機制和原理的基礎(chǔ)上,將其運用于目標(biāo)分類、識別系統(tǒng),并在靜態(tài)2D圖像數(shù)據(jù)集和連續(xù)幀2D圖像數(shù)據(jù)集上對優(yōu)化的算法模型進行性能評估和分析,取得了重要的進展。首先,研究了兩個經(jīng)典的基于生物視覺的計算模型HTM(分層時序模型)和HAMX(分層最大化模型)。然后,結(jié)合視覺認(rèn)知機制重新設(shè)計優(yōu)化了傳統(tǒng)的計算機視覺模型。具體研究內(nèi)容如下:(1)針對傳統(tǒng)目標(biāo)識別模型存在通用性差、目前尚未與視覺認(rèn)知機制有效結(jié)合等難題,首先對HMAX和HTM兩個仿腦模型進行了計算理論層次與算法設(shè)計層次上的分析,指出其本質(zhì)上和計算機視覺模型的原理對應(yīng)關(guān)系。然后,詳細(xì)分析了視覺認(rèn)知理論在目標(biāo)分類、識別中的應(yīng)用。(2)針對光照突變導(dǎo)致識別時檢測率低的問題,提出結(jié)合優(yōu)化的同態(tài)濾波算法,設(shè)計了基于Patch的更具區(qū)分性的LBP特征,改進后的算法應(yīng)用于目標(biāo)識別系統(tǒng),實驗結(jié)果驗證了優(yōu)化后算法的有效性和可行性。(3)針對遮擋情況下,有效檢測目標(biāo),并同時能識別出遮擋目標(biāo)的可見部分是目前面臨的一個主要挑戰(zhàn),研究該方向有具有一定的理論指導(dǎo)意義和實際工程價值。針對上述難點本文提出結(jié)合外觀特征和幀間運動信息對目標(biāo)進行顯式遮擋建模的方法。該方法將基于單幀的部件級目標(biāo)檢測與基于連續(xù)幀的目標(biāo)遮擋估計相融合,解決了因為可利用信息不足導(dǎo)致識別性能不高的難題,有效提升了遮擋情況下的目標(biāo)檢測率。(4)針對傳統(tǒng)的視皮層前饋分層模型僅局限于探討目標(biāo)分類問題,提出了一種面向多視角目標(biāo)檢測的視皮層前饋分層模型。該模型采用基于視角的目標(biāo)表達方法,通過增加一個簡單單元層來表達目標(biāo)的不同視角,增加一個復(fù)雜單元層來表達不同視角簡單單元的投票結(jié)果,從而完成視角不變的目標(biāo)檢測。學(xué)習(xí)方面,在原有的底層特征分片學(xué)習(xí)的基礎(chǔ)上,該模型在高層增加了對視角的學(xué)習(xí),從而形成一個兩層的學(xué)習(xí)結(jié)構(gòu),這一結(jié)構(gòu)可以有效的提高學(xué)習(xí)的效率。在PASCAL VOC2011數(shù)據(jù)集上的測試結(jié)果表明,改進后的模型性能與傳統(tǒng)的計算模型相比,取得了更好的檢測效果。(5)針對被檢測目標(biāo)在視角變化和遮擋時較難識別的問題,提出利用多特征融合的方式來降低視角的干擾,聯(lián)合利用Gabor特征和視角變換時共有的LIOP特征(Local Intensity Order Pattern)對目標(biāo)進行多角度識別的新算法。首先,利用二維Gabor濾波器組對輸入圖像進行濾波,得到含有方向信息的Gabor特征響應(yīng)圖,進而通過相關(guān)算法得到具有尺度及平移不變的特征向量。其次,通過幾何變換算法獲得不同視角下的LIOP特征向量。然后,為了降低時間復(fù)雜度,通過主成分分析算法(principal component analysis)對聯(lián)合特征降維。最后,把降維后的特征向量輸入支持向量機(SVM)進行訓(xùn)練學(xué)習(xí),得到檢測器模型。綜上,本文針對在復(fù)雜場景下,傳統(tǒng)目標(biāo)識別存在一定局限性的問題,圍繞如何利用、模擬生物視覺認(rèn)知機制的特性。對傳統(tǒng)的目標(biāo)分類、識別領(lǐng)域等關(guān)鍵問題和算法模型進行探索和指導(dǎo),初步實現(xiàn)了基于視覺認(rèn)知的目標(biāo)識別功能,完成課題既定研究任務(wù),并取得了階段性成果。為進一步的算法研究提供了理論基礎(chǔ),對研究生物視覺和計算機視覺也具有一定的借鑒意義。
【關(guān)鍵詞】:視覺認(rèn)知 目標(biāo)識別 復(fù)雜場景 分層最大化 機器學(xué)習(xí) 多視角
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【目錄】:
  • 摘要5-7
  • ABSTRACT7-13
  • 第一章 緒論13-32
  • 1.1 課題研究背景意義13-15
  • 1.2 國內(nèi)外研究現(xiàn)狀與發(fā)展趨勢15-28
  • 1.2.1 問題描述15-18
  • 1.2.2 在計算機視覺領(lǐng)域目標(biāo)識別技術(shù)的研究現(xiàn)狀18-23
  • 1.2.3 在生物視覺領(lǐng)域目標(biāo)識別技術(shù)的研究現(xiàn)狀23-28
  • 1.3 本文主要研究內(nèi)容28-30
  • 1.4 本文的組織結(jié)構(gòu)30-32
  • 第二章 視覺認(rèn)知特性和計算視覺模型32-44
  • 2.1 人類視覺認(rèn)知處理機制32-36
  • 2.2 特征和統(tǒng)計學(xué)習(xí)模型36-39
  • 2.3 基于視覺認(rèn)知的計算模型39-42
  • 2.3.1 神經(jīng)網(wǎng)絡(luò)模型39-40
  • 2.3.2 HTM模型40-41
  • 2.3.3 深度學(xué)習(xí)41-42
  • 2.4 本章小結(jié)42-44
  • 第三章 適應(yīng)光照突變的目標(biāo)識別44-54
  • 3.1 同態(tài)濾波處理光敏感44-45
  • 3.2 局部二值模式(LBP)紋理特征45-47
  • 3.3 自適應(yīng)閾值和LBP聯(lián)合特征47-49
  • 3.4 算法評價標(biāo)準(zhǔn)49-51
  • 3.5 實驗結(jié)果與分析51-53
  • 3.6 本章小結(jié)53-54
  • 第四章 基于外觀和運動信息的目標(biāo)識別54-64
  • 4.1 相關(guān)研究工作54-55
  • 4.2 基于外觀信息的部件級目標(biāo)檢測55-57
  • 4.2.1 訓(xùn)練部分目標(biāo)檢測器55-56
  • 4.2.2 基于語義部件的重評分56-57
  • 4.3 基于運動信息的遮擋估計57-61
  • 4.3.1 光流圖像的分割58-59
  • 4.3.2 遮擋估計59-61
  • 4.4 實驗結(jié)果與分析61-63
  • 4.5 本章小結(jié)63-64
  • 第五章 基于視皮層前饋模型的目標(biāo)識別64-76
  • 5.1 相關(guān)工作研究64-66
  • 5.2 HMAX模型理論基礎(chǔ)66-67
  • 5.2.1 S1層簡單特征66-67
  • 5.2.2 C1層復(fù)雜特征67
  • 5.2.3 S2層合成特征67
  • 5.2.4 C2層綜合特征67
  • 5.3 基于HMAX模型的多視角目標(biāo)識別67-68
  • 5.3.1 簡單單元層68
  • 5.3.2 復(fù)雜單元層68
  • 5.4 基于視覺不變性的訓(xùn)練學(xué)習(xí)68-71
  • 5.4.1 S2層的特征分片學(xué)習(xí)69-70
  • 5.4.2 S3層的視角學(xué)習(xí)70-71
  • 5.5 實驗結(jié)果與分析71-74
  • 5.6 本章小結(jié)74-76
  • 第六章 基于Gabor和LIOP特征的多視角目標(biāo)識別76-87
  • 6.1 引言76-77
  • 6.2 多視角檢測系統(tǒng)工作原理與分析77-82
  • 6.2.1 Gabor特征提取77-79
  • 6.2.2 共有LIOP特征提取79-80
  • 6.2.3 特征降維80-82
  • 6.3 分類器設(shè)計82-83
  • 6.4 實驗結(jié)果與分析83-86
  • 6.5 本章小結(jié)86-87
  • 第七章 總結(jié)與展望87-90
  • 7.1 工作與總結(jié)87-88
  • 7.2 本文主要創(chuàng)新點88-89
  • 7.3 深入與展望89-90
  • 致謝90-92
  • 參考文獻92-106
  • 攻博期間取得的研究成果106-107

  本文關(guān)鍵詞:基于視覺認(rèn)知的目標(biāo)識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。



本文編號:253060

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/253060.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶526dc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com