基于語義結(jié)構(gòu)和視覺焦點的場景目標識別
本文關(guān)鍵詞:基于語義結(jié)構(gòu)和視覺焦點的場景目標識別,,由筆耕文化傳播整理發(fā)布。
【摘要】:復(fù)雜場景中的目標檢測以及識別一直都是機器視覺、人工智能、模式識別和圖像處理領(lǐng)域的熱點研究技術(shù)之一,并且被廣泛的應(yīng)用在軍事科技、工業(yè)安防、日常生活、醫(yī)療氣象等各個方面。像目前發(fā)展迅速的Google和百度的無人車、大疆創(chuàng)新開發(fā)的無人機、愛奇藝的視頻廣告投放、高新興科技的智慧城市以及Magic Leap技術(shù)等,這些目標檢測識別的應(yīng)用與我們的生活如影隨形。因此,提高復(fù)雜場景中目標的識別率和實時性就具有非常重要的意義。本文所做的改進工作主要包括以下兩個方面。首先,經(jīng)典的脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)+ITTI模型值雖然可以確定整個場景的目標物體,但是分離而出的目標物體中還會將背景圖像也分離進去,并且無法將單個目標分別分離而出,因此會對后續(xù)要提取的特征向量有較大的影響,嚴重的影響了識別率。改進的MeanShift+ITTI模型,可以將整個目標分離而出,并且只帶有少量的背景信息,實現(xiàn)了很好的目標物的分離,但是同樣無法實現(xiàn)將多目標場景的分離。因此,本文提出了基于視覺焦點的改進ITTI模型,可以實現(xiàn)多目標復(fù)雜場景的目標物體分離,同時對于目標物與目標物之間的遮擋、粘連情況也具有較好的識別效果。其次,本文提出了將自然語言處理中的的語義機制應(yīng)用于SVM分類器模型中,對于SVM分類不滿足自然場景語義機制的打分,選取打分次高者作為判斷的類別,并以此類推,使得重新進行目標識別后可以給出滿足自然場景語義機制的識別結(jié)果,并且在時間上只有稍微的延時,同時,對識別率有了一定的提升。綜上所述,本文提出的基于語義結(jié)構(gòu)和視覺焦點的復(fù)雜場景目標檢測識別技術(shù)具有自適應(yīng)性好、識別率高、實時性好等特點。有望被各種目標識別技術(shù)應(yīng)用和借鑒。
【關(guān)鍵詞】:目標檢測識別 語義結(jié)構(gòu) 視覺焦點 可支持向量機 自然語言處理
【學(xué)位授予單位】:中北大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要4-5
- abstract5-9
- 1.緒論9-19
- 1.1 課題研究背景及意義9-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-17
- 1.2.1 國內(nèi)研究現(xiàn)狀12-15
- 1.2.2 國外研究現(xiàn)狀15-17
- 1.3 主要研究內(nèi)容及結(jié)構(gòu)安排17-19
- 1.3.1 主要研究內(nèi)容17-18
- 1.3.2 結(jié)構(gòu)安排18-19
- 2.Gist+濾波器組構(gòu)成的特征向量19-30
- 2.1 圖像直方圖基礎(chǔ)19-20
- 2.2 LAB空間變換基礎(chǔ)20-21
- 2.3 圖像濾波基礎(chǔ)21-27
- 2.3.1 高斯濾波22-24
- 2.3.2 高斯拉普拉斯濾波24-25
- 2.3.3 Gabor濾波25-27
- 2.4 Gist+濾波器組生成的特征向量提取27-29
- 2.5 本章小結(jié)29-30
- 3.改進的視覺注意力焦點模型30-46
- 3.1 傳統(tǒng)的ITTI模型31-37
- 3.2 MeanShift+ITTI模型37-40
- 3.3 視覺焦點+ITTI模型40-42
- 3.4 各種算子定位結(jié)果比較42-44
- 3.5 本章小結(jié)44-46
- 4.語義機制改進的機器學(xué)習46-63
- 4.1 可支持向量機SVM51-57
- 4.2 Libsvm和Liblinear57-58
- 4.3 場景語義機制的SVM58-62
- 4.4 本章小結(jié)62-63
- 5.基于語義結(jié)構(gòu)和視覺焦點的目標識別算法實現(xiàn)63-67
- 5.1 實驗環(huán)境描述63
- 5.2 算法步驟流程63-64
- 5.3 實驗仿真結(jié)果及分析64-66
- 5.4 本章小結(jié)66-67
- 6.總結(jié)與展望67-69
- 6.1 工作總結(jié)67
- 6.2 工作展望67-69
- 參考文獻69-74
- 攻讀碩士期間發(fā)表的論文及所取得的研究成果74-75
- 致謝75-76
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 周山;;計算機視覺藝術(shù)在數(shù)字媒體的應(yīng)用[J];電子技術(shù)與軟件工程;2016年03期
2 劉鵬飛;吳成茂;聶敏;;基于偏移場校正的模糊局部C-均值聚類算法[J];激光雜志;2015年10期
3 徐仲勛;黃科程;;機器視覺構(gòu)造及應(yīng)用綜述[J];四川工程職業(yè)技術(shù)學(xué)院學(xué)報;2015年03期
4 夏永泉;JO Kang-hyun;甘勇;金保華;錢慎一;;計算機視覺在智能交通系統(tǒng)中的應(yīng)用研究綜述(英文)[J];鄭州輕工業(yè)學(xué)院學(xué)報(自然科學(xué)版);2014年06期
5 楊夢鐸;李凡長;張莉;;李群機器學(xué)習十年研究進展[J];計算機學(xué)報;2015年07期
6 顧軼凡;劉真;朱明;;基于高斯拉普拉斯算子的色域映射算法[J];包裝工程;2014年09期
7 何清;李寧;羅文娟;史忠植;;大數(shù)據(jù)下的機器學(xué)習算法綜述[J];模式識別與人工智能;2014年04期
8 盧文龍;王建軍;劉曉軍;;基于CUDA的高速并行高斯濾波算法[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2011年05期
9 賀穎;蒲曉蓉;;應(yīng)用Gabor濾波的指紋識別算法的研究和實現(xiàn)[J];計算機工程與應(yīng)用;2010年12期
10 盧旺盛;田增民;;機器人在外科領(lǐng)域應(yīng)用現(xiàn)狀[J];北京生物醫(yī)學(xué)工程;2010年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 汪啟偉;圖像直方圖特征及其應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2014年
2 劉尚旺;基于改進選擇性視覺注意模型的語義圖像分割研究[D];西北農(nóng)林科技大學(xué);2012年
3 趙海峰;基于圖的模式識別及其在計算機視覺中的應(yīng)用[D];南京理工大學(xué);2011年
4 劉R
本文編號:302791
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/302791.html