圖像特征識別算法及其在聾人視覺識別中的應(yīng)用研究
發(fā)布時間:2017-07-20 10:11
本文關(guān)鍵詞:圖像特征識別算法及其在聾人視覺識別中的應(yīng)用研究
更多相關(guān)文章: 圖像特征 聾人視覺 分水嶺算法 紋理一致性測度 改進(jìn)LBP BP模糊神經(jīng)網(wǎng)絡(luò)
【摘要】:隨著計算機(jī)技術(shù)和信息技術(shù)的飛速發(fā)展,3G生活已經(jīng)走進(jìn)了千家萬戶,4G技術(shù)也已經(jīng)開始嶄露頭角,這些高新技術(shù)的出現(xiàn),使人們的工作和生活產(chǎn)生了史無前例的巨大變化。借助這些高新技術(shù),人們的工作更加快捷,生活也更為便利,同時,對一直存在于我們身邊的弱勢群體——聾啞人群體也更加地關(guān)注。中國現(xiàn)有聾啞人2000多萬,為了使這2000多萬聾啞人更好更快地融入到正常社會生活之中,消除健全人與聾啞人之間交流的障礙,提高他們的生活質(zhì)量,真正地實(shí)現(xiàn)融合共生,構(gòu)建社會和諧,聾人視覺識別研究已受到國內(nèi)越來越多的專家和學(xué)者關(guān)注。在現(xiàn)有的各種聾人視覺識別算法中,處于主導(dǎo)地位的主要是基于數(shù)據(jù)手套的聾人視覺識別和基于數(shù)字圖像處理的聾人視覺識別方法。大部分研究是將兩種算法相結(jié)合,前者主要用于圖像的采集,而用后者進(jìn)行圖像的識別和處理,以便取得更好的識別效果。盡管聾人視覺識別已經(jīng)取得某些進(jìn)展,但仍然面臨如手勢不變特征的提取、手勢之間的過渡模型等許多挑戰(zhàn)性課題,導(dǎo)致目前的手語識別算法在識別率,健壯性等方面存在諸多不足。本文對上述問題進(jìn)行了研究,并取得了階段性的研究成果,且將其應(yīng)用于作者承擔(dān)開發(fā)的聾啞人視覺識別交流系統(tǒng)的應(yīng)用軟件研制,部分地已投入了實(shí)際教學(xué)試用。盡管該應(yīng)用軟件還存在許多有待改進(jìn)完善之處,但仍然取得了良好的應(yīng)用效果,并受到從事相關(guān)工作單位的肯定。從事研究期間的主要工作和創(chuàng)新性集中地歸納為以下幾個方面:①針對分水嶺算法對噪聲十分敏感,容易引起邊緣不連續(xù),偽邊緣、過分割等現(xiàn)象,提出一種基于形態(tài)學(xué)和分水嶺算法相結(jié)合的圖像幾何特征辨識算法。該算法借助前者獲取將圖像的前景色和背景色最大程序分開的最佳閾值,再利用該閾值對后者的路徑代價函數(shù)進(jìn)行限制,從而縮小查找范圍,提高了算法的執(zhí)行速度。②針對目前各種融合算法在圖像識別中存在的光譜特性扭曲、算法復(fù)雜度高,內(nèi)存需求量大,難以兼顧圖像的整體結(jié)構(gòu)和細(xì)節(jié)等問題,提出一種基于雙正交小波變換紋理一致性測度融合算法。該算法根據(jù)正交小波變換對于融合的源圖像分別進(jìn)行小波分解,其低頻系數(shù)按比例選取圖像的小波系數(shù)構(gòu)成融合圖像小波低頻系數(shù)矩陣,高頻系數(shù)采用紋理一致性測度分析特定區(qū)域不同高低頻系數(shù)的邊緣特性,并以一定規(guī)則確定融合圖像高頻小波系數(shù)矩陣。實(shí)驗結(jié)果表明,該融合算法既可較好地分辨出偽邊緣,使細(xì)節(jié)信息更加豐富和真實(shí),又兼顧了整體視覺效果,具有較好的識別效果。③針對手形識別的局限性,提出一種基于模糊BP神經(jīng)網(wǎng)絡(luò)的手語融合識別算法。該算法借助模糊BP神經(jīng)網(wǎng)絡(luò),將采集的手形和唇形圖像進(jìn)行融合計算,其融合圖像被分別視為手形和唇形模糊集,對模糊集進(jìn)行模糊算子操作,將操作結(jié)果與數(shù)據(jù)庫手語符號進(jìn)行匹配,然后將獲取的兩個手語集再進(jìn)行模糊集合運(yùn)算,最后得到識別結(jié)果。實(shí)驗表明了該算法的有效性。④針對在復(fù)雜光照條件下,傳統(tǒng)人臉特征識別算法往往忽略了局部區(qū)域像間的對比度,丟棄了部分重要的紋理特征信息,導(dǎo)致識別效果不理想,提出一種改進(jìn)的LBP人臉特征識別算法。該算法先對不同復(fù)雜光照下的人臉圖像進(jìn)行光照歸一化預(yù)處理,將光照變化控制在一定范圍之內(nèi),再借助改進(jìn)的LBP算法將局部區(qū)域像素間的對比度值映射為一個區(qū)間值,使光照變化引起的對比度值在控制區(qū)間內(nèi)波動,從而使圖像具有光照不變性,使之可較好地識別出人臉特征。
【關(guān)鍵詞】:圖像特征 聾人視覺 分水嶺算法 紋理一致性測度 改進(jìn)LBP BP模糊神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.41
【目錄】:
- 中文摘要3-5
- 英文摘要5-11
- 1 緒論11-23
- 1.1 研究的背景及意義11-12
- 1.2 聾人視覺識別的國內(nèi)外研究現(xiàn)狀12-16
- 1.3 聾人視覺識別的研究難點(diǎn)和發(fā)展方向16-19
- 1.4 聾人視覺識別的特征19
- 1.5 本文的研究內(nèi)容和結(jié)構(gòu)安排19-21
- 1.6 本章小結(jié)21-23
- 2 基于形態(tài)學(xué)和分水嶺的聾人視覺邊緣提取算法23-41
- 2.1 引言23
- 2.2 二值形態(tài)學(xué)23-28
- 2.3 模糊形態(tài)學(xué)28-32
- 2.3.1 模糊子集定義28
- 2.3.2 l水平截集28-29
- 2.3.3 模糊形態(tài)學(xué)算法29-30
- 2.3.4 模糊模式識別方法30-32
- 2.4 改進(jìn)的分水嶺算法32-33
- 2.4.1 分水嶺算法32
- 2.4.2 基于圖像森林變換的分水嶺算法32-33
- 2.5 改進(jìn)的邊緣提取算法33-39
- 2.5.1 自動識別最優(yōu)閾值的方法33-34
- 2.5.2 基于模糊形態(tài)學(xué)的邊緣提取算法研究34-36
- 2.5.3 實(shí)驗結(jié)果和分析36-39
- 2.6 本章小結(jié)39-41
- 3 雙正交小波變換紋理一致測度的聾人視覺融合算法41-59
- 3.1 引言41
- 3.2 背景知識41-43
- 3.2.1 圖像融合41-42
- 3.2.2 紋理一致性測度42-43
- 3.3 小波變換43-50
- 3.3.1 正交小波變換44
- 3.3.2 二尺度方程44-45
- 3.3.3 正交小波變換(Mallat塔式算法)45-47
- 3.3.4 快速小波變換的分解與重構(gòu)47-50
- 3.4 改進(jìn)的紋理一致性測度融合算法50-54
- 3.4.1 雙正交小波50-52
- 3.4.2 雙正交小波變換紋理一致測度的算法研究52-54
- 3.5 實(shí)驗結(jié)果及其分析54-57
- 3.5.1 融合算法計算結(jié)果55-56
- 3.5.2 融合算法性能分析56-57
- 3.6 本章小結(jié)57-59
- 4 基于模糊神經(jīng)網(wǎng)絡(luò)的聾人視覺識別算法59-75
- 4.1 引言59
- 4.2 BP神經(jīng)網(wǎng)絡(luò)59-63
- 4.2.1 BP神經(jīng)網(wǎng)絡(luò)模型59-60
- 4.2.2 BP神經(jīng)網(wǎng)絡(luò)算法60-63
- 4.3 模糊神經(jīng)網(wǎng)絡(luò)63-66
- 4.3.1 模糊系統(tǒng)63-65
- 4.3.2 模糊神經(jīng)網(wǎng)絡(luò)65-66
- 4.4 模糊BP神經(jīng)網(wǎng)絡(luò)的聾人視覺識別算法研究66-69
- 4.4.1 手語知識66
- 4.4.2 模糊神經(jīng)網(wǎng)絡(luò)架構(gòu)66-68
- 4.4.3 實(shí)現(xiàn)計算步驟68-69
- 4.5 實(shí)驗結(jié)果及分析69-73
- 4.5.1 算法實(shí)驗69-72
- 4.5.2 實(shí)驗性能分析72-73
- 4.6 本章小結(jié)73-75
- 5 復(fù)雜環(huán)境下聾人視覺表情識別75-89
- 5.1 引言75
- 5.2 LBP理論75-80
- 5.2.1 LBP算子的優(yōu)勢75-76
- 5.2.2 基本LBP算子76-80
- 5.2.3 LBP中的Ahonen方法80
- 5.3 改進(jìn)LBP算法在復(fù)雜環(huán)境下的聾人視覺表情識別80-84
- 5.3.1 ALBP算法思想81
- 5.3.2 提取LBP特征層81-82
- 5.3.3 光照歸一化預(yù)處理82-84
- 5.4 實(shí)驗結(jié)果及性能分析84-86
- 5.5 本章小結(jié)86-89
- 6 總結(jié)與展望89-91
- 6.1 本文研究工作總結(jié)89-90
- 6.2 工作展望90-91
- 致謝91-93
- 參考文獻(xiàn)93-101
- 附錄101-102
- A. 作者在攻讀博士學(xué)位期間錄用和發(fā)表論文情況101-102
- B. 作者在攻讀博士學(xué)位期間參加的科研項目102
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 王兆其,楊長水,高文;基于VRML的中國手語三維顯示[J];計算機(jī)研究與發(fā)展;2003年03期
2 高文,陳熙霖,馬繼勇,王兆其;基于多模式接口技術(shù)的聾人與正常人交流系統(tǒng)[J];計算機(jī)學(xué)報;2000年12期
3 鄧廷權(quán),陳延梅,吳從p,
本文編號:567486
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/567486.html
最近更新
教材專著