基于Kinect的實時手語識別技術(shù)研究
發(fā)布時間:2018-07-01 07:39
本文選題:動態(tài)手語識別 + Kinect; 參考:《南京航空航天大學(xué)》2016年碩士論文
【摘要】:手勢識別是當(dāng)前計算機(jī)視覺領(lǐng)域的熱點問題之一。手語作為一種特殊的手勢,是聾人與聾人、聾人與健聽人之間進(jìn)行交流的“語言”。對手語進(jìn)行自動識別,不僅可以創(chuàng)建聾人與健聽人之間的無障礙交流平臺,同時也可以提高計算機(jī)的感知能力,增加人機(jī)交互方式。本文使用體感攝像頭Kinect,它可以返回深度信息,同時具備對人體骨骼進(jìn)行識別定位的功能,本文正是利用Kinect這一特點,實現(xiàn)對動態(tài)手語的識別。動態(tài)手語可以利用手勢軌跡曲線加關(guān)鍵手型的方式進(jìn)行描述,但事實上大多數(shù)手語通過軌跡曲線的匹配即可完成識別。因此本文提出了一種對動態(tài)手語進(jìn)行分級匹配的識別策略。一級匹配通過對軌跡曲線的相似性度量完成;若通過一級匹配可以得到識別結(jié)果,那么識別過程可以結(jié)束,否則進(jìn)入二級匹配,即再對手語的關(guān)鍵手型做識別。由此,首先引入卡爾曼濾波對Kinect檢測到的手部位置進(jìn)行校正,同時利用Kinect返回的深度信息并結(jié)合卡爾曼濾波提出了一種手部區(qū)域的精確分割算法;然后提出了一種曲線的歸一化算法,用以消除不同手語者的動作、時間差異,同時還提出一種基于軌跡曲線密度的關(guān)鍵幀檢測算法,并從關(guān)鍵幀中提取手型特征,完成對手語的特征描述;最后,在一級匹配中,結(jié)合關(guān)鍵幀信息,對DTW算法做了優(yōu)化改進(jìn),使之更加適用于手勢軌跡曲線的相似性度量,二級匹配采用模板匹配的方式對關(guān)鍵手型的組合做識別。以上述算法為基礎(chǔ),使用C#為開發(fā)工具,本文設(shè)計完成了一個實時的動態(tài)手語識別系統(tǒng),該系統(tǒng)可以實現(xiàn)對60個常用動態(tài)手語的識別,且可以面向非特定人群。
[Abstract]:The recognition of dynamic sign language is realized by using Kinect .
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
,
本文編號:2087041
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2087041.html
最近更新
教材專著