基于卷積神經(jīng)網(wǎng)絡(luò)的手勢(shì)識(shí)別算法研究
發(fā)布時(shí)間:2018-03-25 01:30
本文選題:手勢(shì)識(shí)別 切入點(diǎn):聾啞人交互 出處:《吉林大學(xué)》2017年碩士論文
【摘要】:手勢(shì)不僅僅是自然高效的交互方式,也是聾啞人與正常人交互的唯一途徑,但是很多正常人并沒(méi)有掌握手語(yǔ),因此,需要中間人進(jìn)行翻譯,才能使正常人與聾啞人進(jìn)行交流。如果能夠人工智能來(lái)對(duì)手語(yǔ)進(jìn)行自動(dòng)翻譯,將會(huì)大大提高聾啞人與外界交流的效率。本文就是在這一研究背景下,利用卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)手勢(shì)識(shí)別進(jìn)行研究。文章首先對(duì)手勢(shì)識(shí)別的發(fā)展歷程和研究進(jìn)展進(jìn)行了研究和分析,并對(duì)深度學(xué)習(xí)算法進(jìn)行了比較,選用卷積神經(jīng)網(wǎng)絡(luò)作為手勢(shì)識(shí)別的算法基礎(chǔ)。在此基礎(chǔ)上,對(duì)卷積神經(jīng)網(wǎng)絡(luò)的工作原理和訓(xùn)練過(guò)程進(jìn)行了詳細(xì)分析,明確網(wǎng)絡(luò)結(jié)構(gòu)、卷積核大小、池化方法、池化尺寸、激活函數(shù)、學(xué)習(xí)率等對(duì)系統(tǒng)性能的影響,然后在LeNet-5模型基礎(chǔ)上進(jìn)行改進(jìn),并通過(guò)MNIST和CIFAR-10兩個(gè)公認(rèn)數(shù)據(jù)集上進(jìn)行對(duì)比試定量分析影響神經(jīng)網(wǎng)絡(luò)性能的因素,應(yīng)由此確定實(shí)驗(yàn)方案為:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后利用信息量較少的灰度圖像對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并與未經(jīng)預(yù)處理的圖像識(shí)別結(jié)果進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果表明,預(yù)處理之后的數(shù)據(jù)集在識(shí)別準(zhǔn)確率和識(shí)別速度方面都具有優(yōu)勢(shì),驗(yàn)證了論文實(shí)驗(yàn)方案的有效性。最終識(shí)別平均準(zhǔn)確率為93.8%,具有實(shí)際應(yīng)用意義,能夠?yàn)榻窈竺@啞人交流系統(tǒng)提供借鑒。
[Abstract]:鎵嬪娍涓嶄粎浠呮槸鑷劧楂樻晥鐨勪氦浜掓柟寮,
本文編號(hào):1660959
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1660959.html
最近更新
教材專(zhuān)著