基于視覺(jué)的人機(jī)交互動(dòng)作識(shí)別研究與DSP實(shí)現(xiàn)
本文關(guān)鍵詞:基于視覺(jué)的人機(jī)交互動(dòng)作識(shí)別研究與DSP實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著人工智能研究及應(yīng)用的不斷發(fā)展與成熟,其重要研究分支人機(jī)交互技術(shù)也逐漸從傳統(tǒng)的接觸式向非接觸式、界面式向自然式發(fā)展,如基于聽(tīng)覺(jué)的語(yǔ)音識(shí)別技術(shù)和基于視覺(jué)的圖像識(shí)別技術(shù)。但相比語(yǔ)音信號(hào),圖像信號(hào)更具穩(wěn)定性,可以承載更豐富的信息,所以基于視覺(jué)的人機(jī)交互技術(shù)吸引著大量學(xué)者和工程師的興趣,成為當(dāng)前一個(gè)研究熱點(diǎn)。基于視覺(jué)的人機(jī)交互技術(shù)關(guān)鍵是對(duì)以人為核心的圖像識(shí)別,尤其對(duì)人體各種姿勢(shì)動(dòng)作的識(shí)別和理解。目前該技術(shù)已經(jīng)廣泛應(yīng)用或者正在嘗試應(yīng)用于服務(wù)機(jī)器人、智能家居、智慧城市以及智能安防等諸多領(lǐng)域。目前基于視覺(jué)的人機(jī)交互技術(shù)實(shí)現(xiàn)普遍只針對(duì)有限的簡(jiǎn)單肢體動(dòng)作,如跑步、走路、原地跳等,并且有嚴(yán)格的條件限制,如必須正對(duì)攝像頭,不可以多個(gè)人體出現(xiàn),只適合簡(jiǎn)單背景環(huán)境等。此外,相關(guān)算法通常存在計(jì)算量大、內(nèi)存消耗嚴(yán)重、不適合嵌入式微型化發(fā)展等問(wèn)題。為提高基于視覺(jué)的人機(jī)交互技術(shù)普適性,增強(qiáng)在真實(shí)自然環(huán)境下的實(shí)用性,本論文以基于視覺(jué)的智能家居人機(jī)交互系統(tǒng)設(shè)計(jì)開(kāi)發(fā)為實(shí)踐,對(duì)所定義的7種一般性、通用性的人機(jī)交互手勢(shì)動(dòng)作在自然環(huán)境下的識(shí)別進(jìn)行了探究,并重點(diǎn)對(duì)各動(dòng)作的特征提取、特征建模和識(shí)別理解分別進(jìn)行了較深入的研究,同時(shí)提出新的方法和思路。經(jīng)實(shí)驗(yàn)測(cè)試,本系統(tǒng)對(duì)手勢(shì)動(dòng)作識(shí)別準(zhǔn)確度達(dá)79%以上,交互工作效率達(dá)75%以上,并且可以適應(yīng)不同的自然環(huán)境,工作過(guò)程與人體的空間位置、尺寸幾乎無(wú)關(guān)。本論文的主要工作及創(chuàng)新有以下幾點(diǎn):(1)以TI的DM642 DSP為視覺(jué)圖像處理器,以ARM7為主控制器,設(shè)計(jì)并搭建了基于視覺(jué)人機(jī)交互的智能家居管理系統(tǒng)實(shí)驗(yàn)平臺(tái)。定義了一套智能家居交互動(dòng)作手勢(shì)集,包括啟動(dòng)選擇、選擇肯定、選擇否定、開(kāi)關(guān)切換、功能上翻、功能下翻、暫停7種動(dòng)作指令。(2)在手勢(shì)動(dòng)作目標(biāo)檢測(cè)階段,提出了基于最近鄰域像素梯度穩(wěn)定性(N2PG)的視頻背景快速提取方法,解決了基于視覺(jué)的嵌入式人機(jī)交互設(shè)備,在真實(shí)自然環(huán)境中目標(biāo)檢測(cè)跟蹤困難的問(wèn)題。(3)在手勢(shì)動(dòng)作的初次識(shí)別階段,利用HMM模型并基于靜態(tài)特征記錄表的統(tǒng)計(jì)特征,解決了利用單幀圖像特征進(jìn)行動(dòng)作識(shí)別抗干擾性差的問(wèn)題,并且特征記錄表中每條靜態(tài)特征提取使用歸一化的幾何矩和低頻傅里葉描述子,實(shí)現(xiàn)了識(shí)別的方向無(wú)關(guān)、尺寸無(wú)關(guān)和位置無(wú)關(guān)。(4)在手勢(shì)動(dòng)作識(shí)別二次校驗(yàn)階段,提出基于速度方向變化特征的二-八碼(8位二進(jìn)制編碼)校驗(yàn)方法,實(shí)現(xiàn)對(duì)初步識(shí)別結(jié)果的快速匹配校驗(yàn)或者補(bǔ)充識(shí)別,大大提高人機(jī)交互系統(tǒng)對(duì)手勢(shì)的識(shí)別準(zhǔn)確度和魯棒性。
【關(guān)鍵詞】:機(jī)器視覺(jué) 人機(jī)交互 DSP HMM模型 手勢(shì)識(shí)別 嵌入式
【學(xué)位授予單位】:太原理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.41
【目錄】:
- 摘要3-5
- ABSTRACT5-14
- 第一章 緒論14-26
- 1.1 研究背景14-16
- 1.2 國(guó)內(nèi)外研究及現(xiàn)狀16-21
- 1.2.1 機(jī)器視覺(jué)技術(shù)的發(fā)展16-19
- 1.2.2 人機(jī)交互技術(shù)發(fā)展及現(xiàn)狀19-21
- 1.3 本課題的來(lái)源及研究意義21-22
- 1.4 本文工作安排22-26
- 第二章 實(shí)驗(yàn)平臺(tái)設(shè)計(jì)26-42
- 2.1 系統(tǒng)設(shè)計(jì)原理及工作方式介紹26-31
- 2.1.1 系統(tǒng)結(jié)構(gòu)及原理26-27
- 2.1.2 系統(tǒng)交互手勢(shì)定義27-29
- 2.1.3 人機(jī)交互模式29-31
- 2.2 實(shí)驗(yàn)平臺(tái)硬件設(shè)計(jì)及成品展示31-36
- 2.2.1 智能控制中心設(shè)計(jì)及特性32-34
- 2.2.2 視覺(jué)成員設(shè)計(jì)及特性34-35
- 2.2.3 智能燈設(shè)計(jì)及特性35-36
- 2.3 系統(tǒng)軟件架構(gòu)設(shè)計(jì)36-40
- 2.3.1 智能控制中心程序設(shè)計(jì)36-38
- 2.3.2 視覺(jué)成員程序設(shè)計(jì)38-40
- 2.4 本章小結(jié)40-42
- 第三章 目標(biāo)像素區(qū)域檢測(cè)及分割42-56
- 3.1 目標(biāo)檢測(cè)算法概述42-44
- 3.1.1 光流法42-43
- 3.1.2 vibe目標(biāo)檢測(cè)43
- 3.1.3 背景相減法43-44
- 3.2 N2PG實(shí)時(shí)背景提取算法分析44-50
- 3.2.1 相關(guān)定義44-45
- 3.2.2 最近鄰域像素梯度值特征分析45-46
- 3.2.3 二值圖像模型算法分析46-48
- 3.2.4 N2PG背景提取效果比對(duì)48-50
- 3.3 手勢(shì)目標(biāo)檢測(cè)50-53
- 3.3.1 基于N2PG背景提取50-52
- 3.3.2 N2PG穩(wěn)定性閾值動(dòng)態(tài)估計(jì)52
- 3.3.3 目標(biāo)像素檢測(cè)52-53
- 3.4 手勢(shì)圖像分割53-54
- 3.5 本章小結(jié)54-56
- 第四章 交互手勢(shì)特征提取與識(shí)別56-72
- 4.1 人機(jī)交互手勢(shì)動(dòng)作特點(diǎn)分析56-58
- 4.2 手勢(shì)動(dòng)作基本特征提取58-62
- 4.2.1 幾何矩理論58-59
- 4.2.2 傅里葉描述子59-60
- 4.2.3 靜態(tài)基本特征提取60-61
- 4.2.4 動(dòng)態(tài)基本特征提取61-62
- 4.3 特征記錄表狀態(tài)分析62-67
- 4.3.1 靜態(tài)統(tǒng)計(jì)特征描述62-66
- 4.3.2 動(dòng)態(tài)特征編碼(二-八碼)66-67
- 4.4 交互手勢(shì)動(dòng)作識(shí)別67-71
- 4.4.1 隱馬爾科夫模型67-68
- 4.4.2 參數(shù)分析與訓(xùn)練68-69
- 4.4.3 手勢(shì)識(shí)別69-71
- 4.5 本章小結(jié)71-72
- 第五章 算法檢驗(yàn)及DSP實(shí)現(xiàn)72-84
- 5.1 DSP實(shí)現(xiàn)的工作原理及關(guān)鍵配置72-77
- 5.1.1 DSP工作原理72-73
- 5.1.2 基于DSP/BOIS軟件開(kāi)發(fā)簡(jiǎn)介73-75
- 5.1.3 DSP關(guān)鍵配置75-77
- 5.2 系統(tǒng)實(shí)驗(yàn)性能測(cè)試77-82
- 5.2.1 公共數(shù)據(jù)集77-79
- 5.2.2 自建數(shù)據(jù)集79
- 5.2.3 實(shí)驗(yàn)及結(jié)果總結(jié)79-82
- 5.3 本章小結(jié)82-84
- 第六章 結(jié)論與展望84-86
- 參考文獻(xiàn)86-92
- 致謝92-94
- 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文94
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 胡雅琴;;動(dòng)作識(shí)別技術(shù)及其發(fā)展[J];電視技術(shù);2013年S2期
2 倪世宏,史忠科,謝川,王彥鴻;軍用戰(zhàn)機(jī)機(jī)動(dòng)飛行動(dòng)作識(shí)別知識(shí)庫(kù)的建立[J];計(jì)算機(jī)仿真;2005年04期
3 程祥;;人體動(dòng)作識(shí)別的研究[J];電腦知識(shí)與技術(shù);2006年20期
4 黃飛躍;徐光yP;;視角無(wú)關(guān)的動(dòng)作識(shí)別[J];軟件學(xué)報(bào);2008年07期
5 徐光yP;曹媛媛;;動(dòng)作識(shí)別與行為理解綜述[J];中國(guó)圖象圖形學(xué)報(bào);2009年02期
6 黃麗鴻;高智勇;劉海華;;基于脈沖神經(jīng)網(wǎng)絡(luò)的人體動(dòng)作識(shí)別[J];現(xiàn)代科學(xué)儀器;2012年02期
7 周艷青;王磊;;基于視覺(jué)的人體動(dòng)作識(shí)別綜述[J];山東輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年01期
8 曹琨;;基于檢索表的實(shí)時(shí)動(dòng)作識(shí)別技術(shù)研究[J];中外企業(yè)家;2014年05期
9 劉博;安建成;;基于關(guān)鍵姿勢(shì)的人體動(dòng)作識(shí)別[J];電視技術(shù);2014年05期
10 王燕;張紹武;凌志剛;潘泉;;基于圖嵌入線性拓展方法的人體動(dòng)作識(shí)別研究[J];計(jì)算機(jī)仿真;2008年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前7條
1 袁飛;程韜波;周松斌;肖先文;;基于加速度特征的可拓動(dòng)作識(shí)別方法[A];廣州市儀器儀表學(xué)會(huì)2009年學(xué)術(shù)年會(huì)論文集[C];2010年
2 黃飛躍;徐光yP;;自然的人體動(dòng)作識(shí)別[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
3 葉喜勇;陶霖密;王國(guó)建;邸慧軍;;視角無(wú)關(guān)的人體軀干動(dòng)作識(shí)別[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
4 黃艷歡;葉少珍;;連續(xù)動(dòng)作分割綜述[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年
5 董力賡;陶霖密;徐光yP;;頭部姿態(tài)和動(dòng)作的識(shí)別與理解[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
6 朱巖;趙旭;劉允才;;基于稀疏編碼和局部時(shí)空特征的人體動(dòng)作識(shí)別[A];第十五屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
7 席旭剛;金燕;朱海港;高云園;;基于小波包熵和支持向量機(jī)的手部肌電信號(hào)動(dòng)作識(shí)別[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 本報(bào)記者 陳丹;人與機(jī)器的“對(duì)話”[N];科技日?qǐng)?bào);2010年
2 ;凌空敲鍵盤(pán)?無(wú)線計(jì)算機(jī)手套問(wèn)世[N];中國(guó)計(jì)算機(jī)報(bào);2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 諶先敢;現(xiàn)實(shí)環(huán)境下的人體動(dòng)作識(shí)別[D];武漢大學(xué);2012年
2 陳淵博;視頻序列中的人體動(dòng)作識(shí)別[D];北京郵電大學(xué);2015年
3 劉翠微;視頻中人的動(dòng)作分析與理解[D];北京理工大學(xué);2015年
4 陳萌;基于李代數(shù)高斯表示的動(dòng)作識(shí)別方法研究[D];華中科技大學(xué);2016年
5 任海兵;非特定人自然的人體動(dòng)作識(shí)別[D];清華大學(xué);2003年
6 成娟;基于表面肌電和加速度信號(hào)融合的動(dòng)作識(shí)別和人體行為分析研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
7 鄧小宇;面向智能視頻監(jiān)控的前景提取和動(dòng)作識(shí)別技術(shù)研究[D];浙江大學(xué);2012年
8 鄧?yán)?三維人體動(dòng)作識(shí)別及其在交互舞蹈系統(tǒng)上的應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
9 曹雛清;面向多方式人際交互的肢體動(dòng)作識(shí)別研究[D];哈爾濱工業(yè)大學(xué);2012年
10 吳心筱;圖像序列中人的姿態(tài)估計(jì)與動(dòng)作識(shí)別[D];北京理工大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張思亮;體感交互系統(tǒng)的人體動(dòng)作識(shí)別研究[D];華南理工大學(xué);2015年
2 應(yīng)銳;基于關(guān)鍵幀及原語(yǔ)的人體動(dòng)作識(shí)別研究[D];復(fù)旦大學(xué);2014年
3 陳凌琛;基于Kinect的動(dòng)作識(shí)別研究及在教學(xué)中的應(yīng)用[D];昆明理工大學(xué);2015年
4 張孫培;基于關(guān)節(jié)數(shù)據(jù)和極限學(xué)習(xí)機(jī)的人體動(dòng)作識(shí)別[D];南京理工大學(xué);2015年
5 邱春明;基于運(yùn)動(dòng)幅度變化率的視頻人體動(dòng)作識(shí)別[D];河北大學(xué);2015年
6 康欽謀;視頻人體動(dòng)作識(shí)別算法研究[D];電子科技大學(xué);2015年
7 劉海軍;基于時(shí)空流形學(xué)習(xí)的人體動(dòng)作識(shí)別[D];電子科技大學(xué);2014年
8 梁燕;交互應(yīng)用中的實(shí)時(shí)動(dòng)作識(shí)別[D];北京理工大學(xué);2015年
9 冷晶晶;基于光編碼技術(shù)的人員入侵智能報(bào)警系統(tǒng)[D];西安石油大學(xué);2015年
10 馬葉涵;基于Kinect的辦公健康分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
本文關(guān)鍵詞:基于視覺(jué)的人機(jī)交互動(dòng)作識(shí)別研究與DSP實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):475887
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/475887.html