車內(nèi)手勢控制系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2020-10-08 20:59
車內(nèi)手勢控制系統(tǒng)作為一種新的車內(nèi)人機交互方式,在市場上受到越來越多的關注。在駕駛過程中,使用傳統(tǒng)按鈕或者觸屏來操作中控設備會分散駕駛者的注意力,增加危險系數(shù)。而使用手勢來控制,駕駛者可以不需要用眼睛看按鈕或者觸屏,從而獲得更自然的人機交互體驗。目前已經(jīng)量產(chǎn)上市的車載手勢系統(tǒng)采用了深度攝像頭,配有一塊專用芯片來計算圖像算法。此方案的劣勢在于深度攝像頭的成本非常高,而且需要再加上一塊專用芯片的成本,所以只能應用在百萬級別的豪華車型上。主流的中低端市場對手勢識別功能同樣有強烈的需求。如果可以使用廉價的,不帶景深的攝像頭,在每輛汽車都有的中控設備上運行算法,那么就可以大大降低方案整體成本。廉價的攝像頭比較容易找到,問題是主流市場上不同中控設備的芯片計算能力差別很大,擁有更強計算能力的芯片可以使用更復雜的算法,來取得更豐富的功能和更好的識別結(jié)果。而計算能力最弱的設備也需要簡單的算法來實現(xiàn)一些基本的功能。所以根據(jù)計算能力的不同,需要有不同的算法方案來適配這些設備。本文重點是研究適合這些嵌入式設備的手勢識別算法。綜合成本和不同芯片平臺計算能力的限制,本文選用了一款低成本的紅外攝像頭。嘗試了基于輪廓的算法,機器學習算法和深度學習的算法,找出了最適合CPU平臺和GPU平臺的算法。第一種嘗試是完全基于傳統(tǒng)形態(tài)學算法的方案。本文擴展了對旋轉(zhuǎn)手勢的支持。此方案對計算量要求最小,可以輸出基于手掌位置和手指個數(shù)的簡單手勢信息。算法會有背景抑制方面的一些困擾,最終通過調(diào)整的紅外LED的發(fā)射功率取得了相對較好的圖像分割效果。針對深度神經(jīng)網(wǎng)絡計算量太大的問題,本文提出了第二種結(jié)合LBP檢測器和CNN分類網(wǎng)絡的手勢檢測方法,相比之前的一些算法[1]有更好的檢測效果。此方法先基于LBP特征訓練一個級聯(lián)分類器,用來提取手的位置,再訓練一個小的分類網(wǎng)絡來識別手型,用掃描框的方法得到手的位置后,把手的候選框傳入分類網(wǎng)絡,得到具體的手型信息。由于系統(tǒng)僅需要支持單手操作,所以在得到多個候選框的情況下,本文采用了一些算法來排序候選框的優(yōu)先級,然后根據(jù)優(yōu)先級的高低來運行分類網(wǎng)絡。這樣不但加速了整體速度,而且保證每幀圖片上分類網(wǎng)絡的執(zhí)行次數(shù)可控,保證了實時性能。級聯(lián)分類器和低分辨率的小型分類網(wǎng)絡,相比深度神經(jīng)網(wǎng)絡來說計算量少了很多,在沒有GPU加速的系統(tǒng)中,也可以達到實時的處理速度。第三種方法創(chuàng)新應用了最新的實時物體檢測網(wǎng)絡YOLOv2來同時識別手勢的類型和位置。本文試驗了不同的參數(shù),在精確度和速度之間作出平衡。在有GPU加速的平臺上,這種方法的準確度遠遠超過了前兩種算法,YOLOv2的背景抑制能力很強,很少有誤檢測的情況發(fā)生。這種方法對平臺計算能力的要求最高,在計算能力允許的情況下,可以獲得最佳的效果。
【學位單位】:上海交通大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:U463.6;TP391.41
【部分圖文】:
車內(nèi)手勢控制系統(tǒng)的設計聯(lián)分類器的檢測方法來實現(xiàn),此方法效果準確率稍差,但是可以在 CPU 上了與這兩種機器學習的算法做比較,本文還實現(xiàn)了基于輪廓計算的檢測算顯示,在相同的數(shù)據(jù)集上,機器學習的方法顯著優(yōu)于傳統(tǒng)的基于輪廓的檢測勢的定義 傳統(tǒng)車內(nèi) HMI 操作的幾個問題統(tǒng)的車內(nèi) HMI 使用按鈕、旋鈕或者觸屏來操作中控界面。在車輛行駛過程線將不可避免地離開行駛路面。例如最常用的音量和空調(diào)溫度調(diào)節(jié),通常到調(diào)節(jié)按鈕的位置,然后才能開始調(diào)節(jié)。而更復雜的操作引起的注意力滯,例如從列表中選擇歌曲等,需要駕駛員撥動旋鈕或者在觸屏上點擊才能目。如果結(jié)合設計良好的手勢操作,駕駛員就可以完全不需要查看車內(nèi)的。
車內(nèi)手勢控制系統(tǒng)的設計與2 實驗環(huán)境和性能指標上一章已經(jīng)描述了需要解決的主要問題。在開始具體研究之前,需要先定義一標準。包括攝像頭安裝位置,算法驗證平臺的配置等,并定義一些驗證指標。 車內(nèi)的裝配位置根據(jù)一些客戶的需求,把紅外攝像頭安裝在中控屏幕上方。如圖 2-1 箭頭所這樣,駕駛員可以方便地操作設備。攝像頭的 FOV(Field of View)覆蓋了0cm 的區(qū)域,覆蓋的區(qū)域比較大,駕駛者即使不看設備,也能順利地進行隔空操
3 基于 OpenCV 的實現(xiàn)研究的硬件環(huán)境。本章開始討論具體的算法設計和文用 OpenCV 實現(xiàn)了基于傳統(tǒng)計算機視覺形態(tài)學算法指位置的生成是正面朝向攝像頭的。如圖 3-1 所示。由于攝像操作姿勢。所以算法定義為只接受這個角度的輸入。這種方法只能識別手掌的位置和手指的數(shù)量;l(fā)。
【學位單位】:上海交通大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:U463.6;TP391.41
【部分圖文】:
車內(nèi)手勢控制系統(tǒng)的設計聯(lián)分類器的檢測方法來實現(xiàn),此方法效果準確率稍差,但是可以在 CPU 上了與這兩種機器學習的算法做比較,本文還實現(xiàn)了基于輪廓計算的檢測算顯示,在相同的數(shù)據(jù)集上,機器學習的方法顯著優(yōu)于傳統(tǒng)的基于輪廓的檢測勢的定義 傳統(tǒng)車內(nèi) HMI 操作的幾個問題統(tǒng)的車內(nèi) HMI 使用按鈕、旋鈕或者觸屏來操作中控界面。在車輛行駛過程線將不可避免地離開行駛路面。例如最常用的音量和空調(diào)溫度調(diào)節(jié),通常到調(diào)節(jié)按鈕的位置,然后才能開始調(diào)節(jié)。而更復雜的操作引起的注意力滯,例如從列表中選擇歌曲等,需要駕駛員撥動旋鈕或者在觸屏上點擊才能目。如果結(jié)合設計良好的手勢操作,駕駛員就可以完全不需要查看車內(nèi)的。
車內(nèi)手勢控制系統(tǒng)的設計與2 實驗環(huán)境和性能指標上一章已經(jīng)描述了需要解決的主要問題。在開始具體研究之前,需要先定義一標準。包括攝像頭安裝位置,算法驗證平臺的配置等,并定義一些驗證指標。 車內(nèi)的裝配位置根據(jù)一些客戶的需求,把紅外攝像頭安裝在中控屏幕上方。如圖 2-1 箭頭所這樣,駕駛員可以方便地操作設備。攝像頭的 FOV(Field of View)覆蓋了0cm 的區(qū)域,覆蓋的區(qū)域比較大,駕駛者即使不看設備,也能順利地進行隔空操
3 基于 OpenCV 的實現(xiàn)研究的硬件環(huán)境。本章開始討論具體的算法設計和文用 OpenCV 實現(xiàn)了基于傳統(tǒng)計算機視覺形態(tài)學算法指位置的生成是正面朝向攝像頭的。如圖 3-1 所示。由于攝像操作姿勢。所以算法定義為只接受這個角度的輸入。這種方法只能識別手掌的位置和手指的數(shù)量;l(fā)。
【相似文獻】
相關期刊論文 前10條
1 胡悅;;金融市場中的神經(jīng)網(wǎng)絡拐點預測法[J];金融經(jīng)濟;2017年18期
2 遲惠生;陳珂;;1995年世界神經(jīng)網(wǎng)絡大會述評[J];國際學術動態(tài);1996年01期
3 吳立可;;脈沖神經(jīng)網(wǎng)絡和行為識別[J];通訊世界;2018年12期
4 林嘉應;鄭柏倫;劉捷;;基于卷積神經(jīng)網(wǎng)絡的船舶分類模型[J];信息技術與信息化;2019年02期
5 俞頌華;;卷積神經(jīng)網(wǎng)絡的發(fā)展與應用綜述[J];信息通信;2019年02期
6 韓真;凱文·哈特尼特;;為神經(jīng)網(wǎng)絡的通用理論建造基石[J];世界科學;2019年04期
7 鮑偉強;陳娟;熊濤;;基于進化神經(jīng)網(wǎng)絡的短期電力負荷預測研究[J];電工技術;2019年11期
8 陳曉燕;;淺析簡單神經(jīng)網(wǎng)絡的發(fā)展及簡單模型[J];數(shù)字技術與應用;2019年05期
9 李青華;李翠平;張靜;陳紅;王紹卿;;深度神經(jīng)網(wǎng)絡壓縮綜述[J];計算機科學;2019年09期
10 劉高宇;;深度神經(jīng)網(wǎng)絡在煤質(zhì)數(shù)據(jù)分析與預測中的應用[J];電腦知識與技術;2019年28期
相關會議論文 前10條
1 孫軍田;張U
本文編號:2832752
本文鏈接:http://sikaile.net/kejilunwen/qiche/2832752.html
最近更新
教材專著