機械臂語音控制系統(tǒng)研究
本文選題:機器聽覺 切入點:語音降噪 出處:《西安科技大學》2017年碩士論文
【摘要】:具備各種功能的機器人在現代化社會的各行各業(yè)中都得到了廣泛應用。在對機器人的使用和控制中,由于傳統(tǒng)的控制方式較為單一且操作不便,使得機器人的智能化發(fā)展受到限制。因此,如何提高機器人的人機交互能力,找到一種更加便捷的人機交互方式是機器人智能化研究的重要分支。語言是人類交流最主要的方式,若以語音指令去控制機器人使其完成相應的動作將會使人機交互更加便捷高效。本文以機械臂語音控制系統(tǒng)在物流分揀中的應用為研究背景,在分析機械臂軟硬件平臺基礎上對機械臂語音控制系統(tǒng)進行研究。針對噪聲干擾影響語音識別準確率的問題,提出一種改進譜減法的語音指令去噪算法,以此來提高語音指令在機械臂語音控制系統(tǒng)中的識別準確率。本文主要對以下幾個方面進行研究:首先,在對六自由度MOTOMAN機械臂軟硬件分析的基礎上,建立基于機器聽覺的多路徑下物流分揀系統(tǒng)的模型結構,并根據物流分揀系統(tǒng)的不同功能要求,設計各部分的子系統(tǒng),在控制方式上對其進行擴展。最終確定了通過調用Motocom32動態(tài)鏈接庫來實現機械臂對不同類型貨物抓取分揀的程序開發(fā)思路。其次,針對噪聲影響語音識別準確率的問題,提出一種改進譜減法的語音指令去噪算法。該算法根據多窗譜估計理論對語音信號的功率譜進行估計,通過對功率譜密度平滑處理來改進原有的算法。仿真結果驗證了改進算法能夠更有效的分離出純凈語音,得到信噪比更高的語音指令信號。為克服傳統(tǒng)隱馬爾科夫模型分類能力弱的缺點,本文將隱馬爾柯夫模型和神經網絡模型融合,用混合模型來識別去噪后的語音指令。仿真結果表明,混合模型的識別率更高。最后,將本文所提算法應用到機械臂語音控制系統(tǒng)中,并對物流分揀模擬系統(tǒng)進行搭建及運行測試。結果表明,本文所設計開發(fā)的相應軟件可以實現語音指令控制機械臂對不同類型貨物的抓取和分揀,驗證了本文所提算法可以應用到機械臂語音控制系統(tǒng)中。
[Abstract]:Robots with various functions have been widely used in various industries in modern society.In the use and control of the robot, the traditional control mode is simple and the operation is not convenient, so the development of the robot intelligence is restricted.Therefore, how to improve the human-computer interaction ability of robots and find a more convenient way of human-computer interaction is an important branch of intelligent robot research.Language is the most important way of human communication. If the robot is controlled by voice instruction to complete the corresponding action, it will make the human-computer interaction more convenient and efficient.Based on the research background of the application of the robot arm voice control system in the logistics sorting, this paper studies the robot arm voice control system based on the analysis of the hardware and software platform of the manipulator.Aiming at the problem that noise interference affects the accuracy of speech recognition, an improved speech instruction denoising algorithm based on spectral subtraction is proposed to improve the accuracy of speech instruction recognition in the robot arm speech control system.This paper mainly studies the following aspects: firstly, based on the software and hardware analysis of 6-DOF MOTOMAN manipulator, the model structure of multi-path logistics sorting system based on machine hearing is established.According to the different functional requirements of the logistics sorting system, the subsystem of each part is designed, and the control mode is extended.Finally, the program development idea of grasping and sorting different types of goods by using Motocom32 dynamic link library is determined.Secondly, aiming at the problem that noise affects the accuracy of speech recognition, an improved spectral subtraction algorithm for speech instruction denoising is proposed.Based on the theory of multi-window spectrum estimation, the power spectrum of speech signal is estimated, and the original algorithm is improved by smoothing the power spectrum density.The simulation results show that the improved algorithm can separate the pure speech more effectively and get the higher signal-to-noise ratio (SNR) of the speech instruction signal.In order to overcome the weakness of traditional Hidden Markov Model (hmm), this paper combines the Hidden Markov Model (hmm) and the Neural Network (NN) model to recognize the de-noised speech instruction.The simulation results show that the recognition rate of the hybrid model is higher.Finally, the algorithm proposed in this paper is applied to the robot arm voice control system, and the logistics sorting simulation system is built and tested.The results show that the corresponding software designed in this paper can be used to control the grab and sorting of different types of goods by the robot arm. It is verified that the algorithm proposed in this paper can be applied to the speech control system of the robot arm.
【學位授予單位】:西安科技大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP241;TN912.3
【參考文獻】
相關期刊論文 前10條
1 王紅;王愛平;鄒海;;低信噪比下基于信號子空間的語音增強算法研究[J];微電子學與計算機;2017年02期
2 張小俊;劉歡歡;趙少魁;丁國帥;;機器人智能化研究的關鍵技術與發(fā)展展望[J];機械設計;2016年08期
3 孟明輝;周傳德;陳禮彬;馮淼;苗純正;;工業(yè)機器人的研發(fā)及應用綜述[J];上海交通大學學報;2016年S1期
4 楊粵濤;王勇;范威;鐘海林;;車載語音降噪識別系統(tǒng)的設計與實現[J];電子技術與軟件工程;2016年12期
5 張雪;龔曉峰;;EEMD聯合能量熵及小波閾值的語音去噪方法[J];計算機工程與設計;2016年03期
6 張正文;周航麒;;基于多窗譜估計的維納濾波語音增強算法[J];河南理工大學學報(自然科學版);2015年05期
7 羅雅琴;吳小培;呂釗;彭奎;桂雅駿;;滑動窗累積量的遞推估計算法及其在語音端點檢測中的應用[J];聲學學報;2015年05期
8 陳濤;高必梵;艾菊梅;;語音識別技術在智能家居控制系統(tǒng)中的應用研究[J];電子質量;2015年03期
9 黃羿博;張秋余;袁占亭;楊仲平;;融合MFCC和LPCC的語音感知哈希算法[J];華中科技大學學報(自然科學版);2015年02期
10 蔡宇;郝程鵬;侯朝煥;;采用子帶譜減法的語音增強[J];計算機應用;2014年02期
相關博士學位論文 前1條
1 周盼;基于深層神經網絡的語音識別聲學建模研究[D];中國科學技術大學;2014年
相關碩士學位論文 前10條
1 宋靜;PAD情緒模型在情感語音識別中的應用研究[D];太原理工大學;2016年
2 魏泉水;基于深度神經網絡的語音增強算法研究[D];南京大學;2016年
3 楊波;基于語音識別技術的白馬語言保護研究[D];蘭州大學;2016年
4 李燕萍;非特定人的語音識別系統(tǒng)研究[D];安徽工業(yè)大學;2016年
5 崔天宇;基于HMM的語音識別系統(tǒng)的研究與實現[D];吉林大學;2016年
6 王琳;噪聲環(huán)境下的魯棒語音識別技術研究[D];哈爾濱工業(yè)大學;2016年
7 程洋;語音識別算法研究及DSP實現[D];安徽理工大學;2015年
8 陳元;基于BP神經網絡的語音識別技術研究[D];云南大學;2015年
9 張建華;基于深度學習的語音識別應用研究[D];北京郵電大學;2015年
10 劉方洲;語音識別關鍵技術及其改進算法研究[D];長安大學;2014年
,本文編號:1727249
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1727249.html