天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

Android平臺(tái)孤立詞語音識(shí)別算法研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-08-29 10:05
【摘要】:語音識(shí)別是通過機(jī)器把語音信號理解、識(shí)別轉(zhuǎn)成相應(yīng)的命令或文本,并讓機(jī)器執(zhí)行文本或指令完成人機(jī)交互的技術(shù)。語音識(shí)別技術(shù)的研究對象是語音信號,其中涉及到眾多的學(xué)科領(lǐng)域,如心理學(xué)、語言學(xué)、計(jì)算機(jī)科學(xué)、信號處理等等,它也是模式識(shí)別重要的分支。同時(shí),在移動(dòng)互聯(lián)網(wǎng),大數(shù)據(jù)蓬勃發(fā)展的時(shí)代背景下,涌現(xiàn)出更多基于智能終端的語音識(shí)別技術(shù)的應(yīng)用,它們在工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域扮演著重要的角色,所以研究智能終端語言識(shí)別技術(shù),提高語音識(shí)別的準(zhǔn)確率和實(shí)時(shí)性是十分有現(xiàn)實(shí)意義的。論文研究了語音識(shí)別關(guān)鍵技術(shù),主要包括了如下四個(gè)方面:1、設(shè)計(jì)實(shí)現(xiàn)了基于Android平臺(tái)的語音信息采集系統(tǒng)。實(shí)現(xiàn)了在Android平臺(tái)上的語音信息采集、保存、音頻數(shù)據(jù)的播放以及整個(gè)軟件功能模塊設(shè)計(jì)。為后期對語音信號做進(jìn)一步分析打下基礎(chǔ)。2、研究語音信號預(yù)處理的方法與技術(shù)。實(shí)現(xiàn)了語音信號的預(yù)濾波、預(yù)加重、分幀加窗、端點(diǎn)檢測。濾除了語音信號中的電源噪聲,環(huán)境噪聲;獲得了短時(shí)平穩(wěn)的語音幀。從而計(jì)算出滿足特征參數(shù)提取條件的語音信號。3、研究、改進(jìn)了語音信號特征參數(shù)提取算法。著重研究了基于人耳聽覺模型的梅爾倒譜系數(shù)(MFCC)特征參數(shù)提取算法;利用一半的幅度譜計(jì)算功率譜,利用頻率解析度初始化梅爾三角濾波器組,對梅爾三角濾波器響應(yīng)做對數(shù)的立方壓縮實(shí)現(xiàn)算法改進(jìn),在一定程度上提高特征提取算法的性能。4、研究了語音識(shí)別模型。重點(diǎn)實(shí)現(xiàn)了動(dòng)態(tài)時(shí)間規(guī)整(DTW)、隱馬爾可夫(HMM)這兩種識(shí)別算法。通過這兩種算法對數(shù)字0到9漢語語音的特征參數(shù)進(jìn)行訓(xùn)練和識(shí)別,利用多人采樣進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)隱馬爾可夫模型的識(shí)別率優(yōu)于動(dòng)態(tài)時(shí)間規(guī)整算法。實(shí)驗(yàn)結(jié)果表明:基于本文算法的孤立詞語音識(shí)別系統(tǒng)的識(shí)別率達(dá)到60%左右,基本滿足系統(tǒng)設(shè)計(jì)的要求。
[Abstract]:Speech recognition is a technology that can translate the speech signal into the corresponding command or text by the machine, and let the machine execute the text or command to complete the human-computer interaction. The research object of speech recognition technology is speech signal, which involves many disciplines, such as psychology, linguistics, computer science, signal processing and so on. It is also an important branch of pattern recognition. At the same time, under the background of the mobile Internet and big data's vigorous development, more and more applications of speech recognition technology based on intelligent terminals have emerged. They have been applied in industry, household appliances, communications, automotive electronics, medical treatment, and home service. Consumer electronics and other fields play an important role, so the research of intelligent terminal language recognition technology to improve the accuracy and real-time speech recognition is of great practical significance. In this paper, the key technologies of speech recognition are studied, including the following four aspects: 1. A speech information acquisition system based on Android platform is designed and implemented. The design of voice information acquisition, storage, audio data playing and the whole software function module on Android platform is realized. It lays a foundation for further analysis of speech signal, and studies the method and technology of speech signal preprocessing. Speech signal pre-filtering, pre-weighting, framing plus windows, endpoint detection. The power source noise and ambient noise are removed from the speech signal, and a short and stable speech frame is obtained. Thus, the speech signal. 3, which meets the condition of feature parameter extraction, is calculated, and the algorithm of feature parameter extraction for speech signal is improved. The algorithm of extracting characteristic parameters of Mel cepstrum coefficient (MFCC) based on human auditory model is studied emphatically, the power spectrum is calculated by half amplitude spectrum, and the Mel triangular filter bank is initialized by frequency resolution. The algorithm of logarithmic cubic compression of the response of the Mel triangle filter is improved, and the performance of the feature extraction algorithm is improved to a certain extent. The speech recognition model is studied. Two recognition algorithms, dynamic time warping (DTW), hidden Markov (HMM), are implemented. The two algorithms are used to train and recognize the feature parameters of the number 0 to 9 Chinese speech. The experimental results show that the recognition rate of the hidden Markov model is better than that of the dynamic time warping algorithm. The experimental results show that the recognition rate of the isolated words speech recognition system based on this algorithm is about 60%, which basically meets the requirements of the system design.
【學(xué)位授予單位】:湖南科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34;TP316

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李挺;孤立詞語音識(shí)別系統(tǒng)的一種實(shí)用精簡算法[J];江南大學(xué)學(xué)報(bào);2003年02期

2 鄺航宇;張軍;季飛;韋崗;;一種基于聯(lián)合得分的孤立詞語音識(shí)別系統(tǒng)[J];計(jì)算機(jī)工程;2006年10期

3 張晨燕;孫成立;;非特定人孤立詞語音識(shí)別系統(tǒng)的片上實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年13期

4 馬莉;黨幼云;;特定人孤立詞語音識(shí)別系統(tǒng)的仿真與分析[J];西安工程科技學(xué)院學(xué)報(bào);2007年03期

5 姚徐;李永宏;單廣榮;于洪志;;藏語孤立詞語音識(shí)別系統(tǒng)研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期

6 劉麗媛;嚴(yán)家明;;一種孤立詞語音識(shí)別的實(shí)現(xiàn)方法及改進(jìn)[J];現(xiàn)代電子技術(shù);2010年16期

7 孫行偉;賈春梅;;基于孤立詞語音識(shí)別定位系統(tǒng)的研究與設(shè)計(jì)[J];寧波工程學(xué)院學(xué)報(bào);2010年03期

8 朱淑琴;魏威;;基于神經(jīng)網(wǎng)絡(luò)的漢語孤立詞語音識(shí)別[J];微計(jì)算機(jī)信息;2012年09期

9 孫光民,董笑盈;基于神經(jīng)網(wǎng)絡(luò)的漢語孤立詞語音識(shí)別[J];北京工業(yè)大學(xué)學(xué)報(bào);2002年03期

10 劉金偉;黃樟欽;侯義斌;;基于片上系統(tǒng)的孤立詞語音識(shí)別算法設(shè)計(jì)[J];計(jì)算機(jī)工程;2007年13期

相關(guān)會(huì)議論文 前7條

1 丁國宏;李成榮;徐波;;非特定人孤立詞語音識(shí)別系統(tǒng)在定點(diǎn)DSP上的實(shí)現(xiàn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

2 李峰;浦劍濤;李成榮;;基于聲韻母建;唇雍驼~識(shí)別的非特定人孤立詞語音識(shí)別系統(tǒng)的研究[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

3 郭莉莉;王迪;常玲;;基于DSP的孤立詞語音識(shí)別系統(tǒng)在汽車導(dǎo)航中的應(yīng)用[A];第十一屆沈陽科學(xué)學(xué)術(shù)年會(huì)暨中國汽車產(chǎn)業(yè)集聚區(qū)發(fā)展與合作論壇論文集(信息科學(xué)與工程技術(shù)分冊)[C];2014年

4 李明;王之禹;溫源;侯震;俞鐵城;;一種高效的非特定人孤立詞識(shí)別方法[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年

5 劉金偉;黃樟欽;侯義斌;;基于SoC的孤立詞語音識(shí)別算法的C語言仿真[A];中國系統(tǒng)仿真學(xué)會(huì)第五次全國會(huì)員代表大會(huì)暨2006年全國學(xué)術(shù)年會(huì)論文集[C];2006年

6 張歆奕;盧敦陸;張有為;;基于DSP芯片的語音控制指令識(shí)別最小系統(tǒng)[A];第九屆全國信號處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年

7 林波;呂明;;基于DTW改進(jìn)算法的孤立詞識(shí)別系統(tǒng)的仿真與分析[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

相關(guān)碩士學(xué)位論文 前10條

1 楊泉清;Android平臺(tái)孤立詞語音識(shí)別算法研究與實(shí)現(xiàn)[D];湖南科技大學(xué);2015年

2 程曉偉;非特定人孤立詞語音識(shí)別算法研究與實(shí)驗(yàn)分析[D];中國地質(zhì)大學(xué)(北京);2009年

3 卞潔;非特定人孤立詞語音識(shí)別系統(tǒng)若干關(guān)鍵技術(shù)的研究[D];大連理工大學(xué);2005年

4 郭秋雨;小詞匯量非特定人的孤立詞語音識(shí)別系統(tǒng)研究[D];中國海洋大學(xué);2010年

5 李建寧;漢語孤立詞語音識(shí)別的研究與實(shí)現(xiàn)[D];西北大學(xué);2007年

6 時(shí)曉東;孤立詞語音識(shí)別系統(tǒng)設(shè)計(jì)研究[D];浙江大學(xué);2006年

7 李宏言;小詞匯量漢語孤立詞語音識(shí)別的理論與技術(shù)研究[D];中南大學(xué);2006年

8 路娜;孤立詞語音識(shí)別系統(tǒng)的研究與設(shè)計(jì)[D];曲阜師范大學(xué);2014年

9 熊中諒;漢語孤立詞語音識(shí)別系統(tǒng)設(shè)計(jì)[D];南昌大學(xué);2014年

10 江官星;非特定人孤立詞語音識(shí)別系統(tǒng)的研究[D];西南交通大學(xué);2006年



本文編號:2210872

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2210872.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶341fe***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com