天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的孤立詞語音識別系統(tǒng)設計

發(fā)布時間:2017-12-31 04:12

  本文關鍵詞:基于深度學習的孤立詞語音識別系統(tǒng)設計 出處:《東北電力大學》2017年碩士論文 論文類型:學位論文


  更多相關文章: 語音識別 聲學特征 深度學習 深度自動編碼器


【摘要】:在人與人之間的自然對話中,語音對話是被使用最頻繁的一種交流方式,因為它是最直接、最方便的一種表達方式。那么在人工智能領域中,語音識別也就成為了人機交互技術里最重要的部分之一,并隨著現(xiàn)代科技的發(fā)展,各類語音識別軟件逐步融入人們的生活,例如智能手機的語音撥號、發(fā)短信、查詢等,以及汽車上的一些語音控制設備。在如今的互聯(lián)網(wǎng)時代里,獲得大量的語音數(shù)據(jù)已不成問題,那么如何高效的利用這些未經(jīng)標注的而且大量的語音數(shù)據(jù),就成為了當前語音識別領域的一個研究熱點。與此同時,深度學習模型對數(shù)據(jù)有著強大的建模能力,并能直接對未標注的原始數(shù)據(jù)進行預處理,這就使其與語音識別的聯(lián)系越來越緊密。在此背景下,本文以語音識別理論為基礎,針對如何將深度學習理論應用于語音識別中這一問題展開研究,最后在此研究上設計了一個孤立詞語音識別系統(tǒng),主要有以下內(nèi)容。(1)根據(jù)語音識別基本原理,在Matlab環(huán)境下,編程搭建一個非特定人的孤立詞語音識別系統(tǒng)框架,這個系統(tǒng)框架中主要包括語音信號預處理、特征提取、基于HMM聲學模型的訓練和解碼搜索這四個部分。實驗中用訓練庫中語音數(shù)據(jù),以提取傳統(tǒng)的聲學特征(MFCC)為基本特征,訓練出基于HMM聲學模型的模板庫,再結合測試庫中的語音數(shù)據(jù)進行解碼搜索,檢測此識別系統(tǒng)的識別率,并以此得到了一個合適的聲學模型參數(shù),以便下來的試驗。(2)以深度學習為基礎理論,提出了一種升維式的堆棧式深度自動編碼器模型,利用此模型提取新的深層語音特征。并分別從網(wǎng)絡的隱含層層數(shù)、各層節(jié)點數(shù)、各層節(jié)點的激活函數(shù)、有監(jiān)督和無監(jiān)督訓練方式等多個方面構建深度自動編碼器模型及其在語音特征提取中的具體應用。實驗證明,新的深層特征比原始MFCC特征,使識別系統(tǒng)在詞識別正確率和時間方面都有所提高,這就證明了深度學習模型在特征提取上對提高語音識別正確率的有效性。(3)本文基于以上研究成果,在Labview平臺上對上述所研究的基于深度學習的孤立詞語音識別系統(tǒng)進行了系統(tǒng)設計,其功能包括錄音、播放、訓練和識別。其中為了語音系統(tǒng)的識別正確率能達到95%以上,對模板庫進行改進,設計為特定人的模板庫,即在進行識別時,選擇與個人對應的模板庫對其語音進行解碼搜索以得到識別結果。
[Abstract]:Between people and natural dialogue, dialogue is a way of communication is the most frequently used, because it is the most direct, an expression of the most convenient way. So in the field of artificial intelligence, speech recognition has become a human-computer interaction technology, the most important part of the one, and with the development of the modern science and technology, all kinds of voice recognition software gradually into people's lives, such as intelligent mobile phone voice dialing, texting, query, some voice control equipment and automobiles. In today's Internet era, get a large amount of speech data is not a problem, so how to efficiently utilize these data without voice but a lot of annotation, has become a hot research topic in the field of speech recognition. At the same time, deep learning model has a strong ability of data modeling, and can directly to the original unlabeled data into The pretreatment, which makes it more and more closely linked with speech recognition. Under this background, this paper is based on the theory of speech recognition, aiming at how deep learning theory is applied to the problem of speech recognition research, then research on the design of a speech recognition system, the main contents are as follows. (1) according to the basic principle of speech recognition, in the Matlab environment, the framework of speech recognition system programming to build a non specific people, the framework of the system includes voice signal preprocessing, feature extraction, the four part of the HMM acoustic model training and decoding search based on voice data in the training set. By experiment in order to extract acoustic features, the traditional (MFCC) as the basic characteristics of the training HMM acoustic model based on template library, combined with voice data test library for decoding search, detection of the identification systems of knowledge Don't rate, and thus a suitable acoustic model parameters, in order to test down. (2) with deep learning theory, puts forward a type of stack depth sunwy autocoder model, extraction of speech features new using this model. And from the network hidden layer number. The number of nodes in each layer, the activation function of nodes in each layer, and its application in speech feature extraction in the construction of many aspects of depth auto encoder model supervised and unsupervised methods. Experiments show that the new deep feature than the original MFCC feature, the recognition system can improve word recognition accuracy and time., which proves the validity of deep learning model accuracy to improve speech recognition in feature extraction. (3) this paper based on the above research results, based on the Labview depth study of isolated word learning based on the above research The speech recognition system is designed, its functions including recording, playback, training and recognition. In order to speech recognition system accuracy can reach more than 95%, the template library was improved, designed for specific template library, namely in the identification, selection and individual corresponding template library to decode the search in order to get the speech recognition results.

【學位授予單位】:東北電力大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.34

【相似文獻】

相關期刊論文 前10條

1 徐霄鵬,吳及,劉慶升,黃文浩;孤立詞語音識別算法性能研究與改進[J];計算機工程與應用;2001年21期

2 李挺;孤立詞語音識別系統(tǒng)的一種實用精簡算法[J];江南大學學報;2003年02期

3 鄺航宇;張軍;季飛;韋崗;;一種基于聯(lián)合得分的孤立詞語音識別系統(tǒng)[J];計算機工程;2006年10期

4 張晨燕;孫成立;;非特定人孤立詞語音識別系統(tǒng)的片上實現(xiàn)[J];計算機工程與應用;2007年13期

5 馬莉;黨幼云;;特定人孤立詞語音識別系統(tǒng)的仿真與分析[J];西安工程科技學院學報;2007年03期

6 姚徐;李永宏;單廣榮;于洪志;;藏語孤立詞語音識別系統(tǒng)研究[J];西北民族大學學報(自然科學版);2009年01期

7 劉麗媛;嚴家明;;一種孤立詞語音識別的實現(xiàn)方法及改進[J];現(xiàn)代電子技術;2010年16期

8 孫行偉;賈春梅;;基于孤立詞語音識別定位系統(tǒng)的研究與設計[J];寧波工程學院學報;2010年03期

9 朱淑琴;魏威;;基于神經(jīng)網(wǎng)絡的漢語孤立詞語音識別[J];微計算機信息;2012年09期

10 孫光民,董笑盈;基于神經(jīng)網(wǎng)絡的漢語孤立詞語音識別[J];北京工業(yè)大學學報;2002年03期

相關會議論文 前7條

1 丁國宏;李成榮;徐波;;非特定人孤立詞語音識別系統(tǒng)在定點DSP上的實現(xiàn)[A];第六屆全國人機語音通訊學術會議論文集[C];2001年

2 李峰;浦劍濤;李成榮;;基于聲韻母建;唇雍驼~識別的非特定人孤立詞語音識別系統(tǒng)的研究[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年

3 郭莉莉;王迪;常玲;;基于DSP的孤立詞語音識別系統(tǒng)在汽車導航中的應用[A];第十一屆沈陽科學學術年會暨中國汽車產(chǎn)業(yè)集聚區(qū)發(fā)展與合作論壇論文集(信息科學與工程技術分冊)[C];2014年

4 李明;王之禹;溫源;侯震;俞鐵城;;一種高效的非特定人孤立詞識別方法[A];中國聲學學會2002年全國聲學學術會議論文集[C];2002年

5 劉金偉;黃樟欽;侯義斌;;基于SoC的孤立詞語音識別算法的C語言仿真[A];中國系統(tǒng)仿真學會第五次全國會員代表大會暨2006年全國學術年會論文集[C];2006年

6 張歆奕;盧敦陸;張有為;;基于DSP芯片的語音控制指令識別最小系統(tǒng)[A];第九屆全國信號處理學術年會(CCSP-99)論文集[C];1999年

7 林波;呂明;;基于DTW改進算法的孤立詞識別系統(tǒng)的仿真與分析[A];第八屆全國人機語音通訊學術會議論文集[C];2005年

相關碩士學位論文 前10條

1 楊泉清;Android平臺孤立詞語音識別算法研究與實現(xiàn)[D];湖南科技大學;2015年

2 李榮松;基于HMM的非特定人孤立詞語音識別[D];中國民航大學;2011年

3 周慧瓊;基于深度學習的孤立詞語音識別系統(tǒng)設計[D];東北電力大學;2017年

4 程曉偉;非特定人孤立詞語音識別算法研究與實驗分析[D];中國地質(zhì)大學(北京);2009年

5 卞潔;非特定人孤立詞語音識別系統(tǒng)若干關鍵技術的研究[D];大連理工大學;2005年

6 郭秋雨;小詞匯量非特定人的孤立詞語音識別系統(tǒng)研究[D];中國海洋大學;2010年

7 李建寧;漢語孤立詞語音識別的研究與實現(xiàn)[D];西北大學;2007年

8 時曉東;孤立詞語音識別系統(tǒng)設計研究[D];浙江大學;2006年

9 李宏言;小詞匯量漢語孤立詞語音識別的理論與技術研究[D];中南大學;2006年

10 路娜;孤立詞語音識別系統(tǒng)的研究與設計[D];曲阜師范大學;2014年

,

本文編號:1358060

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1358060.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶316f6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com