RNN-DNN語音識別系統(tǒng)研究及其應(yīng)用
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34
【圖文】:
第一章 緒論及意義與人之間互相交流最原始最自然的手段,也是最自然的日 Amazon 發(fā)布的 Echo 語音助手音箱、2016 年 5 月 19、2016 年 10 月 Facebook 將發(fā)布的 AI 管家都無一例外。穿戴設(shè)備和智能家居市場的升溫,語音識別作為其中的也越來越大。2016 年,Research and Markets 公司發(fā)產(chǎn)業(yè)報(bào)告》顯示,隨著智能語音技術(shù)在智能產(chǎn)業(yè)應(yīng)用領(lǐng)域的市場規(guī)模將近 192 億美元。據(jù)中國工業(yè)和信息化,2017 年,中國智能語音產(chǎn)業(yè)規(guī)模突破 100 億人民幣
圖 2-1 語音識別系統(tǒng)詞典,是一個描述詞與拼音對應(yīng)關(guān)系的文本。發(fā)聲詞典在聲學(xué)和語言中每個詞由哪些子詞連接而成。其內(nèi)容也因語種和采取的語音識別。比如聲韻母+聲調(diào)識別基元方案的中文發(fā)聲詞典可以對 華南 這一:華南 h ua2 n an2;模型,也稱語言學(xué)模型,主要是描述人類語言習(xí)慣,語言中的詞語間俗地講,就是教會機(jī)器人類語言有哪些詞語組合。在語音識別的數(shù)負(fù)責(zé)計(jì)算 P( W ),文字序列本身符合語言習(xí)慣的概率。語言模型一一句話的概率拆成每個詞語的概率的積。設(shè)句子W 是由詞語1 2, ,w w 1 2 1 3 1 2 1 2 1( ) ( ) ( | ) ( | , )... ( | , ,..., )n nP W P w P w w P w w w P w w w w 語言模型依靠大量經(jīng)過分詞的中文文本進(jìn)行訓(xùn)練。訓(xùn)練得到的語言
圖 2-2 循環(huán)神經(jīng)網(wǎng)絡(luò)個很大的問題,就是后來時間節(jié)象,因此網(wǎng)絡(luò)層數(shù)一加深就變得 Term Memory,LSTM)的出現(xiàn)存之前時刻的狀態(tài)。這使得網(wǎng)google 公司 Hasim Sak 等研究員 10.7%的 WER。
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 余凱;賈磊;陳雨強(qiáng);徐偉;;深度學(xué)習(xí)的昨天、今天和明天[J];計(jì)算機(jī)研究與發(fā)展;2013年09期
2 王志鋒;賀前華;張雪源;羅海宇;蘇卓生;;基于信道模式噪聲的錄音回放攻擊檢測[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年10期
3 金紅;蔣存波;陳小琴;;基于有限狀態(tài)自動機(jī)原理的孔中心定位程序[J];計(jì)算機(jī)工程與應(yīng)用;2007年04期
4 喬春雷,吳及,王作英;在漢語語音識別中應(yīng)用聲調(diào)信息的研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年12期
5 吳應(yīng)良,韋崗,李海洲;基于字統(tǒng)計(jì)語言模型的漢語語音識別研究[J];計(jì)算機(jī)應(yīng)用研究;2000年05期
相關(guān)博士學(xué)位論文 前1條
1 張仕良;基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型研究[D];中國科學(xué)技術(shù)大學(xué);2017年
相關(guān)碩士學(xué)位論文 前6條
1 葉卓賢;一種基于用戶注冊信息的人機(jī)對話控制方法及系統(tǒng)實(shí)現(xiàn)[D];華南理工大學(xué);2017年
2 張德良;深度神經(jīng)網(wǎng)絡(luò)在中文語音識別系統(tǒng)中的實(shí)現(xiàn)[D];北京交通大學(xué);2015年
3 張潔凱;遠(yuǎn)程說話人認(rèn)證系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2015年
4 梁靜;基于深度學(xué)習(xí)的語音識別研究[D];北京郵電大學(xué);2014年
5 陳碩;深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用研究[D];華南理工大學(xué);2013年
6 鄒榮;大詞匯量連續(xù)語音識別系統(tǒng)中統(tǒng)計(jì)語言模型的研究[D];北京郵電大學(xué);2006年
本文編號:2747077
本文鏈接:http://sikaile.net/kejilunwen/wltx/2747077.html