天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

RNN-BLSTM聲學(xué)模型的說話人自適應(yīng)方法研究

發(fā)布時(shí)間:2018-06-18 16:22

  本文選題:語音識(shí)別 + 說話人自適應(yīng); 參考:《中國(guó)科學(xué)技術(shù)大學(xué)》2017年碩士論文


【摘要】:說話人自適應(yīng)技術(shù)利用特定說話人提供的語料,讓語音識(shí)別系統(tǒng)在識(shí)別性能上針對(duì)該說話人有明顯的提升。它可以將說話人無關(guān)的識(shí)別系統(tǒng)轉(zhuǎn)換成說話人相關(guān)的識(shí)別系統(tǒng),從而和說話人相關(guān)的聲學(xué)特征相匹配;也可以將說話人相關(guān)的聲學(xué)特征轉(zhuǎn)換成說話人無關(guān)的聲學(xué)特征,從而和說話人無關(guān)的識(shí)別系統(tǒng)相匹配。因此,說話人自適應(yīng)技術(shù)是為了讓說話人和識(shí)別系統(tǒng)盡量匹配。基于雙向長(zhǎng)短時(shí)記憶單元的遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network with bidi-rectional Long Short-Term Memory,RNN-BLSTM)聲學(xué)模型不僅針對(duì)語音 的時(shí)序進(jìn)行建模,而且利用一些控制器來控制信息流,從而解決了傳統(tǒng)的基于遞歸神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的梯度爆炸和梯度消失問題。同時(shí),在一些語音標(biāo)準(zhǔn)數(shù)據(jù)集上基于RNN-BLSTM聲學(xué)模型的語音識(shí)別系統(tǒng)相比于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)獲得了超過10%的性能提升。雖然RNN-BLSTM聲學(xué)模型在識(shí)別性能上相比于DNN有了大幅度的提升,但是依舊不能夠解決上述的不匹配問題。因此,在RNN-BLSTM聲學(xué)模型上進(jìn)行說話人自適應(yīng)技術(shù)的研究尤為重要。本文主要圍繞RNN-BLSTM聲學(xué)模型上的說話人自適應(yīng)展開研究。首先,本文將基于說話人編碼(speaker code)的說話人自適應(yīng)方法應(yīng)用于RNN-BLSTM聲學(xué)模型,并分析RNN-BLSTM的記憶單元(memory cell)中的不同控制器對(duì)說話人自適應(yīng)的識(shí)別性能的影響。與此同時(shí),我們還提出一些啟發(fā)式的算法來對(duì)基于speaker code的方法進(jìn)行優(yōu)化和改進(jìn),從而進(jìn)一步地提升識(shí)別性能。然后,本文提出了基于深層編碼(deep code,d-code)的離線說話人自適應(yīng)方法,該方法提供了一種解決基于speaker code的說話人自適應(yīng)方法的二遍解碼問題的途徑。通過實(shí)驗(yàn)對(duì)比,該方法在識(shí)別性能上與基于speaker code的方法相接近,并且比同樣不需要二遍解碼的基于鑒別性矢量(identity vector,i-vector)的說話人自適應(yīng)方法在識(shí)別性能上更優(yōu),訓(xùn)練過程更加靈活。最后,本文研究基于d-code的在線說話人自適應(yīng)方法,該方法不需要收集說話人整個(gè)句子。它在在線的語音識(shí)別過程中逐步進(jìn)行說話人自適應(yīng),并取得了較好的識(shí)別效果。
[Abstract]:The speaker adaptive technology makes use of the corpus provided by a specific speaker to improve the recognition performance of the speech recognition system. It can convert the speaker independent recognition system into the speaker related recognition system, which can match the speaker related acoustic feature, and can also convert the speaker related acoustic feature into the speaker independent acoustic feature. Thus matching with the speaker independent recognition system. Therefore, the speaker adaptation technique is to make the speaker and recognition system match as much as possible. Recurrent neural network with bidi-rectional long term memory (RNN-BLSTM) acoustic model based on bidirectional long short term memory unit not only models the speech time series, but also uses some controllers to control the information flow. The problem of gradient explosion and gradient disappearance based on recurrent neural network acoustic model is solved. At the same time, the speech recognition system based on the RNN-BLSTM acoustic model on some speech standard data sets has achieved a performance improvement of more than 10% compared with the deep neural network (Deep Networks / DNNN). Although the recognition performance of RNN-BLSTM acoustic model is much better than that of DNN, it can not solve the mismatch problem mentioned above. Therefore, it is very important to study the speaker adaptive technology on the RNN-BLSTM acoustic model. This paper focuses on the speaker adaptation on the RNN-BLSTM acoustic model. Firstly, the speaker adaptive method based on speaker code is applied to the RNN-BLSTM acoustic model, and the influence of different controllers in the memory cell of RNN-BLSTM on the speaker adaptive recognition performance is analyzed. At the same time, we propose some heuristic algorithms to optimize and improve the method based on speaker code, so as to further improve the performance of recognition. Then, this paper presents an offline speaker adaptation method based on deep codec, which provides a way to solve the second pass decoding problem of speaker adaptive method based on speaker code. The experimental results show that the performance of this method is similar to that of the one based on speaker code, and it is better than the speaker adaptive method based on discriminant vector identity vectori-vector-based which also does not need to be decoded twice, and the training process is more flexible. Finally, this paper studies the online speaker adaptation method based on d-code, which does not need to collect the whole sentence of the speaker. In the process of online speech recognition, speaker adaptation is carried out step by step, and good recognition effect is achieved.
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TN912.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉文舉,孫兵,鐘秋海;基于說話人分類技術(shù)的分級(jí)說話人識(shí)別研究[J];電子學(xué)報(bào);2005年07期

2 丁輝;唐振民;錢博;李燕萍;;易擴(kuò)展小樣本環(huán)境說話人辨認(rèn)系統(tǒng)的研究[J];系統(tǒng)仿真學(xué)報(bào);2008年10期

3 劉明輝;黃中偉;熊繼平;;用于說話人辨識(shí)的評(píng)分規(guī)整[J];計(jì)算機(jī)工程與應(yīng)用;2010年12期

4 陳雪芳;楊繼臣;;一種三層判決的說話人索引算法[J];計(jì)算機(jī)工程;2012年02期

5 楊繼臣;何俊;李艷雄;;一種基于性別的說話人索引算法[J];計(jì)算機(jī)工程與科學(xué);2012年06期

6 何致遠(yuǎn),胡起秀,徐光yP;兩級(jí)決策的開集說話人辨認(rèn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期

7 殷啟新,韓春光,楊鑒;基于掌上電腦錄音的說話人辨認(rèn)[J];云南民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年04期

8 呂聲,尹俊勛;同語種說話人轉(zhuǎn)換的實(shí)現(xiàn)[J];移動(dòng)通信;2004年S3期

9 董明,劉加,劉潤(rùn)生;快速口音自適應(yīng)的動(dòng)態(tài)說話人選擇性訓(xùn)練[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年07期

10 曹敏;王浩川;;說話人自動(dòng)識(shí)別技術(shù)研究[J];中州大學(xué)學(xué)報(bào);2007年02期

相關(guān)會(huì)議論文 前10條

1 司羅;胡起秀;金琴;;完全無監(jiān)督的雙人對(duì)話中的說話人分隔[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年

2 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動(dòng)感知的音視頻聯(lián)合說話人跟蹤方法[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年

3 馬勇;鮑長(zhǎng)春;夏丙寅;;基于辨別性深度信念網(wǎng)絡(luò)的說話人分割[A];第十二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年

4 白俊梅;張樹武;徐波;;廣播電視中的目標(biāo)說話人跟蹤技術(shù)[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 索宏彬;劉曉星;;基于高斯混合模型的說話人跟蹤系統(tǒng)[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

6 羅海風(fēng);龍長(zhǎng)才;;多話者環(huán)境下說話人辨識(shí)聽覺線索研究[A];中國(guó)聲學(xué)學(xué)會(huì)2009年青年學(xué)術(shù)會(huì)議[CYCA’09]論文集[C];2009年

7 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說話人模型和雙層結(jié)構(gòu)的說話人辨認(rèn)快速算法[A];第十一屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 李經(jīng)偉;;語體轉(zhuǎn)換與角色定位[A];全國(guó)語言與符號(hào)學(xué)研究會(huì)第五屆研討會(huì)論文摘要集[C];2002年

9 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說話人模型和雙層結(jié)構(gòu)的說話人辨認(rèn)[A];第十一屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(二)[C];2011年

10 何磊;方棣棠;吳文虎;;說話人聚類與模型自適應(yīng)結(jié)合的說話人自適應(yīng)方法[A];第六屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年

相關(guān)重要報(bào)紙文章 前3條

1 ;做一名積極的傾聽者[N];中國(guó)紡織報(bào);2003年

2 唐志強(qiáng);不聽別人說話,也能模仿其口音[N];新華每日電訊;2010年

3 黃惠慧(南京師范大學(xué)附屬揚(yáng)子中學(xué));高考聽力要求及對(duì)策[N];中國(guó)教育資訊報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 李洪儒;語句中的說話人形象[D];黑龍江大學(xué);2003年

2 李威;多人會(huì)話語音中的說話人角色分析[D];華南理工大學(xué);2015年

3 楊繼臣;說話人信息分析及其在多媒體檢索中的應(yīng)用研究[D];華南理工大學(xué);2010年

4 鄭建煒;基于核方法的說話人辨認(rèn)模型研究[D];浙江工業(yè)大學(xué);2010年

5 呂聲;說話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年

6 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年

7 玄成君;基于語音頻率特性抑制音素影響的說話人特征提取[D];天津大學(xué);2014年

8 李燕萍;說話人辨認(rèn)中的特征參數(shù)提取和魯棒性技術(shù)研究[D];南京理工大學(xué);2009年

9 徐利敏;說話人辨認(rèn)中的特征變換和魯棒性技術(shù)研究[D];南京理工大學(xué);2008年

10 王堅(jiān);語音識(shí)別中的說話人自適應(yīng)研究[D];北京郵電大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 楊浩;基于廣義音素的文本無關(guān)說話人認(rèn)證的研究[D];北京郵電大學(xué);2008年

2 史夢(mèng)潔;構(gòu)式“沒有比X更Y的(了)”研究[D];上海師范大學(xué);2015年

3 魏君;“說你什么好”的多角度研究[D];河北大學(xué);2015年

4 解冬悅;互動(dòng)韻律:英語多人沖突性話語中說話人的首音模式研究[D];大連外國(guó)語大學(xué);2015年

5 朱韋巍;揚(yáng)州街上話語氣詞研究[D];南京林業(yè)大學(xué);2015年

6 蔣博;特定目標(biāo)說話人的語音轉(zhuǎn)換系統(tǒng)設(shè)計(jì)[D];電子科技大學(xué);2015年

7 王雅丹;漢語反語研究[D];南昌大學(xué);2015年

8 陳雨鶯;基于EMD的說話人特征參數(shù)提取方法研究[D];湘潭大學(xué);2015年

9 單燕燕;變音環(huán)境下魯棒性說話人辨認(rèn)關(guān)鍵技術(shù)研究[D];南京郵電大學(xué);2015年

10 陳sネ,

本文編號(hào):2036096


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2036096.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶46ce9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产精品久久香蕉国产线| 欧美亚洲综合另类色妞| 国产又色又爽又黄又大| 一级片二级片欧美日韩| 又黄又色又爽又免费的视频| 又黄又色又爽又免费的视频| 99精品人妻少妇一区二区人人妻| 日韩亚洲激情在线观看| 狠色婷婷久久一区二区三区| 国产不卡在线免费观看视频| 国产精品十八禁亚洲黄污免费观看| 成年男女午夜久久久精品| 欧美一区二区三区性视频| 亚洲最新的黄色录像在线| 中文字幕乱子论一区二区三区| 欧美多人疯狂性战派对| 中文字幕亚洲人妻在线视频| 亚洲一区二区三区国产| 日韩av生活片一区二区三区| 国产av乱了乱了一区二区三区| 国产亚洲精品俞拍视频福利区| 粗暴蹂躏中文一区二区三区| 亚洲国产成人爱av在线播放下载 | 黄片在线观看一区二区三区| 国产麻豆一线二线三线| 97人妻精品一区二区三区男同| 黑丝国产精品一区二区| 高清在线精品一区二区| 国产日本欧美韩国在线| 亚洲一区二区福利在线| 国产三级黄片在线免费看| 极品熟女一区二区三区| 日本高清不卡一二三区| 中字幕一区二区三区久久蜜桃| 日本中文在线不卡视频| 国产精品不卡高清在线观看| 国产目拍亚洲精品区一区| 午夜福利大片亚洲一区| 91亚洲国产成人久久| 日韩不卡一区二区在线| 国产精品午夜福利在线观看|