天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Kaldi的羅平方言語音識(shí)別研究

發(fā)布時(shí)間:2020-10-27 17:50
【摘要】:語音是人類信息交互的主要手段,近年來,隨著科學(xué)技術(shù)的不斷發(fā)展,語音識(shí)別開始應(yīng)用于生活的方方面面,不過當(dāng)前中文語音識(shí)別系統(tǒng)均是基于普通話,對(duì)于中國這樣一個(gè)地域廣大、民族眾多的國家來說,存在著眾多方言,基于普通話的語音識(shí)別系統(tǒng)是遠(yuǎn)遠(yuǎn)不能滿足大眾需求的,所以針對(duì)各地區(qū)方言的研究與應(yīng)用顯得尤為必要。本文簡要介紹了語音識(shí)別的發(fā)展歷史,闡述了語音識(shí)別技術(shù)的基本原理,認(rèn)真分析了語音識(shí)別的每一項(xiàng)技術(shù)的誕生對(duì)語音識(shí)別發(fā)展的重要意義。.并研究了從原始的模擬語音信號(hào)采集處理到構(gòu)建語言模型和聲學(xué)模型的全過程中所涉及的相關(guān)技術(shù)。接下來的論述中,著重研究了語音識(shí)別的聲學(xué)模型。本文所研究的聲學(xué)模型包括:單音素模型、三音素模型、優(yōu)化后的三音素模型、隱馬爾科夫模型(HMM)、以及深度神經(jīng)網(wǎng)絡(luò)模型(DNN)。本文還對(duì)語音識(shí)別的語言模型進(jìn)行了研究,在本課題中,主要研究了基于統(tǒng)計(jì)的N-gram模型。最后本文對(duì)羅平方言的特征進(jìn)行了分析,搭建了基于Kaldi的羅平方言語音識(shí)別系統(tǒng)。在文中,搭建了五組對(duì)比實(shí)驗(yàn),比較了在不同的聲學(xué)模型、不同的語言模型及不同的訓(xùn)練樣本數(shù)量下系統(tǒng)的識(shí)別準(zhǔn)確性能。實(shí)驗(yàn)表明,在六種不同的聲學(xué)模型中,基于DNN的聲學(xué)模型識(shí)別準(zhǔn)確率最高,高達(dá)96.82%,且基于二元文法模型的實(shí)驗(yàn)結(jié)果優(yōu)于一元文法模型。在二元文法模型實(shí)驗(yàn)中,隨著訓(xùn)練數(shù)據(jù)樣本從1980條增加到2420條,系統(tǒng)識(shí)別正確率不斷提高,這表明訓(xùn)練樣本數(shù)據(jù)量越大,系統(tǒng)識(shí)別正確率越高。在此基礎(chǔ)上,對(duì)訓(xùn)練樣本和測試樣本進(jìn)行調(diào)整,測試結(jié)果表明,系統(tǒng)具有良好的自適應(yīng)性。
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.34
【圖文】:

基于Kaldi的羅平方言語音識(shí)別研究


圖2-2分幀圖??

基于Kaldi的羅平方言語音識(shí)別研究


圖2-3窗函數(shù)幅頻特性曲線??2-3,,一■

基于Kaldi的羅平方言語音識(shí)別研究


圖3-6?—層RBM原理圖??
【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 羅憲華;徐海明;;基于特定人的語音情感識(shí)別系統(tǒng)構(gòu)建[J];中國人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年04期

2 屈丹;張文林;;基于稀疏組LASSO約束的本征音子說話人自適應(yīng)[J];通信學(xué)報(bào);2015年09期

3 張思遠(yuǎn);蔣朝惠;;基于音頻的數(shù)字視頻內(nèi)容安全檢測模型研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年06期

4 梁浩;楊光宇;;基于連續(xù)隱馬爾科夫的語音識(shí)別模型[J];無線互聯(lián)科技;2013年06期

5 田莎莎;唐菀;佘緯;;改進(jìn)MFCC參數(shù)在非特定人語音識(shí)別中的研究[J];科技通報(bào);2013年03期

6 艾散·帕合提;買爾丹·祖農(nóng);蔡亞永;;計(jì)算機(jī)語音識(shí)別與合成技術(shù)[J];中國新通信;2012年21期

7 熊華喬;鄭建彬;詹恩奇;汪陽;華劍;;基于說話人模型聚類的說話人識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2014年02期

8 柳玲玲;趙暉;;聯(lián)機(jī)手寫維吾爾文單詞識(shí)別中兩種語言模型的比較研究[J];計(jì)算機(jī)應(yīng)用與軟件;2012年09期

9 史明泉;;基于DSP的語音錄放系統(tǒng)的設(shè)計(jì)[J];無線電工程;2011年12期

10 張海燕;唐建芳;;基于RBF神經(jīng)網(wǎng)絡(luò)的語音情感識(shí)別[J];四川理工學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年05期


中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條

1 劉勝江;連續(xù)數(shù)字語音識(shí)別系統(tǒng)的研究及應(yīng)用[D];浙江工業(yè)大學(xué);2016年

2 李思舒;一種多語言、多編碼的識(shí)別方法[D];南京大學(xué);2012年

3 周芬;基于電話信道的聲紋識(shí)別算法研究[D];南京理工大學(xué);2012年

4 何金瑞;說話人識(shí)別中的模式匹配方法研究[D];西華大學(xué);2009年

5 陳金明;人工神經(jīng)網(wǎng)絡(luò)在電子設(shè)備自動(dòng)控制方面的研究與應(yīng)用[D];電子科技大學(xué);2008年

6 胡磊;基于隱馬爾科夫模型的語音識(shí)別技術(shù)研究[D];武漢理工大學(xué);2007年



本文編號(hào):2858847

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2858847.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶12354***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com