電力系統(tǒng)下語音識別的研究與應(yīng)用
發(fā)布時間:2021-11-26 23:41
語音識別是人工智能研究的重要領(lǐng)域,具有重要的理論意義和實用價值,漢語是世界上使用人數(shù)最多的一門語言,漢語語音識別技術(shù)有著非常廣闊的應(yīng)用前景。本文對高斯混合隱馬爾科夫模型(Gaussian Mixture Model/Hidden Markov Model,GMM-HMM)下的漢語語音識別系統(tǒng)中的三個模塊進行了研究和實現(xiàn),針對其中的兩個部分進行了改進,并將改進后的GMM-HMM應(yīng)用到電力系統(tǒng)指令調(diào)度語音識別系統(tǒng)中。首先研究了基于GMM-HMM的漢語語音識別系統(tǒng)的整體框架,對聲學(xué)模型進行了實現(xiàn)與分析,F(xiàn)代漢語不同于印歐語系,其有著聲調(diào)這一獨特屬性,同一個漢字在不同的聲調(diào)下代表不同的意義。針對此現(xiàn)象,本文提出在聲學(xué)模型中增加聲調(diào)模型。實驗證明聲調(diào)模型可以有效的區(qū)分聲韻母相同但聲調(diào)不同的近音字。然后本文在連續(xù)語音識別方向進行研究,F(xiàn)代漢語中,相同的讀音可能代表完全不同的漢字,現(xiàn)階段同音字的識別結(jié)果與實際語義存在一定差異。針對此現(xiàn)象,本文提出將單音素模型改為基于上下文的三音素模型,根據(jù)當前字的出現(xiàn)與前一個字的出現(xiàn)有關(guān)的原則,對訓(xùn)練集進行統(tǒng)計計算字轉(zhuǎn)移概率,并將字轉(zhuǎn)移概率添加至語言模型中。實驗證明...
【文章來源】:武漢工程大學(xué)湖北省
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
人類語音交流示意圖
圖 1-2 語音識別系統(tǒng)框架預(yù)處理部分主要是將接收的波形語音信號進行處理,提取語音信號的聲學(xué)特征。這個過程首先需要對波形語音信號進行加窗和分幀處理,一般采用 25ms 漢明窗,窗移 10ms,將波形信號分割成若干個 25ms 的小
圖 1-3 HMM 的生成模型作為一個例子,在 M 的一個實例中,出現(xiàn)狀態(tài) X =(s2, s2, s3, s4, 察到觀測向量序列 O = (o1, o2, o3, o4, o5, o6)的概率為:( , | )p O X M
【參考文獻】:
期刊論文
[1]基于HMM的聲調(diào)語音模型研究[J]. 易雪蓉,黃巍,胡迪,蔣怡. 武漢工程大學(xué)學(xué)報. 2018(06)
[2]淺析現(xiàn)代漢語三音節(jié)詞界定問題[J]. 王欣欣,王宇楓. 現(xiàn)代語文(學(xué)術(shù)綜合版). 2017(08)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的維吾爾語語音識別[J]. 梁玉龍,屈丹,李真,張文林. 信息工程大學(xué)學(xué)報. 2017(01)
[4]拉普拉斯反變換的計算[J]. 滕巖梅. 高等數(shù)學(xué)研究. 2016(06)
[5]正則化分段區(qū)分性特征變換方法[J]. 陳斌,張連海,屈丹,李弼程. 西安電子科技大學(xué)學(xué)報. 2016(02)
[6]基于HTK的語音識別語言模型設(shè)計及性能分析[J]. 張強,陶宏才. 成都信息工程學(xué)院學(xué)報. 2009(02)
[7]普通話語音識別中的基本音素分析[J]. 黃中偉,楊磊,徐明,馮杉杉. 深圳大學(xué)學(xué)報. 2006(04)
[8]“十五”高教版《現(xiàn)代漢語》的語法系統(tǒng)[J]. 張登岐. 阜陽師范學(xué)院學(xué)報(社會科學(xué)版). 2005(06)
[9]基于段長分布的HMM語音識別模型[J]. 王作英,肖熙. 電子學(xué)報. 2004(01)
[10]需求牽引技術(shù)推動開展我國人工智能技術(shù)的研究[J]. 汪成為. 中國科技論壇. 1996(02)
博士論文
[1]基于深層神經(jīng)網(wǎng)絡(luò)的語音識別聲學(xué)建模研究[D]. 周盼.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]連續(xù)語音識別系統(tǒng)的研究與實現(xiàn)[D]. 魯澤茹.浙江工業(yè)大學(xué) 2016
[2]基于網(wǎng)頁的語音呼叫系統(tǒng)的研究與實現(xiàn)[D]. 鄒琳.電子科技大學(xué) 2014
[3]區(qū)分性訓(xùn)練和區(qū)分性自適應(yīng)在自動語音識別聲學(xué)模型優(yōu)化中的應(yīng)用[D]. 竺博.中國科學(xué)技術(shù)大學(xué) 2009
本文編號:3521154
【文章來源】:武漢工程大學(xué)湖北省
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【部分圖文】:
人類語音交流示意圖
圖 1-2 語音識別系統(tǒng)框架預(yù)處理部分主要是將接收的波形語音信號進行處理,提取語音信號的聲學(xué)特征。這個過程首先需要對波形語音信號進行加窗和分幀處理,一般采用 25ms 漢明窗,窗移 10ms,將波形信號分割成若干個 25ms 的小
圖 1-3 HMM 的生成模型作為一個例子,在 M 的一個實例中,出現(xiàn)狀態(tài) X =(s2, s2, s3, s4, 察到觀測向量序列 O = (o1, o2, o3, o4, o5, o6)的概率為:( , | )p O X M
【參考文獻】:
期刊論文
[1]基于HMM的聲調(diào)語音模型研究[J]. 易雪蓉,黃巍,胡迪,蔣怡. 武漢工程大學(xué)學(xué)報. 2018(06)
[2]淺析現(xiàn)代漢語三音節(jié)詞界定問題[J]. 王欣欣,王宇楓. 現(xiàn)代語文(學(xué)術(shù)綜合版). 2017(08)
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的維吾爾語語音識別[J]. 梁玉龍,屈丹,李真,張文林. 信息工程大學(xué)學(xué)報. 2017(01)
[4]拉普拉斯反變換的計算[J]. 滕巖梅. 高等數(shù)學(xué)研究. 2016(06)
[5]正則化分段區(qū)分性特征變換方法[J]. 陳斌,張連海,屈丹,李弼程. 西安電子科技大學(xué)學(xué)報. 2016(02)
[6]基于HTK的語音識別語言模型設(shè)計及性能分析[J]. 張強,陶宏才. 成都信息工程學(xué)院學(xué)報. 2009(02)
[7]普通話語音識別中的基本音素分析[J]. 黃中偉,楊磊,徐明,馮杉杉. 深圳大學(xué)學(xué)報. 2006(04)
[8]“十五”高教版《現(xiàn)代漢語》的語法系統(tǒng)[J]. 張登岐. 阜陽師范學(xué)院學(xué)報(社會科學(xué)版). 2005(06)
[9]基于段長分布的HMM語音識別模型[J]. 王作英,肖熙. 電子學(xué)報. 2004(01)
[10]需求牽引技術(shù)推動開展我國人工智能技術(shù)的研究[J]. 汪成為. 中國科技論壇. 1996(02)
博士論文
[1]基于深層神經(jīng)網(wǎng)絡(luò)的語音識別聲學(xué)建模研究[D]. 周盼.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]連續(xù)語音識別系統(tǒng)的研究與實現(xiàn)[D]. 魯澤茹.浙江工業(yè)大學(xué) 2016
[2]基于網(wǎng)頁的語音呼叫系統(tǒng)的研究與實現(xiàn)[D]. 鄒琳.電子科技大學(xué) 2014
[3]區(qū)分性訓(xùn)練和區(qū)分性自適應(yīng)在自動語音識別聲學(xué)模型優(yōu)化中的應(yīng)用[D]. 竺博.中國科學(xué)技術(shù)大學(xué) 2009
本文編號:3521154
本文鏈接:http://sikaile.net/kejilunwen/dianlilw/3521154.html
最近更新
教材專著