基于深度學(xué)習(xí)的音素特征識別研究
發(fā)布時間:2021-09-11 16:43
語音作為日常交流的重要方式,在人類發(fā)展歷程中占有無可替代的地位。21世紀(jì)后,神經(jīng)網(wǎng)絡(luò)的重新提出和互聯(lián)網(wǎng)的快速發(fā)展將語音識別技術(shù)推進(jìn)到一個新的階段。由于模式識別的進(jìn)步,語音識別作為人機(jī)交互的重要組成是當(dāng)前研究的熱點。在語音的特征提取、聲學(xué)模型識別和解碼三個步驟中,特征提取作為語音識別的第一步尤其重要,隨著深度學(xué)習(xí)在語音識別領(lǐng)域的成功應(yīng)用,使用神經(jīng)網(wǎng)絡(luò)的深度結(jié)構(gòu)可以實現(xiàn)對語音數(shù)據(jù)的復(fù)雜函數(shù)計算和高維學(xué)習(xí),提取出比淺層結(jié)構(gòu)分類效果更好的音素特征。近年來,大量的研究人員提出了多種利用神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)來提高語音特征識別率的方法,盡管在一定程度上取得了較好的效果,但是語音識別的研究技術(shù)仍存在進(jìn)步的空間。本文為降低語音特征的識別錯誤率,首先,從語音信號中提取傳統(tǒng)特征,然后對傳統(tǒng)的特征進(jìn)行音素提取;其次,建立新的串聯(lián)系統(tǒng)模型,通過相關(guān)狀態(tài)的共享結(jié)構(gòu)來減少計算復(fù)雜度,同時充分利用深度學(xué)習(xí)框架中生成性網(wǎng)絡(luò)的映射方式和學(xué)習(xí)能力,進(jìn)行特征參數(shù)的提取;最后,經(jīng)過聲學(xué)模型的學(xué)習(xí)識別與解碼后得到音素識別錯誤率,并以此為指標(biāo)判斷模型的效果。本文主要的研究內(nèi)容如下:(1)子空間高斯混合模型在狀態(tài)空間共享同一結(jié)構(gòu)的情況...
【文章來源】:陜西師范大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
一人機(jī)交互系統(tǒng)模塊組成
HMM的組成
?^??觀察序列??圖2-3?HMM的組成??Fig.?2-3?Composition?of?the?Hidden?Markov?Model??隱馬爾可夫模型作為一個雙內(nèi)嵌形式的隨機(jī)過程,一個過程是無法觀測的,??僅可借助另一個過程中輸出的觀察序列得到結(jié)果。設(shè)HMM模型的狀態(tài)轉(zhuǎn)移序列??是夕二的…七,符號輸出為■,則考慮到在HMM中所有可能的狀態(tài)??序列,輸出的符號序列概率為:??P(0)?=?[P(0|作⑷=[n?外,,?)?(2-7)??S?Si??根據(jù)上面的分析,可以看出聲學(xué)模型HMM由以下5個參數(shù)決定:??M?=?{S,?O,?n,?A,?B}?(2-8)??式中,S為有限的狀態(tài)集合,O為輸出的可以進(jìn)行觀測的符號集合,;r為初始概??率的集合
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)深度置信網(wǎng)絡(luò)的語音增強算法[J]. 余華,唐於烽,趙力. 數(shù)據(jù)采集與處理. 2018(05)
[2]面向中文語音情感識別的改進(jìn)棧式自編碼結(jié)構(gòu)[J]. 朱芳枚,趙力,梁瑞宇,王青云,鄒采榮. 東南大學(xué)學(xué)報(自然科學(xué)版). 2017(04)
[3]深度學(xué)習(xí)在語音識別中的研究進(jìn)展綜述[J]. 侯一民,周慧瓊,王政一. 計算機(jī)應(yīng)用研究. 2017(08)
[4]LVCSR系統(tǒng)中一種基于區(qū)分性和自適應(yīng)瓶頸深度置信網(wǎng)絡(luò)的特征提取方法[J]. 陳雷,楊俊安,王一,王龍. 信號處理. 2015(03)
[5]非齊次語音識別HMM模型和THED語音識別與理解系統(tǒng)[J]. 王作英. 電信科學(xué). 1993(04)
[6]用圖樣匹配法在計算機(jī)上自動識別語音[J]. 俞鐵城. 物理學(xué)報. 1977(05)
[7]漢語標(biāo)準(zhǔn)頻譜[J]. 馬大猷,張家騄. 聲學(xué)學(xué)報. 1965(04)
本文編號:3393356
【文章來源】:陜西師范大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
一人機(jī)交互系統(tǒng)模塊組成
HMM的組成
?^??觀察序列??圖2-3?HMM的組成??Fig.?2-3?Composition?of?the?Hidden?Markov?Model??隱馬爾可夫模型作為一個雙內(nèi)嵌形式的隨機(jī)過程,一個過程是無法觀測的,??僅可借助另一個過程中輸出的觀察序列得到結(jié)果。設(shè)HMM模型的狀態(tài)轉(zhuǎn)移序列??是夕二的…七,符號輸出為■,則考慮到在HMM中所有可能的狀態(tài)??序列,輸出的符號序列概率為:??P(0)?=?[P(0|作⑷=[n?外,,?)?(2-7)??S?Si??根據(jù)上面的分析,可以看出聲學(xué)模型HMM由以下5個參數(shù)決定:??M?=?{S,?O,?n,?A,?B}?(2-8)??式中,S為有限的狀態(tài)集合,O為輸出的可以進(jìn)行觀測的符號集合,;r為初始概??率的集合
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)深度置信網(wǎng)絡(luò)的語音增強算法[J]. 余華,唐於烽,趙力. 數(shù)據(jù)采集與處理. 2018(05)
[2]面向中文語音情感識別的改進(jìn)棧式自編碼結(jié)構(gòu)[J]. 朱芳枚,趙力,梁瑞宇,王青云,鄒采榮. 東南大學(xué)學(xué)報(自然科學(xué)版). 2017(04)
[3]深度學(xué)習(xí)在語音識別中的研究進(jìn)展綜述[J]. 侯一民,周慧瓊,王政一. 計算機(jī)應(yīng)用研究. 2017(08)
[4]LVCSR系統(tǒng)中一種基于區(qū)分性和自適應(yīng)瓶頸深度置信網(wǎng)絡(luò)的特征提取方法[J]. 陳雷,楊俊安,王一,王龍. 信號處理. 2015(03)
[5]非齊次語音識別HMM模型和THED語音識別與理解系統(tǒng)[J]. 王作英. 電信科學(xué). 1993(04)
[6]用圖樣匹配法在計算機(jī)上自動識別語音[J]. 俞鐵城. 物理學(xué)報. 1977(05)
[7]漢語標(biāo)準(zhǔn)頻譜[J]. 馬大猷,張家騄. 聲學(xué)學(xué)報. 1965(04)
本文編號:3393356
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3393356.html
最近更新
教材專著