面向語(yǔ)音識(shí)別的抗噪聽(tīng)覺(jué)特征提取及優(yōu)化
發(fā)布時(shí)間:2022-01-01 18:35
語(yǔ)音作為語(yǔ)言的物質(zhì)外殼和聲學(xué)表現(xiàn),是人類最容易獲取信息的載體之一,它承載和傳達(dá)著多方面的信息源,是人機(jī)交互和智能通信領(lǐng)域的研究?jī)?nèi)容之一。語(yǔ)音識(shí)別作為具有廣闊應(yīng)用前景和價(jià)值的實(shí)現(xiàn)智能人機(jī)交互的技術(shù)之一,主要是達(dá)到與計(jì)算機(jī)進(jìn)行語(yǔ)音交流的目的。最終讓計(jì)算機(jī)能夠?qū)⑤斎氲恼Z(yǔ)音信號(hào)轉(zhuǎn)變成聽(tīng)得懂的命令。而完整的語(yǔ)音識(shí)別系統(tǒng)包含特征提取和模式識(shí)別兩大模塊。其中特征提取作為語(yǔ)音識(shí)別的重要組成部分,對(duì)系統(tǒng)性能的優(yōu)劣有較大影響。理想的特征參數(shù)應(yīng)該在復(fù)雜環(huán)境下都具有較高的穩(wěn)健性和魯棒性,而如何從語(yǔ)音信號(hào)中提取到能夠充分表征其語(yǔ)義信息、削弱說(shuō)話人個(gè)性、易分類且具有穩(wěn)定性的有效特征參數(shù),進(jìn)一步提高識(shí)別率是語(yǔ)音識(shí)別的關(guān)鍵。本文從語(yǔ)音識(shí)別的研究現(xiàn)狀和背景意義出發(fā),在前人的研究基礎(chǔ)上,詳細(xì)介紹了語(yǔ)音識(shí)別和語(yǔ)音特征參數(shù)的研究動(dòng)態(tài),并針對(duì)當(dāng)前語(yǔ)音特征參數(shù)中表征語(yǔ)義信息的不完整性,以及在噪聲環(huán)境下識(shí)別性能下降的問(wèn)題進(jìn)行研究,從特征提取、特征融合和特征優(yōu)化三個(gè)方面入手,對(duì)語(yǔ)音識(shí)別系統(tǒng)的不同環(huán)節(jié)進(jìn)行深入研究和實(shí)驗(yàn)驗(yàn)證。論文的主要研究工作如下:(1)概述了語(yǔ)音識(shí)別系統(tǒng)的組成。首先對(duì)語(yǔ)音信號(hào)的三大數(shù)字模型進(jìn)行介紹,其次,詳細(xì)闡述了語(yǔ)...
【文章來(lái)源】:太原理工大學(xué)山西省 211工程院校
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)加重前后的效果對(duì)比圖
圖 2-6 Mel 濾波器組Figure 2-6 Mel filter bank⑤ 對(duì)④中濾波器的輸出取對(duì)數(shù),具體計(jì)算過(guò)程如下式(2-20): 120log ,0Na mkS m X k H k m M (2-20⑥ 將⑤中的輸出通過(guò)離散余弦變換(Discrete Cosine Transform, DCT)去相關(guān)到 MFCC 特征: 101 2cos ,0Nmn mMFCC n S m n MM (2-215 常見(jiàn)的語(yǔ)音識(shí)別網(wǎng)絡(luò)搭建合適、高效的語(yǔ)音聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的最后一階段,對(duì)系統(tǒng)性能
太原理工大學(xué)碩士研究生學(xué)位論文中的隱馬爾可夫模型需要解決 3 個(gè)基本問(wèn)題:算模型條件下產(chǎn)生觀測(cè)序列 1 2, ,TO O O O 的概率種意義上解釋觀測(cè)序列的最佳狀態(tài)鏈;序列已知時(shí),對(duì)模型參數(shù) A, B, 進(jìn)行調(diào)整使得 P模型布普遍適用的自然分布規(guī)律,針對(duì)語(yǔ)音信號(hào)這種較復(fù)個(gè)高斯模型的加權(quán)累加建立數(shù)學(xué)模型。從而準(zhǔn)確地描況。一種信號(hào)統(tǒng)計(jì)模型,是依賴最大似然估計(jì)算法和期望框圖如下:
【參考文獻(xiàn)】:
期刊論文
[1]Speech recognition algorithm based on neural network and hidden Markov model[J]. Zhao Jianhui,Gao Hongbo,Liu Yuchao,Cheng Bo. The Journal of China Universities of Posts and Telecommunications. 2018(04)
[2]智能化空管技術(shù)研究與展望[J]. 楊紅雨,楊波,武喜萍,余靜. 工程科學(xué)與技術(shù). 2018(04)
[3]一種改進(jìn)的特征提取方法在語(yǔ)音識(shí)別中的應(yīng)用[J]. 陳樹(shù),于海波. 傳感器與微系統(tǒng). 2018(05)
[4]基于時(shí)域特征的光纖安防系統(tǒng)信號(hào)識(shí)別算法[J]. 盧娜,安博文,李玉漣,盧學(xué)佳. 傳感器與微系統(tǒng). 2017(04)
[5]基于線性預(yù)測(cè)倒譜系數(shù)的地震相分析[J]. 解滔,鄭曉東,張?. 地球物理學(xué)報(bào). 2016(11)
[6]LMS自適應(yīng)算法在車輛自動(dòng)化語(yǔ)音識(shí)別過(guò)程的去噪[J]. 王蕾蕾,龍艷群. 科技經(jīng)濟(jì)導(dǎo)刊. 2016(05)
[7]子空間域相關(guān)特征變換與融合的語(yǔ)音識(shí)別方法[J]. 陳斌,胡平舸,屈丹. 西安交通大學(xué)學(xué)報(bào). 2016(04)
[8]小鼠外側(cè)丘系背核神經(jīng)元對(duì)純音的反應(yīng)特性[J]. 佀文娟,程艷玲,楊丹丹,王欣. 生理學(xué)報(bào). 2016(01)
[9]基于PCA和SVM的普通話語(yǔ)音情感識(shí)別[J]. 蔣海華,胡斌. 計(jì)算機(jī)科學(xué). 2015(11)
[10]基于語(yǔ)音識(shí)別技術(shù)的無(wú)障礙居家環(huán)境系統(tǒng)研究[J]. 朱滬生,喻洪流,石萍,方又方,簡(jiǎn)卓. 生物醫(yī)學(xué)工程學(xué)雜志. 2015(05)
碩士論文
[1]基于語(yǔ)音信號(hào)的抑郁癥識(shí)別研究與應(yīng)用[D]. 劉美.天津師范大學(xué) 2018
[2]基于時(shí)頻域分析的電子干擾識(shí)別方法研究[D]. 劉建洋.電子科技大學(xué) 2018
[3]基于特征融合的開(kāi)挖器械聲音識(shí)別算法研究[D]. 程飛.杭州電子科技大學(xué) 2018
[4]基于語(yǔ)音疲勞度的識(shí)別研究[D]. 張靚.安徽大學(xué) 2015
[5]數(shù)字助聽(tīng)器的自適應(yīng)回波抵消算法的研究[D]. 張曉永.哈爾濱工業(yè)大學(xué) 2014
[6]基于感知對(duì)數(shù)面積比系數(shù)的說(shuō)話人確認(rèn)系統(tǒng)的研究[D]. 尹聰.太原理工大學(xué) 2013
[7]耳蝸濾波器倒譜特征在語(yǔ)音識(shí)別中的應(yīng)用[D]. 高揚(yáng).太原理工大學(xué) 2011
本文編號(hào):3562606
【文章來(lái)源】:太原理工大學(xué)山西省 211工程院校
【文章頁(yè)數(shù)】:91 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)加重前后的效果對(duì)比圖
圖 2-6 Mel 濾波器組Figure 2-6 Mel filter bank⑤ 對(duì)④中濾波器的輸出取對(duì)數(shù),具體計(jì)算過(guò)程如下式(2-20): 120log ,0Na mkS m X k H k m M (2-20⑥ 將⑤中的輸出通過(guò)離散余弦變換(Discrete Cosine Transform, DCT)去相關(guān)到 MFCC 特征: 101 2cos ,0Nmn mMFCC n S m n MM (2-215 常見(jiàn)的語(yǔ)音識(shí)別網(wǎng)絡(luò)搭建合適、高效的語(yǔ)音聲學(xué)模型是語(yǔ)音識(shí)別系統(tǒng)的最后一階段,對(duì)系統(tǒng)性能
太原理工大學(xué)碩士研究生學(xué)位論文中的隱馬爾可夫模型需要解決 3 個(gè)基本問(wèn)題:算模型條件下產(chǎn)生觀測(cè)序列 1 2, ,TO O O O 的概率種意義上解釋觀測(cè)序列的最佳狀態(tài)鏈;序列已知時(shí),對(duì)模型參數(shù) A, B, 進(jìn)行調(diào)整使得 P模型布普遍適用的自然分布規(guī)律,針對(duì)語(yǔ)音信號(hào)這種較復(fù)個(gè)高斯模型的加權(quán)累加建立數(shù)學(xué)模型。從而準(zhǔn)確地描況。一種信號(hào)統(tǒng)計(jì)模型,是依賴最大似然估計(jì)算法和期望框圖如下:
【參考文獻(xiàn)】:
期刊論文
[1]Speech recognition algorithm based on neural network and hidden Markov model[J]. Zhao Jianhui,Gao Hongbo,Liu Yuchao,Cheng Bo. The Journal of China Universities of Posts and Telecommunications. 2018(04)
[2]智能化空管技術(shù)研究與展望[J]. 楊紅雨,楊波,武喜萍,余靜. 工程科學(xué)與技術(shù). 2018(04)
[3]一種改進(jìn)的特征提取方法在語(yǔ)音識(shí)別中的應(yīng)用[J]. 陳樹(shù),于海波. 傳感器與微系統(tǒng). 2018(05)
[4]基于時(shí)域特征的光纖安防系統(tǒng)信號(hào)識(shí)別算法[J]. 盧娜,安博文,李玉漣,盧學(xué)佳. 傳感器與微系統(tǒng). 2017(04)
[5]基于線性預(yù)測(cè)倒譜系數(shù)的地震相分析[J]. 解滔,鄭曉東,張?. 地球物理學(xué)報(bào). 2016(11)
[6]LMS自適應(yīng)算法在車輛自動(dòng)化語(yǔ)音識(shí)別過(guò)程的去噪[J]. 王蕾蕾,龍艷群. 科技經(jīng)濟(jì)導(dǎo)刊. 2016(05)
[7]子空間域相關(guān)特征變換與融合的語(yǔ)音識(shí)別方法[J]. 陳斌,胡平舸,屈丹. 西安交通大學(xué)學(xué)報(bào). 2016(04)
[8]小鼠外側(cè)丘系背核神經(jīng)元對(duì)純音的反應(yīng)特性[J]. 佀文娟,程艷玲,楊丹丹,王欣. 生理學(xué)報(bào). 2016(01)
[9]基于PCA和SVM的普通話語(yǔ)音情感識(shí)別[J]. 蔣海華,胡斌. 計(jì)算機(jī)科學(xué). 2015(11)
[10]基于語(yǔ)音識(shí)別技術(shù)的無(wú)障礙居家環(huán)境系統(tǒng)研究[J]. 朱滬生,喻洪流,石萍,方又方,簡(jiǎn)卓. 生物醫(yī)學(xué)工程學(xué)雜志. 2015(05)
碩士論文
[1]基于語(yǔ)音信號(hào)的抑郁癥識(shí)別研究與應(yīng)用[D]. 劉美.天津師范大學(xué) 2018
[2]基于時(shí)頻域分析的電子干擾識(shí)別方法研究[D]. 劉建洋.電子科技大學(xué) 2018
[3]基于特征融合的開(kāi)挖器械聲音識(shí)別算法研究[D]. 程飛.杭州電子科技大學(xué) 2018
[4]基于語(yǔ)音疲勞度的識(shí)別研究[D]. 張靚.安徽大學(xué) 2015
[5]數(shù)字助聽(tīng)器的自適應(yīng)回波抵消算法的研究[D]. 張曉永.哈爾濱工業(yè)大學(xué) 2014
[6]基于感知對(duì)數(shù)面積比系數(shù)的說(shuō)話人確認(rèn)系統(tǒng)的研究[D]. 尹聰.太原理工大學(xué) 2013
[7]耳蝸濾波器倒譜特征在語(yǔ)音識(shí)別中的應(yīng)用[D]. 高揚(yáng).太原理工大學(xué) 2011
本文編號(hào):3562606
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3562606.html
最近更新
教材專著