基于關(guān)鍵詞/垃圾語音模型優(yōu)化的關(guān)鍵詞識(shí)別
發(fā)布時(shí)間:2022-02-11 11:50
隨著計(jì)算機(jī)軟硬件技術(shù)的發(fā)展,當(dāng)今社會(huì)已經(jīng)逐漸走入了人工智能時(shí)代。在移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的背景下萬物開始互通,人機(jī)的交互也成為了新技術(shù)發(fā)展的焦點(diǎn)所在,語音交互正是人機(jī)智能交互的一種重要形式。語音是人類最自然也最便捷的溝通方式,這一特點(diǎn)賦予了人機(jī)語音智能交互在當(dāng)下科學(xué)技術(shù)發(fā)展中的重要地位。語音交互的終極目標(biāo)是實(shí)現(xiàn)人與機(jī)器的無障礙溝通,隨著幾十年來語音領(lǐng)域的技術(shù)積累,這一目標(biāo)不再是遙不可及的,大量有效的算法為語音交互奠定了良好的發(fā)展前景。本文基于隱馬爾科夫模型、高斯混合模型和令牌傳遞算法,開發(fā)了基于Windows平臺(tái)和Android平臺(tái)的語音關(guān)鍵詞識(shí)別系統(tǒng),并根據(jù)解碼算法的原理提出了相關(guān)的優(yōu)化方法,在保持系統(tǒng)對預(yù)定義的關(guān)鍵詞高效、準(zhǔn)確的識(shí)別的同時(shí),大幅度降低誤觸發(fā)的概率。使得系統(tǒng)能夠應(yīng)用在實(shí)際家居環(huán)境中,用于電視或者其他智能設(shè)備的全語音控制。相關(guān)工作和創(chuàng)新點(diǎn)如下:在研究現(xiàn)有基于隱馬爾科夫模型語音聲學(xué)建模的基礎(chǔ)上,開發(fā)了Windows平臺(tái)的關(guān)鍵詞識(shí)別系統(tǒng),對令牌傳遞解碼算法的缺陷進(jìn)行深入研究,引入關(guān)鍵詞/垃圾語音模型從而使系統(tǒng)對一般的語音具有拒識(shí)別能力。并且,通過對實(shí)驗(yàn)結(jié)果的詳細(xì)分析,本文提出了...
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高斯混合模型
圖 2-2 馬爾科夫模型這些參數(shù),我們能夠很方便態(tài)確定為 ,那么狀態(tài)序列acbda)* P(c | a)* P(b | c)* P(d |.7 1 0.6 0.98 移關(guān)系的不同,馬爾科夫模歷模型、無跨越左-右模型、c0.710.9
模型的這些參數(shù),我們能夠很方便地得到不初始狀態(tài)確定為 ,那么狀態(tài)序列 = * , P(X acbda)π(a)* P(c | a)* P(b | c)* P(d | b)* P(a1 0.7 1 0.6 0.90.378 之間轉(zhuǎn)移關(guān)系的不同,馬爾科夫模型一般可各態(tài)遍歷模型、無跨越左-右模型、有跨越圖 2-3 各態(tài)遍歷模型
【參考文獻(xiàn)】:
期刊論文
[1]基于嵌入式語音識(shí)別的家用服務(wù)機(jī)器人控制系統(tǒng)[J]. 董胡. 微型電腦應(yīng)用. 2017(04)
[2]智能家居發(fā)展現(xiàn)狀及未來淺析[J]. 朱敏玲,李寧. 電視技術(shù). 2015(04)
[3]卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用[J]. 張晴晴,劉勇,王智超,潘接林,顏永紅. 網(wǎng)絡(luò)新媒體技術(shù). 2014(06)
[4]基于MFCC的語音情感識(shí)別[J]. 韓一,王國胤,楊勇. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(05)
[5]語音識(shí)別技術(shù)研究進(jìn)展[J]. 柳春. 甘肅科技. 2008(09)
[6]基于HTK的語音識(shí)別系統(tǒng)設(shè)計(jì)[J]. 石現(xiàn)峰,張學(xué)智,張峰. 計(jì)算機(jī)技術(shù)與發(fā)展. 2006(10)
[7]JNI技術(shù)實(shí)現(xiàn)跨平臺(tái)開發(fā)的研究[J]. 任俊偉,林東岱. 計(jì)算機(jī)應(yīng)用研究. 2005(07)
[8]語音識(shí)別的發(fā)展現(xiàn)狀[J]. 俞鐵城. 通訊世界. 2005(02)
[9]隱馬爾可夫模型在語音識(shí)別中的應(yīng)用[J]. 段紅梅,汪軍,馬良河,徐冉. 工科數(shù)學(xué). 2002(06)
[10]摩爾定律與半導(dǎo)體設(shè)備[J]. 翁壽松. 電子工業(yè)專用設(shè)備. 2002(04)
博士論文
[1]DNN-HMM語音識(shí)別聲學(xué)模型的說話人自適應(yīng)[D]. 薛少飛.中國科學(xué)技術(shù)大學(xué) 2015
[2]基于深層神經(jīng)網(wǎng)絡(luò)的語音識(shí)別聲學(xué)建模研究[D]. 周盼.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用研究[D]. 陳碩.華南理工大學(xué) 2013
[2]非特定人語音識(shí)別關(guān)鍵技術(shù)研究[D]. 顧亞強(qiáng).國防科學(xué)技術(shù)大學(xué) 2009
[3]基于DTW和HMM的語音識(shí)別算法仿真及軟件設(shè)計(jì)[D]. 李永健.哈爾濱工程大學(xué) 2009
[4]語音識(shí)別技術(shù)的研究及基本實(shí)現(xiàn)[D]. 雷靜.武漢理工大學(xué) 2002
本文編號(hào):3620225
【文章來源】:華南理工大學(xué)廣東省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高斯混合模型
圖 2-2 馬爾科夫模型這些參數(shù),我們能夠很方便態(tài)確定為 ,那么狀態(tài)序列acbda)* P(c | a)* P(b | c)* P(d |.7 1 0.6 0.98 移關(guān)系的不同,馬爾科夫模歷模型、無跨越左-右模型、c0.710.9
模型的這些參數(shù),我們能夠很方便地得到不初始狀態(tài)確定為 ,那么狀態(tài)序列 = * , P(X acbda)π(a)* P(c | a)* P(b | c)* P(d | b)* P(a1 0.7 1 0.6 0.90.378 之間轉(zhuǎn)移關(guān)系的不同,馬爾科夫模型一般可各態(tài)遍歷模型、無跨越左-右模型、有跨越圖 2-3 各態(tài)遍歷模型
【參考文獻(xiàn)】:
期刊論文
[1]基于嵌入式語音識(shí)別的家用服務(wù)機(jī)器人控制系統(tǒng)[J]. 董胡. 微型電腦應(yīng)用. 2017(04)
[2]智能家居發(fā)展現(xiàn)狀及未來淺析[J]. 朱敏玲,李寧. 電視技術(shù). 2015(04)
[3]卷積神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用[J]. 張晴晴,劉勇,王智超,潘接林,顏永紅. 網(wǎng)絡(luò)新媒體技術(shù). 2014(06)
[4]基于MFCC的語音情感識(shí)別[J]. 韓一,王國胤,楊勇. 重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2008(05)
[5]語音識(shí)別技術(shù)研究進(jìn)展[J]. 柳春. 甘肅科技. 2008(09)
[6]基于HTK的語音識(shí)別系統(tǒng)設(shè)計(jì)[J]. 石現(xiàn)峰,張學(xué)智,張峰. 計(jì)算機(jī)技術(shù)與發(fā)展. 2006(10)
[7]JNI技術(shù)實(shí)現(xiàn)跨平臺(tái)開發(fā)的研究[J]. 任俊偉,林東岱. 計(jì)算機(jī)應(yīng)用研究. 2005(07)
[8]語音識(shí)別的發(fā)展現(xiàn)狀[J]. 俞鐵城. 通訊世界. 2005(02)
[9]隱馬爾可夫模型在語音識(shí)別中的應(yīng)用[J]. 段紅梅,汪軍,馬良河,徐冉. 工科數(shù)學(xué). 2002(06)
[10]摩爾定律與半導(dǎo)體設(shè)備[J]. 翁壽松. 電子工業(yè)專用設(shè)備. 2002(04)
博士論文
[1]DNN-HMM語音識(shí)別聲學(xué)模型的說話人自適應(yīng)[D]. 薛少飛.中國科學(xué)技術(shù)大學(xué) 2015
[2]基于深層神經(jīng)網(wǎng)絡(luò)的語音識(shí)別聲學(xué)建模研究[D]. 周盼.中國科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在語音識(shí)別中的應(yīng)用研究[D]. 陳碩.華南理工大學(xué) 2013
[2]非特定人語音識(shí)別關(guān)鍵技術(shù)研究[D]. 顧亞強(qiáng).國防科學(xué)技術(shù)大學(xué) 2009
[3]基于DTW和HMM的語音識(shí)別算法仿真及軟件設(shè)計(jì)[D]. 李永健.哈爾濱工程大學(xué) 2009
[4]語音識(shí)別技術(shù)的研究及基本實(shí)現(xiàn)[D]. 雷靜.武漢理工大學(xué) 2002
本文編號(hào):3620225
本文鏈接:http://sikaile.net/kejilunwen/wltx/3620225.html
最近更新
教材專著