基于HMM和RNN的無人機(jī)語音控制方案與仿真研究
發(fā)布時間:2021-04-11 02:14
為簡化無人機(jī)操作,避免誤操作,設(shè)計(jì)了一套基于隱馬爾可夫模型(Hidden Markov Model,HMM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)的無人機(jī)語音控制方案。該方案采用HMM識別無人機(jī)語音指令;同時采用RNN對多套無人機(jī)操作指令串進(jìn)行訓(xùn)練,并對當(dāng)前時刻指令進(jìn)行預(yù)測,通過計(jì)算二者的相關(guān)性判斷是否執(zhí)行。仿真結(jié)果表明,該方案對HMM識別錯誤指令的辨別率達(dá)到61.90%,使整體錯誤率降至1.43%,表明該方案具有較為優(yōu)異的性能。
【文章來源】:系統(tǒng)仿真學(xué)報(bào). 2020,32(03)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應(yīng)的無人機(jī)語音指令,即為識別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長短時記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語音識別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個有限長度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時間展開后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個語音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時性上的性能。如果直接將無人機(jī)
出概率,其中概率最大的隱馬爾可夫模型對應(yīng)的無人機(jī)語音指令,即為識別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長短時記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語音識別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個有限長度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時間展開后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個語音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時性上的性能。如果直接將無人機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]基于安卓語音識別的無人機(jī)控制系統(tǒng)[J]. 應(yīng)捷,韓旭. 軟件導(dǎo)刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡(luò)的語音識別快速解碼算法[J]. 張舸,張鵬遠(yuǎn),潘接林,顏永紅. 電子與信息學(xué)報(bào). 2017(04)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅(jiān)強(qiáng),潘登,胡憚. 計(jì)算機(jī)研究與發(fā)展. 2014(09)
[4]語音端點(diǎn)檢測的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學(xué)報(bào). 2005(08)
碩士論文
[1]RNN-BLSTM聲學(xué)模型的說話人自適應(yīng)方法研究[D]. 黃智穎.中國科學(xué)技術(shù)大學(xué) 2017
[2]基于RNN的手寫軌跡序列生成與分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學(xué) 2016
[3]無人機(jī)語音指令控制系統(tǒng)技術(shù)研究[D]. 王沖.南京航空航天大學(xué) 2012
[4]基于神經(jīng)網(wǎng)絡(luò)/HMM的語音識別算法的研究[D]. 張志剛.武漢理工大學(xué) 2006
[5]語音控制的應(yīng)用研究[D]. 何湘智.中國人民解放軍國防科學(xué)技術(shù)大學(xué) 2002
本文編號:3130743
【文章來源】:系統(tǒng)仿真學(xué)報(bào). 2020,32(03)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應(yīng)的無人機(jī)語音指令,即為識別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長短時記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語音識別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個有限長度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時間展開后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個語音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時性上的性能。如果直接將無人機(jī)
出概率,其中概率最大的隱馬爾可夫模型對應(yīng)的無人機(jī)語音指令,即為識別結(jié)果。3循環(huán)神經(jīng)網(wǎng)絡(luò)近年來,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及一些改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),如長短時記憶神經(jīng)網(wǎng)絡(luò)(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(luò)(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運(yùn)用于語音識別的聲學(xué)建模當(dāng)中,并取得了較前饋神經(jīng)網(wǎng)絡(luò)更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡(luò)取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡(luò)只能利用一個有限長度內(nèi)的信息。循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,時間展開后的結(jié)構(gòu)圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡(luò)時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因?yàn)檠h(huán)神經(jīng)網(wǎng)絡(luò)的記憶能力可以涵蓋整個語音序列,因此其層間和層內(nèi)需要更為復(fù)雜的連接,這也帶來了巨大的計(jì)算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡(luò)在實(shí)時性上的性能。如果直接將無人機(jī)
【參考文獻(xiàn)】:
期刊論文
[1]基于安卓語音識別的無人機(jī)控制系統(tǒng)[J]. 應(yīng)捷,韓旭. 軟件導(dǎo)刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡(luò)的語音識別快速解碼算法[J]. 張舸,張鵬遠(yuǎn),潘接林,顏永紅. 電子與信息學(xué)報(bào). 2017(04)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅(jiān)強(qiáng),潘登,胡憚. 計(jì)算機(jī)研究與發(fā)展. 2014(09)
[4]語音端點(diǎn)檢測的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學(xué)報(bào). 2005(08)
碩士論文
[1]RNN-BLSTM聲學(xué)模型的說話人自適應(yīng)方法研究[D]. 黃智穎.中國科學(xué)技術(shù)大學(xué) 2017
[2]基于RNN的手寫軌跡序列生成與分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學(xué) 2016
[3]無人機(jī)語音指令控制系統(tǒng)技術(shù)研究[D]. 王沖.南京航空航天大學(xué) 2012
[4]基于神經(jīng)網(wǎng)絡(luò)/HMM的語音識別算法的研究[D]. 張志剛.武漢理工大學(xué) 2006
[5]語音控制的應(yīng)用研究[D]. 何湘智.中國人民解放軍國防科學(xué)技術(shù)大學(xué) 2002
本文編號:3130743
本文鏈接:http://sikaile.net/kejilunwen/wltx/3130743.html
最近更新
教材專著