基于HMM和RNN的無人機語音控制方案與仿真研究

發(fā)布時間：2021-04-11 02:14

　　為簡化無人機操作,避免誤操作,設計了一套基于隱馬爾可夫模型（Hidden Markov Model,HMM）和循環(huán)神經(jīng)網(wǎng)絡（Recurrent Neural Networks,RNN）的無人機語音控制方案。該方案采用HMM識別無人機語音指令;同時采用RNN對多套無人機操作指令串進行訓練,并對當前時刻指令進行預測,通過計算二者的相關性判斷是否執(zhí)行。仿真結果表明,該方案對HMM識別錯誤指令的辨別率達到61.90%,使整體錯誤率降至1.43%,表明該方案具有較為優(yōu)異的性能。

【文章來源】：系統(tǒng)仿真學報. 2020,32(03)北大核心CSCD

【文章頁數(shù)】：8 頁

【部分圖文】：

語音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme

展開圖,神經(jīng)網(wǎng)絡,展開圖

投?應的無人機語音指令，即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來，循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡，如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory，LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks，TDNN)，已經(jīng)廣泛運用于語音識別的聲學建模當中，并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于，其記憶能力可以涵蓋完整的語音序列，而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示，時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而，正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列，因此其層間和層內需要更為復雜的連接，這也帶來了巨大的計算量，直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機

結構圖,神經(jīng)網(wǎng)絡,結構圖,語音

出概率，其中概率最大的隱馬爾可夫模型對應的無人機語音指令，即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來，循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡，如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory，LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks，TDNN)，已經(jīng)廣泛運用于語音識別的聲學建模當中，并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于，其記憶能力可以涵蓋完整的語音序列，而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示，時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而，正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列，因此其層間和層內需要更為復雜的連接，這也帶來了巨大的計算量，直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機

【參考文獻】：
期刊論文
[1]基于安卓語音識別的無人機控制系統(tǒng)[J]. 應捷,韓旭.  軟件導刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡的語音識別快速解碼算法[J]. 張舸,張鵬遠,潘接林,顏永紅.  電子與信息學報. 2017(04)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅強,潘登,胡憚.  計算機研究與發(fā)展. 2014(09)
[4]語音端點檢測的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳.  系統(tǒng)仿真學報. 2005(08)

碩士論文
[1]RNN-BLSTM聲學模型的說話人自適應方法研究[D]. 黃智穎.中國科學技術大學 2017
[2]基于RNN的手寫軌跡序列生成與分類系統(tǒng)的設計與實現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學 2016
[3]無人機語音指令控制系統(tǒng)技術研究[D]. 王沖.南京航空航天大學 2012
[4]基于神經(jīng)網(wǎng)絡/HMM的語音識別算法的研究[D]. 張志剛.武漢理工大學 2006
[5]語音控制的應用研究[D]. 何湘智.中國人民解放軍國防科學技術大學 2002

本文編號：3130743

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/wltx/3130743.html

上一篇：張量壓縮感知下的字典學習算法及應用
下一篇：X波段寬帶相參雷達海面回波信息反演技術研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于HMM和RNN的無人機語音控制方案與仿真研究