基于HMM和RNN的無人機語音控制方案與仿真研究
發(fā)布時間:2021-04-11 02:14
為簡化無人機操作,避免誤操作,設計了一套基于隱馬爾可夫模型(Hidden Markov Model,HMM)和循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Networks,RNN)的無人機語音控制方案。該方案采用HMM識別無人機語音指令;同時采用RNN對多套無人機操作指令串進行訓練,并對當前時刻指令進行預測,通過計算二者的相關性判斷是否執(zhí)行。仿真結果表明,該方案對HMM識別錯誤指令的辨別率達到61.90%,使整體錯誤率降至1.43%,表明該方案具有較為優(yōu)異的性能。
【文章來源】:系統(tǒng)仿真學報. 2020,32(03)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應的無人機語音指令,即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來,循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡,如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運用于語音識別的聲學建模當中,并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示,時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列,因此其層間和層內需要更為復雜的連接,這也帶來了巨大的計算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機
出概率,其中概率最大的隱馬爾可夫模型對應的無人機語音指令,即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來,循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡,如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運用于語音識別的聲學建模當中,并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示,時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列,因此其層間和層內需要更為復雜的連接,這也帶來了巨大的計算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機
【參考文獻】:
期刊論文
[1]基于安卓語音識別的無人機控制系統(tǒng)[J]. 應捷,韓旭. 軟件導刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡的語音識別快速解碼算法[J]. 張舸,張鵬遠,潘接林,顏永紅. 電子與信息學報. 2017(04)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅強,潘登,胡憚. 計算機研究與發(fā)展. 2014(09)
[4]語音端點檢測的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學報. 2005(08)
碩士論文
[1]RNN-BLSTM聲學模型的說話人自適應方法研究[D]. 黃智穎.中國科學技術大學 2017
[2]基于RNN的手寫軌跡序列生成與分類系統(tǒng)的設計與實現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學 2016
[3]無人機語音指令控制系統(tǒng)技術研究[D]. 王沖.南京航空航天大學 2012
[4]基于神經(jīng)網(wǎng)絡/HMM的語音識別算法的研究[D]. 張志剛.武漢理工大學 2006
[5]語音控制的應用研究[D]. 何湘智.中國人民解放軍國防科學技術大學 2002
本文編號:3130743
【文章來源】:系統(tǒng)仿真學報. 2020,32(03)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
語音控制方案工作流程Fig.3Flowchartofspeechcontrolscheme
投?應的無人機語音指令,即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來,循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡,如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運用于語音識別的聲學建模當中,并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示,時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列,因此其層間和層內需要更為復雜的連接,這也帶來了巨大的計算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機
出概率,其中概率最大的隱馬爾可夫模型對應的無人機語音指令,即為識別結果。3循環(huán)神經(jīng)網(wǎng)絡近年來,循環(huán)神經(jīng)網(wǎng)絡(RNN)及一些改進的循環(huán)神經(jīng)網(wǎng)絡,如長短時記憶神經(jīng)網(wǎng)絡(Long-ShortTimeMemory,LSTM)和時延神經(jīng)網(wǎng)絡(TimeDelayNeuralNetworks,TDNN),已經(jīng)廣泛運用于語音識別的聲學建模當中,并取得了較前饋神經(jīng)網(wǎng)絡更好的效果[12-16]。循環(huán)神經(jīng)網(wǎng)絡取得這種優(yōu)勢的主要原因在于,其記憶能力可以涵蓋完整的語音序列,而前饋神經(jīng)網(wǎng)絡只能利用一個有限長度內的信息。循環(huán)神經(jīng)網(wǎng)絡的結構如圖1所示,時間展開后的結構圖如圖2所示。圖1循環(huán)神經(jīng)網(wǎng)絡結構圖Fig.1StructurediagramofRNN圖2循環(huán)神經(jīng)網(wǎng)絡時間展開圖Fig.2TimeexpansiondiagramofRNN然而,正因為循環(huán)神經(jīng)網(wǎng)絡的記憶能力可以涵蓋整個語音序列,因此其層間和層內需要更為復雜的連接,這也帶來了巨大的計算量,直接限制了循環(huán)神經(jīng)網(wǎng)絡在實時性上的性能。如果直接將無人機
【參考文獻】:
期刊論文
[1]基于安卓語音識別的無人機控制系統(tǒng)[J]. 應捷,韓旭. 軟件導刊. 2017(05)
[2]基于遞歸神經(jīng)網(wǎng)絡的語音識別快速解碼算法[J]. 張舸,張鵬遠,潘接林,顏永紅. 電子與信息學報. 2017(04)
[3]基于RNN-RBM語言模型的語音識別研究[J]. 黎亞雄,張堅強,潘登,胡憚. 計算機研究與發(fā)展. 2014(09)
[4]語音端點檢測的仿真研究[J]. 劉曉明,覃勝,劉宗行,江澤佳. 系統(tǒng)仿真學報. 2005(08)
碩士論文
[1]RNN-BLSTM聲學模型的說話人自適應方法研究[D]. 黃智穎.中國科學技術大學 2017
[2]基于RNN的手寫軌跡序列生成與分類系統(tǒng)的設計與實現(xiàn)[D]. 賈殊凱.哈爾濱工業(yè)大學 2016
[3]無人機語音指令控制系統(tǒng)技術研究[D]. 王沖.南京航空航天大學 2012
[4]基于神經(jīng)網(wǎng)絡/HMM的語音識別算法的研究[D]. 張志剛.武漢理工大學 2006
[5]語音控制的應用研究[D]. 何湘智.中國人民解放軍國防科學技術大學 2002
本文編號:3130743
本文鏈接:http://sikaile.net/kejilunwen/wltx/3130743.html
最近更新
教材專著