基于改進(jìn)LSTM的兒童語(yǔ)音情感識(shí)別模型
發(fā)布時(shí)間:2022-12-08 02:20
為實(shí)現(xiàn)不同兒童情感需求狀態(tài)下幀級(jí)語(yǔ)音特征的有效獲取,建立一種基于改進(jìn)長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)的兒童語(yǔ)音情感識(shí)別模型。采用幀級(jí)語(yǔ)音特征代替?zhèn)鹘y(tǒng)統(tǒng)計(jì)特征以保留原始語(yǔ)音中的時(shí)序關(guān)系,通過(guò)引入注意力機(jī)制將傳統(tǒng)遺忘門和輸入門轉(zhuǎn)換為注意力門,并根據(jù)自定義的深度策略計(jì)算得到深度注意力門,從而提高語(yǔ)音情感識(shí)別性能。實(shí)驗(yàn)結(jié)果表明,在Fau Aibo兒童情感數(shù)據(jù)語(yǔ)料庫(kù)及嬰兒哭聲情感需求數(shù)據(jù)庫(kù)上,該模型在召回率和F1分?jǐn)?shù)上相比基于傳統(tǒng)LSTM的識(shí)別模型分別提高了3.14%、5.50%和1.84%、5.49%,在CASIA中文情感數(shù)據(jù)庫(kù)上,其相比基于傳統(tǒng)LSTM和GRU的識(shí)別模型訓(xùn)練時(shí)間更短、兒童語(yǔ)音情感識(shí)別率更高。
【文章頁(yè)數(shù)】:10 頁(yè)
【文章目錄】:
0 概述
1 相關(guān)工作
1.1 LSTM網(wǎng)絡(luò)
1.2 注意力機(jī)制
2 改進(jìn)的深度注意力門
2.1 注意力門
2.2 深度注意力門
2.3 訓(xùn)練整體框架
3 實(shí)驗(yàn)設(shè)置與分析
3.1 實(shí)驗(yàn)設(shè)置
3.2 幀級(jí)特征的選擇
3.3 實(shí)驗(yàn)參數(shù)設(shè)置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力門的時(shí)間和性能分析
5 結(jié)束語(yǔ)
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力CNLSTM模型的新聞文本分類[J]. 劉月,翟東海,任慶寧. 計(jì)算機(jī)工程. 2019(07)
[2]情感語(yǔ)音數(shù)據(jù)庫(kù)綜述[J]. 韓文靜,李海峰. 智能計(jì)算機(jī)與應(yīng)用. 2013(01)
[3]兒童情緒調(diào)節(jié)的發(fā)展研究[J]. 陸芳,陳國(guó)鵬. 心理科學(xué). 2003(05)
碩士論文
[1]基于表情和語(yǔ)音雙模態(tài)的兒童情感識(shí)別研究[D]. 戴惟嘉.東南大學(xué) 2016
本文編號(hào):3713346
【文章頁(yè)數(shù)】:10 頁(yè)
【文章目錄】:
0 概述
1 相關(guān)工作
1.1 LSTM網(wǎng)絡(luò)
1.2 注意力機(jī)制
2 改進(jìn)的深度注意力門
2.1 注意力門
2.2 深度注意力門
2.3 訓(xùn)練整體框架
3 實(shí)驗(yàn)設(shè)置與分析
3.1 實(shí)驗(yàn)設(shè)置
3.2 幀級(jí)特征的選擇
3.3 實(shí)驗(yàn)參數(shù)設(shè)置
4 算法性能分析
4.1 深度的性能分析
4.2 注意力門的時(shí)間和性能分析
5 結(jié)束語(yǔ)
【參考文獻(xiàn)】:
期刊論文
[1]基于注意力CNLSTM模型的新聞文本分類[J]. 劉月,翟東海,任慶寧. 計(jì)算機(jī)工程. 2019(07)
[2]情感語(yǔ)音數(shù)據(jù)庫(kù)綜述[J]. 韓文靜,李海峰. 智能計(jì)算機(jī)與應(yīng)用. 2013(01)
[3]兒童情緒調(diào)節(jié)的發(fā)展研究[J]. 陸芳,陳國(guó)鵬. 心理科學(xué). 2003(05)
碩士論文
[1]基于表情和語(yǔ)音雙模態(tài)的兒童情感識(shí)別研究[D]. 戴惟嘉.東南大學(xué) 2016
本文編號(hào):3713346
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3713346.html
最近更新
教材專著