智慧家庭環(huán)境下語音交互系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2022-01-15 08:37
近年來,為了滿足人們對智能家居設(shè)備便捷化的控制需求,智能語音軟件和交互設(shè)備逐漸走進了人們的家庭生活。現(xiàn)有軟件和設(shè)備的語音識別功能都基于云端完成,存在無法離線使用、占用網(wǎng)絡(luò)帶寬、隱私泄露等問題。論文對語音識別理論展開研究,設(shè)計和實現(xiàn)了智慧家庭環(huán)境下基于語音的自然人機交互系統(tǒng)。系統(tǒng)包含兩個部分,關(guān)鍵詞識別系統(tǒng)和大詞匯量連續(xù)中文語音識別系統(tǒng)。關(guān)鍵詞識別系統(tǒng)用于設(shè)備喚醒和短指令識別,在資源受限的微控制器端運行。論文從參數(shù)量、識別率和推理階段計算量三個方面,研究和比較了深度全連接神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)和深度可分離卷積神經(jīng)網(wǎng)絡(luò)在關(guān)鍵詞識別任務(wù)中的應(yīng)用。為了實現(xiàn)關(guān)鍵詞識別模型在微控制器端的部署,論文使用動態(tài)定點量化進一步降低模型存儲需求,同時使用SIMD指令加速模型在微控制器端的推理運算。大詞匯量連續(xù)中文語音識別系統(tǒng)用于長語句識別,運行在搭載Intel Movidius神經(jīng)網(wǎng)絡(luò)計算棒的控制中心節(jié)點。本文的端到端連續(xù)語音識別模型能夠直接將音頻轉(zhuǎn)為文本,無需中間音素表示。模型結(jié)合卷積神經(jīng)網(wǎng)絡(luò)、雙向長短時記憶神經(jīng)網(wǎng)絡(luò)和連接時序分類,在輸入梅爾頻率倒譜系數(shù)特征序列與輸出拼音序列之間建立映射關(guān)系,并使用N-g...
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
關(guān)鍵詞識別系統(tǒng)整體結(jié)構(gòu)
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文5 實驗結(jié)果與分析庭環(huán)境下語音交互系統(tǒng)實驗平臺搭建平臺主要包括四個部分: 可穿戴節(jié)點:可穿戴節(jié)點如圖 5-1 所示,節(jié)點運行關(guān)鍵詞識別系統(tǒng)。詞 識 別 系 統(tǒng) 前 期 的 開 發(fā) 和 測 試 都 是 在 恩 智 浦 官 方 推MIMXRT1050-EVK:i.MX RT1052 開發(fā)板上完成,如圖 5-1 中(a)僅集成關(guān)鍵詞識別系統(tǒng)所需硬件的實物圖如圖 5-2 中(b)所示,大為 3×4 厘米,WIFI 模塊使用 Cypress CYW4343W 芯片。
圖 5-2 控制中心節(jié)點:被控節(jié)點如圖 5-3 中的 A、B 所示。被控節(jié)點,由主控(STM32F103RET6)、射頻模塊(M模塊(BL9193-33 和 TP4056)組成,通過綠色
【參考文獻】:
期刊論文
[1]走過智能音箱“元年”[J]. 馬振貴. 上海信息化. 2018(02)
[2]一種基于自適應(yīng)譜熵的端點檢測改進方法[J]. 王琳,李成榮. 計算機仿真. 2010(12)
本文編號:3590290
【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:86 頁
【學(xué)位級別】:碩士
【部分圖文】:
關(guān)鍵詞識別系統(tǒng)整體結(jié)構(gòu)
華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文5 實驗結(jié)果與分析庭環(huán)境下語音交互系統(tǒng)實驗平臺搭建平臺主要包括四個部分: 可穿戴節(jié)點:可穿戴節(jié)點如圖 5-1 所示,節(jié)點運行關(guān)鍵詞識別系統(tǒng)。詞 識 別 系 統(tǒng) 前 期 的 開 發(fā) 和 測 試 都 是 在 恩 智 浦 官 方 推MIMXRT1050-EVK:i.MX RT1052 開發(fā)板上完成,如圖 5-1 中(a)僅集成關(guān)鍵詞識別系統(tǒng)所需硬件的實物圖如圖 5-2 中(b)所示,大為 3×4 厘米,WIFI 模塊使用 Cypress CYW4343W 芯片。
圖 5-2 控制中心節(jié)點:被控節(jié)點如圖 5-3 中的 A、B 所示。被控節(jié)點,由主控(STM32F103RET6)、射頻模塊(M模塊(BL9193-33 和 TP4056)組成,通過綠色
【參考文獻】:
期刊論文
[1]走過智能音箱“元年”[J]. 馬振貴. 上海信息化. 2018(02)
[2]一種基于自適應(yīng)譜熵的端點檢測改進方法[J]. 王琳,李成榮. 計算機仿真. 2010(12)
本文編號:3590290
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3590290.html
最近更新
教材專著