基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音分離及其DSP實(shí)現(xiàn)
發(fā)布時(shí)間:2024-05-20 22:27
近幾年,人工智能快速發(fā)展并滲入到各個(gè)領(lǐng)域,相應(yīng)的人工智能產(chǎn)品也不斷涌現(xiàn),比如家用機(jī)器人、無人駕駛汽車等,人機(jī)交互作為其中關(guān)鍵技術(shù)備受關(guān)注。語(yǔ)音是人們?nèi)粘=涣鞯闹饕绞?語(yǔ)音識(shí)別技術(shù)已經(jīng)取得了很大進(jìn)步,但在實(shí)際環(huán)境中語(yǔ)音的質(zhì)量往往受到周圍環(huán)境噪聲的影響,對(duì)機(jī)器識(shí)別產(chǎn)生干擾,導(dǎo)致識(shí)別率降低,無法正確識(shí)別指令。因此將純凈語(yǔ)音與噪聲分離顯得尤為重要。隨著深度學(xué)習(xí)技術(shù)不斷發(fā)展、計(jì)算機(jī)運(yùn)算能力不斷提升,使得DNN模型廣泛用于圖像、語(yǔ)音信號(hào)處理、自然語(yǔ)言處理等領(lǐng)域;贒NN的語(yǔ)音分離取得了較好的分離效果,但相比廣泛用于實(shí)驗(yàn)研究的DNN語(yǔ)音分離來說,在實(shí)際應(yīng)用方面的工作相對(duì)要少一些,特別是在低功耗、工業(yè)用途方面。深度學(xué)習(xí)處理器主要有CPU、GPU、DSP、FPGA等,DSP相比于其他幾種處理器有更好的功耗控制和穩(wěn)定性。隨著數(shù)字信號(hào)處理技術(shù)快速發(fā)展,DSP芯片性能不斷提升,為語(yǔ)音分離在DSP上的實(shí)現(xiàn)提供了理論與技術(shù)上的支持。本實(shí)驗(yàn)的主要任務(wù)是在實(shí)際環(huán)境中對(duì)語(yǔ)音和噪聲進(jìn)行實(shí)時(shí)分離。將DNN模型部署在DSP硬件平臺(tái)上,DSP通過麥克風(fēng)實(shí)時(shí)接收語(yǔ)音信號(hào)并讓信號(hào)通過模型從而分離噪聲。實(shí)驗(yàn)總體分為以下兩個(gè)步驟:...
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意義
1.2 歷史發(fā)展與研究現(xiàn)狀
1.3 論文的主要內(nèi)容
第二章 語(yǔ)音分離理論基礎(chǔ)
2.1 語(yǔ)音基礎(chǔ)
2.1.1 語(yǔ)音的產(chǎn)生
2.1.2 語(yǔ)音特性
2.1.3 噪聲特性
2.1.4 掩蔽效應(yīng)
2.2 評(píng)價(jià)指標(biāo)
2.2.1 主觀評(píng)價(jià)
2.2.2 客觀評(píng)價(jià)
2.3 常見語(yǔ)音分離方法介紹
2.3.1 譜減法
2.3.2 維納濾波法
2.3.3 基于HMM的語(yǔ)音分離算法
2.4 本章小結(jié)
第三章 基于DNN的語(yǔ)音分離
3.1 深度神經(jīng)網(wǎng)絡(luò)
3.1.1 深度神經(jīng)網(wǎng)絡(luò)概念
3.1.2 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.2 語(yǔ)音分離
3.2.1 語(yǔ)音分離的系統(tǒng)結(jié)構(gòu)
3.2.2 時(shí)頻分解
3.2.3 特征提取
3.2.4 模型訓(xùn)練
3.2.5 波形合成
3.3 本章小結(jié)
第四章 基于DSP的系統(tǒng)實(shí)現(xiàn)
4.1 DSP硬件平臺(tái)概述
4.1.1 DSP簡(jiǎn)介
4.1.2 語(yǔ)音分離系統(tǒng)設(shè)計(jì)流程
4.1.3 硬件組成
4.1.4 DSP與音頻芯片的連接
4.2 DSP軟件系統(tǒng)設(shè)計(jì)
4.2.1 開發(fā)環(huán)境簡(jiǎn)介
4.2.2 存儲(chǔ)空間分配
4.2.3 音頻芯片初始化
4.2.4 McBSP初始化與FIFO緩存
4.2.5 算法實(shí)現(xiàn)
4.3 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果及分析
5.1 模型測(cè)試結(jié)果分析
5.1.1 數(shù)據(jù)集描述
5.1.2 實(shí)驗(yàn)結(jié)果分析
5.2 硬件平臺(tái)測(cè)試結(jié)果分析
5.2.1 測(cè)試平臺(tái)
5.2.2 測(cè)試方法
5.3 本章小結(jié)
第六章 總結(jié)與期望
參考文獻(xiàn)
附錄1 實(shí)驗(yàn)平臺(tái)
附錄2 主要實(shí)現(xiàn)代碼
致謝
本文編號(hào):3979212
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 研究背景及意義
1.2 歷史發(fā)展與研究現(xiàn)狀
1.3 論文的主要內(nèi)容
第二章 語(yǔ)音分離理論基礎(chǔ)
2.1 語(yǔ)音基礎(chǔ)
2.1.1 語(yǔ)音的產(chǎn)生
2.1.2 語(yǔ)音特性
2.1.3 噪聲特性
2.1.4 掩蔽效應(yīng)
2.2 評(píng)價(jià)指標(biāo)
2.2.1 主觀評(píng)價(jià)
2.2.2 客觀評(píng)價(jià)
2.3 常見語(yǔ)音分離方法介紹
2.3.1 譜減法
2.3.2 維納濾波法
2.3.3 基于HMM的語(yǔ)音分離算法
2.4 本章小結(jié)
第三章 基于DNN的語(yǔ)音分離
3.1 深度神經(jīng)網(wǎng)絡(luò)
3.1.1 深度神經(jīng)網(wǎng)絡(luò)概念
3.1.2 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.2 語(yǔ)音分離
3.2.1 語(yǔ)音分離的系統(tǒng)結(jié)構(gòu)
3.2.2 時(shí)頻分解
3.2.3 特征提取
3.2.4 模型訓(xùn)練
3.2.5 波形合成
3.3 本章小結(jié)
第四章 基于DSP的系統(tǒng)實(shí)現(xiàn)
4.1 DSP硬件平臺(tái)概述
4.1.1 DSP簡(jiǎn)介
4.1.2 語(yǔ)音分離系統(tǒng)設(shè)計(jì)流程
4.1.3 硬件組成
4.1.4 DSP與音頻芯片的連接
4.2 DSP軟件系統(tǒng)設(shè)計(jì)
4.2.1 開發(fā)環(huán)境簡(jiǎn)介
4.2.2 存儲(chǔ)空間分配
4.2.3 音頻芯片初始化
4.2.4 McBSP初始化與FIFO緩存
4.2.5 算法實(shí)現(xiàn)
4.3 本章小結(jié)
第五章 實(shí)驗(yàn)結(jié)果及分析
5.1 模型測(cè)試結(jié)果分析
5.1.1 數(shù)據(jù)集描述
5.1.2 實(shí)驗(yàn)結(jié)果分析
5.2 硬件平臺(tái)測(cè)試結(jié)果分析
5.2.1 測(cè)試平臺(tái)
5.2.2 測(cè)試方法
5.3 本章小結(jié)
第六章 總結(jié)與期望
參考文獻(xiàn)
附錄1 實(shí)驗(yàn)平臺(tái)
附錄2 主要實(shí)現(xiàn)代碼
致謝
本文編號(hào):3979212
本文鏈接:http://sikaile.net/kejilunwen/wltx/3979212.html
最近更新
教材專著