基于循環(huán)神經(jīng)網(wǎng)絡(luò)與子帶譜熵法的助聽(tīng)器語(yǔ)音增強(qiáng)
發(fā)布時(shí)間:2021-07-28 17:01
在日常生活中常見(jiàn)的非平穩(wěn)噪聲環(huán)境下,現(xiàn)有助聽(tīng)器語(yǔ)音增強(qiáng)算法的降噪性能有所不足。對(duì)此,本文提出了一種結(jié)合子帶譜熵法與雙尺度循環(huán)神經(jīng)網(wǎng)絡(luò)的助聽(tīng)器語(yǔ)音增強(qiáng)算法。該算法將音頻劃分為16個(gè)子頻段,各頻段的對(duì)數(shù)功率譜被用作循環(huán)神經(jīng)網(wǎng)絡(luò)的輸入特征,對(duì)應(yīng)的頻段增益作為輸出特征,并使用子帶譜熵法對(duì)增益進(jìn)行修正。實(shí)驗(yàn)結(jié)果表明,相較于傳統(tǒng)語(yǔ)音增強(qiáng)算法,在三類不同的噪聲環(huán)境中,本文提出算法的平均信噪比分別提高了4.215 dB、0.906 dB、11.010 dB。在FPGA上對(duì)該算法進(jìn)行測(cè)試,輸出與計(jì)算機(jī)模擬輸出的信噪比差值為0.117 dB,互相關(guān)系數(shù)為0.999 4。并且當(dāng)時(shí)鐘頻率設(shè)置為10 MHz時(shí),算法的延時(shí)約為2 ms,可以滿足助聽(tīng)器的使用需求。
【文章來(lái)源】:傳感技術(shù)學(xué)報(bào). 2020,33(08)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
圖1 分通道濾波器組的各通道幅度-頻率響應(yīng)曲線圖
本文通過(guò)將全連接層、GRU層等結(jié)構(gòu)進(jìn)行組合,設(shè)計(jì)了一種用于語(yǔ)音增強(qiáng)的雙尺度RNN。該網(wǎng)絡(luò)在本研究最初設(shè)計(jì)的單尺度網(wǎng)絡(luò)(圖2(a))的基礎(chǔ)上改進(jìn)而成,其輸入特征除原本16個(gè)頻段的LPS外,還將相鄰的每4個(gè)頻段合并,從而把16個(gè)頻段轉(zhuǎn)化為了4個(gè)粗分頻段。在計(jì)算這些粗分頻段的LPS后,一并作為網(wǎng)絡(luò)的輸入特征。這些數(shù)據(jù)并沒(méi)有直接與原本的LPS并列使用,而是構(gòu)建了一個(gè)對(duì)稱的子網(wǎng)絡(luò)結(jié)構(gòu),稱作粗分析區(qū),并與細(xì)分析區(qū)、譜處理區(qū)組成了如圖2(b)所示的雙尺度語(yǔ)音增強(qiáng)網(wǎng)絡(luò)。圖中每一個(gè)矩形表示網(wǎng)絡(luò)的一層,并列出了該層的結(jié)構(gòu)、激活函數(shù)與節(jié)點(diǎn)數(shù),箭頭則表示數(shù)據(jù)的傳輸方向。與常見(jiàn)的各層依次連接的網(wǎng)絡(luò)結(jié)構(gòu)相比,該網(wǎng)絡(luò)將輸入數(shù)據(jù)直接連接到了部分隱含層,使得譜處理區(qū)能夠同時(shí)獲得原始特征與譜分析區(qū)處理后的特征,并由此計(jì)算每個(gè)頻段的增益。1.3 訓(xùn)練數(shù)據(jù)
將每次迭代的驗(yàn)證集損失函數(shù)值繪制了如圖3所示的變化曲線?梢钥闯鲭S著迭代次數(shù)的增加,損失值在不斷減少并趨于平緩,因此認(rèn)為該語(yǔ)音增強(qiáng)網(wǎng)絡(luò)的訓(xùn)練能夠收斂。1.4 子帶譜熵法
【參考文獻(xiàn)】:
期刊論文
[1]WHO全球防聾計(jì)劃和我國(guó)的響應(yīng)與作用[J]. 卜行寬. 山東大學(xué)耳鼻喉眼學(xué)報(bào). 2019(03)
[2]一種基于自適應(yīng)譜熵的端點(diǎn)檢測(cè)改進(jìn)方法[J]. 王琳,李成榮. 計(jì)算機(jī)仿真. 2010(12)
[3]一種設(shè)計(jì)頻率特性有間斷濾波器的新方法[J]. 黃翔東,王兆華. 天津大學(xué)學(xué)報(bào). 2006(05)
本文編號(hào):3308290
【文章來(lái)源】:傳感技術(shù)學(xué)報(bào). 2020,33(08)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
圖1 分通道濾波器組的各通道幅度-頻率響應(yīng)曲線圖
本文通過(guò)將全連接層、GRU層等結(jié)構(gòu)進(jìn)行組合,設(shè)計(jì)了一種用于語(yǔ)音增強(qiáng)的雙尺度RNN。該網(wǎng)絡(luò)在本研究最初設(shè)計(jì)的單尺度網(wǎng)絡(luò)(圖2(a))的基礎(chǔ)上改進(jìn)而成,其輸入特征除原本16個(gè)頻段的LPS外,還將相鄰的每4個(gè)頻段合并,從而把16個(gè)頻段轉(zhuǎn)化為了4個(gè)粗分頻段。在計(jì)算這些粗分頻段的LPS后,一并作為網(wǎng)絡(luò)的輸入特征。這些數(shù)據(jù)并沒(méi)有直接與原本的LPS并列使用,而是構(gòu)建了一個(gè)對(duì)稱的子網(wǎng)絡(luò)結(jié)構(gòu),稱作粗分析區(qū),并與細(xì)分析區(qū)、譜處理區(qū)組成了如圖2(b)所示的雙尺度語(yǔ)音增強(qiáng)網(wǎng)絡(luò)。圖中每一個(gè)矩形表示網(wǎng)絡(luò)的一層,并列出了該層的結(jié)構(gòu)、激活函數(shù)與節(jié)點(diǎn)數(shù),箭頭則表示數(shù)據(jù)的傳輸方向。與常見(jiàn)的各層依次連接的網(wǎng)絡(luò)結(jié)構(gòu)相比,該網(wǎng)絡(luò)將輸入數(shù)據(jù)直接連接到了部分隱含層,使得譜處理區(qū)能夠同時(shí)獲得原始特征與譜分析區(qū)處理后的特征,并由此計(jì)算每個(gè)頻段的增益。1.3 訓(xùn)練數(shù)據(jù)
將每次迭代的驗(yàn)證集損失函數(shù)值繪制了如圖3所示的變化曲線?梢钥闯鲭S著迭代次數(shù)的增加,損失值在不斷減少并趨于平緩,因此認(rèn)為該語(yǔ)音增強(qiáng)網(wǎng)絡(luò)的訓(xùn)練能夠收斂。1.4 子帶譜熵法
【參考文獻(xiàn)】:
期刊論文
[1]WHO全球防聾計(jì)劃和我國(guó)的響應(yīng)與作用[J]. 卜行寬. 山東大學(xué)耳鼻喉眼學(xué)報(bào). 2019(03)
[2]一種基于自適應(yīng)譜熵的端點(diǎn)檢測(cè)改進(jìn)方法[J]. 王琳,李成榮. 計(jì)算機(jī)仿真. 2010(12)
[3]一種設(shè)計(jì)頻率特性有間斷濾波器的新方法[J]. 黃翔東,王兆華. 天津大學(xué)學(xué)報(bào). 2006(05)
本文編號(hào):3308290
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3308290.html
最近更新
教材專著