天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于循環(huán)神經網絡與子帶譜熵法的助聽器語音增強

發(fā)布時間:2021-07-28 17:01
  在日常生活中常見的非平穩(wěn)噪聲環(huán)境下,現(xiàn)有助聽器語音增強算法的降噪性能有所不足。對此,本文提出了一種結合子帶譜熵法與雙尺度循環(huán)神經網絡的助聽器語音增強算法。該算法將音頻劃分為16個子頻段,各頻段的對數(shù)功率譜被用作循環(huán)神經網絡的輸入特征,對應的頻段增益作為輸出特征,并使用子帶譜熵法對增益進行修正。實驗結果表明,相較于傳統(tǒng)語音增強算法,在三類不同的噪聲環(huán)境中,本文提出算法的平均信噪比分別提高了4.215 dB、0.906 dB、11.010 dB。在FPGA上對該算法進行測試,輸出與計算機模擬輸出的信噪比差值為0.117 dB,互相關系數(shù)為0.999 4。并且當時鐘頻率設置為10 MHz時,算法的延時約為2 ms,可以滿足助聽器的使用需求。 

【文章來源】:傳感技術學報. 2020,33(08)北大核心CSCD

【文章頁數(shù)】:7 頁

【部分圖文】:

基于循環(huán)神經網絡與子帶譜熵法的助聽器語音增強


圖1 分通道濾波器組的各通道幅度-頻率響應曲線圖

示意圖,語音增強,尺度,網絡結構


本文通過將全連接層、GRU層等結構進行組合,設計了一種用于語音增強的雙尺度RNN。該網絡在本研究最初設計的單尺度網絡(圖2(a))的基礎上改進而成,其輸入特征除原本16個頻段的LPS外,還將相鄰的每4個頻段合并,從而把16個頻段轉化為了4個粗分頻段。在計算這些粗分頻段的LPS后,一并作為網絡的輸入特征。這些數(shù)據并沒有直接與原本的LPS并列使用,而是構建了一個對稱的子網絡結構,稱作粗分析區(qū),并與細分析區(qū)、譜處理區(qū)組成了如圖2(b)所示的雙尺度語音增強網絡。圖中每一個矩形表示網絡的一層,并列出了該層的結構、激活函數(shù)與節(jié)點數(shù),箭頭則表示數(shù)據的傳輸方向。與常見的各層依次連接的網絡結構相比,該網絡將輸入數(shù)據直接連接到了部分隱含層,使得譜處理區(qū)能夠同時獲得原始特征與譜分析區(qū)處理后的特征,并由此計算每個頻段的增益。1.3 訓練數(shù)據

變化曲線,損失函數(shù),變化曲線,熵法


將每次迭代的驗證集損失函數(shù)值繪制了如圖3所示的變化曲線。可以看出隨著迭代次數(shù)的增加,損失值在不斷減少并趨于平緩,因此認為該語音增強網絡的訓練能夠收斂。1.4 子帶譜熵法

【參考文獻】:
期刊論文
[1]WHO全球防聾計劃和我國的響應與作用[J]. 卜行寬.  山東大學耳鼻喉眼學報. 2019(03)
[2]一種基于自適應譜熵的端點檢測改進方法[J]. 王琳,李成榮.  計算機仿真. 2010(12)
[3]一種設計頻率特性有間斷濾波器的新方法[J]. 黃翔東,王兆華.  天津大學學報. 2006(05)



本文編號:3308290

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3308290.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ac90b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com