抑制多方向語音噪聲的人工耳蝸語音增強(qiáng)算法
發(fā)布時(shí)間:2021-07-06 16:05
在復(fù)雜聲音場(chǎng)景,尤其是多人對(duì)話交談的情況中,人工耳蝸佩戴者的言語可懂度會(huì)顯著下降。該文提出了一種基于近距離雙麥克風(fēng)的語音增強(qiáng)算法,通過提取采集信號(hào)的延遲參數(shù),并根據(jù)該參數(shù)設(shè)置掩蔽矩陣,進(jìn)而區(qū)分不同方位的聲源,抑制競(jìng)爭(zhēng)性語音噪聲。同時(shí)還以數(shù)字信號(hào)處理器(digital signal processor, DSP)為核心,搭建調(diào)試平臺(tái),對(duì)算法進(jìn)行了工程實(shí)現(xiàn)。實(shí)際測(cè)試表明,算法提升了前端信號(hào)的信噪比,魯棒性強(qiáng),并且算法單幀運(yùn)行時(shí)間短,可以和常用的人工耳蝸言語編碼策略相融合,滿足人工耳蝸的實(shí)時(shí)計(jì)算需求。
【文章來源】:清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,60(02)北大核心EICSCD
【文章頁數(shù)】:8 頁
【圖文】:
圖1 雙麥克風(fēng)與聲源位置示意圖
算法流程圖
參考CI產(chǎn)品的大小與尺寸, 本文設(shè)計(jì)了一套算法調(diào)試平臺(tái)。 硬件平臺(tái)包括采集系統(tǒng)和信號(hào)處理系統(tǒng)兩大部分, 其中采集系統(tǒng)使用2個(gè)全向型的微型麥克風(fēng), 型號(hào)為SPU0410HR5H, 采集聲音并轉(zhuǎn)換為模擬電信號(hào), 雙麥克風(fēng)的距離設(shè)置為17 mm。 采集系統(tǒng)參考文[14]中的前置調(diào)理電路, 將模擬信號(hào)進(jìn)行工頻濾波和多級(jí)放大, 使得采集系統(tǒng)的性能指標(biāo)與目前CI的近距離雙麥克風(fēng)等效。 信號(hào)處理系統(tǒng)的核心處理器是型號(hào)為C6748的數(shù)字信號(hào)處理器(digital signal processor, DSP), 音頻編解碼器采用的是TLV320AIC3106(以下簡(jiǎn)稱AIC3106) 芯片。 C6748是TI公司生產(chǎn)的一款32位的浮點(diǎn)DSP, 共有144個(gè)功能復(fù)用的輸入輸出引腳, 可以同時(shí)配置多聲道音頻串口(multichannel audio serial port, McASP)、 串行外設(shè)接口(serial peripheral interface, SPI)等眾多外設(shè)模塊, 方便調(diào)試平臺(tái)后續(xù)的功能擴(kuò)展和算法的整合。 AIC3106芯片的采樣率范圍為8~96 kHz, 支持LINE-IN和MIC-IN兩種輸入方式。 整體的硬件結(jié)構(gòu)圖如圖3所示。雙麥克風(fēng)采集到的信號(hào)通過音頻線以左右聲道的形式傳輸?shù)紸IC3106的模數(shù)轉(zhuǎn)換器(analog-to-digital converter, ADC), C6748通過集成電路總線(inter-integrated circuit, IIC)控制與AIC3106的數(shù)據(jù)交換, C6748處理后的結(jié)果傳輸?shù)紸IC3106內(nèi)部的數(shù)模轉(zhuǎn)換器 (digital-to-analog converter, DAC) 模塊進(jìn)行數(shù)模轉(zhuǎn)換, 最終由LINE-OUT口輸出處理過的音頻信號(hào)。 為了方便調(diào)試和存儲(chǔ)數(shù)據(jù), 系統(tǒng)還增加了外部存儲(chǔ)器DDR2 (double data rate SDRAM), 并通過JTAG (joint test action group) 接口與計(jì)算機(jī)保持通信。
【參考文獻(xiàn)】:
期刊論文
[1]基于波束形成與最大似然估計(jì)的近距離雙麥克風(fēng)語音增強(qiáng)算法[J]. 宮琴,鄭碩. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[2]基于雙TP型麥克風(fēng)的電子耳蝸前端指向性語音增強(qiáng)系統(tǒng)的研制[J]. 陳又圣,宮琴. 儀器儀表學(xué)報(bào). 2010(09)
本文編號(hào):3268544
【文章來源】:清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,60(02)北大核心EICSCD
【文章頁數(shù)】:8 頁
【圖文】:
圖1 雙麥克風(fēng)與聲源位置示意圖
算法流程圖
參考CI產(chǎn)品的大小與尺寸, 本文設(shè)計(jì)了一套算法調(diào)試平臺(tái)。 硬件平臺(tái)包括采集系統(tǒng)和信號(hào)處理系統(tǒng)兩大部分, 其中采集系統(tǒng)使用2個(gè)全向型的微型麥克風(fēng), 型號(hào)為SPU0410HR5H, 采集聲音并轉(zhuǎn)換為模擬電信號(hào), 雙麥克風(fēng)的距離設(shè)置為17 mm。 采集系統(tǒng)參考文[14]中的前置調(diào)理電路, 將模擬信號(hào)進(jìn)行工頻濾波和多級(jí)放大, 使得采集系統(tǒng)的性能指標(biāo)與目前CI的近距離雙麥克風(fēng)等效。 信號(hào)處理系統(tǒng)的核心處理器是型號(hào)為C6748的數(shù)字信號(hào)處理器(digital signal processor, DSP), 音頻編解碼器采用的是TLV320AIC3106(以下簡(jiǎn)稱AIC3106) 芯片。 C6748是TI公司生產(chǎn)的一款32位的浮點(diǎn)DSP, 共有144個(gè)功能復(fù)用的輸入輸出引腳, 可以同時(shí)配置多聲道音頻串口(multichannel audio serial port, McASP)、 串行外設(shè)接口(serial peripheral interface, SPI)等眾多外設(shè)模塊, 方便調(diào)試平臺(tái)后續(xù)的功能擴(kuò)展和算法的整合。 AIC3106芯片的采樣率范圍為8~96 kHz, 支持LINE-IN和MIC-IN兩種輸入方式。 整體的硬件結(jié)構(gòu)圖如圖3所示。雙麥克風(fēng)采集到的信號(hào)通過音頻線以左右聲道的形式傳輸?shù)紸IC3106的模數(shù)轉(zhuǎn)換器(analog-to-digital converter, ADC), C6748通過集成電路總線(inter-integrated circuit, IIC)控制與AIC3106的數(shù)據(jù)交換, C6748處理后的結(jié)果傳輸?shù)紸IC3106內(nèi)部的數(shù)模轉(zhuǎn)換器 (digital-to-analog converter, DAC) 模塊進(jìn)行數(shù)模轉(zhuǎn)換, 最終由LINE-OUT口輸出處理過的音頻信號(hào)。 為了方便調(diào)試和存儲(chǔ)數(shù)據(jù), 系統(tǒng)還增加了外部存儲(chǔ)器DDR2 (double data rate SDRAM), 并通過JTAG (joint test action group) 接口與計(jì)算機(jī)保持通信。
【參考文獻(xiàn)】:
期刊論文
[1]基于波束形成與最大似然估計(jì)的近距離雙麥克風(fēng)語音增強(qiáng)算法[J]. 宮琴,鄭碩. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[2]基于雙TP型麥克風(fēng)的電子耳蝸前端指向性語音增強(qiáng)系統(tǒng)的研制[J]. 陳又圣,宮琴. 儀器儀表學(xué)報(bào). 2010(09)
本文編號(hào):3268544
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3268544.html
最近更新
教材專著