一種自動等響度數(shù)字混音算法

發(fā)布時間：2019-09-18 22:43

【摘要】：在電視會議系統(tǒng)中,為獲得接近真實(shí)的會議交流氛圍,混音技術(shù)不可或缺。本文利用語音信號的響度特性,提出一種自動等響度數(shù)字混音算法。該算法首先利用信號平均功率和短時自相關(guān)函數(shù)進(jìn)行語音活動檢測(VAD),判斷參與混音的每路信號中是否含有語音信號。然后,利用時變?yōu)V波器進(jìn)行濾波處理,抑制混音過程中引入的噪聲。最后,利用語音信號響度計算各路信號的權(quán)重,使各路語音的平均響度保持一致。仿真實(shí)驗(yàn)結(jié)果表明,本文的混音算法可使各路信號的平均響度基本相同,并具有良好的語音質(zhì)量。
【圖文】：

系統(tǒng)框圖,混音,系統(tǒng)框圖

針對上述問題，本文提出一種自動等響度數(shù)字混音算法。該算法首先利用信號平均功率和短時自相關(guān)函數(shù)進(jìn)行語音活動檢測，判斷參與混音的每路信號中是否含有語音信號。再利用時變?yōu)V波器濾掉不必要的噪聲，解決靜音檢測所導(dǎo)致的會議交流氛圍不真實(shí)等問題。最后，利用響度計算各路信號的權(quán)重，使各路信號的平均響度相同。仿真實(shí)驗(yàn)驗(yàn)證了本文算法的有效性。2自動等響度數(shù)字混音算法本文算法由語音活動檢測、時變?yōu)V波、等響度控制等模塊組成;等響度控制模塊又可分為響度計算、等響度權(quán)重計算、混音處理三個部分;整個流程如圖1所示。首先，每路信號經(jīng)過語音活動檢測模塊判斷是否含有語音信號，根據(jù)判斷結(jié)果確定后續(xù)時變?yōu)V波器的通帶寬度;如果當(dāng)前幀被判斷為語音信號，則用DFT變換計算其響度;最后對時變?yōu)V波器輸出的各路信號進(jìn)行等響度控制。下面，對各模塊進(jìn)行詳細(xì)說明。圖1混音系統(tǒng)框圖Fig．1Blockdiagramofmixedaudiosystem2．1語音活動檢測語音活動檢測是根據(jù)當(dāng)前幀信號的平均功率和短時自相關(guān)函數(shù)判斷當(dāng)前幀是否含有語音信號。設(shè)VAD表示當(dāng)前幀是否含有語音信號，，并且VAD賦初始值，使得VAD=1。當(dāng)前幀功率p可表示為p=1N∑N－1i=0x2［i］(1)其中，x［i］表示當(dāng)前幀第i個輸入數(shù)據(jù)，N表示一幀中的樣本數(shù)。設(shè)當(dāng)前預(yù)定時間段T為當(dāng)前幀之前第r幀至當(dāng)前幀的持續(xù)時間，pi為當(dāng)前幀之前第i幀功率，則當(dāng)前預(yù)定時間段內(nèi)的最小幀功率pmin可表示為pmin=min{p，p1，p2，．．，．pi，．．，．pr}(2)其中，min{·}表示括號中所有數(shù)據(jù)的最小值，r=ceilTFSN，這里ceil(x)表示接近x且大于等于x的整數(shù)，F(xiàn)S表示采樣頻率。當(dāng)滿足式(3)時，所述語音活動檢測模塊將VAD置1。10

特性圖,幅頻響應(yīng),特性,時變?yōu)V波器

第3期呼德等:一種自動等響度數(shù)字混音算法2．2時變?yōu)V波器時變?yōu)V波器根據(jù)語音活動檢測模塊的檢測結(jié)果，對當(dāng)前幀信號進(jìn)行時變低通濾波處理。當(dāng)某路信號當(dāng)前幀中含有語音信號時，時變?yōu)V波器的通帶逐漸變寬;當(dāng)某路信號當(dāng)前幀中不含有語音信號時，時變?yōu)V波器的通帶逐漸變窄。時變?yōu)V波器的差分方程為f［i］=(1－b)x［i］+bf［i－1］(8)其中，f［i］表示當(dāng)前幀的第i個濾波輸出值，x［i］表示當(dāng)前幀第i個輸入數(shù)據(jù)，0≤i＜N，b是濾波系數(shù)。圖2幅頻響應(yīng)特性Fig．2Amplitude-Frequencyresponse當(dāng)采樣頻率為48kHz，時變?yōu)V波器系數(shù)b=0．18時，其3dB通帶截止頻率為20kHz;b=0．956時，其3dB通帶截止頻率為0．3kHz;如圖2所示。根據(jù)語音活動檢測結(jié)果，濾波系數(shù)b在0．18～0．956間逐漸變化，從而使得濾波器通帶在0．3kHz～20kHz內(nèi)發(fā)生變化。系數(shù)b的變化規(guī)則如下:當(dāng)前幀含有語音信號時，則有b=b+0．18－0．956N1(9)其中，當(dāng)b＜0．18，取b=0．18，N1表示b從0．956變至0．18時的采樣點(diǎn)數(shù)。當(dāng)前幀不含有語音信號時，則有b=b+0．956－0．18N2(10)其中，當(dāng)b＞0．956，取b=0．956，N2表示b從0．18變至0．956時的采樣點(diǎn)數(shù)。2．3響度計算響度是指人耳感受到的聲音強(qiáng)弱，它是人對聲音強(qiáng)度大小的主觀感覺量。通常，根據(jù)語音活動檢測模塊的檢測結(jié)果，計算信號當(dāng)前預(yù)定時間段內(nèi)的平均響度。當(dāng)前幀信號處于有語音狀態(tài)時，首先計算x［i］的DFT變換X［s］=∑N－1i=0x［i］WisN，s=0，1，…，N－1(11)其中，WisN=e－j2!Nis，s表示離散頻率，x［i］表示當(dāng)前幀第i個輸入數(shù)據(jù)，j表示虛數(shù)單位。其次，當(dāng)前幀信號的響度值l可表示為l=1N4－N3(∑N4s=N3X［s］210－Equal?
【作者單位】：大連理工大學(xué)信息與通信工程學(xué)院;
【基金】：國家863計劃(2015AA016306) 國家自然科學(xué)基金(61172107,61172110) 遼寧省科技創(chuàng)新重大專項(xiàng)(201302001) 中央高�；究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(DUT13LAB06)
【分類號】：TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文前10條

1 春水東流;;找出消失的立體聲混音[J];電腦迷;2007年11期

2 姚金財;曲敬珍;;淺談混音技術(shù)[J];音響技術(shù);2010年05期

3 鄭斌;;混音小議技術(shù)[J];視聽縱橫;2013年05期

4 任珩;使用超級解霸消除片中混音[J];電腦愛好者;2001年18期

5 徐保民,王秀玲;一個改進(jìn)的混音算法[J];電子與信息學(xué)報;2003年12期

6 王勇;;在線混音調(diào)出美妙旋律[J];電腦愛好者(普及版);2007年06期

7 黃梅;洪玫;盧揚(yáng);胡元甲;;數(shù)字混音模型的設(shè)計與實(shí)現(xiàn)[J];計算機(jī)工程與設(shè)計;2010年16期

8 劉泉 ,張小麟 ,劉新華;自適應(yīng)數(shù)字混音算法的研究與應(yīng)用[J];微計算機(jī)信息;2005年20期

9 謝韋華;;關(guān)于調(diào)音臺混音減功能的分析和應(yīng)用[J];影視制作;2010年08期

10 秦梓元;;淺談多軌錄音、混音的空間設(shè)計及聲場塑造[J];音樂大觀;2012年07期

相關(guān)會議論文前1條

1 林濤;;專業(yè)多軌錄音/混音軟件——Nuendo[A];2005年廣播電視技術(shù)論文匯編[C];2005年

相關(guān)重要報紙文章前2條

1 山東張棟;自己作DJ，酷[N];電腦報;2003年

2 ;音樂文件的編輯、混音及修復(fù)[N];中國國門時報;2006年

相關(guān)碩士學(xué)位論文前10條

1 譚超;多中心應(yīng)急通信系統(tǒng)關(guān)鍵技術(shù)研究[D];天津大學(xué);2014年

2 趙一潼;行動中的混音思維-“再造性”藝術(shù)理念[D];上海音樂學(xué)院;2016年

3 陳申;論數(shù)字與模擬混音平臺的音質(zhì)差異性[D];上海音樂學(xué)院;2012年

4 韓鈺;網(wǎng)絡(luò)電話會議中混音技術(shù)的研究[D];河南科技大學(xué);2010年

5 江淼;當(dāng)代節(jié)奏布魯斯歌曲的混音藝術(shù)與技術(shù)研究[D];中央音樂學(xué)院;2014年

6 孫進(jìn)寶;基于WebRTC的混音服務(wù)器的研究與設(shè)計[D];西安電子科技大學(xué);2014年

7 劉文;嵌入式Linux環(huán)境下多路音頻流混音設(shè)備的研究與設(shè)計[D];河北農(nóng)業(yè)大學(xué);2014年

8 黑利利;錄音、混音室建筑聲學(xué)特性研究[D];長安大學(xué);2013年

9 王亞輝;基于WebRTC語音引擎的會議混音技術(shù)研究[D];西安電子科技大學(xué);2013年

10 張傳永;混音技術(shù)及其在IP電話會議系統(tǒng)中的應(yīng)用[D];西安電子科技大學(xué);2011年

本文編號：2537756

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/2537756.html

上一篇：機(jī)載液晶顯示模塊的背光模組設(shè)計與研究
下一篇：面向5G需求的移動邊緣計算

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一種自動等響度數(shù)字混音算法