一種自動等響度數(shù)字混音算法
【圖文】:
針對上述問題,本文提出一種自動等響度數(shù)字混音算法。該算法首先利用信號平均功率和短時自相關(guān)函數(shù)進(jìn)行語音活動檢測,判斷參與混音的每路信號中是否含有語音信號。再利用時變?yōu)V波器濾掉不必要的噪聲,解決靜音檢測所導(dǎo)致的會議交流氛圍不真實(shí)等問題。最后,利用響度計算各路信號的權(quán)重,使各路信號的平均響度相同。仿真實(shí)驗(yàn)驗(yàn)證了本文算法的有效性。2自動等響度數(shù)字混音算法本文算法由語音活動檢測、時變?yōu)V波、等響度控制等模塊組成;等響度控制模塊又可分為響度計算、等響度權(quán)重計算、混音處理三個部分;整個流程如圖1所示。首先,每路信號經(jīng)過語音活動檢測模塊判斷是否含有語音信號,根據(jù)判斷結(jié)果確定后續(xù)時變?yōu)V波器的通帶寬度;如果當(dāng)前幀被判斷為語音信號,則用DFT變換計算其響度;最后對時變?yōu)V波器輸出的各路信號進(jìn)行等響度控制。下面,對各模塊進(jìn)行詳細(xì)說明。圖1混音系統(tǒng)框圖Fig.1Blockdiagramofmixedaudiosystem2.1語音活動檢測語音活動檢測是根據(jù)當(dāng)前幀信號的平均功率和短時自相關(guān)函數(shù)判斷當(dāng)前幀是否含有語音信號。設(shè)VAD表示當(dāng)前幀是否含有語音信號,,并且VAD賦初始值,使得VAD=1。當(dāng)前幀功率p可表示為p=1N∑N-1i=0x2[i](1)其中,x[i]表示當(dāng)前幀第i個輸入數(shù)據(jù),N表示一幀中的樣本數(shù)。設(shè)當(dāng)前預(yù)定時間段T為當(dāng)前幀之前第r幀至當(dāng)前幀的持續(xù)時間,pi為當(dāng)前幀之前第i幀功率,則當(dāng)前預(yù)定時間段內(nèi)的最小幀功率pmin可表示為pmin=min{p,p1,p2,..,.pi,..,.pr}(2)其中,min{·}表示括號中所有數(shù)據(jù)的最小值,r=ceilTFSN,這里ceil(x)表示接近x且大于等于x的整數(shù),F(xiàn)S表示采樣頻率。當(dāng)滿足式(3)時,所述語音活動檢測模塊將VAD置1。10
第3期呼德等:一種自動等響度數(shù)字混音算法2.2時變?yōu)V波器時變?yōu)V波器根據(jù)語音活動檢測模塊的檢測結(jié)果,對當(dāng)前幀信號進(jìn)行時變低通濾波處理。當(dāng)某路信號當(dāng)前幀中含有語音信號時,時變?yōu)V波器的通帶逐漸變寬;當(dāng)某路信號當(dāng)前幀中不含有語音信號時,時變?yōu)V波器的通帶逐漸變窄。時變?yōu)V波器的差分方程為f[i]=(1-b)x[i]+bf[i-1](8)其中,f[i]表示當(dāng)前幀的第i個濾波輸出值,x[i]表示當(dāng)前幀第i個輸入數(shù)據(jù),0≤i<N,b是濾波系數(shù)。圖2幅頻響應(yīng)特性Fig.2Amplitude-Frequencyresponse當(dāng)采樣頻率為48kHz,時變?yōu)V波器系數(shù)b=0.18時,其3dB通帶截止頻率為20kHz;b=0.956時,其3dB通帶截止頻率為0.3kHz;如圖2所示。根據(jù)語音活動檢測結(jié)果,濾波系數(shù)b在0.18~0.956間逐漸變化,從而使得濾波器通帶在0.3kHz~20kHz內(nèi)發(fā)生變化。系數(shù)b的變化規(guī)則如下:當(dāng)前幀含有語音信號時,則有b=b+0.18-0.956N1(9)其中,當(dāng)b<0.18,取b=0.18,N1表示b從0.956變至0.18時的采樣點(diǎn)數(shù)。當(dāng)前幀不含有語音信號時,則有b=b+0.956-0.18N2(10)其中,當(dāng)b>0.956,取b=0.956,N2表示b從0.18變至0.956時的采樣點(diǎn)數(shù)。2.3響度計算響度是指人耳感受到的聲音強(qiáng)弱,它是人對聲音強(qiáng)度大小的主觀感覺量。通常,根據(jù)語音活動檢測模塊的檢測結(jié)果,計算信號當(dāng)前預(yù)定時間段內(nèi)的平均響度。當(dāng)前幀信號處于有語音狀態(tài)時,首先計算x[i]的DFT變換X[s]=∑N-1i=0x[i]WisN,s=0,1,…,N-1(11)其中,WisN=e-j2!Nis,s表示離散頻率,x[i]表示當(dāng)前幀第i個輸入數(shù)據(jù),j表示虛數(shù)單位。其次,當(dāng)前幀信號的響度值l可表示為l=1N4-N3(∑N4s=N3X[s]210-Equal?
【作者單位】: 大連理工大學(xué)信息與通信工程學(xué)院;
【基金】:國家863計劃(2015AA016306) 國家自然科學(xué)基金(61172107,61172110) 遼寧省科技創(chuàng)新重大專項(xiàng)(201302001) 中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金(DUT13LAB06)
【分類號】:TN912.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 春水東流;;找出消失的立體聲混音[J];電腦迷;2007年11期
2 姚金財;曲敬珍;;淺談混音技術(shù)[J];音響技術(shù);2010年05期
3 鄭斌;;混音小議技術(shù)[J];視聽縱橫;2013年05期
4 任珩;使用超級解霸消除片中混音[J];電腦愛好者;2001年18期
5 徐保民,王秀玲;一個改進(jìn)的混音算法[J];電子與信息學(xué)報;2003年12期
6 王勇;;在線混音調(diào)出美妙旋律[J];電腦愛好者(普及版);2007年06期
7 黃梅;洪玫;盧揚(yáng);胡元甲;;數(shù)字混音模型的設(shè)計與實(shí)現(xiàn)[J];計算機(jī)工程與設(shè)計;2010年16期
8 劉泉 ,張小麟 ,劉新華;自適應(yīng)數(shù)字混音算法的研究與應(yīng)用[J];微計算機(jī)信息;2005年20期
9 謝韋華;;關(guān)于調(diào)音臺混音減功能的分析和應(yīng)用[J];影視制作;2010年08期
10 秦梓元;;淺談多軌錄音、混音的空間設(shè)計及聲場塑造[J];音樂大觀;2012年07期
相關(guān)會議論文 前1條
1 林濤;;專業(yè)多軌錄音/混音軟件——Nuendo[A];2005年廣播電視技術(shù)論文匯編[C];2005年
相關(guān)重要報紙文章 前2條
1 山東 張棟;自己作DJ,酷[N];電腦報;2003年
2 ;音樂文件的編輯、混音及修復(fù)[N];中國國門時報;2006年
相關(guān)碩士學(xué)位論文 前10條
1 譚超;多中心應(yīng)急通信系統(tǒng)關(guān)鍵技術(shù)研究[D];天津大學(xué);2014年
2 趙一潼;行動中的混音思維-“再造性”藝術(shù)理念[D];上海音樂學(xué)院;2016年
3 陳申;論數(shù)字與模擬混音平臺的音質(zhì)差異性[D];上海音樂學(xué)院;2012年
4 韓鈺;網(wǎng)絡(luò)電話會議中混音技術(shù)的研究[D];河南科技大學(xué);2010年
5 江淼;當(dāng)代節(jié)奏布魯斯歌曲的混音藝術(shù)與技術(shù)研究[D];中央音樂學(xué)院;2014年
6 孫進(jìn)寶;基于WebRTC的混音服務(wù)器的研究與設(shè)計[D];西安電子科技大學(xué);2014年
7 劉文;嵌入式Linux環(huán)境下多路音頻流混音設(shè)備的研究與設(shè)計[D];河北農(nóng)業(yè)大學(xué);2014年
8 黑利利;錄音、混音室建筑聲學(xué)特性研究[D];長安大學(xué);2013年
9 王亞輝;基于WebRTC語音引擎的會議混音技術(shù)研究[D];西安電子科技大學(xué);2013年
10 張傳永;混音技術(shù)及其在IP電話會議系統(tǒng)中的應(yīng)用[D];西安電子科技大學(xué);2011年
本文編號:2537756
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2537756.html