一種自動等響度數(shù)字混音算法
【圖文】:
針對上述問題,本文提出一種自動等響度數(shù)字混音算法。該算法首先利用信號平均功率和短時自相關函數(shù)進行語音活動檢測,判斷參與混音的每路信號中是否含有語音信號。再利用時變?yōu)V波器濾掉不必要的噪聲,解決靜音檢測所導致的會議交流氛圍不真實等問題。最后,利用響度計算各路信號的權重,使各路信號的平均響度相同。仿真實驗驗證了本文算法的有效性。2自動等響度數(shù)字混音算法本文算法由語音活動檢測、時變?yōu)V波、等響度控制等模塊組成;等響度控制模塊又可分為響度計算、等響度權重計算、混音處理三個部分;整個流程如圖1所示。首先,每路信號經(jīng)過語音活動檢測模塊判斷是否含有語音信號,根據(jù)判斷結(jié)果確定后續(xù)時變?yōu)V波器的通帶寬度;如果當前幀被判斷為語音信號,則用DFT變換計算其響度;最后對時變?yōu)V波器輸出的各路信號進行等響度控制。下面,對各模塊進行詳細說明。圖1混音系統(tǒng)框圖Fig.1Blockdiagramofmixedaudiosystem2.1語音活動檢測語音活動檢測是根據(jù)當前幀信號的平均功率和短時自相關函數(shù)判斷當前幀是否含有語音信號。設VAD表示當前幀是否含有語音信號,,并且VAD賦初始值,使得VAD=1。當前幀功率p可表示為p=1N∑N-1i=0x2[i](1)其中,x[i]表示當前幀第i個輸入數(shù)據(jù),N表示一幀中的樣本數(shù)。設當前預定時間段T為當前幀之前第r幀至當前幀的持續(xù)時間,pi為當前幀之前第i幀功率,則當前預定時間段內(nèi)的最小幀功率pmin可表示為pmin=min{p,p1,p2,..,.pi,..,.pr}(2)其中,min{·}表示括號中所有數(shù)據(jù)的最小值,r=ceilTFSN,這里ceil(x)表示接近x且大于等于x的整數(shù),F(xiàn)S表示采樣頻率。當滿足式(3)時,所述語音活動檢測模塊將VAD置1。10
第3期呼德等:一種自動等響度數(shù)字混音算法2.2時變?yōu)V波器時變?yōu)V波器根據(jù)語音活動檢測模塊的檢測結(jié)果,對當前幀信號進行時變低通濾波處理。當某路信號當前幀中含有語音信號時,時變?yōu)V波器的通帶逐漸變寬;當某路信號當前幀中不含有語音信號時,時變?yōu)V波器的通帶逐漸變窄。時變?yōu)V波器的差分方程為f[i]=(1-b)x[i]+bf[i-1](8)其中,f[i]表示當前幀的第i個濾波輸出值,x[i]表示當前幀第i個輸入數(shù)據(jù),0≤i<N,b是濾波系數(shù)。圖2幅頻響應特性Fig.2Amplitude-Frequencyresponse當采樣頻率為48kHz,時變?yōu)V波器系數(shù)b=0.18時,其3dB通帶截止頻率為20kHz;b=0.956時,其3dB通帶截止頻率為0.3kHz;如圖2所示。根據(jù)語音活動檢測結(jié)果,濾波系數(shù)b在0.18~0.956間逐漸變化,從而使得濾波器通帶在0.3kHz~20kHz內(nèi)發(fā)生變化。系數(shù)b的變化規(guī)則如下:當前幀含有語音信號時,則有b=b+0.18-0.956N1(9)其中,當b<0.18,取b=0.18,N1表示b從0.956變至0.18時的采樣點數(shù)。當前幀不含有語音信號時,則有b=b+0.956-0.18N2(10)其中,當b>0.956,取b=0.956,N2表示b從0.18變至0.956時的采樣點數(shù)。2.3響度計算響度是指人耳感受到的聲音強弱,它是人對聲音強度大小的主觀感覺量。通常,根據(jù)語音活動檢測模塊的檢測結(jié)果,計算信號當前預定時間段內(nèi)的平均響度。當前幀信號處于有語音狀態(tài)時,首先計算x[i]的DFT變換X[s]=∑N-1i=0x[i]WisN,s=0,1,…,N-1(11)其中,WisN=e-j2!Nis,s表示離散頻率,x[i]表示當前幀第i個輸入數(shù)據(jù),j表示虛數(shù)單位。其次,當前幀信號的響度值l可表示為l=1N4-N3(∑N4s=N3X[s]210-Equal?
【作者單位】: 大連理工大學信息與通信工程學院;
【基金】:國家863計劃(2015AA016306) 國家自然科學基金(61172107,61172110) 遼寧省科技創(chuàng)新重大專項(201302001) 中央高;究蒲袠I(yè)務費專項資金(DUT13LAB06)
【分類號】:TN912.3
【相似文獻】
相關期刊論文 前10條
1 春水東流;;找出消失的立體聲混音[J];電腦迷;2007年11期
2 姚金財;曲敬珍;;淺談混音技術[J];音響技術;2010年05期
3 鄭斌;;混音小議技術[J];視聽縱橫;2013年05期
4 任珩;使用超級解霸消除片中混音[J];電腦愛好者;2001年18期
5 徐保民,王秀玲;一個改進的混音算法[J];電子與信息學報;2003年12期
6 王勇;;在線混音調(diào)出美妙旋律[J];電腦愛好者(普及版);2007年06期
7 黃梅;洪玫;盧揚;胡元甲;;數(shù)字混音模型的設計與實現(xiàn)[J];計算機工程與設計;2010年16期
8 劉泉 ,張小麟 ,劉新華;自適應數(shù)字混音算法的研究與應用[J];微計算機信息;2005年20期
9 謝韋華;;關于調(diào)音臺混音減功能的分析和應用[J];影視制作;2010年08期
10 秦梓元;;淺談多軌錄音、混音的空間設計及聲場塑造[J];音樂大觀;2012年07期
相關會議論文 前1條
1 林濤;;專業(yè)多軌錄音/混音軟件——Nuendo[A];2005年廣播電視技術論文匯編[C];2005年
相關重要報紙文章 前2條
1 山東 張棟;自己作DJ,酷[N];電腦報;2003年
2 ;音樂文件的編輯、混音及修復[N];中國國門時報;2006年
相關碩士學位論文 前10條
1 譚超;多中心應急通信系統(tǒng)關鍵技術研究[D];天津大學;2014年
2 趙一潼;行動中的混音思維-“再造性”藝術理念[D];上海音樂學院;2016年
3 陳申;論數(shù)字與模擬混音平臺的音質(zhì)差異性[D];上海音樂學院;2012年
4 韓鈺;網(wǎng)絡電話會議中混音技術的研究[D];河南科技大學;2010年
5 江淼;當代節(jié)奏布魯斯歌曲的混音藝術與技術研究[D];中央音樂學院;2014年
6 孫進寶;基于WebRTC的混音服務器的研究與設計[D];西安電子科技大學;2014年
7 劉文;嵌入式Linux環(huán)境下多路音頻流混音設備的研究與設計[D];河北農(nóng)業(yè)大學;2014年
8 黑利利;錄音、混音室建筑聲學特性研究[D];長安大學;2013年
9 王亞輝;基于WebRTC語音引擎的會議混音技術研究[D];西安電子科技大學;2013年
10 張傳永;混音技術及其在IP電話會議系統(tǒng)中的應用[D];西安電子科技大學;2011年
本文編號:2537756
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2537756.html