基于改進PNCC特征和兩步區(qū)分性訓練的錄音設備識別方法
本文選題:數(shù)字音頻取證 + 錄音設備識別; 參考:《電子學報》2014年01期
【摘要】:錄音設備來源識別是通過分析已獲取的數(shù)字語音信號從而確定其錄制設備的一種技術,屬于數(shù)字音頻盲取證.本文提出了一種基于改進PNCC特征和兩步區(qū)分性訓練的錄音設備識別方法,由于音頻中的靜音包含了完整的設備信息,且不受說話人和文本等因素的影響,因此從靜音段提取改進的PNCC特征,利用了PNCC的長時幀分析去除背景噪聲對設備信息的影響.在模型方面,以GMM-UBM為基準模型,并通過兩步區(qū)分性訓練調(diào)整集內(nèi)設備模型和通用背景模型,提升模型區(qū)分能力.該方法對于30種設備閉集識別的平均正確識別率為90.23%;對于15個集內(nèi)和15個集外設備的測試,等錯誤率為15.17%,集內(nèi)平均正確識別率為96.65%,驗證了本文算法的有效性.
[Abstract]:Source identification of recording equipment is a kind of technology to determine the recording equipment by analyzing the acquired digital speech signal. It belongs to digital audio blind forensics. In this paper, a recording equipment recognition method based on improved PNCC features and two-step discriminative training is proposed. Because the silence in audio contains complete equipment information and is not affected by the speaker and text, etc. Therefore, the improved PNCC feature is extracted from the mute segment, and the influence of background noise on the equipment information is removed by using the long-time frame analysis of PNCC. In the aspect of model, the ability of model differentiation is improved by using GMM-UBM as the benchmark model and adjusting the device model and the general background model through two-step discriminative training. The average correct recognition rate of this method is 90.23 for the closed set recognition of 30 kinds of devices, 15.17 for 15 in-set and 15 off-set devices, and 96.65 for the average correct recognition rate in the set, which verifies the validity of the algorithm in this paper.
【作者單位】: 華南理工大學電子與信息學院;卡內(nèi)基梅隆大學計算機學院;
【基金】:國家自然科學基金(No.60972132,No.61101160) 廣東省自然科學基金(No.9351064101000003,No.10451064101004651)
【分類號】:TN912.3
【參考文獻】
相關期刊論文 前4條
1 何磊,武健,方棣棠,吳文虎;最大后驗估計和最近鄰線性回歸結合的說話人自適應方法[J];電子學報;2000年11期
2 周琳娜;王東明;郭云彪;楊義先;;基于數(shù)字圖像邊緣特性的形態(tài)學濾波取證技術[J];電子學報;2008年06期
3 陳雁翔;劉鳴;;基于發(fā)音特征的音視頻說話人識別魯棒性的研究[J];電子學報;2010年12期
4 王志鋒;賀前華;張雪源;羅海宇;蘇卓生;;基于信道模式噪聲的錄音回放攻擊檢測[J];華南理工大學學報(自然科學版);2011年10期
【共引文獻】
相關期刊論文 前10條
1 王偉;方勇;;基于有限差分的置換圖像盲檢測方法[J];電子學報;2010年10期
2 余姍姍;張亞瓊;;語音識別的自適應研究[J];福建電腦;2011年06期
3 周龍龍;;圖像空域分析下的篡改檢測算法[J];電視技術;2012年23期
4 朱彥;江華;;利用Photoshop中高斯模糊進行篡改的取證方法[J];電視技術;2013年17期
5 王俊文;張琪;劉光杰;張湛;戴躍偉;王執(zhí)銓;;利用異常邊緣進行圖像銳化篡改取證[J];解放軍理工大學學報(自然科學版);2009年03期
6 王俊文;劉光杰;戴躍偉;張湛;王執(zhí)銓;;基于非抽樣Contourlet變換的圖像模糊取證[J];計算機研究與發(fā)展;2009年09期
7 李哲;鄭江濱;;基于噪聲分布規(guī)律的偽造圖像盲檢測算法[J];計算機應用研究;2009年03期
8 潘生軍;楊本娟;劉本永;;基于后驗概率的圖像模糊檢測方法[J];計算機工程與應用;2012年32期
9 武瑛;;形態(tài)學圖像處理的應用[J];計算機與現(xiàn)代化;2013年05期
10 李晉;郭武;戴禮榮;;聯(lián)合因子分析算法中基于信號子空間的空間變換方法[J];模式識別與人工智能;2013年08期
相關會議論文 前6條
1 駱啟帆;章堅武;吳震東;;一種基于MFCC與韻律特征的說話人確認方法[A];浙江省電子學會2013學術年會論文集[C];2013年
2 尹聰;白靜;龔[,
本文編號:1959752
本文鏈接:http://sikaile.net/kejilunwen/wltx/1959752.html