基于i-vector的電子偽裝語音魯棒還原方法研究

發(fā)布時間：2022-02-14 12:35

　　語音的電子偽裝是指采用變聲設(shè)備或語音處理軟件改變說話人的個性特征,以達到故意隱藏該說話人身份的目的。電子偽裝語音還原是指通過技術(shù)手段將偽裝語音變回原聲,這對基于語音的身份鑒別有重要意義。本文將頻域和時域偽裝語音的還原問題抽象為偽裝因子的估計問題,通過基于i-vector的自動說話人確認方法估計偽裝因子,并引入對稱變換進一步提高估計效果。該方法借助于i-vector的噪聲魯棒性,提高了真實含噪場景下偽裝因子的估計精度,從而改進了噪聲條件下電子偽裝語音的還原效果。在干凈語音庫TIMIT上訓練i-vector并在含噪語音庫VoxCeleb1上對本文方法進行測試,結(jié)果表明,偽裝因子估計的錯誤率從基線系統(tǒng)的9.19%降低為4.49%,還原語音在自動說話人確認等錯誤率和聽覺感知方面也取得了提升。

【文章來源】：數(shù)據(jù)采集與處理. 2020,35(05)北大核心CSCD

【文章頁數(shù)】：12 頁

【部分圖文】：

利用基頻比確定偽裝因子原理圖

方法,語音,語句,因子

基于GMM-UBM和i-vector的說話人確認方法是目前發(fā)展比較成熟且被廣泛采用的說話人確認模型，原理如圖2所示。該模型首先對提取的語音信號的特征（如MFCC等）在大量語料上訓練一組GMM-UBM作為通用背景。在注冊和測試階段，從待測語音S中提取特征，并將這些特征作為觀測值對訓練好的GMM-UBM做最大后驗概率估計（Maximum a posteriori,MAP），得到高斯超矢量，并進一步提取說話人的特征i-vector，用λ表示。通過對比注冊語句和測試語句所提取的i-vector的相似程度，即可完成2條語句是否來自同一個說話人的判決任務(wù)�；谡f話人確認系統(tǒng)的偽裝因子估計方法如圖3所示。該方法通過遍歷偽裝因子的理論取值范圍，對待測偽裝語音進行逐一還原，然后說話人確認系統(tǒng)對每條還原語音與偽裝嫌疑人的語音進行打分，得分最高的還原語音對應(yīng)的偽裝因子即認為是正確的偽裝因子。本文中說話人確認模型選擇了通過GMM-UBM提取的i-vector，具體步驟如下：

因子,方法,語音,嫌疑人

基于說話人確認系統(tǒng)的偽裝因子估計方法如圖3所示。該方法通過遍歷偽裝因子的理論取值范圍，對待測偽裝語音進行逐一還原，然后說話人確認系統(tǒng)對每條還原語音與偽裝嫌疑人的語音進行打分，得分最高的還原語音對應(yīng)的偽裝因子即認為是正確的偽裝因子。本文中說話人確認模型選擇了通過GMM-UBM提取的i-vector，具體步驟如下：(1）訓練階段，利用偽裝嫌疑人Sj的正常語音進行注冊，通過說話人確認中的特征提取部分計算得到該說話人的注冊特征λj;

【參考文獻】：
期刊論文
[1]語音轉(zhuǎn)換技術(shù)研究現(xiàn)狀及展望[J]. 張雄偉,苗曉孔,曾歆,孫蒙,曹鐵勇.  數(shù)據(jù)采集與處理. 2019(05)
[2]基于DC-CNN的電子偽裝語音還原研究[J]. 王永全,施正昱,張曉.  計算機科學. 2019(08)
[3]骨導麥克風語音盲增強技術(shù)研究現(xiàn)狀及展望[J]. 張雄偉,鄭昌艷,曹鐵勇,楊吉斌,邢益搏.  數(shù)據(jù)采集與處理. 2018(05)
[4]基于DTW模型補償?shù)膫窝b語音說話人識別研究[J]. 李燕萍,陶定元,林樂.  計算機技術(shù)與發(fā)展. 2017(01)
[5]電子偽裝語音的變聲規(guī)律研究[J]. 張桂清,金怡珠,劉紅偉,崔效義.  證據(jù)科學. 2010(04)

碩士論文
[1]電子偽裝語音下的說話人識別方法研究[D]. 陶定元.南京郵電大學 2016

本文編號：3624566

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/3624566.html

上一篇：天發(fā)艦收高頻雷達一階海雜波抑制方法研究
下一篇：兩個密鑰協(xié)商協(xié)議的設(shè)計

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于i-vector的電子偽裝語音魯棒還原方法研究