天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

基于i-vector的電子偽裝語音魯棒還原方法研究

發(fā)布時間:2022-02-14 12:35
  語音的電子偽裝是指采用變聲設(shè)備或語音處理軟件改變說話人的個性特征,以達到故意隱藏該說話人身份的目的。電子偽裝語音還原是指通過技術(shù)手段將偽裝語音變回原聲,這對基于語音的身份鑒別有重要意義。本文將頻域和時域偽裝語音的還原問題抽象為偽裝因子的估計問題,通過基于i-vector的自動說話人確認方法估計偽裝因子,并引入對稱變換進一步提高估計效果。該方法借助于i-vector的噪聲魯棒性,提高了真實含噪場景下偽裝因子的估計精度,從而改進了噪聲條件下電子偽裝語音的還原效果。在干凈語音庫TIMIT上訓練i-vector并在含噪語音庫VoxCeleb1上對本文方法進行測試,結(jié)果表明,偽裝因子估計的錯誤率從基線系統(tǒng)的9.19%降低為4.49%,還原語音在自動說話人確認等錯誤率和聽覺感知方面也取得了提升。 

【文章來源】:數(shù)據(jù)采集與處理. 2020,35(05)北大核心CSCD

【文章頁數(shù)】:12 頁

【部分圖文】:

基于i-vector的電子偽裝語音魯棒還原方法研究


利用基頻比確定偽裝因子原理圖

方法,語音,語句,因子


基于GMM-UBM和i-vector的說話人確認方法是目前發(fā)展比較成熟且被廣泛采用的說話人確認模型,原理如圖2所示。該模型首先對提取的語音信號的特征(如MFCC等)在大量語料上訓練一組GMM-UBM作為通用背景。在注冊和測試階段,從待測語音S中提取特征,并將這些特征作為觀測值對訓練好的GMM-UBM做最大后驗概率估計(Maximum a posteriori,MAP),得到高斯超矢量,并進一步提取說話人的特征i-vector,用λ表示。通過對比注冊語句和測試語句所提取的i-vector的相似程度,即可完成2條語句是否來自同一個說話人的判決任務(wù);谡f話人確認系統(tǒng)的偽裝因子估計方法如圖3所示。該方法通過遍歷偽裝因子的理論取值范圍,對待測偽裝語音進行逐一還原,然后說話人確認系統(tǒng)對每條還原語音與偽裝嫌疑人的語音進行打分,得分最高的還原語音對應(yīng)的偽裝因子即認為是正確的偽裝因子。本文中說話人確認模型選擇了通過GMM-UBM提取的i-vector,具體步驟如下:

因子,方法,語音,嫌疑人


基于說話人確認系統(tǒng)的偽裝因子估計方法如圖3所示。該方法通過遍歷偽裝因子的理論取值范圍,對待測偽裝語音進行逐一還原,然后說話人確認系統(tǒng)對每條還原語音與偽裝嫌疑人的語音進行打分,得分最高的還原語音對應(yīng)的偽裝因子即認為是正確的偽裝因子。本文中說話人確認模型選擇了通過GMM-UBM提取的i-vector,具體步驟如下:(1)訓練階段,利用偽裝嫌疑人Sj的正常語音進行注冊,通過說話人確認中的特征提取部分計算得到該說話人的注冊特征λj;

【參考文獻】:
期刊論文
[1]語音轉(zhuǎn)換技術(shù)研究現(xiàn)狀及展望[J]. 張雄偉,苗曉孔,曾歆,孫蒙,曹鐵勇.  數(shù)據(jù)采集與處理. 2019(05)
[2]基于DC-CNN的電子偽裝語音還原研究[J]. 王永全,施正昱,張曉.  計算機科學. 2019(08)
[3]骨導麥克風語音盲增強技術(shù)研究現(xiàn)狀及展望[J]. 張雄偉,鄭昌艷,曹鐵勇,楊吉斌,邢益搏.  數(shù)據(jù)采集與處理. 2018(05)
[4]基于DTW模型補償?shù)膫窝b語音說話人識別研究[J]. 李燕萍,陶定元,林樂.  計算機技術(shù)與發(fā)展. 2017(01)
[5]電子偽裝語音的變聲規(guī)律研究[J]. 張桂清,金怡珠,劉紅偉,崔效義.  證據(jù)科學. 2010(04)

碩士論文
[1]電子偽裝語音下的說話人識別方法研究[D]. 陶定元.南京郵電大學 2016



本文編號:3624566

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3624566.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b13c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com