基于UBM和PLDA的異常聲識別方法研究
發(fā)布時間:2020-04-02 15:17
【摘要】:異常聲音通常是指在安靜的環(huán)境下突然出現(xiàn)的非語音聲,例如,玻璃破碎聲音、嬰兒哭聲、爆炸聲、敲門聲等,它在智能監(jiān)控、場景辨識、安全監(jiān)測等場合具有廣泛應(yīng)用。目前,異常聲音監(jiān)測與識別技術(shù)的研究已取得一定的進(jìn)展,并在實(shí)際中得到應(yīng)用,但識別率相對較低,魯棒性能較差,不能滿足實(shí)際需要。本文對異常聲音監(jiān)測與識別技術(shù)進(jìn)行了研究,通過應(yīng)用統(tǒng)一背景模型和PLDA模型,提高了識別性能。本文的主要工作如下:(1)研究了異常聲音特征提取方式、語音活動檢測中自適應(yīng)閾值的選擇以及傳統(tǒng)異常聲音識別的分類模型。(2)詳細(xì)研究了高斯混合統(tǒng)一背景模型的識別系統(tǒng),推導(dǎo)了統(tǒng)一背景模型訓(xùn)練參數(shù)的流程和最大自適應(yīng)準(zhǔn)則的匹配過程。設(shè)計(jì)了仿真實(shí)驗(yàn),研究了統(tǒng)一背景模型中高斯模型的分量數(shù)目和梅爾頻率倒譜系數(shù)維度對實(shí)驗(yàn)性能的影響,對比了統(tǒng)一背景模型和高斯混合模型對異常聲音分類效果的優(yōu)劣。(3)搭建了基于身份識別向量和PLDA模型的異常聲音識別系統(tǒng)。對身份識別向量的提取算法流程和PLDA模型進(jìn)行了詳細(xì)介紹,通過估計(jì)總變異空間矩陣,利用空間矩陣和因子分析技術(shù),對身份識別向量進(jìn)行了降維處理,并基于PLDA模型進(jìn)行評分。在仿真實(shí)驗(yàn)中,對比了不同維度的身份識別向量,研究了PLDA因子維度等參數(shù)對異常聲識別效果的影響。
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34
本文編號:2612117
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 鄧紅莉;楊韜;;一種基于深度學(xué)習(xí)的異常檢測方法[J];信息通信;2015年03期
2 周國鑫;高勇;;基于GMM-UBM模型的說話人辨識研究[J];無線電工程;2014年12期
3 許云飛;楊海;周若華;顏永紅;;高斯PLDA在說話人確認(rèn)中的應(yīng)用及其聯(lián)合估計(jì)[J];自動化學(xué)報(bào);2014年06期
4 劉波霞;陳建峰;;基于特征分析的環(huán)境聲音事件識別算法[J];計(jì)算機(jī)工程;2011年22期
5 伍宗富;蔡明山;陳日新;;基于短時處理的異常聲音辨識系統(tǒng)研制[J];中國農(nóng)機(jī)化;2011年02期
6 郭武;李軼杰;戴禮榮;王仁華;;說話人識別中的因子分析以及空間拼接[J];自動化學(xué)報(bào);2009年09期
,本文編號:2612117
本文鏈接:http://sikaile.net/kejilunwen/wltx/2612117.html
最近更新
教材專著