基于深度學習和D-S理論的分布式麥克風陣列說話人跟蹤算法研究
發(fā)布時間:2020-06-11 20:53
【摘要】:說話人定位跟蹤在音視頻會議系統(tǒng)、智能監(jiān)控系統(tǒng)以及智能家居等場景中有著廣泛的應用。分布式麥克風陣列相較于傳統(tǒng)規(guī)則麥克風網(wǎng)絡有著節(jié)省數(shù)據(jù)傳輸資源、增強網(wǎng)絡容錯能力、提高系統(tǒng)準確性和穩(wěn)定性等優(yōu)勢。傳統(tǒng)的說話人跟蹤算法多采用卡爾曼類濾波器或粒子類濾波器作為移動說話人位置估計的工具,并假設說話人運動模型符合郎之萬模型。然而實際場景中,說話人的運動狀態(tài)較為復雜,很難用一個固定模型或幾個模型的線性組合表示。此外,分布式跟蹤算法能使得數(shù)據(jù)處理在網(wǎng)絡中每個節(jié)點處完成,大量地減少了傳輸數(shù)據(jù)量,從而降低通信帶寬和能量。因而,作為分布式跟蹤算法的重要環(huán)節(jié),分布式數(shù)據(jù)融合一直以來備受關注。但目前為止,應用較多的數(shù)據(jù)融合手段仍是一致性算法。該算法雖原理簡單、易于實現(xiàn),但其簡易的過程使得數(shù)據(jù)融合精度稍差。針對以上問題,本文主要工作總結如下:(1)針對采用郎之萬模型無法較為準確地描述說話人運動模型而導致的跟蹤精度下降等問題,提出一種基于長短時記憶網(wǎng)絡學習得到說話人運動狀態(tài)模型,并應用分布式卡爾曼濾波器對說話人進行跟蹤的方法,從而提高對說話人狀態(tài)轉移估計的準確度。仿真實驗表明,所提方法在噪聲和混響環(huán)境中仍表現(xiàn)出較好性能,且對麥克風網(wǎng)絡有節(jié)點損壞時的魯棒性較強。(2)針對一致性算法采用的加權系數(shù)比較簡單,導致其收斂速度較慢、精度較低的問題,提出一種基于Dempster-Shafer數(shù)據(jù)證明理論的分布式數(shù)據(jù)融合算法。該算法通過基本概率分配函數(shù)將網(wǎng)絡節(jié)點觀測到的信號到達時延轉為信度值,并利用所得到的信度值在網(wǎng)絡中進行一定的分布式數(shù)據(jù)融合,并利用各節(jié)點最后的信度值對到達時延進行更新。仿真實驗表明,所提方法能夠有效地提高說話人跟蹤算法的抗噪和抗混響性能,且跟蹤精度有所提升。(3)針對目前D-S理論中的基本概率分配函數(shù)仍無較好的統(tǒng)一生成方法,提出一種基于核函數(shù)密度估計的基本概率分配函數(shù)生成法。解決了D-S理論中基本概率分配函數(shù)因應用場景的不同而無法采用統(tǒng)一生成方法的問題;并且可以提高傳感器觀測值轉換為信度值的精度。
【學位授予單位】:大連理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.3
本文編號:2708439
【學位授予單位】:大連理工大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TN912.3
【參考文獻】
相關博士學位論文 前1條
1 張巧靈;麥克風網(wǎng)絡中基于分布式粒子濾波的說話人跟蹤方法研究[D];大連理工大學;2016年
相關碩士學位論文 前2條
1 周哲;證據(jù)理論中的證據(jù)生成和融合方法研究[D];杭州電子科技大學;2012年
2 林靜然;基于麥克風陣列的說話人跟蹤及語音分離實現(xiàn)技術的研究[D];電子科技大學;2005年
,本文編號:2708439
本文鏈接:http://sikaile.net/kejilunwen/wltx/2708439.html
最近更新
教材專著