天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

麥克風網(wǎng)絡(luò)中基于分布式卡爾曼濾波的說話人跟蹤方法研究

發(fā)布時間:2020-06-02 09:54
【摘要】:基于麥克風陣列的說話人定位與跟蹤技術(shù)在音/視頻會議系統(tǒng)、公共安全監(jiān)控系統(tǒng)、語音識別、車載電話、機器人等領(lǐng)域得到廣泛應(yīng)用。近年來,隨著無線傳感器網(wǎng)絡(luò)和集成電路技術(shù)的發(fā)展以及嵌入式處理器計算能力的顯著提高,基于麥克風陣列網(wǎng)絡(luò)的分布式說話人定位與跟蹤技術(shù)成為語音信號處理領(lǐng)域的研究熱點。采用分布式數(shù)據(jù)處理方式,分布式說話人定位方法不限制麥克風陣列網(wǎng)絡(luò)的拓撲結(jié)構(gòu),其容錯能力較強,可靠性和穩(wěn)定性高,但它只利用當前幀的語音信號對聲源進行定位,對背景噪聲和房間混響魯棒性較差。因此,需要采用分布式說話人跟蹤方法來確定說話人的運動軌跡,以獲得更好的聲源位置估計性能。分布式說話人跟蹤是典型的非線性狀態(tài)估計問題。本文針對分布式麥克風網(wǎng)絡(luò)提出了幾種分布式非線性卡爾曼濾波算法,并將這些算法用于麥克風陣列網(wǎng)絡(luò)的說話人跟蹤問題,提出了幾種分布式聲源跟蹤方法,實現(xiàn)對說話人運動軌跡的有效估計。本文的主要貢獻如下:(1)針對分布式聲源定位方法對背景噪聲和房間混響魯棒性差的問題,提出了一種基于分布式麥克風陣列網(wǎng)絡(luò)的分布式卡爾曼濾波說話人跟蹤方法。該方法考慮到噪聲和混響影響使得時間延遲估計可能存在虛假值,引入了一種時延甄別策略,并在對聲源進行跟蹤時,從鄰域搜集有效的時延估計作為觀測信息,用郎之萬模型描述說話人運動狀態(tài),然后用分布式卡爾曼濾波對說話人位置進行準確估計。該方法充分利用當前和過去時間幀的語音信號,能夠有效解決分布式說話人定位的魯棒性差問題,具有通信負擔小、可靠性和穩(wěn)定性高、使用靈活等優(yōu)點。(2)針對說話人跟蹤中觀測模型的非線性問題,提出了一種分布式無味卡爾曼濾波方法,其可達到二階估計精度。在此基礎(chǔ)上,為充分描述室內(nèi)環(huán)境說話人不同運動模式,引入交互式多模型算法,提出了一種基于麥克風陣列網(wǎng)絡(luò)的分布式交互多模型無味卡爾曼濾波說話人跟蹤方法。該方法對聲源進行跟蹤時,從鄰域搜集有效的時延估計,并用不同模型描述說話人駐足、慢走、快走及加速等運動模式,然后融合不同模型的無味卡爾曼濾波結(jié)果,因此能夠有效提高說話人位置的估計精度。(3)針對聲源跟蹤時說話人的初始狀態(tài)可能未知或誤差較大問題,提出了一種分布式迭代拓展卡爾曼濾波方法,并將該方法用于麥克風陣列網(wǎng)絡(luò)的說話人跟蹤問題中。此外,還引入一種迭代終止策略,使迭代過程始終向似然增加的方向進行,從而獲得最大似然意義下的近似最優(yōu)解。該方法在跟蹤過程中,通過增加幾次簡單的局部迭代,即使當說話人的初始位置誤差較大時,也能夠快速捕捉到說話人的位置,因此具有更快的收斂速度,也能有效提高說話人位置的估計精度。(4)考慮到求容積卡爾曼濾波估計精度高,迭代拓展卡爾曼濾波收斂速度快的優(yōu)點,提出了一種迭代求容積卡爾曼濾波方法,可達二階估計精度。在此基礎(chǔ)上,提出了一種分布式迭代求容積卡爾曼濾波方法,并將該方法用于麥克風陣列網(wǎng)絡(luò)的說話人跟蹤問題中。該方法具有二階估計精度,且計算量較小,收斂速度快,能夠有效求解說話人跟蹤中觀測模型的非線性問題,提高說話人跟蹤性能。
【圖文】:

虛聲源,沖激響應(yīng),房間


#表示傅里葉變換長度,IFFT表示傅里葉逆變換。逡逑假設(shè)二維房間長寬分別為6m邋x邋5m,聲源位置為(5m,3.5m),麥克風位置為逡逑混響時間為r60邋=邋300ms,利用虛聲源法求得的房間沖激響應(yīng)如圖2.4所逡逑示。由于直達信號幾乎沒有能量衰減,因此房間沖激響應(yīng)中幅值最大的沖激響應(yīng)逡逑對應(yīng)著直接到達的聲音信號,其它沖激則對應(yīng)著一系列反射路徑聲信號的沖激響應(yīng)。逡逑-13邋-逡逑

說話人,運動路徑,中模,聲源


絡(luò)中的每個節(jié)點估計說話人的運動狀態(tài),即逡逑^Pi.k邋=邋^i,k\k-l逡逑Pi,k邋=邋Pi^k\k—\逡逑對于每一個鄰域節(jié)點/邋e邋A/u.,重復(fù)計算:逡逑Re邋=邋Rik邋+邋HiikP^kHjk逡逑+邋Pi.kH^R-^邋y^k邋-邋HUk邋^iykPi,k邋=邋Pi,k邋-邋Pi,kH:kR:'Hi,,kPi,k逡逑b)邋=邋b^k-i邋+邋fiAi[qi}k-i邋—邋Q^k-i^i.k-i]逡逑cf}邋=邋Sib^逡逑C)邋xiMk邋=邋Eie^k邋c。担澹埃,fe逡逑P%,k\k邋=邋Pi,k逡逑^i,k+l\k邋=邋^邋^i,k\k逡逑Pi,k+i\k邋=邋FPi^\kFJ邋+邋rQ^rT逡逑移矩陣f和噪聲轉(zhuǎn)移矩陣r由第二章郎之萬模型給出。逡逑3.0-j邐逡逑
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TN912.3

【相似文獻】

相關(guān)期刊論文 前10條

1 李稀敏;洪青陽;黃曉丹;;基于說話人的音頻分割與聚類[J];心智與計算;2010年02期

2 李敬陽;李銳;王莉;王曉笛;;基于變分貝葉斯改進的說話人聚類算法[J];數(shù)據(jù)采集與處理;2017年01期

3 葉于林;楊波;莫建華;劉夏;;基于說話人辨識的自上而下聽覺顯著性注意模型[J];計算機系統(tǒng)應(yīng)用;2017年07期

4 陳新仁;;說話人用意的認知加工機制:基于誤解分析的證據(jù)[J];外語教學(xué);2016年04期

5 花冬萍;;潤澤有效的課堂,從引導(dǎo)學(xué)生學(xué)會傾聽開始[J];快樂閱讀;2016年24期

6 楊曉帆;;那些有故事的“說話人”[J];長江叢刊;2017年01期

7 唐一鳴;;漢日位移動詞比較研究[J];唐山文學(xué);2017年02期

8 陶艷;;簡約而不簡單的英語實用口語[J];初中生輔導(dǎo);2016年36期

9 董文英;;臨時性詞匯及其語用功能探析[J];青年文學(xué)家;2017年09期

10 李洪儒;;說話人意義的形成機制及其功能——“語言與人”系列研究(1)[J];外語學(xué)刊;2013年06期

相關(guān)會議論文 前10條

1 金乃高;侯剛;王學(xué)輝;李非墨;;基于主動感知的音視頻聯(lián)合說話人跟蹤方法[A];2010年通信理論與信號處理學(xué)術(shù)年會論文集[C];2010年

2 馬勇;鮑長春;夏丙寅;;基于辨別性深度信念網(wǎng)絡(luò)的說話人分割[A];需將論文集名稱修改為“第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC2013)論文集[C];2013年

3 王海燕;楊鴻武;甘振業(yè);裴東;;基于說話人自適應(yīng)訓(xùn)練的漢藏雙語語音合成[A];需將論文集名稱修改為“第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC2013)論文集[C];2013年

4 何磊;方棣棠;吳文虎;;說話人聚類與模型自適應(yīng)結(jié)合的說話人自適應(yīng)方法[A];第六屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2001年

5 李經(jīng)偉;;語體轉(zhuǎn)換與角色定位[A];全國語言與符號學(xué)研究會第五屆研討會論文摘要集[C];2002年

6 司羅;胡起秀;金琴;;完全無監(jiān)督的雙人對話中的說話人分隔[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年

7 羅海風;龍長才;;多話者環(huán)境下說話人辨識聽覺線索研究[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年

8 白俊梅;張樹武;徐波;;廣播電視中的目標說話人跟蹤技術(shù)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

9 索宏彬;劉曉星;;基于高斯混合模型的說話人跟蹤系統(tǒng)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

10 王剛;鄔曉鈞;鄭方;王琳琳;張陳昊;;基于參考說話人模型和雙層結(jié)構(gòu)的說話人辨認[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(二)[C];2011年

相關(guān)重要報紙文章 前10條

1 ;做一名積極的傾聽者[N];中國紡織報;2003年

2 唐志強;不聽別人說話,也能模仿其口音[N];新華每日電訊;2010年

3 蘭州大學(xué)外國語學(xué)院 樊林洲;語言進化的生態(tài)機制[N];中國社會科學(xué)報;2016年

4 華中師范大學(xué)語言與語言教育研究中心 侯鉞沛;從“高大上”到“然并卵”[N];語言文字周報;2016年

5 中科院自動化所生物特征認證與測評中心 白俊梅;聽到的真實嗎?[N];計算機世界;2003年

6 曹文彪;生氣與高致[N];文學(xué)報;2006年

7 中國科學(xué)院自動化研究所模式識別國家重點實驗室 辛樂邋陶建華;說話人頭像技術(shù):讓語音可視[N];計算機世界;2007年

8 攀登;為這樣的提議叫好[N];福建日報;2013年

9 全國政協(xié)委員 本報高級編輯 詹國樞;咱們都來說真話[N];人民日報海外版;2010年

10 王一民;“自許”跟“自詡”的不同[N];語言文字周報;2012年

相關(guān)博士學(xué)位論文 前10條

1 田野;麥克風網(wǎng)絡(luò)中基于分布式卡爾曼濾波的說話人跟蹤方法研究[D];大連理工大學(xué);2018年

2 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年

3 楊繼臣;說話人信息分析及其在多媒體檢索中的應(yīng)用研究[D];華南理工大學(xué);2010年

4 呂聲;說話人轉(zhuǎn)換方法的研究[D];華南理工大學(xué);2004年

5 屈丹;電話信道下語言辨識技術(shù)研究[D];中國人民解放軍信息工程大學(xué);2005年

6 孫俊;基于激勵源及其韻律特征的源—目標說話人聲音轉(zhuǎn)換研究[D];中國科學(xué)技術(shù)大學(xué);2006年

7 王堅;語音識別中的說話人自適應(yīng)研究[D];北京郵電大學(xué);2007年

8 金乃高;音視頻聯(lián)合說話人定位與跟蹤方法研究[D];大連理工大學(xué);2008年

9 徐利敏;說話人辨認中的特征變換和魯棒性技術(shù)研究[D];南京理工大學(xué);2008年

10 玄成君;基于語音頻率特性抑制音素影響的說話人特征提取[D];天津大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 陳秋明;關(guān)聯(lián)理論在兩會記者招待會口譯中的應(yīng)用[D];福建師范大學(xué);2017年

2 古典;語音識別中神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的說話人自適應(yīng)研究[D];中國科學(xué)技術(shù)大學(xué);2018年

3 肖露;英語狀語主觀性語義的漢譯技巧研究[D];華南理工大學(xué);2018年

4 鐘浩;噪聲環(huán)境下說話人特征參數(shù)提取算法研究[D];廣東工業(yè)大學(xué);2018年

5 金亞強;基于說話人特征的低功耗人機交互喚醒機制研究[D];華南理工大學(xué);2018年

6 吳夢捷;基于主客觀分工的“X比Y要/都/還/更W”結(jié)構(gòu)研究[D];上海師范大學(xué);2018年

7 王昊楠;具備魯棒性的說話人分割機制的設(shè)計與實施[D];北京郵電大學(xué);2018年

8 閆小雨;短語依賴型語者識別系統(tǒng)的設(shè)計與實施[D];北京郵電大學(xué);2018年

9 桑靜;遠程語音通信中說話人身份識別與追蹤研究[D];西南交通大學(xué);2018年

10 朱愷迪;現(xiàn)代漢語反預(yù)期標記“倒”和“反而”功能研究[D];華東師范大學(xué);2017年



本文編號:2692981

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2692981.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2a39***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com