無線電對講語音的說話人分割聚類研究
發(fā)布時間:2017-08-18 17:28
本文關鍵詞:無線電對講語音的說話人分割聚類研究
【摘要】:伴隨著信息爆炸和大數(shù)據(jù)時代的到來,音頻獲取途徑和數(shù)量迅速增加,音頻管理變得越來越復雜,說話人分割聚類作為音頻管理的一種方式近幾年在國際上逐漸成為研究熱點。說話人分割聚類是說話人識別、話者跟蹤、話者自適應的前期處理和必要步驟。本文針對多說話人、信道變化、背景噪聲大的無線電對講語音,主要進行說話人分割聚類研究。在分析現(xiàn)有無監(jiān)督說話人分割算法的基礎上,使用BIC、GLR和KL2準則對音頻進行說話人分割,通過移動不同尺度的時間窗來快速確定存在的說話人變化點,最佳性能達到F=65.47%。說話人聚類是通過CLR距離的自底向上的層次聚類來實現(xiàn)的,聚類的終止條件是系統(tǒng)中指定的說話人個數(shù)。針對音頻中包含較大的背景噪聲,使用經(jīng)典的譜減法和維納濾波器對音頻進行語音增強,對增強后的語音進行說話人分割聚類實驗。在以上說話人分割算法性能遇到瓶頸時,通過觀察發(fā)現(xiàn)地面控制中心和飛行員說話結(jié)束后會產(chǎn)生按鍵音。由于按鍵音是說話人變化的標識,由此提出信息融合的方法進行說話人分割聚類。在研究現(xiàn)有聲學事件檢測算法的基礎上,使用時域分析和模型匹配的方法進行聲學事件檢出。通過實驗得到高召回率和高準確率的事件位置后,對說話人分割結(jié)果進行修正。實驗表明增加事件檢測后說話人分割算法性能提升到77.18%,比之前單獨使用最好的BIC方法的綜合性能相對提升了17.88%,召回率和準確率分別相對提升了20.01%和15.50%。
【關鍵詞】:信息融合 說話人分割聚類 聲學事件檢測
【學位授予單位】:北京理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3
【目錄】:
- 摘要5-6
- Abstract6-9
- 第1章 緒論9-16
- 1.1 課題的研究背景和意義9-10
- 1.2 研究現(xiàn)狀10-14
- 1.2.1 說話人分割聚類10-11
- 1.2.2 聲學事件檢測11-13
- 1.2.3 信息融合13-14
- 1.3 本文研究工作與論文組織14-16
- 第2章 說話人分割聚類16-30
- 2.1 說話人分割聚類概述16-24
- 2.1.1 語音信號的預處理17-19
- 2.1.2 特征提取19-20
- 2.1.3 語音活性檢測20-22
- 2.1.4 說話人分割22-23
- 2.1.5 說話人聚類23-24
- 2.2 實驗數(shù)據(jù)與性能評估24
- 2.3 不同距離度量的說話人分割算法24-28
- 2.3.1 GLR距離25-27
- 2.3.2 BIC距離27
- 2.3.3 KL2距離27-28
- 2.4 說話人聚類28-29
- 2.5 本章小結(jié)29-30
- 第3章 語音增強30-38
- 3.1 語音增強方法概述30-33
- 3.2 語音增強33-36
- 3.2.1 譜減法33-35
- 3.2.2 維納濾波器35-36
- 3.3 語音增強后說話人分割性能36-37
- 3.4 本章小結(jié)37-38
- 第4章 聲學事件檢測38-44
- 4.1 聲學事件檢測概述38-39
- 4.2 聲學事件檢測實現(xiàn)39-43
- 4.2.1 時域分析法40-41
- 4.2.2 模型匹配法41-43
- 4.3 本章小結(jié)43-44
- 第5章 基于信息融合的說話人分割44-49
- 5.1 信息融合概述44-45
- 5.2 信息融合的說話人分割45-47
- 5.3 本章小結(jié)47-49
- 第6章 總結(jié)與展望49-51
- 6.1 主要工作總結(jié)49
- 6.2 后期展望49-51
- 參考文獻51-56
- 攻讀學位期間發(fā)表論文與研究成果清單56-57
- 致謝57
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 石自強;韓紀慶;鄭鐵然;;魯棒聲學事件檢測綜述[J];智能計算機與應用;2012年06期
2 王博;郭英;韓立峰;;基于熵函數(shù)的語音端點檢測算法研究[J];信號處理;2009年03期
3 潘泉,于昕,程詠梅,張洪才;信息融合理論的基本方法與進展[J];自動化學報;2003年04期
中國碩士學位論文全文數(shù)據(jù)庫 前4條
1 劉晶;高強度噪聲對凹耳蛙聽覺的影響[D];廈門大學;2014年
2 孔鴻運;行車環(huán)境下魯棒的聲學事件檢測方法[D];哈爾濱工業(yè)大學;2013年
3 凌錦雯;基于多特征的說話人分割與聚類的研究[D];中國科學技術大學;2011年
4 梁學戰(zhàn);新聞視頻自動切分關鍵技術研究[D];中國科學技術大學;2009年
,本文編號:695829
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/695829.html
最近更新
教材專著