說話人識別系統(tǒng)及其受鼻塞音影響的研究
發(fā)布時間:2021-01-01 05:15
語音是人的固有特征,獲取設備成本較低,不受位置限制,因此用語音來鑒別說話人身份的說話人識別技術有著許多特有的優(yōu)點,在很多場景中甚至是不可替代的。但說話人識別技術發(fā)展至今,仍然面臨很多的困難和挑戰(zhàn)。受發(fā)聲器官的影響,鼻腔堵塞時會發(fā)出聲紋畸變的鼻塞音,對說話人識別系統(tǒng)的識別率產生影響。因此文章將研究鼻塞音與正常音的差別,分析幾種說話人識別系統(tǒng)的性能及其受鼻塞音影響的程度,對在實際應用中選擇說話人識別系統(tǒng)提供指導。本文首先分析了語音信號特征,按語音特征提取系統(tǒng)流程,介紹了語音的數字化方法;通過實驗分析了預加重、分幀加窗、譜熵法端點檢測這一語音預處理過程的必要性;介紹了梅爾倒譜系數提取聲紋特征的原理。通過上述操作將原始語音轉化為可輸入系統(tǒng)的數字信號。接著研究了正常音和鼻塞音的發(fā)聲機理,并通過語譜圖技術對鼻塞語音進行分析,找出鼻塞語音與正常語音的具體差別。然后研究傳統(tǒng)說話人識別系統(tǒng)中矢量量化法和高斯混合模型法的原理及性能,通過實驗找到最佳系統(tǒng)參數,對比最佳系統(tǒng)的識別率受鼻塞音的影響并分析實驗數據。最后研究神經網絡說話人識別系統(tǒng)中基于集成學習思想優(yōu)化的BP神經網絡法和循環(huán)神經網絡算法的原理及性能,...
【文章來源】:西安科技大學陜西省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
音頻錄制參數設置試驗使用AodobeAudition專業(yè)音頻錄制、編輯軟件錄制語音
本文編號:2950984
【文章來源】:西安科技大學陜西省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
音頻錄制參數設置試驗使用AodobeAudition專業(yè)音頻錄制、編輯軟件錄制語音
本文編號:2950984
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2950984.html
最近更新
教材專著