基于語音特征學(xué)習(xí)的說話人確認(rèn)與帕金森診斷
本文關(guān)鍵詞:基于語音特征學(xué)習(xí)的說話人確認(rèn)與帕金森診斷,,由筆耕文化傳播整理發(fā)布。
【摘要】:語音特征是一種重要的生物標(biāo)記物,已經(jīng)廣泛用于說話人識別、疾病診斷等領(lǐng)域。其中,說話人確認(rèn)與帕金森疾病診斷是語音特征近年來應(yīng)用研究的熱點(diǎn)和難點(diǎn)。雖然相關(guān)研究取得了許多正面的進(jìn)展,極大的顯示了其應(yīng)用潛力,但在特征壓縮、樣本優(yōu)選、分類器優(yōu)化等方面,還存在一定的問題,而這些方面都是提高語音特征學(xué)習(xí)質(zhì)量的重要環(huán)節(jié);诖,本文在相關(guān)課題資助下,針對說話人確認(rèn)和帕金森疾病診斷這兩個具體應(yīng)用問題,研究了其語音特征壓縮、樣本優(yōu)選、分類器優(yōu)化等環(huán)節(jié),提出了三種改進(jìn)算法,實(shí)現(xiàn)了識別性能的提高。相關(guān)主要工作如下:(1)提出了一種多類型語音特征封裝式進(jìn)化特征選擇框架算法,同時,基于該框架算法,給出了一種具體的實(shí)現(xiàn)方式—四類型語音特征封裝式遺傳特征選擇算法,為該框架算法給出了具體實(shí)現(xiàn)范例。本框架算法的提出,有利于解決目前缺乏相關(guān)方法標(biāo)準(zhǔn)化框架研究的問題。(2)提出了一種極低信噪比環(huán)境下基于多類型語音特征學(xué)習(xí)的說話人確認(rèn)算法。首先設(shè)計(jì)了低信噪比下提取多種類型語音特征的方法,尤其是引入了基音頻率提取算法。然后設(shè)計(jì)了基于CAGA和GMM-UBM的特征選擇分類集成模型,通過對提取的特征進(jìn)行選擇實(shí)現(xiàn)融合,用于說話人確認(rèn)。本算法的提出實(shí)現(xiàn)了面向極低信噪比環(huán)境下的說話人確認(rèn)算法,有助于解決在這一應(yīng)用領(lǐng)域中存在的語音提取質(zhì)量低的問題。(3)提出了基于語音樣本重復(fù)剪輯算法和隨機(jī)森林的帕金森癥診斷算法,通過樣本重復(fù)剪輯算法實(shí)現(xiàn)對語音樣本的優(yōu)選,通過引入隨機(jī)森林實(shí)現(xiàn)對樣本的集成學(xué)習(xí)。該算法實(shí)現(xiàn)了對語音樣本的優(yōu)選,提高了樣本的質(zhì)量,將為目前基于語音的帕金森癥診斷研究提供新的研究思路和方法參考。本文為相關(guān)研究者提供了方法參考,為提高基于語音特征學(xué)習(xí)的模式分類研究提供了新的思路,具有重要的研究意義。
【關(guān)鍵詞】:說話人確認(rèn) 特征選擇 極低信噪比 帕金森疾病診斷 重復(fù)剪輯近鄰算法
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R742.5;TN912.3
【目錄】:
- 摘要3-4
- ABSTRACT4-8
- 1 緒論8-14
- 1.1 引言8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-12
- 1.3 本文的主要內(nèi)容12
- 1.4 本文文章結(jié)構(gòu)12-14
- 2 本文算法基本原理14-32
- 2.1 語音信號的預(yù)處理15-17
- 2.1.1 預(yù)加重15-16
- 2.1.2 端點(diǎn)檢測(VAD)16
- 2.1.3 分幀與加窗16-17
- 2.2 語音信號的特征參數(shù)提取17-22
- 2.2.1 線性預(yù)測倒譜系數(shù)(LPCC)18-19
- 2.2.2 梅爾頻率倒譜系數(shù)(MFCC)19-21
- 2.2.3 MFCC中加入能量信息和動態(tài)參數(shù)21-22
- 2.3 分類器22-28
- 2.3.1 高斯混合模型-通用背景模型(GMM-UBM)22-26
- 2.3.2 支持向量機(jī)26-27
- 2.3.3 隨機(jī)森林27-28
- 2.4 算法性能評價標(biāo)準(zhǔn)28-31
- 2.4.1 等錯率29
- 2.4.2 DET曲線29-30
- 2.4.3 檢測代價函數(shù)(DCF)30-31
- 2.4.4 帕金森診斷實(shí)驗(yàn)評價指標(biāo)31
- 2.5 本章小結(jié)31-32
- 3 多類型語音特征的封裝式進(jìn)化選擇框架算法研究32-48
- 3.1 FSF-WRGAF算法語音特征提取模塊—GFCC參數(shù)提取33-36
- 3.2 鏈?zhǔn)街悄荏w遺傳算法(CAGA)36-39
- 3.3 FSF-WRGAF算法封裝式語音特征選擇模塊39-41
- 3.4 實(shí)驗(yàn)結(jié)果與分析41-46
- 3.4.1 實(shí)驗(yàn)條件41-42
- 3.4.2 提取的特征類型分析42-44
- 3.4.3 FSF-WrGAF算法選擇的語音特征性能分析44
- 3.4.4 相關(guān)算法的識別性能比較44-46
- 3.4.5 噪聲下相關(guān)語音特征參數(shù)的識別性能比較46
- 3.5 本章小結(jié)46-48
- 4 極低信噪比下多類型特征學(xué)習(xí)用于說話人確認(rèn)48-54
- 4.1 極低信噪比噪聲下基于DP的基音頻率提。―P_PEFAC算法)49-51
- 4.2 實(shí)驗(yàn)結(jié)果與分析51-53
- 4.2.1 實(shí)驗(yàn)條件52
- 4.2.2 極低信噪比下識別性能比較52-53
- 4.3 本章小結(jié)53-54
- 5 基于語音樣本重復(fù)剪輯和隨機(jī)森林的帕金森癥輔助診斷算法研究54-68
- 5.1 語音數(shù)據(jù)特征提取54-58
- 5.2 樣本重復(fù)剪輯近鄰算法58-59
- 5.3 實(shí)驗(yàn)結(jié)果與分析59-66
- 5.3.1 實(shí)驗(yàn)條件59-60
- 5.3.2 本文算法分類結(jié)果與分析60-61
- 5.3.3 語音樣本優(yōu)選效果與分析61-64
- 5.3.4 分類平穩(wěn)性比較分析64-65
- 5.3.5 分類算法的顯著性差異分析65-66
- 5.4 結(jié)論66-68
- 6 總結(jié)與展望68-70
- 6.1 總結(jié)68-69
- 6.2 展望69-70
- 致謝70-72
- 參考文獻(xiàn)72-78
- 附錄78
- A. 作者在攻讀學(xué)位期間取得的科研成果78
- B. 作者在攻讀學(xué)位期間參與的科研項(xiàng)目78
【相似文獻(xiàn)】
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 吳璽宏;遲惠生;;一種高性能的限定文本說話人確認(rèn)系統(tǒng)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年
2 洪青陽;陳毅東;;一種用于說話人確認(rèn)的區(qū)別性訓(xùn)練方法[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
3 許云飛;黃厚軍;金怡珠;李桂蓮;周若華;;基于PLDA的“一對多”下的說話人確認(rèn)方法研究[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
4 展領(lǐng);景新幸;;矢量量化和VQ-UBM在說話人確認(rèn)中的應(yīng)用[A];中國聲學(xué)學(xué)會2009年青年學(xué)術(shù)會議[CYCA’09]論文集[C];2009年
5 趙賢宇;董遠(yuǎn);張雪峰;楊浩;王海拉;;說話人確認(rèn)系統(tǒng)中基于高斯混合分布相似度選擇TNorm背景模型的研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
6 趙亞麗;付中華;謝磊;張健;張艷寧;;雙麥克風(fēng)語音增強(qiáng)和雜混模型訓(xùn)練相結(jié)合的頑健說話人確認(rèn)[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
7 楊藝敏;景新幸;楊海燕;;PSO-SVM在說話人確認(rèn)系統(tǒng)中的研究[A];泛在信息社會中的聲學(xué)——中國聲學(xué)學(xué)會2010年全國會員代表大會暨學(xué)術(shù)會議論文集[C];2010年
8 張濤;王嵐;遲惠生;;基于VQ的說話人確認(rèn)系統(tǒng)的硬件實(shí)現(xiàn)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2001年
9 尹聰;白靜;龔[
本文編號:490836
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/490836.html