基于激勵源能量和聲道譜的元音開始點檢測
發(fā)布時間:2017-06-01 03:20
本文關鍵詞:基于激勵源能量和聲道譜的元音開始點檢測,由筆耕文化傳播整理發(fā)布。
【摘要】:語音承載信息繁雜,難以精確分離出各種類型單一信息(如語音內(nèi)容、說話人特性、情感信息等)。分析和處理語音最關鍵環(huán)節(jié)之一是對各類信息的表征或提取。元音是語音中重要的一大類音素,它不僅是能量的主要載體,還蘊含著各種信息的有效特征模式。元音開始點即為元音開始時刻。輔音-元音音節(jié)結(jié)構中,元音開始點也可認為是輔音-元音分割點,標志著輔音結(jié)束和元音開始時刻。不同語音處理應用涉及各種各樣的語音事件,元音開始點便是其中重要的語音事件,可作為語音識別、說話人識別、情感識別等重要應用的有效特征。因此,準確檢測元音開始點具有重要應用價值,F(xiàn)有元音開始點(VOP)檢測方法大致可以分為兩類,一類是基于激勵源信息實施檢測,另一類基于聲道信息檢測。當前公認檢測效果較好的方法是Prasanna S R M提出的基于激勵源能量、譜峰能量、調(diào)制譜能量和組合能量的元音開始點檢測方法。當時間分辨率為?40 ms時,這些檢測方法具有很好的檢測準確率,但當時間分辨率提高到?30 ms時,其檢測準確率急劇下降。針對這個問題,本文提出使用時域包絡、稀疏線性預測和最大相位線性預測的元音開始點檢測方法,設計處理TIMIT語料庫整個TEST部分共336條語句(168個說話人,每個說話人選取兩條語句)檢測性能評估實驗。實驗結(jié)果表明,當時間分辨率為?30 ms時,采用稀疏線性預測和最大相位線性預測的檢測準確率分別為66.64%和64.19%,比基于激勵源能量的方法提高3.44%和0.99%。而當時間分辨為?20 ms時,采用稀疏線性預測和最大相位線性預測的檢測準確率分別為55.14%和52.81%,比采用激勵源能量的方法提高3.94%和1.61%。本文主要創(chuàng)新工作:(1)提出采用頻域線性預測算法對時域包絡建模的元音開始點檢測算法,并給出時域包絡建模參數(shù)的有效選取方法。(2)提出采用稀疏線性預測算法對激勵源能量建模的元音開始點檢測算法,以稀疏余項表征激勵源能量。(3)提出使用最大相位線性預測算法對激勵源能量建模的元音開始點檢測算法,通過濾除最大相位信息得到余項來表征激勵源能量。
【關鍵詞】:元音開始點 線性預測 頻域線性預測 稀疏線性預測 最大相位線性預測
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN912.3
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 元音開始點檢測背景及意義9-10
- 1.2 元音開始點檢測研究現(xiàn)狀10-11
- 1.3 研究問題及內(nèi)容11-12
- 1.4 論文結(jié)構安排12-15
- 第2章 語音信號處理基本原理15-23
- 2.1 語音生成模型15-16
- 2.2 語音分類16-19
- 2.3 短時處理19-20
- 2.4 語料庫簡介20-21
- 2.5 本章小結(jié)21-23
- 第3章 元音開始點檢測特征提取23-37
- 3.1 激勵源能量23-28
- 3.1.1 線性預測23-25
- 3.1.2 基于激勵源能量元音開始點檢測25-28
- 3.2 譜峰能量28-30
- 3.3 調(diào)制譜能量30-32
- 3.4 組合能量32-33
- 3.5 實驗結(jié)果與分析33-35
- 3.6 本章小結(jié)35-37
- 第4章 基于時域包絡元音開始點檢測37-47
- 4.1 頻域線性預測37-40
- 4.2 基于時域包絡元音開始點檢測40-44
- 4.3 實驗結(jié)果與分析44-45
- 4.4 本章小結(jié)45-47
- 第5章 基于激勵源能量元音開始點檢測47-59
- 5.1 稀疏線性預測47-51
- 5.1.1 余項稀疏的稀疏線性預測48
- 5.1.2 系數(shù)稀疏的稀疏線性預測48-49
- 5.1.3 基于稀疏線性預測元音開始點檢測49-51
- 5.2 最大相位線性預測51-55
- 5.2.1 最大相位線性預測原理51-53
- 5.2.2 基于最大相位線性預測元音開始點檢測53-55
- 5.3 實驗結(jié)果與分析55-57
- 5.4 本章小結(jié)57-59
- 第6章 總結(jié)與展望59-61
- 參考文獻61-67
- 作者簡介67
- 在攻讀碩士學位期間發(fā)表科研成果67
- 參加項目67-69
- 致謝69
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前5條
1 王艷;馮宏偉;張利平;忽滿利;;基于元音檢測的漢語連續(xù)語音聲韻母分割[J];計算機工程與應用;2011年14期
2 張利平;馮宏偉;王艷;;基于元音檢測的漢語連續(xù)語音端點檢測方法[J];計算機工程與應用;2010年27期
3 鄺航宇,張軍,韋崗;一種基于檢測元音的孤立詞端點檢測算法[J];電聲技術;2005年03期
4 郭彤穎,吳成東,曲道奎;小波變換理論應用進展[J];信息與控制;2004年01期
5 屈丹,王炳錫;語音信號元音檢測的新方法[J];聲學學報;2003年01期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 虢明;基于FRFT相位譜的說話人識別研究[D];吉林大學;2014年
2 彭遠疆;基于線性預測編碼的低速率語音編碼算法的研究[D];電子科技大學;2005年
本文關鍵詞:基于激勵源能量和聲道譜的元音開始點檢測,由筆耕文化傳播整理發(fā)布。
,本文編號:411514
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/411514.html
最近更新
教材專著