基于矢量量化的說話人識(shí)別的研究
本文關(guān)鍵詞:基于矢量量化的說話人識(shí)別的研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:說話人識(shí)別作為生物識(shí)別的一種,應(yīng)用范圍非常的廣泛,是依據(jù)語音波形中所反映的說話人生理及行為的語音特征參數(shù),以此來自動(dòng)鑒別說話人的身份。本文研究的是基于矢量量化的說話人識(shí)別。本文采用矢量量化的模板訓(xùn)練方法,設(shè)計(jì)了一個(gè)基于矢量量化的與文本無關(guān)的說話人識(shí)別系統(tǒng),主要工作如下:(1)語音庫的建立,語音庫是由本人在背景噪聲相對(duì)小的環(huán)境下自行錄制的漢語普通話語音數(shù)據(jù)庫。使用Cool Edit Pro2.1軟件錄制,設(shè)置采樣頻率為8kHz、量化精度為16bit,信道選擇單聲道混合,該語音庫由30名男性和16名女性的語音組成,并截取10s用于訓(xùn)練,截取5s用于測(cè)試。(2)闡述語音信號(hào)的前期處理工作,主要對(duì)語音信號(hào)進(jìn)行預(yù)加重、分幀加窗和端點(diǎn)檢測(cè),并對(duì)語音信號(hào)短時(shí)域的特征函數(shù):短時(shí)能量函數(shù)、短時(shí)平均過零率進(jìn)行了分析。然后介紹了端點(diǎn)檢測(cè)的三個(gè)方法:雙門限法、譜減法、譜熵法,對(duì)三種端點(diǎn)檢測(cè)方法作仿真分析,針對(duì)雙門限端點(diǎn)檢測(cè)方法中存在的漏檢現(xiàn)象進(jìn)行了改進(jìn),改進(jìn)后的算法有效地避免了漏檢問題。(3)接著對(duì)常用的語音信號(hào)的特征參數(shù)進(jìn)行介紹和研究,重點(diǎn)分析了線性預(yù)測(cè)系數(shù)(Linear Prediction Coefficient)、線性預(yù)測(cè)倒譜系數(shù)(Linear Prediction Cepstral Coefficients, LPCC)和梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficients, MFCC)及其提取方法,本文選用的是MFCC。之后重點(diǎn)分析了矢量量化的原理、過程及算法,針對(duì)量化過程進(jìn)行了改進(jìn),即采用多級(jí)矢量量化的方法。(4)最后在Matlab平臺(tái)下,設(shè)計(jì)與文本無關(guān)的說話人識(shí)別系統(tǒng),在量化過程中采用多級(jí)矢量量化,測(cè)試了自行錄制的46個(gè)說話人的語音庫,得到了較高的識(shí)別率。
【關(guān)鍵詞】:說話人識(shí)別 矢量量化 線性預(yù)測(cè)系數(shù) 線性預(yù)測(cè)倒譜系數(shù) 梅爾頻率倒譜系數(shù)
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-9
- 第一章 緒論9-17
- 1.1 語音數(shù)字信號(hào)處理概述9-10
- 1.2 說話人識(shí)別技術(shù)10-13
- 1.2.1 說話人識(shí)別研究的背景及意義10-11
- 1.2.2 說話人識(shí)別的研究歷史和現(xiàn)狀11-13
- 1.3 說話人識(shí)別概述13-15
- 1.3.1 基本概念13
- 1.3.2 說話人識(shí)別的分類13-15
- 1.4 論文的研究工作和內(nèi)容安排15-17
- 1.4.1 研究工作15
- 1.4.2 內(nèi)容安排15-17
- 第二章 語音信號(hào)的數(shù)字化處理17-27
- 2.1 語音信號(hào)的獲取17-18
- 2.1.1 語音的產(chǎn)生17
- 2.1.2 語音信號(hào)的數(shù)字化和采集17-18
- 2.2 語音信號(hào)的數(shù)學(xué)模型18-21
- 2.2.1 激勵(lì)模型18-20
- 2.2.2 聲道模型20-21
- 2.2.3 輻射模型21
- 2.3 語音信號(hào)短時(shí)域內(nèi)的特征函數(shù)21-25
- 2.3.1 短時(shí)平均能量21-24
- 2.3.2 短時(shí)平均過零率24-25
- 2.4 本章小結(jié)25-27
- 第三章 語音信號(hào)的端點(diǎn)檢測(cè)和特征提取27-42
- 3.1 語音信號(hào)的端點(diǎn)檢測(cè)27
- 3.1.1 端點(diǎn)檢測(cè)的概念27
- 3.1.2 端點(diǎn)檢測(cè)的應(yīng)用27
- 3.2 常用的幾種端點(diǎn)檢測(cè)方法27-36
- 3.2.1 雙門限檢測(cè)方法及其改進(jìn)方法27-33
- 3.2.2 譜減法33-34
- 3.2.3 譜熵法34-36
- 3.3 語音信號(hào)的特征參數(shù)提取36-41
- 3.3.1 線性預(yù)測(cè)系數(shù)36-38
- 3.3.2 線性預(yù)測(cè)倒譜系數(shù)38-39
- 3.3.3 梅爾頻率倒譜系數(shù)39-41
- 3.4 本章小結(jié)41-42
- 第四章 說話人識(shí)別模板訓(xùn)練方法42-50
- 4.1 說話人識(shí)別的基本方法42-43
- 4.2 矢量量化在說話人識(shí)別中的應(yīng)用43-49
- 4.2.1 矢量量化的原理43-44
- 4.2.2 矢量量化的過程44-46
- 4.2.3 矢量量化的失真測(cè)度46
- 4.2.4 Linde-Buzo-Gray(LBG)算法46-47
- 4.2.5 多級(jí)矢量量化47-49
- 4.3 本章小結(jié)49-50
- 第五章 基于矢量量化的說話人識(shí)別系統(tǒng)的實(shí)現(xiàn)50-60
- 5.1 語音信號(hào)的采集和前期處理50-55
- 5.1.1 實(shí)驗(yàn)中信號(hào)的采集50-51
- 5.1.2 語音信號(hào)的前期處理51-55
- 5.2 特征參數(shù)的實(shí)際提取55
- 5.3 碼本的生成及失真測(cè)度55-56
- 5.3.1 碼本的生成55-56
- 5.3.2 失真測(cè)度56
- 5.4 實(shí)驗(yàn)結(jié)果56-60
- 第六章 總結(jié)與展望60-62
- 6.1 總結(jié)60
- 6.2 展望60-62
- 參考文獻(xiàn)62-66
- 致謝66
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 石艷;王曉曄;;新穎檢測(cè)法在說話人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說話人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期
4 單進(jìn);;說話人識(shí)別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期
6 謝建勛;;淺談?wù)f話人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期
7 安茂波;劉建;;一個(gè)快速說話人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識(shí)別綜述[J];電子科技;2012年06期
9 武光利;;說話人識(shí)別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識(shí)別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識(shí)別[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識(shí)別[A];第七屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識(shí)別中的應(yīng)用研究[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識(shí)別中的應(yīng)用[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識(shí)別的說話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年
10 張晶;董金明;馮文全;;說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議專刊[C];2008年
中國重要報(bào)紙全文數(shù)據(jù)庫 前2條
1 汪永安;科大訊飛說話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年
2 吳長(zhǎng)鋒;科大訊飛勇奪說話人識(shí)別國際大賽第一[N];科技日?qǐng)?bào);2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年
2 別凡虎;說話人識(shí)別中區(qū)分性問題的研究[D];清華大學(xué);2015年
3 陸偉;基于缺失特征的文本無關(guān)說話人識(shí)別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
4 劉鏑;說話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年
5 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
6 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年
7 邱政權(quán);在噪聲環(huán)境下的說話人識(shí)別[D];華南理工大學(xué);2007年
8 郭武;復(fù)雜信道下的說話人識(shí)別[D];中國科學(xué)技術(shù)大學(xué);2007年
9 錢博;基于漢語元音映射的說話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年
10 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說話人識(shí)別[D];電子科技大學(xué);2008年
2 任舒彬;面向手持應(yīng)用的說話人識(shí)別算法研究[D];浙江大學(xué);2006年
3 申志生;文本相關(guān)說話人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
4 汪q
本文編號(hào):327863
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/327863.html