天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于MFCC和PSO-BP神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng)

發(fā)布時(shí)間:2017-06-12 13:10

  本文關(guān)鍵詞:基于MFCC和PSO-BP神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng),由筆耕文化傳播整理發(fā)布。


【摘要】:說話人識(shí)別是一項(xiàng)隨著數(shù)字化信息發(fā)展起來的生物識(shí)別技術(shù),基于人工神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別技術(shù)也成為生物識(shí)別技術(shù)領(lǐng)域中重要的研究熱點(diǎn)之一。基于人工神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別技術(shù),相較于傳統(tǒng)的基于線性系統(tǒng)理論的技術(shù),具有非線性分布式并行處理、較強(qiáng)的模式分類能力、優(yōu)良的不完全信息的魯棒性等特點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征的網(wǎng)絡(luò)模型,在信息模糊化等說話人識(shí)別技術(shù)相關(guān)問題上具有自主學(xué)習(xí)的優(yōu)勢(shì)。本文首先對(duì)說話人識(shí)別技術(shù)和人工神經(jīng)網(wǎng)絡(luò)及其優(yōu)化算法的發(fā)展、研究現(xiàn)狀作了介紹,并從語音信號(hào)的預(yù)處理開始分析,對(duì)語音信號(hào)進(jìn)行了預(yù)加重、端點(diǎn)檢測(cè),濾除了說話人語音中的靜音段和噪聲段,為后續(xù)的特征參數(shù)提取提供了有效的語音段。文中還將基于譜減法增強(qiáng)的梅爾倒譜特征參數(shù)(Mel-Frequency Cepstrum Coefficient,MFCC)與傳統(tǒng)的梅爾倒譜參數(shù)特征參數(shù)進(jìn)行了比較,前者在噪聲條件下具有更好的魯棒性。對(duì)于傳統(tǒng)說話人識(shí)別模型需要大量訓(xùn)練數(shù)據(jù),魯棒性差以及存儲(chǔ)空間大等缺陷,本文提出了反向傳播(Back-Propagation,BP)算法網(wǎng)絡(luò)模型。BP網(wǎng)絡(luò)模型能夠隨經(jīng)驗(yàn)不斷改善性能,通過自組織自學(xué)習(xí)自適應(yīng)調(diào)整網(wǎng)絡(luò)模型參數(shù)。本文重點(diǎn)研究了BP神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn),針對(duì)BP神經(jīng)網(wǎng)絡(luò)收斂速度慢、易陷入局部極小等問題,引進(jìn)了粒子群算法(Particle Swarm Optimization,PSO),建立了PSO-BP神經(jīng)網(wǎng)絡(luò)模型。通過粒子群優(yōu)化算法(PSO)來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,可以有效尋求最佳解空間、加快全局搜索。在實(shí)驗(yàn)驗(yàn)證環(huán)節(jié),相對(duì)于傳統(tǒng)說話人識(shí)別模型,基于PSO-BP神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng)的識(shí)別率和訓(xùn)練速度都得到了較大的提高。
【關(guān)鍵詞】:說話人識(shí)別 MFCC特征參數(shù) BP神經(jīng)網(wǎng)絡(luò) 粒子群算法 譜減法語音增強(qiáng)
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34;TP183
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 第一章 緒論8-14
  • 1.1 引言8
  • 1.2 說話人識(shí)別的研究目的與意義8-10
  • 1.3 國(guó)內(nèi)外研究綜述10-11
  • 1.3.1 說話人識(shí)別研究的現(xiàn)狀10
  • 1.3.2 人工神經(jīng)網(wǎng)絡(luò)研究的現(xiàn)狀10-11
  • 1.3.3 PSO算法研究的現(xiàn)狀11
  • 1.4 本文研究?jī)?nèi)容11-13
  • 1.4.1 反向傳播(BP)神經(jīng)網(wǎng)絡(luò)12
  • 1.4.2 粒子群算法(PSO)12
  • 1.4.3 基于PSO-BP的網(wǎng)絡(luò)模型12-13
  • 1.5 本文組織結(jié)構(gòu)13-14
  • 第二章 說話人識(shí)別預(yù)處理和特征提取14-24
  • 2.1 說話人識(shí)別預(yù)處理14-16
  • 2.2 說話人識(shí)別特征提取16-21
  • 2.3 基于譜減法增強(qiáng)的MFCC特征參數(shù)提取21-23
  • 2.3.1 基于譜減法的語音增強(qiáng)21-22
  • 2.3.2 改進(jìn)后的MFCC特征參數(shù)提取22-23
  • 2.4 本章小結(jié)23-24
  • 第三章 PSO-BP網(wǎng)絡(luò)結(jié)構(gòu)24-38
  • 3.1 人工神經(jīng)網(wǎng)絡(luò)原理24-26
  • 3.1.1 人工神經(jīng)網(wǎng)絡(luò)概念24
  • 3.1.2 人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)24-26
  • 3.1.3 人工神經(jīng)網(wǎng)絡(luò)的分類26
  • 3.2 反向傳播算法(BP算法)26-29
  • 3.2.1 BP算法網(wǎng)絡(luò)模型26-28
  • 3.2.2 BP學(xué)習(xí)算法28-29
  • 3.3 BP算法存在的問題及對(duì)策29-33
  • 3.3.1 BP算法存在的問題29-30
  • 3.3.2 對(duì)策30-33
  • 3.4 粒子群算法起源33-34
  • 3.5 粒子群算法原理34-35
  • 3.6 粒子群算法結(jié)構(gòu)35-37
  • 3.6.1 粒子群算法(PSO)的步驟和流程35-36
  • 3.6.2 設(shè)計(jì)過程中應(yīng)注意的參數(shù)設(shè)置36-37
  • 3.7 本章小結(jié)37-38
  • 第四章 經(jīng)典說話人識(shí)別方法38-49
  • 4.1 說話人識(shí)別原理38
  • 4.2 高斯混合模型(GMM)38-41
  • 4.3 隱馬爾可夫模型(HMM)41-43
  • 4.4 矢量量化模型(VQ)43-47
  • 4.5 本章小結(jié)47-49
  • 第五章 仿真實(shí)驗(yàn)與結(jié)果分析49-63
  • 5.1 系統(tǒng)結(jié)構(gòu)49-50
  • 5.2 具體實(shí)現(xiàn)過程50-56
  • 5.2.1 預(yù)處理過程50-53
  • 5.2.2 特征參數(shù)提取53-55
  • 5.2.3 訓(xùn)練識(shí)別網(wǎng)絡(luò)的設(shè)計(jì)55-56
  • 5.3 實(shí)驗(yàn)結(jié)果分析56-62
  • 5.3.1 噪聲環(huán)境下的系統(tǒng)分析56-58
  • 5.3.2 BP/PSO-BP網(wǎng)絡(luò)性能比較58-60
  • 5.3.3 與經(jīng)典說話人識(shí)別模型的性能比較60-62
  • 5.4 本章小結(jié)62-63
  • 第六章 總結(jié)與展望63-64
  • 參考文獻(xiàn)64-68
  • 附錄1 攻讀碩士學(xué)位期間撰寫的論文68-69
  • 附錄2 攻讀碩士學(xué)位期間申請(qǐng)的專利69-70
  • 附錄3 攻讀碩士學(xué)位期間參加的科研項(xiàng)目70-71
  • 致謝71

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 覃愛娜,韓華;說話人識(shí)別技術(shù)及其在工廠自動(dòng)控制系統(tǒng)中的應(yīng)用[J];長(zhǎng)沙電力學(xué)院學(xué)報(bào)(自然科學(xué)版);2003年02期

2 楊海燕,楊斌,景新幸;說話人識(shí)別技術(shù)在智能家居中的應(yīng)用[J];電聲技術(shù);2004年05期

3 王晶晶,陳中柱,薛文濤,江紅英;一種與文本有關(guān)的說話人識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)仿真;2004年06期

4 戴紅霞,趙力;采用幀概率變換的與文本無關(guān)說話人識(shí)別系統(tǒng)的實(shí)現(xiàn)[J];電聲技術(shù);2004年09期

5 葉蕾,方鵬,楊震;基于因特網(wǎng)的說話人識(shí)別技術(shù)研究[J];南京郵電學(xué)院學(xué)報(bào);2004年03期

6 孫林慧,葉蕾,楊震;說話人識(shí)別中測(cè)試時(shí)長(zhǎng)與識(shí)別率關(guān)系研究[J];計(jì)算機(jī)仿真;2005年05期

7 陸小珊,王俊法,田嵐;音高特征在說話人識(shí)別中的可分性及應(yīng)用研究[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2005年04期

8 芮賢義,俞一彪;基于小波變換的魯棒型特征提取及說話人識(shí)別[J];電路與系統(tǒng)學(xué)報(bào);2005年05期

9 劉雅琴,杜海明;基于矢量量化的說話人識(shí)別[J];洛陽師范學(xué)院學(xué)報(bào);2005年05期

10 陳立偉;趙春暉;姜海麗;;一種基于混合神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng)[J];哈爾濱工程大學(xué)學(xué)報(bào);2005年06期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鮑福良;方志剛;徐潔;;說話人識(shí)別綜述[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識(shí)別[A];第二屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識(shí)別[A];第七屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識(shí)別中的應(yīng)用研究[A];第八屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 戴紅霞;趙力;;文本無關(guān)說話人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說話人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國(guó)人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識(shí)別的說話人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國(guó)科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年

10 張晶;董金明;馮文全;;說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條

1 汪永安;科大訊飛說話人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年

2 吳長(zhǎng)鋒;科大訊飛勇奪說話人識(shí)別國(guó)際大賽第一[N];科技日?qǐng)?bào);2008年

3 新城;小聲音 大前景[N];計(jì)算機(jī)世界;2006年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 單振宇;情感說話人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年

2 陸偉;基于缺失特征的文本無關(guān)說話人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

3 劉鏑;說話人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年

4 俞一彪;基于互信息理論的說話人識(shí)別研究[D];上海大學(xué);2004年

5 付中華;說話人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

6 侯麗敏;基于非線性理論和信息融合的說話人識(shí)別[D];上海大學(xué);2005年

7 林琳;基于模糊聚類與遺傳算法的說話人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

8 邱政權(quán);在噪聲環(huán)境下的說話人識(shí)別[D];華南理工大學(xué);2007年

9 郭武;復(fù)雜信道下的說話人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

10 錢博;基于漢語元音映射的說話人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年


  本文關(guān)鍵詞:基于MFCC和PSO-BP神經(jīng)網(wǎng)絡(luò)的說話人識(shí)別系統(tǒng),,由筆耕文化傳播整理發(fā)布。



本文編號(hào):444130

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/444130.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4eeb3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产亚洲精品俞拍视频福利区| 精品一区二区三区中文字幕| 夫妻性生活一级黄色录像| 日本在线不卡高清欧美| 在线观看免费午夜福利| 免费精品一区二区三区| 人妻少妇久久中文字幕久久| 婷婷激情五月天丁香社区| 国产精品久久熟女吞精| 午夜精品国产精品久久久| 日本特黄特色大片免费观看| 日本欧美一区二区三区高清| 熟女免费视频一区二区| 国产精品内射视频免费| 国产熟女一区二区精品视频| 无套内射美女视频免费在线观看| 欧美熟妇一区二区在线| 不卡中文字幕在线免费看| 精品国产亚洲av久一区二区三区| 国内女人精品一区二区三区| 国产精品不卡免费视频| 亚洲一区二区久久观看| 日韩三级黄色大片免费观看| 亚洲一区在线观看蜜桃| 亚洲国产av精品一区二区| 亚洲深夜精品福利一区| 暴力三级a特黄在线观看| 亚洲一区二区三区在线中文字幕| 国产精品99一区二区三区| 91欧美日韩精品在线| 久久久精品区二区三区| 欧美精品亚洲精品日韩专区| 日本一级特黄大片国产| 国产成人精品一区二区在线看 | 国产免费一区二区不卡| 精品人妻一区二区四区| 欧美亚洲三级视频在线观看| 国产精品熟女乱色一区二区| 欧美不卡午夜中文字幕| 黄片在线免费看日韩欧美| 视频在线观看色一区二区|