基于嵌入式平臺(tái)的說話人識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)

發(fā)布時(shí)間：2017-08-28 19:48

本文關(guān)鍵詞：基于嵌入式平臺(tái)的說話人識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)

【摘要】：說話人識(shí)別系統(tǒng)通過語音設(shè)備采集語音信號(hào),然后對(duì)語音信號(hào)經(jīng)過預(yù)處理并進(jìn)行特征參數(shù)的提取,最后經(jīng)過說話人識(shí)別的算法鑒別出說話人的身份。作為當(dāng)今的一個(gè)研究熱點(diǎn),說話人識(shí)別有其廣泛的應(yīng)用前景,特別是在公安司法、金融以及信息服務(wù)等領(lǐng)域。針對(duì)目前說話人識(shí)別算法復(fù)雜度高,魯棒性不強(qiáng)的問題,本文主要研究了說話人識(shí)別算法,并從實(shí)用的角度出發(fā),設(shè)計(jì)并實(shí)現(xiàn)了基于嵌入式linux的說話人識(shí)別系統(tǒng)。本課題選用三星S5PV210作為核心處理器,并基于嵌入式linux系統(tǒng)搭建嵌入式平臺(tái)。實(shí)現(xiàn)使用u-boot開發(fā)bootloader引導(dǎo)程序,對(duì)linux-3.0.8的內(nèi)核進(jìn)行裁剪和編譯生成內(nèi)核鏡像文件uImage,使用nfs起根文件系統(tǒng),最后的應(yīng)用程序主要使用QT來開發(fā)最終的說話人識(shí)別的界面。在說話人識(shí)別系統(tǒng)實(shí)現(xiàn)方面,課題利用ALSA函數(shù)庫實(shí)現(xiàn)語音的采集,實(shí)現(xiàn)對(duì)語音信號(hào)的預(yù)處理并且對(duì)處理過的語音信號(hào)進(jìn)行特征參數(shù)的提取,最終再利用矢量量化(VQ)和高斯混合模型(GMM)的原理實(shí)現(xiàn)說話人識(shí)別系統(tǒng),并且通過對(duì)其他的說話人識(shí)別系統(tǒng)比如隱馬爾可夫(HMM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)加深對(duì)說話人識(shí)別的認(rèn)識(shí)和理解。同時(shí)本文使用頻譜時(shí)間接受域(STRF)特征提取,該算法比Mel頻率倒譜系數(shù)(MFCC)更符合人耳特性,從而提高系統(tǒng)的魯棒性,但由于其識(shí)別率較低,因此可以融合MFCC,從而提高系統(tǒng)的識(shí)別率。以此同時(shí)對(duì)GMM模型進(jìn)行改進(jìn),使用改進(jìn)的EM算法和改進(jìn)的遺傳算法,最終將改進(jìn)的STRF運(yùn)用在改進(jìn)的GMM模型上,實(shí)現(xiàn)本文算法目的。通過一系列的移植操作,將PC上實(shí)現(xiàn)的說話人識(shí)別系統(tǒng)移植到開發(fā)板上,實(shí)現(xiàn)其真正的實(shí)際應(yīng)用。基于嵌入式系統(tǒng)的說話人識(shí)別系統(tǒng)具有實(shí)時(shí)性,專用性以及良好的用戶界面等優(yōu)點(diǎn),為其在以后市場(chǎng)的使用奠定了實(shí)際基礎(chǔ)。
【關(guān)鍵詞】：嵌入式linux系統(tǒng) 說話人識(shí)別系統(tǒng) 矢量量化 高斯混合模型 STRF特征提取 改進(jìn)的GMM模型 系統(tǒng)移植
【學(xué)位授予單位】：東南大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2016
【分類號(hào)】：TN912.34
【目錄】：

摘要5-6
Abstract6-10
第一章緒論10-16
1.1 說話人識(shí)別研究背景與意義10
1.2 說話人識(shí)別的分類10-11
1.3 說話人識(shí)別的發(fā)展歷程11-12
1.4 說話人識(shí)別存在的問題和解決方案12
1.5 嵌入式linux系統(tǒng)12-13
1.5.1 嵌入式系統(tǒng)概述12-13
1.5.2 嵌入式系統(tǒng)開發(fā)模式13
1.5.3 硬件平臺(tái)設(shè)計(jì)13
1.5.4 軟件平臺(tái)設(shè)計(jì)13
1.6 嵌入式技術(shù)在說話人識(shí)別中的應(yīng)用13-14
1.7 本論文的內(nèi)容安排14-16
第二章嵌入式linux系統(tǒng)的設(shè)計(jì)和關(guān)鍵技術(shù)16-32
2.1 嵌入式linux系統(tǒng)的概述16
2.2 嵌入式系統(tǒng)的硬件設(shè)計(jì)16-17
2.3 嵌入式系統(tǒng)的軟件設(shè)計(jì)17-30
2.3.1 Linux開發(fā)環(huán)境的安裝17-19
2.3.2 Bootloader引導(dǎo)程序19-22
2.3.3 Linux內(nèi)核的編譯22-24
2.3.4 制作根文件系統(tǒng)24-26
2.3.5 nfs起根文件系統(tǒng)26-27
2.3.6 QT開發(fā)27-30
2.4 Linux內(nèi)核鏡像燒寫30-31
2.5 本章小結(jié)31-32
第三章說話人識(shí)別系統(tǒng)的基本原理和算法32-52
3.1 說話人識(shí)別的基本原理32-33
3.1.1 語音輸入32
3.1.2 預(yù)處理32
3.1.3 特征提取32
3.1.4 識(shí)別方法32-33
3.2 語音的發(fā)聲原理33-34
3.3 語音信號(hào)的采集34-36
3.3.1 數(shù)字音頻34
3.3.2 ALSA聲卡驅(qū)動(dòng)34-35
3.3.3 ALSA應(yīng)用程序編程35-36
3.4 預(yù)處理36-39
3.4.1 短時(shí)能量37-38
3.4.2 短時(shí)平均過零率38
3.4.3 端點(diǎn)檢測(cè)38-39
3.5 特征參數(shù)39-46
3.5.1 概述39
3.5.2 基音周期39-41
3.5.3 Mel頻率倒譜系數(shù)(MFCC)41-43
3.5.4 線性預(yù)測(cè)倒譜系數(shù)(LPCC)43-46
3.6 說話人識(shí)別的方法46-51
3.6.1 概述46
3.6.2 矢量量化方法(VQ)46-47
3.6.3 隱馬爾可夫模型方法(HMM)47-49
3.6.4 高斯混合模型方法(GMM)49-50
3.6.5 人工神經(jīng)網(wǎng)絡(luò)方法(ANN)50-51
3.7 本章小結(jié)51-52
第四章基于魯棒性的說話人識(shí)別算法研究與實(shí)現(xiàn)52-66
4.1 語譜圖的介紹52-53
4.2 基于改進(jìn)的頻譜時(shí)間接受域(STRF)特征提取53-58
4.2.1 聽覺系統(tǒng)53-54
4.2.2 STRFs概述54-55
4.2.3 早期聽覺系統(tǒng)模型55-56
4.2.4 初級(jí)聽覺皮質(zhì)(A1)模型56-58
4.2.5 基于STRF的特征提取58
4.3 基于改進(jìn)的GMM的說話人識(shí)別58-63
4.3.1 改進(jìn)的EM算法58-59
4.3.2 遺傳算法59-60
4.3.3 改進(jìn)的遺傳算法60-62
4.3.4 將改進(jìn)的EM算法應(yīng)用于GMM模型62-63
4.3.5 將改進(jìn)的遺傳算法應(yīng)用于GMM模型63
4.4 將改進(jìn)的STRF應(yīng)用于改進(jìn)GMM的說話人識(shí)別63-64
4.5 本章小節(jié)64-66
第五章基于QT的說話人識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)66-72
5.1 說話入識(shí)別系統(tǒng)實(shí)現(xiàn)66-68
5.1.1 編譯過程66-67
5.1.2 交叉編譯與下載67-68
5.2 硬件實(shí)現(xiàn)68-71
5.3 本章小結(jié)71-72
第六章總結(jié)與展望72-74
6.1 總結(jié)72
6.2 展望72-74
致謝74-76
參考文獻(xiàn)76-82
攻讀碩士學(xué)位期間發(fā)表的論文82

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫前1條

1 張學(xué)工;關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J];自動(dòng)化學(xué)報(bào);2000年01期

，

本文編號(hào)：749164

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/749164.html

上一篇：雷電探測(cè)系統(tǒng)中的信號(hào)預(yù)處理及定位算法比較研究
下一篇：基于載波相位的多通道偽距測(cè)量方法的研究與實(shí)現(xiàn)

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于嵌入式平臺(tái)的說話人識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)