基于Xilinx Zynq的說話人識(shí)別的研究與設(shè)計(jì)
發(fā)布時(shí)間:2017-06-07 19:16
本文關(guān)鍵詞:基于Xilinx Zynq的說話人識(shí)別的研究與設(shè)計(jì),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著嵌入式系統(tǒng)和說話人識(shí)別技術(shù)的發(fā)展,基于嵌入式的說話人識(shí)別系統(tǒng)已經(jīng)廣泛應(yīng)用在醫(yī)療服務(wù)、銀行證券、公安司法等領(lǐng)域。近年來,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,使用手機(jī)、平板電腦等手持設(shè)備實(shí)現(xiàn)異地身份驗(yàn)證,語音信號(hào)可能是表征用戶身份的首選特征參數(shù),掀起了一股說話人識(shí)別研究的新熱潮。本文設(shè)計(jì)了基于Xilinx Zynq的與文本無關(guān)的說話人識(shí)別系統(tǒng),為后續(xù)基于移動(dòng)設(shè)備的開發(fā)應(yīng)用奠定基礎(chǔ)。本文的主要工作如下:首先,介紹了語音信號(hào)的采樣量化、預(yù)處理和特征參數(shù)提取方法。詳細(xì)闡述了預(yù)處理的關(guān)鍵技術(shù):預(yù)加重、分幀加窗以及端點(diǎn)檢測(cè);詳細(xì)介紹了特征提取方法MFCC。其次,介紹了高斯混合模型(GMM)的基本原理。具體介紹了運(yùn)用高斯混合模型進(jìn)行參數(shù)訓(xùn)練的期望最大化(EM)算法,參數(shù)訓(xùn)練初始化的k-means算法。闡述了說話人識(shí)別系統(tǒng)訓(xùn)練和識(shí)別的原理,并使用Matlab進(jìn)行了仿真實(shí)驗(yàn)。再次,本文以Xilinx Zynq為硬件平臺(tái),構(gòu)建了嵌入式與文本無關(guān)的說話人識(shí)別系統(tǒng)。通過介紹Xilinx Zynq硬件資源,將系統(tǒng)的軟件架構(gòu)分成兩部分:PC機(jī)輔助軟件及嵌入式識(shí)別軟件,兩者通過NFS文件系統(tǒng)進(jìn)行文件共享。PC機(jī)輔助軟件主要用于GMM模型參數(shù)的訓(xùn)練和識(shí)別算法的驗(yàn)證?紤]到FFT計(jì)算單元的復(fù)雜性,設(shè)計(jì)了Real FFT硬件加速模塊。為包含有Real FFT硬件邏輯的硬件平臺(tái)搭建了嵌入式環(huán)境,這包括添加解析配置文件的u-boot新命令并修改u-boot源碼使其支持多系統(tǒng)引導(dǎo)、修改設(shè)備樹源文件對(duì)Flash進(jìn)行分區(qū)、制作根文件系統(tǒng)并將其編譯至Linux內(nèi)核中。然后設(shè)計(jì)了硬件邏輯的軟件接口。最后,對(duì)說話人識(shí)別系統(tǒng)進(jìn)行了測(cè)試,分析了系統(tǒng)的識(shí)別率以及系統(tǒng)響應(yīng)的實(shí)時(shí)性,并闡述了對(duì)將來工作的展望。
【關(guān)鍵詞】:說話人識(shí)別 高斯混合模型 MFCC Xilinx Zynq
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.34
【目錄】:
- 摘要5-6
- 英文摘要6-11
- 第一章 緒論11-16
- 1.1 研究背景11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-14
- 1.3 論文研究?jī)?nèi)容14
- 1.4 論文組織結(jié)構(gòu)14-16
- 第二章 預(yù)處理與特征提取16-25
- 2.1 語音信號(hào)的產(chǎn)生16
- 2.2 語音信號(hào)預(yù)處理16-19
- 2.2.1 數(shù)字化16-17
- 2.2.2 預(yù)加重17-18
- 2.2.3 分幀加窗18-19
- 2.3 端點(diǎn)檢測(cè)19-22
- 2.3.1 時(shí)域分析20-21
- 2.3.2 雙門限端點(diǎn)檢測(cè)21-22
- 2.4 特征參數(shù)提取22-24
- 2.5 小結(jié)24-25
- 第三章 高斯混合模型25-35
- 3.1 GMM的基本原理25-27
- 3.2 GMM的訓(xùn)練算法27-32
- 3.2.1 EM算法27-31
- 3.2.2 EM算法收斂性的證明31
- 3.2.3 訓(xùn)練數(shù)據(jù)不充分的問題31-32
- 3.3 GMM的初始化32-33
- 3.3.1 高斯分量個(gè)數(shù)M的確定32
- 3.3.2 GMM模型參數(shù)的初始化32-33
- 3.4 GMM的識(shí)別33-34
- 3.5 小結(jié)34-35
- 第四章 系統(tǒng)總體設(shè)計(jì)35-46
- 4.1 軟硬件協(xié)同設(shè)計(jì)基本理論35-37
- 4.1.1 基本概念35
- 4.1.2 設(shè)計(jì)流程35-37
- 4.2 Xilinx Zynq硬件介紹37-43
- 4.2.1 應(yīng)用處理單元APU37
- 4.2.2 片上通用外設(shè)37-39
- 4.2.3 板級(jí)設(shè)備39-41
- 4.2.4 可編程邏輯41-42
- 4.2.5 系統(tǒng)硬件設(shè)計(jì)42-43
- 4.3 系統(tǒng)軟件設(shè)計(jì)43-45
- 4.4 小結(jié)45-46
- 第五章 Real FFT計(jì)算單元的硬件映射46-54
- 5.1 Real FFT計(jì)算單元的控制與數(shù)據(jù)通道46-47
- 5.2 Real FFT計(jì)算單元的設(shè)計(jì)47-52
- 5.2.1 FFT IP核48
- 5.2.2 FFT前端與后端處理48-51
- 5.2.3 Real FFT總體結(jié)構(gòu)與仿真51-52
- 5.3 片上系統(tǒng)的構(gòu)建52-53
- 5.4 小結(jié)53-54
- 第六章 說話人識(shí)別系統(tǒng)的軟件實(shí)現(xiàn)54-80
- 6.1 PC機(jī)輔助軟件的實(shí)現(xiàn)54-63
- 6.1.1 語音采集模塊54-55
- 6.1.2 預(yù)處理模塊55-60
- 6.1.3 GMM訓(xùn)練模塊60-62
- 6.1.4 識(shí)別模塊62-63
- 6.2 嵌入式系統(tǒng)環(huán)境63-73
- 6.2.1 系統(tǒng)搭建63-72
- 6.2.2 系統(tǒng)的啟動(dòng)72-73
- 6.3 嵌入式軟件實(shí)現(xiàn)73-75
- 6.3.1 識(shí)別模塊73-74
- 6.3.2 Real FFT驅(qū)動(dòng)模塊74-75
- 6.4 系統(tǒng)測(cè)試和實(shí)驗(yàn)結(jié)果75-79
- 6.4.1 PC機(jī)輔助軟件的功能測(cè)試76
- 6.4.2 嵌入式系統(tǒng)環(huán)境的功能測(cè)試76-78
- 6.4.3 系統(tǒng)識(shí)別率的測(cè)試78
- 6.4.4 系統(tǒng)響應(yīng)實(shí)時(shí)性的測(cè)試78-79
- 6.5 小結(jié)79-80
- 第七章 總結(jié)與展望80-82
- 7.1 本文總結(jié)80
- 7.2 展望80-82
- 致謝82-83
- 參考文獻(xiàn)83-86
【參考文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 邵寶生;基于LonWorks總線技術(shù)的說話人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D];東華大學(xué);2007年
本文關(guān)鍵詞:基于Xilinx Zynq的說話人識(shí)別的研究與設(shè)計(jì),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):430061
本文鏈接:http://sikaile.net/kejilunwen/wltx/430061.html
最近更新
教材專著