基于FPGA技術(shù)的說話人識別系統(tǒng)的設(shè)計
本文關(guān)鍵詞:基于FPGA技術(shù)的說話人識別系統(tǒng)的設(shè)計,由筆耕文化傳播整理發(fā)布。
【摘要】:說話人識別是通過對說話人所發(fā)出的語音進行分析和個性特征參數(shù)的提取,自動地判斷該說話人是否在所登記的模板庫里,以及對該說話人的身份進行驗證。目前,說話人識別憑借其與眾不同的優(yōu)勢具有較大的市場應(yīng)用價值和廣泛的市場應(yīng)用前景。FPGA器件可重復(fù)編程這一特性有利于日后系統(tǒng)的不斷維護和升級,此外,FPGA具有高性能的并行數(shù)據(jù)處理的功能,能滿足市場對系統(tǒng)實時性的要求,所以本文采用FPGA技術(shù)來實現(xiàn)說話人識別系統(tǒng)的硬件設(shè)計。本文首先對說話人識別的算法進行研究,主要有對采集的語音信號進行預(yù)處理、MFCC特征參數(shù)提取、VQ模式識別。在傳統(tǒng)的算法研究的基礎(chǔ)上,本文在端點檢測算法中用短時平均幅度代替短時能量,從而更準確地截取了有效音段,同時在對MFCC個性特征參數(shù)提取時采用了基于隨機共振理論的方法,有效地提高了系統(tǒng)的識別率。說話人識別算法的仿真在Matlab平臺上實現(xiàn),并把Matlab的仿真結(jié)果保存在SD卡中,方便與Modelsim仿真結(jié)果的對比。建立一個說話人識別系統(tǒng)分為訓(xùn)練階段和識別階段,其中識別階段在DE2開發(fā)板上實現(xiàn),本文采用的芯片是Altera公司的Cyclone II系列芯片EP2C35F672。通過對FPGA芯片結(jié)構(gòu)特點和編程邏輯的了解,針對說話人識別算法,采用自頂向下的模塊設(shè)計原則,把說話人識別系統(tǒng)分為預(yù)加重模塊、分幀加窗模塊、端點檢測模塊、MFCC特征參數(shù)提取模塊、VQ模塊和判決模塊,其中MFCC特征參數(shù)提取模塊分為快速傅里葉變換FFT模塊、功率譜模塊、Mel濾波器組模塊、對數(shù)運算模塊Ln、離散余弦變換模塊DCT。設(shè)計并實現(xiàn)了各個處理模塊,對各個設(shè)計模塊采用Modelsim仿真工具進行仿真并且對其進行功能驗證。設(shè)計了程序控制模塊NIOS II,結(jié)合SOPC的特點,把系統(tǒng)實現(xiàn)的算法和各個接口模塊都整合到SOPC系統(tǒng)上,在SOPC Bulider中設(shè)置好總線連接關(guān)系,配置好內(nèi)存空間和啟動地址,上電后程序?qū)隨DRAM中運行。本文采集了20個人的語音,分別建立了模板訓(xùn)練語音庫和說話人測試語音庫,從20個模板庫里選取5個作為硬件識別系統(tǒng)的參考模板,然后通過Modelsim對該20人的測試語音進行識別仿真,并把仿真結(jié)果與Matlab仿真結(jié)果進行對比,發(fā)現(xiàn)二者雖然有誤差但是基本上可以忽略不計,從而驗證了該說話人識別系統(tǒng)的功能,實現(xiàn)了說話人識別系統(tǒng)的可行性。對于一個說話人識別系統(tǒng)來說,識別率是非常重要的。本文雖然實現(xiàn)了一套實時可用的基于FPGA技術(shù)的說話人識別系統(tǒng),但是系統(tǒng)的識別率并不是很高,有些問題還需要進一步的研究和探索。比如系統(tǒng)已經(jīng)提取了比較有效的MFCC特征參數(shù),但在噪音環(huán)境下對識別率的影響是很大的,還有就是我們選擇特征矢量的時候,選擇的方法很多,是否可以通過選擇不同的特征參數(shù)相結(jié)合來提高系統(tǒng)的識別率還有待進一步研究。
【關(guān)鍵詞】:說話人識別 FPGA MFCC特征提取 NOISⅡ 識別率
【學(xué)位授予單位】:成都理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN791;TN912.34
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 引言10-16
- 1.1 選題依據(jù)和課題研究背景10-11
- 1.2 國內(nèi)外研究和發(fā)展現(xiàn)狀11-13
- 1.3 課題研究的目的和意義13-14
- 1.4 主要研究內(nèi)容及預(yù)期成果14-16
- 第2章 說話人識別的算法研究16-27
- 2.1 語音信號預(yù)處理17-21
- 2.1.1 預(yù)加重17-18
- 2.1.2 分幀加窗18
- 2.1.3 端點檢測18-21
- 2.2 MFCC特征參數(shù)的提取21-23
- 2.3 碼本生成算法23-26
- 2.3.1 矢量量化原理23-24
- 2.3.2 矢量量化的失真測度24-25
- 2.3.3 最佳矢量量化器的設(shè)計25-26
- 2.3.4 LBG算法26
- 2.4 本章小結(jié)26-27
- 第3章 系統(tǒng)的總體設(shè)計27-32
- 3.1 系統(tǒng)的硬件平臺27-29
- 3.2 系統(tǒng)電路總體框架29-31
- 3.3 本章小結(jié)31-32
- 第4章 系統(tǒng)的硬件和軟件設(shè)計32-53
- 4.1 系統(tǒng)的硬件設(shè)計32-39
- 4.1.1 語音信號采集模塊32-34
- 4.1.2 語音數(shù)據(jù)緩存模塊34-35
- 4.1.3 參考數(shù)據(jù)存儲模塊35-36
- 4.1.4 LCD液晶顯示模塊36-37
- 4.1.5 NOIS II控制處理模塊37
- 4.1.6 FPGA配置電路37-39
- 4.2 系統(tǒng)的軟件設(shè)計39-44
- 4.2.1 語音信號預(yù)處理40-42
- 4.2.2 MFCC特征參數(shù)提取42-43
- 4.2.3 說話人識別系統(tǒng)碼本庫的建立43-44
- 4.3 系統(tǒng)各功能模塊的設(shè)計與實現(xiàn)44-52
- 4.3.1 語音預(yù)處理模塊44-47
- 4.3.2 MFCC特征提取模塊47-51
- 4.3.3 VQ模塊設(shè)計51-52
- 4.3.4 判決模塊52
- 4.4 本章小結(jié)52-53
- 第5章 系統(tǒng)的仿真測試分析53-57
- 5.1 系統(tǒng)的總體設(shè)計53-54
- 5.2 系統(tǒng)識別結(jié)果分析54-55
- 5.3 本章小結(jié)55-57
- 總結(jié)與展望57-59
- 總結(jié)57-58
- 展望58-59
- 致謝59-60
- 參考文獻60-62
- 攻讀學(xué)位期間取得學(xué)術(shù)成果62
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前9條
1 何偉;胡又文;張玲;陳方泉;;基于FPGA的說話人識別系統(tǒng)設(shè)計與實現(xiàn)[J];重慶大學(xué)學(xué)報(自然科學(xué)版);2007年09期
2 趙貽玖;王厚軍;戴志堅;;基于NIOS處理器的數(shù)字示波表設(shè)計[J];儀器儀表學(xué)報;2006年S2期
3 許琦;;基于FPGA的電子密碼鎖的設(shè)計[J];科技信息(學(xué)術(shù)研究);2006年10期
4 馬志欣;王宏;李鑫;;語音識別技術(shù)綜述[J];昌吉學(xué)院學(xué)報;2006年03期
5 SAENGHAENGTHAM Nida;KANONGCHAIYOS Pizzanu;;Using LBG quantization for particle-based collision detection algorithm[J];Journal of Zhejiang University Science A(Science in Engineering);2006年07期
6 李連華;;基于FPGA的電子密碼鎖設(shè)計[J];中國科技信息;2006年01期
7 江太輝;基于VQ的說話人識別算法與實驗[J];計算機工程與應(yīng)用;2004年09期
8 邵央,劉丙哲,李宗葛;基于MFCC和加權(quán)矢量量化的說話人識別系統(tǒng)[J];計算機工程與應(yīng)用;2002年05期
9 韓雁,陳利華;說話人計算機識別系統(tǒng)的設(shè)計與實現(xiàn)[J];浙江大學(xué)學(xué)報(工學(xué)版);2001年02期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 陸哲明;矢量量化編碼算法及應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2001年
本文關(guān)鍵詞:基于FPGA技術(shù)的說話人識別系統(tǒng)的設(shè)計,,由筆耕文化傳播整理發(fā)布。
本文編號:296260
本文鏈接:http://sikaile.net/kejilunwen/dianzigongchenglunwen/296260.html