基于ARM的說話人識別系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于ARM的說話人識別系統(tǒng)的設(shè)計與實現(xiàn)
更多相關(guān)文章: 說話人識別系統(tǒng) ARM 端點檢測 特征提取 Linux
【摘要】:目前的說話人識別系統(tǒng)普遍采用PC機或者服務(wù)器的形式作為系統(tǒng)的工作平臺,這種方式不可避免地存在體積大、功耗高、不便攜和實用性低等問題,使得說話人識別系統(tǒng)至今無法普及。針對這樣的問題,本文設(shè)計并實現(xiàn)了一種基于ARM的便攜式說話人識別系統(tǒng)。本文對說話人識別系統(tǒng)的基本算法進(jìn)行了深入的研究分析與改進(jìn),提出了基于時頻參數(shù)融合的自適應(yīng)端點檢測算法,提高了端點檢測的準(zhǔn)確率和抗噪性,解決了常用端點檢測算法在噪聲環(huán)境中不能有效地分割詞語的問題;還提出了基于Fisher比的Bark小波包變換的特征提取算法,明顯提高了系統(tǒng)的識別率和魯棒性,解決了MFCC特征參數(shù)在噪聲環(huán)境中識別率低的問題。本文采用OK6410開發(fā)板作為硬件平臺,并移植Linux操作系統(tǒng)作為軟件平臺,在此基礎(chǔ)上設(shè)計軟件框架。首先移植本文研究的說話人識別算法,實現(xiàn)算法各部分功能;其次在硬件平臺上實現(xiàn)語音信號的采集,采集的語音數(shù)據(jù)經(jīng)過特征提取算法獲得Fisher比Bark小波包倒譜系數(shù)(FWBCC),使用VQ建立模型,采用歐式距離計算出識別測試模板與模板庫中所有模板的誤差,找出誤差最小的模板作為識別結(jié)果;最后在QT用戶界面上顯示和播報識別結(jié)果,并將整個系統(tǒng)移植到硬件平臺上進(jìn)行測試。測試表明,系統(tǒng)達(dá)到了預(yù)期的設(shè)計目標(biāo),具有較好的便攜性、準(zhǔn)確性和魯棒性,為實際生活中的密碼支付提供了一種新的方案。
【關(guān)鍵詞】:說話人識別系統(tǒng) ARM 端點檢測 特征提取 Linux
【學(xué)位授予單位】:西安工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要3-4
- Abstract4-7
- 1 緒論7-11
- 1.1 選題背景7
- 1.2 國內(nèi)外發(fā)展現(xiàn)狀7-8
- 1.3 說話人識別系統(tǒng)概述8-9
- 1.3.1 說話人識別系統(tǒng)的原理8
- 1.3.2 說話人識別系統(tǒng)的分類8-9
- 1.4 課題研究內(nèi)容9
- 1.5 論文組織結(jié)構(gòu)與安排9-11
- 2 說話人識別系統(tǒng)的基本算法及其改進(jìn)11-35
- 2.1 說話人識別系統(tǒng)的基本算法11-20
- 2.1.1 預(yù)處理11-13
- 2.1.2 端點檢測13-15
- 2.1.3 特征提取15-17
- 2.1.4 模式匹配17-20
- 2.2 基于時頻參數(shù)融合的自適應(yīng)端點檢測算法20-26
- 2.2.1 算法改進(jìn)思路20
- 2.2.2 算法實現(xiàn)流程20-24
- 2.2.3 算法驗證與分析24-26
- 2.3 基于Fisher比的Bark小波包變換的特征提取算法26-35
- 2.3.1 算法改進(jìn)思路26-27
- 2.3.2 算法實現(xiàn)流程27-31
- 2.3.3 算法驗證與分析31-35
- 3 說話人識別系統(tǒng)的平臺設(shè)計35-55
- 3.1 系統(tǒng)硬件平臺設(shè)計35-40
- 3.1.1 說話人識別系統(tǒng)硬件設(shè)計35-36
- 3.1.2 嵌入式處理器的選擇36
- 3.1.3 開發(fā)板簡介36-37
- 3.1.4 音頻接口設(shè)計37-40
- 3.2 系統(tǒng)開發(fā)流程40-41
- 3.2.1 交叉開發(fā)模式40
- 3.2.2 嵌入式Linux系統(tǒng)開發(fā)流程40-41
- 3.3 主機開發(fā)環(huán)境搭建41-45
- 3.3.1 制作安裝交叉編譯工具鏈41-44
- 3.3.2 安裝配置NFS服務(wù)44-45
- 3.4 目標(biāo)機開發(fā)環(huán)境搭建45-55
- 3.4.1 系統(tǒng)引導(dǎo)程序的移植45-47
- 3.4.2 嵌入式Linux內(nèi)核的移植47-51
- 3.4.3 構(gòu)建Linux根文件系統(tǒng)51-55
- 4 說話人識別系統(tǒng)的實現(xiàn)55-63
- 4.1 系統(tǒng)設(shè)計目標(biāo)與架構(gòu)55
- 4.1.1 設(shè)計目標(biāo)55
- 4.1.2 設(shè)計架構(gòu)55
- 4.2 系統(tǒng)界面設(shè)計55-56
- 4.3 系統(tǒng)軟件模塊設(shè)計和應(yīng)用程序流程56-59
- 4.3.1 語音信號采集播放模塊56-57
- 4.3.2 語音合成模塊57-58
- 4.3.3 應(yīng)用程序的主要流程58-59
- 4.4 系統(tǒng)測試59-63
- 4.4.1 系統(tǒng)測試過程59-60
- 4.4.2 測試結(jié)果與分析60-63
- 5 結(jié)論63-65
- 參考文獻(xiàn)65-69
- 附錄A Bark頻率群表69-71
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文71-72
- 致謝72
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 石艷;王曉曄;;新穎檢測法在說話人識別技術(shù)中的應(yīng)用[J];現(xiàn)代計算機(專業(yè)版);2008年07期
2 劉雪燕;張娜;袁寶玲;;說話人識別綜述[J];電腦知識與技術(shù);2009年01期
3 邱政權(quán);范小春;王俊年;;基于動態(tài)環(huán)境下的說話人識別[J];科學(xué)技術(shù)與工程;2010年02期
4 單進(jìn);;說話人識別技術(shù)研究[J];科技資訊;2010年21期
5 申志生;于明;;說話人識別算法的定點DSP實現(xiàn)[J];單片機與嵌入式系統(tǒng)應(yīng)用;2011年03期
6 謝建勛;;淺談?wù)f話人識別技術(shù)[J];電腦知識與技術(shù);2011年11期
7 安茂波;劉建;;一個快速說話人識別系統(tǒng)的設(shè)計和實現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期
8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說話人識別綜述[J];電子科技;2012年06期
9 武光利;;說話人識別方法概述[J];硅谷;2012年19期
10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說話人識別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鮑福良;方志剛;徐潔;;說話人識別綜述[A];第六屆全國信息獲取與處理學(xué)術(shù)會議論文集(2)[C];2008年
2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說話人識別[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無關(guān)說話人識別[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類算法及其在說話人識別中的應(yīng)用研究[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說話人識別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
6 戴紅霞;趙力;;文本無關(guān)說話人識別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會論文集[C];2007年
7 陳聯(lián)武;郭武;戴禮榮;;說話人識別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國人機語音通訊學(xué)術(shù)會議論文集(一)[C];2011年
8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說話人識別中的應(yīng)用[A];第十屆全國信號處理學(xué)術(shù)年會(CCSP-2001)論文集[C];2001年
9 吳麗麗;;基于仿生模式識別的說話人識別學(xué)習(xí)模型研究[A];第二屆中國科學(xué)院博士后學(xué)術(shù)年會暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會議程序冊[C];2010年
10 張晶;董金明;馮文全;;說話人識別系統(tǒng)研究與實現(xiàn)[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議專刊[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 汪永安;科大訊飛說話人識別技術(shù)世界領(lǐng)先[N];安徽日報;2008年
2 吳長鋒;科大訊飛勇奪說話人識別國際大賽第一[N];科技日報;2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 單振宇;情感說話人識別及其解決方法的研究[D];浙江大學(xué);2010年
2 別凡虎;說話人識別中區(qū)分性問題的研究[D];清華大學(xué);2015年
3 陸偉;基于缺失特征的文本無關(guān)說話人識別魯棒性研究[D];中國科學(xué)技術(shù)大學(xué);2008年
4 劉鏑;說話人識別中信息融合算法的研究[D];北京交通大學(xué);2011年
5 付中華;說話人識別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年
6 林琳;基于模糊聚類與遺傳算法的說話人識別理論研究及應(yīng)用[D];吉林大學(xué);2007年
7 邱政權(quán);在噪聲環(huán)境下的說話人識別[D];華南理工大學(xué);2007年
8 郭武;復(fù)雜信道下的說話人識別[D];中國科學(xué)技術(shù)大學(xué);2007年
9 錢博;基于漢語元音映射的說話人識別技術(shù)研究[D];南京理工大學(xué);2007年
10 姜濤;網(wǎng)絡(luò)環(huán)境下說話人識別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 叢菡菡;基于支持相量機的穩(wěn)鍵說話人識別[D];電子科技大學(xué);2008年
2 任舒彬;面向手持應(yīng)用的說話人識別算法研究[D];浙江大學(xué);2006年
3 申志生;文本相關(guān)說話人識別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
4 汪q,
本文編號:715984
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/715984.html