天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 建筑工程論文 >

基于VQ的室內(nèi)說(shuō)話(huà)人識(shí)別及FPGA實(shí)現(xiàn)研究

發(fā)布時(shí)間:2020-05-08 03:36
【摘要】:語(yǔ)音控制作為一種自然、高效的控制方式,隨著智能家居的發(fā)展而受到的重視程度越來(lái)越高。在智能家居的應(yīng)用中,說(shuō)話(huà)人識(shí)別是關(guān)鍵的技術(shù)難題,直接影響人身和財(cái)物的安全性。目前,說(shuō)話(huà)人識(shí)別系統(tǒng)的研究大多是基于電腦平臺(tái)實(shí)現(xiàn)的,時(shí)效性較低,在實(shí)際應(yīng)用中受到限制。本文利用FPGA高性能和低功耗的特點(diǎn),研究了室內(nèi)說(shuō)話(huà)人識(shí)別算法和說(shuō)話(huà)人識(shí)別的硬件實(shí)現(xiàn)。室內(nèi)說(shuō)話(huà)人識(shí)別由語(yǔ)音端點(diǎn)檢測(cè)和矢量量化識(shí)別這兩部分組成。語(yǔ)音端點(diǎn)檢測(cè)是系統(tǒng)實(shí)現(xiàn)的基礎(chǔ),采用能量統(tǒng)計(jì)復(fù)雜度算法來(lái)實(shí)現(xiàn),針對(duì)該算法不適合直接應(yīng)用于硬件這個(gè)問(wèn)題,在語(yǔ)音信號(hào)FFT變換后,本文只根據(jù)前半幀數(shù)據(jù)的譜線(xiàn)能量與其對(duì)數(shù)值即可計(jì)算出一幀數(shù)據(jù)的信息熵,省略了概率密度的計(jì)算過(guò)程,然后根據(jù)信息熵算出統(tǒng)計(jì)復(fù)雜度值,最后結(jié)合語(yǔ)音能量獲得能量統(tǒng)計(jì)復(fù)雜度值。改進(jìn)后的能量統(tǒng)計(jì)復(fù)雜度算法能夠一幀一幀地對(duì)語(yǔ)音信號(hào)進(jìn)行流水線(xiàn)操作,計(jì)算量減少,數(shù)據(jù)處理效率得到提高,更適合應(yīng)用在硬件平臺(tái)上。矢量量化識(shí)別的硬件實(shí)現(xiàn)過(guò)程由特征參數(shù)提取、歐氏距離計(jì)算、最小失真計(jì)算構(gòu)成。特征參數(shù)選擇24維梅爾頻率倒譜系數(shù),Mel濾波和離散余弦變換均通過(guò)查表法參與運(yùn)算。計(jì)算每幀的特征參數(shù)與碼本中各個(gè)碼矢的歐氏距離平方誤差值,通過(guò)時(shí)序控制將原本所需要的24個(gè)平方運(yùn)算模塊縮減到6個(gè),節(jié)約了硬件資源。從每幀的歐氏距離平方誤差中選出最小值,與上一幀的最小誤差值疊加,在語(yǔ)音結(jié)束時(shí)用疊加的最小誤差值除以有效幀數(shù),獲得語(yǔ)音的最小失真,將最小失真與預(yù)先設(shè)置的閾值比較,最終實(shí)現(xiàn)說(shuō)話(huà)人識(shí)別。本文以ALTERA公司的EP4CE55F23C8芯片為核心,采用流水線(xiàn)技術(shù)在硬件平臺(tái)上實(shí)現(xiàn)說(shuō)話(huà)人識(shí)別,實(shí)驗(yàn)結(jié)果表明:系統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)在高信噪比與低信噪比的環(huán)境中均有較好的檢測(cè)效果,測(cè)出的有效語(yǔ)音幀數(shù)準(zhǔn)確,系統(tǒng)響應(yīng)時(shí)間96ms;在實(shí)驗(yàn)室環(huán)境中,對(duì)文本相關(guān)的指定說(shuō)話(huà)人識(shí)別時(shí),其正確識(shí)別率可達(dá)到94%;與只設(shè)置說(shuō)話(huà)人識(shí)別的上限閾值相比,同時(shí)設(shè)置上限閾值和下限閾值后,可有效降低指定人對(duì)自己其他語(yǔ)音的誤識(shí)率。系統(tǒng)具有效率高、響應(yīng)快、適用性強(qiáng)的優(yōu)點(diǎn),在智能家居領(lǐng)域具有良好的應(yīng)用前景。圖[56]表[9]參[63]
【圖文】:

資源使用,浮點(diǎn),IP核,輸出口


續(xù)表 5-1 FFT IP 核接口的性質(zhì)及作用9 sink_error[1:0] 輸入口 輸入錯(cuò)誤信號(hào),置 0 即可10 source_ready 輸入口 下傳流模塊已準(zhǔn)備接受信號(hào)時(shí)置11 sink_ready 輸出口 FFT 已準(zhǔn)備好接受信號(hào)時(shí)置位12 source_error[1:0] 輸出口 輸出 FFT 變換中出現(xiàn)錯(cuò)誤的信13 source_sop 輸出口 輸出一幀數(shù)據(jù)的起始信號(hào)14 source_eop 輸出口 輸出一幀數(shù)據(jù)的終止信號(hào)15 source_valid 輸出口 數(shù)據(jù)輸出有效標(biāo)記16 source_exp[5:0] 輸出口 輸出數(shù)據(jù)的縮放因子17 source_real 輸出口 輸出數(shù)據(jù)的實(shí)部18 source_imag 輸出口 輸出數(shù)據(jù)的虛部 數(shù)據(jù)運(yùn)算的實(shí)現(xiàn)本文中,語(yǔ)音數(shù)據(jù)的乘除、平方、開(kāi)平方等算術(shù)運(yùn)算直接調(diào)用 Quartu 核,但對(duì)數(shù)運(yùn)算的 ALTFP_LOG IP 核是浮點(diǎn)運(yùn)算,在 Quartus II 中例為“l(fā)og16”的 ALTFP_LOG IP 核,采用單精度浮點(diǎn)數(shù)作為輸入、輸出 資源使用狀況如圖 5-2 所示。

資源使用,查表法,對(duì)數(shù),狀況


安徽理工大學(xué)碩士學(xué)位論文46該模塊的FPGA資源使用狀況如圖5-4所示,消耗FPGA的邏輯元件數(shù)為409,相應(yīng)的,其消耗的存儲(chǔ)資源較多。圖 5-4 查表法對(duì)數(shù)運(yùn)算資源使用狀況Figure 5-4 Resource utilization of logarithm in look-up table通過(guò) Modelsim 對(duì)該對(duì)數(shù)運(yùn)算模塊仿真,如圖 5-5 所示。對(duì)于第 1 個(gè)真數(shù) 100,其縮放因子 data_exp_6bit 為 0,實(shí)際計(jì)算的結(jié)果為 1024×ln100≈4715.7,,仿真結(jié)果為 4716
【學(xué)位授予單位】:安徽理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:TN791;TN912.34;TU855

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 馬德新;;智能家居市場(chǎng)中的元器件發(fā)展態(tài)勢(shì)[J];電子元件與材料;2014年01期

2 鄭晴晴;傅攀;李威霖;;CHMM在滾動(dòng)軸承故障診斷中的應(yīng)用研究[J];現(xiàn)代制造工程;2013年12期

3 闕大順;趙永安;文先林;李蓓;;基于DHMM和VQ的關(guān)鍵詞識(shí)別系統(tǒng)研究[J];武漢理工大學(xué)學(xué)報(bào);2011年02期

4 劉君俠;;室內(nèi)聲環(huán)境評(píng)價(jià)指標(biāo)研究[J];江漢大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期

5 劉華平;李昕;徐柏齡;姜寧;;語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法綜述及展望[J];計(jì)算機(jī)應(yīng)用研究;2008年08期

6 劉峰濤;賀國(guó)光;;基于近似熵和統(tǒng)計(jì)復(fù)雜度的交通流復(fù)雜性測(cè)度[J];中國(guó)公路學(xué)報(bào);2007年04期



本文編號(hào):2654050

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jianzhugongchenglunwen/2654050.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f5aea***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com