基于Cortex-A8的變異語音識別技術(shù)研究
發(fā)布時間:2021-10-13 02:30
大腦是人類最重要最核心的器官,主導(dǎo)人的意識和行為。為了使機器也具有類似人大腦的智能,我們研究和開發(fā)了名為人工智能的新學(xué)科,讓機器能模擬人的智能而做出回應(yīng),目前在該學(xué)科應(yīng)用比較廣泛的是語音識別和人臉識別。語音識別技術(shù)是使用語音中的特征參數(shù)以及音節(jié)之間的相關(guān)性達(dá)到與數(shù)據(jù)庫的匹配,從而進行語音識別。與其他人工智能技術(shù)相比,語音識別具有簡單、快速的特點。變異語音是指由環(huán)境噪聲、心情變化、信道的改變而對目標(biāo)語音引起干擾,使得語音識別系統(tǒng)的識別率下降。本文從以下兩個方面展開研究:1.端點檢測是語音識別過程中很重要的一部分,檢測效果將決定識別結(jié)果的好壞。本文首先對比分析常用的端點檢測方法:短時自相關(guān)函數(shù)最大值法、比例法、短時能量法、雙門限法。通過分析這幾種方法的優(yōu)缺點,本文提出基于多尺度熵的語音信號端點檢測方法,它是一種自適應(yīng)的數(shù)據(jù)驅(qū)動的信號處理方法,因為目標(biāo)語音的熵值小于白噪聲,據(jù)此可以過濾掉白噪聲。同時因為語音信號在不同的頻率段其能量不同,求取語音信號的瞬時能頻值,將信號分解成含有復(fù)雜信息的高頻段和含噪聲低頻段;2.傳統(tǒng)的隱馬爾科夫模型,在低信噪比的環(huán)境下,識別率低,且它的訓(xùn)練參數(shù)容易收斂于局部...
【文章來源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
echo音響
曉醫(yī)
以及由初始化數(shù)據(jù)逼近模型參數(shù)的過程,具體流程圖如圖 4-33 所示,部分目標(biāo)函數(shù)的代碼如圖4-34 所示,本設(shè)計采用 Objective(GAGenome& g)作為目標(biāo)函數(shù),它嘗試匹配 float 數(shù)組中作為userData 傳遞給我們的值,如果基因組中的值映射到接近的值 genome.nPhenotypes(),則返回更好的分?jǐn)?shù)值 value。目標(biāo)函數(shù)子程序執(zhí)行完畢返回遺傳算法主程序繼續(xù)執(zhí)行。開始基因組gnome返回計算value i<genome.phenotype()是否圖 4-33 目標(biāo)函數(shù)流程圖 4-32 遺傳算法程序流程圖
本文編號:3433785
【文章來源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【部分圖文】:
echo音響
曉醫(yī)
以及由初始化數(shù)據(jù)逼近模型參數(shù)的過程,具體流程圖如圖 4-33 所示,部分目標(biāo)函數(shù)的代碼如圖4-34 所示,本設(shè)計采用 Objective(GAGenome& g)作為目標(biāo)函數(shù),它嘗試匹配 float 數(shù)組中作為userData 傳遞給我們的值,如果基因組中的值映射到接近的值 genome.nPhenotypes(),則返回更好的分?jǐn)?shù)值 value。目標(biāo)函數(shù)子程序執(zhí)行完畢返回遺傳算法主程序繼續(xù)執(zhí)行。開始基因組gnome返回計算value i<genome.phenotype()是否圖 4-33 目標(biāo)函數(shù)流程圖 4-32 遺傳算法程序流程圖
本文編號:3433785
本文鏈接:http://sikaile.net/kejilunwen/wltx/3433785.html
最近更新
教材專著