寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識(shí)別
發(fā)布時(shí)間:2017-08-03 18:01
本文關(guān)鍵詞:寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識(shí)別
更多相關(guān)文章: 語音識(shí)別 語譜圖 特征融合 行投影 列投影 支持向量機(jī)(SVM)
【摘要】:提出一種基于寬窄帶語譜圖融合分帶投影的方法對(duì)特定人二字漢語詞匯進(jìn)行識(shí)別。該方法將圖像處理技術(shù)應(yīng)用到語音識(shí)別領(lǐng)域,在圖像特征提取過程中,首先對(duì)窄帶語譜圖進(jìn)行等寬度分帶行投影和二進(jìn)寬度分帶行投影,并將其分別作為窄帶語譜圖的第1個(gè)特征集合和第2個(gè)特征集合,同時(shí)將窄帶語譜圖進(jìn)行再次圖像傅里葉變換之后進(jìn)行等寬度行投影,作為第3個(gè)特征集合。然后對(duì)寬帶語譜圖進(jìn)行等寬度分帶列投影,作為第4個(gè)特征集合。將上述特征集合作為識(shí)別的特征向量,以支持向量機(jī)為分類器進(jìn)行特定人二字漢語詞匯整體識(shí)別。采用1000個(gè)語音樣本進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明,采用前3個(gè)特征集合的特征向量對(duì)特定人二字漢語詞匯識(shí)別的正確識(shí)別率可達(dá)92.4%,采用第4個(gè)特征集合的特征值對(duì)特定人二字詞匯識(shí)別的正確識(shí)別率可達(dá)80%,而采用上述4個(gè)特征集合的特征值融合對(duì)特定人二字漢語詞匯識(shí)別的正確識(shí)別率可達(dá)95.4%。該特征融合的方法為漢語詞匯的識(shí)別提供了新的思路。
【作者單位】: 東北師范大學(xué)物理學(xué)院;長(zhǎng)春理工大學(xué)理學(xué)院;北京理工大學(xué)光電成像技術(shù)與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 語音識(shí)別 語譜圖 特征融合 行投影 列投影 支持向量機(jī)(SVM)
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61471111)資助
【分類號(hào)】:TP391.41;TN912.34
【正文快照】: 本文受國(guó)家自然科學(xué)基金項(xiàng)目(61471111)資助。1前言語音信號(hào)是一種非平穩(wěn)隨機(jī)信號(hào),考慮到人類發(fā)音器官在發(fā)聲過程中的變化速度具有一定的限度,可以認(rèn)為語音信號(hào)是短時(shí)平穩(wěn)的,即在10~30ms的時(shí)間段內(nèi)可以應(yīng)用平穩(wěn)隨機(jī)過程的分析方法。然而,漢語語音清輔音多,開口呼出的音節(jié)占全,
本文編號(hào):615591
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/615591.html
最近更新
教材專著