寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識別
發(fā)布時間:2017-08-03 18:01
本文關(guān)鍵詞:寬窄帶語譜圖融合分帶投影的特定人漢語詞匯識別
更多相關(guān)文章: 語音識別 語譜圖 特征融合 行投影 列投影 支持向量機(jī)(SVM)
【摘要】:提出一種基于寬窄帶語譜圖融合分帶投影的方法對特定人二字漢語詞匯進(jìn)行識別。該方法將圖像處理技術(shù)應(yīng)用到語音識別領(lǐng)域,在圖像特征提取過程中,首先對窄帶語譜圖進(jìn)行等寬度分帶行投影和二進(jìn)寬度分帶行投影,并將其分別作為窄帶語譜圖的第1個特征集合和第2個特征集合,同時將窄帶語譜圖進(jìn)行再次圖像傅里葉變換之后進(jìn)行等寬度行投影,作為第3個特征集合。然后對寬帶語譜圖進(jìn)行等寬度分帶列投影,作為第4個特征集合。將上述特征集合作為識別的特征向量,以支持向量機(jī)為分類器進(jìn)行特定人二字漢語詞匯整體識別。采用1000個語音樣本進(jìn)行仿真實驗,結(jié)果表明,采用前3個特征集合的特征向量對特定人二字漢語詞匯識別的正確識別率可達(dá)92.4%,采用第4個特征集合的特征值對特定人二字詞匯識別的正確識別率可達(dá)80%,而采用上述4個特征集合的特征值融合對特定人二字漢語詞匯識別的正確識別率可達(dá)95.4%。該特征融合的方法為漢語詞匯的識別提供了新的思路。
【作者單位】: 東北師范大學(xué)物理學(xué)院;長春理工大學(xué)理學(xué)院;北京理工大學(xué)光電成像技術(shù)與系統(tǒng)教育部重點實驗室;
【關(guān)鍵詞】: 語音識別 語譜圖 特征融合 行投影 列投影 支持向量機(jī)(SVM)
【基金】:國家自然科學(xué)基金項目(61471111)資助
【分類號】:TP391.41;TN912.34
【正文快照】: 本文受國家自然科學(xué)基金項目(61471111)資助。1前言語音信號是一種非平穩(wěn)隨機(jī)信號,考慮到人類發(fā)音器官在發(fā)聲過程中的變化速度具有一定的限度,可以認(rèn)為語音信號是短時平穩(wěn)的,即在10~30ms的時間段內(nèi)可以應(yīng)用平穩(wěn)隨機(jī)過程的分析方法。然而,漢語語音清輔音多,開口呼出的音節(jié)占全,
本文編號:615591
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/615591.html
最近更新
教材專著