基于受限玻爾茲曼機(jī)的語音帶寬擴(kuò)展
發(fā)布時(shí)間:2017-10-20 12:17
本文關(guān)鍵詞:基于受限玻爾茲曼機(jī)的語音帶寬擴(kuò)展
更多相關(guān)文章: 語音帶寬擴(kuò)展 受限玻爾茲曼機(jī) 前饋神經(jīng)網(wǎng)絡(luò) 高斯混合模型
【摘要】:語音帶寬擴(kuò)展是為了提高語音質(zhì)量,利用語音低頻和高頻之間的相關(guān)性重構(gòu)語音高頻的一種技術(shù)。高斯混合模型法是語音帶寬技術(shù)中被廣泛應(yīng)用的一種方法,但是,由于該方法假設(shè)語音高頻、低頻服從高斯分布,且只表征了語音低頻、高頻之間的線性關(guān)系,從而導(dǎo)致合成的高頻語音出現(xiàn)失真。因此,該文提出一種基于受限玻爾茲曼機(jī)的方法,該方法利用兩個(gè)高斯伯努利受限玻爾茲曼機(jī)提取語音低頻和高頻中蘊(yùn)含的高階統(tǒng)計(jì)特性;并利用前饋神經(jīng)網(wǎng)絡(luò)將語音低頻高階統(tǒng)計(jì)特性參數(shù)映射為高頻高階統(tǒng)計(jì)特性參數(shù)。這樣,通過提取語音低頻和高頻中蘊(yùn)含的高階統(tǒng)計(jì)特性,該方法可以深層挖掘語音高頻和語音低頻之間的實(shí)際關(guān)系,從而更加準(zhǔn)確地模擬頻譜包絡(luò)分布,合成質(zhì)量更高的語音。客觀測試、主觀測試結(jié)果表明,該方法性能優(yōu)于傳統(tǒng)的高斯混合模型方法。
【作者單位】: 北京理工大學(xué)信息與電子學(xué)院;
【關(guān)鍵詞】: 語音帶寬擴(kuò)展 受限玻爾茲曼機(jī) 前饋神經(jīng)網(wǎng)絡(luò) 高斯混合模型
【基金】:北京理工大學(xué)--愛立信國際合作項(xiàng)目 國家留學(xué)基金委
【分類號】:TN912.3
【正文快照】: 1引言由于窄帶電話語音的帶寬限制在300 Hz到3.4k Hz之間,因此,電話語音的自然度不夠,語音質(zhì)量有限,在一些對語音質(zhì)量要求高的場合,窄帶電話語音不能滿足人們的需求。這些不足可以通過引入寬帶語音(50 Hz~7 k Hz)通信得以改善。目前,電話網(wǎng)絡(luò)的終端系統(tǒng)和寬帶通信之間還存在兼,
本文編號:1067113
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1067113.html
最近更新
教材專著