基于受限玻爾茲曼機(jī)的語音帶寬擴(kuò)展

發(fā)布時(shí)間：2017-10-20 12:17

本文關(guān)鍵詞：基于受限玻爾茲曼機(jī)的語音帶寬擴(kuò)展

【摘要】：語音帶寬擴(kuò)展是為了提高語音質(zhì)量,利用語音低頻和高頻之間的相關(guān)性重構(gòu)語音高頻的一種技術(shù)。高斯混合模型法是語音帶寬技術(shù)中被廣泛應(yīng)用的一種方法,但是,由于該方法假設(shè)語音高頻、低頻服從高斯分布,且只表征了語音低頻、高頻之間的線性關(guān)系,從而導(dǎo)致合成的高頻語音出現(xiàn)失真。因此,該文提出一種基于受限玻爾茲曼機(jī)的方法,該方法利用兩個(gè)高斯伯努利受限玻爾茲曼機(jī)提取語音低頻和高頻中蘊(yùn)含的高階統(tǒng)計(jì)特性;并利用前饋神經(jīng)網(wǎng)絡(luò)將語音低頻高階統(tǒng)計(jì)特性參數(shù)映射為高頻高階統(tǒng)計(jì)特性參數(shù)。這樣,通過提取語音低頻和高頻中蘊(yùn)含的高階統(tǒng)計(jì)特性,該方法可以深層挖掘語音高頻和語音低頻之間的實(shí)際關(guān)系,從而更加準(zhǔn)確地模擬頻譜包絡(luò)分布,合成質(zhì)量更高的語音。客觀測試、主觀測試結(jié)果表明,該方法性能優(yōu)于傳統(tǒng)的高斯混合模型方法。
【作者單位】：北京理工大學(xué)信息與電子學(xué)院;
【關(guān)鍵詞】： 語音帶寬擴(kuò)展 受限玻爾茲曼機(jī) 前饋神經(jīng)網(wǎng)絡(luò) 高斯混合模型
【基金】：北京理工大學(xué)--愛立信國際合作項(xiàng)目國家留學(xué)基金委
【分類號】：TN912.3
【正文快照】： 1引言由于窄帶電話語音的帶寬限制在300 Hz到3.4k Hz之間,因此,電話語音的自然度不夠,語音質(zhì)量有限,在一些對語音質(zhì)量要求高的場合,窄帶電話語音不能滿足人們的需求。這些不足可以通過引入寬帶語音(50 Hz~7 k Hz)通信得以改善。目前,電話網(wǎng)絡(luò)的終端系統(tǒng)和寬帶通信之間還存在兼，

本文編號：1067113

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/1067113.html

上一篇：天基寬帶互聯(lián)網(wǎng)發(fā)展現(xiàn)狀與展望
下一篇：激光大氣傳輸接收功率閃爍的概率分布特征

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于受限玻爾茲曼機(jī)的語音帶寬擴(kuò)展