天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于聚類特征聯(lián)合字典的非負(fù)矩陣分解語(yǔ)音轉(zhuǎn)換

發(fā)布時(shí)間:2020-03-28 05:55
【摘要】:語(yǔ)音轉(zhuǎn)換即維持語(yǔ)義不變,對(duì)源說(shuō)話人的語(yǔ)音進(jìn)行轉(zhuǎn)換,使其具有目標(biāo)說(shuō)話人的個(gè)性特征。語(yǔ)音轉(zhuǎn)換涵蓋信號(hào)處理、聲學(xué)等學(xué)科,對(duì)語(yǔ)音信號(hào)轉(zhuǎn)換的探索可促進(jìn)如:語(yǔ)音編碼、說(shuō)話人識(shí)別等的革新。語(yǔ)音轉(zhuǎn)換在文語(yǔ)合成系統(tǒng)、多媒體娛樂(lè)、語(yǔ)言翻譯系統(tǒng)、醫(yī)學(xué)領(lǐng)域的語(yǔ)音增強(qiáng)系統(tǒng)以及說(shuō)話人偽裝身份通信方面應(yīng)用廣泛,F(xiàn)有的絕大多數(shù)算法基于統(tǒng)計(jì)模型,其中高斯混合模型是主流。它們中很多需要源和目標(biāo)說(shuō)話人的足量平行語(yǔ)料,這帶來(lái)了很多限制和問(wèn)題。比如,訓(xùn)練的數(shù)據(jù)對(duì)兩個(gè)說(shuō)話人必須是相同的,訓(xùn)練的模型只能被應(yīng)用到特定的一對(duì)組合,說(shuō)話人的語(yǔ)料不充足,對(duì)齊時(shí)可能會(huì)出現(xiàn)的幀間錯(cuò)誤匹配等等。本文在傳統(tǒng)的非負(fù)矩陣分解語(yǔ)音轉(zhuǎn)換基礎(chǔ)上,提出一種利用聚類特征聯(lián)合字典實(shí)現(xiàn)多對(duì)多說(shuō)話人的稀疏非負(fù)矩陣分解語(yǔ)音轉(zhuǎn)換算法。它將說(shuō)話人語(yǔ)音的頻譜特征分解成個(gè)性特征和語(yǔ)義相關(guān)兩部分。首先利用語(yǔ)音分析模型自適應(yīng)加權(quán)譜內(nèi)插(STRAIGHT)提取語(yǔ)音的基頻和短時(shí)譜參數(shù),對(duì)短時(shí)譜求解其線性預(yù)測(cè)倒譜系數(shù)(LPCC)。其次,將N個(gè)說(shuō)話人的適量平行語(yǔ)料對(duì)齊,通過(guò)高維均值聚類得到各自的字典。然后,將非負(fù)矩陣頻譜參數(shù)近似為各自字典的線性組合與激勵(lì)陣的乘積。轉(zhuǎn)換語(yǔ)音頻譜參數(shù)是目標(biāo)語(yǔ)音聯(lián)合字典與源語(yǔ)音激勵(lì)陣優(yōu)化后的組合。該算法可以在源和目標(biāo)說(shuō)話人語(yǔ)料不充足的情形下實(shí)現(xiàn)多對(duì)多的語(yǔ)音轉(zhuǎn)換。實(shí)驗(yàn)結(jié)果顯示,以上方法在VCC2016語(yǔ)料庫(kù)上實(shí)驗(yàn)得到的轉(zhuǎn)換語(yǔ)音的譜失真和語(yǔ)音質(zhì)量均優(yōu)于傳統(tǒng)的非負(fù)矩陣分解。轉(zhuǎn)換語(yǔ)音的平均譜失真度比傳統(tǒng)算法降低了大約4.3%。
【圖文】:

發(fā)音器官,聲管,共鳴器,聲道


耳蝸在顱骨深處,尺寸很小,因此對(duì)耳蝸的分析處理是一項(xiàng)異常艱難而繁逡逑雜的工程。目前工程上用的較多的是1982年由美國(guó)Fairchild人工智能研究室Lyon逡逑提出的計(jì)算模型,其原理框圖如下圖2.2所示。第一項(xiàng)為基底膜的振動(dòng)模型,由各逡逑種二階網(wǎng)絡(luò)組成的濾波器構(gòu)成,將輸入信號(hào)在頻域分解。第二項(xiàng)為毛細(xì)胞模型,采取逡逑半波整流和低通濾波近似單個(gè)細(xì)胞的檢測(cè)性能。第三項(xiàng)是神經(jīng)纖維模型,默認(rèn)其是非逡逑8逡逑

語(yǔ)音信號(hào),數(shù)學(xué)模型,激勵(lì)系統(tǒng),聲道


邐邋低通逡逑翻邐I發(fā)放I濾“器逡逑圖2.2語(yǔ)音信號(hào)聽覺(jué)模型原理框圖逡逑2.邋1.3語(yǔ)音信號(hào)模型逡逑為了更好地對(duì)語(yǔ)音信號(hào)分析和研究,需要借助數(shù)學(xué)公式,對(duì)其進(jìn)行建模。該數(shù)學(xué)逡逑模型由三個(gè)模塊構(gòu)成.?激勵(lì)系統(tǒng)、聲道系統(tǒng)和輻射系統(tǒng)。激勵(lì)系統(tǒng)為聲源產(chǎn)生激勵(lì),逡逑聲道系統(tǒng)對(duì)激勵(lì)進(jìn)行調(diào)制,輻射系統(tǒng)將聲音輻射出去。逡逑如圖2.3所示為語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型,以下將對(duì)其三部分詳細(xì)闡述。逡逑Av邐I邐I逡逑基音周期邐■邐?逡逑;聲道參數(shù);逡逑I邐n邐I逡逑.邋%煎五邋五五澹義縣芷諑齔邋逕怕齔迥X,.,逦Ud義希Х⑸麇澹扌停紓ǎ╁!逦.逦!辶x希殄危哄五危殄危五危澹懼五澹五五義螻B、丨聲道模型丨輻射模型語(yǔ)音信號(hào)逡逑邐邋「V(z)邋丁邋R(Z)邐^逡逑隨機(jī)噪聲發(fā)丨邐:逡逑生器邐々一丨\邐;逡逑1邐1邐:邐I濁音/清音開關(guān)邋.逡逑?邐?逡逑I邐I逡逑激勵(lì)系統(tǒng)邐AU邋|聲道系統(tǒng)|邐輻射系統(tǒng)逡逑圖2.3語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型逡逑a.激勵(lì)系統(tǒng)逡逑激勵(lì)系統(tǒng)由濁音激勵(lì)和清音激勵(lì)組成。當(dāng)發(fā)聲者聲帶連續(xù)開合時(shí),能夠形成間歇逡逑9逡逑
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN912.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 余先川;任雅麗;;非負(fù)矩陣分解及在地學(xué)中的應(yīng)用[J];地質(zhì)學(xué)刊;2014年02期

2 溫建科;;基于Cool Edit Pro軟件的數(shù)字音頻處理技術(shù)[J];實(shí)驗(yàn)科學(xué)與技術(shù);2013年06期

3 張炳;俞一彪;;基于改進(jìn)GMM和韻律聯(lián)合短時(shí)譜的說(shuō)話人轉(zhuǎn)換[J];信號(hào)處理;2009年04期

4 劉華平;李昕;徐柏齡;姜寧;;語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法綜述及展望[J];計(jì)算機(jī)應(yīng)用研究;2008年08期

5 左國(guó)玉,劉文舉,阮曉鋼;聲音轉(zhuǎn)換技術(shù)的研究與進(jìn)展[J];電子學(xué)報(bào);2004年07期

6 黃鋼石,張亞非,陸建江,徐寶文;一種受限非負(fù)矩陣分解方法[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期

相關(guān)碩士學(xué)位論文 前4條

1 車瀅霞;約束條件下的結(jié)構(gòu)化統(tǒng)計(jì)聲學(xué)模型及非平行語(yǔ)料語(yǔ)音轉(zhuǎn)換[D];蘇州大學(xué);2015年

2 趙莽;語(yǔ)音個(gè)性特征識(shí)別及轉(zhuǎn)化系統(tǒng)研究[D];南京大學(xué);2014年

3 楊陽(yáng);漢語(yǔ)語(yǔ)音轉(zhuǎn)換系統(tǒng)的研究[D];北京交通大學(xué);2008年

4 蔣冀翔;基于非負(fù)矩陣分解的信息獲取方法研究[D];東南大學(xué);2006年

,

本文編號(hào):2604023

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2604023.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bf0a9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com