基于HMM的印尼語語音合成系統(tǒng)設計與實現(xiàn)

發(fā)布時間：2021-06-29 08:21

　　印度尼西亞語（簡稱印尼語）源自于蘇門答臘島東北部的馬來語,屬于馬來-波利尼西亞語系。世界上約有三千多萬人將印尼語作為他們的母語,且大約有一億多人將其作為第二門語言�，F(xiàn)代馬來語和印尼語都使用拉丁字母拼寫,兩種語言的拼寫也比較接近。論文以開發(fā)印尼語文語轉換應用系統(tǒng)為目的,設計并實現(xiàn)基于隱馬爾可夫模型（Hidden Markov Model，HMM）的印尼語文語轉換基線系統(tǒng),并在此基礎上探索提高語音合成自然度的方法。論文的主要工作包括:（1）音子自動切分。本文根據(jù)印尼語的語音特點,分別按聲韻母結構和按音素結構確定了兩類合成基元。并使用基于HMM的自動切分技術,依據(jù)兩種不同的合成基元,對印尼語音子展開自動切分工作,為本文后續(xù)文轉語的進一步深入研究奠定基礎。（2）模型訓練及語音合成的實現(xiàn)。本文在HTS（HMM-based Speech Synthesis System）的基礎上,建立了一個完整的語音合成系統(tǒng)框架。首先設計了三音子上下文屬性及問題集,并通過決策樹聚類進行聲學模型的訓練,最終實現(xiàn)印尼語語音的合成。（3）印尼語語音合成系統(tǒng)的改進。本文對印尼語語音合成系統(tǒng)進行了三方面的改進工作。首先,對...

【文章來源】：云南大學云南省 211工程院校

【文章頁數(shù)】：64 頁

【學位級別】：碩士

【部分圖文】：

一l:前向遞推結構圖

示意圖,算法結構,示意圖,觀察符號

第二章基于ＨＭＭ的語音合成??其次，面對解碼問題，它與上述方法相似，不同的是，維特比解碼的目的是??求得最大值…１。如圖２－２所示：??卜１?ｔ??…、?????狀態(tài)轉移：％??＾?，（／）?腿?＊＾〇））??：輸出概率：ｂｙ（０，）??ｘＮ，??圖２－２：?Ｖｉｔｅｒｂｉ算法結構示意圖??設屮，（／）表示在／時刻的最大輸出概率，此時由部分觀測序列確定，且觀測序??列處于ｙ狀態(tài)。當％⑴取得最大值時，其路徑Ｈ．７，保存于２，?（＿／）中。使用Ｖｉｔｅｒｂｉ??算法求取最佳序列的步驟為：??第一步：初始化％?（丨）＝〇?（２－６）??第二步：根據(jù)／時刻輸出的觀察符號有迭代式中，（乃為：??屮，（＿／）＝ｍａｘ［Ｔ，．丨（／）〇＂］辦＂（０，）?（２－７）??（力：叩?ｍａｘ?［屮丨（

頻譜,語音合成系統(tǒng),框架,激勵參數(shù)

進行模型訓練，且模型結構可以人工修改，方便實用。所以基于ＨＭＭ的語音合??成系統(tǒng)在語音合成領域備受研究者們的歡迎。??基于ＨＭＭ的語音合成系統(tǒng)框架主要包括訓練和合成兩部分，如圖２－３所示。??首先，訓練部分類似于語音識別系統(tǒng)【２６１，主要區(qū)別是頻譜和激勵參數(shù)的不同，譜??參數(shù)主要包括梅爾倒譜系數(shù)（ＭＦＣＣ）和動態(tài)特征ｆ２＇激勵參數(shù)主要是對基頻取對??數(shù)，即基頻對數(shù)（ｌｏｇＦＯ）。而動態(tài)特征參數(shù)主要從語音庫中提取，并且根據(jù)上下??文標注信息訓練ＨＭＭ模型。其次，在合成階段，由圖２－３虛線下半部分所示，首??先對輸入系統(tǒng)中的文本進行分析，再利用訓練好的狀態(tài)持續(xù)時間模型進行參數(shù)估??計，從而產生相應的激勵參數(shù)和頻譜參數(shù)，最后由ＳＴＲＡＩＧＨＴ?（Ｓｐｅｅｃｈ??Ｔｒａｎｓｆｏｒｍａｔｉｏｎ?ａｎｄ?Ｒｅｐｒｅｓｅｎｔａｔｉｏｎ?ｕｓｉｎｇ?Ａｄａｐｔｉｖｅ?Ｉｎｔｅｒｐｏｌａｔｉｏｎ?ｏｆ?ｗｅｉＧＨＴｅｄ??ｓｐｅｃｔｒｕｍ），即基于自適應加權譜內插值的方法實現(xiàn)語音的轉換和重構ｐ８］，最終產??生語音波形。??簡單的講，ＨＭＭ在本實驗中的應用可概括為以下幾方面：??（１）音子的自動切分。此項工作主要是用２．１節(jié)中介紹的第二個問題一一解??碼問題來實現(xiàn)

【參考文獻】：
期刊論文
[1]關于咸陽市方言語音的內部分化等問題[J]. 孫立新.  咸陽師范學院學報. 2018(01)
[2]一種改進的基于Viterbi的語音切分算法[J]. 李歡歡,王金明,尹海明,徐志軍,孔磊,張開禮.  通信技術. 2015(09)
[3]基于前向-后向HMM的連續(xù)語音識別系統(tǒng)的研究[J]. 于曉明,柏松.  計算機工程與設計. 2009(18)
[4]基于MBIC的決策樹聚類算法在連續(xù)語音識別中的應用[J]. 陳國平,杜利民,付躍文,王勁林.  計算機應用. 2005(12)
[5]漢語、印尼語構詞詞綴差異分析[J]. 顏天惠,宗世海.  暨南大學華文學院學報. 2003(03)
[6]HMM連續(xù)語音識別中Viterbi算法的優(yōu)化及應用[J]. 袁俊.  電子技術. 2001(02)
[7]LSP參數(shù)的語音分析和合成研究[J]. 楊紅云,向茂楠.  北京理工大學學報. 1992(01)

博士論文
[1]語音合成音庫自動標注方法研究[D]. 楊辰雨.中國科學技術大學 2014
[2]統(tǒng)計參數(shù)語音合成中的聲學模型建模方法研究[D]. 雷鳴.中國科學技術大學 2012
[3]中文TTS系統(tǒng)中若干關鍵技術研究[D]. 黃平牧.北京郵電大學 2008
[4]基于統(tǒng)計聲學建模的語音合成技術研究[D]. 凌震華.中國科學技術大學 2008

碩士論文
[1]基于GMM-HMM的聲學模型訓練研究[D]. 王為凱.華南理工大學 2016
[2]統(tǒng)計參數(shù)語音合成中的頻譜建模及生成方法研究[D]. 孫瑜聲.中國科學技術大學 2015
[3]漢藏雙語跨語言統(tǒng)計參數(shù)語音合成的研究[D]. 王海燕.西北師范大學 2015

本文編號：3256098

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/3256098.html

上一篇：Spinal碼的譯碼算法和糾錯性能研究
下一篇：基于ZC706平臺的軟件定義數(shù)據(jù)鏈路層設計與實現(xiàn)

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于HMM的印尼語語音合成系統(tǒng)設計與實現(xiàn)