基于HMM的可訓(xùn)練傣語(yǔ)語(yǔ)音合成系統(tǒng)
本文關(guān)鍵詞:基于HMM的可訓(xùn)練傣語(yǔ)語(yǔ)音合成系統(tǒng)
更多相關(guān)文章: 語(yǔ)音合成 可訓(xùn)練 傣語(yǔ) 隱馬爾可夫模型 STRAIGHT合成器
【摘要】:語(yǔ)音合成就是通過(guò)計(jì)算機(jī)將任意文字信息轉(zhuǎn)換為可聽(tīng)懂且高自然度的聲音信息進(jìn)行輸出的一種技術(shù)。近年來(lái),隨著數(shù)字信號(hào)處理技術(shù)和計(jì)算機(jī)技術(shù)的快速發(fā)展,語(yǔ)音合成技術(shù)發(fā)展也日益成熟,被廣泛應(yīng)用于人機(jī)語(yǔ)音通信中。云南是一個(gè)少數(shù)民族聚集的邊疆省份,少數(shù)民族人口數(shù)約為1400多萬(wàn)。其中,有120多萬(wàn)傣族同胞使用傣語(yǔ),且主要分布于德宏、保山、西雙版納一帶。隨著傣漢民族間的經(jīng)濟(jì)交流和文化交流日益頻繁,傣語(yǔ)語(yǔ)音合成研究的重要性也就不言而喻。本文針對(duì)西雙版納新傣文,以開(kāi)發(fā)傣語(yǔ)語(yǔ)音合成系統(tǒng)為目的,采用基于隱馬爾可夫模型的可訓(xùn)練語(yǔ)音合成方法,對(duì)傣語(yǔ)語(yǔ)音合成系統(tǒng)進(jìn)行了研究。論文的主要工作包括:1.闡述了基于HMM的語(yǔ)音合成基本原理,并在此基礎(chǔ)上研究了傣語(yǔ)可訓(xùn)練語(yǔ)音合成系統(tǒng)的實(shí)現(xiàn)方案。2.根據(jù)西雙版納傣語(yǔ)語(yǔ)音特征,完成語(yǔ)音語(yǔ)料庫(kù)的構(gòu)建、音素列表的確定、單音子和三音子標(biāo)注文件的獲取和上下文屬性和問(wèn)題集的設(shè)計(jì)等傣語(yǔ)語(yǔ)音合成數(shù)據(jù)準(zhǔn)備工作。3.采用HTK工具包,以均勻切分的1300句語(yǔ)音語(yǔ)料為初始訓(xùn)練數(shù)據(jù),生成每個(gè)音子的HMM初始模型。通過(guò)多次循環(huán)訓(xùn)練和音子強(qiáng)制對(duì)齊,生成音子自動(dòng)切分標(biāo)注文件。4.基于STRAIGHT合成器的語(yǔ)音合成平臺(tái),對(duì)1300句已標(biāo)注的傣語(yǔ)語(yǔ)句進(jìn)行特征參數(shù)提取和HMM聲學(xué)模型訓(xùn)練以及后端合成器的構(gòu)建。采用訓(xùn)練好的聲學(xué)模型對(duì)分析好的待合成語(yǔ)料進(jìn)行HMM模型決策和參數(shù)預(yù)測(cè),利用STRAIGHT合成器對(duì)預(yù)測(cè)參數(shù)進(jìn)行語(yǔ)音波形的生成。實(shí)驗(yàn)結(jié)果表明,利用訓(xùn)練好的聲學(xué)模型,能夠合成出可懂度和自然度都可接受的傣語(yǔ)語(yǔ)句,說(shuō)明本文采用的傣語(yǔ)合成方案以及音子自動(dòng)標(biāo)注方法具有可行性。
【關(guān)鍵詞】:語(yǔ)音合成 可訓(xùn)練 傣語(yǔ) 隱馬爾可夫模型 STRAIGHT合成器
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TN912.33
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-13
- 1.1 語(yǔ)音合成概述7-11
- 1.1.1 什么是語(yǔ)音合成7-8
- 1.1.2 語(yǔ)音合成技術(shù)方法分類8-9
- 1.1.3 語(yǔ)音合成的發(fā)展歷史與現(xiàn)狀研究9-11
- 1.2 傣語(yǔ)語(yǔ)音合成概述11-12
- 1.2.1 傣語(yǔ)概述11
- 1.2.2 傣語(yǔ)語(yǔ)音合成現(xiàn)狀11-12
- 1.3 作者的工作12
- 1.4 論文的組織12-13
- 第二章 基于HMM的可訓(xùn)練語(yǔ)音合成系統(tǒng)13-19
- 2.1 HMM模型簡(jiǎn)介13-16
- 2.1.1 離散馬爾可夫鏈13
- 2.1.2 隱馬爾可夫模型13-15
- 2.1.3 HMM三個(gè)基本問(wèn)題15-16
- 2.2 HMM在語(yǔ)音合成中的應(yīng)用16
- 2.3 合成系統(tǒng)框架16-19
- 2.3.1 合成系統(tǒng)介紹16-18
- 2.3.2 基于HMM的可訓(xùn)練語(yǔ)音合成的特點(diǎn)18-19
- 第三章 傣語(yǔ)語(yǔ)音合成數(shù)據(jù)準(zhǔn)備19-41
- 3.1 語(yǔ)音語(yǔ)料庫(kù)構(gòu)建19-20
- 3.1.1 語(yǔ)料獲取19-20
- 3.1.2 錄制語(yǔ)音20
- 3.1.3 發(fā)音文稿校正20
- 3.2 音素列表確定20-25
- 3.3 標(biāo)注文件獲取25-39
- 3.3.1 單音子文件25-36
- 3.3.2 三音子文件36-39
- 3.4 上下文屬性和問(wèn)題集設(shè)計(jì)39-41
- 第四章 傣語(yǔ)語(yǔ)音合成系統(tǒng)構(gòu)建41-51
- 4.1 環(huán)境和工具41-42
- 4.1.1 環(huán)境概述41
- 4.1.2 工具簡(jiǎn)介41-42
- 4.2 建模參數(shù)配置42
- 4.3 模型訓(xùn)練42-47
- 4.3.1 特征參數(shù)文件提取42-43
- 4.3.2 HMM模型訓(xùn)練43-47
- 4.4 合成語(yǔ)音47-48
- 4.5 實(shí)驗(yàn)結(jié)果48-51
- 第五章 總結(jié)和展望51-53
- 5.1 總結(jié)51-52
- 5.2 展望52-53
- 參考文獻(xiàn)53-55
- 攻讀碩士學(xué)位期間完成的科研成果55-56
- 致謝56
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;移動(dòng)設(shè)備的又一增值服務(wù)──移動(dòng)設(shè)備嵌入式語(yǔ)音合成系統(tǒng)[J];通信世界;2001年22期
2 ;科大訊飛新一代語(yǔ)音合成系統(tǒng)新特性[J];通訊世界;2005年06期
3 艾散·帕合提;蔡亞永;買(mǎi)爾丹·祖農(nóng);;語(yǔ)音合成系統(tǒng)的研究與應(yīng)用[J];信息通信;2012年05期
4 朱軍,翟宗起,柴立功,胡永生;智能語(yǔ)音合成系統(tǒng)的研究與實(shí)現(xiàn)[J];微機(jī)發(fā)展;1997年04期
5 呂慶莉,年瑋;明日的播音明星 幾可亂真的人工語(yǔ)音問(wèn)世[J];國(guó)外科技動(dòng)態(tài);2003年03期
6 沈承,曹廣益,朱新堅(jiān);低成本超大容量電子語(yǔ)音說(shuō)明書(shū)系統(tǒng)的開(kāi)發(fā)[J];微型機(jī)與應(yīng)用;2001年03期
7 ;科大訊飛推出最新語(yǔ)音合成系統(tǒng)InterPhonic C&E v2.1[J];電信科學(xué);2003年04期
8 ;新產(chǎn)品、新技術(shù)簡(jiǎn)訊[J];電子科技文摘;2003年12期
9 賈熹濱;尹寶才;李敬華;;語(yǔ)音同步的可視語(yǔ)音合成技術(shù)研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2005年06期
10 張鵬;;嵌入式語(yǔ)音合成系統(tǒng)的一種設(shè)計(jì)方案[J];中國(guó)水運(yùn)(理論版);2006年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 王仁華;;語(yǔ)音合成系統(tǒng)發(fā)展與最新進(jìn)展[A];第九屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2007年
2 敖其爾;鞏政;呼日勒巴特爾;王小喻;;蒙古語(yǔ)音合成系統(tǒng)[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
3 董世偉;張家,
本文編號(hào):923446
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/923446.html