基于HMM的臧語(yǔ)安多方言語(yǔ)音合成的研究
發(fā)布時(shí)間:2020-08-17 14:57
【摘要】:隨著人工智能的發(fā)展,計(jì)算機(jī)語(yǔ)音合成的研究已經(jīng)很普遍。但是讓計(jì)算機(jī)說(shuō)話的語(yǔ)音合成技術(shù),較多應(yīng)用于漢語(yǔ)、英語(yǔ)、日語(yǔ)等。對(duì)于一些古老少數(shù)民族的語(yǔ)音合成技術(shù)仍然落后。藏語(yǔ)安多方言的研究都是以語(yǔ)言學(xué)為基礎(chǔ)。藏語(yǔ)安多方言語(yǔ)音合成技術(shù)的研究仍然比較匱乏,也沒(méi)有一套專(zhuān)門(mén)面向安多方言的計(jì)算機(jī)標(biāo)注系統(tǒng)。本論文主要實(shí)現(xiàn)了基于HMM的藏語(yǔ)安多方言的語(yǔ)音合成。論文的工作和創(chuàng)新如下:1.設(shè)計(jì)了一套面向藏語(yǔ)安多方言語(yǔ)音合成的計(jì)算機(jī)標(biāo)注系統(tǒng),實(shí)現(xiàn)了安多方言的語(yǔ)音合成。首先以最基本的基元聲韻母為研究對(duì)象,總結(jié)出安多方言所有聲韻母特性。然后對(duì)藏文進(jìn)行研究,設(shè)計(jì)了以基字丁為基礎(chǔ)的不同藏文字對(duì)應(yīng)的聲韻母庫(kù),設(shè)計(jì)了安多方言的機(jī)讀音標(biāo)SAMPA-ADT。結(jié)合安多方言的詞邊界,句子邊界等信息。完成了標(biāo)注系統(tǒng)的建立。2.設(shè)計(jì)藏語(yǔ)安多方言的語(yǔ)料庫(kù)。根據(jù)安多方言的特殊發(fā)音規(guī)律,結(jié)合安多方言的《方言調(diào)查字表》,設(shè)計(jì)了安多的500句文本語(yǔ)料信息,尋找安多2男2女進(jìn)行專(zhuān)業(yè)錄音。并對(duì)語(yǔ)料進(jìn)行切分標(biāo)注。3.利用基于HMM的語(yǔ)音合成技術(shù),通過(guò)說(shuō)話人自適應(yīng)訓(xùn)練,合成了自然度較高的藏語(yǔ)安多方言語(yǔ)音。通過(guò)語(yǔ)音合成實(shí)驗(yàn),對(duì)合成的語(yǔ)音進(jìn)行了MOS和DMOS評(píng)測(cè)。實(shí)驗(yàn)結(jié)果表明,通過(guò)說(shuō)話人自適應(yīng)訓(xùn)練方法,可以提高藏語(yǔ)安多方言語(yǔ)音的音質(zhì)。
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TN912.3
【圖文】:
基于 HMM 的藏語(yǔ)安多方言語(yǔ)音合成的研究第 2 章 藏語(yǔ)安多方言發(fā)音介紹言屬歸個(gè)古老的語(yǔ)言,藏語(yǔ)方言主要由衛(wèi)藏方言、安多方言和康特征比較,安多方言大于康巴方言大于衛(wèi)藏方言。安多方多的方言,研究安多方言有助于保護(hù)藏族文化。主要分布在青海的海北藏族自治州等 5 個(gè)自治州,甘肅的治縣,四川省北部等地。安多地區(qū)根據(jù)地理位置不同分為具體可細(xì)分為牧區(qū)土話、農(nóng)區(qū)土話和半農(nóng)半牧區(qū)土話和道分布在安多大部分地區(qū),農(nóng)區(qū)土話分布在尖扎縣,半農(nóng)半仁縣為主,道孚土語(yǔ)主要分布于康區(qū)。如下圖 2.1 所示。
基于 HMM 的藏語(yǔ)安多方言語(yǔ)音合成的研究2.2 語(yǔ)音的錄制在專(zhuān)業(yè)錄音棚中,采用 Pro Tools 單聲道錄音軟件進(jìn)行錄音,采樣率為 16樣精度為 16 位。保存為 Wav 格式文件。因音質(zhì)效果會(huì)影響實(shí)驗(yàn)結(jié)果質(zhì)量音工作量較大。我們可根據(jù)計(jì)算機(jī)屏幕顯示器的語(yǔ)音波形和耳機(jī)跟聽(tīng)進(jìn)行音質(zhì)的監(jiān)控。以便保證高效錄音。下圖 3.2 為錄音界面。
基于 HTS 的統(tǒng)計(jì)參數(shù)的語(yǔ)音合成中最核心的工作就是標(biāo)注,對(duì)藏語(yǔ)安多韻母、詞邊界信息、語(yǔ)句邊界信息進(jìn)行標(biāo)注,標(biāo)注時(shí)與藏語(yǔ)安多方言相同,我們直接按照國(guó)際上通用的機(jī)讀音標(biāo)進(jìn)行標(biāo)注,不同的部分根據(jù)簡(jiǎn)化原安多方言獨(dú)有的 SAMA-ADT 標(biāo)注。我們根據(jù)根據(jù)安多方言語(yǔ)法規(guī)則知識(shí)進(jìn)行文本規(guī)范,轉(zhuǎn)化成標(biāo)準(zhǔn)的書(shū)寫(xiě)形式。例如文本中的數(shù)字、標(biāo)點(diǎn)、日期等的規(guī)范,還要檢查控制符的合法性,濾掉系統(tǒng)不能辨識(shí)的錯(cuò)誤的字符。法詞典,對(duì)語(yǔ)法進(jìn)行分析,確定詞邊界和句子邊界信息,對(duì)于安多文本來(lái)說(shuō)漢語(yǔ)簡(jiǎn)單明顯。它的句子中有明顯的詞的分隔符和句子分隔符。對(duì)輸入的本進(jìn)行詞邊界和句子邊界的識(shí)別。根據(jù)語(yǔ)法詞典分析,和其他相關(guān)信息確的升調(diào)、降調(diào)、重讀部分。在這部分中,通過(guò)研究安多方言的語(yǔ)法結(jié)構(gòu)。轉(zhuǎn)換規(guī)則,最終形成一個(gè)安多音庫(kù)。在這部分內(nèi)容中,得到了詞邊界、句信息,語(yǔ)句相關(guān)的升降調(diào)和重讀信息。確定每個(gè)單字或字符的讀音,為生方言單音素標(biāo)注文件、上下文相關(guān)標(biāo)注文件做了準(zhǔn)備。如圖 4.1 所示,為言文本分析及標(biāo)注文件生成流程圖。
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:TN912.3
【圖文】:
基于 HMM 的藏語(yǔ)安多方言語(yǔ)音合成的研究第 2 章 藏語(yǔ)安多方言發(fā)音介紹言屬歸個(gè)古老的語(yǔ)言,藏語(yǔ)方言主要由衛(wèi)藏方言、安多方言和康特征比較,安多方言大于康巴方言大于衛(wèi)藏方言。安多方多的方言,研究安多方言有助于保護(hù)藏族文化。主要分布在青海的海北藏族自治州等 5 個(gè)自治州,甘肅的治縣,四川省北部等地。安多地區(qū)根據(jù)地理位置不同分為具體可細(xì)分為牧區(qū)土話、農(nóng)區(qū)土話和半農(nóng)半牧區(qū)土話和道分布在安多大部分地區(qū),農(nóng)區(qū)土話分布在尖扎縣,半農(nóng)半仁縣為主,道孚土語(yǔ)主要分布于康區(qū)。如下圖 2.1 所示。
基于 HMM 的藏語(yǔ)安多方言語(yǔ)音合成的研究2.2 語(yǔ)音的錄制在專(zhuān)業(yè)錄音棚中,采用 Pro Tools 單聲道錄音軟件進(jìn)行錄音,采樣率為 16樣精度為 16 位。保存為 Wav 格式文件。因音質(zhì)效果會(huì)影響實(shí)驗(yàn)結(jié)果質(zhì)量音工作量較大。我們可根據(jù)計(jì)算機(jī)屏幕顯示器的語(yǔ)音波形和耳機(jī)跟聽(tīng)進(jìn)行音質(zhì)的監(jiān)控。以便保證高效錄音。下圖 3.2 為錄音界面。
基于 HTS 的統(tǒng)計(jì)參數(shù)的語(yǔ)音合成中最核心的工作就是標(biāo)注,對(duì)藏語(yǔ)安多韻母、詞邊界信息、語(yǔ)句邊界信息進(jìn)行標(biāo)注,標(biāo)注時(shí)與藏語(yǔ)安多方言相同,我們直接按照國(guó)際上通用的機(jī)讀音標(biāo)進(jìn)行標(biāo)注,不同的部分根據(jù)簡(jiǎn)化原安多方言獨(dú)有的 SAMA-ADT 標(biāo)注。我們根據(jù)根據(jù)安多方言語(yǔ)法規(guī)則知識(shí)進(jìn)行文本規(guī)范,轉(zhuǎn)化成標(biāo)準(zhǔn)的書(shū)寫(xiě)形式。例如文本中的數(shù)字、標(biāo)點(diǎn)、日期等的規(guī)范,還要檢查控制符的合法性,濾掉系統(tǒng)不能辨識(shí)的錯(cuò)誤的字符。法詞典,對(duì)語(yǔ)法進(jìn)行分析,確定詞邊界和句子邊界信息,對(duì)于安多文本來(lái)說(shuō)漢語(yǔ)簡(jiǎn)單明顯。它的句子中有明顯的詞的分隔符和句子分隔符。對(duì)輸入的本進(jìn)行詞邊界和句子邊界的識(shí)別。根據(jù)語(yǔ)法詞典分析,和其他相關(guān)信息確的升調(diào)、降調(diào)、重讀部分。在這部分中,通過(guò)研究安多方言的語(yǔ)法結(jié)構(gòu)。轉(zhuǎn)換規(guī)則,最終形成一個(gè)安多音庫(kù)。在這部分內(nèi)容中,得到了詞邊界、句信息,語(yǔ)句相關(guān)的升降調(diào)和重讀信息。確定每個(gè)單字或字符的讀音,為生方言單音素標(biāo)注文件、上下文相關(guān)標(biāo)注文件做了準(zhǔn)備。如圖 4.1 所示,為言文本分析及標(biāo)注文件生成流程圖。
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王海燕;楊鴻武;甘振業(yè);裴東;;基于說(shuō)話人自適應(yīng)訓(xùn)練的漢藏雙語(yǔ)語(yǔ)音合成[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
2 麥麥提艾力·吐?tīng)栠d;;基于上下文音節(jié)的維吾爾語(yǔ)語(yǔ)音合成系統(tǒng)研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年31期
3 高璐;于洪志;鄭文思;;基于HMM的藏語(yǔ)拉薩話語(yǔ)音合成技術(shù)研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期
4 李永宏;于洪志;孔江平;;藏語(yǔ)連續(xù)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2010年13期
5 張家
本文編號(hào):2795471
本文鏈接:http://sikaile.net/kejilunwen/wltx/2795471.html
最近更新
教材專(zhuān)著