面向語音合成的馬來語文本分析
發(fā)布時間:2021-05-11 20:13
近年來隨著人工智能的飛速發(fā)展,語音合成技術(shù)也日趨成熟。語音合成技術(shù)應用在我們生活的方方面面,如朗讀軟件、語音播報等領(lǐng)域,F(xiàn)階段,語音合成的主要實現(xiàn)方式為文語轉(zhuǎn)換,即通過計算機實現(xiàn)從文本到語音的轉(zhuǎn)換。但語音合成的研究主要集中在比較通用的語言上,而對馬來語的研究相對較少。本文以開發(fā)馬來語語音合成系統(tǒng)為目的,研究并實現(xiàn)了馬來語前端文本分析中的語料庫的構(gòu)建、文本歸一化和音節(jié)的自動劃分。本論文的主要工作包括:(1)馬來語語料庫的構(gòu)建。借助現(xiàn)有軟件從馬來語網(wǎng)站和電子書上下載馬來語的文本,并去除文本中的非法字符和重復語料,作為本文研究的馬來語文本語料庫;谠撐谋菊Z料庫,采用句型、高頻詞和句子長度相結(jié)合的原則選取用于錄音的發(fā)音語料。最后用優(yōu)劣評判的標準來驗證發(fā)音語料庫的合理性和代表性。(2)馬來語文本中數(shù)字字符的歸一化。研究了馬來語文本中常出現(xiàn)的特殊字符及其歧義類型。設計了馬來語的歸一化方案和算法流程。采用正則表達和關(guān)鍵字相結(jié)合的方法,對句子中的數(shù)字及與數(shù)字連用的特殊字符進行文本歸一化處理。實驗結(jié)果表明,本次實驗的馬來語歸一化正確率達95.13%。(3)馬來語音節(jié)的自動劃分。學習和研究了現(xiàn)有的馬來語...
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 馬來語簡介
1.3 語音合成概述
1.4 論文研究思路及作者的工作
1.5 論文的組織結(jié)構(gòu)
第二章 馬來語語料庫的構(gòu)建
2.1 原始語料的獲取
2.2 文本語料的整理
2.3 發(fā)音語料庫的構(gòu)建
2.4 語音語料庫的錄制
2.5 本章小結(jié)
第三章 馬來語文本歸一化
3.1 文本歸一化簡介
3.2 數(shù)字字符的識別
3.3 數(shù)字字符歧義判斷
3.3.1 數(shù)字歧義判斷
3.3.2 字符歧義判斷
3.4 數(shù)字字符消歧處理
3.4.1 數(shù)字消歧
3.4.2 字符消歧
3.5 數(shù)字字符轉(zhuǎn)化為標準詞
3.5.1 數(shù)字轉(zhuǎn)化為標準詞
3.5.2 字符轉(zhuǎn)化為標準詞
3.6 本章小結(jié)
第四章 馬來語音節(jié)的自動劃分
4.1 馬來語音節(jié)結(jié)構(gòu)
4.2 基于音節(jié)列表的音節(jié)化方案
4.3 音節(jié)化方案的改進
4.4 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗平臺
5.2 實驗結(jié)果與分析
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
參加的項目和發(fā)表的論文
致謝
【參考文獻】:
期刊論文
[1]人工智能識別技術(shù)及其應用[J]. 熊曉倩. 信息通信. 2018(01)
[2]智能語音產(chǎn)品現(xiàn)狀及展望[J]. 甘玉玨,蘇軍根,林健,洪博宇,魯維. 廣東通信技術(shù). 2017(12)
[3]“歐盟口譯語料庫”項目分析與啟示[J]. 鄧軍濤,古煜奎. 現(xiàn)代教育技術(shù). 2017(12)
[4]淺析人工智能技術(shù)及其在智能機器人領(lǐng)域的應用[J]. 李柏陽. 數(shù)字通信世界. 2017(12)
[5]人工智能+ 共創(chuàng)美好新世界——訪科大訊飛副總裁趙志偉[J]. 黃曉艷. 高科技與產(chǎn)業(yè)化. 2017(08)
[6]基于雙語句對覆蓋度的維漢機器翻譯語料選取技術(shù)[J]. 朱少林,楊雅婷,米成剛,李曉,王磊. 中國科學技術(shù)大學學報. 2017(04)
[7]標識語漢英雙語平行語料庫的設計與創(chuàng)建[J]. 李廣偉,戈玲玲. 南華大學學報(社會科學版). 2015(01)
[8]基于HMM的中英文語音合成技術(shù)研究[J]. 紀正飚,王吉林,趙力. 科學技術(shù)與工程. 2014(32)
[9]英語語音合成系統(tǒng)超前端文本分析知識庫的構(gòu)建[J]. 馬立東. 電腦與信息技術(shù). 2013(05)
[10]可訓練語音合成在越南語合成中的應用[J]. 奎麗萍,楊鑒,胡恩星,何彬. 計算機工程與應用. 2012(35)
碩士論文
[1]基于HMM的可訓練傣語語音合成系統(tǒng)[D]. 陳志瓊.云南大學 2016
[2]面向文語轉(zhuǎn)換的傣語文本歸一化和羅馬化[D]. 胡湘興.云南大學 2015
本文編號:3182036
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 馬來語簡介
1.3 語音合成概述
1.4 論文研究思路及作者的工作
1.5 論文的組織結(jié)構(gòu)
第二章 馬來語語料庫的構(gòu)建
2.1 原始語料的獲取
2.2 文本語料的整理
2.3 發(fā)音語料庫的構(gòu)建
2.4 語音語料庫的錄制
2.5 本章小結(jié)
第三章 馬來語文本歸一化
3.1 文本歸一化簡介
3.2 數(shù)字字符的識別
3.3 數(shù)字字符歧義判斷
3.3.1 數(shù)字歧義判斷
3.3.2 字符歧義判斷
3.4 數(shù)字字符消歧處理
3.4.1 數(shù)字消歧
3.4.2 字符消歧
3.5 數(shù)字字符轉(zhuǎn)化為標準詞
3.5.1 數(shù)字轉(zhuǎn)化為標準詞
3.5.2 字符轉(zhuǎn)化為標準詞
3.6 本章小結(jié)
第四章 馬來語音節(jié)的自動劃分
4.1 馬來語音節(jié)結(jié)構(gòu)
4.2 基于音節(jié)列表的音節(jié)化方案
4.3 音節(jié)化方案的改進
4.4 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗平臺
5.2 實驗結(jié)果與分析
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
參加的項目和發(fā)表的論文
致謝
【參考文獻】:
期刊論文
[1]人工智能識別技術(shù)及其應用[J]. 熊曉倩. 信息通信. 2018(01)
[2]智能語音產(chǎn)品現(xiàn)狀及展望[J]. 甘玉玨,蘇軍根,林健,洪博宇,魯維. 廣東通信技術(shù). 2017(12)
[3]“歐盟口譯語料庫”項目分析與啟示[J]. 鄧軍濤,古煜奎. 現(xiàn)代教育技術(shù). 2017(12)
[4]淺析人工智能技術(shù)及其在智能機器人領(lǐng)域的應用[J]. 李柏陽. 數(shù)字通信世界. 2017(12)
[5]人工智能+ 共創(chuàng)美好新世界——訪科大訊飛副總裁趙志偉[J]. 黃曉艷. 高科技與產(chǎn)業(yè)化. 2017(08)
[6]基于雙語句對覆蓋度的維漢機器翻譯語料選取技術(shù)[J]. 朱少林,楊雅婷,米成剛,李曉,王磊. 中國科學技術(shù)大學學報. 2017(04)
[7]標識語漢英雙語平行語料庫的設計與創(chuàng)建[J]. 李廣偉,戈玲玲. 南華大學學報(社會科學版). 2015(01)
[8]基于HMM的中英文語音合成技術(shù)研究[J]. 紀正飚,王吉林,趙力. 科學技術(shù)與工程. 2014(32)
[9]英語語音合成系統(tǒng)超前端文本分析知識庫的構(gòu)建[J]. 馬立東. 電腦與信息技術(shù). 2013(05)
[10]可訓練語音合成在越南語合成中的應用[J]. 奎麗萍,楊鑒,胡恩星,何彬. 計算機工程與應用. 2012(35)
碩士論文
[1]基于HMM的可訓練傣語語音合成系統(tǒng)[D]. 陳志瓊.云南大學 2016
[2]面向文語轉(zhuǎn)換的傣語文本歸一化和羅馬化[D]. 胡湘興.云南大學 2015
本文編號:3182036
本文鏈接:http://sikaile.net/kejilunwen/wltx/3182036.html
最近更新
教材專著