天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

面向語(yǔ)音合成的緬甸語(yǔ)文本分析與實(shí)現(xiàn)

發(fā)布時(shí)間:2024-04-18 03:57
  緬甸語(yǔ)是緬甸的官方語(yǔ)言,屬漢藏語(yǔ)系藏緬甸語(yǔ)族緬甸語(yǔ)支,與同語(yǔ)系的漢語(yǔ)和藏語(yǔ)語(yǔ)音合成研究相比,緬甸語(yǔ)語(yǔ)音合成相關(guān)研究亟待重視。本文以開(kāi)發(fā)緬甸語(yǔ)語(yǔ)音合成系統(tǒng)為目的,構(gòu)建發(fā)音語(yǔ)料庫(kù),研究并實(shí)現(xiàn)文本歸一化、分詞和文本注音。本文的主要工作包括:(1)構(gòu)建發(fā)音語(yǔ)料庫(kù)。從緬甸語(yǔ)網(wǎng)站上抓取大約600M原始文本語(yǔ)料,去除語(yǔ)料中的非法字符和重復(fù)句子,并統(tǒng)一文本語(yǔ)料的字符編碼方式。統(tǒng)計(jì)文本語(yǔ)料庫(kù)中的高頻詞、句子長(zhǎng)度、句子類型、聲韻母的分布,將其作為發(fā)音語(yǔ)料選取的依據(jù);為了使發(fā)音語(yǔ)料庫(kù)包含的發(fā)音現(xiàn)象、語(yǔ)言現(xiàn)象更加完整,通過(guò)句子之間的相似度比較作為另一個(gè)選取依據(jù);最終挑選出的發(fā)音語(yǔ)料庫(kù)規(guī)模為5000句。(2)文本歸一化。研究了數(shù)字、縮寫(xiě)詞以及特殊字符的歸一化問(wèn)題,對(duì)不同類型的字符分別提出了具體的歸一化方案并進(jìn)行了實(shí)現(xiàn)。(3)實(shí)現(xiàn)三種分詞方法。設(shè)計(jì)并實(shí)現(xiàn)了基于正向最大匹配(Forward Maximum Matching,簡(jiǎn)稱FMM)的分詞、基于條件隨機(jī)場(chǎng)模型(Conditional Random Fields,簡(jiǎn)稱CRF)分詞以及基于雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)+條件隨機(jī)場(chǎng)模型(Bidirectional Long ...

【文章頁(yè)數(shù)】:68 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 緬甸語(yǔ)簡(jiǎn)介
    1.2 緬甸語(yǔ)語(yǔ)音合成系統(tǒng)概述
    1.3 研究思路及論文的主要工作
    1.4 論文組織結(jié)構(gòu)
第二章 緬甸語(yǔ)發(fā)音語(yǔ)料庫(kù)的構(gòu)建
    2.1 緬甸語(yǔ)字符和音節(jié)介紹
    2.2 發(fā)音語(yǔ)料庫(kù)的構(gòu)建
        2.2.1 選取流程
        2.2.2 選取算法
        2.2.3 實(shí)驗(yàn)結(jié)果及分析
    2.3 語(yǔ)音語(yǔ)料庫(kù)的錄制
    2.4 本章小結(jié)
第三章 緬甸語(yǔ)文本歸一化
    3.1 歸一化簡(jiǎn)介
    3.2 數(shù)字和縮寫(xiě)詞歸一化
    3.3 特殊字符歸一化
    3.4 本章小結(jié)
第四章 緬甸語(yǔ)分詞方法及實(shí)現(xiàn)
    4.1 基于FMM的分詞
    4.2 基于CRF的分詞
        4.2.1 標(biāo)注方式
        4.2.2 特征模板
        4.2.3 CRF分詞過(guò)程
    4.3 基于BiLSTM+CRF的分詞
        4.3.1 LSTM介紹
        4.3.2 BiLSTM+CRF網(wǎng)絡(luò)
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 分詞語(yǔ)料庫(kù)的構(gòu)建
        4.4.2 分詞結(jié)果的評(píng)估
        4.4.3 實(shí)驗(yàn)結(jié)果及分析
    4.5 本章小結(jié)
第五章 緬甸語(yǔ)文本自動(dòng)注音
    5.1 自動(dòng)注音簡(jiǎn)介
        5.1.1 聲母的注音
        5.1.2 韻母的注音
    5.2 自動(dòng)注音方法
        5.2.1 基于聲韻母拼接的注音方法
        5.2.2 基于變音變調(diào)規(guī)則的注音方法
        5.2.3 基于CRF模型的注音方法
    5.3 實(shí)驗(yàn)結(jié)果及分析
    5.4 本章小結(jié)
第六章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間完成的科研成果
致謝



本文編號(hào):3957383

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3957383.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ee826***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com