天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 信息工程論文 >

面向語音合成的印尼語文本分析與處理

發(fā)布時間:2020-10-11 13:09
   讓計算機能聽、能看、能說、能感覺,是未來人機交互的發(fā)展方向。語音合成在導(dǎo)航、通信等領(lǐng)域都有廣泛運用。目前,文語轉(zhuǎn)換依舊是語音合成的主要方法,即運用計算機實現(xiàn)從給定文本到相應(yīng)語音的轉(zhuǎn)換。目前,對語音合成的研究較集中于英語、漢語等語言中,對于印尼語的研究相對較少。印尼語屬馬來-波利尼西亞語系西印度尼西亞語支,是一種由拉丁字母構(gòu)成的、有明顯詞邊界的語言。本文主要針對印尼語語音合成系統(tǒng),研究并實現(xiàn)印尼語前端文本分析中的語音語料庫構(gòu)建、文本歸一化、音節(jié)化以及音子的劃分。本文的主要工作包括:(1)印尼語發(fā)音語料庫的構(gòu)建。從印尼語網(wǎng)站中收集了印尼語文本,對文本進行去重和去非法字符處理,并將其用作構(gòu)建印尼語發(fā)音語料庫的初始文本語料庫。在該語料庫的基礎(chǔ)上,綜合考慮句子長度和高頻詞挑選得到印尼語的發(fā)音語料庫,并用客觀的評價標準對其進行評價。(2)印尼語文本中非標準“詞”的歸一化。研究了常出現(xiàn)在印尼語文本中的非標準“詞”及其歧義種類,并提出印尼語文本非標準“詞”的歸一化方法和實現(xiàn)流程。用正則表達式與關(guān)鍵詞相結(jié)合的方法對文本中的數(shù)字串、與數(shù)字連用的特殊字符的進行歸一化處理,用字符匹配的方法對文本中的縮寫詞進行歸一化處理。對實驗結(jié)果統(tǒng)計得到文本歸一化正確率達96.2%。(3)面向語音合成的印尼語的音節(jié)化。研究了印尼語的音節(jié)構(gòu)成,在此基礎(chǔ)上提出適用于語音合成的印尼語音節(jié)化方案,并對其進行實現(xiàn)。采用基于音節(jié)列表的逆向最大匹配的方法,并在此基礎(chǔ)上添加零聲母規(guī)則實現(xiàn)音節(jié)劃分。經(jīng)統(tǒng)計得該次實驗集內(nèi)測試的正確率為98.2%,集外測試的正確率為97.1%。(4)印尼語音子的劃分。針對印尼語語音合成,提出并實現(xiàn)了基于印尼語特性的音子劃分方案。采用基于聲韻母結(jié)構(gòu)的方法和音素的結(jié)構(gòu)的方法分別確定了音子列表,并運用字典匹配的方法實現(xiàn)印尼語語音語料庫文本的音子劃分,得到韻律文本。
【學(xué)位單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.33;TP391.1
【部分圖文】:

過程圖,語料庫,過程


由于句子的長度會影響錄音人話音質(zhì)量進而影響合成的語音質(zhì)量,故統(tǒng)計了??文本語料庫中的句子長度,即統(tǒng)計每個句子中所含的單詞的個數(shù),其句長的分布??如圖2-2所示。該直方圖直觀地給出了文本語料庫中不同長度句子的分布情況,且??為發(fā)音語料庫的選取提供了可行性依據(jù),并作為評判發(fā)音語料庫質(zhì)量的標準之一。??10??

句子長度,語料庫,文本,分布直方圖


??圖2-1:語料庫挑選過程??本次實驗構(gòu)建的發(fā)音語料庫由4400個陳述句,200個感嘆句,400個疑問句,??共計5000個句子組成,其中疑問句包括一般疑問句和特殊疑問句各200句。??由于句子的長度會影響錄音人話音質(zhì)量進而影響合成的語音質(zhì)量,故統(tǒng)計了??文本語料庫中的句子長度,即統(tǒng)計每個句子中所含的單詞的個數(shù),其句長的分布??如圖2-2所示。該直方圖直觀地給出了文本語料庫中不同長度句子的分布情況,且??為發(fā)音語料庫的選取提供了可行性依據(jù),并作為評判發(fā)音語料庫質(zhì)量的標準之一。??10??

曲線,詞匯,覆蓋率,出現(xiàn)次數(shù)


pada?1455413??根據(jù)所創(chuàng)建的高頻詞詞典及文本語料庫所含有的總詞數(shù),可以得到詞匯的覆??蓋率曲線如圖2-3所示。該圖的繪制思想為:從詞頻數(shù)最高的詞為起始,累加計算??每個詞的出現(xiàn)次數(shù)占文本詞匯總出現(xiàn)次數(shù)的比值,將比值作為繪圖點進行連接。??12??
【參考文獻】

相關(guān)期刊論文 前10條

1 李廣偉;戈玲玲;;標識語漢英雙語平行語料庫的設(shè)計與創(chuàng)建[J];南華大學(xué)學(xué)報(社會科學(xué)版);2015年01期

2 劉豫軍;夏聰;;計算機語音合成技術(shù)研究及發(fā)展方向[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2014年12期

3 紀正飚;王吉林;趙力;;基于HMM的中英文語音合成技術(shù)研究[J];科學(xué)技術(shù)與工程;2014年32期

4 于延鎖;朱風(fēng)云;李先剛;劉翼;吳璽宏;;面向大語料庫的語音合成方法研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年05期

5 馬立東;;英語語音合成系統(tǒng)超前端文本分析知識庫的構(gòu)建[J];電腦與信息技術(shù);2013年05期

6 高璐;陳琪;李永宏;于洪志;;藏語語音合成中文本分析的若干問題研究[J];西北民族大學(xué)學(xué)報(自然科學(xué)版);2010年02期

7 趙暉;林成龍;唐朝京;;基于視頻三音子的漢語雙模態(tài)語料庫的建立[J];中文信息學(xué)報;2009年05期

8 賈玉祥;黃德智;劉武;俞士汶;;中文語音合成中的文本正則化研究[J];中文信息學(xué)報;2008年05期

9 陳靜;李薇;崔忠偉;劉霞;;語音合成技術(shù)的研究及其發(fā)展[J];中國科技信息;2007年14期

10 吳義堅;王仁華;;基于HMM的可訓(xùn)練中文語音合成[J];中文信息學(xué)報;2006年04期


相關(guān)博士學(xué)位論文 前2條

1 楊辰雨;語音合成音庫自動標注方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年

2 雷鳴;統(tǒng)計參數(shù)語音合成中的聲學(xué)模型建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年


相關(guān)碩士學(xué)位論文 前4條

1 王昱;傣語中的漢語借詞發(fā)音規(guī)則及其語音合成方法研究[D];云南大學(xué);2016年

2 侯亭武;基于語料庫的中文語音合成技術(shù)研究[D];華中科技大學(xué);2015年

3 葉林沿;基于依存關(guān)系樹的復(fù)句句法特征自動選取[D];華中師范大學(xué);2014年

4 梁怡佳;印尼語與漢語語音對比研究[D];湖南師范大學(xué);2014年



本文編號:2836634

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2836634.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4fe60***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
久热久热精品视频在线观看| 久久福利视频视频一区二区| 国产综合香蕉五月婷在线| 1024你懂的在线视频| 国产丝袜美女诱惑一区二区| 九七人妻一区二区三区| 久久精品亚洲欧美日韩| 欧美精品亚洲精品日韩专区| 国产成人精品一区在线观看| 亚洲视频偷拍福利来袭| 一区二区三区人妻在线| 99少妇偷拍视频在线| 国产又粗又黄又爽又硬的| 人妻偷人精品一区二区三区不卡| 91人妻人人精品人人爽| 午夜精品成年人免费视频| 日本在线不卡高清欧美| 日本欧美在线一区二区三区| 国产超碰在线观看免费| 懂色一区二区三区四区| 91福利免费一区二区三区| 国产一级内片内射免费看| 亚洲欧美一二区日韩高清在线| 国产欧美日韩不卡在线视频| 国内欲色一区二区三区| 精品香蕉国产一区二区三区| 国产av一区二区三区久久不卡| 国产精品十八禁亚洲黄污免费观看 | 91欧美日韩一区人妻少妇| 久久亚洲精品成人国产| 内射精品欧美一区二区三区久久久| 欧美精品久久一二三区| 亚洲一区二区欧美在线| 色好吊视频这里只有精| 亚洲欧美日本视频一区二区| 精品欧美日韩一区二区三区| 国产日韩在线一二三区| 亚洲午夜精品视频观看| 国产日韩综合一区在线观看| 国产精品一区二区三区黄色片| 在线观看免费午夜福利|