面向語音合成的印尼語文本分析與處理
【學(xué)位單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.33;TP391.1
【部分圖文】:
由于句子的長度會影響錄音人話音質(zhì)量進而影響合成的語音質(zhì)量,故統(tǒng)計了??文本語料庫中的句子長度,即統(tǒng)計每個句子中所含的單詞的個數(shù),其句長的分布??如圖2-2所示。該直方圖直觀地給出了文本語料庫中不同長度句子的分布情況,且??為發(fā)音語料庫的選取提供了可行性依據(jù),并作為評判發(fā)音語料庫質(zhì)量的標準之一。??10??
??圖2-1:語料庫挑選過程??本次實驗構(gòu)建的發(fā)音語料庫由4400個陳述句,200個感嘆句,400個疑問句,??共計5000個句子組成,其中疑問句包括一般疑問句和特殊疑問句各200句。??由于句子的長度會影響錄音人話音質(zhì)量進而影響合成的語音質(zhì)量,故統(tǒng)計了??文本語料庫中的句子長度,即統(tǒng)計每個句子中所含的單詞的個數(shù),其句長的分布??如圖2-2所示。該直方圖直觀地給出了文本語料庫中不同長度句子的分布情況,且??為發(fā)音語料庫的選取提供了可行性依據(jù),并作為評判發(fā)音語料庫質(zhì)量的標準之一。??10??
pada?1455413??根據(jù)所創(chuàng)建的高頻詞詞典及文本語料庫所含有的總詞數(shù),可以得到詞匯的覆??蓋率曲線如圖2-3所示。該圖的繪制思想為:從詞頻數(shù)最高的詞為起始,累加計算??每個詞的出現(xiàn)次數(shù)占文本詞匯總出現(xiàn)次數(shù)的比值,將比值作為繪圖點進行連接。??12??
【參考文獻】
相關(guān)期刊論文 前10條
1 李廣偉;戈玲玲;;標識語漢英雙語平行語料庫的設(shè)計與創(chuàng)建[J];南華大學(xué)學(xué)報(社會科學(xué)版);2015年01期
2 劉豫軍;夏聰;;計算機語音合成技術(shù)研究及發(fā)展方向[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2014年12期
3 紀正飚;王吉林;趙力;;基于HMM的中英文語音合成技術(shù)研究[J];科學(xué)技術(shù)與工程;2014年32期
4 于延鎖;朱風(fēng)云;李先剛;劉翼;吳璽宏;;面向大語料庫的語音合成方法研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年05期
5 馬立東;;英語語音合成系統(tǒng)超前端文本分析知識庫的構(gòu)建[J];電腦與信息技術(shù);2013年05期
6 高璐;陳琪;李永宏;于洪志;;藏語語音合成中文本分析的若干問題研究[J];西北民族大學(xué)學(xué)報(自然科學(xué)版);2010年02期
7 趙暉;林成龍;唐朝京;;基于視頻三音子的漢語雙模態(tài)語料庫的建立[J];中文信息學(xué)報;2009年05期
8 賈玉祥;黃德智;劉武;俞士汶;;中文語音合成中的文本正則化研究[J];中文信息學(xué)報;2008年05期
9 陳靜;李薇;崔忠偉;劉霞;;語音合成技術(shù)的研究及其發(fā)展[J];中國科技信息;2007年14期
10 吳義堅;王仁華;;基于HMM的可訓(xùn)練中文語音合成[J];中文信息學(xué)報;2006年04期
相關(guān)博士學(xué)位論文 前2條
1 楊辰雨;語音合成音庫自動標注方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
2 雷鳴;統(tǒng)計參數(shù)語音合成中的聲學(xué)模型建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前4條
1 王昱;傣語中的漢語借詞發(fā)音規(guī)則及其語音合成方法研究[D];云南大學(xué);2016年
2 侯亭武;基于語料庫的中文語音合成技術(shù)研究[D];華中科技大學(xué);2015年
3 葉林沿;基于依存關(guān)系樹的復(fù)句句法特征自動選取[D];華中師范大學(xué);2014年
4 梁怡佳;印尼語與漢語語音對比研究[D];湖南師范大學(xué);2014年
本文編號:2836634
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2836634.html