嵌入式語(yǔ)音合成技術(shù)研究
本文關(guān)鍵詞: 語(yǔ)音合成 文語(yǔ)轉(zhuǎn)換 語(yǔ)音庫(kù) 語(yǔ)音索引模塊 語(yǔ)音播放模塊 出處:《北方工業(yè)大學(xué)》2012年碩士論文 論文類型:學(xué)位論文
【摘要】:語(yǔ)音合成是將文字信息轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái)的信息處理技術(shù)。語(yǔ)音合成技術(shù)自提出以來(lái)已經(jīng)有百年歷史。經(jīng)過(guò)百余年來(lái)的研究和發(fā)展,語(yǔ)音合成技術(shù)在合成理念、合成算法和可實(shí)現(xiàn)性等方面取得了巨大的進(jìn)步。該技術(shù)在人機(jī)交互,文字信息處理領(lǐng)域有著廣泛的應(yīng)用。 本文首先介紹了語(yǔ)音合成技術(shù)的發(fā)展及現(xiàn)狀。其次對(duì)語(yǔ)音合成技術(shù)中的直接模擬發(fā)聲法、共振峰語(yǔ)音合成、LPC合成、PSOLA等算法進(jìn)行了系統(tǒng)的對(duì)比和分析研究。然后介紹了漢語(yǔ)語(yǔ)音知識(shí)和文本內(nèi)容標(biāo)準(zhǔn)化的處理方法及流程。最后設(shè)計(jì)并實(shí)現(xiàn)了一種適于嵌入式系統(tǒng)上運(yùn)行的文語(yǔ)轉(zhuǎn)換系統(tǒng)。本文詳述了該文語(yǔ)轉(zhuǎn)換系統(tǒng)語(yǔ)音庫(kù)的建立過(guò)程,包括語(yǔ)音單元的選擇、多音字的處理、語(yǔ)音單元的連接、以及語(yǔ)音索引模塊和語(yǔ)音播放模塊的建立。 本文以C++編程語(yǔ)言建立了語(yǔ)音庫(kù)、語(yǔ)音索引動(dòng)態(tài)鏈接庫(kù)、語(yǔ)音播放動(dòng)態(tài)鏈接庫(kù),并以此為基礎(chǔ)在不調(diào)用第三方組組件的情況下,實(shí)現(xiàn)了一個(gè)文本語(yǔ)音轉(zhuǎn)換應(yīng)用系統(tǒng),具備文本到語(yǔ)音轉(zhuǎn)換所需的基本功能。
[Abstract]:Speech synthesis is a kind of information processing technology that converts text information into standard and fluent speech reading. Speech synthesis technology has a history of one hundred years since it was put forward. After more than 100 years of research and development, speech synthesis technology is in the concept of synthesis. Great progress has been made in composition algorithm and realizability. This technology has been widely used in the field of human-computer interaction and word information processing. This paper first introduces the development and present situation of speech synthesis technology. The resonance peak speech synthesis / LPC synthesis algorithm PSOLA is compared and analyzed systematically. Then, the processing method and flow chart of standardization of Chinese phonetic knowledge and text content are introduced. Finally, a suitable embedding method is designed and implemented. In this paper, the establishment process of the speech corpus of the speech conversion system is described in detail. It includes the choice of speech unit, the processing of multi-tone word, the connection of speech unit, and the establishment of speech index module and speech playing module. In this paper, we set up a speech base, a speech index dynamic link library and a speech playback dynamic link library based on C programming language. Based on this, a text voice conversion application system is implemented without calling the third-party group components. Basic functions required for text-to-speech conversion.
【學(xué)位授予單位】:北方工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TN912.33;TP368.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 韓紀(jì)慶;邵艷秋;;基于語(yǔ)音信號(hào)的情感處理研究進(jìn)展[J];電聲技術(shù);2006年05期
2 王茂林;漢語(yǔ)自然話語(yǔ)韻律組塊的優(yōu)選論分析[J];暨南學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2005年04期
3 劉遷;賈惠波;;中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J];計(jì)算機(jī)工程與應(yīng)用;2006年03期
4 徐英瑩,張培仁;粵語(yǔ)語(yǔ)音合成系統(tǒng)語(yǔ)料庫(kù)設(shè)計(jì)研究[J];計(jì)算機(jī)工程;2005年14期
5 葉振興;蔡蓮紅;;一種基于決策樹(shù)模型的音庫(kù)構(gòu)建和基元選取方法[J];計(jì)算機(jī)工程;2006年10期
6 王浩;李順華;岳振軍;;基于正弦諧波模型的語(yǔ)音變換技術(shù)[J];軍事通信技術(shù);2006年02期
7 李祖鵬,姚佩陽(yáng);一種高性能漢語(yǔ)語(yǔ)音基音周期估計(jì)方法[J];空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年04期
8 霍華,普杰信,劉俊強(qiáng),馮陽(yáng)春,王平;基于基音同步疊加的漢語(yǔ)文語(yǔ)轉(zhuǎn)換[J];洛陽(yáng)工學(xué)院學(xué)報(bào);2001年04期
9 徐輝,何克抗,孫波;書(shū)面漢語(yǔ)自動(dòng)分詞專家系統(tǒng)的實(shí)現(xiàn)[J];中文信息學(xué)報(bào);1991年03期
10 徐秉錚,詹劍,賀前華;基于神經(jīng)網(wǎng)絡(luò)的分詞方法[J];中文信息學(xué)報(bào);1993年02期
相關(guān)碩士學(xué)位論文 前5條
1 段凱宇;吳語(yǔ)文語(yǔ)轉(zhuǎn)換中語(yǔ)音合成與韻律控制的研究[D];蘇州大學(xué);2002年
2 李莉;維語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng)的研究與實(shí)現(xiàn)[D];新疆大學(xué);2004年
3 李銳;語(yǔ)音技術(shù)在塔臺(tái)模擬機(jī)上的應(yīng)用[D];四川大學(xué);2004年
4 張鵬;嵌入式語(yǔ)音合成系統(tǒng)的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2006年
5 王燕;中文口語(yǔ)交互式開(kāi)放域問(wèn)答系統(tǒng)關(guān)鍵技術(shù)研究[D];北京工商大學(xué);2006年
,本文編號(hào):1496892
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1496892.html