天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于音素的語音可懂度評價方法的研究與實現(xiàn)

發(fā)布時間:2020-08-10 07:17
【摘要】:伴隨著全球文化交流的日益頻繁,人們越來越明白熟練掌握一門外語的重要性?谡Z訓(xùn)練是語言學(xué)習(xí)的基本要求,而計算機輔助發(fā)音訓(xùn)練系統(tǒng)也隨之成為語音識別應(yīng)用中的一個重要研究方向。對于我國英語學(xué)習(xí)者口語發(fā)音評價的重要指標之一是語音可懂度,但目前在音素級自動語音可懂度評分與人類專家評分相關(guān)性差距較大。此外,由于非母語學(xué)習(xí)者發(fā)音錯誤的多樣性,在對學(xué)習(xí)者發(fā)音檢測過程中,相似音素發(fā)音易出現(xiàn)混淆,傳統(tǒng)基于概率統(tǒng)計的檢測方法很難覆蓋到所有的錯誤音素類型,無法準確有效地反饋音素級的糾正建議來幫助學(xué)習(xí)者提升語音可懂度水平。針對上述問題,本文首先分析了目前常用發(fā)音檢測技術(shù)的特點和局限,為了解決學(xué)習(xí)者由于漢語發(fā)音習(xí)慣產(chǎn)生的錯誤發(fā)音規(guī)律性問題。本文采用一種基于音素偏誤發(fā)音網(wǎng)絡(luò)的方法對學(xué)習(xí)者發(fā)音中的錯誤發(fā)音的音素進行檢測,并研究出一種循環(huán)隨機音素識別檢測方法提高音素識別正確率和準確率,并使用SVM分類器對發(fā)音錯誤類型進行判別分類,結(jié)合語音可懂度評價方法,為學(xué)習(xí)者反饋糾錯建議。實驗表明,使用本文改進的音素識別檢測方法,提高了音素語音特征識別的正確率和準確率。在對學(xué)習(xí)者語音可懂度評分時,針對目前常用語音可懂度評價方法與人類專家評分相關(guān)性差距較大的問題。本文首先分析了基于AI指數(shù)、語段特征以及音素得分評價方法原理及特點。研究一種新的基于音素組合特征的語音可懂度評分方法,即通過線性組合的方式得到新的聲學(xué)特征測量得分來對語音可懂度評分,并實驗驗證了本文語音可懂度評分方法與人類專家評分的相關(guān)性。最后本文將發(fā)音問題檢測方法與語音可懂度評價方法應(yīng)用于實際在線原型系統(tǒng)中,設(shè)計了針對非母語學(xué)習(xí)者的語音可懂度評估系統(tǒng)。實驗測試表明,通過該系統(tǒng)對英語發(fā)音進行檢測和糾正錯誤音素后,學(xué)習(xí)者語音可懂度評分有了明顯提高,進一步驗證本文所提方法的有效性和實用性。因此本課題在計算機輔助發(fā)音領(lǐng)域有著一定的參考價值和應(yīng)用價值。
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.3
【圖文】:

譜圖,音強,和聲,譜圖


并對各分類模型在語音識別中的拓展應(yīng)用進行了簡究所可能存在的問題以及為后續(xù)章節(jié)的研究工作做鋪墊。別技術(shù)識別技術(shù)的計算機輔助發(fā)音系統(tǒng)(CAPT),其核心技術(shù)就,由于英語作為全球最廣為流通以及普遍的語言,其學(xué)習(xí)者算機輔助英語學(xué)習(xí)也成為了當(dāng)今的一大研究熱點。英文發(fā)多種技術(shù)來進行研究,研究首先需要了解英語語音的一些基理學(xué)過程,并據(jù)此建立合理的模型來描述發(fā)音檢測評價的過類的產(chǎn)生與三部分器官有關(guān):肺部、喉嚨和聲道。經(jīng)過聲道成人們所能聽到的語音。例如英文單詞“breakfast”的產(chǎn)生st 的音強圖和聲譜圖。

處理流程圖,語音信號,處理流程,音素


音素,字母,音標都是衡量一個英語學(xué)習(xí)中的發(fā)音質(zhì)量以及能否被聽者正確聽懂理解的重要依據(jù)。2.1.2 語音信號處理語音聲學(xué)基元是聲學(xué)模型構(gòu)建的基礎(chǔ),聲學(xué)基元的選擇標準一般需要考慮三個標準易訓(xùn)練、可拓展以及高精度。目前語音識別研究中聲學(xué)基元的選擇大多都是詞(word)、音節(jié)(syllable)、半音節(jié)(semi-syllable)以及音素(phone)等。英文語音一般選擇音素作為聲學(xué)基元,對于小詞匯語音識別系統(tǒng),通常聲學(xué)基元為詞。由于構(gòu)成英文單詞的單元是字母,而字母又是音素組成的。而與漢語的詞匯發(fā)音不同,漢語大多是基于聲母,韻母所構(gòu)成的[25][26]。計算機首先將接收到的語音進行預(yù)處理操作,處理為語音信號之后才能進行分析。通過計算機進行預(yù)處理等操作,可以一定程度上減少因為人類本身和采集設(shè)備對語音信號質(zhì)量所造成的影響。為之后的信號處理提供穩(wěn)定,優(yōu)質(zhì)的分析參數(shù),從而提高信號處理的質(zhì)量。語音信號處理流程如圖 2-2 所示。

結(jié)構(gòu)圖,隱馬爾科夫模型,聲學(xué)模型,結(jié)構(gòu)圖


態(tài)序列不能被直接觀察到,但可以通過觀察向量反映出來;對于任意給定狀態(tài),MM 模型又是一個由隱含狀態(tài)決定觀察值的隨機過程,它會以隨機概率輸出相的觀察向量。HMM 的隨機過程與語音的形成過程類似。HMM 模型能夠很好的模擬語音特性,并對應(yīng)出合理的數(shù)學(xué)解析,且對隨時間不斷變化的語音信號有極強的建能力。HMM 模型可以用以下五組參數(shù)來進行描述,如公式 2-1 所示: { , , , , } (2-1)其中 表示 HMM 模型所包含的有限隱含狀態(tài)的集合; 表示每個隱狀態(tài)所組的集合; 表示狀態(tài)之間的轉(zhuǎn)移概率,可用一個矩陣來表示; 為相應(yīng)輸出觀察的概率; 表示由系統(tǒng)初始狀態(tài)概率所構(gòu)成的集合。HMM 模型用作聲學(xué)模型,圖 2-3 為 HMM 的示意圖,其具有 6 個狀態(tài)的 Morkov 過程,狀態(tài) 2┼5 代表間狀態(tài),兩個黑圓圈分別代表入口狀態(tài) 1 和出口狀態(tài) 6。

【相似文獻】

相關(guān)期刊論文 前10條

1 陳亞繁;許勇;楊軍;;單通道語音增強對低信噪比漢語可懂度的影響[J];電聲技術(shù);2016年10期

2 陳惠德;;%AL_cons的測試[J];電聲技術(shù);1989年05期

3 姚峰英,張敏;一種增強帶噪語音可懂度的新算法[J];聲學(xué)學(xué)報;2002年06期

4 胡書孝;提高教材可懂度技術(shù)的應(yīng)用[J];醫(yī)學(xué)教育;1992年06期

5 程容荃;;人造舌對全舌切除病人攝食和元音可懂度的影響[J];國外醫(yī)學(xué).耳鼻咽喉科學(xué)分冊;1983年04期

6 齊魯;從對話中摘出詞句的可懂度[J];聲學(xué)學(xué)報;1964年02期

7 齊魯;從流利語言中摘出詞句的可懂度——說話速度和詞句長度的影響[J];聲學(xué)學(xué)報;1964年02期

8 周篤強,黃端生,牛聰敏,陳善廣,高慧;快速測量漢語語言可懂度方法的研究[J];航天醫(yī)學(xué)與醫(yī)學(xué)工程;1997年04期

9 吳小平;如何提高物理教材的可懂度[J];技術(shù)物理教學(xué);2005年03期

10 蔣斌;匡正;吳鳴;楊軍;;漢語音段反轉(zhuǎn)言語的可懂度研究[J];聲學(xué)學(xué)報;2012年06期

相關(guān)會議論文 前6條

1 許偉;曾新吾;龔昌超;;不同帶寬和采樣頻率語音可懂度的實驗研究[A];2008年全國聲學(xué)學(xué)術(shù)會議論文集[C];2008年

2 湯朝菊;文森特·范赫恩;;漢語方言互懂度的實驗測試[A];中國社會語言學(xué)(2006年第2期)[C];2006年

3 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC1996)論文集[C];1996年

4 尹建琪;覃春林;諸維明;;用于語聲識別的自適應(yīng)去噪[A];第二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC1992)論文集[C];1992年

5 黃志華;;共振峰對維吾爾語語音可懂度的影響[A];2018年全國聲學(xué)大會論文集 K語言聲學(xué)與語音信號處理[C];2018年

6 王康;王鵬;邱小軍;;漢語母語聽者單耳英語通信可懂度受噪聲的影響[A];2016年全國聲學(xué)學(xué)術(shù)會議論文集[C];2016年

相關(guān)碩士學(xué)位論文 前10條

1 高源;基于音素的語音可懂度評價方法的研究與實現(xiàn)[D];北京工業(yè)大學(xué);2018年

2 高飛;基于音頻特性的語音可懂度評估[D];太原理工大學(xué);2018年

3 劉鵬;高可懂度的信號子空間語音增強算法[D];太原理工大學(xué);2014年

4 彭曉騰;語音可懂度客觀評價策略的研究[D];內(nèi)蒙古大學(xué);2016年

5 郭利華;具有高可懂度的維納濾波語音增強算法[D];太原理工大學(xué);2014年

6 葉琪;低信噪比環(huán)境下語音可懂度增強算法研究[D];安徽大學(xué);2016年

7 鄺秀玉;多級低速率編解碼級聯(lián)語音可懂度增強算法研究與實現(xiàn)[D];電子科技大學(xué);2011年

8 李娜;有效提高語音可懂度的語音增強方法研究[D];北京工業(yè)大學(xué);2013年

9 徐宇卓;語音可懂度客觀評價方法的研究[D];太原理工大學(xué);2015年

10 羅鈞;G.729與AMR級聯(lián)語音可懂度提高技術(shù)研究[D];電子科技大學(xué);2010年



本文編號:2787757

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2787757.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e2264***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com