天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

漢語普通話發(fā)音質(zhì)量自動評測方法研究

發(fā)布時間:2018-01-06 05:09

  本文關(guān)鍵詞:漢語普通話發(fā)音質(zhì)量自動評測方法研究 出處:《哈爾濱工業(yè)大學》2014年博士論文 論文類型:學位論文


  更多相關(guān)文章: 發(fā)音質(zhì)量自動評測 漢語普通話評測 音素評測 聲韻母評測 聲調(diào)評測 兒化音評測


【摘要】:發(fā)音質(zhì)量自動評測(以下簡稱“評測”)是計算機輔助語言學習及口語考試中的核心技術(shù)問題,其研究成果對提高學習者學習的靈活性和滿意度,減少人工閱卷的主觀性和不穩(wěn)定性,降低投入成本,提高實效性,具有重要的理論意義和科學價值,應用前景廣闊。隨著國內(nèi)普通話的大力推廣和普及,以及國外漢語學習熱潮的快速興起,針對漢語普通話的評測技術(shù)實際需求強勁,且更具特色和挑戰(zhàn)性,有必要深入系統(tǒng)地研究。 漢語是一種單音節(jié)聲調(diào)語言,每個音節(jié)包括聲母、韻母和聲調(diào)三部分,音節(jié)間界限較分明,有鮮明的輕重音和兒化音。漢語音節(jié)的三元結(jié)構(gòu)及音韻特點與英語語音差異較大,需要結(jié)合漢語特點,在表征、建模和計算等方面進行針對性研究和創(chuàng)造性方法改進。此外,現(xiàn)有主流評測方法在基本發(fā)音單元(聲韻母、聲調(diào)等)評測上的準確性還不夠理想,無法滿足精細評測任務和較高水平說話人評測任務的實際需求,需要在聲學建模和置信度計算等方面進行改進,以提高聲學模型的精度和評測模型的準確度。 本文重點研究母語人群的漢語普通話評測方法。在聲韻母評測方面,針對當前主流的發(fā)音良好度(Goodness of pronunciation,GOP)算法存在的切分不準、計算精度低、模型間區(qū)分性差等問題,提出一種基于音素混淆概率矩陣的評測方法。該方法通過計算音素混淆概率矩陣來構(gòu)建每個音素的混淆音素集合,一方面利用混淆音素集合建立音素混淆限制識別網(wǎng)絡,提高音素段切分的準確性;另一方面,引入音素混淆先驗概率,把混淆音素集合作為后驗概率的計算空間,提高計算精度和模型間的區(qū)分性。為擴大發(fā)音的評測范圍,提高聲學模型的覆蓋范圍,提出一種基于擴展發(fā)音空間的評測方法。該方法利用錯誤發(fā)音樣本數(shù)據(jù),擴展標準發(fā)音空間,對標準發(fā)音的各類發(fā)音錯誤進行精細建模,并在這個擴展后的發(fā)音空間內(nèi)進行后驗概率計算,計算更加準確和有效。同時,針對包含錯誤發(fā)音的數(shù)據(jù)獲取容易,但標注困難,且工作量巨大的問題,設(shè)計對錯誤發(fā)音樣本聚類的非監(jiān)督學習方法,以及發(fā)音模型的自動更新方法,來持續(xù)提高評測模型的準確性。鑒于上述方法都是單維置信度計算加閾值判斷還不夠魯棒,提出一種基于系統(tǒng)融合的多維置信度的評測方法。該方法依次計算待評測語音段相對于其對應音素的混淆音素集合中所有音素的后驗概率和錯誤音素集合中所有音素的后驗概率,并把它們組合起來,形成一個多維置信度向量,作為一種新的評測特征,為各個音素分別訓練出不同發(fā)音質(zhì)量的分類器,實現(xiàn)對聲韻母發(fā)音質(zhì)量的再評測,人機相關(guān)系數(shù)達到0.893,超過了人工評測的平均水平。 在聲調(diào)評測方面,針對聲調(diào)相關(guān)基頻特征的有效獲取和多層次利用,提出一種基于系統(tǒng)融合的多維置信度的聲調(diào)評測方法。在語音幀層級上,把基頻特征及其一階、二階差分加入到39維梅爾倒譜系數(shù)中去,共42維,以聲母和帶調(diào)韻母為發(fā)音單元,采用嵌入式訓練方式,建立嵌入式聲調(diào)模型。在音節(jié)層級上,提取當前音節(jié)和其前面、后面音節(jié)的基頻特征及它們的統(tǒng)計特征,共12維,選擇高斯混合模型(Gaussian Mixture Model,GMM)做分類器,建立顯式聲調(diào)模型。把利用嵌入式聲調(diào)模型計算出的5種聲調(diào)的后驗概率和利用顯式聲調(diào)模型計算出的5種聲調(diào)的后驗概率組合起來,形成一個10維的多維置信度向量,作為一種新的評測特征,為各個聲調(diào)分別訓練出不同發(fā)音質(zhì)量的分類器,實現(xiàn)對聲調(diào)發(fā)音質(zhì)量的再評測。實驗結(jié)果表明,上述方法有效融合兩種建模方式的互補性,同時利用長時語段和短時語段的特征信息,且不需要考慮閾值選取,具有更好的魯棒性和適應性,有效提高了聲調(diào)評測方法的準確性,人機相關(guān)系數(shù)達到0.899,超過了人工評測的平均水平。 在漢語兒化音評測方面,針對國家普通話水平測試中對兒化音的考評要求,提出一種基于分類思想的兒化音評測方法。深入分析兒化音的發(fā)音規(guī)律和特色,提取共振峰、發(fā)音置信度、時長等代表性特征,采用集成學習方式,改進傳統(tǒng)的AdaBoost算法,,每次迭代時,同一基分類器會根據(jù)不同分類類別分別更新權(quán)值,在權(quán)值計算時增加一個與類別先驗概率和類別數(shù)目相關(guān)的正數(shù)項,大大降低算法對基分類器的精度要求,并特別適合數(shù)據(jù)分布不平衡的多類分類問題,實現(xiàn)對兒化音的發(fā)音質(zhì)量狀況進行有效分類,分類效果明顯優(yōu)于傳統(tǒng)的AdaBoost集成分類器及其他經(jīng)典單一分類器。作為一種輔助評測方法,上述方法可以很容易推廣到其他類型音變的評測中,比如變調(diào)、輕聲等。 基于以上研究工作,在國家普通話水平測試現(xiàn)場錄音的測試語音庫上,實驗系統(tǒng)的總體分差下降到4.26,與人工評測的分差3.71已經(jīng)非常接近,這為今后漢語普通話自動評測的實際應用奠定了良好的基礎(chǔ)。
[Abstract]:The automatic evaluation of pronunciation quality ( hereinafter referred to as " evaluation " ) is the core technical problem in computer - aided language learning and oral examination . The research results are of great theoretical significance and scientific value to improve learners ' learning flexibility and satisfaction , reduce input cost , improve effectiveness , have important theoretical significance and scientific value , and have broad application prospect . With the popularization and popularization of Mandarin Chinese language , and the rapid rise of Chinese learning upsurge in foreign countries , the practical demand for the evaluation technology of Mandarin Chinese Putonghua is strong , and it is more characteristic and challenging , and it is necessary to study in depth . In addition , the accuracy of the traditional mainstream evaluation method in the evaluation of basic pronunciation units ( phonology , tone , etc . ) is not ideal enough to meet the actual needs of the precise evaluation task and the higher level speaker ' s evaluation task , and the improvement of the acoustic modeling and confidence calculation is needed to improve the accuracy of the acoustic model and the accuracy of the evaluation model . In order to improve the accuracy of the evaluation model , this paper proposes a method based on the probability matrix of phoneme confusion , which can improve the accuracy of the evaluation model . In this paper , based on the effective acquisition and multi - level utilization of tone - related fundamental frequency characteristics , a multi - dimensional confidence measure method based on system fusion is proposed . Based on the speech frame level , the fundamental frequency characteristics and the first order and second - order difference are added to the 39 - dimensional Mel cepstrum coefficient . In this paper , a method for evaluating the pronunciation quality of children is proposed in this paper , which is based on the requirement of the evaluation of the children ' s pronunciation in the national Putonghua level test . The method of integrated learning is used to improve the traditional AdaBoost algorithm . Based on the above research work , the overall diversity of the experimental system is reduced to 4.26 on the test voice library of the national Putonghua level test field recording , and the difference of 3.71 has been very close to the manual evaluation , which lays a good foundation for the practical application of the automatic evaluation of Mandarin Chinese Putonghua .

【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:TN912.3

【參考文獻】

相關(guān)期刊論文 前10條

1 劉先任;基于過零觸發(fā)機制的語音基頻快速估計算法[J];電訊技術(shù);2002年02期

2 王孟杰;孟子厚;;基于區(qū)別特征檢測的漢語韻母分類[J];電聲技術(shù);2011年09期

3 魏思;劉慶升;胡郁;王仁華;;普通話水平測試電子化系統(tǒng)[J];中文信息學報;2006年06期

4 劉慶升;魏思;胡郁;郭武;王仁華;;基于語言學知識的發(fā)音質(zhì)量評價算法改進[J];中文信息學報;2007年04期

5 湯霖;尹俊勛;;普通話聲調(diào)的客觀評測[J];中文信息學報;2007年06期

6 潘逸倩;魏思;王仁華;;基于韻律信息的連續(xù)語流調(diào)型評測研究[J];中文信息學報;2008年04期

7 張峰;黃超;戴禮榮;;普通話發(fā)音錯誤自動檢測技術(shù)[J];中文信息學報;2010年02期

8 嚴可;戴禮榮;;基于音素評分模型的發(fā)音標準度評測研究[J];中文信息學報;2011年05期

9 王士進;李宏言;柯登峰;李鵬;高鵬;徐波;;面向第二語言學習的口語大規(guī)模智能評估技術(shù)研究[J];中文信息學報;2011年06期

10 嚴可;魏思;戴禮榮;;針對發(fā)音質(zhì)量評測的聲學模型優(yōu)化算法[J];中文信息學報;2013年01期

相關(guān)博士學位論文 前2條

1 劉慶升;計算機輔助普通話發(fā)音評測關(guān)鍵技術(shù)研究[D];中國科學技術(shù)大學;2010年

2 嚴可;發(fā)音質(zhì)量自動評測技術(shù)研究[D];中國科學技術(shù)大學;2012年



本文編號:1386417

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1386417.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b48cf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com