基于音素的語音可懂度評價方法的研究與實現(xiàn)
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.3
【圖文】:
并對各分類模型在語音識別中的拓展應(yīng)用進行了簡究所可能存在的問題以及為后續(xù)章節(jié)的研究工作做鋪墊。別技術(shù)識別技術(shù)的計算機輔助發(fā)音系統(tǒng)(CAPT),其核心技術(shù)就,由于英語作為全球最廣為流通以及普遍的語言,其學(xué)習(xí)者算機輔助英語學(xué)習(xí)也成為了當(dāng)今的一大研究熱點。英文發(fā)多種技術(shù)來進行研究,研究首先需要了解英語語音的一些基理學(xué)過程,并據(jù)此建立合理的模型來描述發(fā)音檢測評價的過類的產(chǎn)生與三部分器官有關(guān):肺部、喉嚨和聲道。經(jīng)過聲道成人們所能聽到的語音。例如英文單詞“breakfast”的產(chǎn)生st 的音強圖和聲譜圖。
音素,字母,音標都是衡量一個英語學(xué)習(xí)中的發(fā)音質(zhì)量以及能否被聽者正確聽懂理解的重要依據(jù)。2.1.2 語音信號處理語音聲學(xué)基元是聲學(xué)模型構(gòu)建的基礎(chǔ),聲學(xué)基元的選擇標準一般需要考慮三個標準易訓(xùn)練、可拓展以及高精度。目前語音識別研究中聲學(xué)基元的選擇大多都是詞(word)、音節(jié)(syllable)、半音節(jié)(semi-syllable)以及音素(phone)等。英文語音一般選擇音素作為聲學(xué)基元,對于小詞匯語音識別系統(tǒng),通常聲學(xué)基元為詞。由于構(gòu)成英文單詞的單元是字母,而字母又是音素組成的。而與漢語的詞匯發(fā)音不同,漢語大多是基于聲母,韻母所構(gòu)成的[25][26]。計算機首先將接收到的語音進行預(yù)處理操作,處理為語音信號之后才能進行分析。通過計算機進行預(yù)處理等操作,可以一定程度上減少因為人類本身和采集設(shè)備對語音信號質(zhì)量所造成的影響。為之后的信號處理提供穩(wěn)定,優(yōu)質(zhì)的分析參數(shù),從而提高信號處理的質(zhì)量。語音信號處理流程如圖 2-2 所示。
態(tài)序列不能被直接觀察到,但可以通過觀察向量反映出來;對于任意給定狀態(tài),MM 模型又是一個由隱含狀態(tài)決定觀察值的隨機過程,它會以隨機概率輸出相的觀察向量。HMM 的隨機過程與語音的形成過程類似。HMM 模型能夠很好的模擬語音特性,并對應(yīng)出合理的數(shù)學(xué)解析,且對隨時間不斷變化的語音信號有極強的建能力。HMM 模型可以用以下五組參數(shù)來進行描述,如公式 2-1 所示: { , , , , } (2-1)其中 表示 HMM 模型所包含的有限隱含狀態(tài)的集合; 表示每個隱狀態(tài)所組的集合; 表示狀態(tài)之間的轉(zhuǎn)移概率,可用一個矩陣來表示; 為相應(yīng)輸出觀察的概率; 表示由系統(tǒng)初始狀態(tài)概率所構(gòu)成的集合。HMM 模型用作聲學(xué)模型,圖 2-3 為 HMM 的示意圖,其具有 6 個狀態(tài)的 Morkov 過程,狀態(tài) 2┼5 代表間狀態(tài),兩個黑圓圈分別代表入口狀態(tài) 1 和出口狀態(tài) 6。
【相似文獻】
相關(guān)期刊論文 前10條
1 陳亞繁;許勇;楊軍;;單通道語音增強對低信噪比漢語可懂度的影響[J];電聲技術(shù);2016年10期
2 陳惠德;;%AL_cons的測試[J];電聲技術(shù);1989年05期
3 姚峰英,張敏;一種增強帶噪語音可懂度的新算法[J];聲學(xué)學(xué)報;2002年06期
4 胡書孝;提高教材可懂度技術(shù)的應(yīng)用[J];醫(yī)學(xué)教育;1992年06期
5 程容荃;;人造舌對全舌切除病人攝食和元音可懂度的影響[J];國外醫(yī)學(xué).耳鼻咽喉科學(xué)分冊;1983年04期
6 齊魯;從對話中摘出詞句的可懂度[J];聲學(xué)學(xué)報;1964年02期
7 齊魯;從流利語言中摘出詞句的可懂度——說話速度和詞句長度的影響[J];聲學(xué)學(xué)報;1964年02期
8 周篤強,黃端生,牛聰敏,陳善廣,高慧;快速測量漢語語言可懂度方法的研究[J];航天醫(yī)學(xué)與醫(yī)學(xué)工程;1997年04期
9 吳小平;如何提高物理教材的可懂度[J];技術(shù)物理教學(xué);2005年03期
10 蔣斌;匡正;吳鳴;楊軍;;漢語音段反轉(zhuǎn)言語的可懂度研究[J];聲學(xué)學(xué)報;2012年06期
相關(guān)會議論文 前6條
1 許偉;曾新吾;龔昌超;;不同帶寬和采樣頻率語音可懂度的實驗研究[A];2008年全國聲學(xué)學(xué)術(shù)會議論文集[C];2008年
2 湯朝菊;文森特·范赫恩;;漢語方言互懂度的實驗測試[A];中國社會語言學(xué)(2006年第2期)[C];2006年
3 陳凱;俞蒙槐;胡上序;付強;;語音增強系統(tǒng)性能評測方法綜述[A];第四屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC1996)論文集[C];1996年
4 尹建琪;覃春林;諸維明;;用于語聲識別的自適應(yīng)去噪[A];第二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC1992)論文集[C];1992年
5 黃志華;;共振峰對維吾爾語語音可懂度的影響[A];2018年全國聲學(xué)大會論文集 K語言聲學(xué)與語音信號處理[C];2018年
6 王康;王鵬;邱小軍;;漢語母語聽者單耳英語通信可懂度受噪聲的影響[A];2016年全國聲學(xué)學(xué)術(shù)會議論文集[C];2016年
相關(guān)碩士學(xué)位論文 前10條
1 高源;基于音素的語音可懂度評價方法的研究與實現(xiàn)[D];北京工業(yè)大學(xué);2018年
2 高飛;基于音頻特性的語音可懂度評估[D];太原理工大學(xué);2018年
3 劉鵬;高可懂度的信號子空間語音增強算法[D];太原理工大學(xué);2014年
4 彭曉騰;語音可懂度客觀評價策略的研究[D];內(nèi)蒙古大學(xué);2016年
5 郭利華;具有高可懂度的維納濾波語音增強算法[D];太原理工大學(xué);2014年
6 葉琪;低信噪比環(huán)境下語音可懂度增強算法研究[D];安徽大學(xué);2016年
7 鄺秀玉;多級低速率編解碼級聯(lián)語音可懂度增強算法研究與實現(xiàn)[D];電子科技大學(xué);2011年
8 李娜;有效提高語音可懂度的語音增強方法研究[D];北京工業(yè)大學(xué);2013年
9 徐宇卓;語音可懂度客觀評價方法的研究[D];太原理工大學(xué);2015年
10 羅鈞;G.729與AMR級聯(lián)語音可懂度提高技術(shù)研究[D];電子科技大學(xué);2010年
本文編號:2787757
本文鏈接:http://sikaile.net/kejilunwen/wltx/2787757.html