天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于SailAlign的中文語音文語對齊的研究

發(fā)布時間:2017-07-19 10:33

  本文關(guān)鍵詞:基于SailAlign的中文語音文語對齊的研究


  更多相關(guān)文章: 文語對齊 SailAlign 語音識別 語言模型


【摘要】:文語對齊是以語音識別器為基礎(chǔ),在時間上對語音和文本進行強制對齊的過程。文語對齊通常被應(yīng)用在多媒體檢索和訓(xùn)練一個大詞匯量的語音識別和合成系統(tǒng)。近年來網(wǎng)絡(luò)上可以獲取越來越豐富的音頻資源,促進了語音和文本對齊的大規(guī)模研究。例如有聲書本,多媒體文檔等。對這些語音和文本,采用傳統(tǒng)的基于維特比的強制對齊算法被證明對于文本和語音不匹配或者語音存在噪聲的情況存在不足。為了使語音和文本能夠避開這些限制,使用語音識別器對原始的語音進行識別,從而得到含有時間信息的識別文本,再把該文本與原始文本進行對齊,來得到兩者共同的部分。這樣就把語音和文本的對齊問題轉(zhuǎn)化成為文本和文本的對齊問題,后一種問題的解決方案通常要求的計算量要少得多。SailAlign這一開源工具就是基于這種語音和文本對齊方法。本論文利用修改的SailAlign算法進行中文的文語對齊研究。在語音多于文本的情況下,我們進行了實驗,并對其結(jié)果進行分析。最后我們還實現(xiàn)了自動化的文語對齊。本文的主要研究工作如下:首先,由于SailAlign算法不支持中文,所以我們修改了SailAlign的配置文件,并且添加了中文的語言模型和聲學(xué)模型,從而能夠使用SailAlign進行中文的文語對齊研究。聲學(xué)模型和語言模型是用大量的新聞聯(lián)播的語音和文本數(shù)據(jù)訓(xùn)練得到的,使用SailAlign算法對語音和文本進行文語對齊的過程是迭代的和自適應(yīng)的。通過實驗我們對SailAlign算法在語音多于文本的情況下進行文語對齊的正確率進行了分析和比較。實驗表明,在語音多于文本的情況下,利用該算法得到的語音和文本進行對齊的正確率比較高。接下來我們通過SailAlign算法進行文語對齊以后,然后再把對齊的語音和文本數(shù)據(jù)分割出來,就可以得到一一對應(yīng)的語音和文本。為了節(jié)省時間,提高效率,我們把SailAlign文語對齊的整個過程用一個shell腳本實現(xiàn)自動化,整個過程都是在Linux這一個平臺下運行的。該自動化的文語對齊過程分為三個模塊,分別為文本和語音的預(yù)處理,SailAlign的文語對齊,文本的抽取和語音的切分。
【關(guān)鍵詞】:文語對齊 SailAlign 語音識別 語言模型
【學(xué)位授予單位】:中國海洋大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
  • 摘要7-9
  • Abstract9-13
  • 1 引言13-21
  • 1.1 語音識別發(fā)展歷史13-16
  • 1.2 語音識別系統(tǒng)介紹16-17
  • 1.3 文語對齊的特點和研究現(xiàn)狀17-19
  • 1.4 本文研究的主要內(nèi)容19
  • 1.5 本文的組織結(jié)構(gòu)19-21
  • 2 基本原理和工具介紹21-29
  • 2.1 HMM21-26
  • 2.1.1 馬爾科夫過程21
  • 2.1.2 隱馬爾可夫模型21-23
  • 2.1.3 HMM基本要素及三個問題23-26
  • 2.2 HTK26-28
  • 2.3 本章小結(jié)28-29
  • 3 各對應(yīng)率下文語對齊的實驗分析29-39
  • 3.1 SailAlign30-35
  • 3.1.1 編輯距離30-31
  • 3.1.2 SailAlign介紹31-32
  • 3.1.3 SailAlign算法32-35
  • 3.2 實驗結(jié)果和數(shù)據(jù)分析35-37
  • 3.3 本章小結(jié)37-39
  • 4 自動化的文語對齊39-49
  • 4.1 文本與語音的預(yù)處理39-42
  • 4.2 SailAlign的文語對齊42-45
  • 4.3 文本的抽取和語音的切分45-46
  • 4.4 自動化文語對齊46-48
  • 4.5 本章小結(jié)48-49
  • 5 總結(jié)與展望49-51
  • 5.1 本文的主要工作49
  • 5.2 對未來工作的展望49-51
  • 參考文獻51-56
  • 致謝56-57
  • 個人簡歷57

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 王者歸來;;閉著眼睛“看”新聞——請來“文語通”為你讀網(wǎng)頁[J];電腦愛好者(普及版);2010年09期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 高紅坤;基于SailAlign的中文語音文語對齊的研究[D];中國海洋大學(xué);2015年

2 吳s,

本文編號:562474


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/562474.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0608b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com