天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于語音關(guān)鍵詞檢測的人機(jī)交互研究

發(fā)布時間:2017-05-11 01:14

  本文關(guān)鍵詞:基于語音關(guān)鍵詞檢測的人機(jī)交互研究,由筆耕文化傳播整理發(fā)布。


【摘要】:人機(jī)交互(Human-Computer Interaction, HCI)是研究人、計(jì)算機(jī)及它們之間相互影響的技術(shù),包括從鍵盤、鼠標(biāo)到語音識別、手勢輸入、感覺反饋等一系列交互方式。隨著人機(jī)交互技術(shù)的不斷發(fā)展,人們發(fā)現(xiàn)語音是人與計(jì)算機(jī)之間進(jìn)行交互的最方便快捷方式。而語音關(guān)鍵詞檢測是語音識別的一種特殊形式,其主要作用是從連續(xù)的語音流中檢測出在實(shí)際應(yīng)用中所需要的少量特定詞匯且具有資源消費(fèi)少、識別率高和實(shí)用強(qiáng)的特點(diǎn)。因此關(guān)鍵詞檢測技術(shù)有著廣泛的應(yīng)用。目前語音關(guān)鍵詞檢測系統(tǒng)主要有三種:基于垃圾模型的關(guān)鍵詞檢測系統(tǒng)、基于音素/音節(jié)的關(guān)鍵詞檢測系統(tǒng)和基于連續(xù)語音識別的關(guān)鍵詞檢測系統(tǒng)。本論文中主要研究基于連續(xù)語音識別的關(guān)鍵詞檢測系統(tǒng)的相關(guān)技術(shù)。論文主要內(nèi)容如下:(1)在連續(xù)語音識別理論部分,主要介紹語音信號的前端處理、聲學(xué)模型、語言學(xué)模型和搜索解碼。語音信號的前端處理部分主要包括端點(diǎn)檢測、預(yù)加重、分幀和聲學(xué)特征參數(shù)提取。本論文中提取的特征參數(shù)是梅爾倒譜系數(shù)(Mel-Frequence Cepstral Coefficients,MFCC),為了提高其魯棒性和區(qū)分性,將提取的MFCC參數(shù)進(jìn)行線性區(qū)分性(Linear Discriminant Analysis,LDA)變換。聲學(xué)模型部分主要介紹了隱馬爾科夫模型(Hidden Markov Models,HMM)、混合高斯模型(Gaussian Mixture Model,GMM)和子空間混合高斯模型(Subspace Gaussian Mixture Model,SGMM),并將SGMM-UBM (Subspace Gaussian Mixture Model-Universal Background Model)模型替換傳統(tǒng)的]HMM-GMM模型建立聲學(xué)模型。語言學(xué)模型主要介紹基于文法的語言模型和基于統(tǒng)計(jì)的語言模型,本論文中使用的是基于統(tǒng)計(jì)模型的三元語言模型。搜索解碼部分主要介紹Viterbi算法及解碼之后的輸出結(jié)果。(2)在語音關(guān)鍵詞檢測部分,主要介紹Lattice網(wǎng)格結(jié)構(gòu)、關(guān)鍵詞搜索算法、基于Lattice的后驗(yàn)概率置信度計(jì)算及改進(jìn)、關(guān)鍵詞的輸出規(guī)則和系統(tǒng)性能評價標(biāo)準(zhǔn)。在計(jì)算置信度時,引入了最小編輯距離(Minimum Edit Distance,MED)字符串相似度函數(shù),其主要作用是用來對檢測到的錯誤進(jìn)行懲罰。關(guān)鍵詞搜索算法主要介紹了動態(tài)規(guī)劃算法和令牌傳遞算法。(3)搭建了一個基于語音關(guān)鍵詞檢測的人機(jī)交互系統(tǒng),主要利用的工具是Kaldi,數(shù)據(jù)庫是基于清華大學(xué)的THCHS-30語音庫。通過仿真實(shí)驗(yàn)分析了不同算法對系統(tǒng)性能的影響。
【關(guān)鍵詞】:關(guān)鍵詞檢測 連續(xù)語音識別 聲學(xué)模型 語言學(xué)模型 關(guān)鍵詞搜索算法
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3;TN912.34
【目錄】:
  • 致謝5-6
  • 摘要6-7
  • ABSTRACT7-9
  • 序言9-12
  • 1 引言12-18
  • 1.1 研究背景與意義12-13
  • 1.2 發(fā)展歷史與現(xiàn)狀13-15
  • 1.3 論文的主要內(nèi)容與組織結(jié)構(gòu)15-18
  • 2 連續(xù)語音識別原理18-42
  • 2.0 連續(xù)語音識別系統(tǒng)基本框架18-19
  • 2.1 語音信號的前端處理19-26
  • 2.1.1 語音信號的端點(diǎn)檢測19-21
  • 2.1.2 語音信號的預(yù)加重21
  • 2.1.3 語音信號的分幀21-22
  • 2.1.4 聲學(xué)特征參數(shù)提取22-26
  • 2.2 聲學(xué)層模型26-37
  • 2.2.1 隱馬爾科夫模型HMM26-32
  • 2.2.2 混合高斯模型GMM32-33
  • 2.2.3 子空間混合高斯模型SGMM33-37
  • 2.3 語言模型37-39
  • 2.3.1 基于文法的語言模型37-38
  • 2.3.2 基于統(tǒng)計(jì)的語言模型38-39
  • 2.4 搜索解碼39-42
  • 2.4.1 Viterbi搜索解碼39-40
  • 2.4.2 搜索解碼輸出40-42
  • 3 基于連續(xù)語音識別的關(guān)鍵詞檢測技術(shù)42-50
  • 3.1 基于連續(xù)語音識別的關(guān)鍵詞檢測系統(tǒng)框架42
  • 3.2 網(wǎng)格結(jié)構(gòu)42-44
  • 3.3 關(guān)鍵詞搜索算法44-46
  • 3.3.1 動態(tài)規(guī)劃算法44-45
  • 3.3.2 令牌傳遞算法45-46
  • 3.4 基于網(wǎng)格后驗(yàn)概率的置信度計(jì)算46
  • 3.5 置信度的使用與改進(jìn)46-48
  • 3.5.1 置信度的使用47
  • 3.5.2 置信度的改進(jìn)47-48
  • 3.6 關(guān)鍵詞輸出準(zhǔn)則48
  • 3.7 系統(tǒng)性能評價標(biāo)準(zhǔn)48-50
  • 4 基于語音關(guān)鍵詞檢測的人機(jī)交互平臺實(shí)現(xiàn)50-69
  • 4.1 數(shù)據(jù)集及工具介紹50-52
  • 4.1.1 數(shù)據(jù)集及漢語言特點(diǎn)50-51
  • 4.1.2 Kaldi工具介紹51-52
  • 4.2 數(shù)據(jù)準(zhǔn)備52-57
  • 4.2.1 語音數(shù)據(jù)相關(guān)52-54
  • 4.2.2 語言數(shù)據(jù)相關(guān)54-57
  • 4.3 連續(xù)語音識別器的具體實(shí)現(xiàn)57-60
  • 4.3.1 預(yù)處理與特征提取57
  • 4.3.2 聲學(xué)模型的訓(xùn)練57-59
  • 4.3.3 語言模型的訓(xùn)練59
  • 4.3.4 最佳路徑搜索59-60
  • 4.4 關(guān)鍵詞搜索60-61
  • 4.5 置信度確認(rèn)61-62
  • 4.6 基于語音關(guān)鍵詞檢測的實(shí)時人機(jī)交互系統(tǒng)62-65
  • 4.7 基于語音關(guān)鍵詞檢測的人機(jī)交互平臺性能評估實(shí)驗(yàn)65-67
  • 4.8 實(shí)驗(yàn)?zāi)_本清單67-69
  • 5 總結(jié)與展望69-71
  • 5.1 論文工作總結(jié)69-70
  • 5.2 未來工作展望70-71
  • 參考文獻(xiàn)71-75
  • 作者簡歷及攻讀碩士學(xué)位期間取得的研究成果75-77
  • 學(xué)位論文數(shù)據(jù)集77

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 林道發(fā),楊家沅;連續(xù)語音識別和語音翻譯[J];計(jì)算機(jī)應(yīng)用與軟件;1994年02期

2 趙慶衛(wèi),王作英,陸大};基于音節(jié)間相關(guān)識別單元的漢語連續(xù)語音識別算法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年09期

3 劉加;漢語大詞匯量連續(xù)語音識別系統(tǒng)研究進(jìn)展[J];電子學(xué)報(bào);2000年01期

4 宋戰(zhàn)江,鄭方,徐明星,武健,吳文虎;漢語連續(xù)語音識別系統(tǒng)與知識導(dǎo)引的搜索策略研究[J];自動化學(xué)報(bào);2000年04期

5 林生佑,金一慶;連續(xù)語音識別的線性詞典動態(tài)規(guī)劃研究[J];計(jì)算機(jī)應(yīng)用研究;2001年01期

6 郝杰,李星;基于經(jīng)典隱馬爾可夫模型的漢語連續(xù)語音識別系統(tǒng)[J];電子與信息學(xué)報(bào);2002年07期

7 謝磊,I.Cravyse,蔣冬梅,趙榮椿,H.Sahli,Werner Verhelst,J Cornelis,Ignace Lemahieu;一種噪音環(huán)境下的基于特征口形的音頻視頻混合連續(xù)語音識別系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2003年16期

8 謝磊,I Ravyse,蔣冬梅,趙榮椿,H Sahli,W Verhelst,J Cornelis;一種基于數(shù)據(jù)篩的音頻視頻連續(xù)語音識別系統(tǒng)[J];計(jì)算機(jī)應(yīng)用;2003年07期

9 嚴(yán)斌峰,朱小燕;基于聯(lián)合得分的連續(xù)語音識別確認(rèn)方法[J];軟件學(xué)報(bào);2003年12期

10 李春,王作英;漢語連續(xù)語音識別中一種新的音節(jié)間相關(guān)識別單元[J];聲學(xué)學(xué)報(bào);2003年02期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 馬芹;蘇廣川;;基于音節(jié)分割的連續(xù)語音識別方法的研究[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年

2 趙慶衛(wèi);王作英;陸大獾;;音節(jié)間相關(guān)的識別單元在連續(xù)語音識別中的應(yīng)用[A];第五屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1998年

3 俞一彪;顧曉東;趙鶴鳴;;基于關(guān)鍵詞的句法分析及在連續(xù)語音識別中的應(yīng)用[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年

4 李宗葛;;關(guān)于漢語連續(xù)語音識別的思考[A];第一屆全國語言識別學(xué)術(shù)報(bào)告與展示會論文集[C];1990年

5 林志偉;徐波;江源富;徐東昕;黃泰翼;;漢語連續(xù)語音識別系統(tǒng)的研究[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1992年

6 計(jì)天穎;王作英;陸大金;;有限命令集連續(xù)語音識別[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年

7 柴海新;吳文虎;方棣棠;;連續(xù)語音識別的研究和漢語數(shù)字連呼系統(tǒng)的實(shí)現(xiàn)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1994年

8 張向東;劉建;俞鐵城;;基于聲韻母轉(zhuǎn)移模型的漢語特定人無限詞匯連續(xù)語音識別研究[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年

9 張樹武;徐波;黃泰翼;;漢語大詞匯/連續(xù)語音識別語言建模技術(shù)分析[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1996年

10 鄭方;徐明星;吳文虎;;連續(xù)語音識別中的搜索策略[A];第五屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];1998年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 徐望;連續(xù)語音識別的穩(wěn)健性技術(shù)研究[D];解放軍信息工程大學(xué);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 許彥敏;藏語連續(xù)語音識別技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];中央民族大學(xué);2015年

2 李敏;基于語音關(guān)鍵詞檢測的人機(jī)交互研究[D];北京交通大學(xué);2016年

3 陳奇川;基于詞網(wǎng)語言模型的連續(xù)語音識別系統(tǒng)的研究與實(shí)現(xiàn)[D];廈門大學(xué);2009年

4 張利平;漢語連續(xù)語音識別系統(tǒng)的研究與實(shí)現(xiàn)[D];西北大學(xué);2010年

5 湛宗儒;連續(xù)語音識別算法研究及在嵌入式系統(tǒng)上的實(shí)現(xiàn)[D];武漢理工大學(xué);2010年

6 劉盈;大詞表連續(xù)語音識別系統(tǒng)的研究與實(shí)現(xiàn)[D];清華大學(xué);2005年

7 李原;小詞匯量連續(xù)語音識別系統(tǒng)的研究[D];西南大學(xué);2008年

8 薛小燕;基于動態(tài)貝葉斯網(wǎng)絡(luò)的連續(xù)語音識別研究[D];解放軍信息工程大學(xué);2010年

9 張寶奇;基于切分的漢語連續(xù)語音識別技術(shù)研究[D];解放軍信息工程大學(xué);2010年

10 卜素亮;非特定人連續(xù)語音識別技術(shù)研究與應(yīng)用[D];復(fù)旦大學(xué);2011年


  本文關(guān)鍵詞:基于語音關(guān)鍵詞檢測的人機(jī)交互研究,,由筆耕文化傳播整理發(fā)布。



本文編號:355929

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/355929.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ec624***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com