天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語音關(guān)鍵詞檢測(cè)中的置信度研究

發(fā)布時(shí)間:2017-04-15 08:27

  本文關(guān)鍵詞:語音關(guān)鍵詞檢測(cè)中的置信度研究,由筆耕文化傳播整理發(fā)布。


【摘要】:關(guān)鍵詞檢測(cè)作為語音識(shí)別技術(shù)中的一項(xiàng)重要內(nèi)容,具有廣泛的應(yīng)用前景和研究價(jià)值。但由于受環(huán)境噪聲、說話人發(fā)音差異等因素的影響,檢測(cè)結(jié)果中不可避免地存在大量錯(cuò)誤。而置信度計(jì)算則能夠在沒有正確參考條件下,通過對(duì)各候選項(xiàng)的“可靠性”程度進(jìn)行客觀度量,有效排除識(shí)別過程中所產(chǎn)生的大量虛警,因此是關(guān)鍵詞識(shí)別系統(tǒng)走向?qū)嵱没年P(guān)鍵技術(shù)之一。本文根據(jù)關(guān)鍵詞屬性的不同,分別對(duì)基于集內(nèi)詞(In-Vocabulary, Ⅳ)和集外詞(Out-of-Vocabulary,OOV)的置信度計(jì)算及規(guī)整技術(shù)進(jìn)行了深入研究,具體內(nèi)容和貢獻(xiàn)主要有以下三個(gè)方面:(1)針對(duì)集內(nèi)詞檢測(cè)中缺乏對(duì)上下文信息有效利用的問題,提出了一種基于上下文語義相似度優(yōu)化的置信度方法。該方法首先將候選關(guān)鍵詞與其上下文間的語義相似性程度作為置信度度量;其次,采用自適應(yīng)滑動(dòng)窗對(duì)連續(xù)識(shí)別結(jié)果進(jìn)行語義分割,將候選關(guān)鍵詞與其上下文鎖定在相同語義片內(nèi),消除以整句話作為候選詞上下文時(shí)所產(chǎn)生的不同語義間干擾;最后,通過引入歸一化詞間距離信息,異化相同語義片內(nèi)的不同位置上下文對(duì)候選詞的影響。實(shí)驗(yàn)結(jié)果表明,考慮語義分割和位置距離信息,能夠顯著增強(qiáng)基于上下文語義相似度的集內(nèi)詞置信度計(jì)算性能。(2)針對(duì)基于模糊匹配的集外詞檢測(cè)中,由于匹配的不精準(zhǔn)性而導(dǎo)致部分集內(nèi)詞易被誤識(shí)為集外詞候選的問題,提出了一種基于語音誤識(shí)的集外詞置信度確認(rèn)方法。該方法在不使用正確標(biāo)注條件下,根據(jù)各候選詞屬性估計(jì)識(shí)別結(jié)果中可能存在的誤識(shí)類別,并通過將其轉(zhuǎn)化為特征以及區(qū)分性模型訓(xùn)練,來檢測(cè)識(shí)別結(jié)果中的集內(nèi)詞、集外詞區(qū)域。若在集內(nèi)詞區(qū)域發(fā)現(xiàn)關(guān)于集外詞的模糊匹配結(jié)果,則將其視為錯(cuò)誤虛警;相反若發(fā)生于集外詞區(qū)域,則進(jìn)一步通過聯(lián)合置信度得分重估,判斷候選結(jié)果的可靠性。實(shí)驗(yàn)結(jié)果表明,經(jīng)本文基于擴(kuò)展語音誤識(shí)的置信度確認(rèn),系統(tǒng)集外詞檢測(cè)性能可實(shí)現(xiàn)較大程度提升。(3)針對(duì)不同候選關(guān)鍵詞間的屬性差異,可導(dǎo)致置信度得分代表的置信度水平有所不同的問題,提出了一種基于實(shí)際查詢?cè)~權(quán)重代價(jià)(Actual Term-Weighted Value, ATWV)優(yōu)化的詞相關(guān)置信度規(guī)整方法。該方法根據(jù)測(cè)試集中詞發(fā)生次數(shù),調(diào)整候選關(guān)鍵詞置信度得分,并分別采用線性和區(qū)分性方式補(bǔ)償ATWV優(yōu)化中產(chǎn)生的置信度偏差,其中線性補(bǔ)償以線性組合方式調(diào)整置信度得分,而區(qū)分性補(bǔ)償則通過將其轉(zhuǎn)化為正確分類概率,降低置信度偏差帶來的影響。實(shí)驗(yàn)結(jié)果表明,在該置信度規(guī)整方法下,關(guān)鍵詞檢測(cè)ATWV和DET曲線均會(huì)有所改善。
【關(guān)鍵詞】:置信度計(jì)算 集內(nèi)詞檢測(cè) 語義相似度優(yōu)化 集外詞檢測(cè) 擴(kuò)展語音誤識(shí) 詞相關(guān)規(guī)整 ATWV優(yōu)化 偏差補(bǔ)償
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
  • 摘要4-5
  • Abstract5-12
  • 第一章 緒論12-24
  • 1.1 語音關(guān)鍵詞檢測(cè)技術(shù)概述12-14
  • 1.1.1 關(guān)鍵詞檢測(cè)發(fā)展歷程12-13
  • 1.1.2 關(guān)鍵詞檢測(cè)面臨難點(diǎn)13-14
  • 1.2 研究關(guān)鍵詞置信度計(jì)算意義14-15
  • 1.3 置信度計(jì)算研究現(xiàn)狀15-20
  • 1.3.1 集內(nèi)詞置信度計(jì)算方法15-18
  • 1.3.2 集外詞檢測(cè)及置信度計(jì)算方法18-19
  • 1.3.3 置信度得分規(guī)整方法19-20
  • 1.4 存在的主要問題20
  • 1.5 論文研究內(nèi)容及結(jié)構(gòu)安排20-24
  • 第二章 語音關(guān)鍵詞檢測(cè)系統(tǒng)實(shí)現(xiàn)24-40
  • 2.1 關(guān)鍵詞檢測(cè)關(guān)鍵技術(shù)24-35
  • 2.1.1 預(yù)處理24-25
  • 2.1.2 特征提取25-26
  • 2.1.3 聲學(xué)模型26-30
  • 2.1.4 語言模型30
  • 2.1.5 解碼器30-32
  • 2.1.6 關(guān)鍵詞搜索32-34
  • 2.1.7 置信度計(jì)算34-35
  • 2.2 關(guān)鍵詞檢測(cè)評(píng)價(jià)指標(biāo)35-36
  • 2.2.1 漏警率、虛警率和DET曲線35-36
  • 2.2.2 實(shí)際查詢?cè)~權(quán)重代價(jià)36
  • 2.3 實(shí)驗(yàn)36-38
  • 2.3.1 實(shí)驗(yàn)設(shè)置36-37
  • 2.3.2 實(shí)驗(yàn)結(jié)果與分析37-38
  • 2.4 小結(jié)38-40
  • 第三章 基于上下文語義相似度優(yōu)化的集內(nèi)詞置信度計(jì)算40-50
  • 3.1 引言40
  • 3.2 上下文語義相似度40-42
  • 3.2.1 詞間語義相似度41-42
  • 3.2.2 上下文路徑選取42
  • 3.3 語義相似度優(yōu)化處理42-44
  • 3.3.1 自適應(yīng)滑動(dòng)窗語義分割43-44
  • 3.3.2 引入距離信息的相似度度量44
  • 3.4 實(shí)驗(yàn)44-47
  • 3.4.1 實(shí)驗(yàn)設(shè)置44-45
  • 3.4.2 實(shí)驗(yàn)結(jié)果分析45-47
  • 3.5 小結(jié)47-50
  • 第四章 基于模糊匹配和擴(kuò)展語音誤識(shí)的集外詞置信度算法50-60
  • 4.1 引言50
  • 4.2 集外詞檢測(cè)50-51
  • 4.3 語音誤識(shí)估計(jì)51-52
  • 4.4 基于語音誤識(shí)的置信度計(jì)算52-56
  • 4.4.1 擴(kuò)展誤識(shí)類別特征52-54
  • 4.4.2 基礎(chǔ)特征選取及上下文相關(guān)化54-55
  • 4.4.3 IV/OOV標(biāo)注55
  • 4.4.4 聯(lián)合得分重估55-56
  • 4.5 實(shí)驗(yàn)56-58
  • 4.5.1 實(shí)驗(yàn)設(shè)置56
  • 4.5.2 實(shí)驗(yàn)結(jié)果及分析56-58
  • 4.6 小結(jié)58-60
  • 第五章 基于ATWV優(yōu)化和偏差補(bǔ)償?shù)脑~相關(guān)置信度規(guī)整60-70
  • 5.1 引言60
  • 5.2 ATWV優(yōu)化60-62
  • 5.3 偏差補(bǔ)償方法62-64
  • 5.3.1 線性補(bǔ)償62-63
  • 5.3.2 區(qū)分性補(bǔ)償63-64
  • 5.4 實(shí)驗(yàn)64-68
  • 5.4.1 實(shí)驗(yàn)設(shè)置64-65
  • 5.4.2 實(shí)驗(yàn)結(jié)果分析65-68
  • 5.5 小結(jié)68-70
  • 結(jié)束語70-72
  • 一、本文主要工作70
  • 二、下一步研究方向70-72
  • 致謝72-74
  • 參考文獻(xiàn)74-82
  • 作者簡歷82

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前6條

1 Javier Tejedo;Simon King;Joe Frankel;;Term-Dependent Confidence Normalisation for Out-of-Vocabulary Spoken Term Detection[J];Journal of Computer Science & Technology;2012年02期

2 孟莎;劉加;;漢語語音檢索的集外詞問題與兩階段檢索方法[J];中文信息學(xué)報(bào);2009年06期

3 國玉晶;劉剛;劉健;郭軍;;基于環(huán)境特征的語音識(shí)別置信度研究[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期

4 倪崇嘉;劉文舉;徐波;;漢語大詞匯量連續(xù)語音識(shí)別系統(tǒng)研究進(jìn)展[J];中文信息學(xué)報(bào);2009年01期

5 張鵬遠(yuǎn);邵健;趙慶衛(wèi);顏永紅;;廣播新聞?wù)Z音的關(guān)鍵詞檢測(cè)系統(tǒng)[J];通信學(xué)報(bào);2007年12期

6 孫輝;鄭方;吳文虎;;基于上下文相關(guān)置信度打分的語音確認(rèn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期


  本文關(guān)鍵詞:語音關(guān)鍵詞檢測(cè)中的置信度研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):307958

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/307958.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d79e8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲中文字幕高清乱码毛片| 日韩欧美国产精品自拍| 99久久国产亚洲综合精品| 翘臀少妇成人一区二区| 日韩精品成区中文字幕| 国产成人精品99在线观看| 男人大臿蕉香蕉大视频| 国产精品国三级国产专不卡| 嫩呦国产一区二区三区av| 国产激情一区二区三区不卡| 国产一二三区不卡视频| 色综合久久六月婷婷中文字幕| 国产午夜精品在线免费看| 开心激情网 激情五月天| 大香蕉久草网一区二区三区| 麻豆tv传媒在线观看| 麻豆视传媒短视频在线看| 午夜国产精品福利在线观看| 久久精品国产亚洲av久按摩| 欧美成人一区二区三区在线| 丰满少妇被猛烈插入在线观看| 精品人妻精品一区二区三区| 国产免费观看一区二区| 噜噜中文字幕一区二区| 亚洲中文字幕在线观看四区| 中文字幕日韩精品人一妻| 内射精子视频欧美一区二区| 国产丝袜女优一区二区三区| 亚洲精品一区三区三区| 人妻亚洲一区二区三区| 91日韩欧美中文字幕| 日本国产欧美精品视频| 亚洲中文字幕在线观看四区| 久久久精品区二区三区| 亚洲欧美中文日韩综合| 欧美激情一区=区三区| 男人大臿蕉香蕉大视频| 成人午夜在线视频观看| 日本妇女高清一区二区三区| 少妇熟女亚洲色图av天堂| 91在线国内在线中文字幕|