語音關(guān)鍵詞檢測(cè)中的置信度研究
本文關(guān)鍵詞:語音關(guān)鍵詞檢測(cè)中的置信度研究,由筆耕文化傳播整理發(fā)布。
【摘要】:關(guān)鍵詞檢測(cè)作為語音識(shí)別技術(shù)中的一項(xiàng)重要內(nèi)容,具有廣泛的應(yīng)用前景和研究價(jià)值。但由于受環(huán)境噪聲、說話人發(fā)音差異等因素的影響,檢測(cè)結(jié)果中不可避免地存在大量錯(cuò)誤。而置信度計(jì)算則能夠在沒有正確參考條件下,通過對(duì)各候選項(xiàng)的“可靠性”程度進(jìn)行客觀度量,有效排除識(shí)別過程中所產(chǎn)生的大量虛警,因此是關(guān)鍵詞識(shí)別系統(tǒng)走向?qū)嵱没年P(guān)鍵技術(shù)之一。本文根據(jù)關(guān)鍵詞屬性的不同,分別對(duì)基于集內(nèi)詞(In-Vocabulary, Ⅳ)和集外詞(Out-of-Vocabulary,OOV)的置信度計(jì)算及規(guī)整技術(shù)進(jìn)行了深入研究,具體內(nèi)容和貢獻(xiàn)主要有以下三個(gè)方面:(1)針對(duì)集內(nèi)詞檢測(cè)中缺乏對(duì)上下文信息有效利用的問題,提出了一種基于上下文語義相似度優(yōu)化的置信度方法。該方法首先將候選關(guān)鍵詞與其上下文間的語義相似性程度作為置信度度量;其次,采用自適應(yīng)滑動(dòng)窗對(duì)連續(xù)識(shí)別結(jié)果進(jìn)行語義分割,將候選關(guān)鍵詞與其上下文鎖定在相同語義片內(nèi),消除以整句話作為候選詞上下文時(shí)所產(chǎn)生的不同語義間干擾;最后,通過引入歸一化詞間距離信息,異化相同語義片內(nèi)的不同位置上下文對(duì)候選詞的影響。實(shí)驗(yàn)結(jié)果表明,考慮語義分割和位置距離信息,能夠顯著增強(qiáng)基于上下文語義相似度的集內(nèi)詞置信度計(jì)算性能。(2)針對(duì)基于模糊匹配的集外詞檢測(cè)中,由于匹配的不精準(zhǔn)性而導(dǎo)致部分集內(nèi)詞易被誤識(shí)為集外詞候選的問題,提出了一種基于語音誤識(shí)的集外詞置信度確認(rèn)方法。該方法在不使用正確標(biāo)注條件下,根據(jù)各候選詞屬性估計(jì)識(shí)別結(jié)果中可能存在的誤識(shí)類別,并通過將其轉(zhuǎn)化為特征以及區(qū)分性模型訓(xùn)練,來檢測(cè)識(shí)別結(jié)果中的集內(nèi)詞、集外詞區(qū)域。若在集內(nèi)詞區(qū)域發(fā)現(xiàn)關(guān)于集外詞的模糊匹配結(jié)果,則將其視為錯(cuò)誤虛警;相反若發(fā)生于集外詞區(qū)域,則進(jìn)一步通過聯(lián)合置信度得分重估,判斷候選結(jié)果的可靠性。實(shí)驗(yàn)結(jié)果表明,經(jīng)本文基于擴(kuò)展語音誤識(shí)的置信度確認(rèn),系統(tǒng)集外詞檢測(cè)性能可實(shí)現(xiàn)較大程度提升。(3)針對(duì)不同候選關(guān)鍵詞間的屬性差異,可導(dǎo)致置信度得分代表的置信度水平有所不同的問題,提出了一種基于實(shí)際查詢?cè)~權(quán)重代價(jià)(Actual Term-Weighted Value, ATWV)優(yōu)化的詞相關(guān)置信度規(guī)整方法。該方法根據(jù)測(cè)試集中詞發(fā)生次數(shù),調(diào)整候選關(guān)鍵詞置信度得分,并分別采用線性和區(qū)分性方式補(bǔ)償ATWV優(yōu)化中產(chǎn)生的置信度偏差,其中線性補(bǔ)償以線性組合方式調(diào)整置信度得分,而區(qū)分性補(bǔ)償則通過將其轉(zhuǎn)化為正確分類概率,降低置信度偏差帶來的影響。實(shí)驗(yàn)結(jié)果表明,在該置信度規(guī)整方法下,關(guān)鍵詞檢測(cè)ATWV和DET曲線均會(huì)有所改善。
【關(guān)鍵詞】:置信度計(jì)算 集內(nèi)詞檢測(cè) 語義相似度優(yōu)化 集外詞檢測(cè) 擴(kuò)展語音誤識(shí) 詞相關(guān)規(guī)整 ATWV優(yōu)化 偏差補(bǔ)償
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TN912.3
【目錄】:
- 摘要4-5
- Abstract5-12
- 第一章 緒論12-24
- 1.1 語音關(guān)鍵詞檢測(cè)技術(shù)概述12-14
- 1.1.1 關(guān)鍵詞檢測(cè)發(fā)展歷程12-13
- 1.1.2 關(guān)鍵詞檢測(cè)面臨難點(diǎn)13-14
- 1.2 研究關(guān)鍵詞置信度計(jì)算意義14-15
- 1.3 置信度計(jì)算研究現(xiàn)狀15-20
- 1.3.1 集內(nèi)詞置信度計(jì)算方法15-18
- 1.3.2 集外詞檢測(cè)及置信度計(jì)算方法18-19
- 1.3.3 置信度得分規(guī)整方法19-20
- 1.4 存在的主要問題20
- 1.5 論文研究內(nèi)容及結(jié)構(gòu)安排20-24
- 第二章 語音關(guān)鍵詞檢測(cè)系統(tǒng)實(shí)現(xiàn)24-40
- 2.1 關(guān)鍵詞檢測(cè)關(guān)鍵技術(shù)24-35
- 2.1.1 預(yù)處理24-25
- 2.1.2 特征提取25-26
- 2.1.3 聲學(xué)模型26-30
- 2.1.4 語言模型30
- 2.1.5 解碼器30-32
- 2.1.6 關(guān)鍵詞搜索32-34
- 2.1.7 置信度計(jì)算34-35
- 2.2 關(guān)鍵詞檢測(cè)評(píng)價(jià)指標(biāo)35-36
- 2.2.1 漏警率、虛警率和DET曲線35-36
- 2.2.2 實(shí)際查詢?cè)~權(quán)重代價(jià)36
- 2.3 實(shí)驗(yàn)36-38
- 2.3.1 實(shí)驗(yàn)設(shè)置36-37
- 2.3.2 實(shí)驗(yàn)結(jié)果與分析37-38
- 2.4 小結(jié)38-40
- 第三章 基于上下文語義相似度優(yōu)化的集內(nèi)詞置信度計(jì)算40-50
- 3.1 引言40
- 3.2 上下文語義相似度40-42
- 3.2.1 詞間語義相似度41-42
- 3.2.2 上下文路徑選取42
- 3.3 語義相似度優(yōu)化處理42-44
- 3.3.1 自適應(yīng)滑動(dòng)窗語義分割43-44
- 3.3.2 引入距離信息的相似度度量44
- 3.4 實(shí)驗(yàn)44-47
- 3.4.1 實(shí)驗(yàn)設(shè)置44-45
- 3.4.2 實(shí)驗(yàn)結(jié)果分析45-47
- 3.5 小結(jié)47-50
- 第四章 基于模糊匹配和擴(kuò)展語音誤識(shí)的集外詞置信度算法50-60
- 4.1 引言50
- 4.2 集外詞檢測(cè)50-51
- 4.3 語音誤識(shí)估計(jì)51-52
- 4.4 基于語音誤識(shí)的置信度計(jì)算52-56
- 4.4.1 擴(kuò)展誤識(shí)類別特征52-54
- 4.4.2 基礎(chǔ)特征選取及上下文相關(guān)化54-55
- 4.4.3 IV/OOV標(biāo)注55
- 4.4.4 聯(lián)合得分重估55-56
- 4.5 實(shí)驗(yàn)56-58
- 4.5.1 實(shí)驗(yàn)設(shè)置56
- 4.5.2 實(shí)驗(yàn)結(jié)果及分析56-58
- 4.6 小結(jié)58-60
- 第五章 基于ATWV優(yōu)化和偏差補(bǔ)償?shù)脑~相關(guān)置信度規(guī)整60-70
- 5.1 引言60
- 5.2 ATWV優(yōu)化60-62
- 5.3 偏差補(bǔ)償方法62-64
- 5.3.1 線性補(bǔ)償62-63
- 5.3.2 區(qū)分性補(bǔ)償63-64
- 5.4 實(shí)驗(yàn)64-68
- 5.4.1 實(shí)驗(yàn)設(shè)置64-65
- 5.4.2 實(shí)驗(yàn)結(jié)果分析65-68
- 5.5 小結(jié)68-70
- 結(jié)束語70-72
- 一、本文主要工作70
- 二、下一步研究方向70-72
- 致謝72-74
- 參考文獻(xiàn)74-82
- 作者簡歷82
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 Javier Tejedo;Simon King;Joe Frankel;;Term-Dependent Confidence Normalisation for Out-of-Vocabulary Spoken Term Detection[J];Journal of Computer Science & Technology;2012年02期
2 孟莎;劉加;;漢語語音檢索的集外詞問題與兩階段檢索方法[J];中文信息學(xué)報(bào);2009年06期
3 國玉晶;劉剛;劉健;郭軍;;基于環(huán)境特征的語音識(shí)別置信度研究[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S1期
4 倪崇嘉;劉文舉;徐波;;漢語大詞匯量連續(xù)語音識(shí)別系統(tǒng)研究進(jìn)展[J];中文信息學(xué)報(bào);2009年01期
5 張鵬遠(yuǎn);邵健;趙慶衛(wèi);顏永紅;;廣播新聞?wù)Z音的關(guān)鍵詞檢測(cè)系統(tǒng)[J];通信學(xué)報(bào);2007年12期
6 孫輝;鄭方;吳文虎;;基于上下文相關(guān)置信度打分的語音確認(rèn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
本文關(guān)鍵詞:語音關(guān)鍵詞檢測(cè)中的置信度研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):307958
本文鏈接:http://sikaile.net/kejilunwen/wltx/307958.html