天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于DMLS的語(yǔ)音關(guān)鍵詞檢測(cè)技術(shù)研究

發(fā)布時(shí)間:2018-03-09 19:23

  本文選題:關(guān)鍵詞檢測(cè) 切入點(diǎn):動(dòng)態(tài)匹配詞格檢索 出處:《解放軍信息工程大學(xué)》2014年碩士論文 論文類型:學(xué)位論文


【摘要】:語(yǔ)音關(guān)鍵詞檢測(cè)是指在語(yǔ)音數(shù)據(jù)中查找到所有可能出現(xiàn)的給定詞的過(guò)程,是有效處理口語(yǔ)和實(shí)現(xiàn)人機(jī)智能通信的解決方案之一,具有廣泛的應(yīng)用前景。目前,基于動(dòng)態(tài)匹配詞格檢索(Dynamic Match Lattice Spotting, DMLS)的方法是關(guān)鍵詞檢測(cè)的主流方法之一。DMLS將基于Lattice的快速檢測(cè)和動(dòng)態(tài)序列匹配技術(shù)融合在一起,在Lattice檢索過(guò)程中應(yīng)用最小編輯距離來(lái)補(bǔ)償音素識(shí)別器的插入、刪除和替換錯(cuò)誤,實(shí)現(xiàn)了快速而準(zhǔn)確的關(guān)鍵詞檢測(cè)。本文針對(duì)DMLS方法的特點(diǎn),在Lattice生成、索引創(chuàng)建、關(guān)鍵詞置信度和集外詞檢測(cè)等方面開(kāi)展研究,主要工作及創(chuàng)新點(diǎn)如下:(1)音素Lattice的精度直接影響關(guān)鍵詞檢測(cè)的性能,為了提高Lattice的精度,應(yīng)用TRAP特征和多層感知器構(gòu)建了更為精準(zhǔn)的音素Lattice生成系統(tǒng),并在此基礎(chǔ)上搭建了基于DMLS的關(guān)鍵詞檢測(cè)基線系統(tǒng)。該系統(tǒng)采用改進(jìn)的維特比算法遍歷Lattice來(lái)創(chuàng)建一個(gè)固定長(zhǎng)度的音素序列數(shù)據(jù)庫(kù)(Sequence Database, SDB),在檢索階段應(yīng)用最小編輯距離作為置信度來(lái)實(shí)現(xiàn)關(guān)鍵詞的檢出。實(shí)驗(yàn)結(jié)果表明,基于TRAP特征生成的Lattic e搭建的基線系統(tǒng)相比MFCC和PLP特征具有一定的優(yōu)勢(shì),系統(tǒng)的召回率提升了約5%。(2)針對(duì)DMLS中索引階段SDB創(chuàng)建損失部分信息和查詢項(xiàng)長(zhǎng)度超出索引長(zhǎng)度的問(wèn)題,提出了一種改進(jìn)的混合索引的方法,將最大概率音素序列和SDB融合構(gòu)成混合索引。最大概率音素序列是語(yǔ)音識(shí)別中的1-best完整結(jié)果,可以代表整個(gè)Lattice上的全局最優(yōu)結(jié)果,與SDB形成一定的互補(bǔ),并且最大概率音素序列不受音素序列長(zhǎng)度N的影響,可以用于輔助音素序列較長(zhǎng)的查詢項(xiàng)的檢測(cè)。實(shí)驗(yàn)結(jié)果表明,混合索引方法相比單一的SDB索引系統(tǒng)的品質(zhì)因數(shù)提升了1.4%。(3)在基于DMLS的關(guān)鍵詞檢測(cè)系統(tǒng)中,應(yīng)用最小編輯距離作為關(guān)鍵詞檢出的置信度,該方法在提高檢出率的同時(shí)也增加了虛警率。針對(duì)此問(wèn)題,提出了一種融合后驗(yàn)概率的混合置信度方法。該方法首先將基于Lattice的后驗(yàn)概率引入到DMLS的索引建立中,其次應(yīng)用數(shù)據(jù)驅(qū)動(dòng)的音素替換、插入和刪除代價(jià)來(lái)實(shí)現(xiàn)更加靈活的近似匹配,最后通過(guò)聯(lián)合最小編輯距離和后驗(yàn)概率置信度得分進(jìn)行關(guān)鍵詞檢測(cè)。實(shí)驗(yàn)結(jié)果表明,最小編輯距離和后驗(yàn)概率置信度具有一定的互補(bǔ)性,系統(tǒng)的等錯(cuò)誤率相對(duì)降低了13.3%。(4)針對(duì)關(guān)鍵詞檢測(cè)中的集外詞問(wèn)題,提出了一種融合查詢擴(kuò)展和動(dòng)態(tài)匹配的方法。由于查詢擴(kuò)展和動(dòng)態(tài)匹配是在不同的層面補(bǔ)償集外詞發(fā)音的不確定性,考慮到兩者潛在的互補(bǔ)性,研究了兩種融合方法:一種方法是結(jié)果融合,分別應(yīng)用查詢擴(kuò)展和動(dòng)態(tài)匹配并行的檢測(cè)集外詞,然后合并檢測(cè)結(jié)果;另一種是置信度融合,融合最小編輯距離和發(fā)音得分構(gòu)成混合置信度進(jìn)行集外詞的檢出與確認(rèn)。實(shí)驗(yàn)結(jié)果表明,第二種融合方法的效果更好,系統(tǒng)的品質(zhì)因數(shù)相對(duì)提升了19.8%。
[Abstract]:Speech keyword detection refers to the voice data to find all possible for a given word, is the effective treatment of oral and one solution to achieve intelligent man-machine communication, has wide application prospect. At present, the dynamic matching word lattice based retrieval (Dynamic Match Lattice Spotting, DMLS) method is one of the main methods of keyword detection.DMLS rapid detection and dynamic Lattice sequence matching technology together based on the application of insertion of the minimum edit distance in the Lattice retrieval process to compensate phoneme recognizer, delete and replace error, realize keyword detection quickly and accurately. This paper is based on DMLS method, create the index in the Lattice generation, and carry out study on the key words of confidence and out of vocabulary testing and other aspects, the main work and innovation are as follows: (1) directly affect the accuracy of the phoneme Lattice keyword detection ring The performance, in order to improve the accuracy of Lattice, application of TRAP and multilayer perceptron constructs a more precise phoneme Lattice generation system, which is established on the basis of DMLS baseline system based on keyword detection. The system adopts an improved Viterbi algorithm to traverse the Lattice to create a fixed length phoneme sequence database (Sequence Database. SDB), in the detection of phase retrieval using minimum edit distance as the confidence to achieve the keywords. The experimental results show that the baseline system characteristics of TRAP generated Lattic e based structures compared to MFCC and PLP feature has certain advantages, enhance the recall rate of about 5%. system (2) for the DMLS SDB to create the index loss part of the information and query length exceeds the length of the index, proposed a hybrid index improved, the maximum probability of phoneme sequences and SDB fusion hybrid The maximum probability index. 1-best is a complete sequence of phonemes results in speech recognition, can represent the global optimal results on the Lattice, form a complementary and SDB, and the maximum probability of phoneme sequence is not affected by the phoneme sequence length of N, can be used for the detection of query auxiliary phoneme sequences longer. The experimental results show that the mixed compared the quality factor index method SDB index system the improved 1.4%. (3) in the DMLS based keyword detection system, the application of minimum edit distance as the keyword detection confidence, this method can improve the detection rate and increase the false alarm rate. To solve this problem, we propose a hybrid fusion the confidence probability method. Firstly, Lattice posterior probability is introduced into the DMLS index based on data driven application to replace the second phone, insert and delete the price. The more flexible approximate matching, finally combined with the minimum edit distance and a posteriori probability confidence score for keyword detection. The experimental results show that the minimum edit distance and a posteriori confidence has a complementary system, etc. the relative error rate is reduced by 13.3%. (4) according to the problems in the detection of out of vocabulary words. This paper presents a fusion method for query expansion and dynamic matching. Because the query expansion and dynamic matching in pronunciation level compensation out of vocabulary of different uncertainty, considering the complementarity of the two potential, two kinds of fusion methods: one is the result of fusion was detected by out of vocabulary expansion and dynamic parallel matching the query, then merge the results; the other is confidence fusion, fusion minimum edit distance and the pronunciation score constitutes detection and validation of hybrid reliability of out of vocabulary words. The experimental results show that the effect of the second fusion methods is better, and the quality factor of the system is improved by 19.8%.

【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TN912.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陽(yáng)小華;蔣輝;馬家宇;;基于任務(wù)上下文的查詢擴(kuò)展方法[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2010年01期

2 吳煈;張奇;黃萱菁;;基于整數(shù)線性規(guī)劃的查詢擴(kuò)展[J];計(jì)算機(jī)研究與發(fā)展;2013年08期

3 何燕;;基于用戶反饋的查詢擴(kuò)展研究[J];情報(bào)理論與實(shí)踐;2013年08期

4 黃偉群;;基于用戶視角的交互式查詢擴(kuò)展研究[J];圖書情報(bào)工作;2014年05期

5 黃名選;嚴(yán)小衛(wèi);張師超;;查詢擴(kuò)展技術(shù)進(jìn)展與展望[J];計(jì)算機(jī)應(yīng)用與軟件;2007年11期

6 林國(guó)俊;葉飛躍;耿冬;鄭國(guó)良;;基于語(yǔ)義的概念查詢擴(kuò)展[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年06期

7 鞏玉璽;王大玲;;一種改進(jìn)的基于偽相關(guān)反饋的查詢擴(kuò)展[J];微計(jì)算機(jī)信息;2009年15期

8 黃名選;張師超;嚴(yán)小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年10期

9 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹(shù)的查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年14期

10 羅小聰;;基于專用雙語(yǔ)詞典的查詢擴(kuò)展[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年10期

相關(guān)會(huì)議論文 前10條

1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴(kuò)展的數(shù)字檔案檢索策略[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

3 林建方;李生;鄭德權(quán);;基于詞語(yǔ)搭配關(guān)系的查詢擴(kuò)展方法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 丁國(guó)棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

5 李東園;白宇;蔡?hào)|風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

6 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

7 王秉卿;張奇;吳立德;黃萱菁;;機(jī)器學(xué)習(xí)的查詢擴(kuò)展在博客檢索中的應(yīng)用[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

8 王秉卿;黃萱菁;;基于線性模型的查詢擴(kuò)展方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

9 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

10 郭文;史曉東;陳毅東;;跨語(yǔ)言信息檢索中的查詢擴(kuò)展[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

相關(guān)重要報(bào)紙文章 前1條

1 鐘威 何擁軍;數(shù)字檔案信息擴(kuò)展查詢功能需求分析及實(shí)現(xiàn)方式[N];中國(guó)檔案報(bào);2011年

相關(guān)博士學(xué)位論文 前3條

1 郭曉黎;煤礦安全事件本體及其在查詢擴(kuò)展中的應(yīng)用研究[D];中國(guó)礦業(yè)大學(xué)(北京);2016年

2 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年

3 王俊義;正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 鄭永軍;基于DMLS的語(yǔ)音關(guān)鍵詞檢測(cè)技術(shù)研究[D];解放軍信息工程大學(xué);2014年

2 姚小同;查詢擴(kuò)展技術(shù)研究[D];北京郵電大學(xué);2009年

3 許威;基于概念格的查詢擴(kuò)展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年

4 胡保祥;基于查詢?nèi)罩镜牟樵償U(kuò)展研究[D];北京郵電大學(xué);2013年

5 董靜;基于信任網(wǎng)絡(luò)的查詢擴(kuò)展技術(shù)研究[D];哈爾濱工程大學(xué);2013年

6 郭青;基于用戶標(biāo)注信息的查詢擴(kuò)展方法研究[D];大連理工大學(xué);2014年

7 尹俊杰;基于本體術(shù)語(yǔ)關(guān)系的局部查詢擴(kuò)展[D];河北大學(xué);2012年

8 瞿國(guó)忠;查詢擴(kuò)展技術(shù)研究[D];華中師范大學(xué);2007年

9 林智超;基于查詢擴(kuò)展的網(wǎng)絡(luò)信息語(yǔ)義檢索服務(wù)的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2012年

10 陳U,

本文編號(hào):1589914


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/1589914.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4f169***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
午夜久久久精品国产精品| 国产亚洲精品一二三区| 国产熟女一区二区精品视频| 成年人黄片大全在线观看| 中日韩免费一区二区三区| 国产精品国产亚洲看不卡| 国产精品免费自拍视频| 黄片免费播放一区二区| 色婷婷国产熟妇人妻露脸| 国产精品成人一区二区在线| 搡老熟女老女人一区二区| 视频一区中文字幕日韩| 男女午夜视频在线观看免费| 日本99精品在线观看| 欧美一区二区三区高潮菊竹| 好吊日成人免费视频公开| 欧美欧美日韩综合一区| 五月婷婷欧美中文字幕| 国产精品日韩精品最新| 日韩一区二区三区免费av| 欧美日韩国产一级91| 亚洲a码一区二区三区| 日本亚洲精品在线观看| 五月的丁香婷婷综合网| 久久99亚洲小姐精品综合| 午夜小视频成人免费看| 亚洲一区精品二人人爽久久| 欧美在线视频一区观看| 欧美日韩在线视频一区| 91久久国产福利自产拍| 黄片免费观看一区二区| 国内自拍偷拍福利视频| 高中女厕偷拍一区二区三区| 风间中文字幕亚洲一区| 日本欧美一区二区三区高清| 久久精品国产一区久久久| 亚洲欧洲一区二区中文字幕| 久久精品色妇熟妇丰满人妻91| 国产女性精品一区二区三区| 日韩欧美中文字幕av| 日韩国产亚洲一区二区三区|