語(yǔ)音識(shí)別置信度特征提取算法研究
本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語(yǔ)音識(shí)別技術(shù)研究,由筆耕文化傳播整理發(fā)布。
《北京郵電大學(xué)》 2010年
語(yǔ)音識(shí)別置信度特征提取算法研究
國(guó)玉晶
【摘要】: 大規(guī)模連續(xù)語(yǔ)音識(shí)別的研究已經(jīng)進(jìn)行了二十多年,雖已取得了顯著進(jìn)展,但距離廣泛應(yīng)用還有相當(dāng)?shù)木嚯x。在克服識(shí)別算法本身缺陷、追求識(shí)別性能提升的過(guò)程中,研究者們逐漸引入了置信度的概念,用它來(lái)衡量語(yǔ)音識(shí)別系統(tǒng)所作決策的可信程度。近年來(lái),語(yǔ)音識(shí)別置信度在語(yǔ)音錯(cuò)誤檢測(cè)與錯(cuò)誤糾正,無(wú)監(jiān)督和半監(jiān)督訓(xùn)練、多遍搜索技術(shù)和語(yǔ)料庫(kù)中錯(cuò)誤語(yǔ)料甄選等應(yīng)用中都發(fā)揮了非常重要的作用。 傳統(tǒng)的語(yǔ)音識(shí)別置信度標(biāo)注基于不同置信特征或者特征組合進(jìn)行分類判決,目前常使用的置信特征主要來(lái)源于解碼信息。但是,方面現(xiàn)有置信度特征對(duì)解碼信息的挖掘仍局限于孤立和靜態(tài),而忽略了詞與周圍環(huán)境之間的關(guān)系;另一方面,目前聲學(xué)特征仍占主要地位,而人類聽(tīng)覺(jué)實(shí)驗(yàn)表明,人在進(jìn)行語(yǔ)音理解時(shí),大約有30%的信息來(lái)自于語(yǔ)法、語(yǔ)義等知識(shí)的指導(dǎo)。因此,在置信度特征提取中,如何挖掘出詞與環(huán)境之間的關(guān)系,同時(shí)提煉出詞的語(yǔ)法和語(yǔ)義特征,從而提高識(shí)別后處理性能,是一個(gè)非常值得研究的問(wèn)題。 基于上述目的,本文在搭建傳統(tǒng)語(yǔ)音識(shí)別置信度標(biāo)記系統(tǒng)的基礎(chǔ)上,提出了兩種新的置信度特征,一是環(huán)境特征,分為上下文環(huán)境、動(dòng)態(tài)環(huán)境、句全局環(huán)境三類,通過(guò)對(duì)解碼信息的再加工,從空間與時(shí)間角度較全面地描述了詞與環(huán)境之間的關(guān)系;二是基于主題相似性的語(yǔ)義層置信特征提取算法TSS (Topic Similarity based Semantic confidence feature extraction algorithm),通過(guò)主題模型LDA(Latent Dirichlet Allocation)計(jì)算得到識(shí)別結(jié)果中詞的主題分布及其上下文的主題分布,并將二者之間的主題相似性作為詞的語(yǔ)義置信特征。實(shí)驗(yàn)表明,本文提出的兩種特征深入挖掘了解碼層的有效信息,又增加了置信特征的信息來(lái)源,與解碼層置信特征進(jìn)行組合后能有效地提高置信度標(biāo)注的精度。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:TN912.34
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 陳國(guó)興;基于音節(jié)片Lattice的語(yǔ)音檢索關(guān)鍵問(wèn)題研究[D];哈爾濱工程大學(xué);2012年
【同被引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 常凱;;基于TF*IDF垃圾郵件過(guò)濾改進(jìn)算法的研究[J];電腦知識(shí)與技術(shù);2010年25期
2 張仰森,徐波,曹元大;自然語(yǔ)言處理中的語(yǔ)言模型及其比較研究[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年01期
3 饒耀全;吳小培;呂釗;;基于HTK的漢語(yǔ)語(yǔ)音售票系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];工業(yè)控制計(jì)算機(jī);2010年10期
4 王歡良;韓紀(jì)慶;;基于Lattice分段的高質(zhì)量混淆網(wǎng)絡(luò)快速生成方法[J];高技術(shù)通訊;2010年05期
5 孫成立;;混淆網(wǎng)絡(luò)在音頻文檔檢索系統(tǒng)中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年28期
6 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報(bào)雜志;2006年12期
7 孟莎;余鵬;Frank Seide;劉加;;基于后驗(yàn)概率詞格的漢語(yǔ)自然對(duì)話語(yǔ)音索引[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年S1期
8 吳斌;劉剛;郭軍;;漢語(yǔ)大詞匯量連續(xù)語(yǔ)音識(shí)別中混淆網(wǎng)絡(luò)算法的研究[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2007年S1期
9 鄭鐵然;韓紀(jì)慶;李海洋;;基于詞片的語(yǔ)言模型及在漢語(yǔ)語(yǔ)音檢索中的應(yīng)用[J];通信學(xué)報(bào);2009年03期
10 石現(xiàn)峰;張學(xué)智;張峰;;基于HTK的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年10期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語(yǔ)音識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 鄭鐵然;基于音節(jié)網(wǎng)格的漢語(yǔ)語(yǔ)音文檔檢索方法研究[D];哈爾濱工業(yè)大學(xué);2008年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 高運(yùn)霞;基于網(wǎng)格的中文語(yǔ)音文件檢索技術(shù)的研究[D];哈爾濱工程大學(xué);2010年
2 陳晶;基于詞片網(wǎng)格的語(yǔ)音文檔主題分類[D];哈爾濱工程大學(xué);2010年
3 劉建舟;術(shù)語(yǔ)自動(dòng)抽取系統(tǒng)的設(shè)計(jì)及關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2004年
4 侯周國(guó);基于HMM的漢語(yǔ)數(shù)字語(yǔ)音識(shí)別系統(tǒng)研究[D];湖南師范大學(xué);2006年
5 鄭毅;文本挖掘及其在文本檢索中的應(yīng)用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年
6 蘇敏;一種基于HMM和RBF網(wǎng)絡(luò)混合的語(yǔ)音識(shí)別算法研究[D];蘭州理工大學(xué);2007年
7 劉洋;基于最佳狀態(tài)數(shù)的漢語(yǔ)數(shù)字語(yǔ)音識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2008年
8 項(xiàng)勇;基于DSP和HMM的語(yǔ)音識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];武漢科技大學(xué);2008年
9 李海洋;基于詞片和Lattice的漢語(yǔ)語(yǔ)音檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
10 蔣斌;基于停用詞處理的漢語(yǔ)語(yǔ)音檢索方法[D];哈爾濱工業(yè)大學(xué);2008年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 白寶興;管道內(nèi)表面質(zhì)量檢測(cè)系統(tǒng)設(shè)計(jì)[J];中國(guó)圖象圖形學(xué)報(bào);1998年06期
2 張亮;郭桂蓉;莊釗文;何松華;馬莉波;;雷達(dá)目標(biāo)高分辨距離像數(shù)據(jù)預(yù)處理方法研究[J];電子學(xué)報(bào);1998年06期
3 沈同圣;任建存;馮亞林;周曉東;;紅外成像制導(dǎo)中目標(biāo)識(shí)別方法探討[J];紅外與激光工程;1998年05期
4 劉守生,丁勇,胡壽松;一種特征提取新方法[J];信號(hào)處理;1999年S1期
5 李平,蔣振剛;神經(jīng)網(wǎng)絡(luò)對(duì)手寫(xiě)字符識(shí)別特征的提取[J];長(zhǎng)春光學(xué)精密機(jī)械學(xué)院學(xué)報(bào);2000年02期
6 孟國(guó)強(qiáng);基于車輛牌照識(shí)別系統(tǒng)字符的特征提取方法研究[J];河南科學(xué);2003年06期
7 邵云生,徐國(guó)華;雷達(dá)艦船目標(biāo)的混合特征提取算法的設(shè)計(jì)與實(shí)現(xiàn)[J];艦船電子對(duì)抗;2004年02期
8 崔晨旸,石教英;三維模型檢索中的特征提取技術(shù)綜述[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2004年07期
9 張曉東,陳鋒;基于非線性回歸的自適應(yīng)特征提取算法[J];阜陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期
10 夏曉清,馮偉,趙榮椿;CPODW數(shù)字水印技術(shù)中的圖像內(nèi)容提取方法[J];計(jì)算機(jī)應(yīng)用;2004年S2期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 林土勝;賴聲禮;;視網(wǎng)膜血管特征提取的拆支跟蹤法[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年
2 錢(qián)小聰;鄭寶玉;穆明鑫;;神經(jīng)網(wǎng)絡(luò)聯(lián)機(jī)手寫(xiě)簽名驗(yàn)證[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
3 張羽;汪源源;王威琪;余建國(guó);林繼耕;;狹窄血管多普勒信號(hào)特征提取的實(shí)驗(yàn)研究[A];21世紀(jì)醫(yī)學(xué)工程學(xué)術(shù)研討會(huì)論文摘要匯編[C];2001年
4 柳林霞;陳杰;竇麗華;;不變矩理論及其在目標(biāo)識(shí)別中的應(yīng)用[A];2002中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2002年
5 楊日杰;施建禮;林洪文;;一種雷達(dá)視頻回波特征提取方法研究[A];中國(guó)航空學(xué)會(huì)信號(hào)與信息處理專業(yè)全國(guó)第八屆學(xué)術(shù)會(huì)議論文集[C];2004年
6 代克杰;張紅梅;盛賽斌;;基于BP網(wǎng)絡(luò)的故障特征提取方法研究[A];2004中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2004年
7 何新;史迎春;周獻(xiàn)中;;一種基于獨(dú)立分量分析的音頻分類方法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
8 朱曉霞;孫同景;陳桂友;;基于支持向量機(jī)理論的兩級(jí)指紋分類實(shí)現(xiàn)方法[A];第16屆中國(guó)過(guò)程控制學(xué)術(shù)年會(huì)暨第4屆全國(guó)故障診斷與安全性學(xué)術(shù)會(huì)議論文集[C];2005年
9 范海寧;郭英;吳劍鋒;陳志武;;基于小波包分解的聲信號(hào)特征提取方法[A];信號(hào)與信息處理技術(shù)第三屆信號(hào)與信息處理全國(guó)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2004年
10 郗長(zhǎng)青;鄭建明;李言;羅杰;;基于小波包分解的鉆頭磨損特征提取[A];制造技術(shù)自動(dòng)化學(xué)術(shù)會(huì)議論文集[C];2004年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 燕海霞;王憶勤;李福鳳;[N];中國(guó)醫(yī)藥報(bào);2005年
2 沈占鋒;[N];計(jì)算機(jī)世界;2006年
3 王竣;[N];中國(guó)醫(yī)藥報(bào);2007年
4 北京數(shù)碼空間信息技術(shù)有限公司技術(shù)總監(jiān) 劉斌;[N];計(jì)算機(jī)世界;2000年
5 孫哲南 譚鐵牛;[N];計(jì)算機(jī)世界;2007年
6 上海 高博;[N];電腦報(bào);2008年
7 記者 何騰江 通訊員 周匯成;[N];中山日?qǐng)?bào);2008年
8 本報(bào)記者 劉洪宇;[N];遼寧日?qǐng)?bào);2008年
9 林木樹(shù);[N];人民郵電;2004年
10 中科院自動(dòng)化所 何鵬 陶建華 譚鐵牛;[N];計(jì)算機(jī)世界;2005年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 馮坤;基于內(nèi)積變換的機(jī)械故障特征提取原理與早期識(shí)別方法研究[D];北京化工大學(xué);2012年
2 張旗;基于屬性的圖像分類研究[D];大連海事大學(xué);2005年
3 張立福;通用光譜模式分解算法及植被指數(shù)的建立[D];武漢大學(xué);2005年
4 蘇彩紅;墻地磚質(zhì)量自動(dòng)檢測(cè)技術(shù)的研究[D];華南理工大學(xué);2004年
5 宋余慶;醫(yī)學(xué)圖像數(shù)據(jù)挖掘若干技術(shù)研究[D];東南大學(xué);2005年
6 宋晴;基于液滴分析技術(shù)和液滴指紋圖的液體識(shí)別方法的研究[D];天津大學(xué);2005年
7 吳婷;自發(fā)腦電腦機(jī)接口模式識(shí)別關(guān)鍵技術(shù)與實(shí)驗(yàn)研究[D];上海交通大學(xué);2008年
8 孫真真;基于光學(xué)區(qū)雷達(dá)目標(biāo)二維像的目標(biāo)散射特征提取的理論及方法研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2001年
9 武子玉;礦物近紅外光譜信息提取及應(yīng)用研究[D];吉林大學(xué);2005年
10 王承;基于神經(jīng)網(wǎng)絡(luò)的模擬電路故障診斷方法研究[D];電子科技大學(xué);2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 國(guó)玉晶;語(yǔ)音識(shí)別置信度特征提取算法研究[D];北京郵電大學(xué);2010年
2 曾紅梅;情緒圖片視覺(jué)誘發(fā)EEG特征提取與分析[D];天津大學(xué);2012年
3 雷自力;基于Pro/E的三維零件參數(shù)化建模和特征提取研究[D];華中科技大學(xué);2011年
4 林少波;中文文本分類特征提取方法的研究與實(shí)現(xiàn)[D];重慶大學(xué);2011年
5 黃健;履帶式車輛微多普勒效應(yīng)與特征提取[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年
6 趙蕾蕾;基于詞和基本短語(yǔ)模式的特征提取方法[D];河北大學(xué);2009年
7 欒嵐;基于機(jī)理模型判據(jù)的圖像中微弱特征提取方法研究及應(yīng)用[D];東北大學(xué);2009年
8 王菲;面向肺部CAD的特征提取、選擇及分類方法研究[D];東北大學(xué);2009年
9 鄭睿;藻類細(xì)胞圖像的特征提取與分類方法研究[D];杭州電子科技大學(xué);2009年
10 李仁杰;高分辨率SAR圖像目標(biāo)三維特征提取與建模[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
本文關(guān)鍵詞:基于混淆網(wǎng)絡(luò)和輔助信息的語(yǔ)音識(shí)別技術(shù)研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):116056
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/116056.html