天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

維吾爾語大詞匯語音識別系統(tǒng)識別單元研究

發(fā)布時間:2018-06-23 15:17

  本文選題:維吾爾語 + 大詞匯; 參考:《北京大學(xué)學(xué)報(自然科學(xué)版)》2014年01期


【摘要】:維吾爾語是一種黏著語,單詞不太適合作為維吾爾語大詞匯連續(xù)語音識別系統(tǒng)識別單元。針對維吾爾語大詞匯連續(xù)語音識別系統(tǒng)中的識別單元選擇問題,設(shè)計更適合維吾爾語的子詞識別單元,提出維吾爾語單詞和子詞相結(jié)合的組合識別單元構(gòu)建方法,并對單詞、子詞和組合識別單元的語言模型和語音識別性能進(jìn)行評價。實驗結(jié)果表明,所提出的識別單元在單元數(shù)量、語言模型復(fù)雜度等方面表現(xiàn)出更加優(yōu)越的性能,并且使識別系統(tǒng)的單詞錯誤率比基于單詞的系統(tǒng)相對減少22%。
[Abstract]:Uygur is a kind of adherent language, and words are not suitable for the recognition unit of Uygur large vocabulary continuous speech recognition system. In order to solve the problem of unit selection in Uygur large vocabulary continuous speech recognition system, a sub-word recognition unit which is more suitable for Uygur language is designed, and a method of combining Uygur words with sub-words is proposed. The language model and speech recognition performance of sub-words and combined recognition units are evaluated. The experimental results show that the proposed recognition unit has better performance in terms of the number of units and the complexity of the language model, and the word-error rate of the recognition system is reduced by 22% compared with that of the word-based system.
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金(61063024,61363063) 新疆維吾爾自治區(qū)多語種信息處理重點實驗室開放課題(049807)資助
【分類號】:TN912.34

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 薛化建;董興華;周喜;吐爾洪·吾司曼;李曉;;基于子字單元的維吾爾語語音識別研究[J];計算機工程;2011年20期

2 古麗拉·阿東別克,米吉提·阿布力米提;維吾爾語詞切分方法初探[J];中文信息學(xué)報;2004年06期

3 早克熱·卡德爾;艾山·吾買爾;吐爾根·依布拉音;帕里旦·吐爾遜;吳小川;;混合策略的維吾爾語名詞詞干提取系統(tǒng)[J];計算機工程與應(yīng)用;2013年01期

4 張小燕;宿建軍;薛化建;王磊;;維吾爾語語音識別語料庫中的OOV研究[J];計算機工程與設(shè)計;2012年02期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王蘇敏;廖晶晶;趙秀鳥;;基于DTW和HMM算法的語音識別系統(tǒng)對比研究[J];計算機光盤軟件與應(yīng)用;2012年11期

2 陳鴿;王廷梅;趙瑋;;一種新的維漢英混排文本顯示模型的設(shè)計[J];硅谷;2012年16期

3 陳強;何炎祥;劉續(xù)樂;孫松濤;彭敏;李飛;;基于句法分析的跨語言情感分析[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期

4 古麗拉·阿東別克,艾爾肯·伊米爾;維吾爾文校對中常見錯誤分析[J];計算機工程與應(yīng)用;2005年27期

5 趙永進(jìn);郭大慶;盧有飛;李英凡;;維文軟件中排版關(guān)鍵技術(shù)的研究與實現(xiàn)[J];計算機工程與應(yīng)用;2007年22期

6 蘇建輝;程晶;蔣同海;;維、哈、柯文版Linux操作系統(tǒng)關(guān)鍵技術(shù)的設(shè)計實現(xiàn)[J];計算機科學(xué);2008年10期

7 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎檢索器的關(guān)鍵技術(shù)[J];計算機工程;2008年21期

8 薛化建;董興華;周喜;吐爾洪·吾司曼;李曉;;基于子字單元的維吾爾語語音識別研究[J];計算機工程;2011年20期

9 張偉;任大明;許曉輝;趙凡;張巖;;維、哈、柯文顯示及排版技術(shù)研究[J];計算機應(yīng)用研究;2008年03期

10 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯多文種全文搜索引擎的設(shè)計與實現(xiàn)[J];計算機應(yīng)用與軟件;2009年06期

相關(guān)會議論文 前9條

1 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計與實現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

2 吐爾地·托合提;維尼拉·木沙江;米吉提·阿不里米提;;維吾爾文搜索引擎Web Server的實現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

3 米吉提·阿不里米提;艾斯卡爾·艾木都拉;吐爾地·托合提;;維語詞法分析器研究開發(fā)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

4 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實現(xiàn)[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

5 李文;李淼;張建;陳雷;雪艷;;一種帶權(quán)值參數(shù)的非監(jiān)督式形態(tài)切分方法[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

6 海麗且木·艾沙;維尼拉·木沙江;;Web文本分類及其維、哈、柯多文種信息檢索中的應(yīng)用研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

7 王珍;維尼拉·木沙江;趙麗紅;;維、哈、柯文搜索引擎中自動分類技術(shù)的應(yīng)用研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

8 通拉嘎;;漢、蒙、藏、維分詞與詞性標(biāo)注技術(shù)發(fā)展現(xiàn)狀研究[A];第五屆全國青年計算語言學(xué)研討會論文集[C];2010年

9 努爾麥麥·提尤魯瓦斯;吾守爾·斯拉木;熱依曼·吐爾遜;;基于音節(jié)的維吾爾語大詞匯連續(xù)語音識別系統(tǒng)[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年

相關(guān)博士學(xué)位論文 前2條

1 陳潔;基于概念融合的網(wǎng)頁篩選技術(shù)研究[D];北京郵電大學(xué);2013年

2 劉楠;面向微博短文本的情感分析研究[D];武漢大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 熱依瑪依·買買提;維、哈、柯搜索引擎中基于文本的圖像檢索技術(shù)的研究[D];新疆大學(xué);2011年

2 趙倩倩;維吾爾語信息檢索[D];天津大學(xué);2012年

3 陳麗珍;維文網(wǎng)絡(luò)中不良文本信息檢索、監(jiān)控系統(tǒng)的研究[D];新疆大學(xué);2006年

4 陳鵬;基于語料庫的維吾爾語詞干提取和詞性標(biāo)注[D];新疆大學(xué);2006年

5 馬歡;基于不定長拼接單元的維吾爾語文語轉(zhuǎn)換系統(tǒng)的研究與實現(xiàn)[D];新疆大學(xué);2006年

6 張冉;主題搜索引擎的研究與設(shè)計[D];新疆大學(xué);2006年

7 蔡琴;基于HTK的維吾爾語連續(xù)數(shù)字語音識別研究[D];新疆大學(xué);2007年

8 胡顏琪;維、漢多語種農(nóng)村信息化系統(tǒng)研究與實現(xiàn)[D];新疆大學(xué);2008年

9 王珍;維、哈、柯文搜索引擎中的自動分類技術(shù)研究[D];新疆大學(xué);2010年

10 劉俊;基于windows7的維文多語種操作系統(tǒng)本地化的研究與實現(xiàn)[D];新疆大學(xué);2012年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王志明;陶建華;;文本-視覺語音合成綜述[J];計算機研究與發(fā)展;2006年01期

2 李艷紅;鄭家恒;;大規(guī)模語料庫可用性評測方法[J];計算機工程與應(yīng)用;2009年16期

3 姑麗加瑪麗·麥麥提艾力;艾斯卡爾·肉孜;艾斯卡爾·艾木都拉;;三音素模型的維吾爾語最佳文本選取算法[J];計算機工程與應(yīng)用;2009年18期

4 李永宏;于洪志;孔江平;;藏語連續(xù)語音語料庫設(shè)計與實現(xiàn)[J];計算機工程與應(yīng)用;2010年13期

5 李晨沖;董濱;潘復(fù)平;曾興雯;顏永紅;;漢語普通話易混淆音素的識別[J];計算機工程;2009年23期

6 殷建平;漢語自動分詞方法[J];計算機工程與科學(xué);1998年03期

7 章森;劉磊;刁麓弘;;大規(guī)模語音語料庫及其在TTS中應(yīng)用的幾個問題[J];計算機學(xué)報;2010年04期

8 那斯?fàn)柦ね聽栠d;吾守爾·斯拉木;;基于隱馬爾可夫模型的維吾爾語連續(xù)語音識別系統(tǒng)[J];計算機應(yīng)用;2009年07期

9 古麗拉·阿東別克,米吉提·阿布力米提;維吾爾語詞切分方法初探[J];中文信息學(xué)報;2004年06期

10 阿依克孜·卡德爾;開沙爾·卡德爾;吐爾根·依布拉音;;面向自然語言信息處理的維吾爾語名詞形態(tài)分析研究[J];中文信息學(xué)報;2006年03期

相關(guān)會議論文 前2條

1 張皖志;陶建華;;基于聲韻母基元的嵌入式中文語音合成系統(tǒng)[A];第十二屆全國信號處理學(xué)術(shù)年會(CCSP-2005)論文集[C];2005年

2 艾山·吾買爾;吐爾根·依不拉音;早克熱·卡德爾;;維吾爾語名詞詞干提取算法的研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 那斯?fàn)柦ね聽栠d;吾守爾·斯拉木;;基于隱馬爾可夫模型的維吾爾語連續(xù)語音識別系統(tǒng)[J];計算機應(yīng)用;2009年07期

2 蔡琴;吾守爾·斯拉木;;基于HTK的維吾爾語連續(xù)數(shù)字語音識別[J];現(xiàn)代計算機;2007年04期

3 王飛飛;吾守爾·斯拉木;那斯?fàn)柦ね聽栠d;;基于DDBHMM的維吾爾語音聲學(xué)識別[J];計算機工程;2011年02期

4 蔡瑞昌;;未來的電話[J];電子技術(shù);1980年08期

5 趙鶴芹;;一個適用于孤立單詞語音識別系統(tǒng)的數(shù)據(jù)壓縮方法—WHT算法[J];云南工業(yè)大學(xué)學(xué)報;1990年03期

6 馬天蔚;;讓語音超越桌面[J];每周電腦報;1999年32期

7 ;文字/語音識別系統(tǒng)[J];中國電子商情;2001年01期

8 劉云冰;;語音識別技術(shù)的回顧與展望[J];軟件導(dǎo)刊;2005年13期

9 劉福才;王冬云;;語音識別技術(shù)及其在控制領(lǐng)域中的應(yīng)用研究(一)[J];可編程控制器與工廠自動化;2005年11期

10 王宏;郭艷麗;賈新民;;基于HMM的孤立字識別[J];昌吉學(xué)院學(xué)報;2006年01期

相關(guān)會議論文 前10條

1 王昆侖;樊志錦;吐爾洪江;方曉華;徐紹瓊;吾買爾;;維吾爾語綜合語音數(shù)據(jù)庫系統(tǒng)[A];第五屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1998年

2 楊學(xué)增;方棣棠;;神經(jīng)網(wǎng)絡(luò)用于語音識別初探[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年

3 王作英;;非齊次語音識別HMM模型和THED語音識別與理解系統(tǒng)[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

4 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

5 胡春靜;吳善培;;不定人的語音識別系統(tǒng)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

6 董林;袁保宗;周繼成;;一種基于神經(jīng)網(wǎng)絡(luò)的漢語語音識別方法[A];第九屆全國信號處理學(xué)術(shù)年會(CCSP-99)論文集[C];1999年

7 國立新;莫福源;李昌立;;基于分段K平均訓(xùn)練的漢語全音節(jié)語音識別的研究[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

8 崔毓菁;劉剛;;基于HMM的語音識別系統(tǒng)中狀態(tài)輸出概率計算優(yōu)化算法的研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年

9 王承發(fā);肖毅壯;韓紀(jì)慶;;一種語音識別系統(tǒng)的端點檢測算法[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

10 何為民;趙銳;陳光發(fā);;軍事口令非特定人識別系統(tǒng)的實現(xiàn)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

相關(guān)重要報紙文章 前10條

1 通訊員 吉春;漢族民警用維吾爾語介紹法律知識[N];巴音郭楞日報;2008年

2 本報記者 朱彤;俺們的“窮多克特”[N];科技日報;2009年

3 高方;讓電影璀璨鄉(xiāng)村的夜晚[N];新疆日報(漢);2008年

4 閻曉明;掌聲傳遞團(tuán)結(jié)的心聲[N];人民日報;2009年

5 李 昕;烏魯木齊市舉辦維吾爾語系科普知識競賽[N];大眾科技報;2003年

6 記者  李U,

本文編號:2057558


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2057558.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶03265***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com