天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于層次化結(jié)構(gòu)的語言模型單元集優(yōu)化

發(fā)布時(shí)間:2018-04-19 06:35

  本文選題:語音識(shí)別 + 語言模型 ; 參考:《清華大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年03期


【摘要】:對(duì)于大詞匯量語音識(shí)別系統(tǒng),適當(dāng)選擇基本單元至關(guān)重要。雖然以詞為基本單元時(shí)避免了詞邊界的確定等復(fù)雜過程,但很多派生類結(jié)構(gòu)中(如黏性語言),詞比較長,而且很多文字(如中文、日文等)不需要詞邊界,因而在自然語言處理應(yīng)用中沒有選取基本單元集的固定模式。該文以維吾爾語大詞匯量語音識(shí)別系統(tǒng)為例,研究基于各個(gè)層次化粒度單元的語音識(shí)別系統(tǒng)。通過比較各種層次化單元集為基礎(chǔ)的語音識(shí)別結(jié)果,分析錯(cuò)誤識(shí)別模式,收集被誤判的單元序列作為在2層單元序列結(jié)構(gòu)中擇優(yōu)的訓(xùn)練樣本庫。比較各種單元集的優(yōu)缺點(diǎn),提出一種能平衡長單元集和短單元集優(yōu)點(diǎn)的方法。實(shí)驗(yàn)結(jié)果表明:該方法不僅可以有效提高語音識(shí)別準(zhǔn)確率,也大大縮減了詞典容量。
[Abstract]:For large vocabulary speech recognition system, it is very important to select appropriate basic units.Although the word is used as the basic unit to avoid complex processes such as word boundary determination, many derived structures (such as viscous language) have longer words, and many words (such as Chinese, Japanese, etc.) do not need word boundaries.Therefore, the fixed pattern of basic unit set is not selected in natural language processing applications.Taking Uygur large vocabulary speech recognition system as an example, this paper studies a speech recognition system based on hierarchical granularity units.By comparing the results of speech recognition based on various hierarchical unit sets, the error recognition patterns are analyzed, and the misjudged unit sequences are collected as a training sample base to select the best in the two-layer unit sequence structure.By comparing the advantages and disadvantages of various cell sets, a method is proposed to balance the advantages of long and short cell sets.The experimental results show that this method can not only improve the accuracy of speech recognition, but also greatly reduce the dictionary capacity.
【作者單位】: 新疆大學(xué)科學(xué)與技術(shù)學(xué)院;新疆大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61462085,61662078,61163032) 教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃資助項(xiàng)目(NCET-10-0969) 新疆維吾爾自治區(qū)高新技術(shù)發(fā)展研究計(jì)劃項(xiàng)目(201312103)
【分類號(hào)】:TN912.34

【相似文獻(xiàn)】

相關(guān)重要報(bào)紙文章 前3條

1 本報(bào)記者 王揚(yáng) 通訊員 曾慶剛 張文祥;高亞平細(xì)分單元要素 力促管理精益[N];中國煤炭報(bào);2010年

2 曹元文 徐忠波 婁純泗;單元集成訓(xùn)練探要[N];解放軍報(bào);2004年

3 ;六單元集成IGBT模塊[N];計(jì)算機(jī)世界;2001年

相關(guān)博士學(xué)位論文 前1條

1 李坦;Mindlin板高階雜交應(yīng)力單元及其增強(qiáng)型分片檢驗(yàn)[D];大連理工大學(xué);2015年

相關(guān)碩士學(xué)位論文 前4條

1 童迪;考慮新任務(wù)插入的虛擬單元?jiǎng)討B(tài)構(gòu)建與調(diào)度問題研究[D];江蘇科技大學(xué);2015年

2 陸周周;基于枚舉刪除的ESO算法研究[D];重慶大學(xué);2015年

3 朱涵;車聯(lián)網(wǎng)路側(cè)單元部署算法研究[D];大連理工大學(xué);2016年

4 楊瑞巖;包裝單元、搬運(yùn)單元和集裝單元匹配關(guān)系建模與優(yōu)化[D];吉林大學(xué);2013年



本文編號(hào):1771979

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1771979.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9eb6d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com