天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言藝術(shù)論文 >

維吾爾中介語語料庫管理系統(tǒng)建設(shè)及自動標(biāo)注技術(shù)研究

發(fā)布時間:2017-08-26 05:19

  本文關(guān)鍵詞:維吾爾中介語語料庫管理系統(tǒng)建設(shè)及自動標(biāo)注技術(shù)研究


  更多相關(guān)文章: 維吾爾語 中介語 語料庫建設(shè) 自動標(biāo)注 語言模型


【摘要】:語料庫在建設(shè)的過程中是一個浩大的工程。在針對已經(jīng)建立好的一些語料庫和中介語語料庫中伴隨的大量研究成果充分證明了它的重要性。構(gòu)建過程中還需要不同層次專業(yè)人員的參與。因此維吾爾中介語語料庫系統(tǒng)的實現(xiàn),對提高維吾爾語教學(xué)質(zhì)量及維吾爾語專業(yè)人才培養(yǎng)質(zhì)量有深遠(yuǎn)的影響。本系統(tǒng)主要從三個方面進行了設(shè)計與研究:第一、針對維吾爾中介語語料庫的構(gòu)建提出了總體規(guī)劃,包括對標(biāo)注代碼設(shè)計,數(shù)據(jù)采集的內(nèi)容與范圍進行了分析和采集;第二、利用基于Java EE設(shè)計開發(fā)了維吾爾中介語語料庫管理系統(tǒng),解決了維文、數(shù)字、英文字母與符號混排時格式錯誤問題,設(shè)計了維文JS輸入包,用戶無需安裝第三方維文輸入法,可以在本系統(tǒng)直接輸入維文,順利地完成對中介語語料的錄入、審核、標(biāo)注和檢索等工作;第三、由于采集回來的語料信息繁多,在標(biāo)注過程中需要人工進行標(biāo)注,工作量巨大。為此,利用了兩種方法對自動標(biāo)注技術(shù)進行了研究,兩種方法分別為:偏誤詞典庫與字符串匹配的方法和語言模型訓(xùn)練的方法。目前,維吾爾中介語語料庫系統(tǒng)經(jīng)測試后已經(jīng)開始投入使用,對自動標(biāo)注方法也已經(jīng)進行了測試,達到預(yù)期的目標(biāo)。
【關(guān)鍵詞】:維吾爾語 中介語 語料庫建設(shè) 自動標(biāo)注 語言模型
【學(xué)位授予單位】:新疆農(nóng)業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:H215
【目錄】:
  • 摘要4-5
  • Abstract5-8
  • 第1章 緒論8-14
  • 1.1 課題來源8
  • 1.2 選題背景8
  • 1.3 選題意義8-9
  • 1.4 國內(nèi)外研究現(xiàn)狀9-11
  • 1.5 維吾爾文知識11-12
  • 1.6 本文研究內(nèi)容12
  • 1.7 論文的主要內(nèi)容和組織結(jié)構(gòu)12-14
  • 第2章 維吾爾中介語語料庫構(gòu)建14-21
  • 2.1 維吾爾中介語語料庫規(guī)劃15-16
  • 2.2 維吾爾中介語語料庫標(biāo)注規(guī)范16-18
  • 2.3 維吾爾中介語語料采集18-19
  • 2.4 維吾爾中介語語料庫系統(tǒng)的實現(xiàn)19-20
  • 2.5 維吾爾中介語語料庫系統(tǒng)的使用與維護20
  • 2.6 本章小結(jié)20-21
  • 第3章 維吾爾中介語語料庫管理系統(tǒng)設(shè)計和實現(xiàn)21-44
  • 3.1 維吾爾中介語語料庫系統(tǒng)特點21-22
  • 3.2 維吾爾中介語語料庫系統(tǒng)工作流程22-23
  • 3.3 維吾爾中介語語料庫系統(tǒng)數(shù)據(jù)庫設(shè)計23-32
  • 3.4 維吾爾中介語語料庫系統(tǒng)模塊結(jié)構(gòu)32-43
  • 3.5 本章小結(jié)43-44
  • 第4章 偏誤自動標(biāo)注技術(shù)研究44-62
  • 4.1 基本原理44-45
  • 4.2 人工標(biāo)注的缺陷45
  • 4.3 偏誤詞典庫與字符串匹配實現(xiàn)的自動標(biāo)注45-51
  • 4.4 語言模型訓(xùn)練實現(xiàn)的自動標(biāo)注51-61
  • 4.5 本章小結(jié)61-62
  • 第5章 總結(jié)與展望62-64
  • 5.1 總結(jié)62
  • 5.2 展望62-64
  • 參考文獻64-67
  • 發(fā)表論文與參與科研情況67-68
  • 個人簡介68-70
  • 致謝70

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 買吾浪江·艾依提;張?zhí)t;楊文革;;基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)[J];語言與翻譯;2015年04期

2 陳昊;吐爾根·依布拉音;卡哈爾江·阿比的熱西提;艾山·吾買爾;;基于眾包的維吾爾語事件標(biāo)注研究[J];新疆大學(xué)學(xué)報(自然科學(xué)版);2015年02期

3 張寶林;崔希亮;;談漢語中介語語料庫的建設(shè)標(biāo)準(zhǔn)[J];語言文字應(yīng)用;2015年02期

4 買買提依明·哈斯木;吾守爾·斯拉木;維尼拉·木沙江;努爾麥麥提·尤魯瓦斯;;基于N元模型的維吾爾文文本分類技術(shù)研究[J];計算機應(yīng)用研究;2015年07期

5 肖奚強;周文華;;漢語中介語語料庫標(biāo)注的全面性及類別問題[J];世界漢語教學(xué);2014年03期

6 阿力木江·艾沙;庫爾班·吾布力;吐爾根·依布拉音;;維吾爾文Bigram文本特征提取[J];計算機工程與應(yīng)用;2015年03期

7 楊文革;;建立維吾爾語中介語語料庫基本設(shè)想[J];新疆大學(xué)學(xué)報(哲學(xué)·人文社會科學(xué)版);2013年03期

8 汪茂林;;國內(nèi)語料庫中介語研究現(xiàn)狀分析[J];文教資料;2013年12期

9 阿力木江·艾沙;吐爾根·依布拉音;庫爾班·吾布力;李哲;;基于短語的維吾爾文文本分類[J];計算機應(yīng)用;2012年10期

10 翁莉佳;;國內(nèi)外漢語語料庫建設(shè)發(fā)展概述[J];海外英語;2012年03期

,

本文編號:739893

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/739893.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶67f68***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com