維吾爾中介語(yǔ)語(yǔ)料庫(kù)管理系統(tǒng)建設(shè)及自動(dòng)標(biāo)注技術(shù)研究
本文關(guān)鍵詞:維吾爾中介語(yǔ)語(yǔ)料庫(kù)管理系統(tǒng)建設(shè)及自動(dòng)標(biāo)注技術(shù)研究
更多相關(guān)文章: 維吾爾語(yǔ) 中介語(yǔ) 語(yǔ)料庫(kù)建設(shè) 自動(dòng)標(biāo)注 語(yǔ)言模型
【摘要】:語(yǔ)料庫(kù)在建設(shè)的過(guò)程中是一個(gè)浩大的工程。在針對(duì)已經(jīng)建立好的一些語(yǔ)料庫(kù)和中介語(yǔ)語(yǔ)料庫(kù)中伴隨的大量研究成果充分證明了它的重要性。構(gòu)建過(guò)程中還需要不同層次專業(yè)人員的參與。因此維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)的實(shí)現(xiàn),對(duì)提高維吾爾語(yǔ)教學(xué)質(zhì)量及維吾爾語(yǔ)專業(yè)人才培養(yǎng)質(zhì)量有深遠(yuǎn)的影響。本系統(tǒng)主要從三個(gè)方面進(jìn)行了設(shè)計(jì)與研究:第一、針對(duì)維吾爾中介語(yǔ)語(yǔ)料庫(kù)的構(gòu)建提出了總體規(guī)劃,包括對(duì)標(biāo)注代碼設(shè)計(jì),數(shù)據(jù)采集的內(nèi)容與范圍進(jìn)行了分析和采集;第二、利用基于Java EE設(shè)計(jì)開(kāi)發(fā)了維吾爾中介語(yǔ)語(yǔ)料庫(kù)管理系統(tǒng),解決了維文、數(shù)字、英文字母與符號(hào)混排時(shí)格式錯(cuò)誤問(wèn)題,設(shè)計(jì)了維文JS輸入包,用戶無(wú)需安裝第三方維文輸入法,可以在本系統(tǒng)直接輸入維文,順利地完成對(duì)中介語(yǔ)語(yǔ)料的錄入、審核、標(biāo)注和檢索等工作;第三、由于采集回來(lái)的語(yǔ)料信息繁多,在標(biāo)注過(guò)程中需要人工進(jìn)行標(biāo)注,工作量巨大。為此,利用了兩種方法對(duì)自動(dòng)標(biāo)注技術(shù)進(jìn)行了研究,兩種方法分別為:偏誤詞典庫(kù)與字符串匹配的方法和語(yǔ)言模型訓(xùn)練的方法。目前,維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)經(jīng)測(cè)試后已經(jīng)開(kāi)始投入使用,對(duì)自動(dòng)標(biāo)注方法也已經(jīng)進(jìn)行了測(cè)試,達(dá)到預(yù)期的目標(biāo)。
【關(guān)鍵詞】:維吾爾語(yǔ) 中介語(yǔ) 語(yǔ)料庫(kù)建設(shè) 自動(dòng)標(biāo)注 語(yǔ)言模型
【學(xué)位授予單位】:新疆農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:H215
【目錄】:
- 摘要4-5
- Abstract5-8
- 第1章 緒論8-14
- 1.1 課題來(lái)源8
- 1.2 選題背景8
- 1.3 選題意義8-9
- 1.4 國(guó)內(nèi)外研究現(xiàn)狀9-11
- 1.5 維吾爾文知識(shí)11-12
- 1.6 本文研究?jī)?nèi)容12
- 1.7 論文的主要內(nèi)容和組織結(jié)構(gòu)12-14
- 第2章 維吾爾中介語(yǔ)語(yǔ)料庫(kù)構(gòu)建14-21
- 2.1 維吾爾中介語(yǔ)語(yǔ)料庫(kù)規(guī)劃15-16
- 2.2 維吾爾中介語(yǔ)語(yǔ)料庫(kù)標(biāo)注規(guī)范16-18
- 2.3 維吾爾中介語(yǔ)語(yǔ)料采集18-19
- 2.4 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)的實(shí)現(xiàn)19-20
- 2.5 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)的使用與維護(hù)20
- 2.6 本章小結(jié)20-21
- 第3章 維吾爾中介語(yǔ)語(yǔ)料庫(kù)管理系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)21-44
- 3.1 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)特點(diǎn)21-22
- 3.2 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)工作流程22-23
- 3.3 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)23-32
- 3.4 維吾爾中介語(yǔ)語(yǔ)料庫(kù)系統(tǒng)模塊結(jié)構(gòu)32-43
- 3.5 本章小結(jié)43-44
- 第4章 偏誤自動(dòng)標(biāo)注技術(shù)研究44-62
- 4.1 基本原理44-45
- 4.2 人工標(biāo)注的缺陷45
- 4.3 偏誤詞典庫(kù)與字符串匹配實(shí)現(xiàn)的自動(dòng)標(biāo)注45-51
- 4.4 語(yǔ)言模型訓(xùn)練實(shí)現(xiàn)的自動(dòng)標(biāo)注51-61
- 4.5 本章小結(jié)61-62
- 第5章 總結(jié)與展望62-64
- 5.1 總結(jié)62
- 5.2 展望62-64
- 參考文獻(xiàn)64-67
- 發(fā)表論文與參與科研情況67-68
- 個(gè)人簡(jiǎn)介68-70
- 致謝70
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 買吾浪江·艾依提;張?zhí)t;楊文革;;基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)[J];語(yǔ)言與翻譯;2015年04期
2 陳昊;吐?tīng)柛ひ啦祭?卡哈爾江·阿比的熱西提;艾山·吾買爾;;基于眾包的維吾爾語(yǔ)事件標(biāo)注研究[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年02期
3 張寶林;崔希亮;;談漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)的建設(shè)標(biāo)準(zhǔn)[J];語(yǔ)言文字應(yīng)用;2015年02期
4 買買提依明·哈斯木;吾守爾·斯拉木;維尼拉·木沙江;努爾麥麥提·尤魯瓦斯;;基于N元模型的維吾爾文文本分類技術(shù)研究[J];計(jì)算機(jī)應(yīng)用研究;2015年07期
5 肖奚強(qiáng);周文華;;漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)標(biāo)注的全面性及類別問(wèn)題[J];世界漢語(yǔ)教學(xué);2014年03期
6 阿力木江·艾沙;庫(kù)爾班·吾布力;吐?tīng)柛ひ啦祭?;維吾爾文Bigram文本特征提取[J];計(jì)算機(jī)工程與應(yīng)用;2015年03期
7 楊文革;;建立維吾爾語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)基本設(shè)想[J];新疆大學(xué)學(xué)報(bào)(哲學(xué)·人文社會(huì)科學(xué)版);2013年03期
8 汪茂林;;國(guó)內(nèi)語(yǔ)料庫(kù)中介語(yǔ)研究現(xiàn)狀分析[J];文教資料;2013年12期
9 阿力木江·艾沙;吐?tīng)柛ひ啦祭?庫(kù)爾班·吾布力;李哲;;基于短語(yǔ)的維吾爾文文本分類[J];計(jì)算機(jī)應(yīng)用;2012年10期
10 翁莉佳;;國(guó)內(nèi)外漢語(yǔ)語(yǔ)料庫(kù)建設(shè)發(fā)展概述[J];海外英語(yǔ);2012年03期
,本文編號(hào):739893
本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/739893.html