天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

蒙漢英多語種詞典資源管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2019-04-04 12:21
【摘要】:本文以傳統(tǒng)蒙古文、西里爾蒙古文、漢文和英文的多語種對照資源庫為對象,搭建了蒙漢英多語種詞典資源管理平臺(tái)。平臺(tái)的資源庫涵蓋了目前主流的傳統(tǒng)蒙古文-漢文、西里爾蒙古文-漢文、傳統(tǒng)蒙古文-英文和西里爾蒙古文-英文等30多個(gè)詞典,對照詞總條數(shù)達(dá)到近150多萬。該多語種資源庫的建立為蒙古文自然語言處理提供了基礎(chǔ)資源,并對蒙古語言文字的保護(hù)與傳承具有重大意義。本資源管理平臺(tái)主要有根據(jù)不同語種查詢詞條解釋、資源庫的綜合管理與維護(hù)功能,使得該資源庫的管理和使用更加方便、準(zhǔn)確。因?yàn)閷φ赵~庫的詞條數(shù)量較多,所以本文對資源庫建立了索引來提升檢索的效率。本資源管理平臺(tái)針對于查詢功能模塊,采用了一種B+樹的數(shù)據(jù)結(jié)構(gòu)來對傳統(tǒng)蒙古文-漢文、西里爾蒙古文-漢文、傳統(tǒng)蒙古文-英文和西里爾蒙古文-英文等詞典建立索引。B+樹索引是數(shù)據(jù)庫中常用的一種索引技術(shù),B+樹索引支持順序查找和隨機(jī)查找,因此通過B+樹的索引算法有效提高了詞典查詢效率。由于蒙古文屬于黏著語,所以本文根據(jù)蒙古文的構(gòu)詞特點(diǎn)對傳統(tǒng)蒙古文進(jìn)行了詞干后綴切分處理,使得傳統(tǒng)蒙古文的查詢更加準(zhǔn)確有效。系統(tǒng)中傳統(tǒng)蒙古文的默認(rèn)排序功能與平時(shí)的蒙古文字母排序順序有所區(qū)別,因此本文建立了基于規(guī)則的傳統(tǒng)蒙古文排序系統(tǒng),并應(yīng)用在傳統(tǒng)蒙古文的檢索結(jié)果和資源管理維護(hù)中。
[Abstract]:The resource management platform of Mongolian-English multilingual dictionary is set up in this paper, which is based on the multi-language control resource base of traditional Mongolian, Cyrmund, Chinese and English. The resource bank of the platform covers more than 30 dictionaries, such as traditional Mongolian-Chinese, Cyrillic Mongolian-Chinese, traditional Mongolian-English and Cyrillic Mongolian-English. The total number of control words is more than 1.5 million. The establishment of this multilingual resource database provides the basic resources for Mongolian natural language processing and has great significance for the protection and inheritance of Mongolian language and characters. This resource management platform mainly has the function of comprehensive management and maintenance according to different languages, which makes the management and use of the resource database more convenient and accurate. Because of the large number of entries in the reference database, the index of the database is established to improve the efficiency of retrieval. In view of the query function module, this resource management platform adopts a B-tree data structure to the traditional Mongolian-Chinese, Cyrillic-Chinese, Traditional Mongolian-English and Cyrillic-English dictionaries are indexed. B-tree index is a commonly used index technology in database. B-tree index supports sequential search and random search. Therefore, the efficiency of dictionary query is improved effectively by the index algorithm of B-tree. Because Mongolian belongs to adhesive language, this paper deals with the stem suffix segmentation of the traditional Mongolian according to the characteristics of Mongolian word formation, which makes the traditional Mongolian query more accurate and effective. The default sort function of traditional Mongolian in the system is different from the order of Mongolian alphabetical order, so the traditional Mongolian sorting system based on rules is established in this paper. And applied in the traditional Mongolian retrieval results and resource management and maintenance.
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP311.52

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 朝克;《蒙古文編碼》已由內(nèi)蒙古大學(xué)出版社出版[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版);2000年06期

2 紅梅,敖其爾,白云莉;托忒蒙古文讀音輸入法的設(shè)計(jì)與實(shí)現(xiàn)[J];內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版);2004年02期

3 烏日娜;;清代蒙古文歷史文獻(xiàn)及其整理研究概況[J];蘭臺(tái)世界;2011年19期

4 嘎日迪,趙小兵,馬紅旭,賽音,白小玲;蒙古文自動(dòng)處理系統(tǒng)研究[J];中文信息學(xué)報(bào);1999年04期

5 菊花;金良;;使用程序自動(dòng)分析蒙古文詞的研究[J];內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版);2014年02期

6 烏林西拉;內(nèi)蒙古自治區(qū)圖書館學(xué)(蒙古文)的研究與發(fā)展[J];國家圖書館學(xué)刊;2000年01期

7 S·蘇雅拉圖;蒙古文整詞計(jì)算機(jī)生成理論研究[J];中文信息學(xué)報(bào);2001年04期

8 朝克圖;關(guān)于蒙古文報(bào)刊史研究中的幾個(gè)問題[J];蒙古學(xué)信息;2001年04期

9 紅梅;基于Windows 2000/XP平臺(tái)蒙古文輸入法的設(shè)計(jì)技術(shù)[J];內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版);2005年01期

10 鞏政;郝莉;楊旭華;;非標(biāo)準(zhǔn)蒙古文字符編碼轉(zhuǎn)換為國際編碼的一種方法[J];內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期

相關(guān)會(huì)議論文 前10條

1 包艷花;圖格木勒;;多字體印刷蒙古文識(shí)別后處理研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

2 吉仁尼格;;蒙古文同形詞的統(tǒng)計(jì)法[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

3 呼斯勒;六月;斯日古楞;;淺談蒙古文通用編輯器幾點(diǎn)基本規(guī)范[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

4 道布;;回鶻式蒙古文[A];中國民族古文字[C];1982年

5 道布;;回鶻式蒙古文研究概況[A];中國民族古文字研究[C];1980年

6 白雙成;胡其圖;木仁;;蒙古文音節(jié)切分算法實(shí)現(xiàn)及其應(yīng)用[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

7 孟和吉雅;白音門德;敖其爾;田會(huì)利;;蒙古文語音合成技術(shù)研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

8 孟和吉雅;敖其爾;鞏政;;蒙古文網(wǎng)頁制作技術(shù)分析[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年

9 確精扎布;;蒙古文編碼國際標(biāo)準(zhǔn)通過以后研制的幾種蒙古文錄入系統(tǒng)比較[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年

10 寶金良;;蒙古文文本標(biāo)點(diǎn)符號(hào)及其屬性字段設(shè)置[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年

相關(guān)重要報(bào)紙文章 前10條

1 記者 吉儒木圖;手機(jī)可以使用蒙古文了[N];內(nèi)蒙古日報(bào)(漢);2007年

2 記者 解太榮;《蒙古秘史》回鶻體蒙古文復(fù)原項(xiàng)目完成[N];錫林郭勒日報(bào);2009年

3 孟克;如何打破蒙古文圖書產(chǎn)銷兩難的困境[N];中國民族報(bào);2010年

4 記者 阿斯鋼;蒙古國總統(tǒng)簽命令推廣回鶻式蒙古文[N];新華每日電訊;2010年

5 記者 蘇布達(dá);全盟首屆蒙古文圖書節(jié)落幕[N];錫林郭勒日報(bào)(漢);2012年

6 陳崗龍 (蒙古族);蒙古文文學(xué)翻譯的兩個(gè)問題[N];文藝報(bào);2013年

7 金壇;蒙古文:描繪大自然的千姿百態(tài)[N];中國民族報(bào);2014年

8 阿勒得爾圖;沙日布卻瑪:用回鶻體蒙古文還原《蒙古秘史》[N];中國民族報(bào);2006年

9 記者 張文強(qiáng);蒙古文圖書農(nóng)牧民閱讀大接力活動(dòng)啟動(dòng)[N];內(nèi)蒙古日報(bào)(漢);2008年

10 徐恒泰;要全力抓好蒙古文教學(xué)資源建設(shè)[N];鄂爾多斯日報(bào);2008年

相關(guān)博士學(xué)位論文 前9條

1 蘇向東;基于深度學(xué)習(xí)和知識(shí)策略的蒙古文古籍識(shí)別研究[D];內(nèi)蒙古大學(xué);2016年

2 巴圖額爾敦;文本資源檢索技術(shù)在西里爾蒙古文遠(yuǎn)程教育系統(tǒng)中的應(yīng)用研究[D];內(nèi)蒙古大學(xué);2017年

3 淑琴;蒙古文同形詞知識(shí)庫的構(gòu)建[D];內(nèi)蒙古大學(xué);2010年

4 達(dá)古拉;《清內(nèi)秘書院蒙古文檔案匯編》語言研究[D];內(nèi)蒙古大學(xué);2012年

5 魏宏喜;蒙古文古籍圖像檢索技術(shù)研究[D];內(nèi)蒙古大學(xué);2012年

6 通拉嘎;基于蒙古文語料庫的人名自動(dòng)識(shí)別[D];中央民族大學(xué);2013年

7 莎日娜;烏蘭巴托版蒙古文譯本《今古奇觀》研究[D];中國社會(huì)科學(xué)院研究生院;2010年

8 王桂榮;蒙古文字結(jié)構(gòu)研究[D];內(nèi)蒙古大學(xué);2011年

9 普日布蘇榮;蒙古語語料庫建設(shè)的有關(guān)問題[D];內(nèi)蒙古大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 關(guān)高娃;蒙古文停用詞和英文停用詞比較研究[D];內(nèi)蒙古大學(xué);2011年

2 常紅梅;袞布扎布語言論著中的蒙古文阿里嘎禮研究[D];內(nèi)蒙古大學(xué);2013年

3 劉璐;面向蒙古文增量g┱溝男畔⒓燜骷際躚芯縖D];內(nèi)蒙古大學(xué);2015年

4 李坤;蒙古文網(wǎng)絡(luò)熱點(diǎn)詞提取算法研究[D];內(nèi)蒙古大學(xué);2015年

5 王洪偉;基于規(guī)則和統(tǒng)計(jì)的西里爾與傳統(tǒng)蒙古文相互轉(zhuǎn)換方法研究[D];內(nèi)蒙古大學(xué);2015年

6 張畔;蒙古文搜索引擎基本方法的實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年

7 宋莉;蒙古文字造形元數(shù)據(jù)的分類編號(hào)探討[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2015年

8 青玉;指導(dǎo)小學(xué)生蒙古文正字法教學(xué)探析[D];內(nèi)蒙古師范大學(xué);2015年

9 達(dá)拉夫;文獻(xiàn)學(xué)視角下的蒙古文古籍研究[D];內(nèi)蒙古大學(xué);2015年

10 王亞君;基于Linux IBUS的傳統(tǒng)蒙古文輸入法的研究與實(shí)現(xiàn)[D];內(nèi)蒙古師范大學(xué);2015年

,

本文編號(hào):2453805

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2453805.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶df807***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com