天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言學(xué)論文 >

基于Unicode編碼的現(xiàn)代藏文排序系統(tǒng)的設(shè)計(jì)

發(fā)布時(shí)間:2018-12-29 16:45
【摘要】:藏文排序問題是藏文邁向信息化的重要支撐之一。藏文的大量的編目、檢索工作,包括人名排序都要求藏文以有序的方式排列以提高工作效率。藏文排序又是各種辭書、工具書編寫中亟待解決的首要問題。解決了藏文排序,可以為后續(xù)的藏文信息處理奠定基礎(chǔ)。 由于藏文獨(dú)特的二維結(jié)構(gòu),藏文排序相比其他文字的排序要復(fù)雜。根據(jù)現(xiàn)代藏文的辭典序以及現(xiàn)代藏文的結(jié)構(gòu),提出了將二維的藏文音節(jié)展開成形如“基本輔音+前加輔音+上加輔音+下加輔音+元音+后加輔音+又后加輔音”的線性字符串,其中空缺的部分用Unicode碼值較小的空格來代替的方法,最后通過比較排序碼得到與辭典序相同的結(jié)果。 整個現(xiàn)代藏文排序系統(tǒng)由輸入模塊、音節(jié)切分模塊、音節(jié)判定模塊、排序碼的提取與壓縮模塊、排序碼的比較模塊、結(jié)果顯示模塊組成。其中在音節(jié)判定模塊中,根據(jù)現(xiàn)代藏文的特點(diǎn)和Unicode藏文編碼的特點(diǎn),設(shè)計(jì)了獨(dú)特的音節(jié)判定算法。經(jīng)過音節(jié)判定之后,從DUCET中提取相應(yīng)的排序碼。由于提取的排序碼有很多重復(fù)和為零的部分,因此,還要對排序碼進(jìn)行壓縮。經(jīng)過壓縮的排序碼就可以通過排序算法進(jìn)行排序了。 根據(jù)以上各模塊設(shè)計(jì)的排序系統(tǒng)能夠?qū)ΜF(xiàn)代藏文進(jìn)行正確的排序。
[Abstract]:The ranking problem of Tibetan language is one of the important support for Tibetan language towards information. A great deal of cataloguing and searching, including the sorting of people's names, require the Tibetan language to be arranged in an orderly manner to improve its efficiency. Tibetan sorting is also a variety of dictionaries, reference books in the preparation of the first issue to be solved. The arrangement of Tibetan language is solved, which can lay the foundation for the subsequent processing of Tibetan language information. Due to the unique two-dimensional structure of Tibetan language, the sorting of Tibetan characters is more complicated than that of other characters. According to the dictionaries of modern Tibetan and the structure of modern Tibetan, In this paper, a linear string is put forward for example, "add consonant vowel before basic consonant, add consonant vowel before consonant and add consonant after consonant". The vacant part is replaced by spaces with small Unicode code value. Finally, the same result is obtained by comparing the sorting codes with the dictionary order. The whole modern Tibetan sorting system consists of input module, syllable segmentation module, syllable decision module, sorting code extraction and compression module, sort code comparison module, and result display module. In the syllable determination module, according to the characteristics of modern Tibetan and Unicode Tibetan coding, a unique syllable decision algorithm is designed. After the syllable is determined, the corresponding sorting codes are extracted from the DUCET. Since the extracted sorting code has a lot of duplicates and zero parts, the sorting code must be compressed. Compressed sorting codes can be sorted by sorting algorithms. The sorting system designed according to the above modules can sort the modern Tibetan language correctly.
【學(xué)位授予單位】:青海師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1;H087

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳兵;江荻;;藏文國際編碼的發(fā)展與技術(shù)應(yīng)用[J];西南民族大學(xué)學(xué)報(bào)(人文社會科學(xué)版);2011年08期

2 張建木;讀《唐蕃會盟碑》札記二則[J];中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版);1981年01期

3 張濟(jì)川;;藏文元音a的表示法[J];民族語文;1982年01期

4 張連生;;藏文號碼代字及其計(jì)算機(jī)排索[J];語言研究;1983年02期

5 才旦夏茸 ,張鳳翮;關(guān)于藏族歷代翻譯家梵譯藏若干問題之研究[J];西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版);1985年03期

6 毛繼祖;解放前青海省藏文木刻本科技圖書印行概況[J];青海民族學(xué)院學(xué)報(bào);1989年03期

7 郭登元;漢詩(詞)藏譯淺談之一[J];青海民族學(xué)院學(xué)報(bào);1990年02期

8 鄭張;尚芳;;上古漢語的S-頭[J];溫州師范學(xué)院學(xué)報(bào);1990年04期

9 強(qiáng)俄巴·次央;;試析敦煌藏文P.T.999號寫卷[J];西藏研究;1990年01期

10 于洪志;藏文信息處理有重大突破——制定點(diǎn)陣字型盡快實(shí)現(xiàn)網(wǎng)上通訊[J];中文信息;1997年06期

相關(guān)會議論文 前10條

1 康才uo;江荻;;基于Unicode編碼的藏文轉(zhuǎn)寫拉丁文本的算法[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

2 張軸材;;ISO/IEC 10646/Unicode的新進(jìn)展及其實(shí)現(xiàn)[A];中文信息處理技術(shù)研討會論文集[C];2004年

3 劉匯丹;諾明花;趙維納;吳健;賀也平;;藏文編碼轉(zhuǎn)換軟件“藏碼通”的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年

4 金志海;;Java編程技術(shù)中漢字問題的分析及解決[A];海南省通信學(xué)會論文集(二○○一年)[C];2001年

5 阿布力米提·阿不都熱依木;吐爾根·依布拉音;;基于Unicode的維吾爾文信息處理平臺的研究[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會論文集[C];2004年

6 岳耀明;;Windows平臺下朝鮮文輸入法實(shí)現(xiàn)詳析[A];第十屆全國少數(shù)民族語言文字信息處理學(xué)術(shù)研討會論文集[C];2005年

7 地力木拉提.吐爾遜;瓦依提.阿不力孜;吐爾根.伊布拉音;;古維吾爾文(察合臺文)文獻(xiàn)數(shù)字化整理系統(tǒng)中多文種混合處理的實(shí)現(xiàn)[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

8 周永;陳寧;;幾種典型漢字編碼之間轉(zhuǎn)換的原理與實(shí)現(xiàn)[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

9 馬良成;運(yùn)中旺蘇;張步明;;北宋“崇寧重寶背藏文錢”初探[A];甘肅省錢幣學(xué)會第四次會員代表大會專輯[C];2001年

10 運(yùn)中旺蘇;張步明;;北宋“崇寧重寶背藏文錢”再探[A];第二屆西北五省區(qū)錢幣學(xué)會協(xié)作會議專輯[C];2002年

相關(guān)重要報(bào)紙文章 前10條

1 李漢強(qiáng);不要小看IIS的惡性殺手Unicode[N];中國電腦教育報(bào);2004年

2 飄零雪;當(dāng)心Unicode漏洞造成IIS“變節(jié)”[N];電腦報(bào);2002年

3 本報(bào)記者 王向華;藏文圖書“走進(jìn)”藏區(qū)農(nóng)家書屋[N];四川日報(bào);2009年

4 本報(bào)記者 康 麗 茅衛(wèi)東;阿牛和他的普利藏文學(xué)校[N];中國教師報(bào);2005年

5 記者 王杰;藏文軟件推廣應(yīng)用項(xiàng)目啟動儀式在拉薩舉行[N];西藏日報(bào);2009年

6 記者 涂洪長;手機(jī)藏文資訊研發(fā)啟動[N];人民日報(bào)海外版;2009年

7 德吉 邊巴次仁;藏文走在我國少數(shù)民族文字信息化前列[N];中國民族報(bào);2008年

8 涂洪長;手機(jī)藏文資訊研發(fā)啟動 藏文將暢游無線通信網(wǎng)絡(luò)[N];中國民族報(bào);2009年

9 記者 張黎黎 曉勇;讓藏文馳騁在信息高速路上[N];西藏日報(bào);2010年

10 記者 朗杰 裘立華;藏文詞典越來越厚[N];新華每日電訊;2002年

相關(guān)博士學(xué)位論文 前10條

1 芮建武;操作系統(tǒng)國際化基礎(chǔ)的研究與實(shí)踐[D];中國科學(xué)院研究生院(軟件研究所);2005年

2 王邁;語言形式化原理[D];上海外國語大學(xué);2011年

3 那加才旦;古代藏語文研究(7-11 A.D.)[D];中央民族大學(xué);2012年

4 段玉泉;語言背后的文化流傳:一組西夏藏傳佛教文獻(xiàn)解讀[D];蘭州大學(xué);2009年

5 斯塔;本體、方法、境界[D];中央民族大學(xué);2007年

6 東主才讓;藏族宗教與文字的產(chǎn)生和發(fā)展研究[D];中央民族大學(xué);2013年

7 張?jiān)?元代吐蕃地方行政體制研究[D];南京大學(xué);1993年

8 烏云畢力格;論《蘇布喜地》及其對蒙古箴言詩的影響[D];內(nèi)蒙古大學(xué);2009年

9 王獻(xiàn)軍;西藏政教合一制研究[D];南京大學(xué);1997年

10 王璞;藏族史學(xué)思想論綱[D];云南大學(xué);2002年

相關(guān)碩士學(xué)位論文 前10條

1 李繼文;基于Unicode編碼的現(xiàn)代藏文排序系統(tǒng)的設(shè)計(jì)[D];青海師范大學(xué);2013年

2 苗軍;Unicode/XML在電子出版物中的實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2002年

3 朱峰;軟件國際化與本地化自動化轉(zhuǎn)換模型和方法[D];浙江大學(xué);2012年

4 陳羽m,

本文編號:2395084


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2395084.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a64d0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com