天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言學(xué)論文 >

蒙古文語料編碼轉(zhuǎn)換與校對方法研究

發(fā)布時間:2021-01-05 23:37
  如今信息現(xiàn)代化的時代,信息的傳播、資源的共享也都被電子化、網(wǎng)絡(luò)化。大部分信息都是以文字形式傳播和共享。對蒙古文信息而言適應(yīng)信息時代發(fā)展要求是必然的。隨著蒙古文信息處理的發(fā)展出現(xiàn)了多種蒙古文編碼,例如賽音、蒙科立、明安圖、智能編碼等。各種編碼字庫中,蒙古文字形的對應(yīng)的編碼都不一樣,互不兼容,如果沒有安裝對應(yīng)的蒙古文字庫,計算機(jī)里的蒙古文資料將顯示為亂碼,不能使用。這樣會導(dǎo)致蒙古文信息資源無法傳播、共享和研究。解決這些問題的最有效方法就是編碼轉(zhuǎn)換,轉(zhuǎn)換成統(tǒng)一的編碼。本文由蒙古文編碼轉(zhuǎn)換和編碼校對兩大部分構(gòu)成。編碼轉(zhuǎn)換部分中,首先對目前應(yīng)用較廣泛的兩種編碼-蒙科立編碼、智能編碼以及蒙古文國際標(biāo)準(zhǔn)編碼進(jìn)行了詳細(xì)的分析和對比。其次將蒙科立編碼、智能編碼兩種編碼轉(zhuǎn)換為蒙古文國際標(biāo)準(zhǔn)編碼。編碼轉(zhuǎn)換為基于蒙古文變形顯現(xiàn)字符集和控制字符使用規(guī)則的一種轉(zhuǎn)換方法。編碼轉(zhuǎn)換過程中,先通過編碼范圍判斷和編碼在詞中不同位置的詞形判斷編碼類型。編碼類型確定之后,如果是蒙科立編碼則用蒙科立編碼轉(zhuǎn)換為標(biāo)準(zhǔn)碼的算法將其轉(zhuǎn)換為標(biāo)準(zhǔn)編碼。如果是智能編碼,則用智能編碼轉(zhuǎn)換為標(biāo)準(zhǔn)編碼的算法將其轉(zhuǎn)換為標(biāo)準(zhǔn)編碼。非標(biāo)準(zhǔn)蒙古文編碼,例... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:63 頁

【學(xué)位級別】:碩士

【部分圖文】:

蒙古文語料編碼轉(zhuǎn)換與校對方法研究


蒙古文國際標(biāo)準(zhǔn)碼名義字符表

數(shù)據(jù)庫,判斷詞,范圍,詞首


圖 3. 2 蒙科立編碼的 ACCESS 部分?jǐn)?shù)據(jù)庫Fig 3.2 Access database of Menk coding好編碼范圍后,需要應(yīng)用規(guī)則去判斷編碼和其詞中的位置是否正確。即從格中判斷詞首、詞中、詞末、獨立形式的哪個。其關(guān)鍵實現(xiàn)算法如下:變量c在詞中的哪個位置值:‘W’為獨立形、‘T’為詞首形、‘D’為詞中形、‘R’為詞末形 char GetMenkPos(char c)/鏈接Access數(shù)據(jù)庫leDbConnection oleDbConnection = newleDbConnection("Provider=Microsoft.Jet.OLEDB.4.0;Data Source=E:\\menk.mleDbConnection conn = oleDbConnection;

編碼轉(zhuǎn)換,智能編碼,存儲字符


圖 3. 3 蒙科立編碼轉(zhuǎn)換結(jié)果圖Fig 3.3 Results for converting menk codesto the ISO/IEC10646 Mongolian codes智能編碼轉(zhuǎn)換到標(biāo)準(zhǔn)編碼.1 智能編碼的詞中位置判斷判斷智能編碼算法第一步是設(shè)計存儲智能編碼的 ACCESS 數(shù)據(jù)庫。表里存儲當(dāng)前形式、詞中形式、詞末形式或獨立形式的判斷結(jié)果,yuanfu 列存儲字符是元音還是a 列里存儲字符的智能編碼。表格中的 weizhi 列里的 W 為獨立形式,T 為詞首形中形式,R 為詞末形式。部分?jǐn)?shù)據(jù)表如下圖 3.4。


本文編號:2959502

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2959502.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶aded6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com