蒙古文語料編碼轉(zhuǎn)換與校對方法研究
發(fā)布時間:2021-01-05 23:37
如今信息現(xiàn)代化的時代,信息的傳播、資源的共享也都被電子化、網(wǎng)絡(luò)化。大部分信息都是以文字形式傳播和共享。對蒙古文信息而言適應(yīng)信息時代發(fā)展要求是必然的。隨著蒙古文信息處理的發(fā)展出現(xiàn)了多種蒙古文編碼,例如賽音、蒙科立、明安圖、智能編碼等。各種編碼字庫中,蒙古文字形的對應(yīng)的編碼都不一樣,互不兼容,如果沒有安裝對應(yīng)的蒙古文字庫,計算機(jī)里的蒙古文資料將顯示為亂碼,不能使用。這樣會導(dǎo)致蒙古文信息資源無法傳播、共享和研究。解決這些問題的最有效方法就是編碼轉(zhuǎn)換,轉(zhuǎn)換成統(tǒng)一的編碼。本文由蒙古文編碼轉(zhuǎn)換和編碼校對兩大部分構(gòu)成。編碼轉(zhuǎn)換部分中,首先對目前應(yīng)用較廣泛的兩種編碼-蒙科立編碼、智能編碼以及蒙古文國際標(biāo)準(zhǔn)編碼進(jìn)行了詳細(xì)的分析和對比。其次將蒙科立編碼、智能編碼兩種編碼轉(zhuǎn)換為蒙古文國際標(biāo)準(zhǔn)編碼。編碼轉(zhuǎn)換為基于蒙古文變形顯現(xiàn)字符集和控制字符使用規(guī)則的一種轉(zhuǎn)換方法。編碼轉(zhuǎn)換過程中,先通過編碼范圍判斷和編碼在詞中不同位置的詞形判斷編碼類型。編碼類型確定之后,如果是蒙科立編碼則用蒙科立編碼轉(zhuǎn)換為標(biāo)準(zhǔn)碼的算法將其轉(zhuǎn)換為標(biāo)準(zhǔn)編碼。如果是智能編碼,則用智能編碼轉(zhuǎn)換為標(biāo)準(zhǔn)編碼的算法將其轉(zhuǎn)換為標(biāo)準(zhǔn)編碼。非標(biāo)準(zhǔn)蒙古文編碼,例...
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
蒙古文國際標(biāo)準(zhǔn)碼名義字符表
圖 3. 2 蒙科立編碼的 ACCESS 部分?jǐn)?shù)據(jù)庫Fig 3.2 Access database of Menk coding好編碼范圍后,需要應(yīng)用規(guī)則去判斷編碼和其詞中的位置是否正確。即從格中判斷詞首、詞中、詞末、獨立形式的哪個。其關(guān)鍵實現(xiàn)算法如下:變量c在詞中的哪個位置值:‘W’為獨立形、‘T’為詞首形、‘D’為詞中形、‘R’為詞末形 char GetMenkPos(char c)/鏈接Access數(shù)據(jù)庫leDbConnection oleDbConnection = newleDbConnection("Provider=Microsoft.Jet.OLEDB.4.0;Data Source=E:\\menk.mleDbConnection conn = oleDbConnection;
圖 3. 3 蒙科立編碼轉(zhuǎn)換結(jié)果圖Fig 3.3 Results for converting menk codesto the ISO/IEC10646 Mongolian codes智能編碼轉(zhuǎn)換到標(biāo)準(zhǔn)編碼.1 智能編碼的詞中位置判斷判斷智能編碼算法第一步是設(shè)計存儲智能編碼的 ACCESS 數(shù)據(jù)庫。表里存儲當(dāng)前形式、詞中形式、詞末形式或獨立形式的判斷結(jié)果,yuanfu 列存儲字符是元音還是a 列里存儲字符的智能編碼。表格中的 weizhi 列里的 W 為獨立形式,T 為詞首形中形式,R 為詞末形式。部分?jǐn)?shù)據(jù)表如下圖 3.4。
本文編號:2959502
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
蒙古文國際標(biāo)準(zhǔn)碼名義字符表
圖 3. 2 蒙科立編碼的 ACCESS 部分?jǐn)?shù)據(jù)庫Fig 3.2 Access database of Menk coding好編碼范圍后,需要應(yīng)用規(guī)則去判斷編碼和其詞中的位置是否正確。即從格中判斷詞首、詞中、詞末、獨立形式的哪個。其關(guān)鍵實現(xiàn)算法如下:變量c在詞中的哪個位置值:‘W’為獨立形、‘T’為詞首形、‘D’為詞中形、‘R’為詞末形 char GetMenkPos(char c)/鏈接Access數(shù)據(jù)庫leDbConnection oleDbConnection = newleDbConnection("Provider=Microsoft.Jet.OLEDB.4.0;Data Source=E:\\menk.mleDbConnection conn = oleDbConnection;
圖 3. 3 蒙科立編碼轉(zhuǎn)換結(jié)果圖Fig 3.3 Results for converting menk codesto the ISO/IEC10646 Mongolian codes智能編碼轉(zhuǎn)換到標(biāo)準(zhǔn)編碼.1 智能編碼的詞中位置判斷判斷智能編碼算法第一步是設(shè)計存儲智能編碼的 ACCESS 數(shù)據(jù)庫。表里存儲當(dāng)前形式、詞中形式、詞末形式或獨立形式的判斷結(jié)果,yuanfu 列存儲字符是元音還是a 列里存儲字符的智能編碼。表格中的 weizhi 列里的 W 為獨立形式,T 為詞首形中形式,R 為詞末形式。部分?jǐn)?shù)據(jù)表如下圖 3.4。
本文編號:2959502
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2959502.html
最近更新
教材專著