自動識別木刻版蒙古文文獻(xiàn)研究
發(fā)布時間:2017-08-04 07:26
本文關(guān)鍵詞:自動識別木刻版蒙古文文獻(xiàn)研究
【摘要】:在這個全球化、科技信息蔓延的時代,把文字、語言跟計算機(jī)信息處理融為一體是保護(hù)、繼承和發(fā)揚(yáng)自己的語言文字,歷史文化、精神財富、民族特色的明確要求之一。把這些財富轉(zhuǎn)化為省體力省時間的電子文檔形式,使得方便用于科研,便于公用,換句話說,把圖文形式的蒙古語文獻(xiàn)或原文通過形式轉(zhuǎn)化的方式轉(zhuǎn)換成數(shù)字文檔是當(dāng)代需求之一。由于這個需求,把木刻版文獻(xiàn)轉(zhuǎn)換成電子版,建立蒙古甘珠爾的電子庫,創(chuàng)建使用軟件,作為本次研究的主要工作。為了把蒙古木版甘珠爾直接從圖文轉(zhuǎn)換成電子文檔,把首先需要處理的幾個步驟通過北京蒙古甘珠爾的第一卷轉(zhuǎn)換成科研拉丁文,同原文獻(xiàn)的掃描圖建立了語料庫。此文獻(xiàn)共有31排,396張,790篇文章。論文主要講述了把甘珠爾文獻(xiàn)依據(jù)OCR系統(tǒng),建立圖文轉(zhuǎn)換文檔形式軟件的步驟和試用此軟件的步驟與結(jié)果。論文的結(jié)構(gòu)和內(nèi)容如下:序言:主要介紹了選題依據(jù),目的,相關(guān)研究,創(chuàng)新特點(diǎn)及研究意義。第一部:介紹了文字處理軟件OCR的理論方法,創(chuàng)建步驟等。第二部:從信息的角度介紹了蒙古文OCR創(chuàng)建的基本要求,蒙古語文的基礎(chǔ)結(jié)構(gòu)原則及木刻版的概況。并提出了留存至今的版書的范圍,還介紹了把甘珠爾文獻(xiàn)的第一部分轉(zhuǎn)換成拉丁文的方法。第三部:主要介紹了創(chuàng)建識別甘珠爾文獻(xiàn)軟件的具體步驟及未來發(fā)展方向和潛力。
【關(guān)鍵詞】:蒙古文 OCR 木刻版
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:H212
【目錄】:
- 摘要5-7
- 中文摘要7-8
- ABSTRACT8-9
- 目錄9-12
- 正文12-102
- 參考文獻(xiàn)102-106
- 附件106
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 魏宏喜;高光來;;蒙文文檔圖像的傾斜檢測方法[J];內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版);2007年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 魏宏喜;蒙古文古籍圖像檢索技術(shù)研究[D];內(nèi)蒙古大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 吳偉;聯(lián)機(jī)手寫蒙古文字識別技術(shù)的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2005年
2 包艷花;蒙古文識別文本后處理相關(guān)技術(shù)研究[D];內(nèi)蒙古大學(xué);2007年
,本文編號:618318
本文鏈接:http://sikaile.net/shoufeilunwen/rwkxbs/618318.html
最近更新
教材專著