天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏文古籍識別系統(tǒng)的設(shè)計與實(shí)現(xiàn)

發(fā)布時間:2024-05-11 23:24
  藏文古籍是世界文化寶庫中的歷史瑰寶,內(nèi)容涉及宗教、文化、政治、經(jīng)濟(jì)等等,不僅是研究藏族歷史和文化變遷不可多得的珍貴史料,更是中華民族這個大家庭繁榮昌盛的歷史見證。歲月侵蝕加之保存不當(dāng)使得藏文古籍遭受了不可逆轉(zhuǎn)的損壞、退化,因此基于藏文古籍圖像無法再次編輯、檢索效率低以及分析挖掘難度較大等現(xiàn)狀,亟需開發(fā)一款藏文古籍識別軟件系統(tǒng),利用文字識別技術(shù)將藏文古籍文檔圖像轉(zhuǎn)換為可編輯的文本文檔,不僅有助于加快藏文古籍文檔數(shù)字化保護(hù)進(jìn)程、為相關(guān)藏學(xué)研究者提供便利,而且對加快文化的交流和融合有著一定的促進(jìn)作用。本文以木刻板烏金體藏文古籍《甘珠爾》為研究對象,在藏文古籍文檔識別方面開展了一系列研究,并針對藏文古籍文檔圖像的特點(diǎn)提出了以下算法:(1)基于Lab顏色空間污漬去除的二值化算法,該算法能夠消除污漬等不利因素的影響,對低質(zhì)圖像有較好的處理效果;(2)基于連通域形狀判斷的去邊框算法,克服了基于連通域面積容易誤判的缺點(diǎn),能夠更加準(zhǔn)確的判斷并去除圖像中的邊框區(qū)域;(3)基于基線分割的字切分算法,解決了上元音過長產(chǎn)生的粘連問題,進(jìn)一步提高了字切分的準(zhǔn)確性;(4)基于CNN的字丁識別算法,利用深度學(xué)習(xí)解決了...

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1.1藏文音節(jié)的構(gòu)成

圖1.1藏文音節(jié)的構(gòu)成

化是中華文化大熔爐中的重要部分,是國王松贊干布派出使者吞彌·桑布扎到印自己的文字。藏文是一種具有特殊構(gòu)成4個元音字母以前后橫向拼寫、縱向疊音節(jié),并以音節(jié)點(diǎn)進(jìn)行區(qū)分,音節(jié)具有圖1.1所示為藏文音節(jié)構(gòu)成示意圖,音節(jié)4個字丁,現(xiàn)代藏文一個字丁由1至4節(jié)的基本單位,音....


圖1.2藏文古籍示例(002-384)

圖1.2藏文古籍示例(002-384)

藏文古籍大多以木刻雕版印刷而成,與一般書籍成冊裝訂的形式不同,藏文古籍是長條活頁的形式,且文字四周常常添加邊框線、書頁兩邊添加頁碼及書名簡稱以避免頁面混淆,如圖1.2所示為藏文古籍文檔圖像示例,002-384表示第二卷第384頁(以下表示意思相同不在贅述)。


圖2.1普通用戶用例圖

圖2.1普通用戶用例圖

第2章藏文古籍識別系統(tǒng)需求分析分析的任務(wù)是分析系統(tǒng)的數(shù)據(jù)要求、導(dǎo)出系統(tǒng)的邏輯模型、修、確定系統(tǒng)的綜合要求,是系統(tǒng)設(shè)計與實(shí)現(xiàn)的基礎(chǔ)。藏文古籍需要為用戶提供圖像二值化、去邊框、行切分、字切分、分類本標(biāo)記等功能模塊及各模塊對應(yīng)的校對功能,且針對不同的用擇的實(shí)現(xiàn)模式。本章節(jié)主要從圖....


圖2.2專業(yè)用戶用例圖

圖2.2專業(yè)用戶用例圖

8圖2.2專業(yè)用戶用例圖藏文古籍識別系統(tǒng)的功能需求有如下幾個方面。(1)識別系統(tǒng)與用戶的基本交互功能。該功能是識別系統(tǒng)最基本的功能是識別系統(tǒng)能否正常運(yùn)行的關(guān)鍵。輸入系統(tǒng)與用戶的交互功能是指用戶點(diǎn)擊相功能模塊并發(fā)起啟動命令,系統(tǒng)能根據(jù)用戶發(fā)起的命令執(zhí)行相關(guān)的操作。(2)圖像獲取....



本文編號:3970519

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3970519.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7587a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com