天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏文古籍識別系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2024-05-11 23:24
  藏文古籍是世界文化寶庫中的歷史瑰寶,內容涉及宗教、文化、政治、經濟等等,不僅是研究藏族歷史和文化變遷不可多得的珍貴史料,更是中華民族這個大家庭繁榮昌盛的歷史見證。歲月侵蝕加之保存不當使得藏文古籍遭受了不可逆轉的損壞、退化,因此基于藏文古籍圖像無法再次編輯、檢索效率低以及分析挖掘難度較大等現(xiàn)狀,亟需開發(fā)一款藏文古籍識別軟件系統(tǒng),利用文字識別技術將藏文古籍文檔圖像轉換為可編輯的文本文檔,不僅有助于加快藏文古籍文檔數(shù)字化保護進程、為相關藏學研究者提供便利,而且對加快文化的交流和融合有著一定的促進作用。本文以木刻板烏金體藏文古籍《甘珠爾》為研究對象,在藏文古籍文檔識別方面開展了一系列研究,并針對藏文古籍文檔圖像的特點提出了以下算法:(1)基于Lab顏色空間污漬去除的二值化算法,該算法能夠消除污漬等不利因素的影響,對低質圖像有較好的處理效果;(2)基于連通域形狀判斷的去邊框算法,克服了基于連通域面積容易誤判的缺點,能夠更加準確的判斷并去除圖像中的邊框區(qū)域;(3)基于基線分割的字切分算法,解決了上元音過長產生的粘連問題,進一步提高了字切分的準確性;(4)基于CNN的字丁識別算法,利用深度學習解決了...

【文章頁數(shù)】:65 頁

【學位級別】:碩士

【部分圖文】:

圖1.1藏文音節(jié)的構成

圖1.1藏文音節(jié)的構成

化是中華文化大熔爐中的重要部分,是國王松贊干布派出使者吞彌·桑布扎到印自己的文字。藏文是一種具有特殊構成4個元音字母以前后橫向拼寫、縱向疊音節(jié),并以音節(jié)點進行區(qū)分,音節(jié)具有圖1.1所示為藏文音節(jié)構成示意圖,音節(jié)4個字丁,現(xiàn)代藏文一個字丁由1至4節(jié)的基本單位,音....


圖1.2藏文古籍示例(002-384)

圖1.2藏文古籍示例(002-384)

藏文古籍大多以木刻雕版印刷而成,與一般書籍成冊裝訂的形式不同,藏文古籍是長條活頁的形式,且文字四周常常添加邊框線、書頁兩邊添加頁碼及書名簡稱以避免頁面混淆,如圖1.2所示為藏文古籍文檔圖像示例,002-384表示第二卷第384頁(以下表示意思相同不在贅述)。


圖2.1普通用戶用例圖

圖2.1普通用戶用例圖

第2章藏文古籍識別系統(tǒng)需求分析分析的任務是分析系統(tǒng)的數(shù)據要求、導出系統(tǒng)的邏輯模型、修、確定系統(tǒng)的綜合要求,是系統(tǒng)設計與實現(xiàn)的基礎。藏文古籍需要為用戶提供圖像二值化、去邊框、行切分、字切分、分類本標記等功能模塊及各模塊對應的校對功能,且針對不同的用擇的實現(xiàn)模式。本章節(jié)主要從圖....


圖2.2專業(yè)用戶用例圖

圖2.2專業(yè)用戶用例圖

8圖2.2專業(yè)用戶用例圖藏文古籍識別系統(tǒng)的功能需求有如下幾個方面。(1)識別系統(tǒng)與用戶的基本交互功能。該功能是識別系統(tǒng)最基本的功能是識別系統(tǒng)能否正常運行的關鍵。輸入系統(tǒng)與用戶的交互功能是指用戶點擊相功能模塊并發(fā)起啟動命令,系統(tǒng)能根據用戶發(fā)起的命令執(zhí)行相關的操作。(2)圖像獲取....



本文編號:3970519

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3970519.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶7587a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com