天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 語言藝術(shù)論文 >

藏文歷史文獻(xiàn)中粘連字丁串的切分與識別

發(fā)布時間:2020-03-25 20:51
【摘要】:在人類發(fā)展的歲月長河里,各族人民留下了彌足珍貴的歷史足跡。歷史文獻(xiàn)作為重要的信息載體,對研究人們早期的生產(chǎn)、生活方式具有極其重要的價值和深遠(yuǎn)意義。藏族是我國擁有悠久歷史文化,并且擁有本民族語言和文字的少數(shù)民族之一。藏族人民創(chuàng)造了極具特色的高原文化,在多個領(lǐng)域留下了豐富的文化遺產(chǎn)。藏文歷史文獻(xiàn)是研究藏族歷史文化和藏傳佛教的重要途徑,近年來受到了眾多學(xué)者的廣泛關(guān)注。但由于藏文歷史文獻(xiàn)歷史悠久,每一次的查閱都可能會對文獻(xiàn)造成毀滅性的破壞。對藏文歷史文獻(xiàn)進(jìn)行數(shù)字化保護(hù),不僅能夠保護(hù)紙質(zhì)脆弱的歷史文獻(xiàn),也能夠提高文獻(xiàn)的利用率。早期的藏文歷史文獻(xiàn)多采用木刻板印刷,隨著墨跡擴(kuò)散、潮濕等因素的影響,文獻(xiàn)中產(chǎn)生了大量的粘連字丁串。針對英語、漢語、日語和阿拉伯?dāng)?shù)字等粘連字丁串的研究已經(jīng)卓有成效,但尚未有針對藏文歷史文獻(xiàn)粘連字丁串的相關(guān)研究。為了探索藏文歷史文獻(xiàn)中粘連字丁串的切分和識別任務(wù),本文作了如下研究工作:首先,本文介紹了國內(nèi)外對于其他語言的粘連字丁串切分與識別以及藏文歷史文獻(xiàn)的研究現(xiàn)狀和前沿動態(tài),分析了學(xué)者對該課題的研究工作,總結(jié)了在處理該問題時常用方法和技巧,對本文關(guān)于藏文歷史文獻(xiàn)中粘連字丁串的切分與識別研究工作提供了很好的借鑒和幫助。其次,由于對藏文歷史文獻(xiàn)粘連字丁串的研究非常匱乏,該領(lǐng)域并沒有任何公開發(fā)表的數(shù)據(jù)庫。本文在藏文歷史文獻(xiàn)圖像中利用連通區(qū)域分析的方式篩選了7,500張粘連字丁串,并使用XML文件對粘連字丁串的粘連點(diǎn)坐標(biāo)、粘連字丁類別等進(jìn)行了標(biāo)注,構(gòu)建了第一個藏文歷史文獻(xiàn)粘連字丁串?dāng)?shù)據(jù)庫。本文通過對經(jīng)典的滴水算法利用最短路徑進(jìn)行了改進(jìn),使算法對藏文粘連字丁串形成的切分路徑更加合理。經(jīng)過試驗分析,本文發(fā)現(xiàn)改進(jìn)后的滴水算法在粘連模式簡單的藏文粘連字丁串中召回率達(dá)到73.02%。再次,經(jīng)過對藏文文字結(jié)構(gòu)的分析,本文提出了一種基于輪廓特征點(diǎn)檢測的過切分算法。該算法首先通過藏文基線將藏文字丁分成上元音區(qū)域和輔音字母區(qū)域兩部分;然后對于上元音區(qū)域,利用SVM-上元音分類器對上元音區(qū)域的特征點(diǎn)進(jìn)行篩選,對于輔音字母區(qū)域,利用規(guī)則進(jìn)行特征點(diǎn)篩選;最后利用特征點(diǎn)構(gòu)建切分路徑。本方法在粘連模式復(fù)雜的藏文粘連字丁串中召回率達(dá)到了81.42%。最后,本文利用深度學(xué)習(xí)框架,分別開發(fā)了復(fù)雜藏文歷史文獻(xiàn)文本和藏文拉丁轉(zhuǎn)寫文本的識別系統(tǒng),實現(xiàn)了圖像文本識別功能。
【圖文】:

輔音字母,元音字母


北京工業(yè)大學(xué)工程碩士專業(yè)學(xué)位論文上進(jìn)行了初步的實驗;在 3.5 節(jié),對本章進(jìn)行了總結(jié)。3.2 數(shù)據(jù)集的收集藏文文字是一種拼寫型文字,包含 30 個輔音字母和 4 個元音,如圖 3-1(a)和(b)所示。從字形上來說,存在很大的相似性,再加上時間因素造成的字丁粘連,對藏文歷史文獻(xiàn)進(jìn)行數(shù)字化任務(wù)有很大困難。

藏文,歷史文獻(xiàn),版面分析


- 13 -圖 3-3 藏文歷史文獻(xiàn)中的一頁Figure 3-3 A page in the Tibetan historical document藏文粘連字丁串的收集工作包括預(yù)處理、版面分析、行切分、連通區(qū)域分析、后處理等步驟。在預(yù)處理階段,本文主要針對粘連字丁串進(jìn)行了二值化和降噪操作,目的是為了使原始數(shù)據(jù)盡可能的不失真。在進(jìn)行版面分析時,本文使用了張西群[47]等人的方法對掃描的圖像進(jìn)行了版面分析,該方法是通過連通區(qū)域分析和角點(diǎn)檢測而進(jìn)行的。首先對掃面后圖像進(jìn)行角點(diǎn)檢測,文中利用伽馬變換對圖像進(jìn)行了圖像增強(qiáng),,接著使用大津算法對圖像進(jìn)行二值化處理,最后使用 Harris檢點(diǎn)檢測算法檢測角點(diǎn);然后使用設(shè)定閾值初步得到文本區(qū)域;最后對圖像進(jìn)行后處理,對文本區(qū)域的邊緣進(jìn)行提取和矯正,我們使用紅色線條對文本區(qū)域進(jìn)行了標(biāo)記,如圖 3-4(a)所示。
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:H214;TP391.41

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳晰;;近代初期臺灣史學(xué)界的重要工具書——《早期臺灣歷史文獻(xiàn)研究書目》[J];中國索引;2011年01期

2 陳慶英;楊潔;;評《清代藏學(xué)歷史文獻(xiàn)研究》[J];西藏研究;2018年01期

3 趙鳳華;;淺析歷史文獻(xiàn)在歷史教學(xué)中的作用[J];中華少年;2017年19期

4 張子剛;;碑刻:研究地方社會發(fā)展不可或缺的歷史文獻(xiàn)[J];人口·社會·法制研究;2016年Z2期

5 劉敬林;《英藏敦煌社會歷史文獻(xiàn)釋錄》(第一卷)補(bǔ)校[J];敦煌研究;2004年02期

6 葉貴良;《英藏敦煌社會歷史文獻(xiàn)釋錄·斯63號〈太上洞玄靈寶無量度人上品妙經(jīng)〉》校正[J];敦煌學(xué)輯刊;2002年02期

7 ;上圖新館將舉辦 “歷史文獻(xiàn)的開發(fā)與利用”學(xué)術(shù)研討會[J];圖書館雜志;1997年03期

8 王繼光;;蒙、藏、維吾爾族歷史文獻(xiàn)舉要[J];史學(xué)史研究;1987年02期

9 ;歷史文獻(xiàn)[J];黨史縱橫;1988年07期

10 顧志華;;祁承r在歷史文獻(xiàn)整理工作中的貢獻(xiàn)[J];華中師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);1988年04期

相關(guān)會議論文 前10條

1 向燕南;;古城的保護(hù)與其可持續(xù)發(fā)展不應(yīng)忽視歷史文獻(xiàn)的研究[A];《中國長城博物館》2012年第3期[C];2012年

2 趙婭麗;范勝麗;;現(xiàn)代思維科學(xué)與東北地方歷史文獻(xiàn)研究[A];耕耘錄:吉林省博物院學(xué)術(shù)文集(2003-2010)[C];2010年

3 張丕遠(yuǎn);葛全勝;鄭景云;;從歷史文獻(xiàn)、檔案中提取自然環(huán)境信息的研究[A];中國經(jīng)濟(jì)史上的天人關(guān)系學(xué)術(shù)討論會論文集[C];1999年

4 陳志根;;論湘湖歷史文獻(xiàn)的整理與研究[A];蕭山記憶(第四輯)[C];2011年

5 林永祥;;福建省圖書館歷史文獻(xiàn)信息的收集與利用[A];福建省社會科學(xué)信息中心2005年年會論文集[C];2005年

6 周衛(wèi)榮;;“搉石”考[A];面向21世紀(jì)的科技進(jìn)步與社會經(jīng)濟(jì)發(fā)展(下冊)[C];1999年

7 陳立;;載籍聚珍,含英咀華:南京圖書館歷史文獻(xiàn)閱讀推廣之路[A];中國圖書館學(xué)會年會論文集(2014年卷)[C];2014年

8 田玉南;;探析煙臺地區(qū)歷史文獻(xiàn)開發(fā)利用的價值及其舉措[A];文化研究論壇[C];2011年

9 張立憲;;溥儀珍寶迷蹤[A];溥儀研究 創(chuàng)刊號[C];2011年

10 舒大剛;;漢代儒學(xué)文獻(xiàn)的發(fā)展與演變[A];歷史文獻(xiàn)研究(總第31輯)[C];2012年

相關(guān)重要報紙文章 前10條

1 杭州師范大學(xué)馬克思主義學(xué)院 方勇駿;加強(qiáng)民間歷史文獻(xiàn)研究[N];中國社會科學(xué)報;2019年

2 孫昌武;一部歷史文獻(xiàn)拾遺補(bǔ)缺之作[N];中華讀書報;2018年

3 新鄉(xiāng)市圖書館 吳敏卿;河南歷史文獻(xiàn)的整理與開發(fā)利用[N];新鄉(xiāng)日報;2009年

4 記者葛銳;歷史文獻(xiàn)畫冊《中國衛(wèi)生防疫50年》正式出版[N];中國中醫(yī)藥報;2002年

5 記者 章紅雨;國圖社40年披露5萬余種珍稀歷史文獻(xiàn)[N];中國新聞出版廣電報;2019年

6 廈門大學(xué)歷史系 張侃;田野工作、歷史文獻(xiàn)與史學(xué)研究[N];光明日報;2007年

7 高放;珍貴革命歷史文獻(xiàn)的生動展現(xiàn)[N];人民日報;2007年

8 國家社科基金重大項目“英藏敦煌社會歷史文獻(xiàn)整理與研究”首席專家 首都師范大學(xué)教授 郝春文;《英藏敦煌社會歷史文獻(xiàn)釋錄》(1—11卷)出版[N];光明日報;2015年

9 記者 姜小玲;6700余種15000余冊革命歷史文獻(xiàn)整理完成[N];解放日報;2011年

10 記者 莊建;新疆歷史文獻(xiàn)現(xiàn)“真身”[N];光明日報;2010年

相關(guān)博士學(xué)位論文 前1條

1 馮法強(qiáng);近代江淮官話語音演變研究[D];南開大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 趙全超;藏文歷史文獻(xiàn)中粘連字丁串的切分與識別[D];北京工業(yè)大學(xué);2019年

2 張西群;面向藏文歷史文獻(xiàn)的版面分割方法研究[D];北京工業(yè)大學(xué);2018年

3 肖s

本文編號:2600429


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2600429.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f4e10***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲黄色在线观看免费高清| 最近中文字幕高清中文字幕无| 日韩综合国产欧美一区| 97人妻人人揉人人躁人人| 久久久免费精品人妻一区二区三区| 欧美午夜一级艳片免费看| 中文字幕日韩欧美理伦片| 欧美日韩免费观看视频| 一个人的久久精彩视频| 亚洲国产一区精品一区二区三区色| 日韩欧美高清国内精品| 中文字幕亚洲在线一区| 亚洲精品国产主播一区| 色婷婷亚洲精品综合网| 国语对白刺激高潮在线视频| 欧美成人免费视频午夜色| 内射精品欧美一区二区三区久久久| 91日韩欧美中文字幕| 亚洲专区中文字幕在线| 亚洲国产成人久久一区二区三区| 国产成人综合亚洲欧美日韩| 经典欧美熟女激情综合网| 国产精品欧美激情在线观看| 日韩不卡一区二区视频| 激情亚洲内射一区二区三区| 国产一级内片内射免费看| 久久热在线视频免费观看| 麻豆视传媒短视频在线看| 精品一区二区三区三级视频| 人妻乱近亲奸中文字幕| 国产自拍欧美日韩在线观看| 美女被啪的视频在线观看| 欧美整片精品日韩综合| 久久亚洲精品中文字幕| 亚洲综合激情另类专区老铁性| 亚洲欧洲在线一区二区三区| 亚洲国产日韩欧美三级| 夜夜嗨激情五月天精品| 好东西一起分享老鸭窝| 亚洲欧美日韩熟女第一页| 亚洲国产丝袜一区二区三区四|