基于改進(jìn)模糊支持向量機(jī)的西夏文字識(shí)別研究
【學(xué)位單位】:蘭州交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H211.7;TP391.41;TP18
【部分圖文】:
- 5 -圖 2.1 西夏文字示例分析這 6000 多個(gè)字的骨架結(jié)構(gòu),可以得出如下結(jié)論:(1) 大部分字體的筆畫都很繁雜,并且平均筆畫達(dá)到 25 畫。計(jì)算機(jī)識(shí)別難以入手。(2) 與漢字相似,都由豎、撇、捺、折、勾等筆畫組成,但其中斜筆較多。(3) 西夏文字中存在很多形近字,將文字左右部分互換得到的文字往往是原文字的近義字。關(guān)于西夏文字的編碼工作,李漢文先生編寫的《夏漢字典》是迄今為止第一部系統(tǒng)的,完備的西夏文與漢文對照的字典,其中,李漢文先生提出了四角編碼方法將西夏文的筆形劃分為九種類型,并分別用數(shù)字 1-9 來表示,0 用來表示沒有筆形。如圖 2.2 是西夏文字的筆形和對應(yīng)的代碼。
圖 2.2 西夏文字筆形表因?yàn)槲飨奈淖止P畫繁雜,如果只用四角編碼就會(huì)發(fā)生重碼的現(xiàn)象即不同文字有的編碼。為了解決這個(gè)問題,后來又在四位編碼后添加了兩位附加碼。四角碼的編序是按照左上、右上、左下和右下的順序。附加碼的編碼順序是按靠近左下角在先近右下角在后。可是即使這樣依然無法解決所有文字的重碼問題,如圖 2.3 中所示個(gè)西夏文字的編碼都是 101000。圖 2.3 四角編碼重碼文字
圖 2.2 西夏文字筆形表因?yàn)槲飨奈淖止P畫繁雜,如果只用四角編碼就會(huì)發(fā)生重碼的現(xiàn)象即不同文字有碼。為了解決這個(gè)問題,后來又在四位編碼后添加了兩位附加碼。四角碼的編按照左上、右上、左下和右下的順序。附加碼的編碼順序是按靠近左下角在先下角在后?墒羌词惯@樣依然無法解決所有文字的重碼問題,如圖 2.3 中所示夏文字的編碼都是 101000。
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;新華智云推出25款媒體機(jī)器人,解決媒體人痛點(diǎn)[J];傳媒;2019年17期
2 張華萍;黃辰;;文字識(shí)別技術(shù)研究[J];物聯(lián)網(wǎng)技術(shù);2018年08期
3 浦世亮;程戰(zhàn)戰(zhàn);;基于注意力矯正的自然場景文字識(shí)別[J];中國公共安全;2017年09期
4 盛寁;劉偉;;計(jì)算機(jī)文字識(shí)別的發(fā)展及應(yīng)用[J];科技信息;2008年31期
5 Jay;文字識(shí)別網(wǎng)上行[J];電腦應(yīng)用文萃;2005年02期
6 柳玉輝;計(jì)算機(jī)文字識(shí)別的技術(shù)探討與應(yīng)用前景分析[J];軟件工程師;1999年04期
7 郭軍,馬躍,盛立東,鐘義信;發(fā)展中的文字識(shí)別理論與技術(shù)[J];電子學(xué)報(bào);1995年10期
8 張開;岑翠;李林獻(xiàn);謝雨非;;基于蟻群算法的文字識(shí)別[J];信息與電腦(理論版);2019年22期
9 弓耀輝;;圖像文字識(shí)別中的預(yù)處理技術(shù)研究綜述[J];信息通信;2017年09期
10 孫承鑒,張大華;手寫文字識(shí)別技術(shù)及其在圖書館的應(yīng)用[J];現(xiàn)代圖書情報(bào)技術(shù);1993年01期
相關(guān)博士學(xué)位論文 前5條
1 姚超;降維算法和手寫文字識(shí)別中若干問題研究[D];西安電子科技大學(xué);2014年
2 許亞美;手寫維吾爾文字識(shí)別若干關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2014年
3 姚聰;自然圖像中文字檢測與識(shí)別研究[D];華中科技大學(xué);2014年
4 程艷芬;離線阿拉伯手寫體光學(xué)文字識(shí)別方法的研究[D];武漢理工大學(xué);2009年
5 瑪依熱·依布拉音;聯(lián)機(jī)手寫維吾爾文字母與單詞識(shí)別研究[D];武漢大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 劉興長;基于改進(jìn)模糊支持向量機(jī)的西夏文字識(shí)別研究[D];蘭州交通大學(xué);2019年
2 楊海林;基于深度學(xué)習(xí)的古籍文字識(shí)別和檢測[D];華南理工大學(xué);2019年
3 李小璐;基于優(yōu)化分割與提取的西夏古籍文字識(shí)別研究[D];寧夏大學(xué);2019年
4 楊宏志;基于深度學(xué)習(xí)的自然場景文字識(shí)別[D];重慶郵電大學(xué);2019年
5 游京翰;基于深度學(xué)習(xí)的文字序列識(shí)別系統(tǒng)[D];哈爾濱工業(yè)大學(xué);2018年
6 高威威;基于深度學(xué)習(xí)的自然場景文字識(shí)別[D];安徽大學(xué);2019年
7 趙星馳;基于深度學(xué)習(xí)的視頻文字檢測技術(shù)[D];北京郵電大學(xué);2019年
8 張博;基于深度置信網(wǎng)絡(luò)的圖像識(shí)別算法研究[D];哈爾濱理工大學(xué);2019年
9 邵文良;基于深度學(xué)習(xí)的醫(yī)療單據(jù)圖文識(shí)別關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年
10 鄒瑞杰;基于深度學(xué)習(xí)的自然英文文字識(shí)別的研究[D];電子科技大學(xué);2019年
本文編號(hào):2856054
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2856054.html