基于自然場景的文本識(shí)別技術(shù)研究
[Abstract]:With the popularity of intelligent devices, more and more researchers pay attention to the advanced semantic information contained in the scene images taken by intelligent devices. The traditional optical character recognition technology can not be well applied to the extraction and recognition of scene image text, because the scene image has the characteristics that scanning image does not have. On the one hand, the difficulty of recognition is due to the complexity of the background of the scene image itself, and the conditions are often uncontrollable when shooting the scene image, which makes the scene image have some problems, such as low resolution, uneven light, blurring and so on; on the other hand, the characters in the scene image are often different in font, size and color. Therefore, new solutions are needed to solve the problem of text recognition of scene images. The work of this paper is based on this background. The main work of this paper is as follows: (1) the related technologies and present situation in the field of natural scene text recognition are deeply studied and analyzed; (2) based on the convolution neural network in deep learning, an end-to-end scene text recognition system, MatE2E system, is implemented. The system uses convolution neural network to learn character features and trains two classifiers for character determination and recognition respectively. There are two main modules of MatE2E system. The first main module is the text detection module, which uses character judgment classifier and sliding window to scan the scene image to detect the possible text area, and then filters the non-text region according to the text confidence of different positions in the image. The second main module is the text recognition module, which combines character recognition classifier and sliding window to scan the text area image and recognize the text, and then uses the dictionary to correct the text recognition results. (3) ICDAR2011 dataset, ICDAR2015 dataset and street view data set are used to verify the accuracy of the system. The experimental results show that the system proposed in this paper has a good recognition effect. The verification results on the experimental data set show that the MatE2E system has certain reference value in practical application. However, MatE2E system has limitations, such as: can only recognize English letters and numbers; in addition, it also needs to be improved in recognition speed, tilt text detection and so on.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王莉麗;于印;;一種基于雙向投影的文本圖像字符分割方法[J];數(shù)字技術(shù)與應(yīng)用;2017年05期
2 薛松;于印;;紙質(zhì)文檔數(shù)據(jù)防泄與追溯中文本圖像傾斜校正方法[J];電子技術(shù)與軟件工程;2017年04期
3 賀志明;;透視文本圖像的滅點(diǎn)探測[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2009年03期
4 李曉昆;基于筆劃識(shí)別的文本圖像壓縮[J];微型機(jī)與應(yīng)用;1998年09期
5 賀志明;;射影文本圖像的校正[J];電氣自動(dòng)化;2008年01期
6 賀志明;;數(shù)碼相機(jī)拍攝的透視文本圖像的校正[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2007年03期
7 謝鳳英;姜志國;汪雷;;基于空白條方向擬合的復(fù)雜文本圖像傾斜檢測[J];計(jì)算機(jī)應(yīng)用;2006年07期
8 董湘君,常鴻森,鄭楚君;一種基于小波變換的文本圖像閾值法分割[J];華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期
9 萬長明,趙宇明,趙麗;基于粗糙集的彩色文本圖像特征分割算法[J];紅外與激光工程;2003年06期
10 沈大龍,任東,陳增強(qiáng),袁著祉;基于最小二乘法的壓縮文本圖像恢復(fù)算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年02期
相關(guān)會(huì)議論文 前4條
1 馮莉;;文本識(shí)別技術(shù)在電視內(nèi)容監(jiān)管中的應(yīng)用[A];中國新聞技術(shù)工作者聯(lián)合會(huì)2017年學(xué)術(shù)年會(huì)論文集(學(xué)術(shù)論文篇)[C];2017年
2 李蘭蘭;吳樂南;;一種帶噪聲文本圖像的增強(qiáng)算法[A];全國第16屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2004年
3 張媛;蔡利棟;;一種去除文本圖像椒鹽噪聲的方法[A];圖像圖形技術(shù)研究與應(yīng)用(2010)[C];2010年
4 哈力木拉提.買買提;;基于輪廓的維吾爾文切分[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
相關(guān)重要報(bào)紙文章 前2條
1 諸艷;輕松在線OCR[N];中國電腦教育報(bào);2004年
2 上海市高東中學(xué) 鄭鋼;練就一雙“讀圖時(shí)代”的慧眼[N];中國教育報(bào);2015年
相關(guān)博士學(xué)位論文 前10條
1 許劍峰;數(shù)字視頻中的文本分割的研究[D];華南理工大學(xué);2005年
2 章東平;視頻文本的提取[D];浙江大學(xué);2006年
3 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年
4 孫羽菲;低質(zhì)量文本圖像OCR技術(shù)的研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
5 楊春;復(fù)雜場景文本識(shí)別技術(shù)研究[D];北京科技大學(xué);2018年
6 劉麗;近重復(fù)文本圖像匹配研究[D];華東師范大學(xué);2014年
7 譚利娜;文本圖像魯棒認(rèn)證技術(shù)研究[D];湖南大學(xué);2012年
8 吳銳;自然場景中文本識(shí)別技術(shù)研究及實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
9 張昕;自然場景圖像文本信息提取的理論與方法[D];清華大學(xué);2014年
10 孫日明;幾種圖形圖像壓縮方法[D];大連理工大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 黃舒嘯;基于自然場景的文本識(shí)別技術(shù)研究[D];北京郵電大學(xué);2016年
2 鐘巧;基于圖論的掃描圖像文本行分割與矯正[D];湖南大學(xué);2017年
3 張媛媛;基于l_p范數(shù)稀疏先驗(yàn)的文本圖像去模糊算法[D];北京工業(yè)大學(xué);2017年
4 張鵬;基于機(jī)器學(xué)習(xí)的自然圖像中文本檢測及多文種辨識(shí)方法研究[D];延邊大學(xué);2017年
5 張紅;基于L_0正則化的文本圖像去模糊方法研究[D];昆明理工大學(xué);2017年
6 杜敏;文本圖像認(rèn)證技術(shù)研究[D];西北大學(xué);2010年
7 陳侃;基于模糊計(jì)算的文本圖像二值化方法研究與應(yīng)用[D];北方工業(yè)大學(xué);2010年
8 張鑫;脫機(jī)手寫維吾爾文本圖像中粘連字符定位及分割[D];新疆大學(xué);2015年
9 朱其猛;基于文字結(jié)構(gòu)特征的文本圖像方向的研究與應(yīng)用[D];北方工業(yè)大學(xué);2014年
10 周強(qiáng);基于模糊核稀疏先驗(yàn)的文本圖像運(yùn)動(dòng)模糊去除[D];安徽大學(xué);2017年
,本文編號(hào):2506022
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2506022.html