天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于自然場景的文本識(shí)別技術(shù)研究

發(fā)布時(shí)間:2019-06-25 21:25
【摘要】:隨著智能設(shè)備的普及,智能設(shè)備拍攝的場景圖像中包含的高級(jí)語義信息越來越受研究人員的關(guān)注。傳統(tǒng)的光學(xué)字符識(shí)別技術(shù)往往無法很好地應(yīng)用于場景圖像文本的提取和識(shí)別,因?yàn)閳鼍皥D像具有掃描圖像所不具備的特性。造成識(shí)別困難的原因一方面是由于場景圖像本身背景復(fù)雜,且拍攝場景圖像時(shí)往往條件不可控,使得場景圖像存在分辨率低、光照不均、模糊等問題;另一方面,由于場景圖像中的字符往往在字體、大小和顏色等方面各有差異。因此,針對(duì)場景圖像的文本識(shí)別問題需要新的解決方法。本文的工作是基于這樣的背景開展的。本文主要工作包括:(1)深入研究和分析了當(dāng)前自然場景文本識(shí)別領(lǐng)域的相關(guān)技術(shù)和現(xiàn)狀;(2)基于深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)了一個(gè)端到端的場景文本識(shí)別系統(tǒng)——MatE2E系統(tǒng)。該系統(tǒng)利用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)字符特征,訓(xùn)練了兩個(gè)分類器,分別用于字符的判定和識(shí)別。MatE2E系統(tǒng)的主要模塊有兩個(gè)。第一個(gè)主要模塊是文本檢測模塊,該模塊利用字符判斷分類器和滑動(dòng)窗口掃描場景圖像來檢測可能的文本區(qū)域,之后根據(jù)圖像中不同位置的文本置信度過濾非文本區(qū)域。第二個(gè)主要模塊是文本識(shí)別模塊,該模塊結(jié)合字符識(shí)別分類器和滑動(dòng)窗口掃描文本區(qū)域圖像并識(shí)別其中的文字,之后利用詞典更正文本識(shí)別結(jié)果;(3)使用ICDAR2011數(shù)據(jù)集、ICDAR2015數(shù)據(jù)集和街景數(shù)據(jù)集驗(yàn)證了系統(tǒng)的準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,本文提出的系統(tǒng)具有較好的識(shí)別效果。本文在實(shí)驗(yàn)數(shù)據(jù)集上的驗(yàn)證結(jié)果表明MatE2E系統(tǒng)在實(shí)際應(yīng)用中具有一定的參考價(jià)值。不過,MatE2E系統(tǒng)還有局限性,例如:只能識(shí)別英文字母和數(shù)字;另外還需在識(shí)別速度、傾斜文本檢測等方面進(jìn)行改進(jìn)等。
[Abstract]:With the popularity of intelligent devices, more and more researchers pay attention to the advanced semantic information contained in the scene images taken by intelligent devices. The traditional optical character recognition technology can not be well applied to the extraction and recognition of scene image text, because the scene image has the characteristics that scanning image does not have. On the one hand, the difficulty of recognition is due to the complexity of the background of the scene image itself, and the conditions are often uncontrollable when shooting the scene image, which makes the scene image have some problems, such as low resolution, uneven light, blurring and so on; on the other hand, the characters in the scene image are often different in font, size and color. Therefore, new solutions are needed to solve the problem of text recognition of scene images. The work of this paper is based on this background. The main work of this paper is as follows: (1) the related technologies and present situation in the field of natural scene text recognition are deeply studied and analyzed; (2) based on the convolution neural network in deep learning, an end-to-end scene text recognition system, MatE2E system, is implemented. The system uses convolution neural network to learn character features and trains two classifiers for character determination and recognition respectively. There are two main modules of MatE2E system. The first main module is the text detection module, which uses character judgment classifier and sliding window to scan the scene image to detect the possible text area, and then filters the non-text region according to the text confidence of different positions in the image. The second main module is the text recognition module, which combines character recognition classifier and sliding window to scan the text area image and recognize the text, and then uses the dictionary to correct the text recognition results. (3) ICDAR2011 dataset, ICDAR2015 dataset and street view data set are used to verify the accuracy of the system. The experimental results show that the system proposed in this paper has a good recognition effect. The verification results on the experimental data set show that the MatE2E system has certain reference value in practical application. However, MatE2E system has limitations, such as: can only recognize English letters and numbers; in addition, it also needs to be improved in recognition speed, tilt text detection and so on.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王莉麗;于印;;一種基于雙向投影的文本圖像字符分割方法[J];數(shù)字技術(shù)與應(yīng)用;2017年05期

2 薛松;于印;;紙質(zhì)文檔數(shù)據(jù)防泄與追溯中文本圖像傾斜校正方法[J];電子技術(shù)與軟件工程;2017年04期

3 賀志明;;透視文本圖像的滅點(diǎn)探測[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2009年03期

4 李曉昆;基于筆劃識(shí)別的文本圖像壓縮[J];微型機(jī)與應(yīng)用;1998年09期

5 賀志明;;射影文本圖像的校正[J];電氣自動(dòng)化;2008年01期

6 賀志明;;數(shù)碼相機(jī)拍攝的透視文本圖像的校正[J];上海工程技術(shù)大學(xué)學(xué)報(bào);2007年03期

7 謝鳳英;姜志國;汪雷;;基于空白條方向擬合的復(fù)雜文本圖像傾斜檢測[J];計(jì)算機(jī)應(yīng)用;2006年07期

8 董湘君,常鴻森,鄭楚君;一種基于小波變換的文本圖像閾值法分割[J];華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年03期

9 萬長明,趙宇明,趙麗;基于粗糙集的彩色文本圖像特征分割算法[J];紅外與激光工程;2003年06期

10 沈大龍,任東,陳增強(qiáng),袁著祉;基于最小二乘法的壓縮文本圖像恢復(fù)算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年02期

相關(guān)會(huì)議論文 前4條

1 馮莉;;文本識(shí)別技術(shù)在電視內(nèi)容監(jiān)管中的應(yīng)用[A];中國新聞技術(shù)工作者聯(lián)合會(huì)2017年學(xué)術(shù)年會(huì)論文集(學(xué)術(shù)論文篇)[C];2017年

2 李蘭蘭;吳樂南;;一種帶噪聲文本圖像的增強(qiáng)算法[A];全國第16屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2004年

3 張媛;蔡利棟;;一種去除文本圖像椒鹽噪聲的方法[A];圖像圖形技術(shù)研究與應(yīng)用(2010)[C];2010年

4 哈力木拉提.買買提;;基于輪廓的維吾爾文切分[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

相關(guān)重要報(bào)紙文章 前2條

1 諸艷;輕松在線OCR[N];中國電腦教育報(bào);2004年

2 上海市高東中學(xué) 鄭鋼;練就一雙“讀圖時(shí)代”的慧眼[N];中國教育報(bào);2015年

相關(guān)博士學(xué)位論文 前10條

1 許劍峰;數(shù)字視頻中的文本分割的研究[D];華南理工大學(xué);2005年

2 章東平;視頻文本的提取[D];浙江大學(xué);2006年

3 劉濤;現(xiàn)代信息檢索中的文本分類及圖像恢復(fù)研究[D];北京郵電大學(xué);2006年

4 孫羽菲;低質(zhì)量文本圖像OCR技術(shù)的研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年

5 楊春;復(fù)雜場景文本識(shí)別技術(shù)研究[D];北京科技大學(xué);2018年

6 劉麗;近重復(fù)文本圖像匹配研究[D];華東師范大學(xué);2014年

7 譚利娜;文本圖像魯棒認(rèn)證技術(shù)研究[D];湖南大學(xué);2012年

8 吳銳;自然場景中文本識(shí)別技術(shù)研究及實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年

9 張昕;自然場景圖像文本信息提取的理論與方法[D];清華大學(xué);2014年

10 孫日明;幾種圖形圖像壓縮方法[D];大連理工大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 黃舒嘯;基于自然場景的文本識(shí)別技術(shù)研究[D];北京郵電大學(xué);2016年

2 鐘巧;基于圖論的掃描圖像文本行分割與矯正[D];湖南大學(xué);2017年

3 張媛媛;基于l_p范數(shù)稀疏先驗(yàn)的文本圖像去模糊算法[D];北京工業(yè)大學(xué);2017年

4 張鵬;基于機(jī)器學(xué)習(xí)的自然圖像中文本檢測及多文種辨識(shí)方法研究[D];延邊大學(xué);2017年

5 張紅;基于L_0正則化的文本圖像去模糊方法研究[D];昆明理工大學(xué);2017年

6 杜敏;文本圖像認(rèn)證技術(shù)研究[D];西北大學(xué);2010年

7 陳侃;基于模糊計(jì)算的文本圖像二值化方法研究與應(yīng)用[D];北方工業(yè)大學(xué);2010年

8 張鑫;脫機(jī)手寫維吾爾文本圖像中粘連字符定位及分割[D];新疆大學(xué);2015年

9 朱其猛;基于文字結(jié)構(gòu)特征的文本圖像方向的研究與應(yīng)用[D];北方工業(yè)大學(xué);2014年

10 周強(qiáng);基于模糊核稀疏先驗(yàn)的文本圖像運(yùn)動(dòng)模糊去除[D];安徽大學(xué);2017年



本文編號(hào):2506022

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2506022.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶80daa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美日韩高清不卡在线播放| 日韩中文字幕在线不卡一区| 国产精品二区三区免费播放心| 国内精品美女福利av在线| 日韩人妻免费视频一专区| 国产精品欧美在线观看| 久久亚洲精品成人国产| 国产精品成人一区二区三区夜夜夜| 国内精品偷拍视频久久| 午夜福利精品视频视频| 国产精品丝袜美腿一区二区| 亚洲综合激情另类专区老铁性| 精品久久久一区二区三| 又色又爽又黄的三级视频| 大尺度激情福利视频在线观看| 国产av熟女一区二区三区四区| 黄片免费在线观看日韩| 国产麻豆视频一二三区| 妻子的新妈妈中文字幕| 国产成人精品视频一二区| 激情内射日本一区二区三区| 一本色道久久综合狠狠躁| 日韩一级欧美一级久久| 国产内射在线激情一区| 午夜日韩在线观看视频| 日韩欧美精品一区二区三区| 国产精品一区日韩欧美| 国产传媒免费观看视频| 欧美中文字幕一区在线| 亚洲免费黄色高清在线观看| 国产户外勾引精品露出一区| 欧美午夜国产在线观看| 欧洲日本亚洲一区二区| 中文日韩精品视频在线| 日本高清二区视频久二区| 日本女优一色一伦一区二区三区| 国产在线不卡中文字幕| 国产精品视频久久一区| 日韩特级黄色大片在线观看| 国产又粗又硬又大又爽的视频| 国产精品一区二区丝袜|