天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

自然場景圖像中的文字檢測

發(fā)布時間:2017-09-12 21:31

  本文關鍵詞:自然場景圖像中的文字檢測


  更多相關文章: 自然場景圖像 文字檢測 文字/非文字分類 Color-enhanced CER 神經網絡 無歧義學習策略


【摘要】:隨著低成本高性能移動、數(shù)碼或可穿戴設備的成熟和普及,以及互聯(lián)網和移動互聯(lián)網技術的高速發(fā)展,越來越多的新型應用場景中需要利用圖像中的文字信息,從而使得自然場景中的文字提取技術成為了近幾年計算機視覺領域的熱門研究課題。而文字檢測技術作為文字提取技術中的一個核心前端模塊,同樣受到越來越多學者的關注。然而文字本身的高變化度(如各種各樣的字體、大小等)加上自然場景中的不均勻光照,遮擋,模糊,透視變換等客觀因素使得自然場景圖像中的全自動文字檢測問題變得極為困難。本文針對該問題的各個難點進行了深入的分析,提出了一套基于Color-enhanced CER和淺層神經網絡的全自動文字檢測系統(tǒng),并在標準數(shù)據(jù)集上驗證了算法的有效性。此外,在某些特定的應用場景中可以巧妙地利用用戶的交互信息來簡化文字檢測問題的難度,這類問題被稱為基于用戶意圖的文字檢測問題。本文對該類問題也進行了深入的研究,并驗證了圖像的組件樹結構對于解決基于用戶意圖的文字檢測問題的有效性。所以,本文的主要工作可以被劃分為自動的文字檢測和基于用戶意圖的文字檢測兩個部分。 自動的文字檢測主要包含兩個核心子問題,即候選文字連通區(qū)域提取和文字/非文字分類。針對第一個問題,本文首先從理論上分析了經典的極值區(qū)域方法作為候選文字連通區(qū)域的局限性。為了抑制這些局限性,本文對極值區(qū)域算法提出改進,并提出Color-enhanced CER算法來作為本文的候選文字連通區(qū)域提取算法。文字/非文字分類是文字檢測問題的瓶頸問題,本文從理論上深入闡明了該問題的主要難點及其原因,并指出歧義性問題和不平衡分類問題是導致作為少數(shù)類的文字類泛化能力差的重要原因,而這也正是之前的文字檢測算法召回率低的一個重要原因。為了解決這個問題,本文算法在特征層面,系統(tǒng)層面以及訓練數(shù)據(jù)準備層面上都提出了相應的有效解決方法。在特征層面,本文沒有像之前的方法一樣采用人工設計的特征,而是直接利用神經網絡從后續(xù)文字連通區(qū)域所對應的二值圖的原始像素中學出有用的特征,該方法一方面可以避免人工特征提取過程中有用信息的損失,另一方面可以降低算法的計算復雜度。在系統(tǒng)層面,為了克服歧義性問題,本文先利用孤立候選文字連通區(qū)域的形狀或者紋理信息盡可能濾除無歧義非文字連通區(qū)域,以此簡化后面文本行生成算法的難度,再利用文本行信息消除孤立候選文字連通區(qū)域的歧義性問題。其中,為了簡化孤立候選文字連通區(qū)域的文字/非文字分類問題,本文提出“分治”策略將原始問題空間根據(jù)文字本身的特有屬性切分為五個子空間,每個子空間分別利用無歧義學習策略訓練相應的淺層神經網絡分類器進行文字/非文字分類。在訓練數(shù)據(jù)準備層面,無歧義學習策略可以很好地抑制歧義性問題和不平衡分類問題導致文字類泛化能力差的問題,從而使得在準備分類器訓練數(shù)據(jù)的時候可以盡可能多且安全地使用從字體庫合成的樣本作為訓練正樣本。使用合成數(shù)據(jù),一方面可以降低數(shù)據(jù)標注的工作量,另一方面保證訓練數(shù)據(jù)干凈且分布均勻,有助于分類器的性能。另外,通過無歧義學習策略可以有效地采樣出少量且重要的非文字樣本訓練集,從而可以解決數(shù)據(jù)集不平衡問題。由于無歧義學習策略對原始的歧義性問題進行了簡化,所以在通過該策略得到的訓練數(shù)據(jù)集上,淺層神經網絡可以得到接近深度神經網絡的結果,這樣一來本文就可以直接選用淺層神經網絡作為各個文字/非文字分類器,從而大幅降低算法的計算復雜度。本文提出的文字檢測算法在標準數(shù)據(jù)集ICDAR-2011和ICDAR-2013測試集上都取得了很好的結果。 針對基于用戶意圖的文字檢測問題,本文提出可以利用圖像的組件樹結構來解決該問題,并驗證了圖像的組件樹結構在解決基于用戶意圖的文字檢測問題上的有效性。相比于傳統(tǒng)的掃描線法,本文提出的基于組件樹的算法大幅提升了檢測的準確度。之后本文又對初始算法提出改進,設計了一套改進版的基于組件樹的算法,進一步提升了算法的性能。
【關鍵詞】:自然場景圖像 文字檢測 文字/非文字分類 Color-enhanced CER 神經網絡 無歧義學習策略
【學位授予單位】:中國科學技術大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.41
【目錄】:
  • 摘要5-7
  • Abstract7-10
  • 目錄10-12
  • 第1章 緒論12-22
  • 1.1 文字檢測研究及意義12-17
  • 1.2 文字檢測問題難點分析17-19
  • 1.3 基于用戶意圖(User-intention)的文字檢測19-20
  • 1.4 本文主要工作20
  • 1.5 本文結構安排20-22
  • 第2章 文字檢測技術概述22-30
  • 2.1 全自動的文字檢測技術概述22-28
  • 2.1.1 基于區(qū)域的文字檢測算法23-24
  • 2.1.2 基于連通區(qū)域的文字檢測算法24-28
  • 2.1.3 基于前兩種方法融合的方法28
  • 2.2 基于用戶意圖的文字檢測技術概述28-29
  • 2.3 小結29-30
  • 第3章 自然場景圖像中的全自動文字檢測30-85
  • 3.1 引言30-41
  • 3.1.1 候選連通區(qū)域提取難點分析及解決思路30-32
  • 3.1.2 文字/非文字分類難點分析及解決思路32-41
  • 3.2 神經網絡簡介41-46
  • 3.2.1 一般前饋神經網絡簡介41-44
  • 3.2.2 Dropout算法44
  • 3.2.3 本文參數(shù)設置44-46
  • 3.3 本文解決方案46-75
  • 3.3.1 系統(tǒng)概述46-47
  • 3.3.2 顏色空間變換47-50
  • 3.3.3 Color-enhanced CER提取50-58
  • 3.3.4 文字/非文字分類58-75
  • 3.3.5 后處理75
  • 3.3.6 多通道結果融合75
  • 3.4 實驗結果75-82
  • 3.4.1 系統(tǒng)的總體結果評測76-81
  • 3.4.2 系統(tǒng)主要模塊的結果評測81-82
  • 3.5 算法局限性82-83
  • 3.6 算法討論83-84
  • 3.7 本章小結84-85
  • 第4章 基于用戶意圖的文字檢測85-94
  • 4.1 文獻[23]中的算法85-89
  • 4.2 改進算法89-91
  • 4.3 實驗結果91-93
  • 4.4 本章小結93-94
  • 第5章 總結與展望94-97
  • 5.1 本文工作總結94-95
  • 5.2 未來研究展望95-97
  • 插圖索引97-100
  • 表格索引100-101
  • 參考文獻101-111
  • 致謝111-113
  • 攻讀博士學位期間的研究成果

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 彭浩;陳繼鋒;劉瓊;王海濤;高海波;;一種面向聚焦爬蟲的自然場景文本定位技術[J];小型微型計算機系統(tǒng);2014年09期

2 戴津;;自然場景中文本檢測技術研究綜述[J];計算機光盤軟件與應用;2013年18期

3 古輝;蘆亞亞;丁維龍;王杰;張維統(tǒng);;自然場景下果實目標的識別和定位[J];浙江工業(yè)大學學報;2007年03期

4 皮學賢;李思昆;宋君強;;一種新的離散格子氣模型及其在自然場景仿真中的應用[J];計算機工程與科學;2006年10期

5 楊丹;李博;趙紅;;魯棒視覺詞匯本的自適應構造與自然場景分類應用[J];電子與信息學報;2010年09期

6 劉宏;普杰信;;一種改進的自然場景特征提取方法[J];計算機工程;2011年21期

7 宋文;肖建于;;基于筆畫寬度變換的自然場景文本檢測方法[J];計算機工程與應用;2013年09期

8 張冬梅;張全元;鄭達;鄭蔚;李暉;戴光明;;一種新的自然場景標志牌文本提取算法[J];計算機工程與應用;2007年24期

9 ,;何東健;李宗儒;;基于聚類與邊緣檢測的自然場景文本提取方法[J];計算機工程與設計;2010年18期

10 徐瓊;干宗良;劉峰;陳昌紅;;基于提升樹的自然場景中文文本定位算法研究[J];南京郵電大學學報(自然科學版);2013年06期

中國重要會議論文全文數(shù)據(jù)庫 前1條

1 霍靜萍;杜建政;;自然場景視覺記憶中顏色的作用途徑[A];第十一屆全國心理學學術會議論文摘要集[C];2007年

中國博士學位論文全文數(shù)據(jù)庫 前4條

1 吳銳;自然場景中文本識別技術研究及實現(xiàn)[D];哈爾濱工業(yè)大學;2010年

2 黃劍華;自然場景中文本信息提取方法[D];哈爾濱工業(yè)大學;2007年

3 孫雷;自然場景圖像中的文字檢測[D];中國科學技術大學;2015年

4 劉曉佩;自然場景文本信息提取關鍵技術研究[D];西安電子科技大學;2014年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 楊帆;基于腦電的自然場景下目標的快速識別研究[D];云南大學;2014年

2 王煒;基于角點和顏色的自然場景文字定位技術研究[D];西安電子科技大學;2011年

3 葛巧瑞;自然場景下的文字分割及識別研究[D];西安電子科技大學;2012年

4 劉宏;基于雙目視覺的自然場景感知[D];河南科技大學;2011年

5 覃香;自然場景下蘋果檢測系統(tǒng)的研究與實現(xiàn)[D];西北農林科技大學;2011年

6 馬然;基于深度學習的自然場景文本識別系統(tǒng)的設計與實現(xiàn)[D];吉林大學;2015年

7 汪文芳;基于移動終端的自然場景文本定位和識別[D];西安電子科技大學;2011年

8 廖威敏;面向自然場景的端對端英文文字識別研究[D];廈門大學;2014年

9 蘆亞亞;自然場景下果蔬識別定位系統(tǒng)的關鍵技術研究[D];浙江工業(yè)大學;2007年

10 霍靜萍;自然場景視覺記憶中顏色的作用[D];河南大學;2007年



本文編號:839659

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/839659.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶d7a83***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com