基于深度全卷積神經(jīng)網(wǎng)絡的文字區(qū)域定位方法
本文關鍵詞:基于深度全卷積神經(jīng)網(wǎng)絡的文字區(qū)域定位方法
更多相關文章: 深度全卷積網(wǎng)絡 自然場景文字區(qū)域定位 圖像區(qū)域分割
【摘要】:近年來,深度學習模型在各種計算機視覺方面都展現(xiàn)出了遠遠優(yōu)于傳統(tǒng)方法的性能,在自然場景中的文字區(qū)域定位問題中引入深度學習方法無疑也是大勢所趨。文章提出了一種基于深度全卷積網(wǎng)絡方法的文字區(qū)域定位方法,實現(xiàn)了端到端的訓練、檢測,使得訓練更為有效,檢測過程更加高效。最終文中方法在ICDAR 2015數(shù)據(jù)集上對比基于MSER等的傳統(tǒng)方法有了很大提升,達到了86.57%的查準率和82.1%的召回率。
【作者單位】: 同濟大學測繪與地理信息學院;
【關鍵詞】: 深度全卷積網(wǎng)絡 自然場景文字區(qū)域定位 圖像區(qū)域分割
【分類號】:TP391.41;TP183
【正文快照】: 傳統(tǒng)的自然場景文字定位問題通常遵循自下而上的檢測流程,首先是對圖像進行預處理,然后通過傳統(tǒng)的檢測方法通常是使用模版匹配的方法來選擇候選區(qū)域,接著對候選區(qū)域進行投票選擇融合或者非極大值抑制方法生成最后的文字區(qū)域[1]。這類模板在解決特定場景下的定位問題時非常有效
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 田豐;劉娜;;基于二次加權濾波的熱設備故障區(qū)域定位研究[J];計算機工程與應用;2014年14期
2 苑森淼;聲放射源二維平面正方形區(qū)域定位的研究[J];吉林工業(yè)大學學報;1986年01期
3 李樹,施鵬飛,周煦潼;文本圖像的快速區(qū)域定位方法[J];上海交通大學學報;2003年09期
4 胡正平;王瑾;;多尺度-方向筆畫結合SVM驗證的文字區(qū)域定位[J];儀器儀表學報;2010年04期
5 姚金良;翁璐斌;王小華;;一種基于連通分量的文本區(qū)域定位方法[J];模式識別與人工智能;2012年02期
6 馬睿;韋勇鋼;龔巍;程昊;;RFID重要物品管控技術研究[J];信息安全與通信保密;2014年07期
7 李昌海;葉玉堂;劉霖;羅穎;葉涵;徐偉;;人民幣OCR中的號碼區(qū)域快速定位新方法[J];光電工程;2012年09期
8 呂佩卓;賴聲禮;陳佳陽;胡蓉;;一種自適應的手背靜脈區(qū)域定位算法[J];微計算機信息;2008年04期
9 馬帥營;安居白;陳舫明;;基于區(qū)域定位的絕緣子圖像分割[J];電力建設;2010年07期
10 朱煜;江林佳;;基于圖像跟蹤的孔洞目標提取與區(qū)域定位研究[J];光子學報;2008年02期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 孫趙婉;孫建德;劉琚;欒海濤;;基于運動區(qū)域定位的視頻水印算法[A];第八屆全國信息隱藏與多媒體安全學術大會湖南省計算機學會第十一屆學術年會論文集[C];2009年
2 李雄敏;金愛娟;林珊;;五相可變速電機在不對稱聯(lián)結下的分析與仿真[A];04'中國企業(yè)自動化和信息化建設論壇暨中南六省區(qū)自動化學會學術年會專輯[C];2004年
中國碩士學位論文全文數(shù)據(jù)庫 前1條
1 劉廣征;基于視頻與文本信息的說話者人臉標注[D];哈爾濱工業(yè)大學;2010年
,本文編號:902905
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/902905.html