天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一種端到端的多角度場(chǎng)景文本檢測(cè)和識(shí)別方法

發(fā)布時(shí)間:2023-12-09 08:27
  自然場(chǎng)景中的文本展示了許多信息,并提供了與環(huán)境交互的基本工具。文本檢測(cè)方面,場(chǎng)景文本檢測(cè)受場(chǎng)景文本比例、尺度和方向的較大差異困擾。本文將特征金字塔機(jī)制(Feature Pyramid Networks,FPN)與 SSD(Single Shot Detector)框架相結(jié)合,以處理不同比例的文本,并連接局部可檢測(cè)元素以檢測(cè)具有不同方向和尺度的文本。與SSD相比,通過(guò)放大了深層特征圖,以更好地定位大文本并準(zhǔn)確識(shí)別小文本。文本識(shí)別方面,引入殘差模塊(ReseNet)與注意力機(jī)制(Attention)的識(shí)別器解決了模型訓(xùn)練時(shí)容易產(chǎn)生梯度爆炸、消失等問(wèn)題,并且能夠有效預(yù)測(cè)長(zhǎng)字符,提高識(shí)別率。為了處理不同比例、尺度和方向的文本,提出了一種端到端的場(chǎng)景文本檢測(cè)與識(shí)別方法。本文工作如下:(1)通過(guò)結(jié)合特征金字塔網(wǎng)絡(luò)和連接段,可以有效地檢測(cè)不同比例和方向的場(chǎng)景文本。(2)采用更深層次特征金字塔機(jī)制與SSD結(jié)合的設(shè)計(jì),可以有效解決不同規(guī)模的文本檢測(cè)問(wèn)題,尤其是小文本。(3)由于選擇了 SSD樣式的檢測(cè)器,因此所提出的文本檢測(cè)方法非常高效。(4)用引入殘差網(wǎng)絡(luò)的深度雙向遞歸網(wǎng)絡(luò)(Bi-LSTM)對(duì)文本序列...

【文章頁(yè)數(shù)】:68 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 場(chǎng)景文本識(shí)別國(guó)內(nèi)外研究現(xiàn)狀
        1.2.2 研究現(xiàn)狀分析
    1.3 論文研究?jī)?nèi)容與結(jié)構(gòu)安排
第2章 端到端的場(chǎng)景文本檢測(cè)與識(shí)別方法原理
    2.1 場(chǎng)景文本識(shí)別原理
    2.2 特征金字塔介紹
    2.3 殘差網(wǎng)絡(luò)介紹
    2.4 注意力機(jī)制介紹
    2.5 相關(guān)場(chǎng)景文本識(shí)別網(wǎng)絡(luò)模型介紹
        2.5.1 場(chǎng)景文本檢測(cè)網(wǎng)絡(luò)模型
        2.5.2 場(chǎng)景文本識(shí)別網(wǎng)絡(luò)模型
        2.5.3 端到端模型
    2.6 本章小結(jié)
第3章 端到端的場(chǎng)景文本檢測(cè)與識(shí)別模型設(shè)計(jì)
    3.1 端到端的場(chǎng)景文本檢測(cè)與識(shí)別模型總體架構(gòu)
    3.2 場(chǎng)景文本檢測(cè)模型
        3.2.1 Seglink網(wǎng)絡(luò)模型
        3.2.2 基于FPN的Seglink模型的深層特征提取
        3.2.3 模型訓(xùn)練及損失函數(shù)
    3.3 場(chǎng)景文本識(shí)別模型
        3.3.1 Bi-LSTM與CTC的場(chǎng)景文本識(shí)別
        3.3.2 基于改進(jìn)Bi-LSTM上下文語(yǔ)意的特征提取
        3.3.3 基于改進(jìn)CTC轉(zhuǎn)錄
        3.3.4 模型訓(xùn)練
    3.4 本章小結(jié)
第4章 仿真實(shí)驗(yàn)與應(yīng)用驗(yàn)證
    4.1 實(shí)驗(yàn)設(shè)計(jì)
        4.1.1 深度學(xué)習(xí)框架
        4.1.2 開源數(shù)據(jù)集
    4.2 實(shí)驗(yàn)過(guò)程
        4.2.1 模型訓(xùn)練
        4.2.2 文本識(shí)別實(shí)驗(yàn)結(jié)果評(píng)測(cè)標(biāo)準(zhǔn)
        4.2.3 性能評(píng)測(cè)
    4.3 實(shí)驗(yàn)結(jié)果分析
        4.3.1 文本多角度檢測(cè)分析
        4.3.2 文本檢測(cè)端改進(jìn)效果對(duì)比與分析
        4.3.3 文本識(shí)別端改進(jìn)效果對(duì)比與分析
        4.3.4 端到端模型效果對(duì)比與分析
    4.4 本章小結(jié)
第5章結(jié)論與展望
    5.1 研究工作總結(jié)
    5.2 主要?jiǎng)?chuàng)新點(diǎn)
    5.3 展望
致謝
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果



本文編號(hào):3871206

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3871206.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶be7f5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com