天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向自然場(chǎng)景漢字識(shí)別的非平衡性與抗攻擊性研究

發(fā)布時(shí)間:2022-12-05 00:34
  光學(xué)文字識(shí)別(Optical Character Recognition,簡(jiǎn)稱(chēng)OCR)是計(jì)算機(jī)視覺(jué)領(lǐng)域的基礎(chǔ)課題之一。自然場(chǎng)景下的漢字識(shí)別至今仍然存在著一定的提升空間,尤其在不平衡、稀缺訓(xùn)練集上的漢字識(shí)別效果并不理想。近些年隨著深度學(xué)習(xí)的飛速發(fā)展,自然場(chǎng)景中的文字識(shí)別取得了巨大的成就。特別對(duì)于文字符號(hào)偏少的語(yǔ)種(如英文僅有26個(gè)字母),深度學(xué)習(xí)已經(jīng)能夠達(dá)到甚至超越人眼的識(shí)別性能。然而對(duì)于文字符號(hào)復(fù)雜并且數(shù)量偏大的語(yǔ)種(如中文常用字就有3000多字),受樣本不均衡,訓(xùn)練樣本稀缺等因素的影響,深度學(xué)習(xí)方法仍然不能達(dá)到理想的識(shí)別性能。本文以中文漢字識(shí)別為研究對(duì)象,針對(duì)現(xiàn)有的漢字識(shí)別算法在實(shí)際應(yīng)用中所面臨的關(guān)鍵技術(shù)難題進(jìn)行了深入的研究與討論。本文的主要貢獻(xiàn)包括以下四個(gè)方面:第一,提出了基于聚焦CTC損失的非平衡漢字識(shí)別方法。深度學(xué)習(xí)模型在漢字識(shí)別任務(wù)的訓(xùn)練過(guò)程中不可避免的面臨訓(xùn)練數(shù)據(jù)不平衡的問(wèn)題,導(dǎo)致低頻文字無(wú)法得到充分的訓(xùn)練,從而影響模型的整體性能。本文提出的聚焦CTC是一種新型的序列分類(lèi)損失函數(shù),該方法能夠在不對(duì)訓(xùn)練數(shù)據(jù)做人為調(diào)整的情況下,使模型在訓(xùn)練過(guò)程中自動(dòng)地向未充分學(xué)習(xí)的樣本傾斜,有... 

【文章頁(yè)數(shù)】:117 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題背景及研究的目的和意義
    1.2 文字識(shí)別以及相關(guān)深度學(xué)習(xí)技術(shù)研究現(xiàn)狀
        1.2.1 文字識(shí)別相關(guān)研究現(xiàn)狀
        1.2.2 文字識(shí)別骨干網(wǎng)絡(luò)結(jié)構(gòu)研究現(xiàn)狀
        1.2.3 小樣本學(xué)習(xí)研究現(xiàn)狀
        1.2.4 對(duì)抗攻擊研究現(xiàn)狀
    1.3 漢字識(shí)別領(lǐng)域內(nèi)所存在的主要問(wèn)題
    1.4 本文的內(nèi)容安排
第2章 基于聚焦CTC損失的非平衡漢字識(shí)別方法
    2.1 引言
    2.2 基于聚焦CTC的非平衡漢字識(shí)別算法
        2.2.1 基于聚焦CTC的文字識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)
        2.2.2 聚焦CTC函數(shù)
    2.3 基于聚焦CTC的非平衡漢字識(shí)別的實(shí)驗(yàn)結(jié)果與分析
        2.3.1 實(shí)驗(yàn)數(shù)據(jù)描述
        2.3.2 訓(xùn)練策略以及評(píng)價(jià)標(biāo)準(zhǔn)
        2.3.3 基于聚焦CTC的非平衡漢字識(shí)別的實(shí)驗(yàn)結(jié)果
        2.3.4 基于聚焦CTC的非平衡漢字識(shí)別的實(shí)驗(yàn)分析
    2.4 本章小結(jié)
第3章 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別方法
    3.1 引言
    3.2 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別模型
        3.2.1 精簡(jiǎn)稠密網(wǎng)絡(luò)
        3.2.2 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別模型
    3.3 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別實(shí)驗(yàn)結(jié)果與分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)描述
        3.3.2 分類(lèi)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
        3.3.3 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別實(shí)驗(yàn)結(jié)果
        3.3.4 基于精簡(jiǎn)稠密網(wǎng)絡(luò)的漢字識(shí)別實(shí)驗(yàn)分析
    3.4 本章小結(jié)
第4章 基于LSTM-Reptile元學(xué)習(xí)手寫(xiě)漢字識(shí)別方法
    4.1 引言
    4.2 基于LSTM-Reptile元學(xué)習(xí)的手寫(xiě)漢字識(shí)別算法
        4.2.1 LSTM-Reptile元學(xué)習(xí)
        4.2.2 基于LSTM-Reptile元學(xué)習(xí)的手寫(xiě)漢字識(shí)別
    4.3 基于LSTM-Reptile元學(xué)習(xí)的手寫(xiě)漢字識(shí)別實(shí)驗(yàn)結(jié)果與分析
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)描述
        4.3.2 學(xué)習(xí)器模型與元學(xué)習(xí)器模型
        4.3.3 分類(lèi)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
        4.3.4 合成漢字識(shí)別數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果與分析
        4.3.5 真實(shí)漢字識(shí)別數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果與分析
    4.4 本章小結(jié)
第5章 基于提升迭代法的漢字識(shí)別抗攻擊方法
    5.1 引言
    5.2 基于提升迭代法的漢字識(shí)別抗攻擊算法
        5.2.1 對(duì)抗樣本的生成方法
        5.2.2 基于提升迭代法的對(duì)抗樣本生成方法
        5.2.3 基于提升迭代法的漢字識(shí)別模型的抗攻擊方法
    5.3 基于提升迭代法的漢字識(shí)別抗攻擊實(shí)驗(yàn)結(jié)果與分析
        5.3.1 實(shí)驗(yàn)數(shù)據(jù)與模型描述
        5.3.2 基于提升迭代法的漢字識(shí)別抗攻擊實(shí)驗(yàn)結(jié)果
        5.3.3 基于提升迭代法的漢字識(shí)別抗攻擊實(shí)驗(yàn)分析
    5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀博士學(xué)位期間發(fā)表的論文及其他成果
致謝
個(gè)人簡(jiǎn)歷


【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)在手寫(xiě)漢字識(shí)別中的應(yīng)用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊.  自動(dòng)化學(xué)報(bào). 2016(08)



本文編號(hào):3709305

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3709305.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)4f47c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com