基于卷積神經(jīng)網(wǎng)絡(luò)的驗證碼字符識別研究
發(fā)布時間:2021-10-31 00:43
基于文本的驗證碼廣泛部署于各種需要身份驗證的門戶網(wǎng)站,是互聯(lián)網(wǎng)安全機制中重要的一環(huán)。對文本驗證碼的安全性和可用性進行分析,有助于提高網(wǎng)站對抗惡意攻擊的能力,保證用戶的信息安全,維護安全的網(wǎng)絡(luò)環(huán)境。本文圍繞基于卷積神經(jīng)網(wǎng)絡(luò)對驗證碼字符進行識別的問題展開研究,著力于提高神經(jīng)網(wǎng)絡(luò)識別準(zhǔn)確度,降低實現(xiàn)結(jié)構(gòu)的復(fù)雜度。本文的工作一方面可以為文本驗證碼的設(shè)計和可用性提供建議,另一方面為使用卷積神經(jīng)網(wǎng)絡(luò)完成具有挑戰(zhàn)性的場景文本識別提供了新的研究思路。本文的主要工作如下:首先,分析了影響驗證碼字符安全機制的因素,分析其反分割與反識別的效果。研究了圖像識別領(lǐng)域的主流算法卷積神經(jīng)網(wǎng)絡(luò),對其基本理論和實現(xiàn)結(jié)構(gòu)進行分析。介紹了卷積神經(jīng)網(wǎng)絡(luò)的各個實現(xiàn)模塊,包括卷積操作、池化采樣、激活函數(shù)和正則化方法,重點對卷積層中的激活函數(shù)的適用范圍和使用條件進行分析。對經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型進行仿真,展示了CNN、ResNet和Xception網(wǎng)絡(luò)對驗證碼字符的識別性能。其次,在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,結(jié)合自歸一化神經(jīng)網(wǎng)絡(luò)中的縮放指數(shù)型線性單元,引進自歸一化屬性,提出一種自標(biāo)準(zhǔn)化卷積神經(jīng)網(wǎng)絡(luò)。該歸一化效果可以保證多層級訓(xùn)練的魯棒...
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:103 頁
【學(xué)位級別】:碩士
【部分圖文】:
鐵路12306圖像驗證碼12306網(wǎng)站的圖像驗證碼如圖1.1所示,驗證碼是一張整體的圖片,包括文字提示
第一章緒論3reCAPTCHA是Google提供的一種用于身份驗證的基于圖像的驗證碼,用戶需要按照文字提示,對相應(yīng)的圖片做出操作,該機制通過這一互動環(huán)節(jié)預(yù)測用戶的行為,返回用戶的流量分?jǐn)?shù),作為區(qū)分人類與計算機程序的依據(jù)。這類圖像驗證碼需要強大的算法保證評判的正確性,同時要保證圖片庫的容量來對抗惡意程序的暴力破解。圖1.2GooglereCAPTCHA基于圖像的驗證碼機制很難實現(xiàn)自動生成,并且需要完成標(biāo)簽和圖像的匹配,其生成機制相比基于文本的驗證碼更加復(fù)雜,因此其使用范圍受到了限制[8]。同時,尋找提高驗證碼機制安全性與保證用戶體驗之間的平衡是圖像驗證碼設(shè)計者需要深入研究的課題。3.其他驗證碼機制除上述兩類驗證碼,其他類型的驗證碼也存在于需要身份驗證的場景,如基于語音的驗證碼機制,基于視頻的驗證碼機制,互動驗證碼機制等;谡Z音的驗證碼通常是服務(wù)于有視力障礙的人群,該類驗證碼將有效信息與噪聲合成在一段語音中,用戶需要反饋其獲得的語音信息[9]。這種驗證方式經(jīng)常被各大運營商選用,用于確定用戶身份,完成服務(wù)評價和個人信息安全維護。語音驗證碼的識別需要將語音信號處理相關(guān)知識,結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對語音的時域或頻域特征進行提齲目前針對非連續(xù)的語音驗證碼,已經(jīng)可以使用兩相法完成識別[10]。語音驗證碼需要提前錄制和大量的語料庫,同時由于受到通信質(zhì)量和通話環(huán)境的限制,語音驗證碼可用性不高[11];谝曨l的驗證碼,是將字母和數(shù)字等字符以動態(tài)的形式嵌入到視頻格式中。與基于文本的驗證碼類似,基于視頻的驗證碼會對字符進行旋轉(zhuǎn)、扭曲、加入噪線以及復(fù)雜背景等,增加計算機程序識別的難度[12]。由于基于視頻的驗證碼字符的有效信息并不會在同一幀共存,提取驗證碼中的有效信息變得更加
第二章文本驗證碼數(shù)據(jù)集簡介及卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%結(jié)合以上關(guān)于文本驗證碼識別的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四種驗證碼不再安全,識別Baidu、Taobo、PayPal和eBay等驗證碼的技術(shù)相對成熟。本文選擇新浪(2017)為代表的CCT驗證碼和騰訊的空心驗證碼作為研究對象,來補充該領(lǐng)域?qū)CT驗證碼和空心驗證碼的研究。另一方面,當(dāng)前方法中使用的神經(jīng)網(wǎng)絡(luò)多基于早期的LeNet-5進行改進,卷積神經(jīng)網(wǎng)絡(luò)在近幾年的發(fā)展過程中已經(jīng)出現(xiàn)了眾多適用于不同目標(biāo)的網(wǎng)絡(luò)模型,研究基于卷積神經(jīng)網(wǎng)絡(luò)識別驗證碼字符的方法具有重要的理論意義和研究價值。本文選擇空心文本驗證碼和字符粘連文本驗證碼作為各類卷積神經(jīng)網(wǎng)絡(luò)處理的對象,用以對比不同卷積神經(jīng)網(wǎng)絡(luò)之間的識別性能。需要說明的是,本文使用的空心驗證碼為騰訊公司公開的數(shù)據(jù)集,CCT的驗證碼來自開源的驗證碼庫captcha。兩種數(shù)據(jù)集的驗證碼實例如圖2.1所示。圖2.1顯示CCT驗證碼的主要防御機制是使用字符粘連重疊以及遮擋線,騰訊驗證碼采用了復(fù)雜的背景,兩種驗證碼都將不同大小的字符進行旋轉(zhuǎn)以增加識別難度。圖2.1本文使用的兩種驗證碼數(shù)據(jù)集
本文編號:3467719
【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:103 頁
【學(xué)位級別】:碩士
【部分圖文】:
鐵路12306圖像驗證碼12306網(wǎng)站的圖像驗證碼如圖1.1所示,驗證碼是一張整體的圖片,包括文字提示
第一章緒論3reCAPTCHA是Google提供的一種用于身份驗證的基于圖像的驗證碼,用戶需要按照文字提示,對相應(yīng)的圖片做出操作,該機制通過這一互動環(huán)節(jié)預(yù)測用戶的行為,返回用戶的流量分?jǐn)?shù),作為區(qū)分人類與計算機程序的依據(jù)。這類圖像驗證碼需要強大的算法保證評判的正確性,同時要保證圖片庫的容量來對抗惡意程序的暴力破解。圖1.2GooglereCAPTCHA基于圖像的驗證碼機制很難實現(xiàn)自動生成,并且需要完成標(biāo)簽和圖像的匹配,其生成機制相比基于文本的驗證碼更加復(fù)雜,因此其使用范圍受到了限制[8]。同時,尋找提高驗證碼機制安全性與保證用戶體驗之間的平衡是圖像驗證碼設(shè)計者需要深入研究的課題。3.其他驗證碼機制除上述兩類驗證碼,其他類型的驗證碼也存在于需要身份驗證的場景,如基于語音的驗證碼機制,基于視頻的驗證碼機制,互動驗證碼機制等;谡Z音的驗證碼通常是服務(wù)于有視力障礙的人群,該類驗證碼將有效信息與噪聲合成在一段語音中,用戶需要反饋其獲得的語音信息[9]。這種驗證方式經(jīng)常被各大運營商選用,用于確定用戶身份,完成服務(wù)評價和個人信息安全維護。語音驗證碼的識別需要將語音信號處理相關(guān)知識,結(jié)合神經(jīng)網(wǎng)絡(luò)算法,對語音的時域或頻域特征進行提齲目前針對非連續(xù)的語音驗證碼,已經(jīng)可以使用兩相法完成識別[10]。語音驗證碼需要提前錄制和大量的語料庫,同時由于受到通信質(zhì)量和通話環(huán)境的限制,語音驗證碼可用性不高[11];谝曨l的驗證碼,是將字母和數(shù)字等字符以動態(tài)的形式嵌入到視頻格式中。與基于文本的驗證碼類似,基于視頻的驗證碼會對字符進行旋轉(zhuǎn)、扭曲、加入噪線以及復(fù)雜背景等,增加計算機程序識別的難度[12]。由于基于視頻的驗證碼字符的有效信息并不會在同一幀共存,提取驗證碼中的有效信息變得更加
第二章文本驗證碼數(shù)據(jù)集簡介及卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)15Microsoft’s(single-layerscheme)50.9%Microsoft’s(two-layerscheme)65.8%Sina(2017)75.0%Weibo51.2%Yandex56.0%PayPal67.4%Apple47.3%結(jié)合以上關(guān)于文本驗證碼識別的最新研究成果,reCAPTCHA、BotDetect、PayPal和Ya-hoo四種驗證碼不再安全,識別Baidu、Taobo、PayPal和eBay等驗證碼的技術(shù)相對成熟。本文選擇新浪(2017)為代表的CCT驗證碼和騰訊的空心驗證碼作為研究對象,來補充該領(lǐng)域?qū)CT驗證碼和空心驗證碼的研究。另一方面,當(dāng)前方法中使用的神經(jīng)網(wǎng)絡(luò)多基于早期的LeNet-5進行改進,卷積神經(jīng)網(wǎng)絡(luò)在近幾年的發(fā)展過程中已經(jīng)出現(xiàn)了眾多適用于不同目標(biāo)的網(wǎng)絡(luò)模型,研究基于卷積神經(jīng)網(wǎng)絡(luò)識別驗證碼字符的方法具有重要的理論意義和研究價值。本文選擇空心文本驗證碼和字符粘連文本驗證碼作為各類卷積神經(jīng)網(wǎng)絡(luò)處理的對象,用以對比不同卷積神經(jīng)網(wǎng)絡(luò)之間的識別性能。需要說明的是,本文使用的空心驗證碼為騰訊公司公開的數(shù)據(jù)集,CCT的驗證碼來自開源的驗證碼庫captcha。兩種數(shù)據(jù)集的驗證碼實例如圖2.1所示。圖2.1顯示CCT驗證碼的主要防御機制是使用字符粘連重疊以及遮擋線,騰訊驗證碼采用了復(fù)雜的背景,兩種驗證碼都將不同大小的字符進行旋轉(zhuǎn)以增加識別難度。圖2.1本文使用的兩種驗證碼數(shù)據(jù)集
本文編號:3467719
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3467719.html
最近更新
教材專著