網(wǎng)絡(luò)圖片敏感文字的檢測研究與實現(xiàn)
發(fā)布時間:2021-02-01 21:06
隨著互聯(lián)網(wǎng)的快速發(fā)展與應(yīng)用,網(wǎng)絡(luò)安全的風(fēng)險和威脅日益突出。一些不法分子利用音頻、文字和圖片的傳播途徑在網(wǎng)絡(luò)上進(jìn)行恐怖、淫穢、洗錢、反動、賭博等犯罪活動,嚴(yán)重影響了廣大網(wǎng)民的身心健康。目前,純文本形式的敏感信息過濾技術(shù)發(fā)展成熟,并得到了廣泛的應(yīng)用。對于其它的傳播途徑,相關(guān)的監(jiān)管手段還存在著不足。針對一些文字嵌入到圖片的傳播形式,本文結(jié)合了當(dāng)前自然場景的文本檢測與識別的新成果,提出了一種網(wǎng)絡(luò)圖片的敏感文本信息檢測方法。(1)針對網(wǎng)絡(luò)敏感文字圖片不同尺度的文字定位困難的問題,本文在Textboxes++文字定位算法的基礎(chǔ)上進(jìn)行改進(jìn),提出了DG-Textboxes++文字定位算法,該算法優(yōu)化了特征提取網(wǎng)絡(luò)并引入可形變卷積,使其感受野來適應(yīng)文字序列的變化,并對冗余的定位框進(jìn)行了優(yōu)化。該文字定位算法在ICDAR2015數(shù)據(jù)集中綜合指標(biāo)F_mean達(dá)到了69.3%,能準(zhǔn)確完成文字的定位。(2)針對網(wǎng)絡(luò)敏感文字圖片的中文識別困難的問題,本文在CRNN文字識別算法的基礎(chǔ)上進(jìn)行改進(jìn),提出了DS-RCNN文字識別算法,該算法使用了深度的密集卷積神經(jīng)網(wǎng)絡(luò)來提取文字特征,并利用空間變換網(wǎng)絡(luò)來對網(wǎng)絡(luò)圖片中的傾斜中...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
各類網(wǎng)絡(luò)上的文字圖片示例
重慶郵電大學(xué)碩士學(xué)位論文第1章緒論7了完整的網(wǎng)絡(luò)圖片的敏感信息解決方案,對圖片的定位、提取和圖片信息的壓縮進(jìn)行了研究,開發(fā)了基于文字與膚色關(guān)鍵語義的敏感影像檢測應(yīng)用系統(tǒng),并應(yīng)用到廣東移動現(xiàn)網(wǎng)系統(tǒng)中。宋曉敏[30]提出了基于貝葉斯算法的文本分類模型,該模型將詞頻-逆文檔頻率特征的權(quán)重導(dǎo)入到貝葉斯分類器中,提高了中文文本分類的準(zhǔn)確性。文獻(xiàn)[31]在深入研究和利用深度學(xué)習(xí)相關(guān)算法的基礎(chǔ)上,采用了基于FPGA與CPU的異構(gòu)架構(gòu)對含有敏感文字圖片進(jìn)行定位與識別,其方案中特征提取部分采用的是VGG-16[32]網(wǎng)絡(luò),隨著網(wǎng)絡(luò)規(guī)模和深度的提升,會產(chǎn)生過擬合并難以實現(xiàn)收斂。隨著深度學(xué)習(xí)在不同領(lǐng)域上的快速發(fā)展與應(yīng)用,一些新的算法模型用于文本的分類和文本的情感分析等方面有了更多的研究成果,這對于圖片的敏感信息文本的相關(guān)研究有著較好的啟發(fā)。趙宇蕾[33]提出了基于深度學(xué)習(xí)的中文醫(yī)療化驗單圖像的檢測模型,并針對圖像特征尺度的問題,對不同的卷積進(jìn)行有效融合,提高了檢測模型對醫(yī)療化驗單圖像的識別準(zhǔn)確率。1.2.4當(dāng)前工作研究難點通過對上述研究現(xiàn)狀的分析得知,敏感文字信息的圖片檢測存在以下幾個難點:1.圖片定位與識別的復(fù)雜性一些復(fù)雜背景的網(wǎng)絡(luò)圖片中存在文字大孝方向多變的現(xiàn)象,有的還包含了不規(guī)則文字,若傾斜角度較大會導(dǎo)致文字變形,使文字定位與識別的難度變大。比如曲形排列的文本形狀難以用一個矩形檢測框去覆蓋,無論是定位還是識別都比普通的文本行更具有挑戰(zhàn)性。如圖1.2所示,該廣告圖片中文字的大孝尺度多變且包含部分藝術(shù)字體。圖1.2典型難以定位與識別的圖片樣本
重慶郵電大學(xué)碩士學(xué)位論文第2章基于DG-Textboxes++文字定位算法14播得到的。對于多尺度文本行來說,在DVGG特征提取網(wǎng)絡(luò)最后的3層3*3可形變卷積可以減少常規(guī)卷積核引入的大量背景對特征的干擾。2.3.2多方向的目標(biāo)定位框設(shè)計SSD系列算法的默認(rèn)框defaultbox與Faster-RCNN算法中anchor機制類似,設(shè)置一個默認(rèn)框并利用卷積層來預(yù)測邊框相對于默認(rèn)框的偏移量。在Textboxes++算法中,defaultbox定義的text-box層(conv4_3,conv7,conv8_2,conv9_2,conv_10_2,conv_11_2)生成在特征圖上,通過text-box層可直接預(yù)測文本出現(xiàn)的置信度分?jǐn)?shù)和相應(yīng)的邊框的偏移量。為了適應(yīng)多角度的文本,Textboxes++在SSD和Textboxes的基礎(chǔ)上做了一些改進(jìn),其中的text-box層輸出一系列的多角度文本定位框使用{q}或者{r}集合來表示,同時輸出對應(yīng)于多角度文本定位框的最小外界水平矩形框使用集合來表示。多角度文本定位框是通過defaultbox回歸得到的,如圖2.6表示,圖中綠色虛線表示與真值groundtruth匹配的defaultbox,黃色框表示groundtruth,紅色箭頭表示回歸的方向,黑色框表示未匹配到真值的defaultbox,綠色實線框表示對應(yīng)groundtruth的最小外界水平矩形框[35]。圖2.6定位框表示的示例圖[35]假定對應(yīng)輸入特征圖上有水平的defaultbox,用0(,,,)0000b=xywh表示,其中(,)00xy表示為defaultbox的中心坐標(biāo),0w和0h分別表示為寬和高;貧w出來的多角度文本框有兩種表示方式,一種是使用四個點表示四邊形為:(,,,,,,,)qqqqqqqq0101020203030404=xyxyxyxy0q(2.6)另一種是使用四邊形的左上點、右上點和旋轉(zhuǎn)矩形的高表示為:(,,,,)rrrrr010102020=xyxyh0r(2.7)
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計的文本關(guān)鍵詞提取方法[J]. 羅燕,趙書良,李曉超,韓玉輝,丁亞飛. 計算機應(yīng)用. 2016(03)
[2]基于小波變換的圖像中維吾爾文字定位[J]. 哈力旦·A,庫爾班·買提木沙. 計算機工程. 2011(08)
博士論文
[1]面向互聯(lián)網(wǎng)的圖像敏感內(nèi)容分析系統(tǒng)的關(guān)鍵技術(shù)研究[D]. 李英.西安電子科技大學(xué) 2018
[2]基于圖像分析和深度學(xué)習(xí)的船名標(biāo)識字符檢測與識別研究[D]. 劉寶龍.浙江大學(xué) 2018
碩士論文
[1]基于改進(jìn)貝葉斯算法的中文信息分類研究[D]. 宋曉敏.北京郵電大學(xué) 2019
[2]中文醫(yī)療化驗單圖像的信息抽取與識別算法研究[D]. 趙宇蕾.北京交通大學(xué) 2019
[3]基于異構(gòu)計算的圖片敏感文字檢測系統(tǒng)[D]. 彭海.電子科技大學(xué) 2018
本文編號:3013436
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【部分圖文】:
各類網(wǎng)絡(luò)上的文字圖片示例
重慶郵電大學(xué)碩士學(xué)位論文第1章緒論7了完整的網(wǎng)絡(luò)圖片的敏感信息解決方案,對圖片的定位、提取和圖片信息的壓縮進(jìn)行了研究,開發(fā)了基于文字與膚色關(guān)鍵語義的敏感影像檢測應(yīng)用系統(tǒng),并應(yīng)用到廣東移動現(xiàn)網(wǎng)系統(tǒng)中。宋曉敏[30]提出了基于貝葉斯算法的文本分類模型,該模型將詞頻-逆文檔頻率特征的權(quán)重導(dǎo)入到貝葉斯分類器中,提高了中文文本分類的準(zhǔn)確性。文獻(xiàn)[31]在深入研究和利用深度學(xué)習(xí)相關(guān)算法的基礎(chǔ)上,采用了基于FPGA與CPU的異構(gòu)架構(gòu)對含有敏感文字圖片進(jìn)行定位與識別,其方案中特征提取部分采用的是VGG-16[32]網(wǎng)絡(luò),隨著網(wǎng)絡(luò)規(guī)模和深度的提升,會產(chǎn)生過擬合并難以實現(xiàn)收斂。隨著深度學(xué)習(xí)在不同領(lǐng)域上的快速發(fā)展與應(yīng)用,一些新的算法模型用于文本的分類和文本的情感分析等方面有了更多的研究成果,這對于圖片的敏感信息文本的相關(guān)研究有著較好的啟發(fā)。趙宇蕾[33]提出了基于深度學(xué)習(xí)的中文醫(yī)療化驗單圖像的檢測模型,并針對圖像特征尺度的問題,對不同的卷積進(jìn)行有效融合,提高了檢測模型對醫(yī)療化驗單圖像的識別準(zhǔn)確率。1.2.4當(dāng)前工作研究難點通過對上述研究現(xiàn)狀的分析得知,敏感文字信息的圖片檢測存在以下幾個難點:1.圖片定位與識別的復(fù)雜性一些復(fù)雜背景的網(wǎng)絡(luò)圖片中存在文字大孝方向多變的現(xiàn)象,有的還包含了不規(guī)則文字,若傾斜角度較大會導(dǎo)致文字變形,使文字定位與識別的難度變大。比如曲形排列的文本形狀難以用一個矩形檢測框去覆蓋,無論是定位還是識別都比普通的文本行更具有挑戰(zhàn)性。如圖1.2所示,該廣告圖片中文字的大孝尺度多變且包含部分藝術(shù)字體。圖1.2典型難以定位與識別的圖片樣本
重慶郵電大學(xué)碩士學(xué)位論文第2章基于DG-Textboxes++文字定位算法14播得到的。對于多尺度文本行來說,在DVGG特征提取網(wǎng)絡(luò)最后的3層3*3可形變卷積可以減少常規(guī)卷積核引入的大量背景對特征的干擾。2.3.2多方向的目標(biāo)定位框設(shè)計SSD系列算法的默認(rèn)框defaultbox與Faster-RCNN算法中anchor機制類似,設(shè)置一個默認(rèn)框并利用卷積層來預(yù)測邊框相對于默認(rèn)框的偏移量。在Textboxes++算法中,defaultbox定義的text-box層(conv4_3,conv7,conv8_2,conv9_2,conv_10_2,conv_11_2)生成在特征圖上,通過text-box層可直接預(yù)測文本出現(xiàn)的置信度分?jǐn)?shù)和相應(yīng)的邊框的偏移量。為了適應(yīng)多角度的文本,Textboxes++在SSD和Textboxes的基礎(chǔ)上做了一些改進(jìn),其中的text-box層輸出一系列的多角度文本定位框使用{q}或者{r}集合來表示,同時輸出對應(yīng)于多角度文本定位框的最小外界水平矩形框使用集合來表示。多角度文本定位框是通過defaultbox回歸得到的,如圖2.6表示,圖中綠色虛線表示與真值groundtruth匹配的defaultbox,黃色框表示groundtruth,紅色箭頭表示回歸的方向,黑色框表示未匹配到真值的defaultbox,綠色實線框表示對應(yīng)groundtruth的最小外界水平矩形框[35]。圖2.6定位框表示的示例圖[35]假定對應(yīng)輸入特征圖上有水平的defaultbox,用0(,,,)0000b=xywh表示,其中(,)00xy表示為defaultbox的中心坐標(biāo),0w和0h分別表示為寬和高;貧w出來的多角度文本框有兩種表示方式,一種是使用四個點表示四邊形為:(,,,,,,,)qqqqqqqq0101020203030404=xyxyxyxy0q(2.6)另一種是使用四邊形的左上點、右上點和旋轉(zhuǎn)矩形的高表示為:(,,,,)rrrrr010102020=xyxyh0r(2.7)
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計的文本關(guān)鍵詞提取方法[J]. 羅燕,趙書良,李曉超,韓玉輝,丁亞飛. 計算機應(yīng)用. 2016(03)
[2]基于小波變換的圖像中維吾爾文字定位[J]. 哈力旦·A,庫爾班·買提木沙. 計算機工程. 2011(08)
博士論文
[1]面向互聯(lián)網(wǎng)的圖像敏感內(nèi)容分析系統(tǒng)的關(guān)鍵技術(shù)研究[D]. 李英.西安電子科技大學(xué) 2018
[2]基于圖像分析和深度學(xué)習(xí)的船名標(biāo)識字符檢測與識別研究[D]. 劉寶龍.浙江大學(xué) 2018
碩士論文
[1]基于改進(jìn)貝葉斯算法的中文信息分類研究[D]. 宋曉敏.北京郵電大學(xué) 2019
[2]中文醫(yī)療化驗單圖像的信息抽取與識別算法研究[D]. 趙宇蕾.北京交通大學(xué) 2019
[3]基于異構(gòu)計算的圖片敏感文字檢測系統(tǒng)[D]. 彭海.電子科技大學(xué) 2018
本文編號:3013436
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3013436.html
最近更新
教材專著