基于級聯(lián)方法的圖像型垃圾郵件過濾系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2021-07-08 00:22
近些年來,垃圾郵件制造者為了躲避基于郵件文本的傳統(tǒng)垃圾郵件過濾系統(tǒng)的攔截,將特定宣傳目的的垃圾信息嵌入到圖片中,并通過郵件的形式群發(fā)給個人和企業(yè)用戶。這類郵件是一種新型的垃圾郵件,統(tǒng)稱為圖像型垃圾郵件(Image Spam)。同文本型垃圾郵件相比,圖像型垃圾郵件通常含有大量的垃圾信息,如具有特定目的政治宣傳信息、宗教宣傳和廣告推銷信息等,這給個人和企業(yè)用戶帶來較大困擾,給正常的工作與生活帶來不利的影響。圖像型垃圾郵件的標識與過濾已經(jīng)成為了信息安全領域的研究熱點,對圖像型垃圾郵件過濾技術的研究具有重要的現(xiàn)實意義,F(xiàn)有的基于郵件文本的傳統(tǒng)垃圾郵件過濾系統(tǒng)不能有效的過濾圖像型垃圾郵件,因此需要一個系統(tǒng)去高效和準確地過濾圖像型垃圾郵件,來完善和補充現(xiàn)有的垃圾郵件過濾系統(tǒng)。本文的研究對象是圖像型垃圾郵件中的圖像,下文簡稱為垃圾圖像。本文在分析和歸納了垃圾圖像的典型特征的基礎上,設計了一個遞進式的、基于級聯(lián)方法的并帶有反饋機制的雙層過濾系統(tǒng),第一層采用基于垃圾圖像近似匹配的過濾方法,第二層采用深度學習中的卷積神經(jīng)網(wǎng)絡方法進行圖像分類,實現(xiàn)垃圾圖像的過濾。本文的主要工作如下:首先,根據(jù)垃圾圖像大多是...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
CNN的基本結構
味約?檔憬?芯?罰?コ?衾嗉?檔悖?緩蠖ㄒ寮?檔愕姆?向,最后得到圖像局部的特征點,由特征點生成對圖像尺度變換及旋轉保持不變的特征描述子。(1)構建圖像尺度空間:在數(shù)字圖像處理中,尺度空間指是計算機圖像處理模型中的一個工具,它在模型中引入了一個尺度參數(shù),隨著這個參數(shù)的連續(xù)變化,可以得到在不同尺度下的特定圖像序列。與此同時,對這些圖像序列根據(jù)尺度大小進行模糊程度變化的高斯操作,以此來模擬目標在人眼視網(wǎng)膜中的成像過程。在SIFT算法中是通過構建圖像的高斯金字塔來實現(xiàn)圖像尺度空間。高斯金字塔如圖3.2所示。尺度空間可由像素與高斯核函數(shù)的卷積得到,然后在尺度空間中,尋找極值點,通過極大值抑制,得到穩(wěn)定的極值點。圖3.2圖像高斯金字塔構造尺度空間:一幅二維圖像(,)的尺度空間(,,)可由公式3.1式表示。(,,)=(,,)(,)(3.1)其中是尺度空間參數(shù),為卷積操作,(,,)為高斯核函數(shù),定義為:(,,)=122(2+222)(3.2)利用公式3.1對圖像進行高斯平滑處理,得到一個圖像高斯金字塔,這是初步構造的尺度空間。為了找到更加穩(wěn)定的圖像關鍵點,由高斯金字塔(LaplacianofGaussian,LoG)進一步優(yōu)化并構造高斯差分金字塔(DifferenceofGaussian,DoG),公式(3.3)所示:
第三章基于近似匹配的垃圾圖像檢測過濾方法21(,,)=[(,,)(,,)](,)=(,,)(,,)(3.3)其中為閾值,由此可在構建的DoG金字塔中尋找可能的極值點。通過像素點與其點周圍8個相鄰點,以及向下相鄰尺度空間的9×2個點,總共26個點相比較來選取極大或極小值點。精確定位特征點:在高斯差金字塔中檢測得到的極值點是在離散的尺度空間里得到的,高斯差分函數(shù)確定的極值點很可能不是真正意義上的極值點,也有可能是附近的點,因此會產生邊緣效應。為了消除這種影響,SIFT算法的機制是擬合一個高次函數(shù)來尋找真正的極值點,如圖3.3所示,通過這種方式,增強了算法的穩(wěn)定性。圖3.3離散空間中的極值點與真實極值點的區(qū)別特征點方向的確定:SIFT算法是通過計算高斯差分金字塔中的到的極值點鄰域的梯度方向,該方向指定為特征點方向,使得由特征點生成的特征描述子具有尺度不變性。在DoG中檢測出的關鍵點,在其領域高斯金字塔圖的3鄰域窗口內計算梯度幅值(,)及方向(,):(,)=√[(+1,)(1,)]2+[(,+1)(,1)]2(3.4)(,)=((,+1)(,1)(+1,)(1,))(3.5)到這里,完成了極值點的檢測,考慮的因素有特征點的位置、方向和尺度。圖3.4圖像梯度和關鍵點描述
本文編號:3270664
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
CNN的基本結構
味約?檔憬?芯?罰?コ?衾嗉?檔悖?緩蠖ㄒ寮?檔愕姆?向,最后得到圖像局部的特征點,由特征點生成對圖像尺度變換及旋轉保持不變的特征描述子。(1)構建圖像尺度空間:在數(shù)字圖像處理中,尺度空間指是計算機圖像處理模型中的一個工具,它在模型中引入了一個尺度參數(shù),隨著這個參數(shù)的連續(xù)變化,可以得到在不同尺度下的特定圖像序列。與此同時,對這些圖像序列根據(jù)尺度大小進行模糊程度變化的高斯操作,以此來模擬目標在人眼視網(wǎng)膜中的成像過程。在SIFT算法中是通過構建圖像的高斯金字塔來實現(xiàn)圖像尺度空間。高斯金字塔如圖3.2所示。尺度空間可由像素與高斯核函數(shù)的卷積得到,然后在尺度空間中,尋找極值點,通過極大值抑制,得到穩(wěn)定的極值點。圖3.2圖像高斯金字塔構造尺度空間:一幅二維圖像(,)的尺度空間(,,)可由公式3.1式表示。(,,)=(,,)(,)(3.1)其中是尺度空間參數(shù),為卷積操作,(,,)為高斯核函數(shù),定義為:(,,)=122(2+222)(3.2)利用公式3.1對圖像進行高斯平滑處理,得到一個圖像高斯金字塔,這是初步構造的尺度空間。為了找到更加穩(wěn)定的圖像關鍵點,由高斯金字塔(LaplacianofGaussian,LoG)進一步優(yōu)化并構造高斯差分金字塔(DifferenceofGaussian,DoG),公式(3.3)所示:
第三章基于近似匹配的垃圾圖像檢測過濾方法21(,,)=[(,,)(,,)](,)=(,,)(,,)(3.3)其中為閾值,由此可在構建的DoG金字塔中尋找可能的極值點。通過像素點與其點周圍8個相鄰點,以及向下相鄰尺度空間的9×2個點,總共26個點相比較來選取極大或極小值點。精確定位特征點:在高斯差金字塔中檢測得到的極值點是在離散的尺度空間里得到的,高斯差分函數(shù)確定的極值點很可能不是真正意義上的極值點,也有可能是附近的點,因此會產生邊緣效應。為了消除這種影響,SIFT算法的機制是擬合一個高次函數(shù)來尋找真正的極值點,如圖3.3所示,通過這種方式,增強了算法的穩(wěn)定性。圖3.3離散空間中的極值點與真實極值點的區(qū)別特征點方向的確定:SIFT算法是通過計算高斯差分金字塔中的到的極值點鄰域的梯度方向,該方向指定為特征點方向,使得由特征點生成的特征描述子具有尺度不變性。在DoG中檢測出的關鍵點,在其領域高斯金字塔圖的3鄰域窗口內計算梯度幅值(,)及方向(,):(,)=√[(+1,)(1,)]2+[(,+1)(,1)]2(3.4)(,)=((,+1)(,1)(+1,)(1,))(3.5)到這里,完成了極值點的檢測,考慮的因素有特征點的位置、方向和尺度。圖3.4圖像梯度和關鍵點描述
本文編號:3270664
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3270664.html
最近更新
教材專著