基于隱私度的郵件分類方法研究
發(fā)布時間:2021-06-21 15:43
隨著信息技術的普及,以及計算機和手機等智能設備的高速發(fā)展,電子郵件在生活和工作得到了越來越廣泛的應用,它可以擺脫傳統(tǒng)紙張書寫的束縛,具有更加高效的傳輸效率,便于留存且不會輕易丟失。電子郵件帶來便利的同時也產生了一些弊端,如目前整體的郵件安全形勢就不容樂觀,郵件數(shù)據(jù)泄露現(xiàn)象屢見不鮮,這些數(shù)據(jù)中包含大量隱私信息,對社會、企業(yè),尤其是個人隱私安全會造成非常嚴重的影響,所以需要從復雜繁多的電子郵件中將含有隱私信息的郵件識別出來。目前關于隱私信息識別檢測研究較少,常用的方法不能非常準確的識別出隱私信息。為此本文基于詞向量和遷移學習,提出隱私郵件分類方法,具體研究工作及貢獻包括:(1)針對隱私郵件文本特點,為防止生成的詞向量稀疏和考慮上下文對單詞的影響,選擇分布式表示詞向量的方式來得到詞向量,針對詞向量沒有考慮文本的權重信息,加入TF-IDF權重,有效增強了郵件文本詞向量的特征表示,使詞向量更易于郵件分類;(2)從隱私郵件泄露對用戶危害程度的角度出發(fā),對隱私郵件進行分級。為解決沒有大型隱私郵件數(shù)據(jù)集的問題,使用遷移學習進行隱私郵件分類,通過對卷積神經網(wǎng)絡算法和門控制單元算法進行郵件分類的實驗對比,...
【文章來源】:中北大學山西省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
SVM超平面示意圖
CNN網(wǎng)絡結構
RNN結構
【參考文獻】:
期刊論文
[1]個人信息安全的分級分類保護再探究[J]. 商曉陽. 現(xiàn)代信息科技. 2019(18)
[2]遷移學習研究和算法綜述[J]. 劉鑫鵬,欒悉道,謝毓湘,黃明哲. 長沙大學學報. 2018(05)
[3]基于多因素的郵箱安全檢測模型[J]. 李揚,方勇,黃誠,劉亮. 網(wǎng)絡空間安全. 2018(06)
[4]命名實體識別研究綜述[J]. 劉瀏,王東波. 情報學報. 2018(03)
[5]基于詞向量特征的文本分類模型研究[J]. 張敬誼,張亞紅,李靜. 信息技術與標準化. 2017(05)
[6]深度學習的發(fā)展與應用[J]. 邱曉康. 科技展望. 2016(33)
[7]樸素貝葉斯算法的改進與應用[J]. 趙文濤,孟令軍,趙好好,王春春. 測控技術. 2016(02)
[8]基于類決策樹分類的特征層融合識別算法[J]. 尚朝軒,王品,韓壯志,彭剛. 控制與決策. 2016(06)
[9]中文分詞模型的領域適應性方法[J]. 韓冬煦,常寶寶. 計算機學報. 2015(02)
[10]中文分詞與詞性標注研究[J]. 梁喜濤,顧磊. 計算機技術與發(fā)展. 2015(02)
碩士論文
[1]基于循環(huán)神經網(wǎng)絡模型的文本分類[D]. 龔千健.華中科技大學 2016
[2]大數(shù)據(jù)時代電子郵件中的隱私權保護[D]. 劉少陽.北京郵電大學 2016
[3]基于統(tǒng)計學習的中文分詞方法的研究[D]. 王威.東北大學 2015
[4]基于卷積神經網(wǎng)絡的句子分類算法[D]. 林榮華.浙江大學 2015
[5]統(tǒng)計與規(guī)則相結合的中文分詞模型設計與實現(xiàn)[D]. 賀歡.西南交通大學 2013
[6]基于統(tǒng)計學習的中文分詞改進及其在面向應用分詞中的應用[D]. 巫黃旭.浙江大學 2012
[7]基于粗糙集和貝葉斯算法的郵件過濾系統(tǒng)的研究與應用[D]. 史晶.電子科技大學 2011
[8]基于邏輯回歸模型的垃圾郵件過濾系統(tǒng)的研究[D]. 安波.哈爾濱工程大學 2009
本文編號:3240945
【文章來源】:中北大學山西省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
SVM超平面示意圖
CNN網(wǎng)絡結構
RNN結構
【參考文獻】:
期刊論文
[1]個人信息安全的分級分類保護再探究[J]. 商曉陽. 現(xiàn)代信息科技. 2019(18)
[2]遷移學習研究和算法綜述[J]. 劉鑫鵬,欒悉道,謝毓湘,黃明哲. 長沙大學學報. 2018(05)
[3]基于多因素的郵箱安全檢測模型[J]. 李揚,方勇,黃誠,劉亮. 網(wǎng)絡空間安全. 2018(06)
[4]命名實體識別研究綜述[J]. 劉瀏,王東波. 情報學報. 2018(03)
[5]基于詞向量特征的文本分類模型研究[J]. 張敬誼,張亞紅,李靜. 信息技術與標準化. 2017(05)
[6]深度學習的發(fā)展與應用[J]. 邱曉康. 科技展望. 2016(33)
[7]樸素貝葉斯算法的改進與應用[J]. 趙文濤,孟令軍,趙好好,王春春. 測控技術. 2016(02)
[8]基于類決策樹分類的特征層融合識別算法[J]. 尚朝軒,王品,韓壯志,彭剛. 控制與決策. 2016(06)
[9]中文分詞模型的領域適應性方法[J]. 韓冬煦,常寶寶. 計算機學報. 2015(02)
[10]中文分詞與詞性標注研究[J]. 梁喜濤,顧磊. 計算機技術與發(fā)展. 2015(02)
碩士論文
[1]基于循環(huán)神經網(wǎng)絡模型的文本分類[D]. 龔千健.華中科技大學 2016
[2]大數(shù)據(jù)時代電子郵件中的隱私權保護[D]. 劉少陽.北京郵電大學 2016
[3]基于統(tǒng)計學習的中文分詞方法的研究[D]. 王威.東北大學 2015
[4]基于卷積神經網(wǎng)絡的句子分類算法[D]. 林榮華.浙江大學 2015
[5]統(tǒng)計與規(guī)則相結合的中文分詞模型設計與實現(xiàn)[D]. 賀歡.西南交通大學 2013
[6]基于統(tǒng)計學習的中文分詞改進及其在面向應用分詞中的應用[D]. 巫黃旭.浙江大學 2012
[7]基于粗糙集和貝葉斯算法的郵件過濾系統(tǒng)的研究與應用[D]. 史晶.電子科技大學 2011
[8]基于邏輯回歸模型的垃圾郵件過濾系統(tǒng)的研究[D]. 安波.哈爾濱工程大學 2009
本文編號:3240945
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3240945.html
最近更新
教材專著