基于深度學(xué)習(xí)的垃圾郵件過(guò)濾方法研究
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1郵件發(fā)送完整過(guò)程
圖2.1郵件發(fā)送完整過(guò)程圖中的發(fā)送方發(fā)出的一封郵件,需要經(jīng)過(guò)MUA(MailUserAgent,郵件用戶(hù)代理)。我們使用的郵件客戶(hù)端軟件(如Foxmail和OutlookExpress)屬于MUA,可以幫助用戶(hù)讀取和寫(xiě)入文件。用戶(hù)郵件完成后,MUA將郵件發(fā)送到....
圖2.2文本分類(lèi)的一般過(guò)程
圖2.2文本分類(lèi)的一般過(guò)程2.3文本預(yù)處理本小節(jié)重點(diǎn)介紹了文本的預(yù)處理方法,它主要為后面的向量化和特征提取做準(zhǔn)備,所以預(yù)處理的過(guò)程,也直接影響到后面特征提取的好壞。它主要包括去噪、分詞、去停用詞等過(guò)程。2.3.1非法字符的過(guò)濾非法字符的過(guò)濾是文本分類(lèi)中的一個(gè)重要的步驟,因....
圖2.3決策樹(shù)示例
圖2.3決策樹(shù)示例個(gè)簡(jiǎn)單的分類(lèi)決策樹(shù),通過(guò)判斷雷暴,雪,溫度指標(biāo)來(lái)判斷是否思路,包括葉子節(jié)點(diǎn)和根節(jié)點(diǎn),如圖2.3所示,是否走出相應(yīng)的決每個(gè)節(jié)點(diǎn)屬性的劃分,從雷暴開(kāi)始,接著是大雪,溫度,每個(gè)判見(jiàn)的決策樹(shù)的核心算法是ID3[27]和C4.5[28]。ID3算法劃分特征為....
圖2.4SVM分類(lèi)模型
性a里的離散值數(shù)目的增多而變大。決策樹(shù)算法比夠觀察數(shù)據(jù)的分布,但是它不穩(wěn)定,對(duì)數(shù)據(jù)較為敏而發(fā)生改變。以用于處理二分類(lèi)的有監(jiān)督問(wèn)題,后來(lái)再加入了核方用于多目標(biāo)分類(lèi)問(wèn)題上。轉(zhuǎn)化為凸二次規(guī)劃過(guò)程,通過(guò)求解基于凸二次規(guī)劃思想可歸納如下:在樣本中找到可以分離樣本類(lèi)別分區(qū)間隔最大化。支持....
本文編號(hào):3962273
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3962273.html