個(gè)性化垃圾郵件過(guò)濾的擴(kuò)展研究
發(fā)布時(shí)間:2020-12-31 02:40
由于興趣、愛(ài)好的不同,不同用戶對(duì)垃圾郵件的定義可能存在巨大差異,這是一般化郵件過(guò)濾器面臨的窘境,因此實(shí)現(xiàn)個(gè)性化垃圾郵件過(guò)濾成為目前郵件過(guò)濾領(lǐng)域研究的重要課題。同時(shí),特定用戶在不同時(shí)間段,興趣點(diǎn)也會(huì)發(fā)生變化,會(huì)使其重新定義對(duì)垃圾郵件的過(guò)濾標(biāo)準(zhǔn),所以檢測(cè)用戶興趣點(diǎn)是否發(fā)生變化也是個(gè)性化過(guò)濾的關(guān)鍵任務(wù)。本文針對(duì)特定用戶郵箱的錯(cuò)濾情況,對(duì)個(gè)性化過(guò)濾技術(shù)進(jìn)行擴(kuò)展研究,重點(diǎn)關(guān)注如何在動(dòng)態(tài)環(huán)境下,結(jié)合用戶的興趣特征,降低郵件錯(cuò)濾率,并實(shí)現(xiàn)自動(dòng)修正。主要工作和創(chuàng)新點(diǎn)如下:(1)為了緩解現(xiàn)實(shí)情況下網(wǎng)絡(luò)用戶郵箱的錯(cuò)濾程度,本文提出了一種基于客戶端的個(gè)性化郵件再過(guò)濾方法。該方法基于多任務(wù)學(xué)習(xí)理論,使得收件箱和垃圾箱過(guò)濾器借鑒彼此的特征描述,“互相學(xué)習(xí),分開(kāi)過(guò)濾”,緩解類不平衡問(wèn)題。本文提出郵件數(shù)據(jù)流中的“廣義虛漂移”概念,同時(shí)設(shè)計(jì)多窗口框架,結(jié)合重要性加權(quán)的方法以達(dá)到動(dòng)態(tài)環(huán)境自適應(yīng)的效果。(2)通常情況下,相同集體(實(shí)驗(yàn)室、俱樂(lè)部或公司)環(huán)境中的用戶收到的郵件存在一定的相關(guān)性,因此本文提出在集體環(huán)境下的個(gè)性化郵件再過(guò)濾方法。當(dāng)完全個(gè)性化郵件過(guò)濾器學(xué)到的信息有限時(shí),利用相關(guān)性數(shù)據(jù),可有效增加其信息量,提高過(guò)濾...
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
垃圾郵件生命周期的三個(gè)階段一些早期的研究表明,垃圾郵件已經(jīng)占據(jù)所有郵件的80%[1]
圖 1.2 2017 年惡意垃圾郵件數(shù)量占郵件總流量比例于垃圾郵件造成的大量的經(jīng)濟(jì)損失,導(dǎo)致一些國(guó)家通過(guò)法律限制垃圾郵件的擴(kuò)散要求謹(jǐn)慎保管他們的電子郵件地址,不要回復(fù)任何垃圾郵件。但在現(xiàn)實(shí)中,垃圾各地發(fā)出,且發(fā)送者的真實(shí)信息難以追蹤,這些困難都限定了法律的實(shí)用性。除的另一種方法是使用垃圾郵件過(guò)濾器,基于對(duì)消息內(nèi)容和附加信息的分析,嘗
圖 2.1 3 種概念漂移類型時(shí)長(zhǎng)和頻率分為:突發(fā)式(abrupt)漂移、增量式(incrementa移和再現(xiàn)式(recurring)漂移四種[53]。概念漂移的四種變化模式
【參考文獻(xiàn)】:
期刊論文
[1]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
[2]基于用戶反饋的個(gè)性化垃圾郵件過(guò)濾方法[J]. 黃國(guó)偉,劉云霞,陳志. 電子設(shè)計(jì)工程. 2014(15)
[3]基于用戶興趣度的垃圾郵件在線識(shí)別新方法[J]. 王友衛(wèi),劉元寧,鳳麗洲,朱曉冬. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(07)
[4]高校誤判垃圾郵件自動(dòng)召回系統(tǒng)的研究與實(shí)現(xiàn)[J]. 林海卓,王繼龍,吳建平,楊家海,徐聰. 通信學(xué)報(bào). 2013(S2)
[5]集成學(xué)習(xí)和主動(dòng)學(xué)習(xí)相結(jié)合的個(gè)性化垃圾郵件過(guò)濾[J]. 劉伍穎,王挺. 計(jì)算機(jī)工程與科學(xué). 2011(09)
本文編號(hào):2948790
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
垃圾郵件生命周期的三個(gè)階段一些早期的研究表明,垃圾郵件已經(jīng)占據(jù)所有郵件的80%[1]
圖 1.2 2017 年惡意垃圾郵件數(shù)量占郵件總流量比例于垃圾郵件造成的大量的經(jīng)濟(jì)損失,導(dǎo)致一些國(guó)家通過(guò)法律限制垃圾郵件的擴(kuò)散要求謹(jǐn)慎保管他們的電子郵件地址,不要回復(fù)任何垃圾郵件。但在現(xiàn)實(shí)中,垃圾各地發(fā)出,且發(fā)送者的真實(shí)信息難以追蹤,這些困難都限定了法律的實(shí)用性。除的另一種方法是使用垃圾郵件過(guò)濾器,基于對(duì)消息內(nèi)容和附加信息的分析,嘗
圖 2.1 3 種概念漂移類型時(shí)長(zhǎng)和頻率分為:突發(fā)式(abrupt)漂移、增量式(incrementa移和再現(xiàn)式(recurring)漂移四種[53]。概念漂移的四種變化模式
【參考文獻(xiàn)】:
期刊論文
[1]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
[2]基于用戶反饋的個(gè)性化垃圾郵件過(guò)濾方法[J]. 黃國(guó)偉,劉云霞,陳志. 電子設(shè)計(jì)工程. 2014(15)
[3]基于用戶興趣度的垃圾郵件在線識(shí)別新方法[J]. 王友衛(wèi),劉元寧,鳳麗洲,朱曉冬. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(07)
[4]高校誤判垃圾郵件自動(dòng)召回系統(tǒng)的研究與實(shí)現(xiàn)[J]. 林海卓,王繼龍,吳建平,楊家海,徐聰. 通信學(xué)報(bào). 2013(S2)
[5]集成學(xué)習(xí)和主動(dòng)學(xué)習(xí)相結(jié)合的個(gè)性化垃圾郵件過(guò)濾[J]. 劉伍穎,王挺. 計(jì)算機(jī)工程與科學(xué). 2011(09)
本文編號(hào):2948790
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2948790.html
最近更新
教材專著