代價(jià)敏感多主題學(xué)習(xí)的郵件過濾算法
本文關(guān)鍵詞:代價(jià)敏感多主題學(xué)習(xí)的郵件過濾算法
更多相關(guān)文章: 潛在狄利克雷分布 支持向量機(jī) 垃圾郵件過濾 文本分類 多示例學(xué)習(xí)
【摘要】:針對(duì)傳統(tǒng)郵件分類模型中較少對(duì)郵件主題進(jìn)行描述和分析的問題,提出一種代價(jià)敏感多主題學(xué)習(xí)的郵件分類算法,用以實(shí)現(xiàn)垃圾郵件過濾.首先,基于LDA(潛在狄利克雷分布)對(duì)郵件的多個(gè)主題進(jìn)行提取,對(duì)郵件語義進(jìn)行描述;其次,利用CS-SVM(代價(jià)敏感支持向量機(jī))對(duì)郵件進(jìn)行代價(jià)敏感學(xué)習(xí),實(shí)現(xiàn)對(duì)不同類別郵件的懲罰;最后,結(jié)合MI-SVM(多示例支持向量機(jī))進(jìn)行代價(jià)敏感的多主題學(xué)習(xí),實(shí)現(xiàn)郵件分類.實(shí)驗(yàn)采用四組ling-spam處理數(shù)據(jù)集.實(shí)驗(yàn)結(jié)果證明:該分類算法較比傳統(tǒng)郵件分類算法,可以取得更高的準(zhǔn)確性、特異性與敏感性.
【作者單位】: 遼寧大學(xué)信息化中心;沈陽建筑大學(xué)信息網(wǎng)絡(luò)中心;
【關(guān)鍵詞】: 潛在狄利克雷分布 支持向量機(jī) 垃圾郵件過濾 文本分類 多示例學(xué)習(xí)
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61502092)
【分類號(hào)】:TP393.098
【正文快照】: 不法組織未經(jīng)許可強(qiáng)行向用戶發(fā)送電子郵件,其中承載了大量的商業(yè)廣告、詐騙或色情信息,這些垃圾郵件嚴(yán)重干擾人們的日常工作和生活,影響人的身心健康.郵件過濾技術(shù)通過對(duì)已有郵件樣本的學(xué)習(xí),實(shí)現(xiàn)對(duì)陌生郵件的自動(dòng)標(biāo)注,從而攔截垃圾郵件,避免損失.目前垃圾郵件過濾的主要方法有
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 楊葆紅;防范垃圾郵件的幾種措施[J];鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報(bào);2004年01期
2 Firefox;;在線狙擊垃圾郵件[J];電腦迷;2005年16期
3 LX ,阮征 ,Joycat;垃圾郵件 你真的惹惱我了!(上)[J];電腦愛好者;2005年03期
4 許偉民;羅鍵;;廈門廣電集團(tuán)垃圾郵件的防范[J];中國(guó)傳媒科技;2006年10期
5 馮秀彥;宋宏偉;楊鳳勇;;防垃圾郵件方法探討[J];石家莊職業(yè)技術(shù)學(xué)院學(xué)報(bào);2006年06期
6 高良誠(chéng);;郵件過濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];銅陵職業(yè)技術(shù)學(xué)院學(xué)報(bào);2007年01期
7 戴健;;飛馬替你收郵件[J];電腦界.應(yīng)用文萃;2000年08期
8 蔡健,黃國(guó)興,謝孟軍;基于數(shù)據(jù)挖掘方法的電子郵件過濾[J];微型電腦應(yīng)用;2001年08期
9 呢仔男孩;垃圾郵件防守戰(zhàn)[J];電腦愛好者;2001年09期
10 馮小民;徹底拒絕垃圾郵件[J];電腦愛好者;2001年16期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 張晶;姚建民;董守斌;張凌;;基于自然語言同現(xiàn)詞匯的郵件過濾[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 薛亞楠;廖聞劍;彭艷兵;;垃圾郵件行為識(shí)別研究[A];中國(guó)電子學(xué)會(huì)第十六屆信息論學(xué)術(shù)年會(huì)論文集[C];2009年
3 蒯莉;;網(wǎng)絡(luò)垃圾郵件的防范與治理[A];第十六次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2001年
4 沈衛(wèi)超;;郵件過濾器系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];中國(guó)工程物理研究院科技年報(bào)(2001)[C];2001年
5 石艷榮;孫丹寧;賀永強(qiáng);;一種基于內(nèi)容的郵件過濾模型的研究與性能分析[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
6 張尼;姜譽(yù);方濱興;郭莉;;一個(gè)基于郵件路徑地理屬性分析的垃圾郵件過濾算法[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
7 朱巧明;周志軍;李培峰;;中文郵件語料庫(kù)建設(shè)及其分類研究[A];第六屆漢語詞匯語義學(xué)研討會(huì)論文集[C];2005年
8 仇小鋒;陳鳴;賈永興;;垃圾郵件及其防范技術(shù)[A];第九屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2004年
9 張相於;陳繼東;李玉坤;孟小峰;;TEXEM:一種基于實(shí)體的郵件任務(wù)提取策略[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
10 李婧;張煥國(guó);;應(yīng)用于貝葉斯過濾器的噪音消除算法研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 曹;拒絕垃圾郵件[N];中國(guó)電腦教育報(bào);2003年
2 ;狙擊垃圾郵件[N];中國(guó)電腦教育報(bào);2004年
3 ;砍斷垃圾郵件黑手[N];計(jì)算機(jī)世界;2003年
4 本報(bào)記者 張琳;防垃圾郵件怎樣“行為識(shí)別”[N];網(wǎng)絡(luò)世界;2005年
5 新華社記者 王緬 毛磊 楊駿 何德功 潘治;垃圾郵件全球泛濫,,法律怎么辦[N];新華每日電訊;2003年
6 阮光塵邋朱元春;多層構(gòu)建郵件免疫機(jī)能[N];中國(guó)計(jì)算機(jī)報(bào);2007年
7 ;垃圾郵件不再是安全難題[N];網(wǎng)絡(luò)世界;2006年
8 ;垃圾郵件傳播追隨“熱點(diǎn)”[N];網(wǎng)絡(luò)世界;2007年
9 劉向晨;垃圾郵件防治任重道遠(yuǎn)[N];中國(guó)電腦教育報(bào);2003年
10 小新;郵箱也能自動(dòng)過濾垃圾郵件[N];中國(guó)電腦教育報(bào);2003年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 陳彬;垃圾郵件的特征選擇及檢測(cè)方法研究[D];華南理工大學(xué);2010年
2 劉震;垃圾郵件過濾理論和關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2008年
3 王友衛(wèi);基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究[D];吉林大學(xué);2015年
4 劉衛(wèi)紅;垃圾郵件檢測(cè)與過濾關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2010年
5 詹川;反垃圾郵件技術(shù)的研究[D];電子科技大學(xué);2005年
6 王會(huì)珍;文本內(nèi)容分類和主題追蹤關(guān)鍵技術(shù)研究[D];東北大學(xué);2008年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 朱凱健;基于向量空間模型的垃圾郵件過濾系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
2 卓小伍;基于改進(jìn)度量尺度和閾值確定方法的馬田系統(tǒng)及其在郵件過濾中的應(yīng)用[D];南京理工大學(xué);2015年
3 周文彬;基于鏈接挖掘的郵件網(wǎng)絡(luò)中心性研究[D];北京化工大學(xué);2015年
4 項(xiàng)學(xué)濤;基于賦權(quán)有向圖的郵件網(wǎng)絡(luò)親緣關(guān)系研究與實(shí)現(xiàn)[D];國(guó)際關(guān)系學(xué)院;2015年
5 王旭;基于用戶關(guān)系行為的垃圾郵件判別機(jī)制的研究與實(shí)現(xiàn)[D];東北大學(xué);2014年
6 趙雪梅;校園網(wǎng)環(huán)境下行為模式識(shí)別垃圾郵件技術(shù)研究[D];安徽理工大學(xué);2008年
7 王巖;基于內(nèi)容的郵件過濾技術(shù)研究[D];北方工業(yè)大學(xué);2010年
8 代偉;郵件過濾器的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2010年
9 孫吉譚;基于內(nèi)容的垃圾郵件意圖分析方法研究[D];吉林大學(xué);2011年
10 成寶國(guó);基于統(tǒng)計(jì)方法的垃圾郵件處理技術(shù)研究[D];西北大學(xué);2006年
本文編號(hào):841033
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/841033.html