基于用戶興趣集的在線垃圾郵件快速識(shí)別新方法
本文關(guān)鍵詞:基于用戶興趣集的在線垃圾郵件快速識(shí)別新方法
更多相關(guān)文章: 垃圾郵件 用戶興趣集 支持向量機(jī) 主動(dòng)學(xué)習(xí) 在線應(yīng)用
【摘要】:為在不顯著降低垃圾郵件識(shí)別精度的同時(shí)有效提高郵件識(shí)別速度,提出了一種在線垃圾郵件快速識(shí)別新方法.首先引入用戶正、負(fù)興趣集的概念,結(jié)合用戶興趣集及支持向量機(jī)對(duì)郵件進(jìn)行分類;然后根據(jù)主動(dòng)學(xué)習(xí)理論,結(jié)合訓(xùn)練集樣本密度及改進(jìn)角度差異方法尋找分類最不確定的樣本并推薦給用戶進(jìn)行類別標(biāo)注;最后將標(biāo)注后樣本及分類最確定性樣本加入訓(xùn)練集,并使用樣本價(jià)值評(píng)價(jià)新函數(shù)淘汰冗余樣本以生成新的訓(xùn)練集.實(shí)驗(yàn)表明,本文方法的用戶標(biāo)注負(fù)擔(dān)小,垃圾郵件識(shí)別精度高、速度快,具有較高的在線應(yīng)用價(jià)值.
【作者單位】: 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;
【關(guān)鍵詞】: 垃圾郵件 用戶興趣集 支持向量機(jī) 主動(dòng)學(xué)習(xí) 在線應(yīng)用
【基金】:國(guó)家科技成果轉(zhuǎn)化項(xiàng)目(財(cái)建[2011]329,財(cái)建[2012]258)
【分類號(hào)】:TP391.4;TP393.098
【正文快照】: 1弓丨會(huì)■ port Vector Machine,SVM)的增量學(xué)習(xí)方法[4]·該方法將m 規(guī)模較大的訓(xùn)練集等分成若干子集,通過(guò)將每個(gè)子集加在線垃圾郵件識(shí)別可以被看作是一種典型的文本入到先前子集對(duì)應(yīng)的支持向量集中實(shí)現(xiàn)SVM增量學(xué)分類問(wèn)題[1]·不同于傳統(tǒng)文本分類,在線垃圾郵件識(shí)別習(xí).該方法驗(yàn)
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 丁文軍;薛安榮;;基于SVM的Web文本快速增量分類算法[J];計(jì)算機(jī)應(yīng)用研究;2012年04期
2 陳榮;曹永鋒;孫洪;;基于主動(dòng)學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的多類圖像分類[J];自動(dòng)化學(xué)報(bào);2011年08期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;A new method of mesh simplification for 3-Dimension terrain using Laplace operator[J];Computer Aided Drafting,Design and Manufacturing;2012年01期
2 徐冉冉;李文斌;李朝鋒;;支持向量機(jī)在遙感圖像分類中的應(yīng)用研究綜述[J];電腦知識(shí)與技術(shù);2012年18期
3 黃揚(yáng)帆;張慧敏;徐子航;曹鵬程;;超球體支持向量機(jī)的不完全二叉樹多類分類算法[J];重慶大學(xué)學(xué)報(bào);2012年06期
4 張雁;吳保國(guó);王冬;;遙感影像分類方法研究動(dòng)態(tài)[J];安徽農(nóng)業(yè)科學(xué);2012年28期
5 Yan ZHANG;Baoguo WU;Dong WANG;;Research Dynamics of the Classification Methods of Remote Sensing Images[J];Asian Agricultural Research;2013年03期
6 陳潔萍;甘泉;張慧;;一種基于最優(yōu)路徑搜索的圖像分類方法[J];電視技術(shù);2014年23期
7 葉巍;龔建華;郭娜;路梅;趙向軍;;基于流形結(jié)構(gòu)的圖像地理信息標(biāo)注方法[J];地理與地理信息科學(xué);2015年03期
8 陳孝禮;劉培玉;;應(yīng)用于垃圾郵件過(guò)濾的詞序列核[J];計(jì)算機(jī)應(yīng)用;2011年03期
9 張建朋;陳福才;;基于仿射聚類的主動(dòng)SVM多類分類方法[J];計(jì)算機(jī)應(yīng)用研究;2012年09期
10 曹健;李海生;蔡強(qiáng);郭世龍;;圖像目標(biāo)的特征提取技術(shù)研究[J];計(jì)算機(jī)仿真;2013年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條
1 曹健;陳紅倩;毛典輝;李海生;蔡強(qiáng);;基于局部特征的圖像目標(biāo)識(shí)別問(wèn)題綜述[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 權(quán)偉;可視對(duì)象跟蹤算法研究及應(yīng)用[D];西南交通大學(xué);2013年
2 尚海昆;電力變壓器局部放電信號(hào)的特征提取與模式識(shí)別方法研究[D];華北電力大學(xué);2014年
3 張雁;基于機(jī)器學(xué)習(xí)的遙感圖像分類研究[D];北京林業(yè)大學(xué);2014年
4 吳振宇;足球機(jī)器人目標(biāo)識(shí)別及決策規(guī)劃方法研究[D];大連理工大學(xué);2014年
5 王友衛(wèi);基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究[D];吉林大學(xué);2015年
6 洪智勇;基于軟集的不確定性分析方法及應(yīng)用研究[D];西南交通大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陳孝禮;基于改進(jìn)SVM的垃圾郵件過(guò)濾系統(tǒng)研究與實(shí)現(xiàn)[D];山東師范大學(xué);2011年
2 孫吉譚;基于內(nèi)容的垃圾郵件意圖分析方法研究[D];吉林大學(xué);2011年
3 王慕妮;基于組合及統(tǒng)計(jì)的圖像型垃圾郵件檢測(cè)研究[D];南京郵電大學(xué);2012年
4 左文品;采用緩存和Laplace網(wǎng)格簡(jiǎn)化技術(shù)的三維地形可視化研究[D];吉林大學(xué);2012年
5 曹盼東;基于圖模型的半監(jiān)督SVM分類算法研究與應(yīng)用[D];哈爾濱工程大學(xué);2012年
6 李文博;基于主動(dòng)學(xué)習(xí)的本體概念關(guān)系輔助判斷技術(shù)研究[D];沈陽(yáng)航空航天大學(xué);2013年
7 胡文婷;基于半監(jiān)督的垃圾圖片過(guò)濾技術(shù)研究[D];南京郵電大學(xué);2013年
8 王瑤;結(jié)合主動(dòng)學(xué)習(xí)的半監(jiān)督分類算法優(yōu)化研究[D];大連理工大學(xué);2013年
9 史真真;個(gè)性化語(yǔ)音康復(fù)訓(xùn)練推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];青島大學(xué);2013年
10 李向林;基于主動(dòng)學(xué)習(xí)的圖像分類研究[D];西安電子科技大學(xué);2013年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 吳崇明;王曉丹;白冬嬰;張宏達(dá);;基于類邊界殼向量的快速SVM增量學(xué)習(xí)算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年23期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 蔣學(xué)鋒;;用戶興趣的結(jié)構(gòu)和個(gè)性化服務(wù)的實(shí)現(xiàn)[J];計(jì)算技術(shù)與自動(dòng)化;2005年04期
2 李鈍;曹元大;張龍飛;;用戶興趣優(yōu)化過(guò)濾方法研究[J];計(jì)算機(jī)工程;2006年20期
3 費(fèi)洪曉;戴弋;穆s,
本文編號(hào):798714
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/798714.html