基于SVM的新浪微博營銷類水帖識別研究
發(fā)布時間:2017-12-27 00:11
本文關(guān)鍵詞:基于SVM的新浪微博營銷類水帖識別研究 出處:《湘潭大學(xué)自然科學(xué)學(xué)報》2015年04期 論文類型:期刊論文
更多相關(guān)文章: 評論行為 評論特征 支持向量機 水帖識別
【摘要】:研究一種發(fā)現(xiàn)水帖的分類算法.該方法利用SimHash方法將發(fā)帖重復(fù)當(dāng)成類似網(wǎng)頁去重的問題處理,發(fā)帖內(nèi)容的重復(fù)度和其他特征,如發(fā)帖的密集型、帳號名稱的相似性,所使用的客戶端等特征將用于水帖與正常發(fā)帖的分類.該文利用新浪微博API下載多個汽車營銷賬號下的交互數(shù)據(jù)作為實驗數(shù)據(jù),并使用SVM作為分類器.實驗結(jié)果表明,該方法能夠較好地發(fā)現(xiàn)那些偽裝性非常好的水軍所發(fā)布的水帖.
[Abstract]:A study found that water post classification algorithm. The method using the SimHash method to repeat posting as similar pages to weight problems, post content repeatability and other characteristics, such as similarity, intensive post account name, the client will use such characteristics in water and normal post post classification the use of sina. Micro-blog API download multiple car marketing account under the interactive data as the experimental data, and use SVM as the classifier. The experimental results show that this method can effectively find those issued by the camouflage very good the water posts.
【作者單位】: 常州大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金項目(61272367)
【分類號】:TP393.092;TP391.1
【正文快照】: 水軍發(fā)現(xiàn)是這些年來微博研究中一個熱門課題[1].[2]提出一種用評論自身文本屬性進行虛假評論的識別.除此以外,Sun[3]還使用了用戶等特征.但是這些模型對微博營銷賬號效果不佳,因為這些水軍賬號與正常用戶在統(tǒng)計上的差別不大.高度隱蔽性導(dǎo)致從用戶角度考察變得十分困難.如果換,
本文編號:1339431
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1339431.html
最近更新
教材專著