中文微博客的垃圾用戶檢測(cè)
本文關(guān)鍵詞:中文微博客的垃圾用戶檢測(cè)
【摘要】:微博客的出現(xiàn)改變了我們獲取信息的方式。然而,大量垃圾消息卻此起彼伏,危害著微博的健康發(fā)展。該文研究了中文微博客中的垃圾用戶檢測(cè)問題。我們首先對(duì)垃圾用戶的行為進(jìn)行了分析,提出了基于用戶圖、用戶資料、微博內(nèi)容的3大類7種檢測(cè)特征。隨后,討論了基于SVM分類器的垃圾用戶檢測(cè)方法。最后,我們對(duì)采集的微博數(shù)據(jù)進(jìn)行了標(biāo)注,并評(píng)價(jià)了分類器的效果。實(shí)驗(yàn)表明:分類器具有較高的準(zhǔn)確率和召回率,該文提出的特征具有較好的區(qū)分度。
【作者單位】: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所;中國(guó)科學(xué)院大學(xué);國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心;
【關(guān)鍵詞】: 微博客 垃圾用戶 檢測(cè)
【基金】:國(guó)家自然科學(xué)基金(61100083) 國(guó)家863計(jì)劃基金(2012AA011003) 國(guó)家242專項(xiàng)(2011F45,2011F65)
【分類號(hào)】:TP393.092
【正文快照】: 1引言微博客(簡(jiǎn)稱微博)是一種基于用戶關(guān)系的信息分享、傳播與獲取平臺(tái)。近幾年,中文微博服務(wù)發(fā)展迅猛,截止2012年5月,新浪微博的注冊(cè)用戶已達(dá)3億、每日發(fā)布的消息量超過1億條[1];騰訊微博的注冊(cè)用戶數(shù)也已超過4億。微博的出現(xiàn)不僅改變了信息的傳播方式,也改善了我們的生活質(zhì)
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張學(xué)工;關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J];自動(dòng)化學(xué)報(bào);2000年01期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王東霞;張楠;路曉麗;;基于育種算法的SVM參數(shù)優(yōu)化[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期
2 陶秀鳳,唐詩(shī)忠,周鳴爭(zhēng);基于支持向量機(jī)的軟測(cè)量模型及應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年02期
3 程偉;張燕平;趙姝;;支持向量機(jī)在糧食產(chǎn)量預(yù)測(cè)中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2009年08期
4 武素華;;基于最小二乘支持向量機(jī)的土壤含水量檢測(cè)的研究與分析[J];安徽農(nóng)業(yè)科學(xué);2009年09期
5 陳念;沈佐民;;基于化學(xué)成分檢測(cè)和SVM分類的茶葉品質(zhì)鑒定[J];安徽農(nóng)業(yè)科學(xué);2010年15期
6 黃遠(yuǎn)順;;矯直機(jī)的自動(dòng)故障預(yù)報(bào)技術(shù)[J];安徽冶金;2012年01期
7 林春麗;齊欣;王克成;;SVM-KNN分類器在異常行為檢測(cè)中的應(yīng)用[J];遼寧科技大學(xué)學(xué)報(bào);2010年05期
8 王亮;胡靜濤;;基于LS-SVM的光刻過程R2R預(yù)測(cè)控制方法[J];半導(dǎo)體技術(shù);2012年06期
9 梁萬路;;代價(jià)敏感支持向量機(jī)的投影次梯度求解方法[J];兵工自動(dòng)化;2011年04期
10 高學(xué)金;王普;孫崇正;易建強(qiáng);張亞庭;張會(huì)清;;一種建立發(fā)酵過程模型的新方法[J];北京工業(yè)大學(xué)學(xué)報(bào);2006年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 宋海鷹;桂衛(wèi)華;陽(yáng)春華;;基于核偏最小二乘的簡(jiǎn)約最小二乘支持向量機(jī)及其應(yīng)用研究[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
2 顧小軍;楊世錫;錢蘇翔;;基于支持向量機(jī)的旋轉(zhuǎn)機(jī)械多類故障識(shí)別研究[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
3 呂蓬;柳亦兵;馬強(qiáng);魏于凡;;支持向量機(jī)在齒輪智能故障診斷中的應(yīng)用研究[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
4 姜明輝;袁緒川;;基于GA優(yōu)化的個(gè)人信用評(píng)估SVM模型[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
5 韓露;余正濤;鄧錦輝;章程;毛存禮;郭劍毅;;領(lǐng)域知識(shí)關(guān)系對(duì)領(lǐng)域文本分類的影響[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
6 吳靜珠;劉翠玲;孫曉容;;支持向量機(jī)在近紅外光譜檢測(cè)技術(shù)中的應(yīng)用研究[A];第二十九屆中國(guó)控制會(huì)議論文集[C];2010年
7 尹鐘;張建華;;基于支持向量機(jī)方法的過程操作員功能狀態(tài)分類[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)A卷[C];2011年
8 楊坤;紀(jì)志成;;基于峰值識(shí)別的改進(jìn)SVM用電需求預(yù)測(cè)[A];中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)B卷[C];2011年
9 晉朝勃;胡剛強(qiáng);史廣智;李玉陽(yáng);;一種采用支持向量機(jī)的水中目標(biāo)識(shí)別方法[A];中國(guó)聲學(xué)學(xué)會(huì)水聲學(xué)分會(huì)2011年全國(guó)水聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2011年
10 郭瑋;李智勇;朱晟;孫慧;;支持向量機(jī)在變壓器油溶解氣體檢測(cè)中的應(yīng)用[A];第一屆電力安全論壇優(yōu)秀論文集[C];2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 母麗華;煤礦安全預(yù)警系統(tǒng)的方法研究[D];哈爾濱工程大學(xué);2010年
2 朱廣平;混響干擾中的信號(hào)檢測(cè)技術(shù)研究[D];哈爾濱工程大學(xué);2009年
3 孔凡芝;引線鍵合視覺檢測(cè)關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2009年
4 鄭大騰;柔性坐標(biāo)測(cè)量機(jī)空間誤差模型及最佳測(cè)量區(qū)研究[D];合肥工業(yè)大學(xué);2010年
5 王曉明;基于統(tǒng)計(jì)學(xué)習(xí)的模式識(shí)別幾個(gè)問題及其應(yīng)用研究[D];江南大學(xué);2010年
6 李先鋒;基于特征優(yōu)化和多特征融合的雜草識(shí)別方法研究[D];江蘇大學(xué);2010年
7 劉衛(wèi)紅;垃圾郵件檢測(cè)與過濾關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2010年
8 汪春梅;癲癇腦電信號(hào)特征提取與自動(dòng)檢測(cè)方法研究[D];華東理工大學(xué);2011年
9 張目;高技術(shù)企業(yè)信用風(fēng)險(xiǎn)影響因素及評(píng)價(jià)方法研究[D];電子科技大學(xué);2010年
10 向國(guó)齊;支持向量回歸機(jī)代理模型設(shè)計(jì)優(yōu)化及應(yīng)用研究[D];電子科技大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 展慧;基于多源信息融合技術(shù)的板栗分級(jí)檢測(cè)方法研究[D];華中農(nóng)業(yè)大學(xué);2010年
2 杜二玲;擬概率空間上等均值噪聲下統(tǒng)計(jì)學(xué)習(xí)理論的理論基礎(chǔ)[D];河北大學(xué);2007年
3 李金華;基于SVM的多類文本分類研究[D];山東科技大學(xué);2010年
4 安文娟;Fisher和支持向量綜合分類器[D];遼寧師范大學(xué);2010年
5 姜成玉;基于支持向量機(jī)的時(shí)間序列預(yù)測(cè)[D];遼寧師范大學(xué);2010年
6 姜念;區(qū)間自適應(yīng)粒子群算法研究及其應(yīng)用[D];鄭州大學(xué);2010年
7 李朋勇;基于全矢高階譜的故障診斷方法及其應(yīng)用研究[D];鄭州大學(xué);2010年
8 辛保兵;既有預(yù)應(yīng)力混凝土梁橋剩余承載力評(píng)估方法研究[D];鄭州大學(xué);2010年
9 王巧立;微生物發(fā)酵過程的建模與優(yōu)化控制研究[D];鄭州大學(xué);2010年
10 劉松;基于OCSVM和主動(dòng)學(xué)習(xí)的DDOS攻擊分布式檢測(cè)系統(tǒng)[D];鄭州大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 盧增祥,李衍達(dá);交互支持向量機(jī)學(xué)習(xí)算法及其應(yīng)用[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年07期
【相似文獻(xiàn)】
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 彭蔚U,
本文編號(hào):970273
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/970273.html