新浪微博反垃圾中特征選擇的重要性分析
本文關(guān)鍵詞:新浪微博反垃圾中特征選擇的重要性分析
更多相關(guān)文章: 新浪微博 特征生成 特征選擇 垃圾用戶(hù)檢測(cè)
【摘要】:微博中的垃圾用戶(hù)非常普遍,其異常行為及生產(chǎn)的垃圾信息顯著降低了用戶(hù)體驗(yàn)。為了提高識(shí)別準(zhǔn)確率,已有研究或是盡可能多地定義特征,或是不斷嘗試提出新的分類(lèi)檢測(cè)方法;那么,微博反垃圾問(wèn)題的突破點(diǎn)優(yōu)先置于尋找分類(lèi)特征還是改進(jìn)分類(lèi)檢測(cè)方法,是否特征越多檢測(cè)效果越好,新的方法是否可以顯著提高檢測(cè)效果。以新浪微博為例,試圖通過(guò)不同的特征選擇方法與不同的分類(lèi)器組合實(shí)驗(yàn)回答以上問(wèn)題,實(shí)驗(yàn)結(jié)果表明特征組的選擇較分類(lèi)器的改進(jìn)更為重要,需從內(nèi)容信息、用戶(hù)行為和社會(huì)關(guān)系多側(cè)面生成特征,且特征并非越多檢測(cè)效果越好,這些結(jié)論將有助于未來(lái)微博反垃圾工作的突破。
【作者單位】: 中國(guó)民航大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;清華大學(xué)網(wǎng)絡(luò)科學(xué)與網(wǎng)絡(luò)空間研究院;清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室;北京郵電大學(xué)網(wǎng)絡(luò)技術(shù)研究院;北京航空航天大學(xué)虛擬現(xiàn)實(shí)技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 新浪微博 特征生成 特征選擇 垃圾用戶(hù)檢測(cè)
【基金】:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(“973”計(jì)劃)基金資助項(xiàng)目(No.2009CB320505) 國(guó)家科技支撐計(jì)劃基金資助項(xiàng)目(No.2008BAH37B05) 國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61170211,No.U1533104,No.61301245) 教育部博士點(diǎn)基金資助項(xiàng)目(No.20110002110056)~~
【分類(lèi)號(hào)】:TP393.092
【正文快照】: 5.北京航空航天大學(xué)虛擬現(xiàn)實(shí)技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京100876)Foundation Items:The National Basic Research Program of China(973 Program)(No.2009CB320505),The National Key Tech-nology RD Program of China(No.2008BAH37B05),The National Natural Science Foun
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 吉小軍,李世中,李霆;相關(guān)分析在特征選擇中的應(yīng)用[J];測(cè)試技術(shù)學(xué)報(bào);2001年01期
2 賈沛;桑農(nóng);唐紅衛(wèi);;一種改進(jìn)的類(lèi)別依賴(lài)型特征選擇技術(shù)[J];計(jì)算機(jī)與數(shù)子工程;2003年06期
3 靖紅芳;王斌;楊雅輝;徐燕;;基于類(lèi)別分布的特征選擇框架[J];計(jì)算機(jī)研究與發(fā)展;2009年09期
4 吳洪麗;朱顥東;周瑞瓊;;使用特征分辨率和差別對(duì)象對(duì)集的特征選擇[J];計(jì)算機(jī)工程與應(yīng)用;2010年16期
5 楊藝;韓德強(qiáng);韓崇昭;;基于排序融合的特征選擇[J];控制與決策;2011年03期
6 李云;;穩(wěn)定的特征選擇研究[J];微型機(jī)與應(yīng)用;2012年15期
7 錢(qián)學(xué)雙;多重篩選逐步回歸特征選擇法及其應(yīng)用[J];信息與控制;1986年05期
8 宣國(guó)榮;柴佩琪;;基于巴氏距離的特征選擇[J];模式識(shí)別與人工智能;1996年04期
9 范勁松,方廷健;特征選擇和提取要素的分析及其評(píng)價(jià)[J];計(jì)算機(jī)工程與應(yīng)用;2001年13期
10 王新峰;邱靜;劉冠軍;;基于特征相關(guān)性和冗余性分析的機(jī)械故障特征選擇研究[J];中國(guó)機(jī)械工程;2006年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 靖紅芳;王斌;楊雅輝;;基于類(lèi)別分布的特征選擇框架[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
2 李長(zhǎng)升;盧漢清;;排序?qū)W習(xí)模型中的特征選擇[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
3 劉功申;李建華;李生紅;;基于類(lèi)信息的特征選擇和加權(quán)方法[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
4 倪友平;王思臣;馬桂珍;陳曾平;;分支界定算法在低分辨雷達(dá)飛機(jī)架次判別中的應(yīng)用[A];第十三屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2007)論文集[C];2007年
5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類(lèi)SVM分割MR腦圖像特征選擇與優(yōu)化的實(shí)驗(yàn)研究[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年
6 蒙新泛;王厚峰;;主客觀識(shí)別中的上下文因素的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
7 萬(wàn)京;王建東;;一種基于新的差異性度量的ReliefF方法[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年
8 范麗;許潔萍;;基于GMM的音樂(lè)信號(hào)音色模型研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
9 陳友;戴磊;程學(xué)旗;;基于MRMHC-C4.5的IP流分類(lèi)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
10 申f;楊宏暉;袁帥;;用于水聲目標(biāo)識(shí)別的互信息無(wú)監(jiān)督特征選擇[A];第三屆上�!靼猜晫W(xué)學(xué)會(huì)學(xué)術(shù)會(huì)議論文集[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李靜;高維數(shù)據(jù)交互特征選擇和分類(lèi)研究[D];燕山大學(xué);2015年
2 劉風(fēng);基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年
3 王石平;粗糙擬陣及其在高維數(shù)據(jù)降維中的應(yīng)用研究[D];電子科技大學(xué);2014年
4 代琨;基于支持向量機(jī)的網(wǎng)絡(luò)數(shù)據(jù)特征選擇技術(shù)研究[D];解放軍信息工程大學(xué);2013年
5 王博;文本分類(lèi)中特征選擇技術(shù)的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年
6 張明錦;基于特征選擇的多變量數(shù)據(jù)分析方法及其在譜學(xué)研究中的應(yīng)用[D];華東理工大學(xué);2011年
7 高青斌;蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)相關(guān)問(wèn)題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年
8 馮國(guó)忠;文本分類(lèi)中的貝葉斯特征選擇[D];東北師范大學(xué);2011年
9 張麗新;高維數(shù)據(jù)的特征選擇及基于特征選擇的集成學(xué)習(xí)研究[D];清華大學(xué);2004年
10 王鋒;基于�;瘷C(jī)理的粗糙特征選擇高效算法研究[D];山西大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 周瑞;基于支持向量機(jī)特征選擇的移動(dòng)通信網(wǎng)絡(luò)問(wèn)題分析[D];華南理工大學(xué);2015年
2 張金蕾;蛋白質(zhì)SUMO化修飾位點(diǎn)預(yù)測(cè)的數(shù)據(jù)挖掘技術(shù)研究[D];西北農(nóng)林科技大學(xué);2015年
3 陳云風(fēng);基于聚類(lèi)集成技術(shù)的高鐵信號(hào)故障診斷研究[D];西南交通大學(xué);2015年
4 張斌斌;網(wǎng)絡(luò)股評(píng)的傾向性分析[D];中央民族大學(xué);2015年
5 季金勝;高分辨率遙感影像典型地物目標(biāo)的特征選擇及其穩(wěn)定性研究[D];上海交通大學(xué);2015年
6 袁玉錄;基于數(shù)據(jù)分類(lèi)的網(wǎng)絡(luò)通信行為建模方法研究[D];電子科技大學(xué);2015年
7 王虎;基于試驗(yàn)設(shè)計(jì)的白酒譜圖特征選擇及支持向量機(jī)參數(shù)優(yōu)化研究[D];南京財(cái)經(jīng)大學(xué);2015年
8 王維智;基于特征提取和特征選擇的級(jí)聯(lián)深度學(xué)習(xí)模型研究[D];哈爾濱工業(yè)大學(xué);2015年
9 皮陽(yáng);基于聲音的生物種群識(shí)別[D];電子科技大學(xué);2015年
10 劉樹(shù)龍;特征選擇在軟件缺陷預(yù)測(cè)中的應(yīng)用技術(shù)研究[D];南京大學(xué);2015年
,本文編號(hào):1008982
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1008982.html