天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多視角特征融合的中文垃圾微博過(guò)濾

發(fā)布時(shí)間:2018-07-14 13:32
【摘要】:微博中隱含著輿論熱點(diǎn)等與特定話題相關(guān)的有價(jià)值的信息。因此,針對(duì)微博數(shù)據(jù)分析(如話題發(fā)現(xiàn)等)的工作成了當(dāng)前的研究熱點(diǎn)。由于微博內(nèi)容和形式的高度自由,使得相關(guān)的研究工作面臨著垃圾數(shù)據(jù)噪聲大、有用數(shù)據(jù)提取難的問(wèn)題。然而,目前針對(duì)非公共話題的中文垃圾微博過(guò)濾尚無(wú)有效方法。提出一種基于多視角特征融合的垃圾微博過(guò)濾方法。該方法首先從微博的結(jié)構(gòu)和內(nèi)容兩個(gè)視角建立規(guī)則,再與微博文本分詞結(jié)果進(jìn)行融合構(gòu)造復(fù)合特征,并以此對(duì)垃圾微博進(jìn)行過(guò)濾。通過(guò)在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)表明多視角融合的特征使得過(guò)濾效果有明顯提升。
[Abstract]:This paper puts forward a method for filtering spam micro - blog based on multi - view feature fusion , which is based on the structure and content of micro blog .
【作者單位】: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與工程研究中心;中國(guó)科學(xué)院大學(xué);國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心;
【基金】:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(“九七三”計(jì)劃)項(xiàng)目(2012CB316303,2012BAH39B04) 高技術(shù)研究發(fā)展計(jì)劃(“八六三”計(jì)劃)項(xiàng)目(2012AA011003) 國(guó)家自然科學(xué)基金重點(diǎn)資助項(xiàng)目(60933005,61232010)國(guó)家自然科學(xué)基金面上項(xiàng)目(61173064) 國(guó)家242項(xiàng)目(2012F124)
【分類號(hào)】:TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 林霜梅;汪更生;陳弈秋;;個(gè)性化推薦系統(tǒng)中的用戶建模及特征選擇[J];計(jì)算機(jī)工程;2007年17期

2 樊興華;孫茂松;;一種高性能的兩類中文文本分類方法[J];計(jì)算機(jī)學(xué)報(bào);2006年01期

3 賈志洋;李偉偉;張海燕;;基于內(nèi)容的搜索引擎垃圾網(wǎng)頁(yè)檢測(cè)[J];計(jì)算機(jī)應(yīng)用與軟件;2009年11期

4 韓曉暉;馬軍;邵海敏;薛冉;;一種基于LDA的Web論壇低質(zhì)量回帖檢測(cè)方法[J];計(jì)算機(jī)研究與發(fā)展;2012年09期

5 王元珍,錢鐵云,馮小年;基于關(guān)聯(lián)規(guī)則挖掘的中文文本自動(dòng)分類[J];小型微型計(jì)算機(jī)系統(tǒng);2005年08期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李文斌;劉椿年;鐘寧;;基于兩階段集成學(xué)習(xí)的分類器集成[J];北京工業(yè)大學(xué)學(xué)報(bào);2010年03期

2 趙軍;胡栓柱;樊興華;;一種新的詞語(yǔ)相似度計(jì)算方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期

3 曾立梅;;基于文本數(shù)據(jù)挖掘的碩士論文分類技術(shù)[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期

4 楊鳳霞;;基于特征選擇的垃圾短信過(guò)濾研究[J];滄州師范專科學(xué)校學(xué)報(bào);2011年03期

5 孫鐵利;趙雋;楊鳳芹;吳迪;;一種基于相對(duì)特征的文本分類算法[J];東北師大學(xué)報(bào)(自然科學(xué)版);2010年01期

6 李艷玲;戴冠中;覃森;;快速的文本傾向性分類方法(英文)[J];電子科技大學(xué)學(xué)報(bào);2007年06期

7 樊興華;王鵬;;基于兩步策略的中文短文本分類研究[J];大連海事大學(xué)學(xué)報(bào);2008年03期

8 郭玉琴;袁方;劉海博;;基于模糊分類規(guī)則樹(shù)的文本分類(英文)[J];Journal of Southeast University(English Edition);2008年03期

9 李寧;王子磊;鄭濤;;基于本體論的個(gè)性化影片推薦技術(shù)研究[J];電子技術(shù);2009年10期

10 譚玉玲;張新林;;一種基于主題分類的文本過(guò)濾方法及其硬件實(shí)現(xiàn)[J];湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年02期

相關(guān)會(huì)議論文 前4條

1 馬后鋒;樊興華;;一種改進(jìn)的增量貝葉斯分類算法[A];2007'儀表,,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年

2 ;An Analysis on the Personalized Recommendation Architecture of Mobile Commerce Application[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)——管理科學(xué)與工程分會(huì)場(chǎng)論文集[C];2011年

3 趙紀(jì)元;羅霄;;面向中圖法的學(xué)術(shù)文獻(xiàn)自動(dòng)分類研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

4 錢鐵云;馮小年;王元珍;;prefix-hash-tree的插入、查找和重構(gòu)算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

相關(guān)博士學(xué)位論文 前10條

1 劉伍穎;面向垃圾信息過(guò)濾的主動(dòng)多域?qū)W習(xí)文本分類方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

2 古平;基于貝葉斯模型的文檔分類及相關(guān)技術(shù)研究[D];重慶大學(xué);2006年

3 王佐成;基于紋理的遙感圖像分類研究[D];西南交通大學(xué);2007年

4 王樹(shù)梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年

5 張博鋒;面向內(nèi)容安全的文本分類研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2007年

6 郝立柱;漢語(yǔ)文本自動(dòng)分類[D];吉林大學(xué);2008年

7 郝秀蘭;文本分類技術(shù)與應(yīng)用研究[D];復(fù)旦大學(xué);2008年

8 劉赫;文本分類中若干問(wèn)題研究[D];吉林大學(xué);2009年

9 趙朋朋;Deep Web信息集成若干關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2008年

10 劉志勇;基于本體的自適應(yīng)學(xué)習(xí)方法及應(yīng)用研究[D];吉林大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 于洪霞;基于SVM的中文垃圾郵件過(guò)濾[D];哈爾濱工程大學(xué);2009年

2 羅文兵;自適應(yīng)教學(xué)科研信息推送服務(wù)模型研究[D];江西師范大學(xué);2010年

3 徐旭;基于決策樹(shù)的Web應(yīng)用系統(tǒng)個(gè)性化身份驗(yàn)證研究[D];合肥工業(yè)大學(xué);2010年

4 姜倫;模糊聚類算法及其在中文文本聚類中的研究與實(shí)現(xiàn)[D];哈爾濱理工大學(xué);2010年

5 劉繼勇;網(wǎng)絡(luò)輿情預(yù)警輔助決策支持系統(tǒng)模型及關(guān)鍵技術(shù)研究[D];石家莊經(jīng)濟(jì)學(xué)院;2010年

6 孫久舒;基于內(nèi)容關(guān)聯(lián)的政府網(wǎng)站信息服務(wù)模型研究[D];吉林大學(xué);2011年

7 李高敏;基于協(xié)同過(guò)濾的教學(xué)資源個(gè)性化推薦技術(shù)的研究及應(yīng)用[D];北京交通大學(xué);2011年

8 張一平;基于Agent的餐飲個(gè)性化推薦建模與仿真研究[D];大連理工大學(xué);2011年

9 魏彥鵬;基于移動(dòng)社會(huì)網(wǎng)絡(luò)的用戶行為分析[D];北京郵電大學(xué);2011年

10 杜偉;智能化信息服務(wù)平臺(tái)服務(wù)器端設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 應(yīng)曉敏,劉明,竇文華;一種面向個(gè)性化服務(wù)的無(wú)需反例集的用戶建模方法[J];國(guó)防科技大學(xué)學(xué)報(bào);2002年03期

2 朱華宇,孫正興,張福炎;一個(gè)基于向量空間模型的中文文本自動(dòng)分類系統(tǒng)[J];計(jì)算機(jī)工程;2001年02期

3 賀海軍,王建芬,周青,曹元大;基于決策支持向量機(jī)的中文網(wǎng)頁(yè)分類器[J];計(jì)算機(jī)工程;2003年02期

4 石晶;胡明;石鑫;戴國(guó)忠;;基于LDA模型的文本分割[J];計(jì)算機(jī)學(xué)報(bào);2008年10期

5 黃萱菁,吳立德,石崎洋之,徐國(guó)偉;獨(dú)立于語(yǔ)種的文本分類方法[J];中文信息學(xué)報(bào);2000年06期

6 李輝,史忠植,許卓群;運(yùn)用文本領(lǐng)域的常識(shí)改善基于支撐向量機(jī)的文本分類器性能[J];中文信息學(xué)報(bào);2002年02期

7 劉少輝,董明楷,張?,李蓉,史忠植;一種基于向量空間模型的多層次文本分類方法[J];中文信息學(xué)報(bào);2002年03期

8 劉斌,黃鐵軍,程軍,高文;一種新的基于統(tǒng)計(jì)的自動(dòng)文本分類方法[J];中文信息學(xué)報(bào);2002年06期

9 解沖鋒,李 星;基于序列的文本自動(dòng)分類算法[J];軟件學(xué)報(bào);2002年04期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王平;;一種改進(jìn)的CHI算法在垃圾郵件過(guò)濾中的應(yīng)用[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2008年12期

2 吳桂玲;;基于歐氏距離和余弦相似度特征選擇的入侵檢測(cè)模型[J];中小企業(yè)管理與科技(上旬刊);2010年02期

3 李慧;李存華;王霞;;基于特征選擇的網(wǎng)頁(yè)排名算法[J];計(jì)算機(jī)工程;2010年13期

4 李健,范萬(wàn)春,何馳;基于多分類支持向量機(jī)的網(wǎng)絡(luò)入侵檢測(cè)技術(shù)[J];計(jì)算機(jī)應(yīng)用;2005年07期

5 王衛(wèi)玲;劉培玉;劉克非;;一種用于電子郵件分類的特征選擇算法[J];計(jì)算機(jī)工程與應(yīng)用;2006年33期

6 董小國(guó);丁冉;;IDS自適應(yīng)特征選擇算法——進(jìn)化包裝(Wrapper)算法分析[J];微計(jì)算機(jī)信息;2006年33期

7 于詠霞;楊陽(yáng);余生晨;;基于免疫算法和支持向量機(jī)的入侵檢測(cè)研究[J];華北科技學(xué)院學(xué)報(bào);2009年01期

8 朱莉;李玲娟;;攻擊特征在線選擇方法的研究[J];西安郵電學(xué)院學(xué)報(bào);2009年03期

9 孫寧青;;基于神經(jīng)網(wǎng)絡(luò)和CFS特征選擇的網(wǎng)絡(luò)入侵檢測(cè)系統(tǒng)[J];計(jì)算機(jī)工程與科學(xué);2010年06期

10 邱密;陽(yáng)愛(ài)民;劉永定;何震凱;;使用貝葉斯學(xué)習(xí)算法分類網(wǎng)絡(luò)流量[J];計(jì)算機(jī)工程與應(yīng)用;2010年25期

相關(guān)會(huì)議論文 前6條

1 柳斌;李之棠;涂浩;;一種基于半監(jiān)督學(xué)習(xí)的應(yīng)用層流量分類方法[A];2008年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年

2 付煥煥;李俊;張潔;;入侵檢測(cè)中機(jī)器學(xué)習(xí)算法的集成[A];中國(guó)電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年

3 高海華;王行愚;楊輝華;;基于群智能和SVM的網(wǎng)絡(luò)入侵特征選擇和檢測(cè)[A];2005年中國(guó)智能自動(dòng)化會(huì)議論文集[C];2005年

4 毛俐e

本文編號(hào):2121809


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2121809.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1206c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com