天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博垃圾賬號檢測研究

發(fā)布時(shí)間:2018-06-25 08:02

  本文選題:異質(zhì)信息網(wǎng)絡(luò) + 垃圾賬號。 參考:《北京郵電大學(xué)》2017年碩士論文


【摘要】:近年來,隨著諸如推特、新浪微博一類的新型社交網(wǎng)絡(luò)的蓬勃發(fā)展,人們的生活和娛樂方式也發(fā)生了巨大的變化。社交網(wǎng)絡(luò)為用戶提供了在第一時(shí)間獲取或發(fā)布多類型的信息如文本、圖片、音頻和視頻的平臺,在人們的日常生活中占有越來越重要的地位。然而,在社交網(wǎng)絡(luò)為用戶提供了信息交換平臺的同時(shí),垃圾賬號的泛濫嚴(yán)重破壞了社交網(wǎng)絡(luò)的生態(tài)平衡和用戶體驗(yàn)。經(jīng)過調(diào)研本課題將垃圾賬號定義為主要以“僵尸粉”形式存在的、受機(jī)器控制的僵尸賬號和以發(fā)送垃圾廣告或其他垃圾信息為目的垃圾營銷賬號。本課題以新浪微博中的垃圾賬號為研究對象,在對微博垃圾賬號的行為特點(diǎn)的分析基礎(chǔ)上,采用了一系列的垃圾賬號檢測方法,并最終通過異質(zhì)信息網(wǎng)絡(luò)實(shí)現(xiàn)了多類型數(shù)據(jù)結(jié)合的垃圾賬號檢測。本課題完成的工作分為以下幾個(gè)方面:1.研究新浪微博數(shù)據(jù)的高效爬取和存儲。2.對當(dāng)前新浪微博平臺中的垃圾賬號的行為模式進(jìn)行了分析和總結(jié),并在此基礎(chǔ)上進(jìn)行了統(tǒng)計(jì)特征分析,使用從用戶信息和博文信息中抽取的統(tǒng)計(jì)特征實(shí)現(xiàn)垃圾賬號的檢測。3.根據(jù)微博文本的特點(diǎn)如長度短、用詞不規(guī)律以及特殊符號的使用等,設(shè)計(jì)了微博文本預(yù)處理過程和以詞向量為基礎(chǔ)的文本表示模型,通過特征選擇和分類算法,實(shí)現(xiàn)基于文本的垃圾賬號檢測。4.研究異質(zhì)信息網(wǎng)絡(luò)和相關(guān)的相似度算法,構(gòu)建了微博中的異質(zhì)信息網(wǎng)絡(luò),提出了微博用戶信息、博文信息和用戶社交信息三類信息的合理結(jié)合方案以提升垃圾賬號檢測的效果,實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。
[Abstract]:In recent years, with the rapid development of new social networks such as Twitter and Sina Weibo, the way people live and play has changed dramatically. Social network provides a platform for users to obtain or publish many kinds of information such as text, picture, audio and video in the first time, which plays an increasingly important role in people's daily life. However, while social networks provide users with a platform for information exchange, the proliferation of spam accounts seriously undermines the ecological balance and user experience of social networks. After the investigation, the spam account is defined as the zombie account which exists mainly in the form of "zombie powder" and the spam marketing account for sending spam advertisement or other spam information. This subject takes the spam account in Sina Weibo as the research object, based on the analysis of the behavior characteristics of the Weibo spam account, a series of spam account detection methods are adopted. And finally through heterogeneous information network to achieve multiple types of data combined with spam account detection. The work accomplished in this project is divided into the following aspects: 1. Research Sina Weibo data efficient crawling and storage. 2. This paper analyzes and summarizes the behavior pattern of spam account in the current Sina Weibo platform, and analyzes the statistical characteristics on the basis of which, using the statistical features extracted from user information and blog post information to realize the detection of spam account. 3. According to the characteristics of Weibo texts, such as short length, irregular use of words and the use of special symbols, the preprocessing process of Weibo text and the text representation model based on word vector are designed, and the algorithm of feature selection and classification is adopted. Implementation of text-based spam account detection. 4. This paper studies heterogeneous information network and related similarity algorithms, constructs heterogeneous information network in Weibo, and proposes a reasonable combination of Weibo user information, blog information and user social information to improve the effect of spam account detection. The experimental results show that the method is effective.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王炳晨;;全球共網(wǎng),筑起反垃圾墻——Cloudmark Fingerprinting技術(shù)全面對抗垃圾信息[J];微電腦世界;2007年08期

2 李志宇;;對付垃圾短信消費(fèi)者動力不足[J];通信世界;2008年23期

3 孫升蕓;田萱;;產(chǎn)品垃圾評論檢測研究綜述[J];計(jì)算機(jī)科學(xué);2011年S1期

4 周光斌;用法律、經(jīng)濟(jì)和技術(shù)手段圍殲垃圾信息[J];現(xiàn)代電信科技;2004年07期

5 樹子;;把一切垃圾短信拒之門外[J];數(shù)字通信;2007年12期

6 江林芯;蔣艷青;;四川成立12321網(wǎng)絡(luò)不良與垃圾信息舉報(bào)受理中心[J];通信與信息技術(shù);2010年01期

7 楊風(fēng)雷;黎建輝;;用戶生成內(nèi)容中的垃圾意見研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2011年10期

8 程德杰;;互聯(lián)網(wǎng)時(shí)代垃圾信息的預(yù)防和遏制[J];互聯(lián)網(wǎng)天地;2012年05期

9 孫升蕓;田萱;何軍;;基于評論行為的商品垃圾評論的識別研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年11期

10 ;關(guān)于開展垃圾短信息整治專項(xiàng)行動工作方案的通知[J];信息安全與通信保密;2008年07期

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 王劉芳 實(shí)習(xí)生 王薇薇;手機(jī)垃圾信息誰打掃[N];北京日報(bào);2001年

2 本報(bào)記者 聶曉飛;群發(fā)器成垃圾短信溫床 多部門聯(lián)防或成有效方式[N];通信信息報(bào);2010年

3 ;74.54%的中國手機(jī)用戶收到過欺詐類短信[N];中國計(jì)算機(jī)報(bào);2010年

4 趙缶;學(xué)學(xué)新加坡 立法治理垃圾短信[N];深圳特區(qū)報(bào);2012年

5 ;立法打擊垃圾信息成為共識[N];網(wǎng)絡(luò)世界;2005年

6 李韜;保衛(wèi)手機(jī)[N];計(jì)算機(jī)世界;2006年

7 程蓉 記者 王春;上海:呼吁立法控制垃圾信息[N];科技日報(bào);2006年

8 谷慧;垃圾短信重打不下[N];民營經(jīng)濟(jì)報(bào);2006年

9 通訊員  周 鶯;上海市人大代表呼吁制定反垃圾信息法[N];人民代表報(bào);2006年

10 劉恒 通訊員  田源;重慶聯(lián)通大力整治垃圾短信[N];人民郵電;2006年

相關(guān)碩士學(xué)位論文 前10條

1 陳妍男;微博垃圾賬號檢測研究[D];北京郵電大學(xué);2017年

2 龍燕;微博賬號的價(jià)值評估方法研究[D];暨南大學(xué);2017年

3 張夢佳;微信用戶轉(zhuǎn)發(fā)意愿研究[D];天津大學(xué);2016年

4 余攀;基于話題模型的教育領(lǐng)域微博賬號萃取[D];華中師范大學(xué);2017年

5 黃興鳳;在線社會網(wǎng)絡(luò)下的垃圾信息過濾技術(shù)的研究[D];上海師范大學(xué);2015年

6 王鳳嬌;垃圾短信判定系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

7 劉杰;基于用戶評價(jià)的垃圾評論檢測[D];東南大學(xué);2015年

8 劉曉燕;基于規(guī)則和相關(guān)度的微博垃圾評論檢測系統(tǒng)及實(shí)現(xiàn)[D];東北大學(xué);2014年

9 林秀嬌;基于評論關(guān)系圖的垃圾評論者檢測研究[D];福州大學(xué);2014年

10 邱斌;垃圾信息的通用自動化監(jiān)測分析方法及電信運(yùn)營商防范研究[D];南京郵電大學(xué);2016年



本文編號:2065238

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2065238.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶860b4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
偷拍洗澡一区二区三区| 中文字字幕在线中文乱码二区| 亚洲精品国产第一区二区多人| 亚洲精品国产第一区二区多人| 少妇激情在线免费观看| 又黄又色又爽又免费的视频| 激情视频在线视频在线视频 | 中文字幕精品少妇人妻| 亚洲熟女国产熟女二区三区| 日本婷婷色大香蕉视频在线观看| 国产精品久久香蕉国产线| 国产精品视频一级香蕉| 91欧美亚洲精品在线观看| 日韩特级黄片免费观看| 国产精品熟女乱色一区二区| 国产美女网红精品演绎| 精品国产亚洲av成人一区| 日韩中文字幕有码午夜美女| 国产伦精品一区二区三区精品视频| 99久免费精品视频在线观| 欧美日韩国产黑人一区| 91香蕉视频精品在线看| 日韩一区二区三区18| 欧美午夜一级艳片免费看| 人妻久久一区二区三区精品99| 欧美色欧美亚洲日在线| 91亚洲国产成人久久精品麻豆| 亚洲男人的天堂色偷偷| 色哟哟在线免费一区二区三区| 中文字幕亚洲精品人妻| 午夜福利在线观看免费| 国产二级一级内射视频播放| 国产激情一区二区三区不卡| 欧美日韩在线视频一区| 欧美av人人妻av人人爽蜜桃| 二区久久久国产av色| 精品熟女少妇av免费久久野外| 五月天丁香婷婷狠狠爱| 国产日韩欧美在线亚洲| 国产精品国产亚洲看不卡| 五月婷日韩中文字幕四虎|