天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

突發(fā)事件微博新話題檢測與跟蹤系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2018-07-16 10:07
【摘要】:相對于傳統(tǒng)的新聞媒體,微博以其簡短快速便捷的特性迅速成為傳遞公眾話題信息的媒介,并成長為人們獲取與發(fā)布信息的主要渠道之一。目前,各類微博平臺已經(jīng)積累了大量的用戶使用群體,并且其每天的信息發(fā)布量巨大。因此,基于話題檢測與跟蹤的研究也開始從傳統(tǒng)新聞領(lǐng)域向微博平臺進(jìn)行轉(zhuǎn)移。而突發(fā)事件的發(fā)生關(guān)乎國家安全與社會穩(wěn)定,這使得針對各類突發(fā)事件的話題檢測與跟蹤在應(yīng)對災(zāi)害事故和進(jìn)行危機處理有著顯著而重要的意義。本文著眼于微博平臺,使用話題檢測技術(shù)挖掘突發(fā)事件中相關(guān)的話題信息,并以此基礎(chǔ)進(jìn)行微博網(wǎng)絡(luò)話題傳播方式的建模研究。 本文采用理論與實踐相結(jié)合的研究方法,分別從國內(nèi)外研究現(xiàn)狀調(diào)研,微博數(shù)據(jù)采集,話題檢測以及突發(fā)事件微博傳播網(wǎng)絡(luò)建模四個方面依次展開。首先基于國內(nèi)外研究在數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)等方面已有的技術(shù)優(yōu)勢和研究成果,通過密切關(guān)注國內(nèi)外相關(guān)研究的最新動態(tài),提出本文在突發(fā)事件的微博新話題檢測與跟蹤領(lǐng)域可以補充或創(chuàng)新的論點。其次,在新浪微博上采集用于微博話題研究的數(shù)據(jù)集,包括設(shè)計針對微博平臺的爬蟲程序,以及對其數(shù)據(jù)進(jìn)行提取、預(yù)處理并存入數(shù)據(jù)庫等操作。再次,在完成數(shù)據(jù)信息收集的基礎(chǔ)上,檢測微博中突發(fā)事件的相關(guān)話題。但由于微博內(nèi)容的簡短性以及口語化,導(dǎo)致常用的文本聚類方法并不適用于微博文本的話題聚類。因此,本文選用LDA算法作為研究微博話題的檢測算法,并在此基礎(chǔ)上,針對微博數(shù)據(jù)集中的背景噪聲問題,進(jìn)一步提出改進(jìn)后的TC-LDA算法。最后,展開突發(fā)事件微博傳播網(wǎng)絡(luò)的研究。通過使用Petri網(wǎng)和Agent相結(jié)合的研究方法對傳播網(wǎng)絡(luò)進(jìn)行建模,使之可以從微觀個體和宏觀系統(tǒng)兩個方面觀測微博網(wǎng)絡(luò)的傳播特性。 綜上所述,本文通過對突發(fā)事件在微博平臺的話題檢測與跟蹤研究,設(shè)計實現(xiàn)一個從微博數(shù)據(jù)采集,話題檢測以及建立微博傳播模型的系統(tǒng),為各類突發(fā)事件的檢測,預(yù)警以及應(yīng)急管理提供決策參考。
[Abstract]:At present, all kinds of Weibo platforms have accumulated a large number of user groups, and the amount of information released every day is huge. Therefore, the research based on topic detection and tracking began to shift from the traditional news field to the Weibo platform. The thesis points out that this paper can supplement or innovate in the field of Weibo new topic detection and tracking. Thirdly, based on the completion of data collection, the related topics of unexpected events in Weibo are detected. However, due to the brevity and colloquialization of Weibo, the commonly used text clustering methods are not suitable for topic clustering of Weibo texts. Therefore, this paper selects LDA algorithm as the detection algorithm of Weibo topic, and on this basis, proposes an improved TC-LDA algorithm for the background noise problem in Weibo dataset. Finally, the research on the Weibo communication network of unexpected events is carried out. To sum up, this paper designs and implements a system from Weibo data acquisition, topic detection and Weibo propagation model to detect all kinds of emergencies through the research of topic detection and tracking on Weibo platform. Early warning and emergency management provide decision-making reference.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期

2 李保利,俞士汶;話題識別與跟蹤研究[J];計算機工程與應(yīng)用;2003年17期

3 閔可銳;趙迎賓;劉昕;趙澤宇;閆華;;互聯(lián)網(wǎng)話題識別與跟蹤系統(tǒng)設(shè)計及實現(xiàn)[J];計算機工程;2008年19期

4 駱衛(wèi)華;于滿泉;許洪波;王斌;程學(xué)旗;;基于多策略優(yōu)化的分治多層聚類算法的話題發(fā)現(xiàn)研究[J];中文信息學(xué)報;2006年01期

5 洪宇;張宇;劉挺;李生;;話題檢測與跟蹤的評測及研究綜述[J];中文信息學(xué)報;2007年06期

6 周剛;鄒鴻程;熊小兵;黃永忠;;MB-SinglePass:基于組合相似度的微博話題檢測[J];計算機科學(xué);2012年10期

,

本文編號:2126051

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2126051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0f688***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com