面向微博突發(fā)事件的檢測(cè)與跟蹤研究
發(fā)布時(shí)間:2024-01-24 08:23
隨著近年來(lái)社交媒體的普及,人們交流和獲取信息的便利性有了大幅度的提升,人們進(jìn)入了一個(gè)全新的媒體時(shí)代。以微博為代表的社交媒體平臺(tái)更是憑借其發(fā)布、分享、傳播信息的便捷性,成為了大多數(shù)網(wǎng)民首選社交平臺(tái)。由于微博具有較強(qiáng)的及時(shí)性和傳播性,信息在微博上的傳播速度會(huì)很快,其中不乏有一些暴力恐怖等事件,如果某件受廣大民眾關(guān)注的話題對(duì)公共安全有一定風(fēng)險(xiǎn),則可能會(huì)演變成突發(fā)事件。為了能夠?qū)崟r(shí)的在微博的海量信息中發(fā)現(xiàn)輿情并及時(shí)地對(duì)民眾言論進(jìn)行管控和疏導(dǎo),因而面向社交網(wǎng)絡(luò)中突發(fā)事件檢測(cè)和跟蹤研究對(duì)社會(huì)穩(wěn)定有著重要意義。由于微博的每條文本較短、用詞較隨意等原因,一般的話題檢測(cè)技術(shù)在微博突發(fā)事件檢測(cè)上的應(yīng)用效果并不好。因此,本文根據(jù)微博文本的特征,提出一種簡(jiǎn)單有效的針對(duì)微博突發(fā)事件的檢測(cè)和跟蹤算法。主要工作如下:(1)微博預(yù)處理。微博的使用人群范圍廣,發(fā)布的信息數(shù)量巨大,內(nèi)容繁多復(fù)雜。為了提高事件的檢測(cè)效率,通過(guò)分析使用用戶的特點(diǎn),過(guò)濾掉微博中僵尸用戶;通過(guò)分析微博中的文本特點(diǎn),對(duì)文本進(jìn)行分詞、去停用詞等處理后,刪除過(guò)短的無(wú)意義文本,有效的降低計(jì)算的復(fù)雜度。(2)突發(fā)事件的檢測(cè)。通過(guò)研究突發(fā)事件的特點(diǎn),提出基于...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
本文編號(hào):3883460
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
圖1-1近七年中國(guó)網(wǎng)民規(guī)模微博作為一個(gè)迅速興起并基于用戶實(shí)時(shí)獲取、共享信息的平臺(tái),極大的降低了
圖2-1向量空間模型
圖2-2CBOW模型
圖2-3Skip-gram模型
本文編號(hào):3883460
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3883460.html
最近更新
教材專著