天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合時空信息的社交媒體事件檢測方法研究

發(fā)布時間:2024-07-02 01:36
  社交媒體是擁有眾多用戶參與的新型在線媒體,近年來以推特為代表的社交媒體網站吸引了數以億計的用戶,現實社會中所發(fā)生的重大突發(fā)事件在社交媒體中會得到快速的反應與廣泛的傳播,因此社交媒體中包含著豐富的突發(fā)事件的相關信息。社交媒體中的事件檢測方法為利用機器學習與自然語言處理等技術,從海量的社交媒體數據中尋找現實生活中所發(fā)生的突發(fā)事件的方法,有效的事件檢測能讓人們及時了解社會中所出現的熱門事件信息,并幫助政府等機構及時應對社會事件并采取相關措施。對于現實生活中具有一定影響力的事件,事件相關的內容通常在社交媒體中會引入廣泛討論,因此現有社交媒體事件檢測的一個基本思路是通過文本聚類發(fā)現事件相關的文本,再對文本聚類進行分析判斷是否為突發(fā)事件。但是,現有研究存在兩方面問題:1)對社交媒體的短文本流的文本聚類效果不佳;2)事件的特征提取與判定不夠準確。針對以上問題,本文以通過時空信息獲得更加準確事件特征的角度研究社交媒體事件檢測方法,主要貢獻概括為如下兩方面:(1)提出基于融合相似度的在線密度聚類方法。在相似度計算方面,考慮到社交媒體中文本長度較短等特點,本文利用短文本流構建動態(tài)的單詞關聯空間,并基于該空...

【文章頁數】:83 頁

【學位級別】:碩士

【部分圖文】:

圖3-4DBSCAN算法偽代碼

圖3-4DBSCAN算法偽代碼

第三章基于時空信息的文本在線聚類方法27圖3-4DBSCAN算法偽代碼由圖3-4可知,DBSCAN的聚類過程為,首先對于空間中的所有點的Eps鄰域進行檢查,將其中包含點的數量與Minpts進行比較,若大于Minpts,則將該點標記為核心點,并創(chuàng)建以該點為核心對象的簇。之后,通過不....


圖3-5在線DBSCAN聚類方法偽代碼創(chuàng)建以點v為核心點的核心對象的流程為:首先,創(chuàng)建核心對象,將核心點的Eps鄰域內所包含的所有推文中的信息更新到核心對象中;之后,判斷核心點v是

圖3-5在線DBSCAN聚類方法偽代碼創(chuàng)建以點v為核心點的核心對象的流程為:首先,創(chuàng)建核心對象,將核心點的Eps鄰域內所包含的所有推文中的信息更新到核心對象中;之后,判斷核心點v是

電子科技大學碩士學位論文28圖3-5在線DBSCAN聚類方法偽代碼創(chuàng)建以點v為核心點的核心對象的流程為:首先,創(chuàng)建核心對象,將核心點的Eps鄰域內所包含的所有推文中的信息更新到核心對象中;之后,判斷核心點v是否位于其它簇中,若位于其它簇中,則將多個包含核心點v的核心對象合并為同一....


圖4-1十四天內各地理實體比例的變化

圖4-1十四天內各地理實體比例的變化

第四章基于時空的突發(fā)事件判定方法414.2總體框架通過第三章所介紹的在線聚類方法可以得到描述潛在事件的文本簇,為了從其中識別出真實的突發(fā)事件,首先需要對事件進行準確的定義。本節(jié)將首先描述對于事件的詳細的定義,之后基于該定義說明突發(fā)地理實體與突發(fā)事件之間的關系,并介紹基于突發(fā)地理實....


圖4-3地理實體China的頻率隨時間變化圖

圖4-3地理實體China的頻率隨時間變化圖

第四章基于時空的突發(fā)事件判定方法45實體China為例,展示了以兩小時為時間窗長度時,在14天內該地理實體的頻率隨時間變化的圖像,可以看出在這段時間內存在一個較為明顯的突發(fā)。圖4-3地理實體China的頻率隨時間變化圖從圖4-3中可以看出,地理實體在突發(fā)時間段內有著相比于其它時間....



本文編號:3999493

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3999493.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶b2e85***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com