天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

面向微博的事件檢測算法研究

發(fā)布時間:2021-02-10 12:57
  微博以其便捷快速的信息分享方式及龐大的用戶關系網絡,使微博信息通過用戶網絡呈指數(shù)急速增長、蔓延,進一步加劇了信息、時代數(shù)據(jù)豐富而信息匱乏的矛盾。從這些海量繁雜的微博數(shù)據(jù)中梳理出具有價值的事件信息,不僅可以幫助網友獲取自己感興趣的事件資訊并掌握身邊發(fā)生的新聞要事,還可以從輿論監(jiān)控和民意調查的角度協(xié)助政府部門進行應急管理和行政決策。然而由于微博數(shù)據(jù)簡短、不規(guī)范、新穎的特點,應用傳統(tǒng)的網絡文本分析和數(shù)據(jù)挖掘技術的效果不再理想,事件檢測領域在特定的微博環(huán)境下面臨了新的挑戰(zhàn),相關研究尚處于探索階段,亟待尋求面向微博的有效的事件檢測方法。針對微博文本的特點,論文提出了整套面向微博的事件檢測模型,并對每個模塊進行了詳細的算法設計。通過實驗證明,該模型可有效、及時、準確地檢測出微博數(shù)據(jù)中的事件信息。課題的主要研究內容和創(chuàng)新點如下:第一,論文提出了一種基于N元關系統(tǒng)計的自監(jiān)督特征抽取方法。不同于傳統(tǒng)的事件檢測模型,論文提出了將事件檢測重點從文檔轉換為特征,通過微博數(shù)據(jù)自身的特點來表示微博特征,從而能更好地表達微博文本所要傳遞的信息,適應微博文本的特點第二,論文通過引入詞激活力和詞親密度的概念,提出了一種... 

【文章來源】:北京郵電大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:63 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 引言
    1.1 課題研究背景及意義
    1.2 國內外研究現(xiàn)狀
    1.3 作者的主要研究工作
    1.4 論文的組織結構
第二章 相關工作與概念
    2.1 微博數(shù)據(jù)爬取技術
        2.1.1 基于數(shù)據(jù)接口的爬取方法
        2.1.2 基于頁面解析的爬取方法
        2.1.3 對比與總結
    2.2 事件檢測技術
        2.2.1 相關概念
        2.2.2 話題檢測與跟蹤
        2.2.3 事件檢測
    2.3 面向微博的相關研究
        2.3.1 微博研究概述
        2.3.2 微博的事件檢測研究
第三章 面向微博的事件檢測算法模型
    3.1 事件檢測模型概述
    3.2 微博特征獲取
        3.2.1 微博數(shù)據(jù)特征
        3.2.2 特征獲取方法
    3.3 事件檢測的詞聚類算法
        3.3.1 詞激活力算法
        3.3.2 詞聚類算法
        3.3.3 事件表示模型
    3.4 基于時間的事件檢測與跟蹤
        3.4.1 事件的檢測
        3.4.2 事件的跟蹤
    3.5 事件檢測評測體系
        3.5.1 相關概念
        3.5.2 相對事件檢測評測
第四章 實驗結果與分析
    4.1 數(shù)據(jù)準備
        4.1.1 用戶數(shù)據(jù)
        4.1.2 微博數(shù)據(jù)
    4.2 微博數(shù)據(jù)特征獲取算法實驗
        4.2.1 特征獲取具體結果分析
        4.2.2 特征整體分布結果分析
    4.3 面向微博的事件檢測算法實驗
        4.3.1 事件檢測參數(shù)確定
        4.3.2 事件檢測結果分析
        4.3.3 事件跟蹤結果分析
    4.4 基于文檔聚類的事件檢測算法的對比實驗
        4.4.1 兩種方法事件檢測結果對比
        4.4.2 相對事件檢測評價
    4.5 實驗總結
第五章 結束語
    5.1 論文工作總結
    5.2 未來工作展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術論文目錄


【參考文獻】:
期刊論文
[1]基于微博的六度空間理論研究[J]. 劉宏杰,陸浩,張楠,鄭曉龍.  計算機應用研究. 2012(08)
[2]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青.  模式識別與人工智能. 2012(03)
[3]一種中文微博新聞話題檢測的方法[J]. 鄭斐然,苗奪謙,張志飛,高燦.  計算機科學. 2012(01)
[4]基于層次結構的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松.  中文信息學報. 2012(01)
[5]微博用戶特征分析和核心用戶挖掘[J]. 何黎,何躍,霍葉青.  情報理論與實踐. 2011(11)
[6]新浪微博數(shù)據(jù)挖掘方案[J]. 廉捷,周欣,曹偉,劉云.  清華大學學報(自然科學版). 2011(10)
[7]微博網絡輿情中的意見領袖識別及分析[J]. 劉志明,劉魯.  系統(tǒng)工程. 2011(06)
[8]新聞數(shù)據(jù)流的在線事件檢測[J]. 陳偉,張成,王燦,卜佳俊,陳純,陳宏.  浙江大學學報(工學版). 2011(06)
[9]話題檢測與跟蹤的評測及研究綜述[J]. 洪宇,張宇,劉挺,李生.  中文信息學報. 2007(06)
[10]基于多策略優(yōu)化的分治多層聚類算法的話題發(fā)現(xiàn)研究[J]. 駱衛(wèi)華,于滿泉,許洪波,王斌,程學旗.  中文信息學報. 2006(01)

博士論文
[1]突發(fā)事件信息提取研究[D]. 楊爾弘.北京語言大學 2005



本文編號:3027389

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3027389.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶476d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com