天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中文微博的話題相關性分析研究

發(fā)布時間:2021-01-24 03:15
  隨著Web2.0的發(fā)展,微博等社交媒體逐步成為了人們獲取網(wǎng)絡信息、了解社會動態(tài)的主要平臺。微博信息主要由個人用戶發(fā)布、信息通過人與人的社會交互共享,這使得微博呈現(xiàn)出數(shù)據(jù)規(guī)模大、信息質量參差不齊、話題實時更新等特點。如何在這些龐大冗余的微博信息中篩選出熱門話題、摘取出有價值的信息片段,對于面向互聯(lián)網(wǎng)絡的信息處理具有重要的意義。本文首先研究了Hashtag話題相關性分析問題。Hashtag是微博文本中的一種主題標簽,發(fā)布者可以利用Hashtag機制標注微博涉及的話題。微博平臺基于Hashtag聚合微博,能幫助用戶在海量微博數(shù)據(jù)中發(fā)現(xiàn)熱點話題。但Hashtag由用戶創(chuàng)建的特性使得不同的Hashtag可能代表著同一個話題,挖掘Hashtag之間的話題相關性將有助于熱點話題發(fā)現(xiàn)。因此在分析了微博內容特征及結構特點的基礎上,本文抽取了Hashtag文本特征、微博內容、Hashtag出現(xiàn)次數(shù)-時間分布以及Hashtag共現(xiàn)等一系列特征,用于分析Hashtag之間的話題相關性。在新浪微博數(shù)據(jù)上的實驗結果顯示,這一系列特征組合能較好地幫助Hashtag話題相關性分析。為了摘取出有價值的信息片段幫助用戶快... 

【文章來源】:國防科技大學湖南省 211工程院校 985工程院校

【文章頁數(shù)】:61 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
        1.1.1 微博的發(fā)展
        1.1.2 社交媒體上熱點話題研究的意義
        1.1.3 Hashtag的作用以及不足
        1.1.4 研究意義
    1.2 重要概念介紹
        1.2.1 事件
        1.2.2 話題
        1.2.3 Hashtag
        1.2.4 標簽云
    1.3 研究內容
        1.3.1 Hashtag話題相關性分析
        1.3.2 微博集合的子話題分析
    1.4 論文結構
第二章 國內外相關技術研究現(xiàn)狀
    2.1 引言
    2.2 話題發(fā)現(xiàn)與跟蹤技術研究現(xiàn)狀
        2.2.1 話題發(fā)現(xiàn)跟蹤的研究歷史
        2.2.2 文本的表示模型
        2.2.3 相似度的計算
        2.2.4 聚類算法
    2.3 微博文本話題分析的相關研究現(xiàn)狀
        2.3.1 微博內容簡短
        2.3.2 微博噪音數(shù)據(jù)多、用詞不規(guī)范
        2.3.3 實時性、時效性強
    2.4 關鍵詞抽取的研究現(xiàn)狀
        2.4.1 有監(jiān)督的關鍵詞抽取算法
        2.4.2 無監(jiān)督的關鍵詞抽取算法
        2.4.3 關鍵詞抽取算法的核心思想
    2.5 本章小結
第三章 Hashtag話題相關性分析
    3.1 引言
    3.2 相關工作
    3.3 問題描述
    3.4 特征設計
        3.4.1 Hashtag文本特征(Jaccard Of Hashtag)
        3.4.2 包含Hashtag的微博內容(Weibo Text)
        3.4.3 Hashtag的出現(xiàn)次數(shù)-時間分布(Time)
        3.4.4 Hashtag的共現(xiàn)(Co-Occurrence)
    3.5 Hashtag相關性分析模型的構造
    3.6 實驗構造與結果分析
        3.6.1 實驗語料
        3.6.2 機器學習模型的選擇
        3.6.3 實驗評價方法
        3.6.4 實驗設置
        3.6.5 實驗結果及分析
    3.7 本章小結
第四章 微博集合的子話題分析
    4.1 引言
    4.2 微博集合子話題分析系統(tǒng)的構造
        4.2.1 微博集合子話題分析系統(tǒng)的算法流程
        4.2.2 聚類算法流程
        4.2.3 關鍵詞抽取
        4.2.4 標簽云技術
    4.3 實驗結果與分析
        4.3.1 整體話題信息的展示
        4.3.2 子話題信息的展示
    4.4 本章小結
第五章 總結及展望
    5.1 工作總結
    5.2 展望
致謝
參考文獻
作者在學期間取得的學術成果



本文編號:2996456

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2996456.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8ab55***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com