天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向機(jī)構(gòu)的微博挖掘系統(tǒng)

發(fā)布時(shí)間:2021-07-08 07:18
  微博客是一種基于WEB2.0的新型的信息發(fā)布和獲取平臺(tái),它具有短小、便捷、靈活等特點(diǎn)。自2006年誕生以來(lái),微博在短時(shí)間內(nèi)就積聚了大最用戶,并迅速影響和改變著人們獲取和發(fā)布信息的習(xí)慣。本文設(shè)計(jì)了一種在微博平臺(tái)上面分析獲取與某一目標(biāo)機(jī)構(gòu)有關(guān)的數(shù)據(jù)發(fā)掘系統(tǒng),試圖在微博平臺(tái)提供的海量數(shù)據(jù)中發(fā)掘出與某一特定機(jī)構(gòu)相關(guān)的評(píng)論、事件等等相關(guān)內(nèi)容,并同時(shí)通過(guò)發(fā)掘微博中的社交網(wǎng)絡(luò)關(guān)系和微博內(nèi)容來(lái)發(fā)掘與目標(biāo)機(jī)構(gòu)相關(guān)的用戶群。本系統(tǒng)在數(shù)據(jù)上依托于微博平臺(tái)提供的開(kāi)放API接口,實(shí)時(shí)通過(guò)檢索接口和關(guān)注目標(biāo)機(jī)構(gòu)的官方賬戶等方式獲取初始數(shù)據(jù),終過(guò)對(duì)數(shù)據(jù)進(jìn)行垃圾過(guò)濾后,系統(tǒng)結(jié)合微博的文本內(nèi)容和和微博發(fā)布者的社交關(guān)系來(lái)評(píng)價(jià)微博的相關(guān)性,并采用動(dòng)態(tài)聚類的方法從微博中發(fā)現(xiàn)相關(guān)話題。在發(fā)掘與目標(biāo)機(jī)構(gòu)相關(guān)話題的過(guò)程中,系統(tǒng)將通過(guò)不斷的更新分類器訓(xùn)練語(yǔ)料,動(dòng)態(tài)的發(fā)掘當(dāng)前機(jī)構(gòu)的相關(guān)關(guān)鍵字集合。此外,系統(tǒng)定義了用戶相關(guān)度的概念,綜合考慮一個(gè)用戶在社交網(wǎng)絡(luò)上和文本語(yǔ)義上的相關(guān)性,并通過(guò)該指標(biāo)發(fā)掘在社交關(guān)系上較為相關(guān)或發(fā)布相關(guān)微博較為活躍的用戶。此外,系統(tǒng)還將通過(guò)基于社區(qū)發(fā)現(xiàn)的方法從與官方賬戶相關(guān)的社交網(wǎng)絡(luò)中發(fā)掘出整體上與目標(biāo)機(jī)構(gòu)相關(guān)的... 

【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:58 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究的背景
    1.2 國(guó)內(nèi)和國(guó)外研究現(xiàn)狀
    1.3 論文的結(jié)構(gòu)
第2章 系統(tǒng)總休設(shè)計(jì)
    2.1 微博基本功能簡(jiǎn)介
    2.2 系統(tǒng)框架概述
    2.3 系統(tǒng)設(shè)計(jì)所需條件
第3章 相關(guān)內(nèi)容挖掘
    3.1 爬蟲模塊
        3.1.1 調(diào)用微博檢索接口
        3.1.2 官方賬戶及相關(guān)用戶微博爬取
        3.1.3 爬蟲模塊的工作流程
    3.2 分類器
        3.2.1 傳統(tǒng)基于向量空間模型的建模
        3.2.2 引入時(shí)間因子的改進(jìn)建模方法
        3.2.3 分類器設(shè)計(jì)
    3.3 話題聚類
        3.3.1 K-means聚類算法簡(jiǎn)介
        3.3.2 基于時(shí)間窗過(guò)濾的動(dòng)態(tài)增量聚類
第4章 相關(guān)用戶獲取
    4.1 模塊任務(wù)說(shuō)明
    4.2 用戶關(guān)系數(shù)據(jù)集
        4.2.1 用戶關(guān)系爬蟲
        4.2.2 徽博接口的訪問(wèn)限制問(wèn)題
        4.2.3 用相關(guān)系數(shù)據(jù)概況
    4.3 用戶與目標(biāo)機(jī)構(gòu)的相關(guān)度
        4.3.1 用戶相似度的設(shè)計(jì)
        4.3.2 語(yǔ)義內(nèi)容相關(guān)度的計(jì)算
        4.3.3 社交網(wǎng)絡(luò)相關(guān)度的計(jì)算
    4.4 基于社區(qū)發(fā)現(xiàn)的方法發(fā)掘相關(guān)用戶
        4.4.1 相關(guān)社區(qū)挖掘算法介紹
        4.4.2 與目標(biāo)機(jī)構(gòu)相關(guān)社交網(wǎng)絡(luò)的社區(qū)挖掘
        4.4.3 通過(guò)社區(qū)發(fā)現(xiàn)發(fā)掘相關(guān)用戶的缺陷
第5章 系統(tǒng)的整合和實(shí)現(xiàn)
    5.1 系統(tǒng)整合仟?jiǎng)?wù)概述
        5.1.1 系統(tǒng)各模塊數(shù)據(jù)的存儲(chǔ)和協(xié)調(diào)
        5.1.2 系統(tǒng)各模塊的運(yùn)行周期
    5.2 系統(tǒng)前臺(tái)搭建
第6章 總結(jié)和展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄



本文編號(hào):3271122

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3271122.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶82c2d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com