天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 安全工程論文 >

基于LDA的微博災(zāi)害信息聚合——以臺(tái)風(fēng)為例

發(fā)布時(shí)間:2024-02-16 02:41
  微博等社交媒體日益普及化為災(zāi)害應(yīng)急提供了新思路。災(zāi)害應(yīng)急任務(wù)離不開數(shù)據(jù)的支持,微博憑借自身優(yōu)勢搭建了一座災(zāi)區(qū)內(nèi)與災(zāi)區(qū)外信息溝通的橋梁,其已經(jīng)成為災(zāi)害事件中災(zāi)害信息及時(shí)獲取的重要來源之一,然而微博數(shù)據(jù)非結(jié)構(gòu)化且更新速度快的特征導(dǎo)致這些信息難以被充分利用。因此,如何從非結(jié)構(gòu)化微博數(shù)據(jù)中快速聚合出災(zāi)害優(yōu)勢信息以輔助災(zāi)害應(yīng)急決策是當(dāng)前亟待解決的問題。本文針對(duì)當(dāng)前微博信息聚合在災(zāi)害領(lǐng)域應(yīng)用較少且現(xiàn)有微博信息聚合方法對(duì)微博信息利用不全面等現(xiàn)狀,圍繞聚合粒度以及聚合內(nèi)容豐富度兩個(gè)關(guān)鍵問題,提出了一種基于LDA的微博災(zāi)害信息聚合方法,研究內(nèi)容主要包括:(1)研究了微博數(shù)據(jù)預(yù)處理方法。針對(duì)現(xiàn)有文本預(yù)處理方法沒有考慮災(zāi)害特征導(dǎo)致預(yù)處理之后的微博數(shù)據(jù)并不能滿足本文聚合需求問題,本文在現(xiàn)有方法基礎(chǔ)上,結(jié)合災(zāi)害領(lǐng)域知識(shí),制定了合適的微博數(shù)據(jù)預(yù)處理方案。(2)研究了基于LDA的災(zāi)害主題模型構(gòu)建方法。從微博災(zāi)害信息聚合快速且盡可能全面的聚合需求出發(fā),總結(jié)了模型參數(shù)估計(jì)方法的三項(xiàng)原則,即高辨識(shí)度、高主題差異度、低時(shí)間復(fù)雜度,并通過實(shí)驗(yàn)分析確定Gibbs采樣作為主題模型的參數(shù)估計(jì)方法。(3)研究了微博災(zāi)害信息聚合方法。...

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景與意義
    1.2 研究現(xiàn)狀綜述
        1.2.1 微博信息聚合
        1.2.2 主題模型
        1.2.3 研究現(xiàn)狀總結(jié)
    1.3 研究目標(biāo)與內(nèi)容
        1.3.1 研究目標(biāo)
        1.3.2 研究內(nèi)容
    1.4 技術(shù)路線
    1.5 論文組織結(jié)構(gòu)
第2章 微博數(shù)據(jù)采集與預(yù)處理
    2.1 微博數(shù)據(jù)采集
        2.1.1 網(wǎng)絡(luò)爬蟲技術(shù)
        2.1.2 微博開放平臺(tái)介紹
        2.1.3 微博數(shù)據(jù)采集方案
    2.2 微博數(shù)據(jù)預(yù)處理
        2.2.1 中文分詞
        2.2.2 停用詞過濾
        2.2.3 無關(guān)詞過濾
    2.3 本章小結(jié)
第3章 基于LDA的災(zāi)害主題模型構(gòu)建
    3.1 LDA主題模型基本理論
        3.1.1 狄利克雷分布
        3.1.2 生成模型
        3.1.3 VEM參數(shù)估計(jì)
        3.1.4 Gibbs采樣
    3.2 基于LDA的災(zāi)害主題模型構(gòu)建過程
        3.2.1 總體流程概述
        3.2.2 災(zāi)害語料庫構(gòu)建
        3.2.3 LDA主題模型
        3.2.4 主題數(shù)目確定
        3.2.5 主題相似度
    3.3 實(shí)驗(yàn)與分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)
        3.3.2 實(shí)驗(yàn)結(jié)果
        3.3.3 實(shí)驗(yàn)分析
    3.4 本章小結(jié)
第4章 微博災(zāi)害信息聚合
    4.1 基本理論
        4.1.1 詞頻-逆文本頻度分析
        4.1.2 命名實(shí)體識(shí)別
    4.2 漸進(jìn)求精的微博數(shù)據(jù)聚合
        4.2.1 災(zāi)害關(guān)鍵詞
        4.2.2 時(shí)間
    4.3 微博災(zāi)害信息聚合
        4.3.1 時(shí)空分布信息
        4.3.2 主題特征信息
    4.4 聚合信息可視化方法
    4.5 本章小結(jié)
第5章 實(shí)驗(yàn)與分析
    5.1 實(shí)驗(yàn)平臺(tái)搭建
    5.2 實(shí)驗(yàn)結(jié)果與分析
        5.2.1 實(shí)驗(yàn)數(shù)據(jù)
        5.2.2 實(shí)驗(yàn)結(jié)果與分析
    5.3 本章小結(jié)
第6章 總結(jié)與展望
    6.1 本文的研究成果
    6.2 創(chuàng)新點(diǎn)
    6.3 研究展望
參考文獻(xiàn)
附錄
    主要成果
    科研項(xiàng)目
致謝



本文編號(hào):3900680

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/anquangongcheng/3900680.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶04b98***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
午夜福利92在线观看| 国产高清一区二区不卡| 久久婷婷综合色拍亚洲| 亚洲一级二级三级精品| 亚洲欧美一二区日韩高清在线| 人妻久久一区二区三区精品99| 91精品国产av一区二区| 日韩中文字幕免费在线视频| 国产成人精品在线播放| 国产日韩在线一二三区| 欧美中文日韩一区久久| 久草视频在线视频在线观看| 神马午夜福利一区二区| 日韩成人动画在线观看| 色婷婷国产熟妇人妻露脸| 免费亚洲黄色在线观看| 免费黄色一区二区三区| 日本办公室三级在线观看| 国产不卡免费高清视频| 国产亚洲精品岁国产微拍精品| 亚洲欧美天堂精品在线| 欧美一级黄片欧美精品| 久久三级国外久久久三级| 国产精品十八禁亚洲黄污免费观看| 亚洲精品偷拍视频免费观看| 国产在线一区中文字幕 | 日韩高清一区二区三区四区| 欧美激情中文字幕综合八区| 日系韩系还是欧美久久| 久草视频这里只是精品| 高清免费在线不卡视频| 亚洲国产日韩欧美三级| 国产视频福利一区二区| 午夜精品麻豆视频91| 欧美国产极品一区二区| 亚洲午夜福利不卡片在线| 老富婆找帅哥按摩抠逼视频| 麻豆精品在线一区二区三区| 亚洲欧美日本国产不卡| 国产传媒免费观看视频| 尹人大香蕉中文在线播放|