天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于主題詞向量模型的話題演化分析技術(shù)研究

發(fā)布時間:2023-01-14 15:57
  近年來,熱點話題層出不窮,不斷點燃網(wǎng)絡(luò)輿論。幾乎每個熱點話題都有鋪天蓋地的相關(guān)信息。有效的對話題演化進(jìn)行分析有助于人們及時了解話題發(fā)展動態(tài),掌握話題演化脈絡(luò),總結(jié)話題發(fā)展規(guī)律,為科學(xué)制定決策提供幫助。已有的相關(guān)研究分析較為粗糙且不夠深入,主要存在如下三個方面問題:(1)重在捕捉全局的主題語義信息,沒有兼顧局部詞匯語義信息,語義連貫性較差;(2)對話題發(fā)展過程中有顯著影響事件的定位準(zhǔn)確性較差;(3)不能有效厘清話題的演化發(fā)展脈絡(luò),無法高效的對話題的演化趨勢進(jìn)行直觀展示。主題詞向量模型能夠有效解決或改善以上問題。本文研究了基于主題詞向量模型的話題演化分析技術(shù),主要研究成果如下:(1)研究了話題內(nèi)新事件檢測。傳統(tǒng)的主題模型無法有效兼顧文檔隱含的主題語義信息和局部詞匯語義信息,實際應(yīng)用中性能不夠理想且波動較大。本文提出了基于主題詞向量聚類的話題內(nèi)新事件檢測方法。首先,通過主題詞向量模型對經(jīng)預(yù)處理的文檔進(jìn)行訓(xùn)練來獲取主題詞向量,可以有效的兼顧全局的主題語義信息和局部詞匯語義信息;然后,對獲取的主題詞向量進(jìn)行K-means聚類來獲取話題內(nèi)的子話題分布;最后,基于各個子話題所包含文檔時間戳的先后順序... 

【文章頁數(shù)】:88 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 相關(guān)概念與定義
    1.3 話題演化分析技術(shù)研究綜述
        1.3.1 傳統(tǒng)的話題演化分析技術(shù)
        1.3.2 新事件檢測
        1.3.3 事件關(guān)系識別
        1.3.4 話題演化可視化展示
    1.4 論文研究內(nèi)容與組織結(jié)構(gòu)
        1.4.1 論文研究內(nèi)容
        1.4.2 論文組織結(jié)構(gòu)
第2章 主題詞向量模型與語料庫建設(shè)
    2.1 主題模型
        2.1.1 主題模型簡介
        2.1.2 主題模型基礎(chǔ)
        2.1.3 隱含狄利克雷分配
    2.2 詞向量模型
    2.3 主題詞向量模型
    2.4 語料庫建設(shè)
        2.4.1 數(shù)據(jù)來源
        2.4.2 語料庫標(biāo)注
    2.5 本章小結(jié)
第3章 基于主題詞向量聚類的話題內(nèi)新事件檢測
    3.1 基于主題詞向量聚類的話題內(nèi)新事件檢測方法原理分析
        3.1.1 話題內(nèi)新事件檢測與TDT新事件檢測的區(qū)別
        3.1.2 話題內(nèi)新事件檢測面臨的挑戰(zhàn)
        3.1.3 主題詞向量聚類
    3.2 方法流程及關(guān)鍵技術(shù)
        3.2.1 方法流程
        3.2.2 基于K-means聚類算法的話題抽取
        3.2.3 話題內(nèi)新事件檢測
    3.3 實驗結(jié)果與分析
        3.3.1 實驗語料
        3.3.2 評價標(biāo)準(zhǔn)
        3.3.3 實驗結(jié)果及性能比較
    3.4 本章小結(jié)
第4章 基于主題詞向量模型的事件演化關(guān)系識別
    4.1 事件演化關(guān)系識別相關(guān)概念
    4.2 基于主題詞向量模型的事件演化關(guān)系識別方法原理分析
        4.2.1 事件演化關(guān)系識別的核心問題分析
        4.2.2 方法原理分析
    4.3 方法流程及關(guān)鍵技術(shù)
        4.3.1 方法流程
        4.3.2 事件向量構(gòu)建
        4.3.3 事件相似度計算及事件演化關(guān)系識別
    4.4 實驗結(jié)果與分析
        4.4.1 實驗語料
        4.4.2 評價標(biāo)準(zhǔn)
        4.4.3 實驗結(jié)果及性能比較
    4.5 本章小結(jié)
第5章 基于事件向量聚類的話題演化圖構(gòu)建
    5.1 基于事件向量聚類的話題演化圖構(gòu)建方法原理分析
        5.1.1 話題演化圖構(gòu)建核心問題分析
        5.1.2 方法原理分析
    5.2 方法流程及關(guān)鍵技術(shù)
        5.2.1 方法流程
        5.2.2 節(jié)點發(fā)現(xiàn)
        5.2.3 節(jié)點間邊建立
        5.2.4 話題演化圖構(gòu)建
    5.3 實驗結(jié)果與分析
        5.3.1 實驗語料
        5.3.2 評價標(biāo)準(zhǔn)
        5.3.3 實驗結(jié)果與性能比較
        5.3.4 話題演化圖展示
    5.4 本章小結(jié)
第6章 總結(jié)與展望
    6.1 論文總結(jié)
    6.2 下一步工作
參考文獻(xiàn)
致謝
個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果


【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)輿情場內(nèi)信息受眾觀點的“三體”可視化框架構(gòu)建[J]. 周昕,高俊峰,潘逸塵.  情報科學(xué). 2018(11)
[2]一種基于社交事件關(guān)聯(lián)的故事脈絡(luò)生成方法[J]. 李瑩瑩,馬帥,蔣浩誼,劉喆,胡春明,李雄.  計算機研究與發(fā)展. 2018(09)
[3]基于詞向量的中文事件發(fā)現(xiàn)及表示[J]. 張斌,胡琳梅,侯磊,李涓子.  模式識別與人工智能. 2018(03)
[4]基于LDA的雙通道在線主題演化模型[J]. 曹建平,王暉,夏友清,喬鳳才,張鑫.  自動化學(xué)報. 2014(12)
[5]面向動態(tài)主題數(shù)的話題演化分析[J]. 方瑩,黃河燕,辛欣,魏驍馳,莊琨.  中文信息學(xué)報. 2014(03)
[6]一種基于特征演變的新聞話題演化挖掘方法[J]. 趙旭劍,楊春明,李波,張暉,金培權(quán),岳麗華,戴文鍇.  計算機學(xué)報. 2014(04)
[7]狄利克雷過程混合模型、擴展模型及應(yīng)用[J]. 梅素玉,王飛,周水庚.  科學(xué)通報. 2012(34)
[8]基于局部和全局的LDA話題演化分析[J]. 章建,李芳.  上海交通大學(xué)學(xué)報. 2012(11)
[9]一種話題演化建模與分析方法[J]. 胡艷麗,白亮,張維明.  自動化學(xué)報. 2012(10)
[10]網(wǎng)絡(luò)輿情中一種基于OLDA的在線話題演化方法[J]. 胡艷麗,白亮,張維明.  國防科技大學(xué)學(xué)報. 2012(01)



本文編號:3730710

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3730710.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶693be***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com