基于社交網(wǎng)絡結構和內容的層次觀點挖掘
發(fā)布時間:2022-02-05 03:42
社交媒體的迅猛發(fā)展為用戶提供了更為豐富的表達觀點的方式,例如寫評論、發(fā)表情等,這些文本數(shù)據(jù)混雜著關注、點贊、轉發(fā)等行為數(shù)據(jù),對現(xiàn)有的觀點挖掘方法提出了挑戰(zhàn)?紤]到社交媒體數(shù)據(jù)具有以下特性:(1)用戶持有多粒度的觀點;(2)用戶感興趣的主題更大程度上影響用戶的觀點;(3)社交網(wǎng)絡結構上有聯(lián)系的用戶之間可能共享相同的觀點;(4)用戶的觀點可能隨時間變化,本文圍繞基于結構和內容的層次觀點挖掘展開研究。論文的主要工作包括如下:1)考慮到微博文本觀點的多粒度特性,我們提出了基于概率圖模型的層次觀點挖掘方法(Hierarchical Opinion Phase,HOP)。與傳統(tǒng)的層次主題模型不同,HOP假設對于某一主題只持有支持或者反對立場,這樣HOP模型在根節(jié)點只有兩個分支。同時為了更好地表示觀點,我們引入了短語(Phrase)的概念。為了進一步提高層次觀點挖掘的準確性,我們引入了哈希標簽和情感詞字典作為先驗。HOP模型在我們爬取的兩個分別關于“英國脫歐”和“美國大選”熱點主題的微博數(shù)據(jù)集上實驗,結果表明,HOP能夠準確地挖掘出層次觀點,在文本級別的立場分類上也能取得了不錯的性能。2)考慮到用戶...
【文章來源】:東南大學江蘇省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 粗粒度觀點挖掘
1.2.2 細粒度觀點挖掘
1.2.3 層次主題發(fā)現(xiàn)
1.3 現(xiàn)有模型的局限性
1.4 本文的研究動機
1.5 本文的主要貢獻
1.6 文章結構
第二章 相關算法介紹
2.1 LDA主題模型
2.1.1 生成式過程
2.1.2 基于吉布斯采樣的參數(shù)估計
2.2 HLDA層次主題模型
2.2.1 生成式過程
2.2.2 嵌套中餐館過程
2.2.3 后驗概率估計
2.3 TPM主題短語模型
2.3.1 生成式過程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后驗概率估計
2.4 本章小結
第三章 基于社交媒體文本的層次觀點挖掘方法
3.1 動機
3.2 層次觀點短語模型
3.2.1 生成式過程
3.2.2 基于吉布斯采樣的后驗概率估計
3.3 實驗和結果
3.3.1 數(shù)據(jù)集構建
3.3.2 基準模型
3.3.3 主題凝聚度
3.3.4 立場分類
3.3.5 定性分析
3.4 本章小結
第四章 基于結構和內容的動態(tài)觀點預測方法
4.1 動機
4.2 相關工作
4.2.1 融合結構和內容的立場檢測
4.2.2 動態(tài)觀點檢測
4.3 動態(tài)觀點神經(jīng)網(wǎng)絡模型
4.3.1 總體架構
4.3.2 微博表示
4.3.3 獲得主題向量
4.3.4 語境注意力機制
4.3.5 流數(shù)據(jù)上的用戶級別立場檢測
4.3.6 模型的変種
4.4 實驗和結果
4.4.1 實驗設定
4.4.2 實驗結果
4.5 本章小結
第五章 總結和展望
5.1 文章總結
5.2 工作展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]基于主題模型的微博轉發(fā)行為預測[J]. 郭亞,宮葉云,張奇,黃萱菁. 中文信息學報. 2018(04)
[2]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
[3]產(chǎn)品評論挖掘研究綜述[J]. 伍星,何中市,黃永文. 計算機工程與應用. 2008(36)
本文編號:3614495
【文章來源】:東南大學江蘇省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內外研究現(xiàn)狀
1.2.1 粗粒度觀點挖掘
1.2.2 細粒度觀點挖掘
1.2.3 層次主題發(fā)現(xiàn)
1.3 現(xiàn)有模型的局限性
1.4 本文的研究動機
1.5 本文的主要貢獻
1.6 文章結構
第二章 相關算法介紹
2.1 LDA主題模型
2.1.1 生成式過程
2.1.2 基于吉布斯采樣的參數(shù)估計
2.2 HLDA層次主題模型
2.2.1 生成式過程
2.2.2 嵌套中餐館過程
2.2.3 后驗概率估計
2.3 TPM主題短語模型
2.3.1 生成式過程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后驗概率估計
2.4 本章小結
第三章 基于社交媒體文本的層次觀點挖掘方法
3.1 動機
3.2 層次觀點短語模型
3.2.1 生成式過程
3.2.2 基于吉布斯采樣的后驗概率估計
3.3 實驗和結果
3.3.1 數(shù)據(jù)集構建
3.3.2 基準模型
3.3.3 主題凝聚度
3.3.4 立場分類
3.3.5 定性分析
3.4 本章小結
第四章 基于結構和內容的動態(tài)觀點預測方法
4.1 動機
4.2 相關工作
4.2.1 融合結構和內容的立場檢測
4.2.2 動態(tài)觀點檢測
4.3 動態(tài)觀點神經(jīng)網(wǎng)絡模型
4.3.1 總體架構
4.3.2 微博表示
4.3.3 獲得主題向量
4.3.4 語境注意力機制
4.3.5 流數(shù)據(jù)上的用戶級別立場檢測
4.3.6 模型的変種
4.4 實驗和結果
4.4.1 實驗設定
4.4.2 實驗結果
4.5 本章小結
第五章 總結和展望
5.1 文章總結
5.2 工作展望
致謝
參考文獻
作者簡介
【參考文獻】:
期刊論文
[1]基于主題模型的微博轉發(fā)行為預測[J]. 郭亞,宮葉云,張奇,黃萱菁. 中文信息學報. 2018(04)
[2]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
[3]產(chǎn)品評論挖掘研究綜述[J]. 伍星,何中市,黃永文. 計算機工程與應用. 2008(36)
本文編號:3614495
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3614495.html
最近更新
教材專著