基于社交網(wǎng)絡(luò)結(jié)構(gòu)和內(nèi)容的層次觀點(diǎn)挖掘
發(fā)布時間:2022-02-05 03:42
社交媒體的迅猛發(fā)展為用戶提供了更為豐富的表達(dá)觀點(diǎn)的方式,例如寫評論、發(fā)表情等,這些文本數(shù)據(jù)混雜著關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)等行為數(shù)據(jù),對現(xiàn)有的觀點(diǎn)挖掘方法提出了挑戰(zhàn)?紤]到社交媒體數(shù)據(jù)具有以下特性:(1)用戶持有多粒度的觀點(diǎn);(2)用戶感興趣的主題更大程度上影響用戶的觀點(diǎn);(3)社交網(wǎng)絡(luò)結(jié)構(gòu)上有聯(lián)系的用戶之間可能共享相同的觀點(diǎn);(4)用戶的觀點(diǎn)可能隨時間變化,本文圍繞基于結(jié)構(gòu)和內(nèi)容的層次觀點(diǎn)挖掘展開研究。論文的主要工作包括如下:1)考慮到微博文本觀點(diǎn)的多粒度特性,我們提出了基于概率圖模型的層次觀點(diǎn)挖掘方法(Hierarchical Opinion Phase,HOP)。與傳統(tǒng)的層次主題模型不同,HOP假設(shè)對于某一主題只持有支持或者反對立場,這樣HOP模型在根節(jié)點(diǎn)只有兩個分支。同時為了更好地表示觀點(diǎn),我們引入了短語(Phrase)的概念。為了進(jìn)一步提高層次觀點(diǎn)挖掘的準(zhǔn)確性,我們引入了哈希標(biāo)簽和情感詞字典作為先驗。HOP模型在我們爬取的兩個分別關(guān)于“英國脫歐”和“美國大選”熱點(diǎn)主題的微博數(shù)據(jù)集上實驗,結(jié)果表明,HOP能夠準(zhǔn)確地挖掘出層次觀點(diǎn),在文本級別的立場分類上也能取得了不錯的性能。2)考慮到用戶...
【文章來源】:東南大學(xué)江蘇省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 粗粒度觀點(diǎn)挖掘
1.2.2 細(xì)粒度觀點(diǎn)挖掘
1.2.3 層次主題發(fā)現(xiàn)
1.3 現(xiàn)有模型的局限性
1.4 本文的研究動機(jī)
1.5 本文的主要貢獻(xiàn)
1.6 文章結(jié)構(gòu)
第二章 相關(guān)算法介紹
2.1 LDA主題模型
2.1.1 生成式過程
2.1.2 基于吉布斯采樣的參數(shù)估計
2.2 HLDA層次主題模型
2.2.1 生成式過程
2.2.2 嵌套中餐館過程
2.2.3 后驗概率估計
2.3 TPM主題短語模型
2.3.1 生成式過程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后驗概率估計
2.4 本章小結(jié)
第三章 基于社交媒體文本的層次觀點(diǎn)挖掘方法
3.1 動機(jī)
3.2 層次觀點(diǎn)短語模型
3.2.1 生成式過程
3.2.2 基于吉布斯采樣的后驗概率估計
3.3 實驗和結(jié)果
3.3.1 數(shù)據(jù)集構(gòu)建
3.3.2 基準(zhǔn)模型
3.3.3 主題凝聚度
3.3.4 立場分類
3.3.5 定性分析
3.4 本章小結(jié)
第四章 基于結(jié)構(gòu)和內(nèi)容的動態(tài)觀點(diǎn)預(yù)測方法
4.1 動機(jī)
4.2 相關(guān)工作
4.2.1 融合結(jié)構(gòu)和內(nèi)容的立場檢測
4.2.2 動態(tài)觀點(diǎn)檢測
4.3 動態(tài)觀點(diǎn)神經(jīng)網(wǎng)絡(luò)模型
4.3.1 總體架構(gòu)
4.3.2 微博表示
4.3.3 獲得主題向量
4.3.4 語境注意力機(jī)制
4.3.5 流數(shù)據(jù)上的用戶級別立場檢測
4.3.6 模型的変種
4.4 實驗和結(jié)果
4.4.1 實驗設(shè)定
4.4.2 實驗結(jié)果
4.5 本章小結(jié)
第五章 總結(jié)和展望
5.1 文章總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]基于主題模型的微博轉(zhuǎn)發(fā)行為預(yù)測[J]. 郭亞,宮葉云,張奇,黃萱菁. 中文信息學(xué)報. 2018(04)
[2]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報. 2010(08)
[3]產(chǎn)品評論挖掘研究綜述[J]. 伍星,何中市,黃永文. 計算機(jī)工程與應(yīng)用. 2008(36)
本文編號:3614495
【文章來源】:東南大學(xué)江蘇省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 粗粒度觀點(diǎn)挖掘
1.2.2 細(xì)粒度觀點(diǎn)挖掘
1.2.3 層次主題發(fā)現(xiàn)
1.3 現(xiàn)有模型的局限性
1.4 本文的研究動機(jī)
1.5 本文的主要貢獻(xiàn)
1.6 文章結(jié)構(gòu)
第二章 相關(guān)算法介紹
2.1 LDA主題模型
2.1.1 生成式過程
2.1.2 基于吉布斯采樣的參數(shù)估計
2.2 HLDA層次主題模型
2.2.1 生成式過程
2.2.2 嵌套中餐館過程
2.2.3 后驗概率估計
2.3 TPM主題短語模型
2.3.1 生成式過程
2.3.2 Hierarchical Pitman-Yor Process(HPYP)
2.3.3 后驗概率估計
2.4 本章小結(jié)
第三章 基于社交媒體文本的層次觀點(diǎn)挖掘方法
3.1 動機(jī)
3.2 層次觀點(diǎn)短語模型
3.2.1 生成式過程
3.2.2 基于吉布斯采樣的后驗概率估計
3.3 實驗和結(jié)果
3.3.1 數(shù)據(jù)集構(gòu)建
3.3.2 基準(zhǔn)模型
3.3.3 主題凝聚度
3.3.4 立場分類
3.3.5 定性分析
3.4 本章小結(jié)
第四章 基于結(jié)構(gòu)和內(nèi)容的動態(tài)觀點(diǎn)預(yù)測方法
4.1 動機(jī)
4.2 相關(guān)工作
4.2.1 融合結(jié)構(gòu)和內(nèi)容的立場檢測
4.2.2 動態(tài)觀點(diǎn)檢測
4.3 動態(tài)觀點(diǎn)神經(jīng)網(wǎng)絡(luò)模型
4.3.1 總體架構(gòu)
4.3.2 微博表示
4.3.3 獲得主題向量
4.3.4 語境注意力機(jī)制
4.3.5 流數(shù)據(jù)上的用戶級別立場檢測
4.3.6 模型的変種
4.4 實驗和結(jié)果
4.4.1 實驗設(shè)定
4.4.2 實驗結(jié)果
4.5 本章小結(jié)
第五章 總結(jié)和展望
5.1 文章總結(jié)
5.2 工作展望
致謝
參考文獻(xiàn)
作者簡介
【參考文獻(xiàn)】:
期刊論文
[1]基于主題模型的微博轉(zhuǎn)發(fā)行為預(yù)測[J]. 郭亞,宮葉云,張奇,黃萱菁. 中文信息學(xué)報. 2018(04)
[2]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報. 2010(08)
[3]產(chǎn)品評論挖掘研究綜述[J]. 伍星,何中市,黃永文. 計算機(jī)工程與應(yīng)用. 2008(36)
本文編號:3614495
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3614495.html
最近更新
教材專著