面向數(shù)據(jù)特性的文本情感分析方法研究
發(fā)布時間:2021-01-19 06:06
社交媒體與電商平臺為數(shù)以億計的用戶提供著便捷的工作、生活和社交娛樂服務(wù)的同時,也散布著海量的文本數(shù)據(jù),其中,用戶生成的文本數(shù)據(jù)中蘊含著豐富的情感信息。深入分析、挖掘這些數(shù)據(jù)中隱含的情感信息,服務(wù)于社會管理和商業(yè)運營,正是文本情感分析技術(shù)追求的目標。文本情感分析是指綜合運用自然語言處理與機器學習等技術(shù)對文本中的情感信息進行抽取、處理、分析和推理的過程。社會媒體中的文本數(shù)據(jù)紛繁復(fù)雜,觀察和統(tǒng)計表明,社會媒體數(shù)據(jù)具有:類別非平衡、標簽數(shù)據(jù)缺乏、情感表達隱晦、情感載體多樣等特性,這些數(shù)據(jù)特性給文本情感分析帶來了巨大挑戰(zhàn)。針對上述數(shù)據(jù)特性,本文旨在運用數(shù)據(jù)采樣、半監(jiān)督學習、嵌入表示、深度學習等技術(shù),圍繞文本情感分類、反問與反諷句識別、可解釋推薦模型建立等問題,開展系統(tǒng)深入的研究,發(fā)展文本情感分析理論與方法。主要研究內(nèi)容與創(chuàng)新點如下:(1)局部稠密下采樣與全局再平衡的文本情感分類方法非平衡文本情感分類。社會媒體評論文本數(shù)據(jù)的情感類別非平衡性會導致分類模型的偏置問題,從而影響模型的分類效果。本文提出了一種局部稠密區(qū)域下采樣與全局再平衡的文本情感分類方法(LDMRC+SS/RS)。該方法在局部稠密邊界...
【文章來源】:山西大學山西省
【文章頁數(shù)】:137 頁
【學位級別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究動態(tài)
1.2.1 非平衡文本情感分類
1.2.2 半監(jiān)督文本情感分類
1.2.3 隱式情感分析
1.2.4 方面項情感分析
1.2.5 可解釋產(chǎn)品推薦
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于LDMRC算法與全局再平衡的文本情感分類
2.1 問題提出
2.2 基本概念
2.3 局部稠密混合區(qū)域下采樣+全局再平衡
2.3.1 LDMRC算法
2.3.2 數(shù)據(jù)的全局再平衡策略
2.4 文本情感分類步驟
2.5 實驗設(shè)置
2.5.1 實驗數(shù)據(jù)
2.5.2 采樣方案
2.5.3 評價指標
2.6 實驗結(jié)果與分析
2.6.1 算法參數(shù)的確定
2.6.2 采樣方案比較
2.7 本章小結(jié)
第三章 文本情感分類的協(xié)同混合半監(jiān)督學習
3.1 問題提出
3.2 一些相關(guān)度量
3.3 學習框架
3.3.1 種子選擇算法
3.3.2 訓練數(shù)據(jù)集更新
3.3.3 協(xié)同訓練策略
3.3.4 集成分類器
3.4 文本情感分類步驟
3.5 實驗設(shè)置
3.5.1 實驗數(shù)據(jù)
3.5.2 評價指標
3.5.3 訓練模式設(shè)計
3.6 實驗結(jié)果與分析
3.6.1 種子選擇方法
3.6.2 英文數(shù)據(jù)集上的比較實驗
3.6.3 中文數(shù)據(jù)集上的比較實驗
3.6.4 CASCT方法的穩(wěn)定性
3.7 本章小結(jié)
第四章 基于語言特征自動獲取的反問句識別
4.1 問題提出
4.2 反問句識別模型
4.2.1 反問句特征自動獲取模型
4.2.2 基于層疊注意力機制的反問句識別模型
4.3 實驗設(shè)置
4.3.1 數(shù)據(jù)集及評價指標
4.3.2 參數(shù)設(shè)置
4.4 實驗結(jié)果與分析
4.4.1 特征性能的比較實驗
4.4.2 特征數(shù)對識別效果的影響
4.4.3 綜合比較實驗
4.4.4 錯誤分析
4.5 本章小結(jié)
第五章 基于多信息融合的反諷句識別
5.1 問題提出
5.2 基于BERT的句子表示
5.3 融入顯式特征信息的句子表示
5.4 情感信息獲取
5.4.1 基于BERT的句子情感分類
5.4.2 句子情感差異表示
5.5 多信息融合的反諷句識別框架
5.6 實驗設(shè)置
5.6.1 實驗數(shù)據(jù)及評價指標
5.6.2 方法的比較方案
5.7 實驗結(jié)果與分析
5.7.1 特征的有效性對比實驗
5.7.2 與其他方法的對比實驗
5.8 本章小結(jié)
第六章 基于方面項情感分析的可解釋推薦
6.1 問題提出
6.2 方面項抽取
6.2.1 方面項情感判別
6.2.2 方面項確定
6.3 基于圖神經(jīng)網(wǎng)絡(luò)的推薦模型
6.3.1 用戶-產(chǎn)品圖建模
6.3.2 基于注意力機制的圖更新
6.3.3 模型輸出與訓練
6.4 產(chǎn)品評級策略
6.5 實驗設(shè)置
6.6 實驗結(jié)果與分析
6.6.1 產(chǎn)品評級融合參數(shù)的選取
6.6.2 產(chǎn)品評級策略對比實驗
6.6.3 與已有方法的比較
6.6.4 推薦的可解釋性
6.7 本章小結(jié)
第七章 總結(jié)及展望
7.1 主要結(jié)論
7.2 未來工作
參考文獻
攻讀博士學位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:2986474
【文章來源】:山西大學山西省
【文章頁數(shù)】:137 頁
【學位級別】:博士
【文章目錄】:
中文摘要
英文摘要
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究動態(tài)
1.2.1 非平衡文本情感分類
1.2.2 半監(jiān)督文本情感分類
1.2.3 隱式情感分析
1.2.4 方面項情感分析
1.2.5 可解釋產(chǎn)品推薦
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第二章 基于LDMRC算法與全局再平衡的文本情感分類
2.1 問題提出
2.2 基本概念
2.3 局部稠密混合區(qū)域下采樣+全局再平衡
2.3.1 LDMRC算法
2.3.2 數(shù)據(jù)的全局再平衡策略
2.4 文本情感分類步驟
2.5 實驗設(shè)置
2.5.1 實驗數(shù)據(jù)
2.5.2 采樣方案
2.5.3 評價指標
2.6 實驗結(jié)果與分析
2.6.1 算法參數(shù)的確定
2.6.2 采樣方案比較
2.7 本章小結(jié)
第三章 文本情感分類的協(xié)同混合半監(jiān)督學習
3.1 問題提出
3.2 一些相關(guān)度量
3.3 學習框架
3.3.1 種子選擇算法
3.3.2 訓練數(shù)據(jù)集更新
3.3.3 協(xié)同訓練策略
3.3.4 集成分類器
3.4 文本情感分類步驟
3.5 實驗設(shè)置
3.5.1 實驗數(shù)據(jù)
3.5.2 評價指標
3.5.3 訓練模式設(shè)計
3.6 實驗結(jié)果與分析
3.6.1 種子選擇方法
3.6.2 英文數(shù)據(jù)集上的比較實驗
3.6.3 中文數(shù)據(jù)集上的比較實驗
3.6.4 CASCT方法的穩(wěn)定性
3.7 本章小結(jié)
第四章 基于語言特征自動獲取的反問句識別
4.1 問題提出
4.2 反問句識別模型
4.2.1 反問句特征自動獲取模型
4.2.2 基于層疊注意力機制的反問句識別模型
4.3 實驗設(shè)置
4.3.1 數(shù)據(jù)集及評價指標
4.3.2 參數(shù)設(shè)置
4.4 實驗結(jié)果與分析
4.4.1 特征性能的比較實驗
4.4.2 特征數(shù)對識別效果的影響
4.4.3 綜合比較實驗
4.4.4 錯誤分析
4.5 本章小結(jié)
第五章 基于多信息融合的反諷句識別
5.1 問題提出
5.2 基于BERT的句子表示
5.3 融入顯式特征信息的句子表示
5.4 情感信息獲取
5.4.1 基于BERT的句子情感分類
5.4.2 句子情感差異表示
5.5 多信息融合的反諷句識別框架
5.6 實驗設(shè)置
5.6.1 實驗數(shù)據(jù)及評價指標
5.6.2 方法的比較方案
5.7 實驗結(jié)果與分析
5.7.1 特征的有效性對比實驗
5.7.2 與其他方法的對比實驗
5.8 本章小結(jié)
第六章 基于方面項情感分析的可解釋推薦
6.1 問題提出
6.2 方面項抽取
6.2.1 方面項情感判別
6.2.2 方面項確定
6.3 基于圖神經(jīng)網(wǎng)絡(luò)的推薦模型
6.3.1 用戶-產(chǎn)品圖建模
6.3.2 基于注意力機制的圖更新
6.3.3 模型輸出與訓練
6.4 產(chǎn)品評級策略
6.5 實驗設(shè)置
6.6 實驗結(jié)果與分析
6.6.1 產(chǎn)品評級融合參數(shù)的選取
6.6.2 產(chǎn)品評級策略對比實驗
6.6.3 與已有方法的比較
6.6.4 推薦的可解釋性
6.7 本章小結(jié)
第七章 總結(jié)及展望
7.1 主要結(jié)論
7.2 未來工作
參考文獻
攻讀博士學位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:2986474
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2986474.html
最近更新
教材專著