微博文本的細(xì)致情感分析研究
發(fā)布時(shí)間:2023-11-25 01:13
現(xiàn)如今,人們通過網(wǎng)絡(luò)社交平臺(tái)進(jìn)行信息分享和交流變得越來越普遍。微博所發(fā)出的內(nèi)容蘊(yùn)含的情感信息反應(yīng)出中國民眾的社會(huì)行為和情感極性傾向,已成為自然語言處理中的熱門研究話題之一。鑒于此,本文以微博數(shù)據(jù)為基礎(chǔ)開展了對(duì)于微博這一領(lǐng)域的用戶表達(dá)的情感進(jìn)行分析。本文的研究內(nèi)容如下所示:在基于情感詞典的研究中,仍存有大量沒有錄入情感詞典的新詞,現(xiàn)存的詞典對(duì)微博中情感極性詞包含得不夠全面。本文在建立的微博基礎(chǔ)詞典上構(gòu)建了一個(gè)拓充情感詞典,同時(shí)基于SOPMI算法實(shí)現(xiàn)對(duì)詞典的擴(kuò)充,構(gòu)建專屬于微博的領(lǐng)域情感詞典,并設(shè)計(jì)了一種將情感詞與特定的語義規(guī)則相結(jié)合的權(quán)重算法。傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析挖掘出的情感特征不全面。通過提出基于分類器的特征挖掘算法,在特征的選取與組合、特征的維度設(shè)定與分類算法的選取進(jìn)行實(shí)驗(yàn),獲得最佳分類器,以得到最好的細(xì)致情緒分類準(zhǔn)確率。如今花費(fèi)大量時(shí)間進(jìn)行人工特征提取已難以實(shí)現(xiàn)。本文提出了一種運(yùn)用詞向量結(jié)合深度學(xué)習(xí)混合模型的算法來訓(xùn)練數(shù)據(jù)內(nèi)容。首先應(yīng)用Word2vec神經(jīng)網(wǎng)絡(luò)語言模型生成詞向量代替人工提取的特征信息,隨后進(jìn)入本文提出的深度學(xué)習(xí)混合模型LChybrid模型的主體,提取詞向量中包含的...
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.1.1 選題背景
1.1.2 理論意義和應(yīng)用價(jià)值
1.2 研究現(xiàn)狀及發(fā)展趨勢
1.3 課題主要研究內(nèi)容
1.4 內(nèi)容組織安排
2 相關(guān)技術(shù)和理論概述
2.1 文本預(yù)處理技術(shù)
2.2 特征選擇
2.3 機(jī)器學(xué)習(xí)分類模型
2.4 Word2vec詞向量語言模型
2.5 分類評(píng)估性能
2.6 本章小結(jié)
3 數(shù)據(jù)的收集與預(yù)處理過程
3.1 微博數(shù)據(jù)的收集
3.2 微博數(shù)據(jù)的清洗
3.3 微博數(shù)據(jù)的篩選
3.4 本章小結(jié)
4 基于SOPMI擴(kuò)充詞典的語義權(quán)重算法
4.1 微博基礎(chǔ)詞典
4.2 拓充情感詞典
4.2.1 同義詞詞典的擴(kuò)充
4.2.2 網(wǎng)絡(luò)情感詞典的擴(kuò)充
4.2.3 微博表情詞典的擴(kuò)充
4.3 基于SOPMI算法的情感詞典擴(kuò)充
4.3.1 SOPMI算法
4.3.2 領(lǐng)域情感詞典
4.4 基于擴(kuò)展詞典的語義權(quán)重算法設(shè)計(jì)
4.4.1 算法主體設(shè)計(jì)思路
4.4.2 算法設(shè)計(jì)與實(shí)現(xiàn)
4.5 實(shí)驗(yàn)結(jié)果及分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)來源
4.5.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
4.5.3 結(jié)果分析
4.6 本章小結(jié)
5 基于LChybrid模型的情感分析算法
5.1 基于Word2vec模型的詞向量表示技術(shù)
5.2 基于LSTM模型的情感分析
5.3 基于CNN模型的情感分析
5.4 基于LChybrid模型的情感分析
5.5 基于分類器的情感分析
5.5.1 分類的基本流程
5.5.2 基于特征選擇的分類算法
5.5.3 實(shí)驗(yàn)結(jié)果及分析
5.6 基于LChybrid模型的情感分析實(shí)驗(yàn)
5.6.1 實(shí)驗(yàn)數(shù)據(jù)來源及平臺(tái)搭建
5.6.2 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果展示
5.6.3 實(shí)驗(yàn)結(jié)果分析
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號(hào):3866975
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.1.1 選題背景
1.1.2 理論意義和應(yīng)用價(jià)值
1.2 研究現(xiàn)狀及發(fā)展趨勢
1.3 課題主要研究內(nèi)容
1.4 內(nèi)容組織安排
2 相關(guān)技術(shù)和理論概述
2.1 文本預(yù)處理技術(shù)
2.2 特征選擇
2.3 機(jī)器學(xué)習(xí)分類模型
2.4 Word2vec詞向量語言模型
2.5 分類評(píng)估性能
2.6 本章小結(jié)
3 數(shù)據(jù)的收集與預(yù)處理過程
3.1 微博數(shù)據(jù)的收集
3.2 微博數(shù)據(jù)的清洗
3.3 微博數(shù)據(jù)的篩選
3.4 本章小結(jié)
4 基于SOPMI擴(kuò)充詞典的語義權(quán)重算法
4.1 微博基礎(chǔ)詞典
4.2 拓充情感詞典
4.2.1 同義詞詞典的擴(kuò)充
4.2.2 網(wǎng)絡(luò)情感詞典的擴(kuò)充
4.2.3 微博表情詞典的擴(kuò)充
4.3 基于SOPMI算法的情感詞典擴(kuò)充
4.3.1 SOPMI算法
4.3.2 領(lǐng)域情感詞典
4.4 基于擴(kuò)展詞典的語義權(quán)重算法設(shè)計(jì)
4.4.1 算法主體設(shè)計(jì)思路
4.4.2 算法設(shè)計(jì)與實(shí)現(xiàn)
4.5 實(shí)驗(yàn)結(jié)果及分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)來源
4.5.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
4.5.3 結(jié)果分析
4.6 本章小結(jié)
5 基于LChybrid模型的情感分析算法
5.1 基于Word2vec模型的詞向量表示技術(shù)
5.2 基于LSTM模型的情感分析
5.3 基于CNN模型的情感分析
5.4 基于LChybrid模型的情感分析
5.5 基于分類器的情感分析
5.5.1 分類的基本流程
5.5.2 基于特征選擇的分類算法
5.5.3 實(shí)驗(yàn)結(jié)果及分析
5.6 基于LChybrid模型的情感分析實(shí)驗(yàn)
5.6.1 實(shí)驗(yàn)數(shù)據(jù)來源及平臺(tái)搭建
5.6.2 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果展示
5.6.3 實(shí)驗(yàn)結(jié)果分析
5.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
本文編號(hào):3866975
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3866975.html
最近更新
教材專著