電商評論文本中的用戶情感傾向判定與主題分析
發(fā)布時間:2024-02-29 21:18
目前,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)購物已經(jīng)成為了大多數(shù)人購買物品的消費方式,很多人都會在平臺上留下對購買物品的看法,留下的這些評論無論是對后續(xù)購買者還是廠商都提供了很重要的參考。在此期間,受到大數(shù)據(jù)、人工智能的影響,智能音箱得到了快速的發(fā)展,不僅僅是因為它已經(jīng)漸漸成為了很多智能設(shè)備的控制入口,還有就是它的簡單易用、功能多樣,但是,如何從數(shù)以萬計的評論數(shù)據(jù)中選擇合適的音箱是很多人面臨的問題,通過對這些評論的分析,不僅僅是對消費者的選擇有所幫助,還有可以對廠商的更新?lián)Q代提供數(shù)據(jù)上的支持。本文選擇的數(shù)據(jù)是小愛音箱、天貓精靈、小度音箱的評論數(shù)據(jù),因為這幾款品牌的數(shù)據(jù)是很有代表性的,所以通過對它們的分析可以為市場上大部分人群提供可行的意見。首先是通過八爪魚采集器進行數(shù)據(jù)的采集,在天貓和京東上采集天貓精靈、小愛音箱和小度音箱的數(shù)據(jù),然后對這些數(shù)據(jù)進行預(yù)處理,因為經(jīng)過數(shù)據(jù)預(yù)處理的數(shù)據(jù)還是非結(jié)構(gòu)性的,這樣是不能被計算機識別的,所以這一步最終想要達成的目標(biāo)是將這些非結(jié)構(gòu)性的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)性的,從而能夠被計算機識別、分析。在情感分析中,因為機器學(xué)習(xí)的分類方法一般是需要有標(biāo)簽的數(shù)據(jù)的,所以本文首先通過基于詞典的方...
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感傾向性分析研究現(xiàn)狀
1.2.2 主題模型研究現(xiàn)狀
1.2.3 電商評論研究現(xiàn)狀
1.3 研究內(nèi)容及框架
2 研究方法及理論
2.1 文本挖掘
2.1.1 文本挖掘理論
2.1.2 文本預(yù)處理
2.1.3 文本的表示
2.1.4 特征的提取
2.2 情感傾向分析
2.3 機器學(xué)習(xí)算法
2.3.1 支持向量機
2.3.2 K近鄰算法
2.3.3 樸素貝葉斯
2.4 LDA主題模型
3 數(shù)據(jù)采集與預(yù)處理
3.1 數(shù)據(jù)的選取與采集
3.1.1 數(shù)據(jù)的選取
3.1.2 數(shù)據(jù)的采集
3.2 數(shù)據(jù)的預(yù)處理
3.2.1 數(shù)據(jù)的清洗
3.2.2 中文分詞與去停用詞
3.2.3 詞頻統(tǒng)計
3.3 本章小結(jié)
4 評論數(shù)據(jù)的情感傾向分析
4.1 基于詞典的情感分類
4.1.1 基礎(chǔ)詞典的構(gòu)建
4.1.2 否定詞典
4.1.3 情感分類結(jié)果
4.2 基于機器學(xué)習(xí)的分類
4.2.1 算法流程
4.2.2 實驗步驟
4.2.3 分類器性能評估
4.3 本章小結(jié)
5 消費者評論特征分析
5.1 基于詞云圖的可視化
5.2 基于LDA主題模型的特征分析
5.2.1 LDA最優(yōu)主題個數(shù)的確定
5.2.2 天貓精靈的負(fù)面主題分析
5.2.3 小愛音箱的負(fù)面主題分析
5.2.4 小度音箱的負(fù)面主題分析
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 不足與展望
參考文獻
后記
本文編號:3914937
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 情感傾向性分析研究現(xiàn)狀
1.2.2 主題模型研究現(xiàn)狀
1.2.3 電商評論研究現(xiàn)狀
1.3 研究內(nèi)容及框架
2 研究方法及理論
2.1 文本挖掘
2.1.1 文本挖掘理論
2.1.2 文本預(yù)處理
2.1.3 文本的表示
2.1.4 特征的提取
2.2 情感傾向分析
2.3 機器學(xué)習(xí)算法
2.3.1 支持向量機
2.3.2 K近鄰算法
2.3.3 樸素貝葉斯
2.4 LDA主題模型
3 數(shù)據(jù)采集與預(yù)處理
3.1 數(shù)據(jù)的選取與采集
3.1.1 數(shù)據(jù)的選取
3.1.2 數(shù)據(jù)的采集
3.2 數(shù)據(jù)的預(yù)處理
3.2.1 數(shù)據(jù)的清洗
3.2.2 中文分詞與去停用詞
3.2.3 詞頻統(tǒng)計
3.3 本章小結(jié)
4 評論數(shù)據(jù)的情感傾向分析
4.1 基于詞典的情感分類
4.1.1 基礎(chǔ)詞典的構(gòu)建
4.1.2 否定詞典
4.1.3 情感分類結(jié)果
4.2 基于機器學(xué)習(xí)的分類
4.2.1 算法流程
4.2.2 實驗步驟
4.2.3 分類器性能評估
4.3 本章小結(jié)
5 消費者評論特征分析
5.1 基于詞云圖的可視化
5.2 基于LDA主題模型的特征分析
5.2.1 LDA最優(yōu)主題個數(shù)的確定
5.2.2 天貓精靈的負(fù)面主題分析
5.2.3 小愛音箱的負(fù)面主題分析
5.2.4 小度音箱的負(fù)面主題分析
5.3 本章小結(jié)
6 總結(jié)與展望
6.1 論文總結(jié)
6.2 不足與展望
參考文獻
后記
本文編號:3914937
本文鏈接:http://sikaile.net/qiyeguanlilunwen/3914937.html
最近更新
教材專著