面向電子商務(wù)評論文本的情感分析技術(shù)研究
發(fā)布時間:2020-08-24 23:35
【摘要】:隨著電子商務(wù)對人們生活產(chǎn)生深刻的影響,面向電子商務(wù)評論文本的情感分析研究也成為當(dāng)前的熱點研究方向。評論文本情感分析方法主要分為基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法,然而傳統(tǒng)的情感分析方法面對電子商務(wù)評論文本時在特征表示及提取等方面存在諸多不足,而豐富有效的特征提取是提升情感判別準(zhǔn)確率的關(guān)鍵因素。為了解決傳統(tǒng)情感分析模型在處理電子商務(wù)文本時特征構(gòu)建與使用方面存在的問題,本論文針對傳統(tǒng)情感分析方法提出了兩種改進(jìn)模型并在真實的中文電子商務(wù)評論上進(jìn)行試驗,驗證了我們提出的改進(jìn)方法的有效性。本文的主要工作有:第一,通過對情感詞典采用模板匹配的方式進(jìn)行擴(kuò)展和針對不同句型針對性分析評論語句情感值的計算方法,建立了基于情感詞典的改進(jìn)分析模型。本文首先對現(xiàn)有情感詞典進(jìn)行了收集和整理,同時對網(wǎng)絡(luò)詞典進(jìn)行收集并采用基于模板規(guī)則的方法對情感詞典進(jìn)行了拓展,獲取領(lǐng)域情感詞,構(gòu)建了面向電子商務(wù)評論的情感詞典。其次,本文引入決策樹對不同句型進(jìn)行分類,將句子分為四大類,包括肯定句、否定句、雙重否定句及反問句,然后針對每類句型設(shè)計情感值計算方法,并對雙重否定句以及反問句這兩類情感強度較強的句子做加權(quán)處理,實現(xiàn)整條評論的情感值計算來獲取其情感傾向性。最后,通過在京東部分商品評論數(shù)據(jù)上的實驗證明了改進(jìn)模型的情感判別效果明顯優(yōu)于傳統(tǒng)模型,充分體現(xiàn)本文提出的改進(jìn)模型的有效性。第二,通過融合詞向量特征建立了基于機(jī)器學(xué)習(xí)的改進(jìn)分析模型。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的分析方法對于評論這樣的短文本進(jìn)行特征表示時,存在特征稀疏問題。詞向量技術(shù)能實現(xiàn)文本的向量化表示,向量維度較低,并能有效對詞語之間的語義關(guān)系進(jìn)行建模。為了提取更為豐富準(zhǔn)確的文本特征,我們在第一部分拓展的情感詞典的基礎(chǔ)上基于詞向量技術(shù)對情感詞的向量表示進(jìn)行情感調(diào)整構(gòu)造情感詞向量,并利用TF-IDF值表征詞在文本中的重要性,作為詞向量的權(quán)重,最后將詞向量進(jìn)行加權(quán)疊加,形成文本的向量化表示。在此基礎(chǔ)上,將第一部分中基于情感詞典的分析模型輸出作為特征與本部分中的情感詞向量特征進(jìn)行融合,并通過機(jī)器學(xué)習(xí)方法進(jìn)行情感分析。實驗結(jié)果表明,改進(jìn)的基于機(jī)器學(xué)習(xí)的情感分析模型相比其它基礎(chǔ)模型在性能上有進(jìn)一步提升。
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F713.36;TP391.1
【圖文】:
造情感詞典,通過詞典分析文本中所有能夠影響情感表達(dá)的詞語,通常包括情感詞逡逑以及修飾詞,根據(jù)情感詞語及其修飾詞的情感強度賦予其對應(yīng)的權(quán)重值,然后綜合逡逑加權(quán)來計算文本情感值;谇楦性~典的分析流程如圖2-1所示:逡逑評論文本邋邐?文本預(yù)處理一?捐感詞匹配——?情感值計算——?憧感分類逡逑1邐邐_J邋邐邐邐邋邐邋邐逡逑情感詞典逡逑圖2-1基于情感詞典的分析流程逡逑基于情感詞典的分析方法關(guān)鍵之一是情感詞典的構(gòu)建,情感詞典主要由具有情逡逑感傾向性的情感詞語構(gòu)成,同時也包括副詞及否定詞等修飾情感傾向性的詞語。目逡逑前的研究工作中常用的情感詞典構(gòu)建方法主要分成兩種,第一種是以受到廣泛認(rèn)可逡逑的情感詞典,例如知網(wǎng)等為基礎(chǔ),再根據(jù)情感分類問題所屬的具體領(lǐng)域,針對性的逡逑構(gòu)建特定研宄領(lǐng)域所需的情感詞典;第二種是根據(jù)特定情感分類領(lǐng)域的特點,完全逡逑由人工通過收集整理的方式,構(gòu)建特定領(lǐng)域的情感詞典。顯然第一種方法構(gòu)建情感逡逑詞典的方法有前人的研宄工作作為基礎(chǔ),構(gòu)建起來速度更快,任務(wù)量更小,可以在逡逑相對較短的時間里完成情感詞典的構(gòu)建;相反第二種方法無任何現(xiàn)有詞典作為基礎(chǔ)
3.1基于情感詞典的基礎(chǔ)分析模型逡逑基于情感詞典的情感分析過程主要包括:情感詞典的構(gòu)建、文本預(yù)處理、利用逡逑規(guī)則計算句子的情感值,如圖3-1所示,其中關(guān)鍵的工作是情感詞典的構(gòu)建和情感逡逑極性值的計算。逡逑12逡逑
現(xiàn)存情感詞典包含情感詞有限,雖然已通過人工收集整理的方式獲取了很多網(wǎng)逡逑絡(luò)新詞,但情感詞典的覆蓋程度仍然很低,我們采用一種較簡單的挖掘情感新詞的逡逑方法,即基于模板規(guī)則的方法,利用該方法挖掘領(lǐng)域情感詞的流程如圖3-2所示。逡逑評論ifiS溯逡逑處理逡逑詞頻統(tǒng)計邐構(gòu)建規(guī)則逡逑t邐/"I逡逑挑選基sE提取候選詞逡逑TJX逡逑計算候選詞?一
本文編號:2802980
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F713.36;TP391.1
【圖文】:
造情感詞典,通過詞典分析文本中所有能夠影響情感表達(dá)的詞語,通常包括情感詞逡逑以及修飾詞,根據(jù)情感詞語及其修飾詞的情感強度賦予其對應(yīng)的權(quán)重值,然后綜合逡逑加權(quán)來計算文本情感值;谇楦性~典的分析流程如圖2-1所示:逡逑評論文本邋邐?文本預(yù)處理一?捐感詞匹配——?情感值計算——?憧感分類逡逑1邐邐_J邋邐邐邐邋邐邋邐逡逑情感詞典逡逑圖2-1基于情感詞典的分析流程逡逑基于情感詞典的分析方法關(guān)鍵之一是情感詞典的構(gòu)建,情感詞典主要由具有情逡逑感傾向性的情感詞語構(gòu)成,同時也包括副詞及否定詞等修飾情感傾向性的詞語。目逡逑前的研究工作中常用的情感詞典構(gòu)建方法主要分成兩種,第一種是以受到廣泛認(rèn)可逡逑的情感詞典,例如知網(wǎng)等為基礎(chǔ),再根據(jù)情感分類問題所屬的具體領(lǐng)域,針對性的逡逑構(gòu)建特定研宄領(lǐng)域所需的情感詞典;第二種是根據(jù)特定情感分類領(lǐng)域的特點,完全逡逑由人工通過收集整理的方式,構(gòu)建特定領(lǐng)域的情感詞典。顯然第一種方法構(gòu)建情感逡逑詞典的方法有前人的研宄工作作為基礎(chǔ),構(gòu)建起來速度更快,任務(wù)量更小,可以在逡逑相對較短的時間里完成情感詞典的構(gòu)建;相反第二種方法無任何現(xiàn)有詞典作為基礎(chǔ)
3.1基于情感詞典的基礎(chǔ)分析模型逡逑基于情感詞典的情感分析過程主要包括:情感詞典的構(gòu)建、文本預(yù)處理、利用逡逑規(guī)則計算句子的情感值,如圖3-1所示,其中關(guān)鍵的工作是情感詞典的構(gòu)建和情感逡逑極性值的計算。逡逑12逡逑
現(xiàn)存情感詞典包含情感詞有限,雖然已通過人工收集整理的方式獲取了很多網(wǎng)逡逑絡(luò)新詞,但情感詞典的覆蓋程度仍然很低,我們采用一種較簡單的挖掘情感新詞的逡逑方法,即基于模板規(guī)則的方法,利用該方法挖掘領(lǐng)域情感詞的流程如圖3-2所示。逡逑評論ifiS溯逡逑處理逡逑詞頻統(tǒng)計邐構(gòu)建規(guī)則逡逑t邐/"I逡逑挑選基sE提取候選詞逡逑TJX逡逑計算候選詞?一
本文編號:2802980
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2802980.html
最近更新
教材專著