天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于電商在線評(píng)論的文本情感傾向性分析

發(fā)布時(shí)間:2024-05-11 11:52
  隨著互聯(lián)網(wǎng)的普及和移動(dòng)支付的快速發(fā)展,網(wǎng)上購(gòu)物成為人們生活中不可或缺的一部分,隨著商品銷量不斷增長(zhǎng),同時(shí)增長(zhǎng)的還有消費(fèi)者評(píng)論。消費(fèi)者在商品評(píng)論系統(tǒng)中留下自己的體驗(yàn)與感受,成為商家了解消費(fèi)者,消費(fèi)者了解其他消費(fèi)者的重要窗口,評(píng)論數(shù)據(jù)分析因此具有非常重要的現(xiàn)實(shí)意義。目前關(guān)于文本情感傾向性分析的研究大多數(shù)基于有標(biāo)簽的數(shù)據(jù),基于無(wú)標(biāo)簽文本數(shù)據(jù)的研究較少。本文基于挖掘的電商用戶評(píng)論數(shù)據(jù)分別研究了有標(biāo)簽數(shù)據(jù)和無(wú)標(biāo)簽數(shù)據(jù)的情感傾向性分析方法,并繼續(xù)對(duì)這兩類文本做了評(píng)論特征分析,研究具有重要的理論和實(shí)際意義。本文以京東商城的嬰兒奶嘴評(píng)論文本數(shù)據(jù)為研究對(duì)象,利用Python分別爬取了有標(biāo)簽的奶嘴評(píng)論數(shù)據(jù)和無(wú)標(biāo)簽的奶嘴綜合評(píng)論數(shù)據(jù)作為分析語(yǔ)料,對(duì)數(shù)據(jù)進(jìn)行清洗、分詞、去停用詞等預(yù)處理操作后對(duì)文本的情感傾向做了分類。對(duì)有標(biāo)簽的數(shù)據(jù),本文先采用構(gòu)建情感詞典的方法對(duì)其進(jìn)行情感分類,獲得了對(duì)應(yīng)的分類效果,然后運(yùn)用了三種文本特征提取方法—TF-IDF,Word2vec以及TF-IDF加權(quán)的Word2vec訓(xùn)練特征向量,并將三種方法獲得的特征向量劃分訓(xùn)練集和測(cè)試集用以訓(xùn)練隨機(jī)森林、支持向量機(jī)和邏輯回歸三種機(jī)器學(xué)習(xí)分類器...

【文章頁(yè)數(shù)】:71 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1CBOW和Skip-gram模型的網(wǎng)絡(luò)結(jié)構(gòu)示意圖

圖2.1CBOW和Skip-gram模型的網(wǎng)絡(luò)結(jié)構(gòu)示意圖

2文本挖掘與情感分析理論11是位置索引。訓(xùn)練好的CBOW和Skip-gram模型并不用來(lái)進(jìn)行進(jìn)一步的測(cè)試,而是選取此時(shí)輸入層和隱藏層之間的權(quán)重矩陣進(jìn)行下一步的文本分析。而Skip-gram模型的思路則與CBOW不同,其區(qū)別在于,將一個(gè)特定詞的詞向量作為輸入,特定詞對(duì)應(yīng)的上下文詞向....


圖2.2隨機(jī)森林算法流程圖

圖2.2隨機(jī)森林算法流程圖

重慶理工大學(xué)碩士學(xué)位論文14決定輸入的樣本應(yīng)該屬于哪一類,最多決策樹選擇的那一類就認(rèn)為是該輸入樣本的類別,隨機(jī)森林可以既可以處理屬性為離散值的量,如ID3算法,也可以處理屬性為連續(xù)值的量,如C4.5算法[37]。隨機(jī)森林的基礎(chǔ)模型是決策樹模型。決策樹(decisiontree)模....


圖2.3LDA模型

圖2.3LDA模型

重慶理工大學(xué)碩士學(xué)位論文16Ng,AndrewY.,Jordan[46]于2003年提出,該模型的基本思想是:在一篇文檔中可能包含多個(gè)主題,意味著一個(gè)主題會(huì)在多個(gè)文檔中出現(xiàn),但出現(xiàn)在每篇文檔的概率有所差別。而對(duì)每個(gè)主題來(lái)說(shuō),會(huì)包含多個(gè)關(guān)鍵詞,同一個(gè)關(guān)鍵詞也會(huì)在多個(gè)主題中出現(xiàn),但出....


圖4.1基于情感詞典的文本情感傾向分類混淆矩陣

圖4.1基于情感詞典的文本情感傾向分類混淆矩陣

4文本情感傾向分類27圖4.1基于情感詞典的文本情感傾向分類混淆矩陣4.1.2基于機(jī)器學(xué)習(xí)的情感分類(1)特征提取及計(jì)算在構(gòu)建分類器之前,需要把分詞轉(zhuǎn)換成計(jì)算機(jī)可以處理的詞向量,本節(jié)將采用三種不同的文本特征提取方法對(duì)分詞文本進(jìn)行向量化,即TF-IDF方法,Word2vec方法,以....



本文編號(hào):3969912

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3969912.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶42771***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com