天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于Stacking的酒店評論情感分析研究

發(fā)布時間:2021-08-14 23:52
  隨著互聯(lián)網(wǎng)的迅速發(fā)展,人們經(jīng)常在網(wǎng)上預訂酒店。但是網(wǎng)絡上的酒店評論良莠不齊,面對五花八門的信息時,僅僅依靠人工瀏覽是費時且費力的。通過使用機器學習領域的某些方法,對大量的酒店評論信息進行情感分析,這不僅可以極大的方便消費者網(wǎng)上預訂酒店,而且對于酒店商家和互聯(lián)網(wǎng)平臺來說也是至關(guān)重要的。對于酒店評論的情感分析,常用的TF-IDF加權(quán)方法只片面的關(guān)注了特征的詞頻和文檔數(shù)。同時,在分類過程中單一的機器學習模型也往往由于某種缺陷,影響文本的分類結(jié)果。因此,本文在現(xiàn)有基礎上改進了傳統(tǒng)的TF-IDF加權(quán)方法,提出了一種基于集成的情感分類模型。本文的主要工作如下:(1)對酒店評論文本進行預處理。首先是簡單的清理酒店評論文本,包括去重、去掉無意義的字符、正確劃分評論的所屬類別等。然后為了在酒店評論的情感分析中,準確區(qū)分評論中的情感極性詞,構(gòu)建了由通用的已有詞典和人工抽取的酒店情感詞組成的情感詞典。最后針對分詞中存在著情感詞識別和新詞識別這兩個問題,引入自定義詞典對評論文本進行了分詞操作。(2)使用Word2Vec對預處理后的酒店評論進行特征提取,得到文本的特征向量。由于傳統(tǒng)的TF-IDF加權(quán)方法忽略了特... 

【文章來源】:重慶大學重慶市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:60 頁

【學位級別】:碩士

【部分圖文】:

基于Stacking的酒店評論情感分析研究


訓練文本的不同劃分x

原理圖,原理,超平面,最優(yōu)超平面


重慶大學碩士學位論文2情感分析的相關(guān)技術(shù)12C中只有B可以成功區(qū)分不同類型的文本成為超平面。圖2.3訓練文本的不同劃分圖2.4SVM的原理Figure2.3DifferentdivisionsoftrainingtextsFigure2.4TheprincipleofSVM通常分類超平面很多,但是最優(yōu)超平面只有一個,同時最優(yōu)超平面的兩側(cè)存在兩個互相平行的超平面,作為間隔邊界來判斷樣本的分類。最優(yōu)超平面的分類間隔必須最大,也就是可以使兩個邊界之間的距離達到最大,這樣在對文本進行分類時,不僅能成功分離正反兩類樣本,同時還能以最大的概率區(qū)分模糊的實例點,從而提高分類的準確率。如圖2.4所示,C是超平面,A和B則分別位于C兩側(cè)且互相平行。假設以x={x1,…,xn},y={y1,…,yn}y∈{1,1}作為樣本集,超平面C的計算公式為:wx+b=0(2.1)參數(shù)w和b分別為法向量和截距。A和B作為間隔邊界,對樣本進行分類:wxi+b≥+1ifyi=+1(2.2)wxi+b≤1ifyi=1(2.3)即yi[(wxi)+b]≥+1i=1,2,…,n(2.4)樣本點(xi,yi)到超平面的最小幾何間隔為:γ=mini=1,2,…,nyi(w|w|xi+b|w|)(2.5)支持向量機的目的是求出最優(yōu)超平面,使得幾何間隔最大從而分隔不同類型的樣本,所以公式2.5可以進一步轉(zhuǎn)換為:maxw,bγs.t.yiw|w|xi+b|w|≥γ,i=1,2,…,n(2.6)結(jié)合SVM的優(yōu)化思想(考慮到不同形式的間隔關(guān)聯(lián)以及變量||w||的最大化和ABCxyABCxyd=2/||w||

基于Stacking的酒店評論情感分析研究


KNN的分類結(jié)果

【參考文獻】:
期刊論文
[1]基于半監(jiān)督學習的微博情感分析[J]. 陳珂,黎樹俊,謝博.  計算機與數(shù)字工程. 2018(09)
[2]基于依存句法關(guān)系的文本情感分類研究[J]. 張慶慶,劉西林.  計算機工程與應用. 2015(22)
[3]決策樹算法綜述[J]. 謝妞妞.  軟件導刊. 2015(11)
[4]一種語句級細粒度情感傾向性分析算法研究[J]. 黃高峰,周學廣.  計算機應用與軟件. 2015(04)
[5]基于主題的文本句情感分析[J]. 王磊,苗奪謙,張志飛,余鷹.  計算機科學. 2014(03)
[6]面向用戶觀點分析的多分類器集成和優(yōu)化技術(shù)[J]. 林煜明,朱濤,王曉玲,周傲英.  計算機學報. 2013(08)
[7]基于主題情感混合模型的無監(jiān)督文本情感分析[J]. 孫艷,周學廣,付偉.  北京大學學報(自然科學版). 2013(01)

碩士論文
[1]基于深度學習中文分詞的研究[D]. 王夢鴿.西安郵電大學 2018
[2]用Stacking算法堆積隨機森林、GBDT、SVM、Adaboost等七種算法的多因子選股模型[D]. 李佩琛.浙江工商大學 2018
[3]Stacking算法的研究及改進[D]. 徐慧麗.華南理工大學 2018
[4]基于stacking組合的文本情感分類研究[D]. 袁策書.華中師范大學 2017
[5]面向中文產(chǎn)品評論數(shù)據(jù)的情感分析模型設計及評估[D]. 李洋.北京郵電大學 2017



本文編號:3343416

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3343416.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶48074***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com