天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

關(guān)于酒店評(píng)論情感傾向的統(tǒng)計(jì)分析

發(fā)布時(shí)間:2020-12-19 14:28
  隨著互聯(lián)網(wǎng)+的逐漸普及,越來(lái)越多的商品采取線(xiàn)上的形式進(jìn)行銷(xiāo)售,不僅包括實(shí)物類(lèi)商品,還有諸多服務(wù)類(lèi)商品(酒店預(yù)訂、在線(xiàn)打車(chē)、家政服務(wù)等)。消費(fèi)者也不僅僅是商品信息的獲取方,更多時(shí)候可以作為信息的輸出方,對(duì)商品進(jìn)行評(píng)價(jià)、描述、建議,海量的商品加上海量的數(shù)據(jù),這也導(dǎo)致互聯(lián)網(wǎng)的信息量呈指數(shù)型的增長(zhǎng)。通過(guò)對(duì)這些文本信息進(jìn)行分析,識(shí)別出潛在有價(jià)值的內(nèi)容,了解這些信息的情感傾向——積極或是消極等,有助于挖掘出其中更有價(jià)值的內(nèi)容,幫助商家獲取新的市場(chǎng)機(jī)遇,給出消費(fèi)者更多更好的消費(fèi)意見(jiàn),給人們帶來(lái)生活上的便利。但在如此海量級(jí)別的信息數(shù)據(jù)下,想要了解用戶(hù)對(duì)商品的評(píng)價(jià)情感,只靠人力去解讀這些信息,工作量巨大,還存在許多主觀意識(shí)和客觀環(huán)境的影響。因此,為了更方便迅速的了解用戶(hù)對(duì)商品評(píng)價(jià)的情感趨勢(shì),提取大數(shù)據(jù)下的有效信息,本文采取機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法,針對(duì)收集的酒店評(píng)論數(shù)據(jù)集(包含覃建波老師的10000條和網(wǎng)絡(luò)爬蟲(chóng)獲取的5000條酒店評(píng)論數(shù)據(jù)集,積極語(yǔ)料和消極語(yǔ)料的比例為2:1)來(lái)進(jìn)行情感分類(lèi)分析,為消費(fèi)者和商家?guī)?lái)對(duì)于商品信息更為直觀的認(rèn)識(shí)。本文最終通過(guò)一系列的模型訓(xùn)練,選擇出效果較為理想的模型,能夠?qū)⒃u(píng)... 

【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:54 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

關(guān)于酒店評(píng)論情感傾向的統(tǒng)計(jì)分析


圖2.2?PV-DM模型圖??PV-DBOW模型則與PV-DM模型有所不同,它輸入的就是段落的向量,并且采??

示意圖,示意圖,樣本點(diǎn),原數(shù)據(jù)


綠色的點(diǎn)為待測(cè)樣本,灰色三角與紅色正方形均為原數(shù)據(jù)樣本點(diǎn),??sl和class2兩類(lèi),在給定k=l的情況下,與待測(cè)數(shù)據(jù)距離最近的一個(gè)點(diǎn)??形,則綠色樣本點(diǎn)被分類(lèi)到dass2。在給定k=5的情況下,距離待測(cè)樣??5個(gè)原數(shù)據(jù)樣本點(diǎn)為3個(gè)灰色三角和2兩個(gè)紅色正方形,那么待測(cè)樣本??classl。因此k值的選擇是十分重要的,對(duì)于待測(cè)數(shù)據(jù)的預(yù)測(cè)結(jié)果有著??鄰算法中,通過(guò)計(jì)算對(duì)象間距離來(lái)作為各個(gè)對(duì)象之間的非相似性指標(biāo),??之間的匹配問(wèn)題,在這里距離一般使用歐氏距離或曼哈頓距離:??式距離:〇^,乂)=反(x廣凡)??V是=1??距離:6?(1,>0?=?^^丨:^->^丨??近鄰算法的具體描述為:??算待測(cè)數(shù)據(jù)點(diǎn)與訓(xùn)練數(shù)據(jù)點(diǎn)之間的距離;??離的遠(yuǎn)近程度,依次排序這些訓(xùn)練數(shù)據(jù)點(diǎn);??擇距離最短的K個(gè)樣本點(diǎn);??前K個(gè)點(diǎn)在所在類(lèi)別出現(xiàn)的頻率;??個(gè)點(diǎn)中出現(xiàn)頻率最高的點(diǎn)作為測(cè)試數(shù)據(jù)點(diǎn)的預(yù)測(cè)分類(lèi)。??

示意圖,原數(shù)據(jù),示意圖,誤差率


圖3.2?6折交叉示意圖??上圖所示,第一行為原數(shù)據(jù)集,被均等切分為了?6份。第二到七行分別代表??數(shù)據(jù)中選取一份作為測(cè)試集,其他作為訓(xùn)練集的切分結(jié)果。在這六種不同的??據(jù)上,分別進(jìn)行模型訓(xùn)練,在測(cè)試集上得到誤差率,最后平均下來(lái)即是K折??證的誤差率。一般來(lái)講,折交叉驗(yàn)證法的K一般是大于2的,不然就沒(méi)有交??的意義了。K折交叉驗(yàn)證法可以有效的避免過(guò)擬合以及欠擬合狀態(tài)的發(fā)生,??

【參考文獻(xiàn)】:
期刊論文
[1]基于多任務(wù)深度學(xué)習(xí)的文本情感原因分析[J]. 余傳明,李浩男,安璐.  廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(01)
[2]基于文本挖掘的我國(guó)人工智能產(chǎn)業(yè)政策量化研究[J]. 袁野,于敏敏,陶于祥,龔振煒,劉繼明.  中國(guó)電子科學(xué)研究院學(xué)報(bào). 2018(06)
[3]基于改進(jìn)的K-means算法在文本挖掘中的應(yīng)用[J]. 楊丹,朱世玲,卞正宇.  計(jì)算機(jī)技術(shù)與發(fā)展. 2019(04)
[4]Convolutional Neural Network Based on Spatial Pyramid for Image Classification[J]. Gaihua Wang,Meng Lü,Tao Li,Guoliang Yuan,Wenzhou Liu.  Journal of Beijing Institute of Technology. 2018(04)
[5]Real-time object segmentation based on convolutional neural network with saliency optimization for picking[J]. CHEN Jinbo,WANG Zhiheng,LI Hengyu.  Journal of Systems Engineering and Electronics. 2018(06)
[6]在線(xiàn)評(píng)論文本挖掘?qū)﹄娚痰挠绊懷芯縖J]. 崔永生.  中國(guó)商論. 2018(33)
[7]基于深度學(xué)習(xí)的多維特征微博情感分析[J]. 金志剛,胡博宏,張瑞.  中南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(05)
[8]基于卷積神經(jīng)網(wǎng)絡(luò)的文檔特征提取方法[J]. 劉鋼,李宗晨,郭建偉.  江蘇科技信息. 2018(14)
[9]招聘過(guò)程中中小企業(yè)與求職者間的博弈分析[J]. 賀琦.  人才資源開(kāi)發(fā). 2017(24)
[10]基于卷積神經(jīng)網(wǎng)絡(luò)模型的互聯(lián)網(wǎng)短文本情感分類(lèi)[J]. 劉小明,張英,鄭秋生.  計(jì)算機(jī)與現(xiàn)代化. 2017(04)

博士論文
[1]提取商品特征和情感詞的語(yǔ)義約束LDA模型研究[D]. 彭云.江西財(cái)經(jīng)大學(xué) 2016

碩士論文
[1]基于向量空間模型的文本內(nèi)容篩查方法研究[D]. 蔡禮高.電子科技大學(xué) 2018
[2]基于詞典和機(jī)器學(xué)習(xí)組合的情感分析[D]. 丁蔚.西安郵電大學(xué) 2017
[3]多層卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法的應(yīng)用研究[D]. 張萬(wàn)亞.西安電子科技大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[5]基于演化博弈論的人力資本定價(jià)研究[D]. 董江鵬.天津大學(xué) 2017
[6]企業(yè)員工招聘中信息不對(duì)稱(chēng)的演化博弈分析[D]. 劉金鳳.東北石油大學(xué) 2012
[7]企業(yè)招聘中的大學(xué)生誠(chéng)信缺失研究[D]. 呂軍戰(zhàn).西北大學(xué) 2011



本文編號(hào):2926060

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2926060.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)4065f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com