產(chǎn)品評論的方面級觀點挖掘技術(shù)研究
發(fā)布時間:2024-03-23 04:33
隨著互聯(lián)網(wǎng)和網(wǎng)絡(luò)購物的日益流行,產(chǎn)品的評論通常被作為是否選購該產(chǎn)品的重要依據(jù),因此,如何從大規(guī)模的產(chǎn)品評論中高效地獲取到對潛在消費者和商家更具有價值的信息逐漸成為研究熱點。本文對產(chǎn)品評論進行方面級觀點挖掘技術(shù)研究,能夠快速準(zhǔn)確地獲取到產(chǎn)品各屬性的評價情況,對潛在消費者選購和商家改進產(chǎn)品都有重要意義。本文的主要研究工作如下:1.針對目前多數(shù)評價搭配抽取方法存在人工標(biāo)注工作量高、依賴于外部情感詞典和動詞詞性考慮較少等問題,提出了一種基于規(guī)則的評價搭配抽取方法。該方法通過詞性、依存句法分析和語義依存分析的結(jié)果制定規(guī)則,首先進行核心搭配的抽取,然后引入識別并列評價對象的算法及改進的識別修飾成分的算法,結(jié)合核心搭配組成部分的不同詞性進一步制定規(guī)則來識別完整的評價對象和評價短語。在中文手機評論數(shù)據(jù)集上進行實驗的準(zhǔn)確率達(dá)到71.95%,召回率達(dá)到66.74%,F1值達(dá)到69.25%;在中文酒店評論數(shù)據(jù)集上進行實驗的準(zhǔn)確率達(dá)到60.42%,召回率達(dá)到62.24%,F1值達(dá)到61.31%。實驗結(jié)果表明本文方法進行評價搭配抽取的有效性。2.針對已有的方面級情感分類研究中,大多數(shù)方法通常需要構(gòu)建完善的情感詞...
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3935464
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1.1近5年我國網(wǎng)民和網(wǎng)購用戶規(guī)模變化趨勢
第1章緒論1.1研究背景及意義近年來,伴隨著信息技術(shù)的迅猛發(fā)展和計算機、手機等網(wǎng)絡(luò)設(shè)備的普及,互聯(lián)網(wǎng)已經(jīng)與人們的日常生活密不可分,如微博、淘寶、京東等熱門應(yīng)用的頻繁使用,人們也更加傾向于在這些網(wǎng)絡(luò)平臺上發(fā)表自己對產(chǎn)品以及熱門事件的看法和情感。2019年2月28日....
圖2.9Sigmoid函數(shù)圖像
用機器學(xué)習(xí)的方式,在本文的后續(xù)研究中、樸素貝葉斯和K-最近鄰法等機器學(xué)習(xí)模sticRegression,簡稱LR)屬于概率型回歸,。它的基本思想是對分類邊界建立回歸公屬于某個類別的概率就越大,否則樣本屬活函數(shù)Sigmoid如公式2.3所示:1()1zgze像....
圖5.3產(chǎn)品的觀點挖掘結(jié)果
53圖5.3產(chǎn)品的觀點挖掘結(jié)果圖5.3中,第一個柱狀圖展示了消費者評論最多的10個產(chǎn)品屬性,以及綠色的柱代表每個屬性的好評率、橙色的柱表示中評率、紅色的柱對應(yīng)為差評率;左下角的餅圖表示消費者好評最多的5個產(chǎn)品屬性;右下角的餅圖表示消費者最不滿意的5個產(chǎn)品屬性。通....
本文編號:3935464
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3935464.html
最近更新
教材專著