網(wǎng)絡(luò)商品評論細(xì)粒度情感分析系統(tǒng)關(guān)鍵技術(shù)研究
本文選題:網(wǎng)絡(luò)評論 切入點:數(shù)據(jù)獲取 出處:《大連海事大學(xué)》2017年碩士論文
【摘要】:網(wǎng)絡(luò)商品評論情感分析主要分為粗粒度的情感分析與細(xì)粒度的情感分析,粗粒度的情感極性分析重在用于判斷文本整體的情感傾向,主要的方法特征項選擇、特征項降維和特征項權(quán)重計算。粗粒度的情感分析并沒有從屬性角度出發(fā)更詳細(xì)地在解決消費者面臨的評論數(shù)據(jù)超載和識別過程復(fù)雜的問題,而細(xì)粒度的情感極性分析重在從評論中找出這些商品屬性,并判斷消費者對于各個屬性的情感傾向。為使情感分析的效用更加精準(zhǔn)的作用于某一屬性之上,并展示給大眾,本文利用網(wǎng)絡(luò)爬蟲技術(shù)獲取網(wǎng)絡(luò)評論語料,然后將語料中的屬性詞與情感詞抽取出來進(jìn)行細(xì)粒度情感傾向分析與計算,并設(shè)計相應(yīng)的系統(tǒng)將實驗分析與結(jié)果展示出來。本文主要研究工作為,首先利用Shark-PageRank主題爬取算法生成待爬取網(wǎng)頁隊列方法、Bloom Filter網(wǎng)頁去重方法和Jsoup網(wǎng)頁數(shù)據(jù)獲取方法三者相結(jié)合的網(wǎng)絡(luò)爬蟲技術(shù)進(jìn)行數(shù)據(jù)獲取,將抓取到的網(wǎng)絡(luò)評論作為語料庫。然后結(jié)合中文網(wǎng)絡(luò)評論語言表達(dá)方式的特點,使用一種基于語義分析的屬性詞與情感詞詞對聯(lián)合識別抽取的方法,并將該抽取方法與面向?qū)傩栽~的方法相結(jié)合提出了一種基于語義分析網(wǎng)絡(luò)評論細(xì)粒度情感分析方法。最后,在上述工作基礎(chǔ)上,結(jié)合Web前端技術(shù),設(shè)計了一個網(wǎng)絡(luò)評論細(xì)粒度情感分析系統(tǒng),此系統(tǒng)提供網(wǎng)絡(luò)評論數(shù)據(jù)獲取,網(wǎng)絡(luò)評論細(xì)粒度情感分析,并將評論文本的細(xì)粒度情感分析結(jié)果展示的功能。經(jīng)過對本論文的鉆研分析,可以將用戶評論的情感分析的精確性更深一步提升,并使其通過情感分析在商品屬性上進(jìn)行修整、制定消費決策等兩方面發(fā)揮更大的指導(dǎo)作用。
[Abstract]:The emotional analysis of online commodity reviews is mainly divided into coarse-grained emotional analysis and fine-grained emotional analysis. Coarse-grained affective polarity analysis is mainly used to judge the emotional tendency of the text as a whole. Coarse-grained emotional analysis does not address in more detail the complexity of comment data overload and identification process faced by consumers from the perspective of attributes. The fine-grained affective polarity analysis focuses on finding out these commodity attributes from the comments and judging the consumer's emotional propensity for each attribute, in order to make the utility of emotional analysis more accurate on one attribute and show it to the public. In this paper, the web crawler technology is used to obtain the network comment corpus, and then the attribute words and emotion words from the corpus are extracted for fine-grained emotional tendency analysis and calculation. And design the corresponding system to display the experimental analysis and results. Firstly, the Shark-PageRank topic crawling algorithm is used to generate the web crawler technology which combines the bloom Filter web page removal method and the Jsoup web page data acquisition method to obtain the data. The collected comments are used as a corpus, and then a method based on semantic analysis is used to identify and extract attribute words and affective words according to the characteristics of the Chinese network comment language. A fine-grained emotional analysis method based on semantic analysis for network comments is proposed by combining the extraction method with the attribute-oriented method. Finally, based on the above work, combined with the Web front-end technology, A fine-grained emotional analysis system for network comments is designed. The system provides data acquisition for network reviews and fine-grained emotional analysis for network reviews. Through the research and analysis of this paper, we can further enhance the accuracy of the emotional analysis of user comments, and make it through emotional analysis to modify the commodity attributes. Making consumer decisions and other two aspects to play a greater guiding role.
【學(xué)位授予單位】:大連海事大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 江騰蛟;萬常選;劉德喜;劉喜平;廖國瓊;;基于語義分析的評價對象-情感詞對抽取[J];計算機(jī)學(xué)報;2017年03期
2 于娟;劉強(qiáng);;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計算機(jī)工程與科學(xué);2015年02期
3 李光敏;張行文;張磊;楊朋英;;面向網(wǎng)絡(luò)輿情的評論文本情感分析研究[J];情報雜志;2014年05期
4 樓博文;許歆藝;蔡根;張辰;劉功申;;智能信息系統(tǒng)中手機(jī)產(chǎn)品評論的情感傾向分析[J];計算機(jī)技術(shù)與發(fā)展;2013年12期
5 楊格蘭;涂立;;基于主題相關(guān)性和鏈接權(quán)重的PageRank算法[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2012年S1期
6 宋雙永;李秋丹;路冬媛;;面向微博客的熱點事件情感分析方法[J];計算機(jī)科學(xué);2012年S1期
7 陳岳峰;苗奪謙;李文;張志飛;;基于概念的詞匯情感傾向識別方法[J];智能系統(tǒng)學(xué)報;2011年06期
8 張笛;;WORDNET與HOWNET之比較[J];青年文學(xué)家;2011年13期
9 李實;葉強(qiáng);李一軍;羅嗣卿;;挖掘中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征及情感傾向[J];計算機(jī)應(yīng)用研究;2010年08期
10 張翔;周明全;李智杰;董麗麗;;基于PageRank與Bagging的主題爬蟲研究[J];計算機(jī)工程與設(shè)計;2010年14期
相關(guān)博士學(xué)位論文 前1條
1 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
相關(guān)碩士學(xué)位論文 前3條
1 蔡啟煌;細(xì)粒度中文網(wǎng)絡(luò)消費評論情感極性分類方法研究[D];大連海事大學(xué);2016年
2 羅亞平;面向網(wǎng)絡(luò)輿情的中文評論文本情感傾向分析研究[D];東北財經(jīng)大學(xué);2010年
3 朱善宗;面向情感分析的特征抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年
,本文編號:1659791
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1659791.html