天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于網(wǎng)絡(luò)評論挖掘的商品綜合評分模型研究

發(fā)布時間:2018-08-17 16:22
【摘要】:隨著互聯(lián)網(wǎng)成為中國網(wǎng)民購物的一個重要渠道,網(wǎng)絡(luò)評論也充斥著每個購物平臺,網(wǎng)絡(luò)產(chǎn)品評論所提供的信息也影響著消費(fèi)者的購物行為。由于網(wǎng)絡(luò)產(chǎn)品評論的數(shù)據(jù)量非常巨大,并且其中摻雜著很多無意義的,甚至惡意的垃圾評論,對于用戶來說瀏覽如此龐大數(shù)量的評論會浪費(fèi)時間,且獲取到的信息不一定完全真實(shí)可靠。分析目前各大主流購物網(wǎng)站的現(xiàn)狀,發(fā)現(xiàn)目前網(wǎng)站普遍采用五分制的評分來直觀展示消費(fèi)者對產(chǎn)品的打分,這種評分和評論內(nèi)容獨(dú)立的情況導(dǎo)致用戶不僅要看評分還要看評論內(nèi)容才能確定評論所表達(dá)的準(zhǔn)確信息。鑒于上述一系列的復(fù)雜現(xiàn)狀,本文基于網(wǎng)絡(luò)評論挖掘,并結(jié)合垃圾評論識別研究如何構(gòu)建一個商品綜合評分模型。本文研究的最終結(jié)果是構(gòu)建一個商品綜合評分模型,其中最主要的過程是評論內(nèi)容的情感分析。評論內(nèi)容情感分析中首先通過分詞系統(tǒng)進(jìn)行評論的預(yù)處理,利用Apriori算法和剪枝方法提取特征詞。然后結(jié)合HowNet和《同義詞詞林》擴(kuò)充極性詞數(shù)量,并且參照《中文情感詞匯本體庫》對極性詞進(jìn)行情感強(qiáng)度的標(biāo)注,完善極性詞詞典內(nèi)容。最后利用隸屬度方法提取特征-觀點(diǎn)詞對,并分析程度副詞和否定詞對觀點(diǎn)詞的影響,計(jì)算的評論內(nèi)容情感值有效反應(yīng)了評論者的情感。并且在評論內(nèi)容情感分析的基礎(chǔ)上,本文提出融合評論者行為和評論內(nèi)容的垃圾評論識別方法,分析了進(jìn)行垃圾識別的評論者行為和評論內(nèi)容特征,并采用KNN分類器有效地對評論進(jìn)行是否為垃圾評論的分類。最終的模型構(gòu)建綜合考慮評分、評論者專業(yè)能力、評論內(nèi)容的情感值、評論歸屬(是否為垃圾評論)四個因素,模型有兩部分組成:單條評論的評分模型、商品的評分模型。最后給出實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)來自數(shù)據(jù)堂提供的兩款手機(jī)和一款筆記本的評論數(shù)據(jù)。本文分別對產(chǎn)品特征詞提取、特征-觀點(diǎn)詞對提取、評論內(nèi)容情感分析、垃圾評論識別和綜合評分模型進(jìn)行實(shí)驗(yàn),并對結(jié)果進(jìn)行分析,實(shí)驗(yàn)結(jié)果表明,本文在構(gòu)建模型中提出的方法具有合理性和有效性。
[Abstract]:As the Internet has become an important channel for Chinese Internet users to shop, online reviews are also flooded with every shopping platform, and the information provided by online product reviews also affects consumers' shopping behavior. Because there is a huge amount of data in web product reviews, and there are a lot of meaningless, even malicious spam comments, it is a waste of time for users to browse such a large number of comments. And the information obtained is not necessarily true and reliable. By analyzing the current situation of major shopping websites, we find that at present websites generally use a five-point rating system to visually show consumers' scoring of products. This independent rating and comment content leads users to see not only the rating but also the content of the comment to determine the exact information expressed by the comment. In view of the complex status of the above series, this paper based on the network comment mining, and combined with the garbage comment recognition research how to build a product comprehensive scoring model. The final result of this study is to construct a comprehensive commodity scoring model, in which the main process is the emotional analysis of the content of comment. In the emotional analysis of comment content, the word segmentation system is used to preprocess the comment, and the Apriori algorithm and pruning method are used to extract the feature words. Then the number of polar words is expanded with HowNet and "synonym forest", and the polar words are annotated with reference to "Chinese emotional Vocabulary Noumenon" to improve the content of polarity word dictionary. Finally, we use the method of membership degree to extract the Feature-Viewpoint word pair, and analyze the influence of degree adverb and negative word on the opinion word, and calculate the emotional value of the comment content to reflect the reviewer's emotion effectively. And on the basis of emotional analysis of comment content, this paper proposes a method of garbage comment recognition, which combines the behavior of commenters and the content of comments, and analyzes the characteristics of commenters' behaviors and comments' content. KNN classifier is used to classify comments effectively. The final model consists of four factors: the rating, the professional ability of the reviewer, the emotional value of the content of the comment, and whether the comment belongs to the spam. The model consists of two parts: the single comment scoring model and the commodity rating model. In the end, the experimental data are obtained from two mobile phones and one notebook provided by Datacom. In this paper, product feature word extraction, feature-viewpoint word pair extraction, comment content emotion analysis, garbage comment recognition and comprehensive scoring model are tested, and the results are analyzed. The experimental results show that, The method proposed in this paper is reasonable and effective.
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F713.36;F713.55

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 尹群;;信用評分模型中的拒絕推斷[J];商場現(xiàn)代化;2010年27期

2 李雪含;楊吉峰;;信用風(fēng)險評分模型初探[J];現(xiàn)代經(jīng)濟(jì)信息;2012年11期

3 張景肖;魏秋萍;姜玉霞;張波;;基于兩階段思想處理拒絕推斷的信用評分模型[J];數(shù)理統(tǒng)計(jì)與管理;2012年06期

4 陳強(qiáng);陳文彬;;關(guān)于零售評分模型部署方式的理論及實(shí)證研究[J];金融監(jiān)管研究;2013年04期

5 劉樹紅;黃擎明;;可加性評分模型指標(biāo)間相關(guān)性處理和權(quán)重確定的研究[J];數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究;1990年11期

6 陳文華;;信用評分模型與方法[J];中國信用卡;2007年06期

7 黎玉華;;信用卡行為評分模型的開發(fā)[J];征信;2013年09期

8 李瑞麗,沈薇;利用統(tǒng)計(jì)學(xué)方法建立消費(fèi)信貸評分模型[J];經(jīng)濟(jì)與管理;2005年04期

9 鄧超;胡威;唐瑩;;基于拒絕推論的小企業(yè)信用評分模型研究[J];國際金融研究;2011年04期

10 魏秋萍;張景肖;張波;;基于核函數(shù)法進(jìn)行拒絕推斷的信用評分模型[J];統(tǒng)計(jì)與決策;2012年12期

相關(guān)會議論文 前4條

1 毛建軍;蔡衛(wèi)民;;個人信用評分模型比較研究[A];科學(xué)發(fā)展觀與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會第十四屆學(xué)術(shù)年會論文集[C];2006年

2 楊文斌;陳恩強(qiáng);白浪;陳學(xué)兵;馮萍;唐紅;;三種終末期肝病評分模型對早中期慢性重型乙型肝炎患者短期預(yù)后的評估價值[A];第6屆全國疑難及重癥肝病大會論文集[C];2011年

3 秦宛順;石慶焱;;一個基于Logistic回歸的個人信用評分模型[A];21世紀(jì)數(shù)量經(jīng)濟(jì)學(xué)(第4卷)[C];2003年

4 陳希鎮(zhèn);;關(guān)于評分模型的研究[A];全國教育與心理統(tǒng)計(jì)測量學(xué)術(shù)年會論文摘要集[C];2006年

相關(guān)重要報紙文章 前2條

1 記者王宙;我國個人通用信用評分模型研究取得階段性成果[N];中國社會科學(xué)報;2010年

2 記者  周萃;信用評分模型有助于緩解小企業(yè)融資瓶頸[N];金融時報;2006年

相關(guān)博士學(xué)位論文 前1條

1 朱艷敏;基于信用評分模型的小微企業(yè)貸款的可獲得性研究[D];蘇州大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 謝榮華;多維項(xiàng)目反應(yīng)理論等級評分模型的參數(shù)估計(jì)[D];西南大學(xué);2015年

2 劉炯;科研論文影響力評估方法研究[D];華南理工大學(xué);2015年

3 肖洋洋;漢語L_2口語的文本特征及評分模型初探[D];南京大學(xué);2014年

4 張紅艷;基于河南省某農(nóng)村人群的2型糖尿病風(fēng)險評分模型研究[D];鄭州大學(xué);2016年

5 陳薇;乙型肝炎病毒相關(guān)性肝細(xì)胞癌預(yù)測模型的驗(yàn)證及優(yōu)化[D];福建醫(yī)科大學(xué);2015年

6 史玲玲;基于網(wǎng)絡(luò)評論挖掘的商品綜合評分模型研究[D];杭州電子科技大學(xué);2016年

7 徐偉;基于信用評分模型的民營企業(yè)信用評級研究[D];廣東商學(xué)院;2010年

8 肖涵敏;基于項(xiàng)目節(jié)點(diǎn)的項(xiàng)目評分模型及其應(yīng)用研究[D];西南大學(xué);2012年

9 傅強(qiáng);基于集成化的個人信用評分模型研究[D];華中科技大學(xué);2009年

10 曾輝;基于數(shù)據(jù)挖掘的銀行個人客戶信用評分模型的研究[D];對外經(jīng)濟(jì)貿(mào)易大學(xué);2007年

,

本文編號:2188213

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2188213.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a0ae5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com