在線評(píng)論中的產(chǎn)品屬性提取及有用性識(shí)別研究
本文選題:在線評(píng)論 + 屬性提取 ; 參考:《大連理工大學(xué)》2016年碩士論文
【摘要】:隨著近些年,互聯(lián)網(wǎng)向著網(wǎng)站與用戶之間雙向互動(dòng)的Web2.0時(shí)代高速發(fā)展,在線評(píng)論這種非結(jié)構(gòu)化文本數(shù)據(jù)迎來了爆發(fā)性的增長(zhǎng)。這些數(shù)據(jù)中包含了大量的有用信息,是影響用戶決策的重要影響因素之一,也是廠商家制定產(chǎn)品的研發(fā)和改進(jìn)策略的主要依據(jù)。然而,由于在線評(píng)論數(shù)據(jù)量巨大,并且消費(fèi)者往往具有不同的關(guān)注點(diǎn)與喜好,如何篩選出質(zhì)量較高的在線評(píng),并從在線評(píng)論中提取關(guān)于產(chǎn)品各方面屬性的相關(guān)評(píng)價(jià)信息,就顯得格外重要。為了可以從在線評(píng)論中找到用戶關(guān)注的產(chǎn)品信息,本文提出了一種基于互自擴(kuò)展模式的產(chǎn)品屬性提取算法。算法的核心思想是通過計(jì)算機(jī)自我學(xué)習(xí),增量迭代達(dá)到理想效果。同時(shí)結(jié)合FP-Growth算法對(duì)該模式進(jìn)行改進(jìn),使其不但可以無需人工標(biāo)注種子庫,從而避免算法結(jié)果的不確定性,而且可以提高自擴(kuò)展模式中增量迭代的速度,獲得更好的擴(kuò)展效果。為了降低自擴(kuò)展模式下主題偏移的情況發(fā)生,又給出了一種提取詞、提取模式置信度的求解方法。為了克服中文分詞、詞性標(biāo)注中出現(xiàn)錯(cuò)誤,提出了相似提取模式和復(fù)合提取詞的概念并給出了其挖掘方法,該方法能夠在犧牲較少準(zhǔn)確率的情況下,較好的提高召回率。最后實(shí)驗(yàn)顯示算法對(duì)中文在線評(píng)論中產(chǎn)品屬性的提取效果,平均準(zhǔn)確率為78.50%,平均召回率為79.81%,平均F-score為78.97%,取得了較好的提取效果。對(duì)英文評(píng)論中的產(chǎn)品屬性提取效果,準(zhǔn)確率為80.22%,召回率為72.28%,F-score為76.04%,相比較于文獻(xiàn)中其它同類研究,在準(zhǔn)確率上獲得了較大的提升;谏衔乃岬降漠a(chǎn)品屬性提取算法而建立的產(chǎn)品屬性數(shù)據(jù)庫,考慮到通常用戶在閱讀在線評(píng)論時(shí),都對(duì)評(píng)論內(nèi)容所包含的屬性存在一個(gè)心理預(yù)期,不同產(chǎn)品、甚至相同產(chǎn)品不同品牌之間,這些預(yù)期都是不同的。如果評(píng)論可以滿足用戶預(yù)期,將會(huì)對(duì)用戶認(rèn)為評(píng)論是否有用產(chǎn)生重要影響。基于以上考慮,通過將在線評(píng)論有用性判別問題轉(zhuǎn)化為文本分類問題,采用SVM支持向量機(jī)方法,利用開元的LibSVM軟件實(shí)現(xiàn)文本分類器,結(jié)合其他學(xué)者的研究成果,提出九種特征值,實(shí)現(xiàn)了對(duì)評(píng)論有用性的機(jī)器識(shí)別。實(shí)驗(yàn)表明,對(duì)評(píng)論有用性的識(shí)別準(zhǔn)確率平均在90.67%,驗(yàn)證了算法的有效性,同時(shí)也證明了用戶心理預(yù)期的產(chǎn)品屬性描述對(duì)用戶評(píng)判在線評(píng)論有用性存在著較大的影響。本文研究成果可以為用戶在線購物提供決策支持,為廠商家改善產(chǎn)品及服務(wù)提供理論依據(jù),還能夠促進(jìn)電子商務(wù)平臺(tái)完善在線評(píng)論系統(tǒng),極具理論與實(shí)踐意義。
[Abstract]:In recent years, with the rapid development of the Internet towards the Web2.0 era of two-way interaction between Web sites and users, online reviews of unstructured text data are experiencing an explosive growth.These data contain a large amount of useful information, which is one of the important factors that affect the decision of users, and is also the main basis for manufacturers to formulate product development and improvement strategies.However, because of the huge amount of online comment data, and consumers often have different concerns and preferences, how to screen out high quality online reviews and extract relevant evaluation information about product attributes from online reviews.It's all the more important.In order to find the product information of users' concern from online comments, this paper proposes a product attribute extraction algorithm based on mutual self-expansion mode.The core idea of the algorithm is to achieve ideal results through computer self-learning and incremental iteration.At the same time, the scheme is improved with FP-Growth algorithm, which can not only avoid the uncertainty of the algorithm result, but also improve the speed of incremental iteration in the self-expanding mode and obtain better expansion effect.In order to reduce the occurrence of topic offset in the self-expanding mode, a method of extracting the word and extracting the confidence degree of the pattern is presented.In order to overcome the errors in Chinese word segmentation and part of speech tagging, the concepts of similar extraction pattern and compound word extraction are proposed and their mining methods are given. This method can improve the recall rate at the expense of less accuracy.Finally, the experimental results show that the average accuracy is 78.50, the average recall rate is 79.81, and the average F-score is 78.97.The accuracy of product attribute extraction is 80.222.The recall rate is 72.28 and the F-score is 76.044.Compared with other similar studies in the literature, the accuracy rate has been greatly improved.The product attribute database based on the product attribute extraction algorithm mentioned above, considering that users usually have a psychological expectation about the attributes contained in the comments when reading online comments, different products,Even the same product and different brands, these expectations are different.If the comment meets the user's expectations, it will have a significant impact on whether the comment is useful or not.Based on the above considerations, the text categorizer is realized by using SVM support vector machine (SVM) and open LibSVM software, by transforming the problem of online comment usefulness discrimination into text categorization, and combining with the research results of other scholars.Nine eigenvalues are proposed to realize the machine recognition of comment usefulness.Experiments show that the average recognition accuracy of comment usefulness is 90.67, which verifies the validity of the algorithm, and also proves that the product attribute description expected by users' psychology has a great influence on the usefulness of online reviews.The research results of this paper can provide decision support for online shopping, provide theoretical basis for factories and merchants to improve their products and services, and promote e-commerce platform to perfect online comment system, which is of great theoretical and practical significance.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:F724.6
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫洪杰;周庭銳;;整合框架下的產(chǎn)品屬性比較機(jī)理研究綜述[J];管理學(xué)報(bào);2011年10期
2 李博;董曉凱;莫蘇寧;;產(chǎn)品屬性挖掘綜述[J];現(xiàn)代商貿(mào)工業(yè);2012年09期
3 張子平;;從產(chǎn)品到商品[J];肉類研究;2009年05期
4 孫曉東;馮學(xué)鋼;;多顧客個(gè)性化需求下產(chǎn)品屬性配置策略[J];工業(yè)工程;2013年01期
5 方明;市場(chǎng)經(jīng)濟(jì)條件下高速公路建設(shè)發(fā)展的公共性產(chǎn)品屬性探討[J];生產(chǎn)力研究;2004年12期
6 于春玲;趙平;;談品牌的情感定位[J];市場(chǎng)營(yíng)銷導(dǎo)刊;2004年03期
7 張金萍,周游;網(wǎng)絡(luò)營(yíng)銷中產(chǎn)品屬性與渠道屬性匹配研究[J];商業(yè)研究;2003年17期
8 孫榮;;教育產(chǎn)品的屬性分析[J];企業(yè)導(dǎo)報(bào);2012年07期
9 孫麗輝;以最大滿意度為目標(biāo)進(jìn)行產(chǎn)品屬性組合的優(yōu)化決策[J];工業(yè)技術(shù)經(jīng)濟(jì);1996年06期
10 王宏起,胡運(yùn)權(quán);高新技術(shù)產(chǎn)品屬性綜合認(rèn)定方法及應(yīng)用的研究[J];管理世界;2002年03期
相關(guān)會(huì)議論文 前4條
1 孟昭祥;;高速公路產(chǎn)品屬性及收費(fèi)標(biāo)準(zhǔn)的探討[A];中國高速公路管理學(xué)術(shù)論文集(2010卷)[C];2010年
2 張姝;賈文杰;夏迎炬;孟遙;于浩;;產(chǎn)品屬性歸類技術(shù)研究[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
3 余傳明;陳雷;張小青;;基于支持向量機(jī)的產(chǎn)品屬性識(shí)別研究[A];國家自然科學(xué)基金委員會(huì)管理科學(xué)部宏觀管理與政策學(xué)科青年基金獲得者交流研討會(huì)論文集[C];2010年
4 陳縈;;高等教育的產(chǎn)品屬性及其對(duì)供給模式的影響[A];2007年中國教育經(jīng)濟(jì)學(xué)年會(huì)會(huì)議論文集[C];2007年
相關(guān)重要報(bào)紙文章 前6條
1 張立偉;品牌建設(shè)從產(chǎn)品識(shí)別開始[N];江蘇經(jīng)濟(jì)報(bào);2007年
2 徐曼;怎樣為品牌取個(gè)好名字[N];中國質(zhì)量報(bào);2004年
3 本報(bào)記者 劉旭;企業(yè)有條不紊應(yīng)對(duì)歐盟新規(guī)[N];國際商報(bào);2014年
4 沈菏生;品牌規(guī)劃的四個(gè)“籌碼”[N];醫(yī)藥經(jīng)濟(jì)報(bào);2006年
5 品文;品牌的陷阱[N];廠長(zhǎng)經(jīng)理日?qǐng)?bào);2001年
6 袁孝沖;走出品牌建設(shè)的誤區(qū)[N];中國冶金報(bào);2008年
相關(guān)博士學(xué)位論文 前3條
1 余櫻;享樂適應(yīng)視角下顧客持續(xù)滿意度的影響因素及內(nèi)在機(jī)制研究[D];華中科技大學(xué);2015年
2 辜紅;奢侈品產(chǎn)品屬性對(duì)持續(xù)滿意影響的實(shí)證研究[D];華中科技大學(xué);2012年
3 雷超;市場(chǎng)屬性與產(chǎn)品屬性對(duì)跨境購物意愿的影響[D];暨南大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 扈夏蒙;概念設(shè)計(jì)階段用戶需求到產(chǎn)品屬性的轉(zhuǎn)化方法研究[D];北京服裝學(xué)院;2016年
2 于明朕;在線評(píng)論中的產(chǎn)品屬性提取及有用性識(shí)別研究[D];大連理工大學(xué);2016年
3 李法生;產(chǎn)品屬性對(duì)農(nóng)村消費(fèi)者購后行為影響的實(shí)證研究[D];遼寧工程技術(shù)大學(xué);2012年
4 馮小翼;在線評(píng)論的產(chǎn)品屬性提取與情感分析研究[D];華中科技大學(xué);2011年
5 高會(huì)娟;產(chǎn)品屬性挖掘及應(yīng)用[D];北方工業(yè)大學(xué);2015年
6 趙麗影;產(chǎn)品開發(fā)中顧客需求轉(zhuǎn)化為產(chǎn)品屬性的路徑研究[D];東北師范大學(xué);2005年
7 鄭璐;產(chǎn)品屬性分析方法及其應(yīng)用[D];西南交通大學(xué);2005年
8 楊春梅;基于聯(lián)合分析法的消費(fèi)者產(chǎn)品屬性偏好的確定[D];東北大學(xué);2008年
9 夏亞麗;生活形態(tài)、產(chǎn)品屬性之相關(guān)性研究[D];南京理工大學(xué);2006年
10 婁慧娜;基于手段—目的鏈的顧客滿意因素分析[D];廈門大學(xué);2007年
,本文編號(hào):1765261
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1765261.html