天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

電子商務(wù)環(huán)境下用戶(hù)觀點(diǎn)的情感挖掘研究

發(fā)布時(shí)間:2020-07-12 04:15
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)和電子商務(wù)的迅速發(fā)展,人類(lèi)社會(huì)正快速步入“全民網(wǎng)購(gòu)”時(shí)代。消費(fèi)者對(duì)產(chǎn)品的評(píng)論內(nèi)容包含了商品的體驗(yàn),也為其他消費(fèi)者、企業(yè)產(chǎn)品的反饋提供了重要的信息資源。如何高效地挖掘用戶(hù)評(píng)論中消費(fèi)者對(duì)產(chǎn)品以及相關(guān)方面所持有的觀點(diǎn)成為情感挖掘分析領(lǐng)域的熱點(diǎn)問(wèn)題。但是,由于中文自然語(yǔ)言表述的多樣性和復(fù)雜性,使用戶(hù)評(píng)論的情感分析和研究變得更具有挑戰(zhàn)性。目前,對(duì)文本情感分析的研究主要集中于細(xì)粒度的情感挖掘。它能深入到用戶(hù)評(píng)價(jià)的多個(gè)方面,提取評(píng)價(jià)信息中涉及的評(píng)價(jià)對(duì)象、評(píng)價(jià)詞等元素,并對(duì)其進(jìn)行情感傾向分析,從而準(zhǔn)確地反映用戶(hù)的評(píng)價(jià)意圖。但是,現(xiàn)有的細(xì)粒度文本情感挖掘仍然存在一些至今還沒(méi)有很好解決的問(wèn)題。例如,評(píng)價(jià)對(duì)象與評(píng)價(jià)詞不完備、評(píng)價(jià)詞的情感傾向歧義等問(wèn)題。如何有效解決這些問(wèn)題,實(shí)現(xiàn)基于細(xì)粒度的文本情感分析,正受到學(xué)術(shù)界的廣泛關(guān)注。本文首先分析了文本情感分析的國(guó)內(nèi)外發(fā)展現(xiàn)狀和存在問(wèn)題,然后以文本情感挖掘的句法分析和語(yǔ)義分析為主線(xiàn),對(duì)電子商務(wù)環(huán)境下用戶(hù)評(píng)論的觀點(diǎn)挖掘進(jìn)行了研究。歸納起來(lái),本文的主要研究工作表現(xiàn)在以下幾個(gè)方面:(1)電商平臺(tái)的產(chǎn)品評(píng)論數(shù)據(jù)獲取與預(yù)處理。首先,使用Python爬蟲(chóng)方式獲取京東商城的手機(jī)評(píng)論、相機(jī)評(píng)論和電腦評(píng)論信息。然后,對(duì)獲取的評(píng)論數(shù)據(jù)進(jìn)行清洗。最后,對(duì)數(shù)據(jù)集進(jìn)行分句、分詞、句法分析、語(yǔ)義分析等預(yù)處理,為后續(xù)的研究做好數(shù)據(jù)準(zhǔn)備。(2)提出了基于語(yǔ)義的評(píng)價(jià)信息抽取方法。應(yīng)用條件隨機(jī)場(chǎng)(CRFs)模型,提出在條件隨機(jī)場(chǎng)模型中引入句法分析和語(yǔ)義分析,解決評(píng)價(jià)對(duì)象、評(píng)價(jià)詞的抽取。首先,對(duì)預(yù)處理后的評(píng)論內(nèi)容進(jìn)行用戶(hù)關(guān)注度分析,半自動(dòng)標(biāo)注數(shù)據(jù)集。然后,構(gòu)建適用于電商平臺(tái)數(shù)據(jù)的評(píng)價(jià)信息抽取模型。最后,進(jìn)行了實(shí)驗(yàn)分析。結(jié)果表明基于語(yǔ)義的評(píng)價(jià)信息抽取方法在抽取評(píng)價(jià)對(duì)象和評(píng)價(jià)詞上F值分別達(dá)到了92.31%、89.90%,并驗(yàn)證了句法關(guān)系和語(yǔ)義關(guān)系對(duì)評(píng)價(jià)信息抽取的正確和有效。(3)提出了基于語(yǔ)義關(guān)系的評(píng)價(jià)單元抽取方法。針對(duì)評(píng)價(jià)對(duì)象與評(píng)價(jià)詞不完備問(wèn)題,提出了結(jié)合句法關(guān)系、語(yǔ)義關(guān)系的多粒度條件隨機(jī)場(chǎng)模型抽取評(píng)價(jià)單元方法SSMCRFs(Syntactic Semantic and Multi-grained Conditional Random Fields,SSMCRFs),解決了評(píng)價(jià)單元的抽取問(wèn)題。通過(guò)3個(gè)實(shí)驗(yàn)分別證明了SSMCRFs方法的有效性以及句法特性和語(yǔ)義特性對(duì)評(píng)價(jià)單元識(shí)別的效果。(4)產(chǎn)品評(píng)價(jià)情感傾向分析。針對(duì)評(píng)價(jià)詞的情感傾向歧義問(wèn)題,考慮了評(píng)價(jià)對(duì)象和評(píng)價(jià)詞兩者的依賴(lài)關(guān)系,采用SSMCRFs加支持向量機(jī)對(duì)評(píng)價(jià)單元進(jìn)行情感傾向分析。首先,人工標(biāo)注評(píng)價(jià)單元數(shù)據(jù)集為評(píng)價(jià)對(duì)象,評(píng)價(jià)詞,極性三元組。然后,對(duì)獲取的評(píng)論信息進(jìn)行了情感傾向分析。最后,根據(jù)情感傾向分析結(jié)果和評(píng)價(jià)單元頻數(shù)進(jìn)行可視化展示。
【學(xué)位授予單位】:四川師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:F724.6;F274;TP391.1
【圖文】:

框架圖,文本,預(yù)處理,框架


挖掘 它是人們對(duì)產(chǎn)品 表達(dá)的情感觀點(diǎn)是消極的感分類(lèi)研究還在政冶 經(jīng)挖掘要經(jīng)歷一系列流程如 2.1 文本情感挖掘的一般的數(shù)據(jù)集就是用戶(hù)在電都是顧客或消費(fèi)者對(duì)第三價(jià)值的用戶(hù)評(píng)論 語(yǔ)料庫(kù)預(yù)處理評(píng)價(jià)信息抽取原始評(píng)論語(yǔ)料庫(kù)

架構(gòu)圖,哈工大,架構(gòu),平臺(tái)


圖 2.3 哈工大語(yǔ)言技術(shù)平臺(tái)架構(gòu)表 2.1 詞性中的標(biāo)注及含義標(biāo)注 含義 標(biāo)注 含義 標(biāo)注 含義 標(biāo)注 含義b 區(qū)別詞 j 簡(jiǎn)稱(chēng) ni 機(jī)構(gòu)名 q 量詞a 形容詞 i 習(xí)用語(yǔ) nl 處所名詞 r 代詞d 副詞 k 后接成分 ns 地名 u 助詞c 連詞 m 數(shù)詞 nt 時(shí)間詞 v 動(dòng)詞e 感嘆詞 n 名詞 nz 其他專(zhuān)名 wp 標(biāo)點(diǎn)符號(hào)g 語(yǔ)素字 nd 方位名詞 o 擬聲詞 ws 字符串h 前接成分 nh 人名 p 介詞 x 非語(yǔ)素字表 2.2 依存句法分析中的標(biāo)注名及含義

模型圖,支持向量機(jī),模型,樣本空間


相關(guān)理論概述類(lèi)問(wèn)題的算法 SVM 的基本思想:簡(jiǎn)單的來(lái)說(shuō)是實(shí)現(xiàn)升維和線(xiàn)性性超平面,并求解一個(gè)最優(yōu)化問(wèn)題,就是將尋找最優(yōu)線(xiàn)性超平面的基于 Mercer 核展開(kāi)定理,通過(guò)非線(xiàn)性映射,把樣本空間映射到一窮維的特征 Hilbert 空間,來(lái)解決樣本空間中的高度非線(xiàn)性分類(lèi)和M 被認(rèn)為是性能最好的分類(lèi)器 如圖 2.4 所示是一個(gè)支持向量機(jī)模

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 郭沖;王振宇;;面向細(xì)粒度意見(jiàn)挖掘的情感本體樹(shù)及自動(dòng)構(gòu)建[J];中文信息學(xué)報(bào);2013年05期

2 鄭敏潔;雷志城;廖祥文;陳國(guó)龍;;基于層疊CRFs的中文句子評(píng)價(jià)對(duì)象抽取[J];中文信息學(xué)報(bào);2013年03期

3 陳炯;張虎;曹付元;張永奎;;面向中文客戶(hù)評(píng)論的產(chǎn)品屬性抽取方法研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年03期

4 王榮洋;鞠久朋;李壽山;周?chē)?guó)棟;;基于CRFs的評(píng)價(jià)對(duì)象抽取特征研究[J];中文信息學(xué)報(bào);2012年02期

5 楊源;林鴻飛;;基于產(chǎn)品屬性的條件句傾向性分析[J];中文信息學(xué)報(bào);2011年03期

6 趙妍妍;秦兵;車(chē)萬(wàn)翔;劉挺;;基于句法路徑的情感評(píng)價(jià)單元識(shí)別[J];軟件學(xué)報(bào);2011年05期

7 楊江;侯敏;王寧;;基于淺層篇章結(jié)構(gòu)的評(píng)論文傾向性分析[J];中文信息學(xué)報(bào);2011年02期

相關(guān)會(huì)議論文 前1條

1 王根;趙軍;;中文褒貶義詞語(yǔ)傾向性的分析[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年

相關(guān)碩士學(xué)位論文 前9條

1 李毅捷;基于復(fù)雜句式文本情感分類(lèi)研究[D];太原理工大學(xué);2018年

2 劉超然;在線(xiàn)新聞網(wǎng)民評(píng)論情感傾向性分析及可視化研究[D];哈爾濱工業(yè)大學(xué);2018年

3 張?chǎng)?基于在線(xiàn)評(píng)論的細(xì)粒度情感分析研究[D];大連海事大學(xué);2018年

4 馮倉(cāng)龍;商品細(xì)粒度評(píng)價(jià)的識(shí)別與分析[D];沈陽(yáng)航空航天大學(xué);2017年

5 徐瑩瑩;基于深度神經(jīng)網(wǎng)絡(luò)模型的句子級(jí)文本情感分類(lèi)研究[D];深圳大學(xué);2016年

6 邸鵬;基于句子情感權(quán)值合成算法的篇章情感分析[D];太原理工大學(xué);2015年

7 劉平洋;句子級(jí)情感傾向性分析與研究[D];北京郵電大學(xué);2015年

8 聶欣慧;基于產(chǎn)品特征的領(lǐng)域情感本體構(gòu)建及應(yīng)用研究[D];首都師范大學(xué);2014年

9 張s

本文編號(hào):2751406


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2751406.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)4ee45***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com