天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

電商評(píng)論中細(xì)粒度主題情感混合模型建構(gòu)

發(fā)布時(shí)間:2019-11-01 07:49
【摘要】:本文對(duì)細(xì)粒度觀點(diǎn)挖掘的相關(guān)理論做了深入探討,詳細(xì)研究了LDA模型,又對(duì)該模型加以改進(jìn),提出了細(xì)粒度主題情感混合模型,該模型能對(duì)實(shí)體提取、意見(jiàn)詞識(shí)別、情感傾向分析、評(píng)論信息自動(dòng)匯總分析、用戶評(píng)價(jià)等提供評(píng)價(jià)分析,為用戶提供直觀的信息。
【圖文】:

流程圖,個(gè)性化推薦,流程


了改進(jìn),在文檔和主題層之間設(shè)置了超參數(shù),解決了PLSA模型過(guò)擬合現(xiàn)象。(二)LDA模型文本文檔的LDA模型被認(rèn)為是由多個(gè)主題組成的概率分布,如圖3所示,它是由文檔、主題和詞組成的三層模型,每個(gè)主題的概率分布由多個(gè)詞組成。圖3中各變量的含義如表1所示。LDA模型先確定評(píng)論文檔的主題分布,再選擇一個(gè)主題,接著選擇一個(gè)詞語(yǔ),從上一步驟生成的對(duì)應(yīng)主題詞條分布中進(jìn)行選擇,反復(fù)進(jìn)行上述兩個(gè)過(guò)程,完成文檔的編輯后過(guò)程結(jié)束。(三)細(xì)粒度觀點(diǎn)挖掘主題模型設(shè)計(jì)細(xì)粒度觀點(diǎn)挖掘的實(shí)現(xiàn)目標(biāo)有以下四個(gè)方面:在眾多圖1個(gè)性化推薦流程圖2細(xì)粒度觀點(diǎn)挖掘流程圖圖3LDA模型表1LDA模型變量解釋表2詞條所屬滑動(dòng)窗口分布表市場(chǎng)營(yíng)銷

概率分布,挖掘流程,細(xì)粒度,觀點(diǎn)


又稱為細(xì)粒度觀點(diǎn)挖掘,使用過(guò)程中評(píng)論中的被評(píng)價(jià)實(shí)體方面被這種方法細(xì)節(jié)化,實(shí)體所有方面的詳細(xì)觀點(diǎn)和情感傾向都能被分析得出。實(shí)現(xiàn)較深層次的任務(wù)是細(xì)粒度觀點(diǎn)挖掘的一大優(yōu)勢(shì),另一優(yōu)點(diǎn)是向消費(fèi)者或商家提供被評(píng)價(jià)實(shí)體與之相關(guān)的情感觀點(diǎn)信息,細(xì)粒度觀點(diǎn)挖掘獲得的信息可以滿足用戶更高層次的需求。(四)細(xì)粒度觀點(diǎn)挖掘承擔(dān)的主要任務(wù)細(xì)粒度觀點(diǎn)挖掘的目標(biāo)定在被評(píng)價(jià)實(shí)體方面的抽取,抽取過(guò)程中注重情感分析,即從眾多的評(píng)論中生成評(píng)價(jià)摘要。提取實(shí)體、提取意見(jiàn)詞和分析情感傾向是細(xì)粒度意見(jiàn)挖掘的三個(gè)主要任務(wù)。圖2展示了細(xì)粒度觀點(diǎn)挖掘的流程。挖掘過(guò)程為:采集電商網(wǎng)上消費(fèi)者的評(píng)論數(shù)據(jù)→過(guò)濾無(wú)用數(shù)據(jù)(數(shù)據(jù)預(yù)處理)→刪掉停用詞等→轉(zhuǎn)化數(shù)據(jù),生成可識(shí)別的格式供算法使用→抽取被評(píng)價(jià)實(shí)體方面和觀點(diǎn)詞,在此基礎(chǔ)上從情感傾向角度進(jìn)行分析→生成評(píng)價(jià)摘要且評(píng)價(jià)摘要可視化。細(xì)粒度主題情感混合模型(一)主題模型文檔中常常有一些隱含的主題,對(duì)于這些主題的建模采用主題模型的方法實(shí)現(xiàn),每一個(gè)文檔的生成模型稱為主題模型。若干個(gè)詞語(yǔ)組成了文檔,文檔的形成包括以下過(guò)程:詞語(yǔ)確定主題;在這個(gè)主題中選擇詞語(yǔ);不斷重復(fù)前兩步的選擇過(guò)程,從而生成文檔。主題模型在上述選擇主題或詞的過(guò)程中均以采取相應(yīng)的概率為前提,,PLSA和LDA是電商評(píng)論中被普遍采用的兩種主題模型,這兩種模型在應(yīng)用過(guò)程中的使用情況如下:PLSA模型容易出現(xiàn)過(guò)擬合,應(yīng)在文檔層和主題層之間增加概率模型;LDA模型在PLSA模型基礎(chǔ)上做了改進(jìn),在文檔和主題層之間設(shè)置了超參數(shù),解決了PLSA模型過(guò)擬合現(xiàn)象。(二)LDA模型文本文檔的LDA模型被認(rèn)為是由多個(gè)主題組成的概率分布,如圖3所示,它是由文檔、主題和詞組成的三層模型,每個(gè)主題的概率分布由

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王寧;鈔柯;羅嬪;;實(shí)現(xiàn)細(xì)粒度訪問(wèn)控制的元模型研究[J];大連理工大學(xué)學(xué)報(bào);2012年03期

2 歐陽(yáng)純萍;陽(yáng)小華;雷龍艷;徐強(qiáng);余穎;劉志明;;多策略中文微博細(xì)粒度情緒分析研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期

3 史大偉;袁天偉;;一種粗細(xì)粒度結(jié)合的動(dòng)態(tài)污點(diǎn)分析方法[J];計(jì)算機(jī)工程;2014年03期

4 原子;于莉莉;劉超;;引入缺陷的細(xì)粒度軟件變更識(shí)別方法[J];北京航空航天大學(xué)學(xué)報(bào);2014年09期

5 涂登彪;譚光明;孫凝暉;;無(wú)鎖同步的細(xì)粒度并行介度中心算法[J];軟件學(xué)報(bào);2011年05期

6 華秀麗;徐凡;王中卿;李培峰;;細(xì)粒度科技論文摘要句子分類方法[J];計(jì)算機(jī)工程;2012年14期

7 時(shí)杰;朱虹;馮玉才;;實(shí)現(xiàn)數(shù)據(jù)庫(kù)細(xì)粒度訪問(wèn)控制的一種動(dòng)態(tài)查詢修改算法[J];計(jì)算機(jī)科學(xué);2010年12期

8 王志強(qiáng);黃皓;夏磊;;進(jìn)程內(nèi)細(xì)粒度保護(hù)域模型及其實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2007年06期

9 趙亞杰;陳龍;;面向手機(jī)取證的細(xì)粒度數(shù)據(jù)完整性檢驗(yàn)方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年11期

10 王希忠;曲家興;馬春光;周長(zhǎng)利;;一種適用于非結(jié)構(gòu)化數(shù)據(jù)的改進(jìn)細(xì)粒度加密方法[J];計(jì)算機(jī)應(yīng)用研究;2014年09期

相關(guān)會(huì)議論文 前1條

1 盛振華;吳羽;江錦華;壽黎但;陳剛;;InfoSigs:一種面向WEB對(duì)象的細(xì)粒度聚類算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年

相關(guān)博士學(xué)位論文 前3條

1 時(shí)杰;關(guān)系數(shù)據(jù)庫(kù)細(xì)粒度訪問(wèn)控制研究[D];華中科技大學(xué);2010年

2 朱倩;面向自由文本的細(xì)粒度關(guān)系抽取的關(guān)鍵技術(shù)研究[D];江蘇大學(xué);2011年

3 余a\;基于Simulink模型的細(xì)粒度多線程技術(shù)研究[D];浙江大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 趙黎光;基于依存句法的句子級(jí)細(xì)粒度情感計(jì)算[D];華南理工大學(xué);2015年

2 姚亮;數(shù)據(jù)訪問(wèn)控制中基于中間代理的用戶撤銷方法[D];西安電子科技大學(xué);2014年

3 占文平;面向產(chǎn)品評(píng)論的情感分析技術(shù)研究[D];浙江工商大學(xué);2015年

4 廖純;基于句法和語(yǔ)義的話題細(xì)粒度情感分析的研究[D];北京理工大學(xué);2016年

5 李毅;屬性層級(jí)觀點(diǎn)挖掘技術(shù)的研究與應(yīng)用[D];石家莊鐵道大學(xué);2016年

6 周志華;聊天系統(tǒng)文本情感細(xì)粒度分類研究與應(yīng)用[D];西南交通大學(xué);2015年

7 康海蒙;基于細(xì)粒度監(jiān)控的Spark優(yōu)化研究[D];哈爾濱工業(yè)大學(xué);2016年

8 陳闖闖;中文微博細(xì)粒度情感判別研究[D];南華大學(xué);2016年

9 付連鵬;微博客細(xì)粒度情感分析技術(shù)的研究與實(shí)現(xiàn)[D];東北大學(xué);2014年

10 李凌云;基于部件對(duì)齊模型的細(xì)粒度分類方法研究[D];大連理工大學(xué);2016年



本文編號(hào):2554020

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2554020.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4f8f0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com