天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于LDA主題模型的評價對象抽取研究

發(fā)布時間:2018-05-11 11:18

  本文選題:情感分析 + 評價對象抽取。 參考:《河北師范大學(xué)》2017年碩士論文


【摘要】:近年來電子商務(wù)發(fā)展迅猛,顧客在購買產(chǎn)品之后針對產(chǎn)品的主觀性評論也與日俱增。這些網(wǎng)絡(luò)評論信息表達(dá)了人們的各種情感色彩及情感傾向性,包含著非常重要的價值。客戶購買商品前,經(jīng)常通過之前用戶的產(chǎn)品評論來了解該產(chǎn)品的質(zhì)量和服務(wù),根據(jù)所獲取的信息再決定是否購買。同樣,這些評論信息對商家也有著重要的意義,他們可以通過評論獲取客戶的反饋,從而了解產(chǎn)品在哪些方面受到青睞和好評,而在哪些方面應(yīng)該努力改進(jìn),從而實現(xiàn)自身商業(yè)利益的最大化。針對網(wǎng)上大量的評論文本,如果僅通過人工方式來分析處理顯然是不現(xiàn)實的,需要通過計算機(jī)快速獲取和處理這些具有主觀情感色彩的評價信息,情感分析技術(shù)應(yīng)運而生。情感分析技術(shù)包含了許多方面的任務(wù),評價對象抽取就是其中非常重要的任務(wù)之一。評價對象抽取的研究主要包括基于規(guī)則/模板的方法和基于統(tǒng)計的方法;谝(guī)則/模板的方法需要領(lǐng)域?qū)<叶x相應(yīng)領(lǐng)域的評價對象和規(guī)則,無法滿足不斷出現(xiàn)的新詞,不具有跨領(lǐng)域性,可移植性差,同時也不能將評價對象進(jìn)行聚類。LDA主題模型是一種無監(jiān)督統(tǒng)計模型,不僅能克服上述方法的缺點,也無需大量的人工標(biāo)記,得到了研究者的廣泛關(guān)注。但LDA主題模型在應(yīng)用時忽略了詞的位置信息和語言結(jié)構(gòu)信息,并不適合評價對象抽取的研究,因此需要對其進(jìn)行擴(kuò)展,以達(dá)到抽取目的。在LDA的擴(kuò)展模型中,雖然有很多能識別出評價對象,但無法將評價對象和評價詞分開,而Zhao等提出的MaxEnt-LDA模型在LDA中引入最大熵,通過最大熵模型來加入相應(yīng)的語言特征以彌補(bǔ)標(biāo)準(zhǔn)LDA的缺陷,并能識別出評價對象,同時能將評價對象和評價詞分開。但MaxEnt-LDA模型只考慮了詞法特征,忽略了句法特征,而最大熵部分也存在一些不足。針對上述問題,本文提出了基于主題-條件隨機(jī)場的CLDA模型,進(jìn)行評價對象的抽取。首先在LDA模型中引入條件隨機(jī)場,來區(qū)分評價對象,評價詞和背景詞;然后,通過加入指示變量,對評價對象,評價詞和背景詞進(jìn)行全局和局部的區(qū)分,之所以要將詞進(jìn)行全局和局部的區(qū)分,是因為顧客在對產(chǎn)品進(jìn)行評價時,有些用詞使用比較頻繁,容易將其他的評價對象或評價詞淹沒,所以使用全局和局部來區(qū)分出頻繁用詞和非頻繁用詞。通過CLDA模型不僅能夠達(dá)到抽取評價對象的研究目的,而且能夠?qū)⒃u價對象和評價詞進(jìn)行分離。為驗證CLDA模型的有效性,實驗中使用Restaurant領(lǐng)域的評論數(shù)據(jù)集,進(jìn)行定性分析和定量分析,在定量分析中,與MaxEnt-LDA模型進(jìn)行對比,實驗結(jié)果表明CLDA模型在評價對象抽取方面,有著更好的性能。實驗中還重點討論了條件隨機(jī)場模型中的特征選擇問題,通過實驗驗證了選用詞特征,詞性特征和依存句法特征的有效性。最后由于主題模型在中文評價對象抽取方面的研究較少,所以本文將CLDA模型用于中文的評價對象抽取,實驗證明CLDA模型在中文的應(yīng)用上同樣適用。
[Abstract]:In this paper , it is very important for the consumers to understand the quality and service of the products . In order to verify the effectiveness of CLDA model , this paper makes qualitative analysis and quantitative analysis . In order to validate the effectiveness of CLDA model , this paper makes qualitative analysis and quantitative analysis . In order to verify the effectiveness of CLDA model , this paper makes qualitative analysis and quantitative analysis . The results show that CLDA model has better performance in evaluating object extraction .

【學(xué)位授予單位】:河北師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 廖曉鋒;王永吉;范修斌;吳敬征;;基于LDA主題模型的安全漏洞分類[J];清華大學(xué)學(xué)報(自然科學(xué)版);2012年10期

2 胡吉明;陳果;;基于動態(tài)LDA主題模型的內(nèi)容主題挖掘與演化[J];圖書情報工作;2014年02期

3 劉培奇;孫捷焓;;基于LDA主題模型的標(biāo)簽傳遞算法[J];計算機(jī)應(yīng)用;2012年02期

4 程艷花;譚怒濤;黃磊;王建英;;圖像分塊重構(gòu)和LDA融合的人臉識別方法[J];計算機(jī)工程與應(yīng)用;2009年27期

5 黃正鵬;;一種改進(jìn)的LDA+算法[J];福建電腦;2008年08期

6 張燕平;竇蓉蓉;趙姝;曹振田;;基于集成學(xué)習(xí)的規(guī)范化LDA人臉識別[J];計算機(jī)工程;2010年14期

7 趙煒;陳俊杰;李海芳;;融合LDA和多類SVM的圖像語義映射研究[J];計算機(jī)工程與應(yīng)用;2009年18期

8 吳秀清;范麗亞;;基于QR分解和支持向量的偽逆LDA[J];聊城大學(xué)學(xué)報(自然科學(xué)版);2011年04期

9 鄭世卓;崔曉燕;;基于半監(jiān)督LDA的文本分類應(yīng)用研究[J];軟件;2014年01期

10 楚克明;李芳;;基于LDA話題關(guān)聯(lián)的話題演化[J];上海交通大學(xué)學(xué)報;2010年11期

相關(guān)會議論文 前2條

1 楚克明;李芳;;基于LDA新聞話題的演化[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

2 Jussi Koskinen;藺春濤;高冬;;線陣探測器(LDA)的現(xiàn)狀及發(fā)展趨勢(英文)[A];2004年CT和三維成像學(xué)術(shù)年會論文集[C];2004年

相關(guān)碩士學(xué)位論文 前10條

1 陳小艷;融合結(jié)構(gòu)信息的LDA扣件狀態(tài)識別研究[D];西南交通大學(xué);2015年

2 袁勝文;基于LDA的中文科技文獻(xiàn)話題演化研究[D];河南工業(yè)大學(xué);2015年

3 雷鵬;基于LDA的智能電視家庭成員識別方法研究[D];山東大學(xué);2016年

4 楊帆;基于LDA主題模型和標(biāo)簽聚類的黨建信息推送策略研究[D];云南大學(xué);2016年

5 黃勇;改進(jìn)的互信息與LDA結(jié)合的特征降維方法研究[D];華中師范大學(xué);2016年

6 張彬彬;基于LDA的社會化標(biāo)簽系統(tǒng)推薦技術(shù)研究[D];華南農(nóng)業(yè)大學(xué);2016年

7 任藝;基于LDA主題模型的圖像場景分類研究[D];中北大學(xué);2017年

8 何甜;基于LDA主題模型的評價對象抽取研究[D];河北師范大學(xué);2017年

9 楚克明;基于LDA的新聞話題演化研究[D];上海交通大學(xué);2010年

10 王敏;基于LDA主題模型的圖像場景分類[D];西安電子科技大學(xué);2013年



本文編號:1873732

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1873732.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶74ee5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com