天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于多文檔摘要的產(chǎn)品評(píng)論挖掘技術(shù)研究

發(fā)布時(shí)間:2018-04-19 19:52

  本文選題:情感分類 + 評(píng)論挖掘; 參考:《東南大學(xué)》2015年碩士論文


【摘要】:對(duì)產(chǎn)品評(píng)論進(jìn)行挖掘,從中抽取利益方關(guān)切信息的技術(shù)和方法成為互聯(lián)網(wǎng)環(huán)境下非結(jié)構(gòu)化數(shù)據(jù)處理研究的重要方向之一。本文對(duì)評(píng)論挖掘技術(shù)進(jìn)行研究,提出基于產(chǎn)品特征的抽取式摘要算法獲得簡(jiǎn)潔的摘要,再以摘要為基礎(chǔ)進(jìn)行評(píng)論分析,從而從評(píng)論中抽取有價(jià)值的信息。主要貢獻(xiàn)如下:1)根據(jù)詞向量工具word2vec的運(yùn)行原理,設(shè)計(jì)了一套同義詞篩選規(guī)則,通過詞向量對(duì)種子詞典進(jìn)行擴(kuò)充,使用篩選規(guī)則篩選詞向量的擴(kuò)充結(jié)果,可以有效的提高特征詞和情感詞的同義詞典的質(zhì)量。2)基于依存句法分析技術(shù)實(shí)現(xiàn)自動(dòng)化的情感詞極性判斷。首先利用開源的搜索引擎技術(shù)定位語(yǔ)料庫(kù)中情感詞的相關(guān)句子,找到與它具有并列關(guān)系(COO)的已知極性情感詞,以此判定情感詞的極性。相比于傳統(tǒng)的基于語(yǔ)料庫(kù)和連詞的判斷方法,通過COO關(guān)系可以捕捉到廣泛意義的并列關(guān)系,該方法對(duì)于情感傾向性判斷的準(zhǔn)確率很高。3)針對(duì)評(píng)價(jià)句法結(jié)構(gòu)特點(diǎn),設(shè)計(jì)基于產(chǎn)品特征的摘要抽取算法,生成簡(jiǎn)短的具有代表性和可讀性的簡(jiǎn)潔摘要,支持后續(xù)的評(píng)論句分類。針對(duì)評(píng)論的用語(yǔ)特點(diǎn)總結(jié)出評(píng)價(jià)搭配模板抽取評(píng)價(jià)搭配信息,根據(jù)評(píng)論句中特征詞和情感詞搭配關(guān)系將句子分到相應(yīng)的類別中。相比于傳統(tǒng)摘要算法,本文提出的摘要算法的結(jié)果可以更好的作為分類依據(jù)。4)為了實(shí)現(xiàn)自動(dòng)化產(chǎn)品評(píng)論挖掘,在上述研究基礎(chǔ)之上,從用戶需求出發(fā),設(shè)計(jì)并實(shí)現(xiàn)基于產(chǎn)品特征的摘要系統(tǒng),系統(tǒng)可以輔助用戶快速獲取產(chǎn)品評(píng)論中有價(jià)值信息。
[Abstract]:The technology and method of mining product reviews and extracting information of interest from the stakeholders has become one of the important research directions of unstructured data processing in the Internet environment. In this paper, we study the technology of comment mining, propose a product feature-based abstract extraction algorithm to obtain concise summary, and then analyze comments based on summary, so as to extract valuable information from comments. The main contributions are as follows: (1) according to the principle of word vector tool word2vec, a set of synonym selection rules is designed. The seed dictionary is expanded by word vector, and the expansion result of word vector is filtered by screening rule. It can effectively improve the quality of synonyms of feature words and affective words. 2) automatic polarity judgment of affective words can be realized based on dependency syntactic analysis technology. Firstly, the open source search engine is used to locate the relevant sentences of affective words in the corpus, and to find the known polar affective words with its paratactic relationship, and then to judge the polarity of affective words. Compared with the traditional corpus-based and conjunction-based judgment methods, the paratactic relationships of a wide range of meanings can be captured by using COO relations, and the accuracy of this method in judging affective preference is high. 3) to evaluate the syntactic structure characteristics. A product feature-based abstract extraction algorithm is designed to generate a brief, representative and readable summary, which supports the subsequent classification of comment sentences. According to the lexical characteristics of comments, this paper summarizes the evaluation collocation template and extracts the evaluation collocation information, and classifies the sentences into the corresponding categories according to the collocation relationship between the feature words and the affective words in the comment sentences. Compared with the traditional summary algorithm, the result of this paper can be used as classification basis. 4) in order to realize automatic product comment mining, based on the above research, the paper starts from the user's demand. A summary system based on product features is designed and implemented. The system can help users to quickly obtain valuable information in product reviews.
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 許璐蕾;;網(wǎng)絡(luò)評(píng)論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期

2 肖健;徐建;朱姝;萬(wàn)纓;許亮;;基于翻譯和語(yǔ)義方法的情感詞挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期

3 趙鵬;趙志偉;卓景文;;一種情感詞語(yǔ)義加權(quán)的句子傾向性識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期

4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類方法研究[J];計(jì)算機(jī)科學(xué);2012年12期

5 李勇敢;周學(xué)廣;孫艷;張煥國(guó);;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計(jì)分析的情感詞庫(kù)構(gòu)建方法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2013年05期

6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評(píng)論檢測(cè)[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期

7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評(píng)論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年05期

8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動(dòng)識(shí)別方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2011年10期

9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語(yǔ)情感詞的句子情感分析[J];計(jì)算機(jī)工程;2012年09期

10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計(jì)算機(jī)工程;2013年12期

相關(guān)會(huì)議論文 前5條

1 陳奇哲;劉全升;姚天f ;;漢語(yǔ)意見型語(yǔ)句主題與情感關(guān)系抽取的研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年

3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年

4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個(gè)性化信息推薦模型[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年

相關(guān)博士學(xué)位論文 前8條

1 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年

2 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年

3 寇廣增;基于意見挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年

4 楊玉珍;基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年

5 黃勝;Web評(píng)論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年

6 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年

7 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年

8 李芳;面向中文Web評(píng)論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學(xué);2012年

2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學(xué)院;2015年

3 蔡啟煌;細(xì)粒度中文網(wǎng)絡(luò)消費(fèi)評(píng)論情感極性分類方法研究[D];大連海事大學(xué);2016年

4 李軍偉;網(wǎng)站商品評(píng)論挖掘技術(shù)的研究[D];北京交通大學(xué);2016年

5 劉妙;面向評(píng)論文本基于情感分析的可信推薦模型研究[D];浙江理工大學(xué);2016年

6 高磊;產(chǎn)品特征自動(dòng)提取及情感分類研究[D];南京大學(xué);2013年

7 汪怡群;雙語(yǔ)發(fā)展不平衡雙語(yǔ)者情感詞語(yǔ)義加工及情感加工[D];浙江大學(xué);2016年

8 周景升;大學(xué)生在自步速句子閱讀和RSVP任務(wù)中中英文情感詞的識(shí)別加工研究[D];浙江大學(xué);2016年

9 何新宇;基于改進(jìn)情感詞識(shí)別方法的輿情情感分析系統(tǒng)設(shè)計(jì)[D];北方工業(yè)大學(xué);2016年

10 燕麗蘋;基于用戶評(píng)論的?漆t(yī)院評(píng)價(jià)研究[D];北京理工大學(xué);2015年

,

本文編號(hào):1774482

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1774482.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9bc7a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com