網(wǎng)絡(luò)評(píng)論文本的情感傾向性研究
本文選題:情感分析 切入點(diǎn):情感詞典 出處:《暨南大學(xué)》2016年碩士論文 論文類(lèi)型:學(xué)位論文
【摘要】:隨著近幾年來(lái)電子商務(wù)的快速發(fā)展,越來(lái)越多的用戶(hù)在網(wǎng)上購(gòu)買(mǎi)商品后會(huì)留下對(duì)商品或服務(wù)的評(píng)論,并且該類(lèi)評(píng)論數(shù)據(jù)的數(shù)量正在不斷增長(zhǎng)。這些數(shù)據(jù)不僅可以作為消費(fèi)者購(gòu)物的參考信息,也可以為商家的銷(xiāo)售策略提供很多建議和商機(jī),因此研究這些評(píng)論文本數(shù)據(jù)具有很大價(jià)值。作為文本分析的重要技術(shù)之一,文本情感分析在近幾年得到了研究人員的廣泛關(guān)注,并取得了很多的研究成果。文本情感分析根據(jù)評(píng)論文本中觀點(diǎn)的褒貶傾向來(lái)進(jìn)行文本分類(lèi),其分類(lèi)方法包括基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法,其中第一種方法易于實(shí)現(xiàn)但是領(lǐng)域針對(duì)性不強(qiáng),第二種方法分類(lèi)效果更好但是需要大量的訓(xùn)練語(yǔ)料。本文首先介紹了情感分析的研究背景、國(guó)內(nèi)外研究現(xiàn)狀以及關(guān)鍵技術(shù)。然后對(duì)比了基于情感詞典和基于機(jī)器學(xué)習(xí)兩種方法的優(yōu)缺點(diǎn),并且結(jié)合機(jī)器學(xué)習(xí)中深度模型的有效性,選取了長(zhǎng)短型記憶遞歸網(wǎng)絡(luò)作為分類(lèi)模型,提出將情感詞典與深度學(xué)習(xí)模型兩者結(jié)合的新方法來(lái)分階段進(jìn)行文本分類(lèi)。新方法既克服了情感詞典的不完整性缺點(diǎn)也解決了機(jī)器學(xué)習(xí)的大量語(yǔ)料需求。最后,本文通過(guò)對(duì)比實(shí)驗(yàn)證明在缺少訓(xùn)練語(yǔ)料情況下,將情感詞典和長(zhǎng)短型記憶遞歸網(wǎng)絡(luò)結(jié)合的方法應(yīng)用在文本分類(lèi)中可以獲得較高的精確度。
[Abstract]:With the rapid development of electronic commerce in recent years, more and more users will leave comments on goods or services after buying goods on the Internet. And the number of such reviews is growing. These data not only serve as a reference for consumers to shop for, but also provide a lot of advice and business opportunities for businesses' sales strategies. As one of the important techniques of text analysis, text emotion analysis has been paid much attention by researchers in recent years. A lot of research results have been made. Text affective analysis carries out text categorization according to the positive or negative tendency of opinion in the comment text. The classification methods include affective dictionary based approach and machine learning based approach. The first method is easy to implement but the domain is not specific. The second method has better classification effect but requires a lot of training data. Firstly, this paper introduces the research background of emotion analysis. Then, the advantages and disadvantages of affective dictionary and machine based learning are compared, and the validity of depth model in machine learning is combined. The long-long memory recursive network is selected as the classification model. A new method, which combines emotion dictionary with depth learning model, is proposed to classify text in stages. The new method not only overcomes the incompleteness of emotion dictionary, but also solves the need of a large amount of corpus for machine learning. In this paper, it is proved that in the absence of training corpus, the combination of affective dictionary and long-memory recursive network can achieve high accuracy in text classification.
【學(xué)位授予單位】:暨南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李盛瑜;何文;;一種對(duì)聊天文本進(jìn)行特征選取的方法研究[J];計(jì)算機(jī)科學(xué);2007年05期
2 蔣志方;祝翠玲;吳強(qiáng);;一個(gè)對(duì)不帶類(lèi)別標(biāo)記文本進(jìn)行分類(lèi)的方法[J];計(jì)算機(jī)工程;2007年12期
3 趙鋼;;從復(fù)雜文本中導(dǎo)入數(shù)據(jù)的方法[J];中國(guó)審計(jì);2007年18期
4 易樹(shù)鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期
5 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2004年09期
6 覃曉;元昌安;彭昱忠;丁超;;基于基因表達(dá)式編程的Web文本分類(lèi)研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2009年03期
7 諶志群;;文本趨勢(shì)挖掘綜述[J];情報(bào)科學(xué);2010年02期
8 王亞民;劉洋;;含附件文本的分類(lèi)算法研究[J];情報(bào)雜志;2012年08期
9 江偉;潘昊;;基于優(yōu)化的多核學(xué)習(xí)方法的Web文本分類(lèi)的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年10期
10 陳福海;C++中用>>和<<重載實(shí)現(xiàn)文本文件的方便存取[J];現(xiàn)代計(jì)算機(jī);1997年05期
相關(guān)會(huì)議論文 前10條
1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復(fù)制文本檢測(cè)[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年
3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導(dǎo)的遺傳算法在文本分類(lèi)中的應(yīng)用[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
4 李文波;孫樂(lè);黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類(lèi)新算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
5 黃云平;孫樂(lè);李文波;;基于上下文圖模型文本表示的文本分類(lèi)研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 蔣勇;陳曉靜;;一種多方向手寫(xiě)文本行提取方法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復(fù)制文本檢測(cè)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類(lèi)的方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
9 勞錦明;韋崗;;文本壓縮技術(shù)研究的新進(jìn)展[A];開(kāi)創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2001年
10 江荻;;藏語(yǔ)文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
相關(guān)重要報(bào)紙文章 前1條
1 戴洪玲;向Excel中快速輸入相同文本[N];中國(guó)電腦教育報(bào);2004年
相關(guān)博士學(xué)位論文 前10條
1 宋歌;基于聚類(lèi)森林的文本流分類(lèi)方法研究[D];哈爾濱工業(yè)大學(xué);2014年
2 韓開(kāi)旭;基于支持向量機(jī)的文本情感分析研究[D];東北石油大學(xué);2014年
3 鄭立洲;短文本信息抽取若干技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
4 韓磊;漢語(yǔ)句義結(jié)構(gòu)模型分析及其文本表示方法研究[D];北京理工大學(xué);2016年
5 劉林;面向論壇文本的大學(xué)生情緒識(shí)別研究[D];華中師范大學(xué);2016年
6 張博宇;基于局部特征的場(chǎng)景文本分析方法研究[D];哈爾濱工業(yè)大學(xué);2015年
7 胡明涵;面向領(lǐng)域的文本分類(lèi)與挖掘關(guān)鍵技術(shù)研究[D];東北大學(xué) ;2009年
8 孫曉華;基于聚類(lèi)的文本機(jī)會(huì)發(fā)現(xiàn)關(guān)鍵問(wèn)題研究[D];哈爾濱工程大學(xué);2010年
9 尚文倩;文本分類(lèi)及其相關(guān)技術(shù)研究[D];北京交通大學(xué);2007年
10 霍躍紅;典籍英譯譯者文體分析與文本的譯者識(shí)別[D];大連理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 金傳鑫;氣象文本分類(lèi)特征選擇方法及其在MapReduce上的實(shí)現(xiàn)[D];南京信息工程大學(xué);2015年
2 李少卿;不良文本及其變體信息的檢測(cè)過(guò)濾技術(shù)研究[D];復(fù)旦大學(xué);2014年
3 楊名陽(yáng);基于空間文本數(shù)據(jù)的k近鄰連接研究[D];上海交通大學(xué);2015年
4 李天彩;短文本信息流的會(huì)話(huà)抽取與分析技術(shù)研究[D];解放軍信息工程大學(xué);2015年
5 陳亮宇;面向微博文本的事件抽取[D];東南大學(xué);2015年
6 許慧芳;基于全覆蓋粒計(jì)算模型的文本表示和特征提取研究[D];太原理工大學(xué);2016年
7 王煒;面向網(wǎng)絡(luò)輿情的文本語(yǔ)義傾向性分類(lèi)算法研究[D];河北工程大學(xué);2016年
8 任倚天;基于支持向量機(jī)的海量文本分類(lèi)并行化技術(shù)研究[D];北京理工大學(xué);2016年
9 光順利;基于Spark的文本分類(lèi)的研究[D];長(zhǎng)春工業(yè)大學(xué);2016年
10 張高祥;基于SVM的文本信息過(guò)濾算法研究[D];吉林大學(xué);2016年
,本文編號(hào):1624828
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1624828.html