天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

社交網(wǎng)絡(luò)評(píng)論中的反語(yǔ)識(shí)別研究

發(fā)布時(shí)間:2018-04-17 04:33

  本文選題:反語(yǔ)識(shí)別 + 文本分類 ; 參考:《云南財(cái)經(jīng)大學(xué)》2017年碩士論文


【摘要】:隨著信息技術(shù)的蓬勃發(fā)展,網(wǎng)絡(luò)中的文檔成為主要的信息載體,是人們生活中主要信息來源。隨著互聯(lián)網(wǎng)Web2.0時(shí)代的到來,人們從被動(dòng)接受門戶網(wǎng)站的信息,轉(zhuǎn)為主動(dòng)在社交媒體上發(fā)布、共享、傳播信息。由于用戶參與信息產(chǎn)生過程中,網(wǎng)絡(luò)信息的內(nèi)容形式也變得多種多樣。這些關(guān)于觀點(diǎn)性的內(nèi)容對(duì)社會(huì)輿情分析、電子商務(wù)等方面都有著重要的意義和實(shí)用價(jià)值。針對(duì)這種觀點(diǎn)性文本的情感分類逐漸演變?yōu)橐粋(gè)熱點(diǎn)問題。在網(wǎng)絡(luò)文本中經(jīng)常出現(xiàn)反語(yǔ),他們利用反語(yǔ)來表達(dá)主觀的以及深層次的觀點(diǎn),反語(yǔ)的使用將大大增加情感分析的難度。為了提高情感分類的準(zhǔn)確度,需要探討反語(yǔ)識(shí)別,因此本文研究的是反語(yǔ)識(shí)別。本文主要從兩個(gè)方面研究反語(yǔ)的識(shí)別:一是基于規(guī)則的反語(yǔ)識(shí)別方法;二是基于機(jī)器學(xué)習(xí)反語(yǔ)識(shí)別方法。對(duì)于基于規(guī)則的反語(yǔ)識(shí)別方法,本文中提出了兩種反語(yǔ)識(shí)別的規(guī)則——歇后語(yǔ)規(guī)則、違反常識(shí)規(guī)則,這也是本文的創(chuàng)新之處。對(duì)違反常識(shí)規(guī)則部分引入了矛盾關(guān)系檢測(cè),通過矛盾關(guān)系中的反義詞規(guī)則和否定詞規(guī)則,來判斷文本是否是違反了常識(shí)規(guī)則。滿足上述兩種規(guī)則中的其中一種的文本則判定為反語(yǔ),對(duì)于不滿足規(guī)則的文本,使用機(jī)器學(xué)習(xí)方法訓(xùn)練分類器,識(shí)別出反語(yǔ)。訓(xùn)練分類器過程中,構(gòu)建特征體系——英文詞、特定的語(yǔ)氣詞、文本中特定的詞匯、網(wǎng)絡(luò)詞匯、諧音字、連續(xù)的標(biāo)點(diǎn)符號(hào),將分詞后并刪除停用詞后的所有不重復(fù)詞也納入特征體系。計(jì)算只使用機(jī)器學(xué)習(xí)方法進(jìn)行反語(yǔ)識(shí)別的性能,同時(shí)也計(jì)算規(guī)則結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行反語(yǔ)識(shí)別的性能,并比較這兩種方法的性能。本文發(fā)現(xiàn)本文中提出的規(guī)則結(jié)合機(jī)器學(xué)習(xí)方法對(duì)反語(yǔ)識(shí)別相對(duì)只使用機(jī)器學(xué)習(xí)方法是更有效的。
[Abstract]:With the rapid development of information technology, network documents become the main carrier of information, is the main source of information in people's life. With the advent of the Internet Web2.0 era, people accept the information portal from passive to active in social media release, sharing and dissemination of information. Because the user participation in the information network process. The content of the information form has become diverse. These views about the content analysis of social public opinion, e-commerce and other aspects are of great significance and practical value. In this view the text sentiment classification has gradually evolved into a hot issue. Irony often appear in the network text, they use the language to express subjective and deep view of irony use will greatly increase the difficulty of sentiment analysis. In order to improve the accuracy of sentiment classification, to explore irony recognition, because This paper is the study of irony recognition. This article mainly from the two aspects of irony recognition: one is the irony recognition method based on rules; two is the irony recognition method based on machine learning. The irony recognition method based on rules, this paper puts forward two kinds of irony recognition rules of Xiehouyu rules, in violation of common sense rules. This is also the innovation of this paper. Any violation of common sense rules introduced by the contradiction between detection, the contradiction between the opposite rule and negation rules, to determine whether the text is in violation of common sense rules. Meet the above two kinds of rules in which a text is judged for irony, does not meet the rules of the text. The use of machine learning methods to train the classifier, recognize the irony. The process of training classifier, feature construction system -- English specific words, modal words, vocabulary specific text in network Vocabulary, homophonic words, punctuation, continuous, word and delete the stop words after all words are included in the feature system. Calculation only using machine learning methods for performance of irony recognition, but also the calculation rules combined with machine learning method for recognition of irony, and compare the performance of these two methods. We find that the proposed rule learning method with the machine of irony recognition relative only use the machine learning method is more effective.

【學(xué)位授予單位】:云南財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 鄧釗;賈修一;陳家駿;;面向微博的中文反語(yǔ)識(shí)別研究[J];計(jì)算機(jī)工程與科學(xué);2015年12期

2 劉茂福;王月;顧進(jìn)廣;;基于語(yǔ)義規(guī)則的中文矛盾關(guān)系識(shí)別方法[J];計(jì)算機(jī)工程與科學(xué);2015年04期

3 劉正光;反語(yǔ)理論綜述[J];解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào);2002年04期

相關(guān)博士學(xué)位論文 前3條

1 張冬梅;文本情感分類及觀點(diǎn)摘要關(guān)鍵問題研究[D];山東大學(xué);2012年

2 代印唐;基于語(yǔ)義網(wǎng)絡(luò)的知識(shí)協(xié)作關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2009年

3 陳博;WEB文本情感分類中關(guān)鍵問題的研究[D];北京郵電大學(xué);2008年

相關(guān)碩士學(xué)位論文 前9條

1 李曉笛;Web文本挖掘技術(shù)研究及應(yīng)用[D];北京交通大學(xué);2015年

2 李偉;網(wǎng)絡(luò)語(yǔ)言中的反語(yǔ)研究[D];新疆師范大學(xué);2012年

3 王楷翔;基于蘊(yùn)涵推理的知識(shí)語(yǔ)義沖突識(shí)別方法及其實(shí)現(xiàn)[D];上海交通大學(xué);2011年

4 張?chǎng)稳A;基于語(yǔ)義推理的知識(shí)相似性與沖突檢測(cè)研究[D];上海交通大學(xué);2011年

5 湯羅浩;基于STN的行動(dòng)計(jì)劃時(shí)間表示和沖突處理研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

6 尚愛華;從圖形—背景理論看反語(yǔ)[D];河南大學(xué);2010年

7 馬春榮;關(guān)聯(lián)理論框架下的言語(yǔ)反語(yǔ)研究[D];南京師范大學(xué);2007年

8 陳晶晶;反語(yǔ)生成和理解機(jī)制研究[D];河南大學(xué);2007年

9 謝騁超;基于語(yǔ)義的數(shù)據(jù)庫(kù)全文檢索系統(tǒng)[D];浙江大學(xué);2006年

,

本文編號(hào):1762105

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1762105.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ec760***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com