天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于主動學習的微博情感分析方法研究

發(fā)布時間:2018-05-27 00:05

  本文選題:微博情感分析 + 主動學習 ; 參考:《吉林大學》2017年碩士論文


【摘要】:目前,作為文本挖掘重要分支之一的文本情感分析受到學者的廣泛關(guān)注。隨著互聯(lián)網(wǎng)的飛速發(fā)展和社交媒體的普及,網(wǎng)上產(chǎn)生了大量的用戶衍生文本,而這些文本主觀性很強并帶有明顯的情感傾向和豐富的情感信息,具有很高的研究價值。主流的情感分類方法廣泛采用了機器學習,這種方法的局限在于需要大規(guī)模標注語料作為訓練集,這需要花費巨大的成本來標注語料。而在實踐當中,容易獲得的都是未標注的文本語料,因此,如何利用少量的標注語料和大量的未標注語料進行文本情感分類成為了一個重要課題。本文將主動學習方法結(jié)合進基于機器學習的文本情感分類方法中,以解決未標記語料的有效利用問題。由于文本特征矩陣的稀疏性,采用支持向量機作為基分類器在準確度上有著較大優(yōu)勢。邊緣采樣方法是利用支持向量機進行主動學習的經(jīng)典方法,但該方法同樣存在著錯誤級聯(lián)、過擬合和冗余迭代等一些準確率和性能上的問題。本文針對這些問題并在同樣使用支持向量機作為基分類器的基礎(chǔ)上提出了一個新的主動學習方法(Active Learning in Informative Vector Selection-----ALIVS)。主要工作如下:第一,本研究對文本情感分類和主動學習的理論進行了系統(tǒng)研究,分析了文本情感分類的主要任務、研究流派以及主動學習的基本假設和主流方法等基礎(chǔ)理論。并對經(jīng)典的基于邊緣的主動學習方法進行了研究和分析,發(fā)現(xiàn)其存在的局限。第二,本研究以上文所述的理論研究為起點,提出新的主動學習方法ALIVS,該方法利用未標記樣本集的特點提出了信息向量(Informative Vector)的概念并結(jié)合支持向量機發(fā)展出一個二級分類的學習流程,該流程基于以下想法:采用兩級分類器,第一級主分類器負責情感分類;第二級信息向量分類器利用第一級分類器學習到的分類信息從未標記樣本中遴選出最具分類信息的信息向量作為候選標記樣本,經(jīng)專家標記后,加入第一級分類器的訓練集中,循環(huán)迭代,不斷增強第一級分類器的分類能力,進而達成利用大量的未標記文本和少量的標記文本進行有效訓練的目標。第三,本研究將該方法應用到基于COAE2014評測的任務4的實際場景中,并與廣泛應用的邊緣采樣方法進行對比,設計實驗對該方法的準確度和性能進行了測試和分析。實驗結(jié)果表明,本文提出的ALIVS方法在提高準確率、降低過擬合及錯誤級聯(lián)等方面有著良好的表現(xiàn),從而證明了該方法的可行性。最后本文對該方法在未來的改進和發(fā)展進行了展望。
[Abstract]:At present, as one of the important branches of text mining, text emotional analysis has been widely concerned by scholars. With the rapid development of the Internet and the popularity of social media, a large number of user-derived texts have been generated on the Internet, and these texts are highly subjective, with obvious emotional tendency and rich emotional information, which has high research value. Machine learning is widely used in the mainstream affective classification methods. The limitation of this method lies in the need of large-scale tagging corpus as a training set, which requires a huge cost to annotate the corpus. In practice, it is easy to obtain unannotated text corpus, so how to use a small amount of annotated corpus and a large amount of unlabeled corpus to classify text emotion has become an important topic. In this paper, the active learning method is combined with the text emotion classification method based on machine learning to solve the problem of the effective use of unmarked corpus. Because of the sparsity of text feature matrix, support vector machine (SVM) as the basis classifier has a great advantage in accuracy. Edge sampling is a classical method for active learning using support vector machines, but it also has some problems in accuracy and performance, such as error concatenation, overfitting and redundant iteration. In this paper, we propose a new active learning method, active Learning in Informative Vector Selection-ALIVSs, based on the same support vector machine (SVM) as a basis classifier for these problems. The main work is as follows: first, this study systematically studies the theories of text emotion classification and active learning, analyzes the main tasks of text emotion classification, the basic hypothesis and mainstream methods of active learning. The classical edge-based active learning method is studied and analyzed, and its limitations are found. Second, this study starts with the theoretical research mentioned above. A new active learning method, ALIVS, is proposed in this paper. Based on the characteristics of unlabeled sample sets, the concept of information vector Informative vector is proposed and a secondary classification process is developed by combining support vector machine. The process is based on the following ideas: a two-level classifier is used, and the first primary classifier is responsible for emotion classification; The second level information vector classifier uses the information vector of the first level classifier to select the information vector with the most classified information as the candidate marker sample, and adds the training set of the first level classifier after the expert mark. Cyclic iteration enhances the classification ability of the first level classifier and achieves the goal of using a large number of unmarked text and a small amount of marked text for effective training. Thirdly, this method is applied to the actual scenario of task 4 based on COAE2014 evaluation, and compared with the widely used edge sampling method. The accuracy and performance of the method are tested and analyzed by experiments. The experimental results show that the proposed ALIVS method has a good performance in improving the accuracy, reducing over-fitting and error concatenation, which proves the feasibility of this method. Finally, the improvement and development of this method in the future are prospected.
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 徐興凱;;信息課上應重視學生的主動學習[J];小學時代(教育研究);2011年10期

2 劉蘭芳;;談學生主動學習習慣的培養(yǎng)[J];科技資訊;2006年30期

3 劉寶峰;;由被動學習轉(zhuǎn)為主動學習的探討[J];天津職業(yè)院校聯(lián)合學報;2012年08期

4 沈元懌;;基于主動學習的資源優(yōu)化分配方案研究[J];佛山科學技術(shù)學院學報(自然科學版);2006年01期

5 王玲;李琴;隋美玲;肖海軍;;基于支持向量機的主動學習方法及其實現(xiàn)[J];長沙大學學報;2014年02期

6 繆樹民;STS案例的探討[J];甘肅科技縱橫;2005年06期

7 王穎;高新波;李潔;王秀美;;基于PSVM的主動學習腫塊檢測方法[J];計算機研究與發(fā)展;2012年03期

8 張桂平;李文博;王裴巖;;基于主動學習的本體概念關(guān)系判斷[J];中文信息學報;2013年04期

9 楊文君;;大學計算機基礎(chǔ)教學模式改革探索——問題模式在教學中的應用[J];牡丹江師范學院學報(自然科學版);2006年02期

10 魏欽冰;;大學計算機基礎(chǔ)教學模式改革探索——淺析問題模式在教學中的應用[J];職業(yè)圈;2007年07期

相關(guān)博士學位論文 前1條

1 姚拓中;結(jié)合主動學習的視覺場景理解[D];浙江大學;2011年

相關(guān)碩士學位論文 前9條

1 陳雄韜;基于聚類的主動學習實例選擇方法研究[D];中國礦業(yè)大學;2016年

2 張軍;基于主動學習和遷移學習的文本情感預測研究[D];山西大學;2016年

3 關(guān)雅夫;基于主動學習的微博情感分析方法研究[D];吉林大學;2017年

4 黃輝;基于局部線性重構(gòu)系數(shù)的主動學習[D];溫州大學;2014年

5 崔寶今;基于半監(jiān)督和主動學習的蛋白質(zhì)關(guān)系抽取研究[D];大連理工大學;2008年

6 張江紅;多分類主動學習方法在地表分類中的應用[D];南京理工大學;2011年

7 易博;基于主動學習的語義缺失問句補全[D];哈爾濱工業(yè)大學;2012年

8 柴思遠;結(jié)合主動學習的協(xié)作分類方法研究[D];吉林大學;2011年

9 高文濤;劃分分類模型中主動學習關(guān)鍵技術(shù)研究[D];燕山大學;2010年

,

本文編號:1939511

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1939511.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶13652***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩精品你懂的在线观看| 久久精品国产99国产免费| 国产精品国产亚洲区久久| 欧美做爰猛烈叫床大尺度| 国产自拍欧美日韩在线观看| 在线观看视频国产你懂的| 亚洲男人的天堂色偷偷| 东京热一二三区在线免| 美女被后入视频在线观看| 日本视频在线观看不卡| 亚洲天堂一区在线播放| 久久99热成人网不卡| 内射精子视频欧美一区二区| 草草草草在线观看视频| 国产精品一区二区视频| 久久久精品日韩欧美丰满| 亚洲欧美中文字幕精品| 亚洲欧洲成人精品香蕉网| 五月的丁香婷婷综合网| 三级高清有码在线观看| 99在线视频精品免费播放| 亚洲黄香蕉视频免费看| 午夜精品久久久99热连载| 欧美夫妻性生活一区二区| 国产成人精品在线播放| 日本熟妇熟女久久综合| 99久免费精品视频在线观| 91熟女大屁股偷偷对白| 国产一区二区熟女精品免费| 色哟哟哟在线观看视频| 亚洲一区二区精品免费视频| 日韩欧美91在线视频| 麻豆视频传媒入口在线看| 午夜亚洲精品理论片在线观看| 国产亚洲欧美日韩精品一区 | 国产亚洲精品一二三区| 精品一区二区三区三级视频| 国产又大又黄又粗又免费| 欧美精品激情视频一区| 激情图日韩精品中文字幕| 国产又色又爽又黄又大|