天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 營銷論文 >

基于漸進直推式支持向量機的Twitter文本情感分析研究

發(fā)布時間:2018-03-15 06:09

  本文選題:Twitter 切入點:情感分析 出處:《合肥工業(yè)大學》2015年碩士論文 論文類型:學位論文


【摘要】:近年來,隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和移動終端的進一步普及,社交網(wǎng)絡(luò)(Social Network Service)己逐漸深入人們的日常生活。Twitter是一個典型的社交網(wǎng)絡(luò)及微博客服務(wù)網(wǎng)站,其訪問量位列全球互聯(lián)網(wǎng)網(wǎng)站前十位。用戶可隨時隨地更新自己的狀態(tài),同時可以關(guān)注其他用戶的動態(tài)。每天數(shù)以億計的推文記錄了用戶的所見、所聞、所為、所感,分享了他們的喜、怒、哀、樂。對表達于Tweets中的情感特征進行深度挖掘在市場營銷、輿情監(jiān)控、突發(fā)事件應(yīng)急等方面都有重要作用。情感計算是近年來人工智能領(lǐng)域的研究熱點。情感的主觀性、隱藏性、判定標準不統(tǒng)一性等特點致使文本情感分析有別于傳統(tǒng)的文本分析。而Tweets的短文本性、口語化、高噪聲等特性使得Twitter'情感分析更具挑戰(zhàn)性。針對Twitter的特點,研究了Twitter情感分析的若干關(guān)鍵問題,主要包括Tweets的文本預處理、特征分析、基于半監(jiān)督的情感分析算法等。為降低Tweets中噪聲對情感分析造成的影響,研究了一系列改良的Twitter文本預處理方法,重點對URLs、否定詞、重復字母等信息進行預處理,并通過對比試驗驗證了預處理方法對Twitter情感分析的有效性。同時,分析了不同選擇標準在特征選擇方面的能力,重點對比了文檔頻率、信息增益和卡方統(tǒng)計量特征選擇的效果。實驗結(jié)果表明,預處理及特征選擇操作在提高了情感分類準確率的同時有效降低了特征空間的維度。另外,為克服大量標注數(shù)據(jù)的難獲取性,避免海量未標注數(shù)據(jù)的資源浪費,研究了一種基于漸進直推式支持向量機的半監(jiān)督Twitter情感分析算法。通過引入擾動因子穩(wěn)步優(yōu)化了Twitter情感分析效果,并且可以自適應(yīng)數(shù)據(jù)分布,自動控制學習進度和訓練時間。
[Abstract]:In recent years, with the rapid development of Internet technology and the further popularization of mobile terminals, Social Network Service has gradually penetrated into people's daily life. Twitter is a typical social network and Weibo guest service website. Users can update their status anytime, anywhere, and follow the movements of other users. Hundreds of millions of tweets every day record what they see, hear, do and feel. Sharing their joy, anger, sadness, joy, deep mining of emotional features expressed in Tweets in marketing, public opinion monitoring, Emotional computing has become a research hotspot in the field of artificial intelligence in recent years. The disunity of the judging standard makes the text emotional analysis different from the traditional text analysis. However, the characteristics of Tweets, such as short text nature, colloquialization and high noise, make it more challenging. This paper studies some key problems of Twitter affective analysis, including Tweets text preprocessing, feature analysis, semi-supervised affective analysis algorithm and so on. This paper studies a series of improved Twitter text preprocessing methods, focusing on the preprocessing of URLs, negative words and repeated letters, and validates the validity of the preprocessing method for Twitter affective analysis through comparative experiments. The ability of different selection criteria in feature selection is analyzed, and the effects of document frequency, information gain and chi-square statistics feature selection are compared. The experimental results show that, Preprocessing and feature selection not only improve the accuracy of emotion classification, but also reduce the dimension of feature space effectively. A semi-supervised Twitter affective analysis algorithm based on progressive direct push support vector machine (SVM) is studied. By introducing disturbance factor, the effect of Twitter affective analysis can be optimized steadily, and the data distribution can be adaptively distributed, and the learning schedule and training time can be automatically controlled.
【學位授予單位】:合肥工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 孔祥南;黎銘;姜遠;周志華;;一種針對弱標記的直推式多標記分類方法[J];計算機研究與發(fā)展;2010年08期

2 ;火爆的身材 iRiver T7 Volcano[J];汽車生活;2008年07期

3 陳毅松,汪國平,董士海;基于支持向量機的漸進直推式分類學習算法[J];軟件學報;2003年03期

4 彭新俊;王翼飛;;雙模糊漸進直推式支持向量機算法[J];模式識別與人工智能;2009年04期

5 艾解清;高濟;彭艷斌;鄭志軍;;基于直推式支持向量機的協(xié)商決策模型[J];浙江大學學報(工學版);2012年06期

6 張永錚;周勇林;杜飛;;網(wǎng)絡(luò)異常性指數(shù)的一種直推式定量計算方法[J];通信學報;2013年08期

7 薛貞霞;劉三陽;劉萬里;;基于可信度的漸進直推式支持向量機算法[J];廈門大學學報(自然科學版);2008年06期

8 廖東平;魏璽章;黎湘;莊釗文;;一種改進的漸進直推式支持向量機分類學習算法[J];信號處理;2008年02期

9 李云飛;;近鄰漸進直推式支持向量機算法[J];計算機工程;2008年17期

10 吳薇;胡靜濤;;基于代價敏感直推式學習的故障診斷方法[J];儀器儀表學報;2010年05期

相關(guān)會議論文 前2條

1 江典林;李巍華;;基于直推式支持向量機的機械故障診斷方法[A];2008年全國振動工程及應(yīng)用學術(shù)會議暨第十一屆全國設(shè)備故障診斷學術(shù)會議論文集[C];2008年

2 李巍華;劉雯;;基于主元分析和直推式支持向量機的齒輪早期故障診斷[A];第十二屆全國設(shè)備故障診斷學術(shù)會議論文集[C];2010年

相關(guān)碩士學位論文 前10條

1 鮑艷偉;基于漸進直推式支持向量機的Twitter文本情感分析研究[D];合肥工業(yè)大學;2015年

2 余力濤;直推式遷移分類算法與應(yīng)用研究[D];大連理工大學;2012年

3 廖朝陽;基于直推式學習和遷移學習方法改進的支持向量機分類方法及應(yīng)用研究[D];西安電子科技大學;2012年

4 胡孔兵;基于自學習的直推式遷移學習方法研究[D];合肥工業(yè)大學;2013年

5 汪旗;基于直推式多示例學習的圖像分類算法研究[D];安徽大學;2013年

6 秦彥霞;直推式遷移學習及其應(yīng)用研究[D];哈爾濱工業(yè)大學;2012年

7 方玉成;基于Logistic回歸的直推式遷移學習方法研究[D];合肥工業(yè)大學;2010年

8 沈新宇;基于直推式支持向量機的圖像分類算法研究與應(yīng)用[D];北京交通大學;2008年

9 王利文;直推式支持向量機的研究學習[D];重慶大學;2014年

10 崔鵬;一種基于支持向量機的直推式WEB挖掘[D];大連海事大學;2006年



本文編號:1614752

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/1614752.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b2289***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com