基于模糊聚類算法的微博用戶情感分析研究
本文選題:模糊聚類 + 網(wǎng)絡(luò)爬蟲; 參考:《西南石油大學(xué)》2014年碩士論文
【摘要】:隨著Web2.0技術(shù)的發(fā)展,社交網(wǎng)站不斷擴(kuò)展其功能,人們可以在網(wǎng)上盡情地發(fā)表自己的觀點(diǎn),釋放自己的情感。微博作為近幾年來互聯(lián)網(wǎng)的新興產(chǎn)物,其情感計算與分析已成為計算機(jī)學(xué)、自然語言學(xué)、人類心理學(xué)等社會計算工作的重要研究課題。本文首先研究了模糊聚類相關(guān)理論知識,并將其應(yīng)用于騰訊QQ空間說說的情感分析,為下一步將模糊聚類應(yīng)用于微博用戶情感分類分析提供了可操作性。模糊聚類分析首先要將文本數(shù)據(jù)數(shù)值化,對微博博文信息進(jìn)行情感計算。因此本文在網(wǎng)絡(luò)爬蟲的技術(shù)原理上設(shè)計了新浪微博專用數(shù)據(jù)采集系統(tǒng),建立了微博源數(shù)據(jù)庫。利用基于知網(wǎng)(HowNet)基礎(chǔ)情感詞集的詞語相似度計算方法計算微博情感詞權(quán)值,建立了微博情感詞庫。在情感詞庫的基礎(chǔ)上,分析了包含否定副詞和程度副詞等修飾詞的微博短語情感強(qiáng)度值,并結(jié)合短句、短句與短句之間的關(guān)系,通過相應(yīng)的情感值運(yùn)算方法,計算得出整條微博消息的情感值。最后篩選了50名用戶在10個不同時間段的情感值作為原始數(shù)據(jù)矩陣,利用模糊聚類算法將50名用戶進(jìn)行動態(tài)分類,并生成動態(tài)聚類圖,由圖可知根據(jù)不同的λ閾值,可以有不同的分類,并用F統(tǒng)計量檢驗(yàn)法計算出最佳分類,再利用SPSS對分類結(jié)果預(yù)測作出每個分類用戶的情感走勢圖,以便更直觀地分析用戶的情感變化。本文創(chuàng)新點(diǎn)主要在于:抓住人類情感是模糊不定的特征,利用模糊聚類來對已經(jīng)通過情感計算的微博信息進(jìn)行分類分析,政府、商家或企業(yè)可以根據(jù)不同的需求得到不同的分類結(jié)果,從而采取相應(yīng)的措施。
[Abstract]:With the development of Web2.0 technology, social networking sites continue to expand their functions, people can express their views on the Internet and release their feelings. Weibo as a new product of the Internet in recent years, its emotional calculation and analysis has become an important research topic in computer science, natural linguistics, human psychology and other social computing work. This paper first studies the relevant theory of fuzzy clustering, and applies it to the emotional analysis of Tencent QZone, which provides the maneuverability for the next step to apply fuzzy clustering to the analysis of Weibo users' emotion classification. In fuzzy clustering analysis, the text data should be numerically valued, and the Weibo post information should be calculated with emotion. Therefore, this paper designs a special data acquisition system for Sina Weibo based on the technical principle of web crawler, and establishes the Weibo source database. The Weibo affective word weight is calculated by using the word similarity calculation method based on the basic affective word set of how Net. and the Weibo affective lexicon is established. On the basis of affective lexicon, this paper analyzes the affective strength of Weibo phrases, including negative adverbs and degree adverbs, and combines the relationship among short sentences, short sentences and short sentences. Calculate the emotional value of the entire Weibo message. Finally, the emotional values of 50 users in 10 different time periods are selected as the original data matrix, 50 users are dynamically classified by fuzzy clustering algorithm, and the dynamic clustering graph is generated. We can use F statistic test method to calculate the best classification, and then use SPSS to predict the classification result to make the emotion trend map of each classification user, so as to analyze the user's emotion change more intuitively. The innovation of this paper mainly lies in: grasping the feature that human emotion is fuzzy and indefinite, using fuzzy clustering to classify and analyze the Weibo information that has been calculated by emotion, the government, Businesses or enterprises can get different classification results according to different needs, and then take appropriate measures.
【學(xué)位授予單位】:西南石油大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1;TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張宏怡;吳秀偉;章忠威;;改進(jìn)的離群核模糊聚類算法[J];計算機(jī)工程;2009年11期
2 李凱;李娜;陳武;;一種基于廣義熵的模糊聚類算法[J];計算機(jī)工程;2012年13期
3 張鴻彥;許奇功;;模糊聚類算法的優(yōu)化設(shè)計[J];河南大學(xué)學(xué)報(自然科學(xué)版);2013年04期
4 王濤,沈謙,馮煥清;一種改進(jìn)的模糊聚類算法[J];電路與系統(tǒng)學(xué)報;1999年01期
5 李焱 ,范植華,洪志國,王勇;基于改進(jìn)模糊聚類算法的評估數(shù)據(jù)一致性分析[J];微型機(jī)與應(yīng)用;2004年05期
6 王元珍,王健,李晨陽;一種改進(jìn)的模糊聚類算法[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2005年02期
7 蔡衛(wèi)菊;張穎超;;基于核的模糊聚類算法[J];計算機(jī)工程與應(yīng)用;2006年18期
8 彭秋生;魏文紅;;基于核方法的并行模糊聚類算法[J];計算機(jī)工程與設(shè)計;2008年08期
9 郝方平;汪家常;;基于模糊聚類算法的備件需求辨識模型[J];計算機(jī)與現(xiàn)代化;2009年11期
10 雷紅艷;鄒漢斌;;粗糙的方向性模糊聚類算法[J];計算機(jī)工程與科學(xué);2010年06期
相關(guān)會議論文 前2條
1 吳書;姜青山;董槐林;林景亮;;一種新的類屬型數(shù)據(jù)模糊聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
2 張樂媛;劉偉;;基于web數(shù)據(jù)挖掘的幾種模糊聚類算法淺析[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會通信與信息技術(shù)會議論文集(上冊)[C];2008年
相關(guān)博士學(xué)位論文 前6條
1 陳東輝;基于目標(biāo)函數(shù)的模糊聚類算法關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
2 邱存勇;區(qū)間二型模糊聚類算法研究及其在電力牽引監(jiān)控系統(tǒng)中的應(yīng)用[D];西南交通大學(xué);2013年
3 曲福恒;一類模糊聚類算法研究及其應(yīng)用[D];吉林大學(xué);2009年
4 支曉斌;自適應(yīng)判別降維模糊聚類算法研究[D];西安電子科技大學(xué);2013年
5 曾山;模糊聚類算法研究[D];華中科技大學(xué);2012年
6 楊鳳芹;基于粒子群的優(yōu)化方法研究[D];吉林大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 黃明明;基于層次的模糊聚類算法[D];青島大學(xué);2005年
2 嚴(yán)駿;模糊聚類算法應(yīng)用研究[D];浙江大學(xué);2006年
3 何敏;模糊聚類算法研究及在CRM中的應(yīng)用[D];四川大學(xué);2006年
4 鮑正益;模糊聚類算法及其有效性研究[D];廈門大學(xué);2006年
5 羅琪;模糊聚類算法及其在入侵檢測中的應(yīng)用[D];西安電子科技大學(xué);2008年
6 李文鳳;一種基于粗集的模糊聚類算法及應(yīng)用的研究[D];華中師范大學(xué);2008年
7 陳氏映雪(Tran Thi Anh Tuyet);Weka環(huán)境下模糊聚類算法集成研究[D];上海大學(xué);2013年
8 譚欣;基于協(xié)同的模糊聚類算法的研究[D];長沙理工大學(xué);2013年
9 趙權(quán);基于粒度分析原理的模糊聚類算法研究[D];山西大學(xué);2008年
10 張利敏;基于模糊聚類算法的路面識別的研究[D];江蘇科技大學(xué);2014年
,本文編號:1905591
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1905591.html