天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

微博的輿情發(fā)現(xiàn)與分析研究

發(fā)布時間:2018-02-09 03:49

  本文關(guān)鍵詞: 微博 輿情 熱點發(fā)現(xiàn) 情感分析 出處:《河北地質(zhì)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著信息技術(shù)的高速發(fā)展,互聯(lián)網(wǎng)得到了廣泛普及,對社會產(chǎn)生了日益深遠(yuǎn)的影響。作為互聯(lián)網(wǎng)時代的重要產(chǎn)物,微博成為了眾多網(wǎng)民生活中不可或缺的一部分。微博是一個分享簡短實時信息的廣播式社交網(wǎng)絡(luò)平臺。在微博平臺上,用戶可以描述自己周圍發(fā)生的事情,發(fā)表自己對某個事情的看法,甚至可以推廣自己的產(chǎn)品。在滿足人們網(wǎng)絡(luò)社交需求的同時,微博也顯現(xiàn)出了在網(wǎng)絡(luò)輿論中的重要地位。面對每天數(shù)以億計的博文,如何挖掘出微博輿情,并對微博輿情進(jìn)行分析顯得越來越重要。目前對于微博輿情的研究處于起步階段,仍有許多值得研究的工作。本文的主要研究工作圍繞以下三個方面展開。1.采集篩選微博數(shù)據(jù)及數(shù)據(jù)預(yù)處理。分別研究了基于微博API的數(shù)據(jù)采集方案,基于網(wǎng)絡(luò)爬蟲的微博數(shù)據(jù)采集方案。結(jié)合了兩種微博數(shù)據(jù)采集方案對公共微博數(shù)據(jù)和用戶微博數(shù)據(jù)分別進(jìn)行了采集。從微博用戶和微博內(nèi)容兩方面,對微博數(shù)據(jù)進(jìn)行了篩選。并且對微博文本進(jìn)行了分詞處理、去停用詞處理、特征選擇處理,向量表示。2.提出了一種微博輿情發(fā)現(xiàn)算法。對現(xiàn)有的微博熱點發(fā)現(xiàn)算法進(jìn)行了分析,研究了各個熱點發(fā)現(xiàn)算法的優(yōu)點和不足,提出了HEA熱點發(fā)現(xiàn)算法。針對單個文本聚類算法對微博文本聚類效果差的問題,提出了一種混合聚類算法HKSK。將HKSK算法與HEA算法相結(jié)合提出了HKSK-HEA的熱點發(fā)現(xiàn)算法。實驗證明該算法可以有效的發(fā)現(xiàn)微博熱點。3.提出了一種微博情感分析算法。研究了目前常用的情感分析算法。對目前已有的情感詞典進(jìn)行了整理,構(gòu)建了基礎(chǔ)情感詞典,并針對文本語義的特點構(gòu)建了情感修正詞典?紤]到微博文本的網(wǎng)絡(luò)屬性,構(gòu)建了表情符號詞典,并且研究了樸素貝葉斯分類器在情感分類中的應(yīng)用。針對單一的情感分類算法泛化能力低的問題,設(shè)計了情感樸素貝葉斯分類器。實驗證明情感樸素貝葉斯分類器可以提高微博情感分析算法的性能。
[Abstract]:With the rapid development of information technology, the Internet has been widely popularized, which has an increasingly far-reaching impact on society. As an important product of the Internet era, Weibo has become an integral part of the lives of many Internet users. Weibo is a broadcast social networking platform that shares short, real-time information. On Weibo, users can describe what's happening around them. Even if you express your opinion on something, you can even promote your product. While meeting people's social needs online, Weibo has also shown an important position in online public opinion. In the face of hundreds of millions of blog posts every day, How to dig out Weibo's public opinion and analyze it is becoming more and more important. At present, the research on Weibo's public opinion is in its infancy. There is still a lot of work worth studying. The main research work in this paper is focused on the following three aspects. 1. Collect and screen Weibo data and data preprocessing. Weibo data acquisition scheme based on network crawler. Combined with two data collection schemes of Weibo, the data of public Weibo and user Weibo were collected separately. From the two aspects of the content of Weibo users and Weibo users, The Weibo data was screened. Then, the participle processing, the deactivation word processing, the feature selection processing, the vector representation. 2. A public opinion discovery algorithm was put forward. This paper studies the advantages and disadvantages of each hot spot discovery algorithm, and puts forward the HEA hot spot discovery algorithm, aiming at the problem that the single text clustering algorithm has poor effect on Weibo text clustering. A hybrid clustering algorithm, HKSK, is proposed. Combining HKSK algorithm with HEA algorithm, a hot spot discovery algorithm for HKSK-HEA is proposed. Experiments show that the algorithm can effectively find Weibo hot spot. In this paper, the commonly used affective analysis algorithms are put forward, and the existing emotion dictionaries are sorted out. The basic emotion dictionary is constructed, and the emotion correction dictionary is constructed according to the semantic characteristics of the text. Considering the network attribute of Weibo's text, the emoji dictionary is constructed. And the application of naive Bayesian classifier in emotion classification is studied. An emotional naive Bayesian classifier is designed, and it is proved by experiments that the performance of Weibo's emotion analysis algorithm can be improved by using this classifier.
【學(xué)位授予單位】:河北地質(zhì)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張鈺莎;;微博熱點事件發(fā)現(xiàn)與研究[J];信息通信;2017年01期

2 鄒學(xué)強;包秀國;黃曉軍;馬宏遠(yuǎn);袁慶升;;基于層次分析的微博短文本特征計算方法[J];通信學(xué)報;2016年12期

3 周詠梅;王偉;陽愛民;林江豪;方澤鋒;;一種基于特征簇的微博短文本情感分類方法[J];小型微型計算機(jī)系統(tǒng);2016年12期

4 馬慧芳;吉余崗;李曉紅;周汝南;;基于離散粒子群優(yōu)化的微博熱點話題發(fā)現(xiàn)算法[J];計算機(jī)工程;2016年03期

5 葉成緒;楊萍;劉少鵬;;基于主題詞的微博熱點話題發(fā)現(xiàn)[J];計算機(jī)應(yīng)用與軟件;2016年02期

6 馬力;劉笑;宮玉龍;;基于語義的微博短文本傾向性分析研究[J];計算機(jī)應(yīng)用研究;2016年10期

7 蘇小英;孟環(huán)建;;基于神經(jīng)網(wǎng)絡(luò)的微博情感分析[J];計算機(jī)技術(shù)與發(fā)展;2015年12期

8 李鵬;于巖;李英樂;李星;何贊園;;基于權(quán)重微博鏈的改進(jìn)LDA微博主題模型[J];計算機(jī)應(yīng)用研究;2016年07期

9 張昊;劉功申;蘇波;;一種微博用戶影響力的計算方法[J];計算機(jī)應(yīng)用與軟件;2015年03期

10 孫曰昕;馬慧芳;姚偉;張志昌;;結(jié)合互信息和主題模型的微博話題發(fā)現(xiàn)方法[J];計算機(jī)工程與應(yīng)用;2016年06期

相關(guān)博士學(xué)位論文 前2條

1 丁兆云;面向微博輿情的影響力分析關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年

2 黃九鳴;面向輿情分析和屬性發(fā)現(xiàn)的網(wǎng)絡(luò)文本挖掘技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前4條

1 陳險峰;微博輿情分析系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學(xué);2015年

2 馬治濤;文本分類停用詞處理和特征選擇技術(shù)研究[D];西安電子科技大學(xué);2014年

3 鄭毅;基于情感詞典的中文微博情感分析研究[D];中山大學(xué);2014年

4 佘偉成;基于微博的熱點發(fā)現(xiàn)與情感傾向分析[D];云南大學(xué);2013年

,

本文編號:1496998

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1496998.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c3909***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com