基于微博公共平臺的單條微博熱門程度預測及其相關(guān)微博發(fā)現(xiàn)
本文選題:微博 + 熱門話題 ; 參考:《安徽大學》2016年碩士論文
【摘要】:新浪微博在我們?nèi)粘I畹男畔鞑ブ衅鸬搅酥匾淖饔?截止2014年新浪微博的每日活躍人數(shù)已經(jīng)達到了6660萬。而新浪微博公共平臺一般擁有過萬的粉絲數(shù),他們的影響力及其大,因此對于新聞的監(jiān)管就變得十分的困難,如何實時從成千上萬的微博中找到熱門的微博是十分有意義的。它可以幫助人們實時的了解社會動態(tài),使一些政府機構(gòu)提前對一些負面的情緒加以引導,從而使得社會更加的穩(wěn)定。在當前微博發(fā)展的趨勢下,學者們對微博的研究也越來越重視,最近幾年對微博的熱門話題發(fā)現(xiàn)、微博的輿情分析都是研究的熱門。本論文主要構(gòu)建了一個微博公共平臺實時的監(jiān)管系統(tǒng),用來預測將來可能會成為熱門話題的微博。本論文主要對新浪微博的各大新聞公共平臺進行數(shù)據(jù)采集,然后對這些數(shù)據(jù)進行分析,通過這樣的分析本文構(gòu)建了預測模型。通過計算每條微博的轉(zhuǎn)發(fā)、評論的增長趨勢,從而預測出該條微博在當前的熱門程度。并且通過聚類算法找出與該微博相關(guān)的一些微博。本論文的主要貢獻如下:(1) 通過新浪微博api接口實時收集微博數(shù)據(jù),本文通過使用新浪微博api接口每十分鐘收集一次新浪微博的數(shù)據(jù),然后對這些微博進行分析,找到影響微博趨勢的因素,通過這樣的分析發(fā)現(xiàn)微博的評論、轉(zhuǎn)發(fā)增長數(shù)會隨著時間的推移呈現(xiàn)凹曲線下降的趨勢。(2) 本論文構(gòu)建了一個預測模型,該模型由微博的長期趨勢、循環(huán)趨勢、作者影響力、微博前十分鐘的評論數(shù)和轉(zhuǎn)發(fā)數(shù)幾個因素組成。通過該模型可以計算出一條微博的評論數(shù)和轉(zhuǎn)發(fā)數(shù)在未來的趨勢,然后本文給出了熱門程度公式,通過這個公式可以計算一條微博的熱門程度。(3) 本論文改進了k-means聚類算法,該算法通過輸入一個聚類中心并且設(shè)置一個閾值來找到距離聚類中心在這個閡值內(nèi)的文本。通過這樣的算法可以找到與熱門微博相關(guān)的一些微博。
[Abstract]:Sina Weibo has played an important role in the dissemination of information about our daily lives, with the daily active number of Sina Weibo reaching 66.6 million as of 2014. Sina's Weibo public platform generally has more than 10, 000 followers, and their influence is enormous, making it difficult to monitor news, and it makes sense to find popular Weibo from thousands of Weibo in real time. It can help people to understand the social dynamics in real time, so that some government agencies in advance to guide some of the negative emotions, thereby making the society more stable. With the development of Weibo, scholars pay more and more attention to the research of Weibo. In recent years, the popular topic of Weibo is that the analysis of public opinion of Weibo is the hot research. This paper mainly constructs a real-time monitoring system of Weibo public platform to predict the Weibo which may become a hot topic in the future. This paper mainly carries on the data collection to the Sina Weibo each big news public platform, then carries on the analysis to these data, through this kind of analysis this article has constructed the forecast model. By calculating the forward of each Weibo and the growth trend of the comments, the current popularity of the Weibo is predicted. Some Weibo related to the Weibo are found by clustering algorithm. The main contributions of this paper are as follows: (1) collect Weibo data in real time through Sina Weibo api interface. This paper collects Sina Weibo data every ten minutes by using Sina Weibo api interface, and then analyzes these Weibo. Find out the factors that influence the trend of Weibo, through this analysis we find that the comments of Weibo, the number of forward growth will show a downward trend of concave curve over time.) this paper constructs a prediction model, which is based on the long-term trend of Weibo. Circular trends, author influence, Weibo's first 10 minutes of comments and forwarding a number of factors. Through this model, we can calculate the future trend of the number of comments and forwards of a Weibo. Then, this paper gives the popular degree formula, which can be used to calculate the popularity of a Weibo.) in this paper, we improve the k-means clustering algorithm. By inputting a cluster center and setting a threshold value, the algorithm finds the text within the threshold value of the distance clustering center. Through this algorithm, we can find some Weibo related to the popular Weibo.
【學位授予單位】:安徽大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.092
【相似文獻】
相關(guān)期刊論文 前10條
1 ;福建省電子政務(wù)公共平臺建設(shè)服務(wù)實施指南[J];電子政務(wù);2013年08期
2 黃華煒;張勇;;華東區(qū)域電網(wǎng)科技信息公共平臺建設(shè)[J];華東電力;2006年08期
3 ;我國首批云計算電子政務(wù)公共平臺落戶哈爾濱市[J];互聯(lián)網(wǎng)天地;2013年09期
4 姜天軍;;企事業(yè)信息服務(wù)公共平臺體系結(jié)構(gòu)研究[J];伊犁師范學院學報(自然科學版);2011年03期
5 暢榕;陳丹;;要素、模式與運營機制:數(shù)字出版公共平臺建構(gòu)初探[J];中國出版;2012年10期
6 韋東方;游專;;江蘇淮安物流信息公共平臺需求分析與系統(tǒng)規(guī)劃[J];中國科技信息;2009年18期
7 暢榕;陳丹;;數(shù)字出版公共平臺的建構(gòu)模式與運營機制初探[J];科技與出版;2012年02期
8 吳偉;孫毅中;成驊;趙曉琴;;城市規(guī)劃新技術(shù)應(yīng)用平臺建設(shè)進展[J];江蘇城市規(guī)劃;2009年12期
9 張彥超;趙爽;;基于云計算的電子政務(wù)公共平臺:安全風險與應(yīng)對策略[J];電信網(wǎng)技術(shù);2014年02期
10 周維強;公共平臺(外一篇)[J];新聞記者;2004年04期
相關(guān)重要報紙文章 前10條
1 記者 溫文清;茄克研發(fā)公共平臺落戶泉州[N];泉州晚報;2014年
2 記者 張駿;政府社會合力打造 服務(wù)民企公共平臺[N];解放日報;2014年
3 滬商;上海中小商貿(mào)企業(yè)公共平臺上線[N];國際商報;2014年
4 申蓓 曄敏;揚州加快物流信息公共平臺建設(shè)[N];揚州日報;2006年
5 于華鵬;北京吸引民資進入城市公共平臺[N];中國建設(shè)報;2010年
6 程永康 向斌;樟樹構(gòu)建公共平臺助推中小企業(yè)創(chuàng)新成長[N];宜春日報;2011年
7 鄭榮;企業(yè)無論大小,都享受公共平臺高端服務(wù)[N];新華日報;2014年
8 徐德生;長寧區(qū)科委加強公共平臺建設(shè)[N];上?萍紙;2008年
9 本報記者 于吶洋;建公共平臺回收舊手機[N];法制日報;2013年
10 樊莉 徐紅 徐許雄 高文娟;四川推動地信公共平臺成果應(yīng)用[N];中國測繪報;2014年
相關(guān)碩士學位論文 前10條
1 齊躍鵬;物聯(lián)網(wǎng)公共平臺服務(wù)器及終端設(shè)計與實現(xiàn)[D];西南交通大學;2015年
2 高淑蘭;基于Petri網(wǎng)的服務(wù)外包公共平臺業(yè)務(wù)流程建模與仿真[D];五邑大學;2015年
3 俞青云;基于微博公共平臺的單條微博熱門程度預測及其相關(guān)微博發(fā)現(xiàn)[D];安徽大學;2016年
4 郭興;A財險公司微信公共平臺建設(shè)方案設(shè)計[D];首都經(jīng)濟貿(mào)易大學;2014年
5 徐剛;數(shù)字城市地理信息公共平臺的設(shè)計與實現(xiàn)[D];廈門大學;2013年
6 陳潔;能源計量數(shù)據(jù)公共平臺系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學;2013年
7 馮永軍;基于E-HUB的企業(yè)集團資金管理公共平臺設(shè)計與實現(xiàn)[D];復旦大學;2010年
8 鄭維維;專業(yè)作品:“TOP未來”—浙江日報文化新聞部微信公共平臺設(shè)計方案[D];浙江大學;2014年
9 王利;社會公共平臺的設(shè)計與實現(xiàn)[D];天津大學;2013年
10 陳文超;基于上海市中考招生公共平臺投檔錄取的分析[D];復旦大學;2012年
,本文編號:2005456
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2005456.html