社交網(wǎng)絡用戶影響力關鍵技術研究
發(fā)布時間:2018-03-18 11:28
本文選題:微博數(shù)據(jù)采集 切入點:Phantomjs 出處:《上海交通大學》2014年碩士論文 論文類型:學位論文
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,社交網(wǎng)絡日益成熟,微博作為社交網(wǎng)絡中的典型代表近年來廣受學術界的關注。在微博中的每個用戶影響他人的能力作為微博研究的一個熱點,對于微博中信息的傳播、整合與推廣以及微博中輿論監(jiān)控與導向有著重要的理論與實踐意義。本文以新浪微博為例,首先研究了一種全新的微博數(shù)據(jù)采集方法,為研究微博用戶影響力提供數(shù)據(jù)采集方面的支持,然后提出了一種微博用戶影響力的計算方法,來衡量微博中的用戶影響力。 對于新浪微博的數(shù)據(jù)采集,本文首先分析了新浪微博中需要采集的數(shù)據(jù),然后分析了新浪微博API數(shù)據(jù)采集的缺點,,從而提出了一種新的基于Phantomjs的新浪微博數(shù)據(jù)采集方法并詳細的介紹了相關的采集技術與存儲采集內容的數(shù)據(jù)結構,最終通過與新浪微博API數(shù)據(jù)采集比較取長補短設計了一種新的新浪微博數(shù)據(jù)采集方案并根據(jù)該方案設計了新浪微博數(shù)據(jù)采集系統(tǒng),通過實驗該系統(tǒng)可以高效的進行新浪微博數(shù)據(jù)采集。 對于新浪微博用戶影響力,本文參考PageRank算法分析了用戶影響力的構成,提出了用戶自身影響力與用戶被影響力的概念,得出了用戶影響力是由用戶粉絲的自身影響力乘以其被影響力加上用戶自身影響力構成的,并且分析得出了用戶自身影響力與用戶被影響力的計算公式,最終通過實驗證明用戶影響力的計算方法能夠較好的體現(xiàn)用戶影響力。
[Abstract]:With the development of Internet, social network is becoming more and more mature. Weibo, as a typical representative of social network, has attracted much attention from academic circles in recent years. It has important theoretical and practical significance for the dissemination, integration and promotion of information in Weibo, as well as the supervision and guidance of public opinion in Weibo. This paper provides data acquisition support for studying Weibo's user influence, and then proposes a method to calculate the user's influence to measure the user's influence in Weibo. For the data collection of Sina Weibo, this paper first analyzes the data that need to be collected in Sina Weibo, and then analyzes the shortcomings of the data collection of API. A new data acquisition method of Sina Weibo based on Phantomjs is put forward, and the relevant acquisition technology and data structure of storing collected content are introduced in detail. Finally, by comparing data acquisition with Sina Weibo API, a new Sina Weibo data acquisition scheme is designed, and according to this scheme, Sina Weibo data acquisition system is designed. Through the experiment this system can carry on the Sina Weibo data collection efficiently. For user influence of Sina Weibo, this paper analyzes the composition of user influence with reference to PageRank algorithm, and puts forward the concept of user's own influence and user's influence. It is concluded that user influence is made up of the influence of the user fan multiplied by the influence of the user and the influence of the user, and the calculation formula of the influence of the user itself and the influence of the user is obtained. Finally, it is proved by experiments that the calculation method of user influence can better reflect the influence of user.
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.092
【參考文獻】
相關期刊論文 前10條
1 劉麗清;;微博雖“微”足值道爾——微博特性之淺析[J];東南傳播;2009年11期
2 周立柱,林玲;聚焦爬蟲技術研究綜述[J];計算機應用;2005年09期
3 閆幸;常亞平;;微博研究綜述[J];情報雜志;2011年09期
4 歐健文,董守斌,蔡斌;模板化網(wǎng)頁主題信息的提取方法[J];清華大學學報(自然科學版);2005年S1期
5 趙麗;袁睿翕;管曉宏;賈慶山;;博客網(wǎng)絡中具有突發(fā)性的話題傳播模型[J];軟件學報;2009年05期
6 王曉光;;微博客用戶行為特征與關系特征實證分析——以“新浪微博”為例[J];圖書情報工作;2010年14期
7 趙思佳;尹婷;;基于規(guī)則引擎的個性化主題網(wǎng)頁爬蟲的研究[J];計算機技術與發(fā)展;2011年03期
8 盧金珠;;微博客傳播特性及盈利模式分析[J];現(xiàn)代傳播(中國傳媒大學學報);2010年04期
9 劉淑梅;夏亮;許南山;;主題搜索引擎網(wǎng)絡爬蟲搜索策略的研究與實現(xiàn)[J];計算機系統(tǒng)應用;2010年03期
10 石磊;張聰;衛(wèi)琳;;引入活躍指數(shù)的微博用戶排名機制[J];小型微型計算機系統(tǒng);2012年01期
本文編號:1629424
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1629424.html
最近更新
教材專著