基于社交網(wǎng)絡(luò)的話題傳播模型挖掘及應(yīng)用
本文選題:信息傳播 切入點(diǎn):爬蟲系統(tǒng) 出處:《海南大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著智能手機(jī)、平臺電腦等移動設(shè)備的快速發(fā)展,社交媒體呈現(xiàn)了爆發(fā)似的增長。用戶可以在任何時間任何地點(diǎn)使用設(shè)備在社交媒體上發(fā)布自己的事件或者觀點(diǎn)。社交媒體的廣泛使用,使得數(shù)據(jù)量劇增。為了更好的確認(rèn)社交媒體中信息的主題,社交媒體平臺通過使用hashtag(主題標(biāo)簽)的方式標(biāo)識信息的主題。這不僅方便了社交媒體對相同話題的信息聚類,也很大程度上幫助了用戶在社交網(wǎng)絡(luò)上更容易找到自己感興趣的話題。研究話題在社交網(wǎng)絡(luò)中的傳播在很多方面都很有現(xiàn)實(shí)意義,例如市場營銷等。針對這些情況,本文對社交網(wǎng)絡(luò)中話題的傳播模型進(jìn)行了研究。主要包括以下幾個方面的內(nèi)容:首先根據(jù)需求分析,構(gòu)建了面向微博的話題爬蟲系統(tǒng)。以話題為中心,以廣度優(yōu)先遍歷的算法爬取新浪微博中的話題微博數(shù)據(jù)。爬蟲系統(tǒng)主要解決了動態(tài)網(wǎng)頁數(shù)據(jù)解析的問題,以及禮貌爬取數(shù)據(jù)、人機(jī)驗(yàn)證等問題,有著穩(wěn)定的爬取性能。然后對爬取的數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析。統(tǒng)計(jì)結(jié)果發(fā)現(xiàn)微博的只一次轉(zhuǎn)發(fā)的數(shù)量占總轉(zhuǎn)發(fā)數(shù)量的50%以上,說明話題微博數(shù)據(jù)有很高的聚集性。其次介紹了社交媒體中信息傳播的模型—IC模型和TIC模型。IC模型和TIC模型假設(shè)信息以級聯(lián)的方式在社交網(wǎng)絡(luò)中傳播。根據(jù)TIC模型的優(yōu)勢和微博數(shù)據(jù)的高度聚集性,本文提出了分層融合的話題傳播模型—STIC模型。STIC模型將社交網(wǎng)絡(luò)中的話題分文兩層,第一層為信息只被轉(zhuǎn)發(fā)一次的情況,第二層為信息被轉(zhuǎn)發(fā)兩次以上的情況。第一層數(shù)據(jù)以三大類特征作為輸入特征值,使用SVM分類算法學(xué)習(xí)。第二層使用TIC模型學(xué)習(xí)。最后將兩個模型的學(xué)習(xí)結(jié)果線性整合作為整個模型的學(xué)習(xí)結(jié)果。通過實(shí)驗(yàn)分析,STIC模型可以比TIC模型有更好的預(yù)測效果。
[Abstract]:With the rapid development of mobile devices such as smartphones, platforms and computers, Social media has grown like an explosion. Users can post their own events or opinions on social media at any time, anywhere, anywhere. In order to better identify the topic of information in social media, social media platform identifies the topic of information by using hashtag. this not only makes it convenient for social media to cluster information on the same topic, It also makes it easier for users to find topics of interest on social networks. Research on the spread of topics on social networks is of practical significance in many ways, such as marketing. This paper studies the communication model of topic in social network. It mainly includes the following aspects: firstly, according to the requirement analysis, a topic crawler system for Weibo is constructed. The crawler system mainly solves the problems of dynamic web page data parsing, politely crawling data, man-machine verification and so on. It has stable crawling performance. Then it makes a statistical analysis of the crawling data. The statistical results show that Weibo's number of forwarding only once accounted for more than 50% of the total number of retweets. It is shown that the topic Weibo data is highly aggregated. Secondly, the model IC model, TIC model .IC model and TIC model of information transmission in social media are introduced. The information is assumed to propagate in cascades in the social network. According to the TIC model, the paper introduces the model of information transmission in social media. Type A and Weibo's highly aggregated data, In this paper, we propose a hierarchical fusion topic propagation model-STIC model. STIC model divides the topic in social network into two layers. The first layer is the case that the information is forwarded only once. The second layer is the case where the information is forwarded more than twice. The first layer of data uses three categories of features as input eigenvalues. In the second layer, the learning results of the two models are linearly integrated as the learning results of the whole model. Through the experimental analysis, the prediction results of the SVM model can be better than that of the TIC model.
【學(xué)位授予單位】:海南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 Bruce Antelman;李雯;;社交網(wǎng)絡(luò)[J];高校圖書館工作;2008年01期
2 ;基于位置的手機(jī)社交網(wǎng)絡(luò)“貝多”正式發(fā)布[J];中國新通信;2008年06期
3 曹增輝;;社交網(wǎng)絡(luò)更偏向于用戶工具[J];信息網(wǎng)絡(luò);2009年11期
4 ;美國:印刷企業(yè)青睞社交網(wǎng)絡(luò)營銷新方式[J];中國包裝工業(yè);2010年Z1期
5 李智惠;柳承燁;;韓國移動社交網(wǎng)絡(luò)服務(wù)的類型分析與促進(jìn)方案[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報);2010年08期
6 賈富;;改變一切的社交網(wǎng)絡(luò)[J];互聯(lián)網(wǎng)天地;2011年04期
7 譚拯;;社交網(wǎng)絡(luò):連接與發(fā)現(xiàn)[J];廣東通信技術(shù);2011年07期
8 陳一舟;;社交網(wǎng)絡(luò)的發(fā)展趨勢[J];傳媒;2011年12期
9 殷樂;;全球社交網(wǎng)絡(luò)新態(tài)勢及文化影響[J];新聞與寫作;2012年01期
10 許麗;;社交網(wǎng)絡(luò):孤獨(dú)年代的集體狂歡[J];上海信息化;2012年09期
相關(guān)會議論文 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國管理學(xué)年會商務(wù)智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎?wù)撐腫C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國體育科學(xué)大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:1618799
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1618799.html