基于社交網絡信息的健康話題關注度預測方法研究
本文選題:話題發(fā)現 + 關注度預測 ; 參考:《北京郵電大學》2016年碩士論文
【摘要】:社交網絡平臺是伴隨著移動互聯(lián)網技術的發(fā)展而迅速普及起來的一種全新的信息交流方式,微博作為社交網絡中普及范圍最廣的一種形式,在使用人數、用戶活躍度等方面都已經遠遠超越了其他社交網絡服務平臺,已經成為一個有著充足用戶資源的信息來源。隨著人們對自身健康情況的重視和健康觀念的轉變,越來越多的人在微博平臺上發(fā)布和交流與健康話題相關的信息,參與到健康話題的相關討論中。因此,微博服務平臺已經成為一個重要而豐富的健康信息數據來源。從這個豐富的信息來源平臺上獲取有關人們健康話題的信息和數據,對民眾保持自身健康狀況具有重要的意義,也有利于醫(yī)學工作者提高相關工作的主動性和及時性,對其開展疾病監(jiān)控和預防工作提供參考性的建議。因此本文針對微博平臺上的健康話題發(fā)現和關注度預測方法進行了研究。根據調研,本文選擇新浪微博作為社交網絡信息來源。通過分析新浪微博平臺的特點,研究了針對新浪微博平臺獲取微博數據的方法,并對健康話題關注度趨勢預測所涉及的關鍵技術進行了調研和研究。在對微博文本特點、話題關注度發(fā)展及話題發(fā)現與追蹤(Topic detection and tracking,TDT)技術的研究和學習的基礎上,本文設計并實現了一個針對新浪微博數據的健康話題關注度預測系統(tǒng)。系統(tǒng)利用網絡爬蟲與新浪微博平臺開放API相結合的技術手段分兩個時間段采集了 75天內共170828條新浪微博數據作為分析對象。在對原始數據進行處理后,選用SVM算法從中篩選出健康領域相關的微博文本。對于篩選后的文本,使用Single-Pass算法進行文本聚類,完成話題抽取。本文定義了健康話題關注度計算方法,并據此在話題發(fā)現結果的基礎上建立了馬爾科夫預測模型完成對話題關注度趨勢的預測。
[Abstract]:With the rapid development of mobile Internet technology, social network platform is a new way of information exchange. As the most widely used form of social network, Weibo is widely used. User activity has been far beyond other social networking platforms, and has become a source of information with sufficient user resources. With the attention of people to their own health situation and the change of health concept, more and more people publish and exchange information related to health topic on Weibo platform, and participate in the relevant discussion of health topic. Therefore, Weibo service platform has become an important and rich health information data source. Getting information and data on people's health topics from this rich information source platform is of great significance to the people to maintain their own health status, and also conducive to the medical workers to improve the initiative and timeliness of related work. To carry out disease control and prevention of the work to provide reference advice. Therefore, the methods of health topic discovery and attention prediction on Weibo platform are studied in this paper. According to the investigation, this article chooses Sina Weibo as the social network information source. By analyzing the characteristics of Sina Weibo platform, the method of obtaining Weibo data from Sina Weibo platform is studied, and the key techniques of predicting the trend of health topic concern are investigated and studied. On the basis of the research and study on the characteristics of Weibo text, the development of topic attention and topic discovery and tracking, this paper designs and implements a health topic concern prediction system for Sina Weibo data. The system uses the technology of web crawler and open API of Sina Weibo platform to collect 170828 Sina Weibo data in 75 days. After processing the raw data, the Weibo text related to health domain is selected by using SVM algorithm. For filtered text, Single-Pass algorithm is used for text clustering to complete topic extraction. Based on the results of topic discovery, a Markov prediction model is established to predict the trend of topic concern.
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP393.092
【相似文獻】
相關期刊論文 前10條
1 Bruce Antelman;李雯;;社交網絡[J];高校圖書館工作;2008年01期
2 ;基于位置的手機社交網絡“貝多”正式發(fā)布[J];中國新通信;2008年06期
3 曹增輝;;社交網絡更偏向于用戶工具[J];信息網絡;2009年11期
4 ;美國:印刷企業(yè)青睞社交網絡營銷新方式[J];中國包裝工業(yè);2010年Z1期
5 李智惠;柳承燁;;韓國移動社交網絡服務的類型分析與促進方案[J];現代傳播(中國傳媒大學學報);2010年08期
6 賈富;;改變一切的社交網絡[J];互聯(lián)網天地;2011年04期
7 譚拯;;社交網絡:連接與發(fā)現[J];廣東通信技術;2011年07期
8 陳一舟;;社交網絡的發(fā)展趨勢[J];傳媒;2011年12期
9 殷樂;;全球社交網絡新態(tài)勢及文化影響[J];新聞與寫作;2012年01期
10 許麗;;社交網絡:孤獨年代的集體狂歡[J];上海信息化;2012年09期
相關會議論文 前10條
1 趙云龍;李艷兵;;社交網絡用戶的人格預測與關系強度研究[A];第七屆(2012)中國管理學年會商務智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網絡中信息傳播的分析和思考——以人人網為例[A];首屆華中地區(qū)新聞與傳播學科研究生學術論壇獲獎論文[C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網絡與大學生焦慮緩解[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網絡解析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:2012528
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2012528.html