基于社交網(wǎng)絡(luò)信息的健康話題關(guān)注度預(yù)測方法研究
本文選題:話題發(fā)現(xiàn) + 關(guān)注度預(yù)測; 參考:《北京郵電大學(xué)》2016年碩士論文
【摘要】:社交網(wǎng)絡(luò)平臺是伴隨著移動互聯(lián)網(wǎng)技術(shù)的發(fā)展而迅速普及起來的一種全新的信息交流方式,微博作為社交網(wǎng)絡(luò)中普及范圍最廣的一種形式,在使用人數(shù)、用戶活躍度等方面都已經(jīng)遠(yuǎn)遠(yuǎn)超越了其他社交網(wǎng)絡(luò)服務(wù)平臺,已經(jīng)成為一個有著充足用戶資源的信息來源。隨著人們對自身健康情況的重視和健康觀念的轉(zhuǎn)變,越來越多的人在微博平臺上發(fā)布和交流與健康話題相關(guān)的信息,參與到健康話題的相關(guān)討論中。因此,微博服務(wù)平臺已經(jīng)成為一個重要而豐富的健康信息數(shù)據(jù)來源。從這個豐富的信息來源平臺上獲取有關(guān)人們健康話題的信息和數(shù)據(jù),對民眾保持自身健康狀況具有重要的意義,也有利于醫(yī)學(xué)工作者提高相關(guān)工作的主動性和及時性,對其開展疾病監(jiān)控和預(yù)防工作提供參考性的建議。因此本文針對微博平臺上的健康話題發(fā)現(xiàn)和關(guān)注度預(yù)測方法進(jìn)行了研究。根據(jù)調(diào)研,本文選擇新浪微博作為社交網(wǎng)絡(luò)信息來源。通過分析新浪微博平臺的特點(diǎn),研究了針對新浪微博平臺獲取微博數(shù)據(jù)的方法,并對健康話題關(guān)注度趨勢預(yù)測所涉及的關(guān)鍵技術(shù)進(jìn)行了調(diào)研和研究。在對微博文本特點(diǎn)、話題關(guān)注度發(fā)展及話題發(fā)現(xiàn)與追蹤(Topic detection and tracking,TDT)技術(shù)的研究和學(xué)習(xí)的基礎(chǔ)上,本文設(shè)計(jì)并實(shí)現(xiàn)了一個針對新浪微博數(shù)據(jù)的健康話題關(guān)注度預(yù)測系統(tǒng)。系統(tǒng)利用網(wǎng)絡(luò)爬蟲與新浪微博平臺開放API相結(jié)合的技術(shù)手段分兩個時間段采集了 75天內(nèi)共170828條新浪微博數(shù)據(jù)作為分析對象。在對原始數(shù)據(jù)進(jìn)行處理后,選用SVM算法從中篩選出健康領(lǐng)域相關(guān)的微博文本。對于篩選后的文本,使用Single-Pass算法進(jìn)行文本聚類,完成話題抽取。本文定義了健康話題關(guān)注度計(jì)算方法,并據(jù)此在話題發(fā)現(xiàn)結(jié)果的基礎(chǔ)上建立了馬爾科夫預(yù)測模型完成對話題關(guān)注度趨勢的預(yù)測。
[Abstract]:With the rapid development of mobile Internet technology, social network platform is a new way of information exchange. As the most widely used form of social network, Weibo is widely used. User activity has been far beyond other social networking platforms, and has become a source of information with sufficient user resources. With the attention of people to their own health situation and the change of health concept, more and more people publish and exchange information related to health topic on Weibo platform, and participate in the relevant discussion of health topic. Therefore, Weibo service platform has become an important and rich health information data source. Getting information and data on people's health topics from this rich information source platform is of great significance to the people to maintain their own health status, and also conducive to the medical workers to improve the initiative and timeliness of related work. To carry out disease control and prevention of the work to provide reference advice. Therefore, the methods of health topic discovery and attention prediction on Weibo platform are studied in this paper. According to the investigation, this article chooses Sina Weibo as the social network information source. By analyzing the characteristics of Sina Weibo platform, the method of obtaining Weibo data from Sina Weibo platform is studied, and the key techniques of predicting the trend of health topic concern are investigated and studied. On the basis of the research and study on the characteristics of Weibo text, the development of topic attention and topic discovery and tracking, this paper designs and implements a health topic concern prediction system for Sina Weibo data. The system uses the technology of web crawler and open API of Sina Weibo platform to collect 170828 Sina Weibo data in 75 days. After processing the raw data, the Weibo text related to health domain is selected by using SVM algorithm. For filtered text, Single-Pass algorithm is used for text clustering to complete topic extraction. Based on the results of topic discovery, a Markov prediction model is established to predict the trend of topic concern.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 Bruce Antelman;李雯;;社交網(wǎng)絡(luò)[J];高校圖書館工作;2008年01期
2 ;基于位置的手機(jī)社交網(wǎng)絡(luò)“貝多”正式發(fā)布[J];中國新通信;2008年06期
3 曹增輝;;社交網(wǎng)絡(luò)更偏向于用戶工具[J];信息網(wǎng)絡(luò);2009年11期
4 ;美國:印刷企業(yè)青睞社交網(wǎng)絡(luò)營銷新方式[J];中國包裝工業(yè);2010年Z1期
5 李智惠;柳承燁;;韓國移動社交網(wǎng)絡(luò)服務(wù)的類型分析與促進(jìn)方案[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào));2010年08期
6 賈富;;改變一切的社交網(wǎng)絡(luò)[J];互聯(lián)網(wǎng)天地;2011年04期
7 譚拯;;社交網(wǎng)絡(luò):連接與發(fā)現(xiàn)[J];廣東通信技術(shù);2011年07期
8 陳一舟;;社交網(wǎng)絡(luò)的發(fā)展趨勢[J];傳媒;2011年12期
9 殷樂;;全球社交網(wǎng)絡(luò)新態(tài)勢及文化影響[J];新聞與寫作;2012年01期
10 許麗;;社交網(wǎng)絡(luò):孤獨(dú)年代的集體狂歡[J];上海信息化;2012年09期
相關(guān)會議論文 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國管理學(xué)年會商務(wù)智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎?wù)撐腫C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國體育科學(xué)大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:2012528
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2012528.html