基于中文微博的話題趨勢預測系統(tǒng)的設計與實現(xiàn)
本文選題:社交網(wǎng)絡 + 話題趨勢預測�。� 參考:《北京郵電大學》2014年碩士論文
【摘要】:近些年來社交網(wǎng)絡得到了快速的發(fā)展,其獨有的特性使得用戶發(fā)布消息更加容易,信息傳播更加快捷,然而社交網(wǎng)絡的發(fā)展也對于商業(yè)機構的管理者和政府機構的決策者,提出了一定的挑戰(zhàn)。這些機構的管理者和決策者需要隨時并且快速的應對社交網(wǎng)絡上面的熱點話題及相關事件,因為這些事件有時會對相關機構產(chǎn)生非�,F(xiàn)實且巨大的風險。 本論文將以新浪微博為實際的例子探索如何在社交網(wǎng)絡中對于話題趨勢做出預測。在本文中,首先給出了社交網(wǎng)絡中熱點話題趨勢預測的形式化定義和一個話題趨勢預測模型,然后提出了一種針對時間序列數(shù)據(jù)進行特征抽取和構造的新方法,基于提出的新方法構造了三個相互補充的特征子集,最后將這三個特征子集線性組合起來做為支持向量機SVM的輸入向量進行話題趨勢的預測。為了驗證預測模型的性能,本論文采集了一個高質量的新浪微博數(shù)據(jù)集�;讷@取到的數(shù)據(jù),對預測模型進行了完整的測試,取得了良好的效果。 論文首先介紹了近些年來社交網(wǎng)絡的發(fā)展及社交網(wǎng)絡的相關研究領域;在第二章中論文提出了基于SVM的話題趨勢預測模型,并且詳細的給出了特征向量的構造方式;在第三章論文給出了爬蟲框架的詳細設計與實現(xiàn),然后描述了話題趨勢預測系統(tǒng)內(nèi)部各個子系統(tǒng)的詳細設計與實現(xiàn);論文在第四章對于整個系統(tǒng)進行了詳細的功能測試和性能測試,測試表明整個系統(tǒng)達到了預期的設計目標;在最后一章,論文對未來的工作進行了展望,并總結了作者在研究生期間的所有工作和成果。
[Abstract]:Social networks have developed rapidly in recent years. Their unique features make it easier for users to publish news and faster information dissemination. However, the development of social networks also poses a challenge to managers and decision-makers in business organizations. The managers and decision-makers of these institutions need to be ready and quick. We should deal with hot topics and related events on social networks quickly, because these events can sometimes pose a very real and huge risk to related institutions.
This paper will take Sina and micro-blog as an example to explore how to predict topic trends in social networks. In this paper, the formal definition of trend prediction and a topic trend prediction model of hot topics in social networks are given, and then a needle for feature extraction and construction of time series data is proposed. The new method is based on the proposed new method to construct three complementary feature subsets. Finally, the three feature subsets are combined linearly as the input vector of the support vector machine SVM to predict the topic trend. In order to verify the performance of the prediction model, a high quality Sina micro-blog data set is collected in this paper. The data have been tested on the prediction model and achieved good results.
This paper first introduces the development of social networks and the related research fields of social networks in recent years. In the second chapter, the thesis puts forward the prediction model of topic trend based on SVM, and gives a detailed description of the construction of feature vectors. In the third chapter, the detailed design and implementation of the crawler framework are given, and then the topic is described. The detailed design and implementation of each subsystem in the trend prediction system; in the fourth chapter, the detailed functional test and performance test are carried out for the whole system, and the test shows that the whole system has achieved the expected design goal. In the last chapter, the paper looks forward to the future work and summarizes the author during the graduate period. All the work and results.
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.092;TP391.1
【相似文獻】
相關期刊論文 前10條
1 李林容;;社交網(wǎng)絡的特性及其發(fā)展趨勢[J];新聞界;2010年05期
2 陳琛;沙昊;;社交網(wǎng)絡的開放融合圖譜[J];通信世界;2010年48期
3 楊宇良;;網(wǎng)絡讓我們更遠還是更近[J];互聯(lián)網(wǎng)天地;2011年01期
4 陳昱;;社交網(wǎng)絡革命與國家安全關系[J];情報雜志;2011年S2期
5 勞倫·考克斯;;請在工作時更新你的狀態(tài)[J];科技創(chuàng)業(yè);2011年05期
6 斯蒂芬·卡斯;;在線社區(qū)能否解決隱私問題[J];科技創(chuàng)業(yè);2011年08期
7 陳云鵬;;電子商務引領社交網(wǎng)絡走進2.0時代[J];上海信息化;2012年01期
8 馬文剛;;智慧的物聯(lián)社交網(wǎng)絡[J];上海信息化;2012年03期
9 朱乾龍;張倩;杜娟;;我國社交網(wǎng)絡繁榮背后面臨深層次問題困擾[J];世界電信;2012年06期
10 劉華;;社交網(wǎng)絡的融合之路[J];軟件工程師;2012年07期
相關會議論文 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡用戶的人格預測與關系強度研究[A];第七屆(2012)中國管理學年會商務智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網(wǎng)絡中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學科研究生學術論壇獲獎論文[C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡與大學生焦慮緩解[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡解析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:1955379
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1955379.html