天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于新浪微博的好友推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-08-12 13:14
【摘要】:隨著互聯(lián)網(wǎng)和移動(dòng)通信技術(shù)的快速發(fā)展,越來越多的人使用新浪微博等社交平臺(tái)進(jìn)行交友和分享。數(shù)以億計(jì)的用戶在線交互產(chǎn)生了海量的數(shù)據(jù),以至于出現(xiàn)"信息過載"現(xiàn)象,使得人們查找好友的時(shí)間比與好友交流的時(shí)間還長。為此,本文設(shè)計(jì)實(shí)現(xiàn)了一個(gè)好友推薦系統(tǒng),向用戶推薦可能成為好友的其他用戶。本文通過網(wǎng)絡(luò)爬蟲方式獲得目標(biāo)用戶的二度好友的個(gè)人信息和微博信息,然后通過分析采集到的數(shù)據(jù),并基于用戶興趣相似度、用戶間的地理相似度和用戶影響力這三種因素來綜合地向目標(biāo)用戶進(jìn)行好友推薦。本文首先介紹了課題的研究背景與意義,并且分析了課題的國內(nèi)外研究現(xiàn)狀。接著,通過分析好友推薦系統(tǒng)的用戶需求和功能需求,對(duì)系統(tǒng)進(jìn)行了概要設(shè)計(jì)并對(duì)好友推薦系統(tǒng)進(jìn)行了功能模塊劃分,設(shè)計(jì)了系統(tǒng)的數(shù)據(jù)庫。然后,詳細(xì)設(shè)計(jì)并實(shí)現(xiàn)了各個(gè)模塊。其中,微博數(shù)據(jù)獲取模塊實(shí)現(xiàn)了一種基于用戶好友關(guān)注關(guān)系的新浪微博爬蟲。該爬蟲通過廣度優(yōu)先搜索好友,獲得目標(biāo)用戶的二度好友,通過解析網(wǎng)頁獲得好友的個(gè)人信息以及微博信息,完成了數(shù)據(jù)持久化,同時(shí)解決了使用微博公開API獲取數(shù)據(jù)的多種限制問題。好友推薦模塊通過對(duì)微博歷史內(nèi)容文本使用Ansj中文分詞和TF-IDF算法提取文本特征詞,并使用樸素貝葉斯分類算法對(duì)特征詞進(jìn)行分類以獲得用戶興趣向量,同時(shí)通過余弦距離計(jì)算用戶的興趣相似度。接著,通過用戶所在地信息和用戶的簽到數(shù)據(jù)來計(jì)算用戶間距離,并將距離轉(zhuǎn)換為地理相似度,通過正態(tài)分布函數(shù)對(duì)地理相似度歸一化。然后,通過用戶的粉絲數(shù)、發(fā)送的微博數(shù)以及發(fā)送的微博的轉(zhuǎn)發(fā)量、評(píng)論量和點(diǎn)贊量來衡量用戶的影響力。最后,通過分配不同的權(quán)重綜合三種因素并且加上用戶的教育背景和工作經(jīng)歷信息生成好友推薦列表,通過Top-N方法向用戶進(jìn)行好友推薦。實(shí)驗(yàn)結(jié)果表明,綜合多因素的好友推薦結(jié)果比單一因素的推薦準(zhǔn)確率更高。
[Abstract]:With the rapid development of Internet and mobile communication technology, more and more people use social platforms such as Sina Weibo to make friends and share. Hundreds of millions of online users interact with each other to generate so much data that "information overload" occurs, which makes it take longer to find friends than to communicate with friends. Therefore, this paper designs and implements a friend recommendation system to recommend other users who may become friends. In this paper, the personal information and Weibo information of the second degree friends of the target user are obtained by crawler method, and then the collected data are analyzed, and based on the similarity of user interest, The geographic similarity and user influence among users are three factors to make friend recommendation to the target user synthetically. This paper first introduces the research background and significance of the subject, and analyzes the current research situation at home and abroad. Then, by analyzing the user requirements and functional requirements of the friend recommendation system, the system is designed briefly, and the function modules of the friend recommendation system are divided, and the database of the system is designed. Then, each module is designed and implemented in detail. Among them, the Weibo data acquisition module implements a Sina Weibo crawler based on the user's friend relationship. The crawler gets the second best friend of the target user by searching for friends in the range first, and gets the personal information and Weibo information of the friend by analyzing the web page, and completes the data persistence. At the same time, the problem of using Weibo to expose API to obtain data is solved. The good friend recommendation module extracts the text feature words by using Ansj Chinese word segmentation and TF-IDF algorithm to the Weibo historical content text, and classifies the feature words by using naive Bayes classification algorithm to obtain the user interest vector. At the same time, the interest similarity of users is calculated by cosine distance. Then, the distance between users is calculated by user location information and user check-in data, and the distance is converted into geographical similarity, and the geographical similarity is normalized by normal distribution function. Then, the influence of the user is measured by the number of followers, the number of Weibo sent and the amount of Weibo forwarded, comments and likes. Finally, by assigning different weights to synthesize the three factors and adding the user's educational background and work experience information to generate a friend recommendation list, the Top-N method is used to recommend friends to the user. The experimental results show that the recommendation accuracy is higher than that of single factor.
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 鄭煒冬;;試卷相似度自動(dòng)評(píng)估技術(shù)的研究[J];智能計(jì)算機(jī)與應(yīng)用;2011年06期

2 趙濤;肖建;;二型模糊相似度及其應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2013年08期

3 徐志明;李棟;劉挺;李生;王剛;袁樹侖;;微博用戶的相似性度量及其應(yīng)用[J];計(jì)算機(jī)學(xué)報(bào);2014年01期

4 李桂林,陳曉云;關(guān)于聚類分析中相似度的討論[J];計(jì)算機(jī)工程與應(yīng)用;2004年31期

5 秦玉平;楊興凱;;基于案例推理的區(qū)間屬性相似度研究[J];遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年04期

6 蔣鵬;;基于本體的應(yīng)急案例相似度算法研究[J];南昌高專學(xué)報(bào);2009年03期

7 何亞;;詞語相似度算法的分析與改進(jìn)[J];硅谷;2011年24期

8 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期

9 焦鵬;唐見兵;查亞兵;;仿真可信度評(píng)估中相似度方法的改進(jìn)及其應(yīng)用[J];系統(tǒng)仿真學(xué)報(bào);2007年12期

10 姜毅;樂慶玲;;一種基于興趣相似度的學(xué)習(xí)社區(qū)算法[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年16期

相關(guān)會(huì)議論文 前10條

1 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

2 陸勁挺;路強(qiáng);劉曉平;;對(duì)比相似度計(jì)算方法及其在功能樹擴(kuò)展中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

3 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

4 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年

5 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過濾算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

6 洪文學(xué);王金甲;常鳳香;宋佳霖;劉文遠(yuǎn);王立強(qiáng);;基于圖形特征增強(qiáng)的相似度分類器的研究[A];中國生物醫(yī)學(xué)工程進(jìn)展——2007中國生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2007年

7 雷慶;吳揚(yáng)揚(yáng);;一種基于語義信息計(jì)算XML文檔相似度的新方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

8 葉正;林鴻飛;楊志豪;;基于問句相似度的中文FAQ問答系統(tǒng)研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

9 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集A輯一[C];2010年

10 王健;劉衍珩;焦玉;;VANETs信任傳播建模[A];中國通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年

相關(guān)重要報(bào)紙文章 前1條

1 王伽 衛(wèi)江;出入境證件照片應(yīng)及時(shí)更換[N];中國國門時(shí)報(bào);2008年

相關(guān)博士學(xué)位論文 前10條

1 操震洲;矢量數(shù)據(jù)動(dòng)態(tài)多尺度網(wǎng)絡(luò)傳輸研究[D];南京大學(xué);2015年

2 程亮;基于本體的疾病數(shù)據(jù)整合與挖掘方法研究[D];哈爾濱工業(yè)大學(xué);2014年

3 劉振宇;基于區(qū)域相似度和特征降維的極化SAR影像分類[D];武漢大學(xué);2013年

4 曹,

本文編號(hào):2179160


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2179160.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶272bb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com