基于微博用戶關系分析的好友推薦系統(tǒng)研究與應用
發(fā)布時間:2017-07-25 20:15
本文關鍵詞:基于微博用戶關系分析的好友推薦系統(tǒng)研究與應用
更多相關文章: 標簽聚類 用戶影響力 文本分類 本體 好友推薦
【摘要】:社交網(wǎng)絡如今已經(jīng)是我們生活的一份子,它是web2.0時代的產(chǎn)物,與傳統(tǒng)的門戶網(wǎng)站相比,它是以用戶為主導的,用戶可以對網(wǎng)絡中的內容進行瀏覽,同樣也可以對網(wǎng)絡上的內容進行創(chuàng)建。在五花八門的社交軟件中,微博以其消息傳播的及時性獲取了用戶的好感。在中國社交網(wǎng)絡中微博的占有率越來越高,人們使用微博的頻率越來越高,其中尤其以新浪微博一枝獨秀,人們可以在微博中關注他們希望認識的人,以及與自己有共同興趣愛好的人。如何能夠從海量用戶中給用戶準確的推薦他們感興趣的人,無疑是一個研究熱點,目前新浪微博中的好友推薦注重的方面略顯單一,本文從以下幾個方向進行了研究,為用戶提供了更準確的好友推薦算法。首先,對現(xiàn)有的推薦算法進行了介紹與研究,并對后續(xù)要使用的幾種技術:分類算法、聚類算法、PageRank算法、以及本體的相關概念進行了介紹。其次,通過K-means算法對用戶的標簽中屬于興趣愛好的類別進行了聚類分析,聚在同一個類的標簽說明了具有相似性,用戶可能對這一類別下的興趣愛好標簽同時感興趣。對于用戶所發(fā)狀態(tài)的處理,將搜狗實驗室的文本分類語料庫通過分詞及使用停用詞處理以后,使用Word Net本體庫以及通過Protégé自己建立的本體庫,完成了特征詞選取,并使用KNN分類算法對用戶所發(fā)狀態(tài)進行了分類,結合用戶的標簽以及用戶所關注用戶的興趣,對用戶的興趣愛好進行了判斷,判定出了有相似的興趣愛好關系的被推薦出來的用戶與等待好友推薦的用戶。然后,對用戶的二度以內的好友,也就是與等待好友推薦的用戶之間,至少存在一個互相關注用戶或者單向關注的用戶,通過關注關系以及用戶之間的交互關系,提出了一種基于PageRank算法的用來判斷用戶身邊的用戶影響力的算法。根據(jù)微博中用戶的簽到信息,通過地理位置以及簽到地點的類型判定了被推薦出來的用戶與等待好友推薦的用戶的地理位置關系。最后將上述提出的三種用戶之間的關系,相似的興趣愛好關系、可以建立聯(lián)系的二度好友關系、相似的地理位置關系,綜合在一起設計并實現(xiàn)了基于微博用戶關系分析的好友推薦系統(tǒng)。實驗部分的數(shù)據(jù)通過新浪微博開放平臺提供的API和數(shù)據(jù)堂網(wǎng)站進行獲取,使用java語言完成了實現(xiàn)。系統(tǒng)中同目前微博中所采用的幾種好友推薦算法相比,基于微博用戶關系分析的好友推薦算法提高了推薦的準確性。
【關鍵詞】:標簽聚類 用戶影響力 文本分類 本體 好友推薦
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 緒論9-15
- 1.1 課題背景及意義9-11
- 1.2 國內外研究現(xiàn)狀11-12
- 1.3 本文的主要工作12
- 1.4 論文組織結構12-15
- 第2章 相關理論概述15-27
- 2.1 推薦算法15-19
- 2.1.1 協(xié)同過濾推薦算法15-18
- 2.1.2 基于內容的推薦算法18-19
- 2.1.3 基于社交網(wǎng)絡的好友推薦19
- 2.2 聚類算法19-21
- 2.3 分類算法21-23
- 2.3.1 文本的預處理21-22
- 2.3.2 特征選擇22-23
- 2.3.3 特征權重計算23
- 2.3.4 最終分類23
- 2.4 PageRank算法概述23-24
- 2.5 本體的構建24-26
- 2.5.1 本體的概念24-25
- 2.5.2 本體庫的概念25-26
- 2.6 本章小結26-27
- 第3章 微博中用戶關系的分析27-51
- 3.1 好友推薦方法的概述27-28
- 3.2 微博標簽的處理28-31
- 3.2.1 微博標簽的相似性處理29-30
- 3.2.2 微博標簽的聚類分析30-31
- 3.3 微博用戶所發(fā)狀態(tài)的分析31-38
- 3.3.1 微博用戶所發(fā)狀態(tài)的處理32-35
- 3.3.2 本體知識在微博信息中的應用35-37
- 3.3.3 用戶興趣的分析37-38
- 3.4 用戶身邊的用戶影響力分析38-44
- 3.4.1 基于PageRank算法的用戶影響力計算38-41
- 3.4.2 待推薦用戶身邊的用戶影響力改進算法41-44
- 3.5 用戶地理位置關系的分析44-49
- 3.5.1 新浪微博中的簽到信息44-46
- 3.5.2 用戶簽到信息分析46-48
- 3.5.3 基于地理位置的推薦48-49
- 3.6 基于微博用戶關系分析的好友推薦算法的提出49-50
- 3.7 本章小結50-51
- 第4章 基于微博用戶關系分析的好友推薦系統(tǒng)設計與實現(xiàn)51-65
- 4.1 系統(tǒng)設計51-58
- 4.1.1 功能性需求分析51-53
- 4.1.2 非功能性需求分析53
- 4.1.3 系統(tǒng)架構設計53-54
- 4.1.4 系統(tǒng)數(shù)據(jù)庫設計54-56
- 4.1.5 主要模塊詳細設計56-58
- 4.2 本體的構建58-61
- 4.2.1 WordNet的使用58-60
- 4.2.2 自建本體的構建60-61
- 4.3 系統(tǒng)的主要功能實現(xiàn)61-63
- 4.4 本章小結63-65
- 第5章 實驗結果分析65-73
- 5.1 實驗數(shù)據(jù)獲取65-68
- 5.1.1 新浪微博開放平臺數(shù)據(jù)獲取65-67
- 5.1.2 文本分類數(shù)據(jù)獲取67-68
- 5.2 算法評價標準68-69
- 5.3 準確率實驗結果與分析69-70
- 5.4 召回率實驗結果與分析70-71
- 5.5 本章小結71-73
- 結論73-75
- 參考 文獻75-79
- 攻讀碩士學位期間取得的研究成果79-81
- 致謝81
本文編號:573069
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/573069.html
最近更新
教材專著