基于微博用戶關(guān)系分析的好友推薦系統(tǒng)研究與應(yīng)用
發(fā)布時(shí)間:2017-07-25 20:15
本文關(guān)鍵詞:基于微博用戶關(guān)系分析的好友推薦系統(tǒng)研究與應(yīng)用
更多相關(guān)文章: 標(biāo)簽聚類 用戶影響力 文本分類 本體 好友推薦
【摘要】:社交網(wǎng)絡(luò)如今已經(jīng)是我們生活的一份子,它是web2.0時(shí)代的產(chǎn)物,與傳統(tǒng)的門戶網(wǎng)站相比,它是以用戶為主導(dǎo)的,用戶可以對(duì)網(wǎng)絡(luò)中的內(nèi)容進(jìn)行瀏覽,同樣也可以對(duì)網(wǎng)絡(luò)上的內(nèi)容進(jìn)行創(chuàng)建。在五花八門的社交軟件中,微博以其消息傳播的及時(shí)性獲取了用戶的好感。在中國(guó)社交網(wǎng)絡(luò)中微博的占有率越來越高,人們使用微博的頻率越來越高,其中尤其以新浪微博一枝獨(dú)秀,人們可以在微博中關(guān)注他們希望認(rèn)識(shí)的人,以及與自己有共同興趣愛好的人。如何能夠從海量用戶中給用戶準(zhǔn)確的推薦他們感興趣的人,無疑是一個(gè)研究熱點(diǎn),目前新浪微博中的好友推薦注重的方面略顯單一,本文從以下幾個(gè)方向進(jìn)行了研究,為用戶提供了更準(zhǔn)確的好友推薦算法。首先,對(duì)現(xiàn)有的推薦算法進(jìn)行了介紹與研究,并對(duì)后續(xù)要使用的幾種技術(shù):分類算法、聚類算法、PageRank算法、以及本體的相關(guān)概念進(jìn)行了介紹。其次,通過K-means算法對(duì)用戶的標(biāo)簽中屬于興趣愛好的類別進(jìn)行了聚類分析,聚在同一個(gè)類的標(biāo)簽說明了具有相似性,用戶可能對(duì)這一類別下的興趣愛好標(biāo)簽同時(shí)感興趣。對(duì)于用戶所發(fā)狀態(tài)的處理,將搜狗實(shí)驗(yàn)室的文本分類語(yǔ)料庫(kù)通過分詞及使用停用詞處理以后,使用Word Net本體庫(kù)以及通過Protégé自己建立的本體庫(kù),完成了特征詞選取,并使用KNN分類算法對(duì)用戶所發(fā)狀態(tài)進(jìn)行了分類,結(jié)合用戶的標(biāo)簽以及用戶所關(guān)注用戶的興趣,對(duì)用戶的興趣愛好進(jìn)行了判斷,判定出了有相似的興趣愛好關(guān)系的被推薦出來的用戶與等待好友推薦的用戶。然后,對(duì)用戶的二度以內(nèi)的好友,也就是與等待好友推薦的用戶之間,至少存在一個(gè)互相關(guān)注用戶或者單向關(guān)注的用戶,通過關(guān)注關(guān)系以及用戶之間的交互關(guān)系,提出了一種基于PageRank算法的用來判斷用戶身邊的用戶影響力的算法。根據(jù)微博中用戶的簽到信息,通過地理位置以及簽到地點(diǎn)的類型判定了被推薦出來的用戶與等待好友推薦的用戶的地理位置關(guān)系。最后將上述提出的三種用戶之間的關(guān)系,相似的興趣愛好關(guān)系、可以建立聯(lián)系的二度好友關(guān)系、相似的地理位置關(guān)系,綜合在一起設(shè)計(jì)并實(shí)現(xiàn)了基于微博用戶關(guān)系分析的好友推薦系統(tǒng)。實(shí)驗(yàn)部分的數(shù)據(jù)通過新浪微博開放平臺(tái)提供的API和數(shù)據(jù)堂網(wǎng)站進(jìn)行獲取,使用java語(yǔ)言完成了實(shí)現(xiàn)。系統(tǒng)中同目前微博中所采用的幾種好友推薦算法相比,基于微博用戶關(guān)系分析的好友推薦算法提高了推薦的準(zhǔn)確性。
【關(guān)鍵詞】:標(biāo)簽聚類 用戶影響力 文本分類 本體 好友推薦
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 緒論9-15
- 1.1 課題背景及意義9-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-12
- 1.3 本文的主要工作12
- 1.4 論文組織結(jié)構(gòu)12-15
- 第2章 相關(guān)理論概述15-27
- 2.1 推薦算法15-19
- 2.1.1 協(xié)同過濾推薦算法15-18
- 2.1.2 基于內(nèi)容的推薦算法18-19
- 2.1.3 基于社交網(wǎng)絡(luò)的好友推薦19
- 2.2 聚類算法19-21
- 2.3 分類算法21-23
- 2.3.1 文本的預(yù)處理21-22
- 2.3.2 特征選擇22-23
- 2.3.3 特征權(quán)重計(jì)算23
- 2.3.4 最終分類23
- 2.4 PageRank算法概述23-24
- 2.5 本體的構(gòu)建24-26
- 2.5.1 本體的概念24-25
- 2.5.2 本體庫(kù)的概念25-26
- 2.6 本章小結(jié)26-27
- 第3章 微博中用戶關(guān)系的分析27-51
- 3.1 好友推薦方法的概述27-28
- 3.2 微博標(biāo)簽的處理28-31
- 3.2.1 微博標(biāo)簽的相似性處理29-30
- 3.2.2 微博標(biāo)簽的聚類分析30-31
- 3.3 微博用戶所發(fā)狀態(tài)的分析31-38
- 3.3.1 微博用戶所發(fā)狀態(tài)的處理32-35
- 3.3.2 本體知識(shí)在微博信息中的應(yīng)用35-37
- 3.3.3 用戶興趣的分析37-38
- 3.4 用戶身邊的用戶影響力分析38-44
- 3.4.1 基于PageRank算法的用戶影響力計(jì)算38-41
- 3.4.2 待推薦用戶身邊的用戶影響力改進(jìn)算法41-44
- 3.5 用戶地理位置關(guān)系的分析44-49
- 3.5.1 新浪微博中的簽到信息44-46
- 3.5.2 用戶簽到信息分析46-48
- 3.5.3 基于地理位置的推薦48-49
- 3.6 基于微博用戶關(guān)系分析的好友推薦算法的提出49-50
- 3.7 本章小結(jié)50-51
- 第4章 基于微博用戶關(guān)系分析的好友推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)51-65
- 4.1 系統(tǒng)設(shè)計(jì)51-58
- 4.1.1 功能性需求分析51-53
- 4.1.2 非功能性需求分析53
- 4.1.3 系統(tǒng)架構(gòu)設(shè)計(jì)53-54
- 4.1.4 系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)54-56
- 4.1.5 主要模塊詳細(xì)設(shè)計(jì)56-58
- 4.2 本體的構(gòu)建58-61
- 4.2.1 WordNet的使用58-60
- 4.2.2 自建本體的構(gòu)建60-61
- 4.3 系統(tǒng)的主要功能實(shí)現(xiàn)61-63
- 4.4 本章小結(jié)63-65
- 第5章 實(shí)驗(yàn)結(jié)果分析65-73
- 5.1 實(shí)驗(yàn)數(shù)據(jù)獲取65-68
- 5.1.1 新浪微博開放平臺(tái)數(shù)據(jù)獲取65-67
- 5.1.2 文本分類數(shù)據(jù)獲取67-68
- 5.2 算法評(píng)價(jià)標(biāo)準(zhǔn)68-69
- 5.3 準(zhǔn)確率實(shí)驗(yàn)結(jié)果與分析69-70
- 5.4 召回率實(shí)驗(yàn)結(jié)果與分析70-71
- 5.5 本章小結(jié)71-73
- 結(jié)論73-75
- 參考 文獻(xiàn)75-79
- 攻讀碩士學(xué)位期間取得的研究成果79-81
- 致謝81
本文編號(hào):573069
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/573069.html
最近更新
教材專著