一類社交網(wǎng)絡的分析及其算法
發(fā)布時間:2022-07-12 19:02
隨著互聯(lián)網(wǎng)時代的來臨,計算機計算能力與移動網(wǎng)絡技術的不斷提高,社交網(wǎng)絡在近些年來得到了迅猛發(fā)展,如何根據(jù)網(wǎng)站的歷史數(shù)據(jù),統(tǒng)計分析用戶的特性特點,抓住用戶痛點,不斷改進現(xiàn)有推薦系統(tǒng),向用戶推薦更加優(yōu)質的內(nèi)容,是各大社交網(wǎng)絡的首要任務之一。本文對網(wǎng)絡爬蟲抓取的社交網(wǎng)站數(shù)據(jù)進行分析,并結合所爬取數(shù)據(jù)特點提出了一種混合推薦算法。具體內(nèi)容如下:1.選取了當今國內(nèi)發(fā)展迅速且規(guī)模最大的Q&A社交網(wǎng)站知乎作為研究對象,首先爬取該網(wǎng)站的用戶數(shù)據(jù),為此設計了基于Python的多線程爬蟲策略,利用種子用戶進行3層的廣度遍歷。用戶數(shù)據(jù)包括:用戶基本信息,用戶的回答數(shù),用戶獲得的贊同數(shù)和感謝數(shù),用戶關注的人和關注用戶的人的基本信息,用戶回答過的問題,以及用戶關注的話題。然后設計了專門SQlite數(shù)據(jù)庫用來存儲爬蟲數(shù)據(jù),一共收集了2萬名用戶的相關信息。2.分析所爬取數(shù)據(jù)的各類統(tǒng)計指標,根據(jù)指標解讀該網(wǎng)站的用戶特性,整個用戶網(wǎng)絡的連接緊密度,還有其長尾現(xiàn)象。3.根據(jù)第二部分所獲取的用戶數(shù)據(jù)特性,為了給用戶推薦更加優(yōu)質的內(nèi)容,提出了基于協(xié)同過濾推薦算法和基于標簽的混合推薦算法,并且利用上述爬取的數(shù)據(jù)對該混合算法進行性...
【文章頁數(shù)】:39 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 社交網(wǎng)絡研究背景
1.2 社交網(wǎng)絡下的推薦算法的研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 知乎數(shù)據(jù)爬取與分析
2.1 用戶信息獲取表示及建模
2.2 知乎的數(shù)據(jù)采集和和分析
2.2.1 選取特征數(shù)據(jù)建立數(shù)據(jù)庫
2.2.2 數(shù)據(jù)爬蟲
2.2.3 數(shù)據(jù)分析
2.3 本章總結
第三章 基于知乎提出的混合推薦算法
3.1 傳統(tǒng)推薦算法
3.2 基于協(xié)同過濾和標簽的混合推薦算法
第四章 算法性能檢驗
4.1 常用測評指標
4.2 實驗設計及結果
4.2.1 數(shù)據(jù)集
4.2.2 實驗設計
4.2.3 測評指標
4.2.4 實驗結果
4.3 實驗結果分析
第五章 結論與展望
5.1 主要結論
5.2 研究展望
在學期間的研究成果
參考文獻
致謝
本文編號:3659672
【文章頁數(shù)】:39 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 社交網(wǎng)絡研究背景
1.2 社交網(wǎng)絡下的推薦算法的研究現(xiàn)狀
1.3 研究內(nèi)容
第二章 知乎數(shù)據(jù)爬取與分析
2.1 用戶信息獲取表示及建模
2.2 知乎的數(shù)據(jù)采集和和分析
2.2.1 選取特征數(shù)據(jù)建立數(shù)據(jù)庫
2.2.2 數(shù)據(jù)爬蟲
2.2.3 數(shù)據(jù)分析
2.3 本章總結
第三章 基于知乎提出的混合推薦算法
3.1 傳統(tǒng)推薦算法
3.2 基于協(xié)同過濾和標簽的混合推薦算法
第四章 算法性能檢驗
4.1 常用測評指標
4.2 實驗設計及結果
4.2.1 數(shù)據(jù)集
4.2.2 實驗設計
4.2.3 測評指標
4.2.4 實驗結果
4.3 實驗結果分析
第五章 結論與展望
5.1 主要結論
5.2 研究展望
在學期間的研究成果
參考文獻
致謝
本文編號:3659672
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3659672.html
最近更新
教材專著