個(gè)性化微博推薦方法研究
發(fā)布時(shí)間:2017-04-02 12:09
本文關(guān)鍵詞:個(gè)性化微博推薦方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Web 2.0時(shí)代的出現(xiàn),社交網(wǎng)絡(luò)推陳出新,極大地改變了人們的網(wǎng)絡(luò)使用習(xí)慣。傳統(tǒng)網(wǎng)絡(luò)服務(wù)中用戶只能被動(dòng)地瀏覽網(wǎng)絡(luò)頁面,而社交網(wǎng)絡(luò)成為有著相似興趣、背景的用戶在互聯(lián)網(wǎng)上進(jìn)行交互和協(xié)作的一種信息傳播機(jī)制。因此,社交網(wǎng)絡(luò)吸引到了大量用戶,同時(shí)使得社交網(wǎng)絡(luò)的數(shù)據(jù)不斷豐富起來,深入挖掘出這些數(shù)據(jù)隱含的潛在價(jià)值對于知識(shí)獲取、決策支持等具有重要意義。推薦系統(tǒng)是通過研究用戶已有數(shù)據(jù)來發(fā)掘用戶興趣,從而為用戶推薦可能感興趣的對象,如產(chǎn)品、網(wǎng)頁、微博等。目前,推薦系統(tǒng)已在電子商務(wù)、企業(yè)推薦引擎服務(wù)以及各種網(wǎng)站、社交平臺(tái)得到廣泛的應(yīng)用。協(xié)同過濾作為推薦系統(tǒng)的一種主要算法,相對于傳統(tǒng)的文本過濾在商業(yè)應(yīng)用上獲得了更為不錯(cuò)的成效。當(dāng)前,微博已經(jīng)成長為世界上最有影響力的社交網(wǎng)絡(luò)服務(wù)之一。隨著微博的流行,微博上大量的數(shù)據(jù)也使得用戶無法快速獲取他感興趣的信息。本文主要研究了基于新浪微博的微博推薦問題。我們在對國內(nèi)外相關(guān)方法研究對比的基礎(chǔ)上,介紹對比了推薦系統(tǒng)及其主要推薦技術(shù),特別是協(xié)同過濾推薦方法。本文從影響用戶興趣度的隱性因素(因子)和顯性因素,以及微博互聯(lián)網(wǎng)中的數(shù)據(jù)采集和預(yù)處理等角度對微博推薦進(jìn)行研究。本文首先使用矩陣分解對隱性因素建模,在已有用戶與微博、用戶與微博發(fā)布者影響因素的基礎(chǔ)上[1],提出微博與微博發(fā)布者影響因素,提高了原算法的準(zhǔn)確度,之后又提出了基于張量分解模型的隱因子建模方法,實(shí)現(xiàn)了更高的預(yù)測準(zhǔn)確度。
【關(guān)鍵詞】:微博推薦 協(xié)同過濾 矩陣分解 張量分解
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3;TP393.092
【目錄】:
- 摘要5-6
- Abstract6-9
- 第一章 緒論9-17
- 1.1 研究背景和選題意義9-12
- 1.1.1 研究背景9-11
- 1.1.2 選題意義11-12
- 1.2 微博個(gè)性化推薦系統(tǒng)研究現(xiàn)狀12-14
- 1.2.1 個(gè)性化推薦系統(tǒng)12
- 1.2.2 微博個(gè)性化推薦系統(tǒng)12-14
- 1.3 本文的研究對象和主要工作內(nèi)容14-15
- 1.4 論文的結(jié)構(gòu)安排15-16
- 1.5 本章小結(jié)16-17
- 第二章 個(gè)性化推薦系統(tǒng)及其核心技術(shù)17-23
- 2.1 個(gè)性化推薦系統(tǒng)概述17
- 2.2 個(gè)性化推薦系統(tǒng)的相關(guān)技術(shù)17-22
- 2.2.1 基于內(nèi)容的推薦方法17-19
- 2.2.2 基于協(xié)同過濾的推薦方法19-21
- 2.2.3 復(fù)合型推薦方法21-22
- 2.3 本章小結(jié)22-23
- 第三章 基于協(xié)同排序的微博推薦算法23-35
- 3.1 微博協(xié)同排序方法概述23-24
- 3.2 數(shù)據(jù)源分析24
- 3.3 微博排序優(yōu)化準(zhǔn)則24-25
- 3.4 基于顯性因素的協(xié)同排序25-28
- 3.4.1 用戶關(guān)系顯性因素提取26
- 3.4.2 用戶歷史行為顯性因素提取26-27
- 3.4.3 微博內(nèi)容顯性因素提取27
- 3.4.4 微博發(fā)布者權(quán)威顯性因素提取27-28
- 3.5 基于隱性因素的協(xié)同排序28-33
- 3.5.1 基于矩陣的隱性因子分解模型28-31
- 3.5.2 基于張量的隱性因子分解模型31-33
- 3.6 本章小節(jié)33-35
- 第四章 數(shù)據(jù)獲取與實(shí)驗(yàn)評估35-48
- 4.1 網(wǎng)絡(luò)爬蟲35-39
- 4.1.1 基于scrapy的并行爬蟲設(shè)計(jì)35-37
- 4.1.2 微博模擬登錄37-38
- 4.1.3 微博異步數(shù)據(jù)加載38
- 4.1.4 快速消重算法38-39
- 4.2 數(shù)據(jù)預(yù)處理39-41
- 4.2.1 原始數(shù)據(jù)集39-40
- 4.2.2 數(shù)據(jù)集的劃分和預(yù)處理40-41
- 4.3 評價(jià)標(biāo)準(zhǔn)41
- 4.4 方法對比41-42
- 4.5 實(shí)驗(yàn)結(jié)果與分析42-47
- 4.6 參數(shù)設(shè)置47
- 4.7 本章小節(jié)47-48
- 第五章 總結(jié)與展望48-49
- 參考文獻(xiàn)49-52
- 攻讀碩士學(xué)位期間取得的研究成果52-53
- 致謝53-54
- 附件54
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 孫立偉;何國輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年15期
本文關(guān)鍵詞:個(gè)性化微博推薦方法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):282463
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/282463.html
最近更新
教材專著