基于網(wǎng)絡關(guān)系特征的混合推薦算法研究
本文關(guān)鍵詞:基于網(wǎng)絡關(guān)系特征的混合推薦算法研究
更多相關(guān)文章: 推薦系統(tǒng) 關(guān)系特征 復雜網(wǎng)絡
【摘要】:隨著計算能力和存儲能力的提升,我們正在進入DT時代。數(shù)據(jù)量爆炸式增長,尋找內(nèi)容的代價不斷提升,由此人們陷入嚴重的信息過載中。推薦系統(tǒng)作為解決信息過載問題的一種重要形式,近年得到了快速的發(fā)展。尤其在電商領(lǐng)域,推薦應用場景更加廣泛,推薦系統(tǒng)可以為商戶解決長尾商品的營銷問題,同時也可以為用戶提供符合偏好的個性化推薦,提升用戶體驗。推薦系統(tǒng)在電商的發(fā)展過程中起到了重要作用。傳統(tǒng)的協(xié)同過濾算法固然是很成熟的推薦算法。首先協(xié)同過濾是性價比很高的推薦算法,它需要最少的領(lǐng)域知識就可以建立模型而且無需復雜的特征工程。它體現(xiàn)的是集體智慧的思想。其次,它能在一定程度上解決未交互商品的推薦問題。在內(nèi)容特征不足但用戶行為數(shù)據(jù)豐富的情況下更能凸顯其優(yōu)勢。但是協(xié)同過濾也面臨著一些瓶頸。首先是冷啟動的問題。當新User、Item出現(xiàn)時由于缺乏必要的行為數(shù)據(jù),會嚴重損害推薦系統(tǒng)的性能。其次,它無法解決行為數(shù)據(jù)稀疏的問題,這將影響算法的效果。除此之外,它無法加入更多的特征去刻畫User、Item,如果只是改進相似度函數(shù),這對算法效果的提升并不明顯。推薦系統(tǒng)在電商場景下最重要的作用是提升用戶體驗并引導成交,然而隨著電商規(guī)模的擴大,數(shù)據(jù)計算量也飛速增長,傳統(tǒng)的推薦算法無法滿足需求。所以本文采用了基于Match、Rank的思路進行粗召回、精排序的推薦方法,這種混合推薦的機器學習方法更容易融入更多的特征,進而更精準地刻畫用戶喜好。在提升推薦精度方面本文通過復雜網(wǎng)絡算法挖掘用戶行為蘊含的關(guān)系特征,并將該維度的特征進行擴展應用到模型中去。其次,其次,本文還用K-Core算法提取核心節(jié)點用于Match階段,這也可以看做是對噪聲數(shù)據(jù)的清洗。該方法能夠提升模型精度和魯棒性。除此之外,還對本文用到的群落發(fā)現(xiàn)算法進行了分布式實現(xiàn),使得大規(guī)模關(guān)系數(shù)據(jù)挖掘成為可能。從本文的實驗以及結(jié)果分析中可以發(fā)現(xiàn),這里提出的混合推薦算法能夠顯著提高推薦模型的效果。
【關(guān)鍵詞】:推薦系統(tǒng) 關(guān)系特征 復雜網(wǎng)絡
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- abstract5-9
- 第1章 緒論9-13
- 1.1 研究背景及其意義9-10
- 1.2 推薦算法研究現(xiàn)狀及工業(yè)界應用10-11
- 1.3 本文研究內(nèi)容11-12
- 1.4 本文研究章節(jié)結(jié)構(gòu)12-13
- 第2章 相關(guān)研究簡介13-26
- 2.1 推薦算法13-21
- 2.1.1 基于內(nèi)容的推薦算法13-14
- 2.1.2 基于近鄰的協(xié)同過濾推薦算法14-17
- 2.1.3 基于模型的協(xié)同過濾推薦算法17-18
- 2.1.4 混合推薦算法18-19
- 2.1.5 推薦算法評估19-21
- 2.2 復雜網(wǎng)絡21-23
- 2.2.1 復雜網(wǎng)絡概述及結(jié)構(gòu)特性21-22
- 2.2.2 社區(qū)發(fā)現(xiàn)22-23
- 2.3 GIRAPH圖計算框架23-25
- 2.4 本章小結(jié)25-26
- 第3章 基于復雜網(wǎng)絡關(guān)系特征的推薦模型26-38
- 3.1 挖掘網(wǎng)絡關(guān)系特征26-31
- 3.1.1 群落發(fā)現(xiàn)算法思想26-28
- 3.1.2 基于Item的關(guān)系數(shù)據(jù)及權(quán)重28-29
- 3.1.3 融合關(guān)系數(shù)據(jù)的多維度特征構(gòu)建29-31
- 3.2 分布式圖框架加速群落發(fā)現(xiàn)31-33
- 3.2.1 分布式算法思想31-32
- 3.2.2 震蕩檢測及死鎖處理32-33
- 3.3 提取K-CORE節(jié)點消除噪聲數(shù)據(jù)33-34
- 3.4 基于關(guān)系特征的混合推薦架構(gòu)34-37
- 3.4.1 融入Model的二步推薦34-36
- 3.4.2 混合推薦整體架構(gòu)36-37
- 3.5 本章小結(jié)37-38
- 第4章 實驗與效果評估38-49
- 4.0 實驗數(shù)據(jù)集38-39
- 4.1 實驗環(huán)境39-40
- 4.2 推薦算法評估指標40
- 4.3 實驗方案及結(jié)果分析40-48
- 4.3.1 數(shù)據(jù)劃分及評測搭建41-43
- 4.3.2 網(wǎng)絡關(guān)系特征提取43-45
- 4.3.3 K-Core清洗數(shù)據(jù)45-46
- 4.3.4 分布式加速群落發(fā)現(xiàn)46-48
- 4.4 本章小結(jié)48-49
- 第5章 總結(jié)與展望49-51
- 5.1 工作總結(jié)49-50
- 5.2 工作展望50-51
- 參考文獻51-55
- 作者簡介及在學期間所取得的科研成果55-56
- 致謝56
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐義峰;徐云青;劉曉平;;一種基于時間序列性的推薦算法[J];計算機系統(tǒng)應用;2006年10期
2 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計算機應用;2007年06期
3 張海玉;劉志都;楊彩;賈松浩;;基于頁面聚類的推薦算法的改進[J];計算機應用與軟件;2008年09期
4 張立燕;;一種基于用戶事務模式的推薦算法[J];福建電腦;2009年03期
5 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國科技信息;2009年07期
6 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強;;智能博物館環(huán)境下的個性化推薦算法[J];計算機工程與應用;2010年19期
7 王文;;個性化推薦算法研究[J];電腦知識與技術(shù);2010年16期
8 張愷;秦亮曦;寧朝波;李文閣;;改進評價估計的混合推薦算法研究[J];微計算機信息;2010年36期
9 夏秀峰;代沁;叢麗暉;;用戶顯意識下的多重態(tài)度個性化推薦算法[J];計算機工程與應用;2011年16期
10 楊博;趙鵬飛;;推薦算法綜述[J];山西大學學報(自然科學版);2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個性化推薦算法[A];2008年計算機應用技術(shù)交流會論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年
4 周玉妮;鄭會頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動商務個性化推薦系統(tǒng)[A];社會經(jīng)濟發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國系統(tǒng)工程學會第17屆學術(shù)年會論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡的含時推薦算法[A];第五屆全國復雜網(wǎng)絡學術(shù)會議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號:1011999
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1011999.html