基于項目相似度改進的協(xié)同過濾TopN推薦算法研究
本文關(guān)鍵詞:基于項目相似度改進的協(xié)同過濾TopN推薦算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及云計算等技術(shù)地快速發(fā)展,我們的生活也發(fā)生了翻天覆地的變化。我們在享受先進技術(shù)帶來的便捷的同時,也承受著它們所帶來的負面影響,信息過載就是其中之一。針對信息過載問題,早期主要有分類目錄與搜索引擎兩種解決方法,但均有其局限性,分類目錄只能覆蓋少數(shù)項目,相對于海量項目來說遠遠不夠;搜索引擎則需要有明確需求,無法滿足用戶的個性化需求。為了更進一步解決信息過載這一難題,研究人員提出了推薦系統(tǒng)概念。推薦系統(tǒng)通過對用戶歷史行為地分析,發(fā)掘出用戶潛藏的興趣喜好,并且能夠?qū)崿F(xiàn)對用戶的個性化推薦。推薦系統(tǒng)的核心部分就是推薦算法,現(xiàn)今在實際系統(tǒng)中運用最為廣泛的算法就是協(xié)同過濾推薦算法。但是,隨著推薦系統(tǒng)的進一步應(yīng)用,傳統(tǒng)的協(xié)同過濾推薦算法存在的諸如冷啟動、數(shù)據(jù)稀疏性、推薦精度低、長尾項目發(fā)掘能力低等問題,使其不再滿足實際應(yīng)用需求。目前針對推薦系統(tǒng)的研究十分火熱,不過相當(dāng)多的研究工作主要將焦點放在如何提高推薦的準確度上,雖然取得了一定成果,但是無法兼顧推薦結(jié)果的新穎度,導(dǎo)致推薦新穎度仍處于比較低的水平。本文提出了基于項目相似度改進的協(xié)同過濾TopN推薦算法,該算法主要研究目的在于增強長尾項目發(fā)掘能力的同時,不降低推薦結(jié)果的精度。主要工作包括:1.分析用戶活躍度對推薦結(jié)果的影響,引入用戶活躍度概念,削弱活躍用戶對推薦結(jié)果的影響,提高長尾項目的發(fā)掘能力,提高推薦結(jié)果的覆蓋率。2.分析項目種類對推薦結(jié)果的影響,對相似度矩陣進行歸一化處理,削弱同類項目只見相似度過高對推薦結(jié)果的影響,提高推薦結(jié)果的精度,增強推薦結(jié)果的可靠性。3.采用推薦領(lǐng)域經(jīng)典的MovieLens數(shù)據(jù)集對改進算法進行分步仿真,驗證改進算法每一步驟的有效性。
【關(guān)鍵詞】:協(xié)同過濾 項目相似度 用戶活躍度 新穎度
【學(xué)位授予單位】:安徽理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-12
- 1 緒論12-18
- 1.1 研究背景及意義12-14
- 1.1.1 信息過載產(chǎn)生原因12-13
- 1.1.2 信息過載傳統(tǒng)解決方法13
- 1.1.3 推薦系統(tǒng)13-14
- 1.2 推薦系統(tǒng)的研究現(xiàn)狀14-16
- 1.3 本文的研究內(nèi)容16
- 1.4 本文的組織架構(gòu)16-18
- 2 研究理論基礎(chǔ)18-30
- 2.1 相關(guān)技術(shù)18-20
- 2.1.1 信息檢索18
- 2.1.2 信息過濾18-19
- 2.1.3 數(shù)據(jù)挖掘19-20
- 2.2 推薦算法概述20-28
- 2.2.1 基于內(nèi)容的推薦算法21-22
- 2.2.2 基于協(xié)同過濾的推薦算法22-25
- 2.2.3 基于關(guān)聯(lián)規(guī)則的推薦25
- 2.2.4 基于聚類的推薦25
- 2.2.5 基于知識的推薦25-26
- 2.2.6 基于上下文感知的推薦26
- 2.2.7 社交網(wǎng)絡(luò)推薦26-27
- 2.2.8 混合推薦算法27-28
- 2.3 相關(guān)理論28-30
- 2.3.1 長尾理論28
- 2.3.2 馬太效應(yīng)28-30
- 3 基于項目相似度改進的協(xié)同過濾TopN推薦算法30-37
- 3.1 用戶行為數(shù)據(jù)30-31
- 3.1.1 用戶行為數(shù)據(jù)簡介30
- 3.1.2 用戶行為數(shù)據(jù)分類30-31
- 3.1.3 數(shù)據(jù)集分類31
- 3.2 基于項目的協(xié)同過濾算法主要步驟31-34
- 3.2.1 建立用戶-項目反饋信息矩陣R(m,n)31-32
- 3.2.2 項目相似度計算32-33
- 3.2.3 推薦列表生成33-34
- 3.3 基于項目相似度改進的協(xié)同過濾TopN推薦算法34-37
- 3.3.1 項目相似度計算公式改進34
- 3.3.2 項目相似度的歸一化34-35
- 3.3.3 TopN推薦35-37
- 4 實驗設(shè)計與算法評測37-48
- 4.1 推薦系統(tǒng)實驗方法37-40
- 4.1.1 離線實驗38
- 4.1.2 用戶調(diào)查38-39
- 4.1.3 在線實驗39-40
- 4.2 評測指標40-44
- 4.2.1 用戶滿意度40-41
- 4.2.2 準確度評價41-42
- 4.2.3 覆蓋率42-43
- 4.2.4 新穎度43-44
- 4.3 實驗設(shè)計與結(jié)果分析44-48
- 4.3.1 數(shù)據(jù)集選用44
- 4.3.2 本文實驗設(shè)計44
- 4.3.3 實驗結(jié)果與分析44-48
- 5 總結(jié)與展望48-50
- 5.1 總結(jié)48
- 5.2 展望48-50
- 參考文獻50-53
- 致謝53-54
- 作者簡介及讀研期間主要科研成果54
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐義峰;徐云青;劉曉平;;一種基于時間序列性的推薦算法[J];計算機系統(tǒng)應(yīng)用;2006年10期
2 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計算機應(yīng)用;2007年06期
3 張海玉;劉志都;楊彩;賈松浩;;基于頁面聚類的推薦算法的改進[J];計算機應(yīng)用與軟件;2008年09期
4 張立燕;;一種基于用戶事務(wù)模式的推薦算法[J];福建電腦;2009年03期
5 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國科技信息;2009年07期
6 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強;;智能博物館環(huán)境下的個性化推薦算法[J];計算機工程與應(yīng)用;2010年19期
7 王文;;個性化推薦算法研究[J];電腦知識與技術(shù);2010年16期
8 張愷;秦亮曦;寧朝波;李文閣;;改進評價估計的混合推薦算法研究[J];微計算機信息;2010年36期
9 夏秀峰;代沁;叢麗暉;;用戶顯意識下的多重態(tài)度個性化推薦算法[J];計算機工程與應(yīng)用;2011年16期
10 楊博;趙鵬飛;;推薦算法綜述[J];山西大學(xué)學(xué)報(自然科學(xué)版);2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個性化推薦算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個性化推薦算法[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
3 秦國;杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
4 周玉妮;鄭會頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動商務(wù)個性化推薦系統(tǒng)[A];社會經(jīng)濟發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國系統(tǒng)工程學(xué)會第17屆學(xué)術(shù)年會論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡(luò)的含時推薦算法[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會議論文(摘要)匯集[C];2009年
6 梁莘q
本文編號:321055
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/321055.html