協(xié)同過濾系統(tǒng)的數(shù)據(jù)稀疏性問題研究
本文關(guān)鍵詞:協(xié)同過濾系統(tǒng)的數(shù)據(jù)稀疏性問題研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:推薦系統(tǒng)是解決信息過載問題的有效方案,已經(jīng)廣泛應(yīng)用于電子商務(wù)、社交網(wǎng)絡(luò)、音樂社區(qū)和電影社區(qū)等領(lǐng)域。近年來,協(xié)同過濾推薦技術(shù),因其思路簡單易實現(xiàn)、數(shù)據(jù)依賴性低、推薦結(jié)果準確等優(yōu)點,已經(jīng)成為推薦系統(tǒng)領(lǐng)域中應(yīng)用最為廣泛的技術(shù)之一。協(xié)同過濾推薦系統(tǒng)主要分為基于內(nèi)存的方法和基于模型的方法,但是這些算法都有稀疏性、冷啟動和擴展性等問題。本文主要為緩解數(shù)據(jù)稀疏性問題展開了如下工作:(1)提出一種新穎的基于項目候選集的協(xié)同過濾算法(CI-CF)。CI-CF算法基于用戶協(xié)同過濾,引入用戶之間的非對稱影響度和支持度,并考慮到用戶對項目的偏好程度,提出了項目候選集的概念,同時利用項目信息熵對未評分項目集合進行二次修正,得到候選項目集合。基于MovieLens和netflix數(shù)據(jù)集的實驗表明,相比近三年來多個比較流行的算法(如:AC-PCC算法,RA-CF算法),CI-CF算法在推薦結(jié)果的準確率、召回率和F1值上都具有較大的優(yōu)勢,有效地降低了用戶評分稀疏性問題帶來的負面影響,顯著提高了推薦系統(tǒng)的推薦質(zhì)量。(2)提出了基于好友關(guān)系和標簽的混合協(xié)同過濾算法(FT-CF)。首先分析好友之間的關(guān)系網(wǎng)絡(luò),通過關(guān)系傳播機制快速尋找關(guān)系網(wǎng)絡(luò)中與目標用戶興趣愛好相似的用戶,并找到符合目標用戶需要的商品;然后,利用TF-IDF的思想,從用戶歷史標簽記錄中挖掘該用戶的興趣愛好;最后將兩者有效地結(jié)合,以進一步緩解數(shù)據(jù)的稀疏性問題;趌astfm數(shù)據(jù)集的實驗表明,FT-CF算法比近三年來較流行的算法(如:PRT-CF算法和UCTRA算法)在準確率和召回率上都具有較大優(yōu)勢。(3)全面總結(jié)了對使用標簽信息數(shù)據(jù)、評分數(shù)據(jù)和用戶/項目屬性數(shù)據(jù)等不同種類數(shù)據(jù)信息的算法,并詳細介紹、實現(xiàn)和實驗比較了基于標簽和協(xié)同過濾的個性化資源推薦、基于近鄰雙聚類的協(xié)同過濾top-N推薦系統(tǒng)和基于耦合對象相似度的項目推薦算法;贛ovieLenslOM數(shù)據(jù)集的實驗表明,當(dāng)推薦系統(tǒng)獲得用戶/項目的信息越多,我們對用戶的了解就越多,就越容易把握用戶的興趣愛好,所以將多方面的數(shù)據(jù)信息進行有效的融合,有助于提高推薦系統(tǒng)的推薦質(zhì)量。
【關(guān)鍵詞】:推薦系統(tǒng) 協(xié)同過濾 標簽 社交網(wǎng)絡(luò) 數(shù)據(jù)稀疏性
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-13
- 第一章 緒論13-19
- 1.1 研究背景及意義13-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-16
- 1.2.1 國外研究現(xiàn)狀14-15
- 1.2.2 國內(nèi)研究現(xiàn)狀15-16
- 1.3 協(xié)同過濾所面臨的問題16-17
- 1.4 論文的主要工作和組織結(jié)構(gòu)17-19
- 1.4.1 本文的主要工作17-18
- 1.4.2 本文的組織結(jié)構(gòu)18-19
- 第二章 經(jīng)典的協(xié)同過濾算法19-32
- 2.1 協(xié)同過濾算法19-27
- 2.1.1 基于用戶的k-最近鄰算法20-23
- 2.1.2 基于項目昀k-最近鄰算法23-25
- 2.1.3 Slope One算法25-27
- 2.2 相似度度量27-29
- 2.2.1 余弦相似性度量27-28
- 2.2.2 歐氏距離相似性28-29
- 2.2.3 Pearson相關(guān)系數(shù)29
- 2.2.4 jaccard系數(shù)29
- 2.3 協(xié)同過濾的評價標準29-31
- 2.3.1 預(yù)測準確度30
- 2.3.2 分類準確性30-31
- 2.4 本章小結(jié)31-32
- 第三章 基于項目候選集的協(xié)同過濾算法32-42
- 3.1 相關(guān)工作32
- 3.2 基于項目候選集的算法實現(xiàn)32-37
- 3.2.1 用戶相似度的設(shè)計33-34
- 3.2.2 用戶相似度的綜合34-35
- 3.2.3 項目候選集的選取35-36
- 3.2.4 預(yù)測評分36
- 3.2.5 算法的詳細步驟36-37
- 3.3 實驗結(jié)果及分析37-41
- 3.3.1 數(shù)據(jù)集及度量標準37
- 3.3.2 實驗結(jié)果37-41
- 3.4 本章小結(jié)41-42
- 第四章 基于好友關(guān)系和標簽的混合協(xié)同過濾算法42-54
- 4.1 相關(guān)工作42-46
- 4.1.1 社會化標簽系統(tǒng)描述43-45
- 4.1.2 社交網(wǎng)絡(luò)系統(tǒng)描述45-46
- 4.2 基于好友關(guān)系和標簽的混合算法實現(xiàn)46-50
- 4.2.1 用戶相關(guān)性的計算46-48
- 4.2.2 用戶-標簽偏愛程度的計算48
- 4.2.3 用戶預(yù)測評分值48-49
- 4.2.4 算法的詳細步驟49-50
- 4.3 實驗結(jié)果及分析50-53
- 4.3.1 數(shù)據(jù)集及度量標準50
- 4.3.2 實驗結(jié)果50-53
- 4.4 本章小結(jié)53-54
- 第五章 相關(guān)算法比較54-68
- 5.1 數(shù)據(jù)的收集54-57
- 5.2 社會化標簽推薦算法57-58
- 5.2.1 社會化標簽系統(tǒng)描述57
- 5.2.2 算法流程57-58
- 5.3 基于用戶評分的推薦算法58-61
- 5.3.1 用戶評分描述58-59
- 5.3.2 算法流程59-61
- 5.4 基于項目屬性的推薦算法61-63
- 5.4.1 項目屬性描述61-62
- 5.4.2 算法流程62-63
- 5.5 實驗結(jié)果及分析63-67
- 5.5.1 數(shù)據(jù)集及度量標準63-64
- 5.5.2 實驗結(jié)果64-67
- 5.6 本章小結(jié)67-68
- 總結(jié)與展望68-70
- 總結(jié)68-69
- 展望69-70
- 參考文獻70-76
- 攻讀學(xué)位期間發(fā)表的學(xué)位論文76-78
- 致謝78
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計算機工程與應(yīng)用;2007年06期
2 王嵐;翟正軍;;基于時間加權(quán)的協(xié)同過濾算法[J];計算機應(yīng)用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購系統(tǒng)[J];武漢大學(xué)學(xué)報(工學(xué)版);2008年02期
4 張富國;;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計算機系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報;2009年04期
6 廖新考;;基于用戶特征和項目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計算機工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進研究[J];計算機技術(shù)與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計算機信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術(shù)的個性化網(wǎng)絡(luò)教學(xué)平臺研究[J];科技風(fēng);2012年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項目分類的協(xié)同過濾算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國第20屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場景的協(xié)同過濾推薦算法[A];中國系統(tǒng)仿真學(xué)會第五次全國會員代表大會暨2006年全國學(xué)術(shù)年會論文集[C];2006年
5 李建國;姚良超;湯庸;郭歡;;基于認知度的協(xié)同過濾推薦算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯一[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
2 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
3 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機研究[D];上海交通大學(xué);2011年
4 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進機制研究[D];天津大學(xué);2012年
5 高e
本文編號:460923
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/460923.html