基于聚類和矩陣分解的協(xié)同過濾算法研究
本文關(guān)鍵詞:基于聚類和矩陣分解的協(xié)同過濾算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)和電子商務(wù)的高速發(fā)展,帶來(lái)了網(wǎng)站上的各種信息資源呈現(xiàn)指數(shù)級(jí)別增長(zhǎng),面對(duì)這些泛濫的信息,推薦系統(tǒng)在各大網(wǎng)站了得到了廣泛的應(yīng)用,推薦系統(tǒng)的核心為推薦算法,尤其是協(xié)同過濾推薦算法,該算法是當(dāng)前應(yīng)用最為成功的推薦算法之一,是一種基于用戶顯性評(píng)分行為的推薦技術(shù)。伴隨著網(wǎng)站系統(tǒng)中用戶與項(xiàng)目數(shù)量的迅速增長(zhǎng),其面臨著數(shù)據(jù)稀疏性、冷啟動(dòng)和擴(kuò)展性問題,論文針對(duì)傳統(tǒng)協(xié)同過濾算法中出現(xiàn)的問題進(jìn)行改進(jìn),引入了聯(lián)合聚類和矩陣分解的方法,提出了一種基于聯(lián)合聚類和矩陣分解的協(xié)同過濾改進(jìn)方法。傳統(tǒng)的協(xié)同過濾算法往往忽略了兩個(gè)用戶存在相似的品味只是針對(duì)部分項(xiàng)目這一點(diǎn),而是計(jì)算了網(wǎng)站中的全部項(xiàng)目,面對(duì)該問題,該文引入了基于聚類的算法。首先對(duì)原始矩陣進(jìn)行用戶-項(xiàng)目?jī)蓚(gè)維度的聯(lián)合聚類,聯(lián)合聚類后生成若干個(gè)子矩陣,子矩陣的規(guī)模與原始評(píng)分矩陣相比要小很多,并且同一子矩陣內(nèi)部的評(píng)分具有相似性,可有效降低預(yù)測(cè)階段計(jì)算量,而且也緩解了數(shù)據(jù)稀疏性問題。新數(shù)據(jù)加入后,只需要更新若干個(gè)子矩陣中的一個(gè)或多個(gè)矩陣的某個(gè)未知評(píng)分,可以及時(shí)將新評(píng)分作為可靠的依據(jù)再重新進(jìn)行評(píng)分預(yù)測(cè)。然后,在預(yù)測(cè)階段,選用基于矩陣分解的方法進(jìn)行最后的評(píng)分預(yù)測(cè)。在子矩陣中通過對(duì)傳統(tǒng)的矩陣分解進(jìn)行正則化約束來(lái)防止模型過擬合現(xiàn)象,可有效緩解可擴(kuò)展性。以常用的電影推薦為載體,在傳統(tǒng)的矩陣分解(SVD)的基礎(chǔ)上,深入挖掘數(shù)據(jù)集特點(diǎn),加入全局偏置和社會(huì)興趣隨時(shí)間變化的影響,以提高預(yù)測(cè)精度。最后,在MovieLens數(shù)據(jù)集上進(jìn)行聚類效果實(shí)驗(yàn)與評(píng)分預(yù)測(cè)實(shí)驗(yàn),將該文提出的新算法與傳統(tǒng)的協(xié)同過濾推薦算法進(jìn)行多組對(duì)比實(shí)驗(yàn),以此來(lái)說(shuō)明該文算法的性能優(yōu)劣。實(shí)驗(yàn)結(jié)果表明,該方法具有高效性。
【關(guān)鍵詞】:聯(lián)合聚類 協(xié)同過濾 相似性 矩陣分解 評(píng)分預(yù)測(cè)
【學(xué)位授予單位】:武漢輕工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 1 緒論9-16
- 1.1 研究背景及意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-14
- 1.2.1 聯(lián)合聚類研究現(xiàn)狀10-12
- 1.2.2 協(xié)同過濾研究現(xiàn)狀12-13
- 1.2.3 面臨的主要問題和挑戰(zhàn)13-14
- 1.3 論文的主要研究?jī)?nèi)容14-15
- 1.4 論文的組織結(jié)構(gòu)15
- 1.5 本章小結(jié)15-16
- 2 協(xié)同過濾技術(shù)16-34
- 2.1 傳統(tǒng)協(xié)同過濾推薦算法16-22
- 2.1.1 傳統(tǒng)的協(xié)同過濾算法18-19
- 2.1.2 協(xié)同過濾推薦算法的基本流程19-20
- 2.1.3 用戶相似度計(jì)算方法20-22
- 2.2 基于聚類的協(xié)同過濾技術(shù)22-28
- 2.2.1 基于項(xiàng)目聚類的協(xié)同過濾23-25
- 2.2.2 基于用戶聚類的協(xié)同過濾25-27
- 2.2.3 基于用戶和項(xiàng)目雙重聚類的協(xié)同過濾27-28
- 2.3 矩陣分解方法28-30
- 2.4 評(píng)價(jià)標(biāo)準(zhǔn)和常用數(shù)據(jù)集30-33
- 2.4.1 評(píng)價(jià)標(biāo)準(zhǔn)30-32
- 2.4.2 常用數(shù)據(jù)集32-33
- 2.5 本章小結(jié)33-34
- 3 協(xié)同過濾算法研究和改進(jìn)34-43
- 3.1 聯(lián)合聚類算法的研究和改進(jìn)35-37
- 3.2 增量更新機(jī)制及其改進(jìn)37-38
- 3.3 矩陣分解推薦算法的研究和改進(jìn)38-42
- 3.3.1 基于梯度下降法的矩陣分解38-39
- 3.3.2 加入全局偏置39-40
- 3.3.3 社會(huì)興趣隨時(shí)間變化40-42
- 3.4 本章小結(jié)42-43
- 4 算法實(shí)驗(yàn)與結(jié)果分析43-48
- 4.1 實(shí)驗(yàn)數(shù)據(jù)集43-44
- 4.2 聯(lián)合聚類實(shí)驗(yàn)44-46
- 4.3 實(shí)驗(yàn)結(jié)果分析46-47
- 4.4 本章小結(jié)47-48
- 5 總結(jié)與展望48-50
- 5.1 總結(jié)48
- 5.2 展望48-50
- 參考文獻(xiàn)50-55
- 致謝55-56
- 攻讀學(xué)位期間的研究成果56
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 楊風(fēng)召;;一種基于特征表的協(xié)同過濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年06期
2 王嵐;翟正軍;;基于時(shí)間加權(quán)的協(xié)同過濾算法[J];計(jì)算機(jī)應(yīng)用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過濾的智能導(dǎo)購(gòu)系統(tǒng)[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
4 張富國(guó);;用戶多興趣下基于信任的協(xié)同過濾算法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶評(píng)分矩陣的協(xié)同過濾算法[J];西安電子科技大學(xué)學(xué)報(bào);2009年04期
6 廖新考;;基于用戶特征和項(xiàng)目屬性的混合協(xié)同過濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過濾推薦方法[J];計(jì)算機(jī)工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶多興趣的協(xié)同過濾策略改進(jìn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過濾算法[J];微計(jì)算機(jī)信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過濾推薦技術(shù)的個(gè)性化網(wǎng)絡(luò)教學(xué)平臺(tái)研究[J];科技風(fēng);2012年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類的協(xié)同過濾算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過濾推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過濾算法研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場(chǎng)景的協(xié)同過濾推薦算法[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國(guó);姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過濾推薦算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類迭代的協(xié)同過濾推薦算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測(cè)量學(xué)的協(xié)同過濾相似度方法(英文)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類的協(xié)同過濾推薦算法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問題的方法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過濾推薦算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過濾瓶頸問題研究[D];合肥工業(yè)大學(xué);2009年
2 郭艷紅;推薦系統(tǒng)的協(xié)同過濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
3 羅恒;基于協(xié)同過濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
4 薛福亮;電子商務(wù)協(xié)同過濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
5 高e
本文編號(hào):456766
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/456766.html