基于k-means用戶(hù)聚類(lèi)的混合協(xié)同過(guò)濾算法的研究
本文關(guān)鍵詞:基于k-means用戶(hù)聚類(lèi)的混合協(xié)同過(guò)濾算法的研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近幾年,隨著電子商務(wù)的飛速發(fā)展與互聯(lián)網(wǎng)的普及,人們的生活越來(lái)越方便,可以在足不出戶(hù)的情況下選擇自己想要的商品,電子商務(wù)系統(tǒng)也不斷地為消費(fèi)者供給商品與服務(wù)。但是,隨著用戶(hù)的不斷增加,電子商務(wù)系統(tǒng)提供商品的種類(lèi)信息等也不斷地增加,雖然用戶(hù)可以方便的選擇各種各樣的商品,但如今用戶(hù)很難在眾多的信息中準(zhǔn)確迅速地找到自己感興趣的商品,此時(shí),電子商務(wù)推薦系統(tǒng)的改進(jìn)與優(yōu)化迫在眉睫。如今已存在很多推薦算法,主要可以分為以用戶(hù)主觀為標(biāo)準(zhǔn)的個(gè)性化推薦,以及與用戶(hù)主觀意向無(wú)關(guān)的非個(gè)性化推薦算法,相應(yīng)地推薦系統(tǒng)也可以被分為非個(gè)性化推薦和個(gè)性化推薦系統(tǒng)。推薦系統(tǒng)所提供的個(gè)性化推薦是根據(jù)用戶(hù)的歷史行為給予推薦,而非個(gè)性化推薦則不考慮用戶(hù)歷史數(shù)據(jù)。本文主要研究的是個(gè)性化推薦算法中的協(xié)同過(guò)濾,由于傳統(tǒng)的協(xié)同過(guò)濾具有一些缺點(diǎn),本文針對(duì)其缺點(diǎn)進(jìn)行一些相應(yīng)改進(jìn),主要工作如下:首先,采用最傳統(tǒng)且使用最為廣泛的推薦算法,即協(xié)同過(guò)濾推薦算法。協(xié)同過(guò)濾推薦算法可分為基于用戶(hù)的協(xié)同過(guò)濾推薦算法和基于項(xiàng)目的協(xié)同過(guò)濾推薦算法兩種。第一種是通過(guò)計(jì)算用戶(hù)之間的相似性進(jìn)行推薦的,而另一種是通過(guò)計(jì)算項(xiàng)目之間的相似性進(jìn)行推薦的,本文主要采用的是基于用戶(hù)的協(xié)同過(guò)濾。其次,采用混合協(xié)同過(guò)濾推薦算法。針對(duì)基于用戶(hù)的協(xié)同過(guò)濾推薦算法的稀疏性進(jìn)行優(yōu)化。在現(xiàn)實(shí)生活中,用戶(hù)對(duì)項(xiàng)目的評(píng)分只是其中的小部分,使得評(píng)分?jǐn)?shù)據(jù)非常稀疏,這將導(dǎo)致用戶(hù)相似度的計(jì)算存在著很大的誤差,很難準(zhǔn)確的找到用戶(hù)的“鄰居”,直接影響著推薦結(jié)果的準(zhǔn)確性。本文根據(jù)項(xiàng)目的相似性進(jìn)行評(píng)分預(yù)測(cè),解決評(píng)分矩陣的稀疏性,再根據(jù)近鄰用戶(hù)的行為實(shí)施推薦。最后,由于電子商務(wù)的飛速發(fā)展,用戶(hù)與項(xiàng)目都不斷增加,導(dǎo)致在使用協(xié)同過(guò)濾推薦算法時(shí)計(jì)算相似性的效率低、推薦不及時(shí)等問(wèn)題的出現(xiàn)。為更好的解決此問(wèn)題,本文提出結(jié)合數(shù)據(jù)挖掘算法。首先使用k-means用戶(hù)聚類(lèi),根據(jù)用戶(hù)的行為習(xí)慣把用戶(hù)分成不同的簇,然后使用項(xiàng)目相似性解決評(píng)分矩陣的稀疏性,最后在此基礎(chǔ)上使用協(xié)同過(guò)濾推薦算法,先判斷用戶(hù)具體屬于哪個(gè)簇,在簇內(nèi)計(jì)算用戶(hù)相似性。這樣,將最大限度的減少計(jì)算量,提高推薦算法的效率,并且經(jīng)過(guò)最終實(shí)驗(yàn)結(jié)果驗(yàn)證,此優(yōu)化方式將提高算法的準(zhǔn)確性。
【關(guān)鍵詞】:電子商務(wù) 協(xié)同過(guò)濾 k-means算法 聚類(lèi)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要4-6
- abstract6-11
- 第1章 緒論11-15
- 1.1 研究背景11
- 1.2 電子商務(wù)研究現(xiàn)狀11-13
- 1.2.1 數(shù)據(jù)挖掘11-12
- 1.2.2 電子商務(wù)12-13
- 1.3 本文研究?jī)?nèi)容13-14
- 1.4 本文研究結(jié)構(gòu)14-15
- 第2章 傳統(tǒng)的數(shù)據(jù)挖掘算法與推薦算法15-32
- 2.1 電子商務(wù)推薦系統(tǒng)15-16
- 2.2 數(shù)據(jù)挖掘相關(guān)算法16-24
- 2.2.1 K最近鄰算法16-17
- 2.2.2 樸素貝葉斯算法17-18
- 2.2.3 PageRank算法18-20
- 2.2.4 Apriori算法20-24
- 2.3 個(gè)性化推薦算法24-26
- 2.3.1 基于內(nèi)容的推薦24-25
- 2.3.2 基于關(guān)聯(lián)規(guī)則的推薦25
- 2.3.3 基于效用的推薦25-26
- 2.3.4 基于知識(shí)的推薦26
- 2.4 協(xié)同過(guò)濾推薦算法26-31
- 2.4.1 相關(guān)概念27-28
- 2.4.2 基于用戶(hù)的協(xié)同過(guò)濾推薦算法28-29
- 2.4.3 基于項(xiàng)目的協(xié)同過(guò)濾推薦算法29-30
- 2.4.4 混合協(xié)同過(guò)濾推薦算法30-31
- 2.5 本章小結(jié)31-32
- 第3章 混合協(xié)同過(guò)濾推薦算法的研究32-38
- 3.1 優(yōu)化背景32
- 3.2 算法描述32-35
- 3.2.1 基于用戶(hù)的協(xié)同過(guò)濾推薦算法32-33
- 3.2.2 混合協(xié)同過(guò)濾推薦算法33-35
- 3.3 實(shí)驗(yàn)及分析35-36
- 3.3.1 實(shí)驗(yàn)數(shù)據(jù)35
- 3.3.2 度量標(biāo)準(zhǔn)35-36
- 3.3.3 結(jié)果分析36
- 3.4 本章總結(jié)36-38
- 第4章 基于聚類(lèi)的混合協(xié)同過(guò)濾推薦算法的研究38-47
- 4.1 優(yōu)化背景38
- 4.2 k-means算法38-40
- 4.3 算法描述40-44
- 4.3.1 k-means用戶(hù)聚類(lèi)40-41
- 4.3.2 基于k-means用戶(hù)聚類(lèi)的混合協(xié)同過(guò)濾算法41-44
- 4.4 結(jié)果分析44-45
- 4.5 本章小結(jié)45-47
- 第5章 總結(jié)與展望47-49
- 5.1 總結(jié)47
- 5.2 展望47-49
- 參考文獻(xiàn)49-52
- 致謝52
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 楊風(fēng)召;;一種基于特征表的協(xié)同過(guò)濾算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年06期
2 王嵐;翟正軍;;基于時(shí)間加權(quán)的協(xié)同過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用;2007年09期
3 曾子明;張李義;;基于多屬性決策和協(xié)同過(guò)濾的智能導(dǎo)購(gòu)系統(tǒng)[J];武漢大學(xué)學(xué)報(bào)(工學(xué)版);2008年02期
4 張富國(guó);;用戶(hù)多興趣下基于信任的協(xié)同過(guò)濾算法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2008年08期
5 侯翠琴;焦李成;張文革;;一種壓縮稀疏用戶(hù)評(píng)分矩陣的協(xié)同過(guò)濾算法[J];西安電子科技大學(xué)學(xué)報(bào);2009年04期
6 廖新考;;基于用戶(hù)特征和項(xiàng)目屬性的混合協(xié)同過(guò)濾推薦[J];福建電腦;2010年07期
7 沈磊;周一民;李舟軍;;基于心理學(xué)模型的協(xié)同過(guò)濾推薦方法[J];計(jì)算機(jī)工程;2010年20期
8 徐紅;彭黎;郭艾寅;徐云劍;;基于用戶(hù)多興趣的協(xié)同過(guò)濾策略改進(jìn)研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年04期
9 焦晨斌;王世卿;;基于模型填充的混合協(xié)同過(guò)濾算法[J];微計(jì)算機(jī)信息;2011年11期
10 鄭婕;鮑海琴;;基于協(xié)同過(guò)濾推薦技術(shù)的個(gè)性化網(wǎng)絡(luò)教學(xué)平臺(tái)研究[J];科技風(fēng);2012年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 沈杰峰;杜亞軍;唐俊;;一種基于項(xiàng)目分類(lèi)的協(xié)同過(guò)濾算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
2 周軍鋒;湯顯;郭景峰;;一種優(yōu)化的協(xié)同過(guò)濾推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
3 董全德;;基于雙信息源的協(xié)同過(guò)濾算法研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
4 張光衛(wèi);康建初;李鶴松;劉常昱;李德毅;;面向場(chǎng)景的協(xié)同過(guò)濾推薦算法[A];中國(guó)系統(tǒng)仿真學(xué)會(huì)第五次全國(guó)會(huì)員代表大會(huì)暨2006年全國(guó)學(xué)術(shù)年會(huì)論文集[C];2006年
5 李建國(guó);姚良超;湯庸;郭歡;;基于認(rèn)知度的協(xié)同過(guò)濾推薦算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 王明文;陶紅亮;熊小勇;;雙向聚類(lèi)迭代的協(xié)同過(guò)濾推薦算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 胡必云;李舟軍;王君;;基于心理測(cè)量學(xué)的協(xié)同過(guò)濾相似度方法(英文)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
8 林麗冰;師瑞峰;周一民;李月雷;;基于雙聚類(lèi)的協(xié)同過(guò)濾推薦算法[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
9 羅喜軍;王韜丞;杜小勇;劉紅巖;何軍;;基于類(lèi)別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問(wèn)題的方法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
10 黃創(chuàng)光;印鑒;汪靜;劉玉葆;王甲海;;不確定近鄰的協(xié)同過(guò)濾推薦算法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯一[C];2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 紀(jì)科;融合上下文信息的混合協(xié)同過(guò)濾推薦算法研究[D];北京交通大學(xué);2016年
2 李聰;電子商務(wù)推薦系統(tǒng)中協(xié)同過(guò)濾瓶頸問(wèn)題研究[D];合肥工業(yè)大學(xué);2009年
3 郭艷紅;推薦系統(tǒng)的協(xié)同過(guò)濾算法與應(yīng)用研究[D];大連理工大學(xué);2008年
4 羅恒;基于協(xié)同過(guò)濾視角的受限玻爾茲曼機(jī)研究[D];上海交通大學(xué);2011年
5 薛福亮;電子商務(wù)協(xié)同過(guò)濾推薦質(zhì)量影響因素及其改進(jìn)機(jī)制研究[D];天津大學(xué);2012年
6 高e
本文編號(hào):383437
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/383437.html