基于協(xié)同過(guò)濾與劃分聚類的推薦算法研究
發(fā)布時(shí)間:2017-06-30 03:01
本文關(guān)鍵詞:基于協(xié)同過(guò)濾與劃分聚類的推薦算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)和通信技術(shù)的蓬勃發(fā)展,人們已經(jīng)從信息匱乏的時(shí)代邁入到信息過(guò)載的時(shí)代,目前解決信息過(guò)載的方法主要有信息檢索和信息過(guò)濾,以搜索引擎為代表的信息檢索技術(shù)已經(jīng)日漸成熟,個(gè)性化推薦是信息過(guò)濾領(lǐng)域最典型的應(yīng)用,作為搜索引擎的補(bǔ)充已被廣泛應(yīng)用到電子商務(wù)、社交網(wǎng)絡(luò)、基于位置的服務(wù)和個(gè)性化廣告等領(lǐng)域。常見的個(gè)性化推薦技術(shù)有協(xié)同過(guò)濾、基于內(nèi)容的推薦和基于圖的推薦等等,協(xié)同過(guò)濾是其中最古老也是應(yīng)用最成功的算法,它假設(shè)過(guò)去相似的用戶將來(lái)會(huì)有相似的行為,通過(guò)對(duì)用戶群體的歷史行為分析計(jì)算找出相似用戶,然后給目標(biāo)用戶推薦他近鄰喜歡但他未購(gòu)買的商品,但是當(dāng)面對(duì)海量信息時(shí),協(xié)同過(guò)濾算法也面臨著數(shù)據(jù)稀疏、冷啟動(dòng)、推薦精度和擴(kuò)展性等問(wèn)題。 傳統(tǒng)的基于用戶的協(xié)同過(guò)濾和基于項(xiàng)目的協(xié)同過(guò)濾在計(jì)算推薦結(jié)果時(shí),都局限在分析用戶-項(xiàng)目評(píng)分信息,基本沒(méi)有考慮用戶和項(xiàng)目的內(nèi)容屬性,盡可能多的挖掘有價(jià)值的推薦信息,對(duì)于提高推薦精度至關(guān)重要。本文充分利用項(xiàng)目的屬性特點(diǎn),就提高協(xié)同過(guò)濾近鄰查找準(zhǔn)確率和近鄰查找效率做了如下研究: 首先,通過(guò)具體實(shí)例分析了傳統(tǒng)的協(xié)同過(guò)濾算法近鄰查找方法的缺陷,數(shù)據(jù)高維稀疏造成用戶間相似度計(jì)算和近鄰查找不準(zhǔn)確,然后提出了基于相似評(píng)分行為的近鄰查找優(yōu)化算法。 其次,將劃分聚類的思想應(yīng)用到協(xié)同推薦中,聚類的過(guò)程是將相似度高的對(duì)象聚到同一個(gè)簇中,通過(guò)聚類將目標(biāo)用戶近鄰查找空間縮小至與其最相似的一個(gè)或幾個(gè)聚類簇,提出了基于用戶-評(píng)分矩陣聚類的協(xié)同過(guò)濾算法;考慮項(xiàng)目的屬性特點(diǎn),應(yīng)用詞頻-逆文檔頻率TF-IDF評(píng)估思想,將高維稀疏的用戶-評(píng)分矩陣轉(zhuǎn)化成相對(duì)低維密集的用戶-興趣矩陣,提出了基于用戶-興趣矩陣聚類的協(xié)同過(guò)濾算法;融合用戶-評(píng)分和用戶-興趣,提出了基于用戶-評(píng)分融合用戶-興趣聚類的協(xié)同過(guò)濾算法,并分別研究了它們的推薦實(shí)時(shí)性和推薦精度。 最后,,在數(shù)據(jù)集MovieLens上設(shè)計(jì)實(shí)驗(yàn),以傳統(tǒng)的基于用戶的協(xié)同過(guò)濾算法作為對(duì)照實(shí)驗(yàn),驗(yàn)證了基于相似評(píng)分行為的近鄰查找算法能夠提高近鄰的查找準(zhǔn)確率從而提高推薦的精度;基于劃分聚類的協(xié)同過(guò)濾算法能夠提高近鄰的查找效率,融合了項(xiàng)目屬性信息聚類的協(xié)同過(guò)濾算法比傳統(tǒng)的協(xié)同過(guò)濾算法推薦精度要高。
【關(guān)鍵詞】:個(gè)性化推薦 協(xié)同過(guò)濾 近鄰查找 相似度計(jì)算 劃分聚類 推薦精度
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-14
- 1.1 研究背景10-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-12
- 1.3 本文的研究?jī)?nèi)容12-13
- 1.4 本文的組織結(jié)構(gòu)13-14
- 第2章 推薦系統(tǒng)概述14-29
- 2.1 推薦系統(tǒng)簡(jiǎn)介14-15
- 2.2 協(xié)同過(guò)濾推薦15-22
- 2.2.1 協(xié)同推薦工作流程16-17
- 2.2.2 協(xié)同過(guò)濾分類17-21
- 2.2.3 協(xié)同推薦面臨的挑戰(zhàn)21-22
- 2.3 其他常用推薦算法22-26
- 2.3.1 基于內(nèi)容的推薦算法22-24
- 2.3.2 基于圖的推薦算法24-26
- 2.4 推薦系統(tǒng)評(píng)測(cè)標(biāo)準(zhǔn)26-28
- 2.4.1 誤差標(biāo)準(zhǔn)26-27
- 2.4.2 命中率標(biāo)準(zhǔn)27
- 2.4.3 其他標(biāo)準(zhǔn)27-28
- 2.5 本章小結(jié)28-29
- 第3章 優(yōu)化近鄰查找的協(xié)同過(guò)濾算法29-37
- 3.1 優(yōu)化背景29-31
- 3.2 基于相似評(píng)分行為的近鄰查找法31-32
- 3.2.1 算法描述31-32
- 3.3 實(shí)驗(yàn)結(jié)果與分析32-36
- 3.3.1 數(shù)據(jù)集介紹32-33
- 3.3.2 評(píng)測(cè)標(biāo)準(zhǔn)33-34
- 3.3.3 實(shí)驗(yàn)環(huán)境34
- 3.3.4 實(shí)驗(yàn)分析34-36
- 3.4 本章小結(jié)36-37
- 第4章 基于劃分聚類的協(xié)同過(guò)濾算法37-51
- 4.1 優(yōu)化背景及目標(biāo)37-38
- 4.1.1 優(yōu)化背景37-38
- 4.1.2 優(yōu)化目標(biāo)38
- 4.2 基于用戶-評(píng)分矩陣聚類的協(xié)同過(guò)濾算法38-42
- 4.2.1 算法說(shuō)明38-39
- 4.2.2 算法描述39-41
- 4.2.3 實(shí)驗(yàn)結(jié)果與分析41-42
- 4.3 基于用戶-興趣矩陣聚類的協(xié)同過(guò)濾算法42-48
- 4.3.1 算法說(shuō)明42-44
- 4.3.2 算法描述44-47
- 4.3.3 實(shí)驗(yàn)結(jié)果與分析47-48
- 4.4 基于用戶-評(píng)分融合用戶-興趣矩陣聚類的協(xié)同過(guò)濾算法48-50
- 4.4.1 算法說(shuō)明48-49
- 4.4.2 算法描述49
- 4.4.3 實(shí)驗(yàn)結(jié)果與分析49-50
- 4.5 本章小結(jié)50-51
- 第5章 總結(jié)與展望51-53
- 5.1 總結(jié)51
- 5.2 展望51-53
- 參考文獻(xiàn)53-57
- 作者簡(jiǎn)介及在學(xué)期間科研成果57-58
- 致謝58
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 王國(guó)霞;劉賀平;;個(gè)性化推薦系統(tǒng)綜述[J];計(jì)算機(jī)工程與應(yīng)用;2012年07期
2 陳君;唐雁;;基于Web社會(huì)網(wǎng)絡(luò)的個(gè)性化Web信息推薦模型[J];計(jì)算機(jī)科學(xué);2006年04期
3 藺豐奇;劉益;;信息過(guò)載問(wèn)題研究述評(píng)[J];情報(bào)理論與實(shí)踐;2007年05期
4 曾春,邢春曉,周立柱;個(gè)性化服務(wù)技術(shù)綜述[J];軟件學(xué)報(bào);2002年10期
5 楊博;趙鵬飛;;推薦算法綜述[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
6 鄧愛林,左子葉,朱揚(yáng)勇;基于項(xiàng)目聚類的協(xié)同過(guò)濾推薦算法[J];小型微型計(jì)算機(jī)系統(tǒng);2004年09期
本文關(guān)鍵詞:基于協(xié)同過(guò)濾與劃分聚類的推薦算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):500283
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/500283.html
最近更新
教材專著