基于聚類矩陣近似的協(xié)同過濾推薦模型研究
發(fā)布時(shí)間:2021-10-01 01:52
基于矩陣分解技術(shù)的系統(tǒng)過濾是一種常見的推薦技術(shù),但是由于用戶和商品數(shù)據(jù)的稀疏性和推薦系統(tǒng)可擴(kuò)展性差的問題,使推薦系統(tǒng)的準(zhǔn)確性和計(jì)算效率受到了巨大挑戰(zhàn)。本文提出基于顯性信息和隱性信息聚類矩陣近似的協(xié)同過濾推薦模型,該模型主要針對推薦系統(tǒng)中存在的用戶商品數(shù)據(jù)的稀疏問題和推薦系統(tǒng)可擴(kuò)展性較差問題進(jìn)行改進(jìn),以期提升推薦系統(tǒng)的準(zhǔn)確率與計(jì)算效率;陲@性信息的聚類矩陣近似的協(xié)同過濾推薦方法通過用戶和商品同時(shí)聚類來考慮用戶對于商品興趣的局部特性,找到評分矩陣的內(nèi)在結(jié)構(gòu),形成稠密矩陣塊。同時(shí),該方法應(yīng)用的是真實(shí)評分?jǐn)?shù)據(jù),而不是填充數(shù)據(jù),從而較少地將缺失數(shù)據(jù)納入計(jì)算范圍,減少了噪聲數(shù)據(jù)的干擾,提升了推薦質(zhì)量。在稠密矩陣塊內(nèi)部做推薦減少了推薦系統(tǒng)整體的數(shù)據(jù)輸入,提高了計(jì)算效率;陔[性信息的聚類矩陣近似的協(xié)同過濾推薦方法首先將用戶-商品評分矩陣轉(zhuǎn)化為進(jìn)過處理后的偏好指示矩陣,在此基礎(chǔ)上進(jìn)行尋找最相似的用戶-商品稠密矩陣塊。然后將通過偏好指示矩陣找到的稠密矩陣塊中的數(shù)據(jù)還原為原始用戶對商品的評分?jǐn)?shù)據(jù),并進(jìn)行矩陣近似和對用戶進(jìn)行推薦。最后,本文選取MovieLens-100K電影評分真實(shí)數(shù)據(jù)集進(jìn)行試驗(yàn),并采用...
【文章來源】:北京化工大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1?SVD分解示意圖??Fig.2-1?SVD?decomposition?diagram??
?北京化工大學(xué)碩士學(xué)位論文???n??^?m??圖2-2:?PLSA原理示意圖??Fig.2-2?PLSA?decomposition?diagram??在PLSA中,首先定義潛在主題變量Z?=?,…,\卜表示選擇用戶%??的概率,表示在用戶給定w,的情況下,該用戶擁有興趣主題\的概率,??表示在興趣主題&給定的情況下選擇商品乂的概率。那么,公式(2-4)??計(jì)算了商品&被用戶%選中的概率。??P(*)?=?ZP“|々(。?(2-4)??該模型一般在訓(xùn)練數(shù)據(jù)上采用EM算法進(jìn)行求解,詳細(xì)的求解步驟可以參見??文獻(xiàn)(81)。在給定興趣主題數(shù)量h并計(jì)算出用戶的興趣主題概率^以及??興趣主題々下商品概率之后,根據(jù)公式(2-4)即可為用戶推薦商品。??之后,用戶對商品評分的估算可由公式(2-5)得到。此處,rate表示評分矩??max??陣尺中的最高評分。??P(9j\ui)?=?TP(9j\zk)P^M)xrate^??(2-5)??k??2_2_?2.3基于SGD?(Stochastic?Gradient?Descent,隨機(jī)梯度下降)的協(xié)同過濾??方法??SGD原理??定義一組m個(gè)自變量為,…,'卜因變量為少2,__?,凡J,目標(biāo)??14??
?第五章實(shí)驗(yàn)與分析???第五章實(shí)驗(yàn)與分析??5.?1實(shí)驗(yàn)數(shù)據(jù)??本文采用經(jīng)典的MovieLens-100K數(shù)據(jù)集4。該數(shù)據(jù)集有100,000個(gè)評分?jǐn)?shù)據(jù),??來自943個(gè)用戶,每個(gè)用戶至少評分過20個(gè)以上的電影,共1682部電影。評分??數(shù)據(jù)分為五個(gè)等級,分別是1、2、3、4、5,評分按照由高到低的順序,越低標(biāo)??示用戶對該電影的評價(jià)越低,越高標(biāo)示用戶對該電影的評價(jià)越高。經(jīng)過整理后,??本文將MovieLens-100K數(shù)據(jù)集轉(zhuǎn)化為一個(gè)943行、1682列的用戶-商品評分矩??陣R。其中,每一行數(shù)據(jù)代表一個(gè)用戶對所有商品的評分,每一列數(shù)據(jù)代表一個(gè)??商品被所有的用戶的評分,矩陣中的數(shù)值表示位于該行的用戶對位于該列的商品??的評分。計(jì)算該矩陣中評分不為0的數(shù)據(jù)占全部數(shù)據(jù)的比重可以得到矩陣的稠密??度為6.3%,也就是說,該矩陣的稀疏性為93.7%,這意味著該矩陣中93.7%的數(shù)??據(jù)都是0。圖6顯示了該數(shù)據(jù)集非零數(shù)據(jù)的分布狀態(tài)(圖中NZ是none?zero的縮??寫):??三??0?2£K)?400?600?K)0?1000?1200?1400?1600??nz?=?100000??圖5-1?MovieLens-100K數(shù)據(jù)集非零數(shù)據(jù)分布圖??Fig.5-1?MovieLens-100K?Data?Set?Non-zero?Data?Distribution?Map??4《Movielens?數(shù)據(jù)集》,online:??https://grouplens.org/datasets/movielens/??31??
【參考文獻(xiàn)】:
期刊論文
[1]基于稀疏聚類和信任度的協(xié)同過濾算法[J]. 侯宇博. 信息與電腦(理論版). 2018(07)
[2]基于雙層相似度的協(xié)同過濾推薦算法[J]. 謝毅剛,郭衛(wèi)斌,李建華. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[3]矩陣分解在大規(guī)模個(gè)性化推薦系統(tǒng)中的實(shí)際應(yīng)用[J]. 徐細(xì)林,李毅. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2018(05)
[4]運(yùn)行在Hadoop上的基于用戶的協(xié)同過濾推薦算法研究[J]. 王斯鋒,祝永志,劉文超. 電子技術(shù). 2017(11)
[5]基于矩陣分解的個(gè)性化推薦系統(tǒng)研究[J]. 張時(shí)俊,王永恒. 中文信息學(xué)報(bào). 2017(03)
[6]國內(nèi)電子商務(wù)網(wǎng)站推薦系統(tǒng)信息服務(wù)質(zhì)量比較研究——以淘寶、京東、亞馬遜為例[J]. 洪亮,任秋圜,梁樹賢. 圖書情報(bào)工作. 2016(23)
[7]基于Web日志挖掘和相關(guān)性度量的電子商務(wù)推薦系統(tǒng)[J]. 馬勇,鮮敏,鄭翔,黎遠(yuǎn)松. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(08)
[8]基于地理位置的個(gè)性化新聞混合推薦研究[J]. 陶永才,李俊艷,石磊,衛(wèi)琳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(05)
[9]基于用戶的協(xié)同過濾算法的推薦效率和個(gè)性化改進(jìn)[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(03)
[10]網(wǎng)絡(luò)推薦系統(tǒng)對消費(fèi)者的營銷效果——技術(shù)接受模型視角[J]. 楊一翁,王毅,孫國輝. 中國流通經(jīng)濟(jì). 2016(02)
博士論文
[1]社會網(wǎng)絡(luò)中基于社會關(guān)系的推薦算法研究[D]. 郭磊.山東大學(xué) 2015
碩士論文
[1]基于用戶需求深度驅(qū)動的個(gè)性化推薦算法研究[D]. 劉倩倩.山東師范大學(xué) 2017
[2]基于協(xié)同過濾的推薦算法研究與引擎設(shè)計(jì)[D]. 王世暉.電子科技大學(xué) 2017
[3]基于用戶協(xié)同過濾推薦技術(shù)的研究與實(shí)現(xiàn)[D]. 郎鵬程.寧夏大學(xué) 2017
[4]基于網(wǎng)廳用戶隱私行為的個(gè)性化推薦系統(tǒng)的設(shè)計(jì)和研究[D]. 束宇.南京郵電大學(xué) 2016
[5]基于概率矩陣分解的個(gè)性化推薦系統(tǒng)研究[D]. 譚鳳.西南大學(xué) 2015
[6]協(xié)同過濾推薦算法稀疏性與可擴(kuò)展性問題研究[D]. 李小浩.重慶大學(xué) 2015
[7]基于矩陣分解和隨機(jī)游走相結(jié)合的推薦算法[D]. 楊永向.北京交通大學(xué) 2014
[8]基于分類的推薦系統(tǒng)優(yōu)化方法研究[D]. 朱洪青.華中科技大學(xué) 2014
本文編號:3417018
【文章來源】:北京化工大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1?SVD分解示意圖??Fig.2-1?SVD?decomposition?diagram??
?北京化工大學(xué)碩士學(xué)位論文???n??^?m??圖2-2:?PLSA原理示意圖??Fig.2-2?PLSA?decomposition?diagram??在PLSA中,首先定義潛在主題變量Z?=?,…,\卜表示選擇用戶%??的概率,表示在用戶給定w,的情況下,該用戶擁有興趣主題\的概率,??表示在興趣主題&給定的情況下選擇商品乂的概率。那么,公式(2-4)??計(jì)算了商品&被用戶%選中的概率。??P(*)?=?ZP“|々(。?(2-4)??該模型一般在訓(xùn)練數(shù)據(jù)上采用EM算法進(jìn)行求解,詳細(xì)的求解步驟可以參見??文獻(xiàn)(81)。在給定興趣主題數(shù)量h并計(jì)算出用戶的興趣主題概率^以及??興趣主題々下商品概率之后,根據(jù)公式(2-4)即可為用戶推薦商品。??之后,用戶對商品評分的估算可由公式(2-5)得到。此處,rate表示評分矩??max??陣尺中的最高評分。??P(9j\ui)?=?TP(9j\zk)P^M)xrate^??(2-5)??k??2_2_?2.3基于SGD?(Stochastic?Gradient?Descent,隨機(jī)梯度下降)的協(xié)同過濾??方法??SGD原理??定義一組m個(gè)自變量為,…,'卜因變量為少2,__?,凡J,目標(biāo)??14??
?第五章實(shí)驗(yàn)與分析???第五章實(shí)驗(yàn)與分析??5.?1實(shí)驗(yàn)數(shù)據(jù)??本文采用經(jīng)典的MovieLens-100K數(shù)據(jù)集4。該數(shù)據(jù)集有100,000個(gè)評分?jǐn)?shù)據(jù),??來自943個(gè)用戶,每個(gè)用戶至少評分過20個(gè)以上的電影,共1682部電影。評分??數(shù)據(jù)分為五個(gè)等級,分別是1、2、3、4、5,評分按照由高到低的順序,越低標(biāo)??示用戶對該電影的評價(jià)越低,越高標(biāo)示用戶對該電影的評價(jià)越高。經(jīng)過整理后,??本文將MovieLens-100K數(shù)據(jù)集轉(zhuǎn)化為一個(gè)943行、1682列的用戶-商品評分矩??陣R。其中,每一行數(shù)據(jù)代表一個(gè)用戶對所有商品的評分,每一列數(shù)據(jù)代表一個(gè)??商品被所有的用戶的評分,矩陣中的數(shù)值表示位于該行的用戶對位于該列的商品??的評分。計(jì)算該矩陣中評分不為0的數(shù)據(jù)占全部數(shù)據(jù)的比重可以得到矩陣的稠密??度為6.3%,也就是說,該矩陣的稀疏性為93.7%,這意味著該矩陣中93.7%的數(shù)??據(jù)都是0。圖6顯示了該數(shù)據(jù)集非零數(shù)據(jù)的分布狀態(tài)(圖中NZ是none?zero的縮??寫):??三??0?2£K)?400?600?K)0?1000?1200?1400?1600??nz?=?100000??圖5-1?MovieLens-100K數(shù)據(jù)集非零數(shù)據(jù)分布圖??Fig.5-1?MovieLens-100K?Data?Set?Non-zero?Data?Distribution?Map??4《Movielens?數(shù)據(jù)集》,online:??https://grouplens.org/datasets/movielens/??31??
【參考文獻(xiàn)】:
期刊論文
[1]基于稀疏聚類和信任度的協(xié)同過濾算法[J]. 侯宇博. 信息與電腦(理論版). 2018(07)
[2]基于雙層相似度的協(xié)同過濾推薦算法[J]. 謝毅剛,郭衛(wèi)斌,李建華. 華東理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[3]矩陣分解在大規(guī)模個(gè)性化推薦系統(tǒng)中的實(shí)際應(yīng)用[J]. 徐細(xì)林,李毅. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2018(05)
[4]運(yùn)行在Hadoop上的基于用戶的協(xié)同過濾推薦算法研究[J]. 王斯鋒,祝永志,劉文超. 電子技術(shù). 2017(11)
[5]基于矩陣分解的個(gè)性化推薦系統(tǒng)研究[J]. 張時(shí)俊,王永恒. 中文信息學(xué)報(bào). 2017(03)
[6]國內(nèi)電子商務(wù)網(wǎng)站推薦系統(tǒng)信息服務(wù)質(zhì)量比較研究——以淘寶、京東、亞馬遜為例[J]. 洪亮,任秋圜,梁樹賢. 圖書情報(bào)工作. 2016(23)
[7]基于Web日志挖掘和相關(guān)性度量的電子商務(wù)推薦系統(tǒng)[J]. 馬勇,鮮敏,鄭翔,黎遠(yuǎn)松. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2016(08)
[8]基于地理位置的個(gè)性化新聞混合推薦研究[J]. 陶永才,李俊艷,石磊,衛(wèi)琳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(05)
[9]基于用戶的協(xié)同過濾算法的推薦效率和個(gè)性化改進(jìn)[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計(jì)算機(jī)系統(tǒng). 2016(03)
[10]網(wǎng)絡(luò)推薦系統(tǒng)對消費(fèi)者的營銷效果——技術(shù)接受模型視角[J]. 楊一翁,王毅,孫國輝. 中國流通經(jīng)濟(jì). 2016(02)
博士論文
[1]社會網(wǎng)絡(luò)中基于社會關(guān)系的推薦算法研究[D]. 郭磊.山東大學(xué) 2015
碩士論文
[1]基于用戶需求深度驅(qū)動的個(gè)性化推薦算法研究[D]. 劉倩倩.山東師范大學(xué) 2017
[2]基于協(xié)同過濾的推薦算法研究與引擎設(shè)計(jì)[D]. 王世暉.電子科技大學(xué) 2017
[3]基于用戶協(xié)同過濾推薦技術(shù)的研究與實(shí)現(xiàn)[D]. 郎鵬程.寧夏大學(xué) 2017
[4]基于網(wǎng)廳用戶隱私行為的個(gè)性化推薦系統(tǒng)的設(shè)計(jì)和研究[D]. 束宇.南京郵電大學(xué) 2016
[5]基于概率矩陣分解的個(gè)性化推薦系統(tǒng)研究[D]. 譚鳳.西南大學(xué) 2015
[6]協(xié)同過濾推薦算法稀疏性與可擴(kuò)展性問題研究[D]. 李小浩.重慶大學(xué) 2015
[7]基于矩陣分解和隨機(jī)游走相結(jié)合的推薦算法[D]. 楊永向.北京交通大學(xué) 2014
[8]基于分類的推薦系統(tǒng)優(yōu)化方法研究[D]. 朱洪青.華中科技大學(xué) 2014
本文編號:3417018
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3417018.html
最近更新
教材專著