融合本體語義與用戶屬性的協(xié)同過濾推薦算法研究
發(fā)布時間:2022-01-18 21:19
大數(shù)據(jù)背景下,海量信息帶來的信息過載問題日益嚴峻,如何高效快速地為用戶尋找到滿足需求的資源,已成為當前亟待解決的問題。推薦系統(tǒng)作為解決上述問題的重要工具,得到了學術界和工業(yè)界的廣泛研究和應用。目前如何為用戶提供更加個性化的建議是推薦算法的主要研究目標,協(xié)同過濾算法作為推薦領域中最經典的算法之一,通過具有相似喜好的用戶群組為目標用戶進行個性化推薦。然而伴隨著數(shù)據(jù)量的不斷增大,傳統(tǒng)的協(xié)同過濾算法存在數(shù)據(jù)稀疏性、長尾現(xiàn)象導致的推薦精度降低等問題。針對上述問題,提出一種融合本體語義與用戶屬性的協(xié)同過濾推薦算法。首先,根據(jù)本體中項目的屬性信息,利用本體語義相似度方法計算項目之間的相似度,構建項目相似度矩陣;其次,根據(jù)用戶-項目評分矩陣提取用戶屬性信息,即用戶興趣度和差異度,構建用戶相似度矩陣,進而融合本體語義與用戶屬性形成用戶偏好矩陣;最后,對用戶偏好矩陣的預測評分進行加權處理,完成TOP-N推薦。實驗采用Movielens數(shù)據(jù)集,結果表明融合本體語義與用戶屬性的協(xié)同過濾推薦算法與當前流行的推薦算法相比,MAE值最低,準確率達到71%,在整體性以及新穎度上都優(yōu)于其他推薦算法。該論文有圖20幅,表...
【文章來源】:遼寧工程技術大學遼寧省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
推薦系統(tǒng)研究趨勢
遼寧工程技術大學碩士學位論文72相關基礎理論2.1個性化推薦算法推薦系統(tǒng)中最關鍵的核心部分,即推薦算法,目前個性化推薦算法按照規(guī)則的不同可以劃分為:基于內容、基于關聯(lián)規(guī)則、基于協(xié)同過濾、基于知識和基于混合模型的這五種推薦算法等,詳情見圖2.1。協(xié)同過濾算法是在推薦領域中研究和發(fā)展最為廣泛,基于內容的推薦算法和基于知識的推薦算法,一般是指根據(jù)內容或領域知識獲取用戶或項目的屬性信息進行推薦,基于關聯(lián)規(guī)則的推薦算法多于數(shù)據(jù)挖掘等經典算法框架相結合使用,挖掘更多用戶興趣信息為用戶提供個性化建議,而混合推薦算法是通過混合其他推薦算法進行推薦,吸取不同算法的優(yōu)點,起到了揚長避短的作用。圖2.1推薦算法的分類Figure2.1Classificationofrecommendedalgorithms2.1.1基于協(xié)同過濾的推薦算法協(xié)同過濾算法是推薦系統(tǒng)中最經典的一種算法。在一定程度上,該算法標志著推薦系統(tǒng)的首次問世。算法于1992年首次提出,曾被GroupLens成功應用于過濾新聞和電子郵件過濾系統(tǒng)。協(xié)同過濾算法作為近年來推薦算法的研究熱點之一,主要可分為基于模型的協(xié)同過濾算法與基于記憶的協(xié)同過濾算法;谀P偷膮f(xié)同過濾算法是根據(jù)用戶的歷史經驗信息,采用數(shù)據(jù)挖掘、機器學習等學習方法訓練一個推薦模型,然后利用這個訓練模型為用戶進行推薦;谟洃浀膮f(xié)同過濾算法可分為User-baseCF[29]與Item-baseCF[30],其核心思想為:通過利用用戶與項目之間的歷史交互信息(如點擊、瀏覽、評分等),挖掘用戶的潛在偏好信息,根據(jù)用戶對項目評分的不同,度量用戶之間的相似度,搜索到與目標用戶相似度較高的最近鄰居集,進而通過最近鄰居集對項目的評分來預測目標用戶的興趣傾向,最終形成推薦列表。協(xié)同過濾算法在近年來研究和關注度持續(xù)上升,與其?
遼寧工程技術大學碩士學位論文9現(xiàn)的總頻率,N表示文本集中的總文本數(shù),in表示文本集合中出現(xiàn)特征項it的文本數(shù)量。圖2.2基于內容的推薦算法Figure2.2Content-basedrecommendationalgorithm2.1.3基于關聯(lián)規(guī)則的推薦算法關聯(lián)規(guī)則是數(shù)據(jù)挖掘中的經典算法之一,近年來在推薦系統(tǒng)中應用十分廣泛;陉P聯(lián)規(guī)則的推薦算法來自于一個對購物車分析“啤酒和尿布”的成功案例[32]。關聯(lián)分析的輸出包含規(guī)則的頭部信息以及對應的主體信息,基于關聯(lián)分析的推薦算法以這種關聯(lián)分析的數(shù)據(jù)分析方式,根據(jù)用戶瀏覽過的行為記錄作為規(guī)則的頭部信息,預測用戶可能感興趣的項目,即規(guī)則的主體信息,從而選出推薦的對象完成推薦。算法的基本實現(xiàn)方法如下:設12=,,...,NIiii為所有項目集合,數(shù)據(jù)集為D,A和mt為任意項目集合,mAt,mtI,根據(jù)關聯(lián)規(guī)則AB,A,BI且AB=。首先,需要計算建立數(shù)據(jù)集中規(guī)則的支持度,即數(shù)據(jù)集D中AB的比例,如式(2.2)所示。()()=()=countABsupportABPABD(2.2)其次,根據(jù)規(guī)則AB的支持度計算出數(shù)據(jù)集中規(guī)則的置信度,如式(2.3)所示。()()()=()=()supportABcountABconfidenceABPBAsupportAcountA()(2.3)最后,根據(jù)置信度再將其做相似度度量,計算方法如式(2.4)所示,找到相似度較高的鄰居項目為當前目標用戶進行推薦。(,)()ababsimiiconfidenceii(2.4)
【參考文獻】:
期刊論文
[1]基于用戶興趣度量的知識發(fā)現(xiàn)服務精準推薦[J]. 丁夢曉,畢強,許鵬程,李潔,牟冬梅. 圖書情報工作. 2019(03)
[2]結合項目流行度加權的協(xié)同過濾推薦算法[J]. 魏甜甜,陳莉,范婷婷,吳小華. 計算機應用研究. 2020(03)
[3]融合用戶對項目和屬性偏好的協(xié)同過濾算法[J]. 王云超,劉臻. 計算機科學. 2018(S2)
[4]融合用戶信任度和相似度的基于核心用戶抽取的魯棒性推薦算法[J]. 趙明,閆寒,曹高峰,劉昕鴻. 電子與信息學報. 2019(01)
[5]一類BP神經網絡優(yōu)化評分預測的協(xié)同過濾推薦算法[J]. 王右雪,蘇清華,胡中波. 長江大學學報(自科版). 2018(17)
[6]基于用戶多屬性加權和興趣相似度的協(xié)同過濾算法研究[J]. 羅海媛,章牧. 情報探索. 2018(05)
[7]基于內容的加權粒度序列推薦算法[J]. 王光,張杰民,董帥含,夏帥. 計算機工程與科學. 2018(03)
[8]基于樸素貝葉斯與協(xié)同過濾的分布式推薦模型研究[J]. 何麗,李熙偉. 北方工業(yè)大學學報. 2017(05)
[9]基于用戶項目體驗度的協(xié)同過濾推薦算法[J]. 鄭蘇洋,姜久雷,王曉峰. 計算機工程. 2017(08)
[10]融合語義相似度與矩陣分解的評分預測算法[J]. 王陽,鐘勇,李振東,楊觀賜. 計算機應用. 2017(S1)
博士論文
[1]基于領域本體的電子商務推薦技術研究[D]. 肖敏.武漢理工大學 2009
碩士論文
[1]基于改進聚類和矩陣分解的協(xié)同過濾推薦算法研究[D]. 宋真真.遼寧工程技術大學 2018
[2]協(xié)同過濾算法的改進與應用研究[D]. 王璇.南京郵電大學 2017
[3]基于本體的語義相似度研究[D]. 阮春陽.鄭州大學 2016
[4]基于本體的個性化推薦系統(tǒng)[D]. 王璐.電子科技大學 2013
[5]基于領域本體的語義檢索及個性化推薦算法研究[D]. 曾維明.南京理工大學 2010
本文編號:3595610
【文章來源】:遼寧工程技術大學遼寧省
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
推薦系統(tǒng)研究趨勢
遼寧工程技術大學碩士學位論文72相關基礎理論2.1個性化推薦算法推薦系統(tǒng)中最關鍵的核心部分,即推薦算法,目前個性化推薦算法按照規(guī)則的不同可以劃分為:基于內容、基于關聯(lián)規(guī)則、基于協(xié)同過濾、基于知識和基于混合模型的這五種推薦算法等,詳情見圖2.1。協(xié)同過濾算法是在推薦領域中研究和發(fā)展最為廣泛,基于內容的推薦算法和基于知識的推薦算法,一般是指根據(jù)內容或領域知識獲取用戶或項目的屬性信息進行推薦,基于關聯(lián)規(guī)則的推薦算法多于數(shù)據(jù)挖掘等經典算法框架相結合使用,挖掘更多用戶興趣信息為用戶提供個性化建議,而混合推薦算法是通過混合其他推薦算法進行推薦,吸取不同算法的優(yōu)點,起到了揚長避短的作用。圖2.1推薦算法的分類Figure2.1Classificationofrecommendedalgorithms2.1.1基于協(xié)同過濾的推薦算法協(xié)同過濾算法是推薦系統(tǒng)中最經典的一種算法。在一定程度上,該算法標志著推薦系統(tǒng)的首次問世。算法于1992年首次提出,曾被GroupLens成功應用于過濾新聞和電子郵件過濾系統(tǒng)。協(xié)同過濾算法作為近年來推薦算法的研究熱點之一,主要可分為基于模型的協(xié)同過濾算法與基于記憶的協(xié)同過濾算法;谀P偷膮f(xié)同過濾算法是根據(jù)用戶的歷史經驗信息,采用數(shù)據(jù)挖掘、機器學習等學習方法訓練一個推薦模型,然后利用這個訓練模型為用戶進行推薦;谟洃浀膮f(xié)同過濾算法可分為User-baseCF[29]與Item-baseCF[30],其核心思想為:通過利用用戶與項目之間的歷史交互信息(如點擊、瀏覽、評分等),挖掘用戶的潛在偏好信息,根據(jù)用戶對項目評分的不同,度量用戶之間的相似度,搜索到與目標用戶相似度較高的最近鄰居集,進而通過最近鄰居集對項目的評分來預測目標用戶的興趣傾向,最終形成推薦列表。協(xié)同過濾算法在近年來研究和關注度持續(xù)上升,與其?
遼寧工程技術大學碩士學位論文9現(xiàn)的總頻率,N表示文本集中的總文本數(shù),in表示文本集合中出現(xiàn)特征項it的文本數(shù)量。圖2.2基于內容的推薦算法Figure2.2Content-basedrecommendationalgorithm2.1.3基于關聯(lián)規(guī)則的推薦算法關聯(lián)規(guī)則是數(shù)據(jù)挖掘中的經典算法之一,近年來在推薦系統(tǒng)中應用十分廣泛;陉P聯(lián)規(guī)則的推薦算法來自于一個對購物車分析“啤酒和尿布”的成功案例[32]。關聯(lián)分析的輸出包含規(guī)則的頭部信息以及對應的主體信息,基于關聯(lián)分析的推薦算法以這種關聯(lián)分析的數(shù)據(jù)分析方式,根據(jù)用戶瀏覽過的行為記錄作為規(guī)則的頭部信息,預測用戶可能感興趣的項目,即規(guī)則的主體信息,從而選出推薦的對象完成推薦。算法的基本實現(xiàn)方法如下:設12=,,...,NIiii為所有項目集合,數(shù)據(jù)集為D,A和mt為任意項目集合,mAt,mtI,根據(jù)關聯(lián)規(guī)則AB,A,BI且AB=。首先,需要計算建立數(shù)據(jù)集中規(guī)則的支持度,即數(shù)據(jù)集D中AB的比例,如式(2.2)所示。()()=()=countABsupportABPABD(2.2)其次,根據(jù)規(guī)則AB的支持度計算出數(shù)據(jù)集中規(guī)則的置信度,如式(2.3)所示。()()()=()=()supportABcountABconfidenceABPBAsupportAcountA()(2.3)最后,根據(jù)置信度再將其做相似度度量,計算方法如式(2.4)所示,找到相似度較高的鄰居項目為當前目標用戶進行推薦。(,)()ababsimiiconfidenceii(2.4)
【參考文獻】:
期刊論文
[1]基于用戶興趣度量的知識發(fā)現(xiàn)服務精準推薦[J]. 丁夢曉,畢強,許鵬程,李潔,牟冬梅. 圖書情報工作. 2019(03)
[2]結合項目流行度加權的協(xié)同過濾推薦算法[J]. 魏甜甜,陳莉,范婷婷,吳小華. 計算機應用研究. 2020(03)
[3]融合用戶對項目和屬性偏好的協(xié)同過濾算法[J]. 王云超,劉臻. 計算機科學. 2018(S2)
[4]融合用戶信任度和相似度的基于核心用戶抽取的魯棒性推薦算法[J]. 趙明,閆寒,曹高峰,劉昕鴻. 電子與信息學報. 2019(01)
[5]一類BP神經網絡優(yōu)化評分預測的協(xié)同過濾推薦算法[J]. 王右雪,蘇清華,胡中波. 長江大學學報(自科版). 2018(17)
[6]基于用戶多屬性加權和興趣相似度的協(xié)同過濾算法研究[J]. 羅海媛,章牧. 情報探索. 2018(05)
[7]基于內容的加權粒度序列推薦算法[J]. 王光,張杰民,董帥含,夏帥. 計算機工程與科學. 2018(03)
[8]基于樸素貝葉斯與協(xié)同過濾的分布式推薦模型研究[J]. 何麗,李熙偉. 北方工業(yè)大學學報. 2017(05)
[9]基于用戶項目體驗度的協(xié)同過濾推薦算法[J]. 鄭蘇洋,姜久雷,王曉峰. 計算機工程. 2017(08)
[10]融合語義相似度與矩陣分解的評分預測算法[J]. 王陽,鐘勇,李振東,楊觀賜. 計算機應用. 2017(S1)
博士論文
[1]基于領域本體的電子商務推薦技術研究[D]. 肖敏.武漢理工大學 2009
碩士論文
[1]基于改進聚類和矩陣分解的協(xié)同過濾推薦算法研究[D]. 宋真真.遼寧工程技術大學 2018
[2]協(xié)同過濾算法的改進與應用研究[D]. 王璇.南京郵電大學 2017
[3]基于本體的語義相似度研究[D]. 阮春陽.鄭州大學 2016
[4]基于本體的個性化推薦系統(tǒng)[D]. 王璐.電子科技大學 2013
[5]基于領域本體的語義檢索及個性化推薦算法研究[D]. 曾維明.南京理工大學 2010
本文編號:3595610
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3595610.html
最近更新
教材專著