基于圖嵌入技術(shù)的個(gè)人推薦與群組推薦算法研究
發(fā)布時(shí)間:2021-08-01 06:37
推薦系統(tǒng)是近十年來(lái)非常熱門的研究方向。而近年來(lái)表示學(xué)習(xí)技術(shù)的迅猛發(fā)展,也大大推動(dòng)了推薦系統(tǒng)技術(shù)的進(jìn)步。在本文的研究中,我們主要探究了如何將一種新的表示學(xué)習(xí)技術(shù),圖嵌入技術(shù)分別應(yīng)用到兩個(gè)常見的推薦問(wèn)題上:即面向個(gè)人用戶的物品或朋友推薦,和面向群組用戶的物品推薦。傳統(tǒng)的面向個(gè)人用戶的推薦主要采取協(xié)同過(guò)濾算法,然而協(xié)同過(guò)濾主要面臨三個(gè)挑戰(zhàn)性問(wèn)題:(1)數(shù)據(jù)稀疏性問(wèn)題;(2)推薦效率問(wèn)題;(3)用戶決策的復(fù)雜性,即社交網(wǎng)絡(luò)平臺(tái)中用戶選擇物品不僅考慮自身興趣,還會(huì)參考朋友的選擇。反之,用戶選擇朋友也同樣會(huì)考慮用戶與物品間的交互關(guān)系。針對(duì)以上問(wèn)題,本文提出了不同場(chǎng)景下兩種面向個(gè)人的推薦算法。針對(duì)問(wèn)題(1)和(2),本文提出了一種高效的自適應(yīng)混合協(xié)同物品推薦算法。該算法利用計(jì)算內(nèi)容張量相似度的方法得到基于內(nèi)容的推薦結(jié)果作為輔助信息,從而緩解數(shù)據(jù)稀疏性問(wèn)題;同時(shí),為了提高效率,本文采用了一種圖上的短路徑枚舉疊加算法;最后,采用自適應(yīng)的混合方法融合以上兩種方法的推薦結(jié)果,提高推薦性能。另外,針對(duì)問(wèn)題(1)和(3),本文提出了基于圖嵌入技術(shù)的面向個(gè)人的聯(lián)合用戶和物品推薦算法。該算法利用用戶物品交互圖和用戶...
【文章來(lái)源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1?AHCF算法框架圖??
基于圖嵌入技術(shù)的個(gè)人推薦與群組推薦算法研宄?第二章基于自適應(yīng)混合協(xié)同過(guò)濾的高效物品推?f:算法??的鄰接物品標(biāo)簽對(duì),可以認(rèn)為共享物品和標(biāo)簽的二元組信息的用戶是更相似的,這??種方法很大程度上去除了大量偶然相關(guān)用戶,為用戶找到興趣更相關(guān)的用戶。這種??情況下路徑得分計(jì)算與基本擴(kuò)展一樣,也是終點(diǎn)物品的評(píng)分。假設(shè)用戶通過(guò)二元??組<?>找到用戶計(jì)算用戶的歷史物品得分為:??S?p(iii,<Vf,rm>,iij,\,n)?=?Pv”。??圖3-3以基本擴(kuò)展模型為例描述了短路徑枚舉方法的計(jì)算示意圖,4代表用戶與??物品標(biāo)簽的鄰接矩陣,對(duì)于用戶與物品或標(biāo)簽有交互的位置設(shè)置為1,沒有交互的設(shè)??置為0,?代表A的轉(zhuǎn)置。P是用戶與物品的交互矩陣,其中的物品得分都是該列物??品的正面率。矩陣相乘之后即為最終的預(yù)測(cè)矩陣見??圖3-3短路徑枚舉算法說(shuō)明圖??時(shí)間復(fù)雜度分析:對(duì)于傳統(tǒng)的基于k近鄰的協(xié)同過(guò)濾算法,在將標(biāo)簽作為第三類??實(shí)體的基礎(chǔ)上,總的時(shí)間復(fù)雜度是〇((rvi+m)??丨似丨2+丨似丨?(丨切??/嘆間+a:??m)),前??半部分是計(jì)算用戶相似度矩陣,后半部分是對(duì)于每個(gè)用戶首先找出k近鄰,然后針對(duì)??每個(gè)候選物品計(jì)算得分。對(duì)于隨機(jī)游走算法,其時(shí)間復(fù)雜度為〇((丨糾+?m?+?m)3.A〇,??其屮W是矩陣迭代的次數(shù)。而本章的短路徑枚平算法的吋間復(fù)雜度是<9((|7|?+丨71)-??丨似丨2?+?rwi2??rvi),就是三個(gè)矩陣相乘的時(shí)間復(fù)雜度,由于現(xiàn)有的技術(shù)可以很方便地對(duì)??矩陣乘法并行計(jì)算,因此實(shí)際操作時(shí)效申.極高。??3.2.4算法總結(jié)??最終算法的偽代碼如算法I所示。第一步,首先根據(jù)物品的內(nèi)容構(gòu)造張量,??Tuc
基于圖嵌入技術(shù)的個(gè)人推荇與群組推薦算法研究?第二章基于自適應(yīng)混合協(xié)同過(guò)濾的咼效物品推薦算法??[XZ:?UserKNN??12'?^?\ZZ2?RW??10-?V?ctd?SP1??y?□?SP2??I:ll?R??i^L??Movielens?Oouban-Book??DataSets??圖3-4協(xié)同過(guò)濾算法的運(yùn)行時(shí)間對(duì)比圖??品的平均記錄數(shù)分別為丨00和20,可以看到當(dāng)〇和/?設(shè)置為丨00和20時(shí),準(zhǔn)確率能達(dá)到??最高。在表3-6中,抽取總數(shù)據(jù)集80%的記錄作為訓(xùn)練集,此時(shí)用戶和物品的平均??記錄數(shù)約為300和60,i」J■以看到當(dāng)a和盡設(shè)置為300和60時(shí),精確度也i」j'以達(dá)到最高。??因此,每一次在混合計(jì)算之前,首先計(jì)算當(dāng)前數(shù)據(jù)集的用戶與物品的平均記錄數(shù),??將a和分別設(shè)置為對(duì)應(yīng)值。對(duì)于Douban-?Book也使用這種方法設(shè)置。??表3-5訓(xùn)練集占比20%時(shí)噦對(duì)準(zhǔn)確度的影響??100?200?400?600??10?0.528?0.5280.527 ̄ ̄0.526?? ̄^0?0.528?0.5240.5220.518??^0?0.4970.465 ̄ ̄0.382 ̄ ̄0.315??60? ̄0.418?0.302?0.190?0.132??表3-6訓(xùn)練集占比80%時(shí)d叫對(duì)準(zhǔn)確度的影響??200?300?400?600??20?0.134?0.134?0.134?0.134??40?0.232?0.231 ̄ ̄0231 ̄ ̄0.231??^600.233 ̄ ̄0.233 ̄ ̄0.232 ̄ ̄0.232??80? ̄0.233?0.233
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶近鄰的N維張量分解推薦算法[J]. 陳健美,孫亞軍. 計(jì)算機(jī)工程. 2017(11)
[2]基于動(dòng)態(tài)k近鄰的SlopeOne協(xié)同過(guò)濾推薦算法[J]. 孫麗梅,李晶皎,孫煥良. 計(jì)算機(jī)科學(xué)與探索. 2011(09)
[3]通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[J]. 羅辛,歐陽(yáng)元新,熊璋,袁滿. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
[4]協(xié)同過(guò)濾在推薦系統(tǒng)中的應(yīng)用研究[J]. 王霞,劉琴. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2005(04)
本文編號(hào):3315015
【文章來(lái)源】:蘇州大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1?AHCF算法框架圖??
基于圖嵌入技術(shù)的個(gè)人推薦與群組推薦算法研宄?第二章基于自適應(yīng)混合協(xié)同過(guò)濾的高效物品推?f:算法??的鄰接物品標(biāo)簽對(duì),可以認(rèn)為共享物品和標(biāo)簽的二元組信息的用戶是更相似的,這??種方法很大程度上去除了大量偶然相關(guān)用戶,為用戶找到興趣更相關(guān)的用戶。這種??情況下路徑得分計(jì)算與基本擴(kuò)展一樣,也是終點(diǎn)物品的評(píng)分。假設(shè)用戶通過(guò)二元??組<?>找到用戶計(jì)算用戶的歷史物品得分為:??S?p(iii,<Vf,rm>,iij,\,n)?=?Pv”。??圖3-3以基本擴(kuò)展模型為例描述了短路徑枚舉方法的計(jì)算示意圖,4代表用戶與??物品標(biāo)簽的鄰接矩陣,對(duì)于用戶與物品或標(biāo)簽有交互的位置設(shè)置為1,沒有交互的設(shè)??置為0,?代表A的轉(zhuǎn)置。P是用戶與物品的交互矩陣,其中的物品得分都是該列物??品的正面率。矩陣相乘之后即為最終的預(yù)測(cè)矩陣見??圖3-3短路徑枚舉算法說(shuō)明圖??時(shí)間復(fù)雜度分析:對(duì)于傳統(tǒng)的基于k近鄰的協(xié)同過(guò)濾算法,在將標(biāo)簽作為第三類??實(shí)體的基礎(chǔ)上,總的時(shí)間復(fù)雜度是〇((rvi+m)??丨似丨2+丨似丨?(丨切??/嘆間+a:??m)),前??半部分是計(jì)算用戶相似度矩陣,后半部分是對(duì)于每個(gè)用戶首先找出k近鄰,然后針對(duì)??每個(gè)候選物品計(jì)算得分。對(duì)于隨機(jī)游走算法,其時(shí)間復(fù)雜度為〇((丨糾+?m?+?m)3.A〇,??其屮W是矩陣迭代的次數(shù)。而本章的短路徑枚平算法的吋間復(fù)雜度是<9((|7|?+丨71)-??丨似丨2?+?rwi2??rvi),就是三個(gè)矩陣相乘的時(shí)間復(fù)雜度,由于現(xiàn)有的技術(shù)可以很方便地對(duì)??矩陣乘法并行計(jì)算,因此實(shí)際操作時(shí)效申.極高。??3.2.4算法總結(jié)??最終算法的偽代碼如算法I所示。第一步,首先根據(jù)物品的內(nèi)容構(gòu)造張量,??Tuc
基于圖嵌入技術(shù)的個(gè)人推荇與群組推薦算法研究?第二章基于自適應(yīng)混合協(xié)同過(guò)濾的咼效物品推薦算法??[XZ:?UserKNN??12'?^?\ZZ2?RW??10-?V?ctd?SP1??y?□?SP2??I:ll?R??i^L??Movielens?Oouban-Book??DataSets??圖3-4協(xié)同過(guò)濾算法的運(yùn)行時(shí)間對(duì)比圖??品的平均記錄數(shù)分別為丨00和20,可以看到當(dāng)〇和/?設(shè)置為丨00和20時(shí),準(zhǔn)確率能達(dá)到??最高。在表3-6中,抽取總數(shù)據(jù)集80%的記錄作為訓(xùn)練集,此時(shí)用戶和物品的平均??記錄數(shù)約為300和60,i」J■以看到當(dāng)a和盡設(shè)置為300和60時(shí),精確度也i」j'以達(dá)到最高。??因此,每一次在混合計(jì)算之前,首先計(jì)算當(dāng)前數(shù)據(jù)集的用戶與物品的平均記錄數(shù),??將a和分別設(shè)置為對(duì)應(yīng)值。對(duì)于Douban-?Book也使用這種方法設(shè)置。??表3-5訓(xùn)練集占比20%時(shí)噦對(duì)準(zhǔn)確度的影響??100?200?400?600??10?0.528?0.5280.527 ̄ ̄0.526?? ̄^0?0.528?0.5240.5220.518??^0?0.4970.465 ̄ ̄0.382 ̄ ̄0.315??60? ̄0.418?0.302?0.190?0.132??表3-6訓(xùn)練集占比80%時(shí)d叫對(duì)準(zhǔn)確度的影響??200?300?400?600??20?0.134?0.134?0.134?0.134??40?0.232?0.231 ̄ ̄0231 ̄ ̄0.231??^600.233 ̄ ̄0.233 ̄ ̄0.232 ̄ ̄0.232??80? ̄0.233?0.233
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶近鄰的N維張量分解推薦算法[J]. 陳健美,孫亞軍. 計(jì)算機(jī)工程. 2017(11)
[2]基于動(dòng)態(tài)k近鄰的SlopeOne協(xié)同過(guò)濾推薦算法[J]. 孫麗梅,李晶皎,孫煥良. 計(jì)算機(jī)科學(xué)與探索. 2011(09)
[3]通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[J]. 羅辛,歐陽(yáng)元新,熊璋,袁滿. 計(jì)算機(jī)學(xué)報(bào). 2010(08)
[4]協(xié)同過(guò)濾在推薦系統(tǒng)中的應(yīng)用研究[J]. 王霞,劉琴. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2005(04)
本文編號(hào):3315015
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3315015.html
最近更新
教材專著