基于深度學(xué)習(xí)和矩陣分解的個(gè)性化推薦算法研究
發(fā)布時(shí)間:2021-06-13 03:08
個(gè)性化推薦作為一種有效的信息過(guò)濾技術(shù),能夠有效緩解信息過(guò)載問(wèn)題,有著極強(qiáng)的實(shí)用價(jià)值和商業(yè)價(jià)值。由于所面對(duì)業(yè)務(wù)環(huán)境的復(fù)雜性,個(gè)性化推薦一直存在著數(shù)據(jù)稀疏、冷啟動(dòng)以及用戶興趣遷移等問(wèn)題需要解決和優(yōu)化。本文針對(duì)推薦中存在的數(shù)據(jù)稀疏及用戶興趣遷移問(wèn)題,對(duì)現(xiàn)有的矩陣分解推薦算法進(jìn)行了改進(jìn),并在其基礎(chǔ)上結(jié)合了深度學(xué)習(xí)相關(guān)模型,提出一種基于深度學(xué)習(xí)和矩陣分解的推薦算法,主要做了如下工作:首先,根據(jù)不同用戶和不同項(xiàng)目之間的不對(duì)稱關(guān)系,提出改進(jìn)相關(guān)度計(jì)算式,用于預(yù)測(cè)評(píng)分,提出一種基于非對(duì)稱相似度的矩陣分解推薦算法,緩解用戶信息不對(duì)稱造成的數(shù)據(jù)稀疏問(wèn)題。并在MovieLens、Amazon和Ciao數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)設(shè)計(jì),實(shí)驗(yàn)結(jié)果顯示和同類型推薦算法相比改進(jìn)算法能夠明顯提高推薦精度。其次,考慮到神經(jīng)網(wǎng)絡(luò)能夠從數(shù)據(jù)中學(xué)習(xí)更為靈活的映射關(guān)系,在改進(jìn)矩陣分解推薦算法的基礎(chǔ)上增加了多層感知器來(lái)獲取用戶-數(shù)據(jù)交互信息的非線性部分,提出一種加權(quán)神經(jīng)網(wǎng)絡(luò)矩陣分解推薦算法,并在MovieLens和Pinterest兩數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)設(shè)計(jì),實(shí)驗(yàn)結(jié)果顯示和其他主流推薦算法模型相比,推薦精度也有一定程度的提升。此外,針對(duì)用戶...
【文章來(lái)源】:武漢紡織大學(xué)湖北省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文的研究路線
武漢紡織大學(xué)碩士學(xué)位論文12信任度,后者指的是用戶信任用戶集合中的不同用戶產(chǎn)生的不同信任度。社會(huì)化推薦系統(tǒng)的結(jié)構(gòu)如圖2.1所示。圖2.1社會(huì)化推薦模型結(jié)構(gòu)Fig.2.1Structureofsocialrecommendationmodel在采集數(shù)據(jù)的時(shí)候一般包括:用戶和項(xiàng)目的屬性信息,例如用戶的年齡、地理位置以及項(xiàng)目的類型等;用戶對(duì)項(xiàng)目的交互信息,例如用戶對(duì)項(xiàng)目的評(píng)價(jià)、點(diǎn)擊以及收藏等;和用戶社會(huì)關(guān)系屬性信息,例如用戶的好友、關(guān)注等。采集到數(shù)據(jù)還需要進(jìn)行處理,主要操作有:建立用戶-項(xiàng)目的交互矩陣,對(duì)用戶數(shù)據(jù)和項(xiàng)目數(shù)據(jù)的篩選,以及計(jì)算不同用戶之間的信任關(guān)系等。社會(huì)化推薦模型主要是將社會(huì)化信息融合到推薦模型中,常用的社會(huì)化推薦算法有社會(huì)化矩陣分解推薦算法[33]、概率矩陣分解算法(PMF)[34]、基于信任加權(quán)的推薦算法(TrustSVD)錯(cuò)誤!未找到引用源。等。社會(huì)化矩陣分解推薦模型是在矩陣分解的基礎(chǔ)上考慮了社會(huì)信息,用社會(huì)正則化來(lái)約束矩陣分解的損失函數(shù),其損失函數(shù)可以定義為公式(2.12)。222,,12,111min[()]2mnTijijijFFUVijGIRUVSUV(2.12)其中,221F2FUV表示用戶特征和項(xiàng)目特征的正則項(xiàng),1和2分別是正則項(xiàng)參數(shù),2()1|()|mffFiiiFUSUFi表示社會(huì)正則項(xiàng)用戶保存用戶與其信任用戶之間的興趣差異,是社會(huì)正則項(xiàng)參數(shù)。由公式(2.12)可以看出,在社會(huì)化矩陣分解推薦模型中,需要定義用戶相似度。用戶相似度用來(lái)描述用戶關(guān)聯(lián)程度,常見(jiàn)的相似度度量方法有余弦相似度和皮爾遜相似度。余弦相似度描述的是向量之間的距離,直接計(jì)算了不同用戶的交互向量之間的距離值,其計(jì)算公式如公式(2.13)所示:
武漢紡織大學(xué)碩士學(xué)位論文14圖2.2NCF框架Fig.2.2NCFframeworkNCF框架采用了一種多層感知器來(lái)建立用戶-項(xiàng)目的交互,底層輸入層由用戶u的特征向量和項(xiàng)目i的特征向量組成。在描述用戶和項(xiàng)目之間的交互關(guān)系的過(guò)程中,可以采用多種方式來(lái)對(duì)用戶和項(xiàng)目交互建模,常見(jiàn)的有:基于鄰居的模型,基于項(xiàng)目?jī)?nèi)容的主題模型,因子分解機(jī)FM等。在處理輸入的時(shí)候可以將用戶和項(xiàng)目的標(biāo)識(shí)作為輸入,對(duì)其進(jìn)行one-hot編碼,將標(biāo)志轉(zhuǎn)化為二進(jìn)制向量,除標(biāo)志位為1以外,其他位都為0,這種做法可以較好的修正冷啟動(dòng)帶來(lái)的問(wèn)題。在輸入層之后是嵌入層,這部分網(wǎng)絡(luò)將one-hot編碼映射到稠密向量上,從而得到的用戶嵌入的潛在向量空間和項(xiàng)目嵌入的潛在向量空間。在將其輸入至神經(jīng)網(wǎng)絡(luò)層之前,需要先將用戶潛在向量和用戶潛在向量連接起來(lái),將拼接后的結(jié)果作為神經(jīng)網(wǎng)絡(luò)層的輸入,然后通過(guò)多層神經(jīng)網(wǎng)絡(luò)模型來(lái)訓(xùn)練數(shù)據(jù)并得到最終的預(yù)測(cè)評(píng)分。在神經(jīng)網(wǎng)絡(luò)層中,每一層都可以被重新定義來(lái)發(fā)現(xiàn)用戶-項(xiàng)目交互的某些潛在結(jié)構(gòu),一般來(lái)說(shuō),網(wǎng)絡(luò)層數(shù)越多,模型的預(yù)測(cè)效果也會(huì)越好。最終的輸出層是預(yù)測(cè)評(píng)分,然后通過(guò)損失函數(shù)來(lái)最小化和之間差值來(lái)訓(xùn)練模型。根據(jù)NCF的框架圖,可以用公式(2.15)來(lái)表示NCF框架的預(yù)測(cè)模型:(Pv,Qv|P,Q,)TUTIuiuifyf(2.15)其中,P和Q分別表示用戶和項(xiàng)目的潛在因子矩陣,Θf表示交互函數(shù)f的模型參數(shù)。交互模型f指的是NCF模型中的神經(jīng)網(wǎng)絡(luò)部分,對(duì)于一個(gè)X層的多層感知器網(wǎng)絡(luò),可以用公式(2.16)表示:21(Pv,Qv)((((Pv,Qv))))TUTITUTIuioutXuif(2.16)
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)非對(duì)稱相似度和關(guān)聯(lián)正則化的推薦算法[J]. 劉春玲,張黎. 計(jì)算機(jī)工程與應(yīng)用. 2020(16)
[2]社會(huì)化推薦研究綜述[J]. 王剛,蔣軍,王含茹. 計(jì)算機(jī)科學(xué). 2018(S2)
[3]基于用戶非對(duì)稱相似性的協(xié)同過(guò)濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[4]支持推薦非空率的關(guān)聯(lián)規(guī)則推薦算法[J]. 何明,劉偉世,張江. 通信學(xué)報(bào). 2017(10)
[5]聯(lián)合正則化的矩陣分解推薦算法[J]. 吳賓,婁錚錚,葉陽(yáng)東. 軟件學(xué)報(bào). 2018(09)
[6]針對(duì)時(shí)間序列多步預(yù)測(cè)的聚類隱馬爾科夫模型[J]. 章登義,歐陽(yáng)黜霏,吳文李. 電子學(xué)報(bào). 2014(12)
[7]協(xié)同過(guò)濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識(shí)別與人工智能. 2014(08)
[8]一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J]. 郭磊,馬軍,陳竹敏,姜浩然. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[9]移動(dòng)通信網(wǎng)中基于用戶社會(huì)化關(guān)系挖掘的協(xié)同過(guò)濾算法[J]. 黃武漢,孟祥武,王立才. 電子與信息學(xué)報(bào). 2011(12)
[10]面向個(gè)性化推薦的強(qiáng)關(guān)聯(lián)規(guī)則挖掘[J]. 李杰,徐勇,王云峰,朱昭賢. 系統(tǒng)工程理論與實(shí)踐. 2009(08)
碩士論文
[1]基于用戶偏好多樣性的推薦算法研究及應(yīng)用[D]. 陳云峰.中國(guó)科學(xué)技術(shù)大學(xué) 2018
[2]基于時(shí)序模型的社會(huì)化推薦算法研究[D]. 牛冰慧.重慶大學(xué) 2017
本文編號(hào):3226866
【文章來(lái)源】:武漢紡織大學(xué)湖北省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文的研究路線
武漢紡織大學(xué)碩士學(xué)位論文12信任度,后者指的是用戶信任用戶集合中的不同用戶產(chǎn)生的不同信任度。社會(huì)化推薦系統(tǒng)的結(jié)構(gòu)如圖2.1所示。圖2.1社會(huì)化推薦模型結(jié)構(gòu)Fig.2.1Structureofsocialrecommendationmodel在采集數(shù)據(jù)的時(shí)候一般包括:用戶和項(xiàng)目的屬性信息,例如用戶的年齡、地理位置以及項(xiàng)目的類型等;用戶對(duì)項(xiàng)目的交互信息,例如用戶對(duì)項(xiàng)目的評(píng)價(jià)、點(diǎn)擊以及收藏等;和用戶社會(huì)關(guān)系屬性信息,例如用戶的好友、關(guān)注等。采集到數(shù)據(jù)還需要進(jìn)行處理,主要操作有:建立用戶-項(xiàng)目的交互矩陣,對(duì)用戶數(shù)據(jù)和項(xiàng)目數(shù)據(jù)的篩選,以及計(jì)算不同用戶之間的信任關(guān)系等。社會(huì)化推薦模型主要是將社會(huì)化信息融合到推薦模型中,常用的社會(huì)化推薦算法有社會(huì)化矩陣分解推薦算法[33]、概率矩陣分解算法(PMF)[34]、基于信任加權(quán)的推薦算法(TrustSVD)錯(cuò)誤!未找到引用源。等。社會(huì)化矩陣分解推薦模型是在矩陣分解的基礎(chǔ)上考慮了社會(huì)信息,用社會(huì)正則化來(lái)約束矩陣分解的損失函數(shù),其損失函數(shù)可以定義為公式(2.12)。222,,12,111min[()]2mnTijijijFFUVijGIRUVSUV(2.12)其中,221F2FUV表示用戶特征和項(xiàng)目特征的正則項(xiàng),1和2分別是正則項(xiàng)參數(shù),2()1|()|mffFiiiFUSUFi表示社會(huì)正則項(xiàng)用戶保存用戶與其信任用戶之間的興趣差異,是社會(huì)正則項(xiàng)參數(shù)。由公式(2.12)可以看出,在社會(huì)化矩陣分解推薦模型中,需要定義用戶相似度。用戶相似度用來(lái)描述用戶關(guān)聯(lián)程度,常見(jiàn)的相似度度量方法有余弦相似度和皮爾遜相似度。余弦相似度描述的是向量之間的距離,直接計(jì)算了不同用戶的交互向量之間的距離值,其計(jì)算公式如公式(2.13)所示:
武漢紡織大學(xué)碩士學(xué)位論文14圖2.2NCF框架Fig.2.2NCFframeworkNCF框架采用了一種多層感知器來(lái)建立用戶-項(xiàng)目的交互,底層輸入層由用戶u的特征向量和項(xiàng)目i的特征向量組成。在描述用戶和項(xiàng)目之間的交互關(guān)系的過(guò)程中,可以采用多種方式來(lái)對(duì)用戶和項(xiàng)目交互建模,常見(jiàn)的有:基于鄰居的模型,基于項(xiàng)目?jī)?nèi)容的主題模型,因子分解機(jī)FM等。在處理輸入的時(shí)候可以將用戶和項(xiàng)目的標(biāo)識(shí)作為輸入,對(duì)其進(jìn)行one-hot編碼,將標(biāo)志轉(zhuǎn)化為二進(jìn)制向量,除標(biāo)志位為1以外,其他位都為0,這種做法可以較好的修正冷啟動(dòng)帶來(lái)的問(wèn)題。在輸入層之后是嵌入層,這部分網(wǎng)絡(luò)將one-hot編碼映射到稠密向量上,從而得到的用戶嵌入的潛在向量空間和項(xiàng)目嵌入的潛在向量空間。在將其輸入至神經(jīng)網(wǎng)絡(luò)層之前,需要先將用戶潛在向量和用戶潛在向量連接起來(lái),將拼接后的結(jié)果作為神經(jīng)網(wǎng)絡(luò)層的輸入,然后通過(guò)多層神經(jīng)網(wǎng)絡(luò)模型來(lái)訓(xùn)練數(shù)據(jù)并得到最終的預(yù)測(cè)評(píng)分。在神經(jīng)網(wǎng)絡(luò)層中,每一層都可以被重新定義來(lái)發(fā)現(xiàn)用戶-項(xiàng)目交互的某些潛在結(jié)構(gòu),一般來(lái)說(shuō),網(wǎng)絡(luò)層數(shù)越多,模型的預(yù)測(cè)效果也會(huì)越好。最終的輸出層是預(yù)測(cè)評(píng)分,然后通過(guò)損失函數(shù)來(lái)最小化和之間差值來(lái)訓(xùn)練模型。根據(jù)NCF的框架圖,可以用公式(2.15)來(lái)表示NCF框架的預(yù)測(cè)模型:(Pv,Qv|P,Q,)TUTIuiuifyf(2.15)其中,P和Q分別表示用戶和項(xiàng)目的潛在因子矩陣,Θf表示交互函數(shù)f的模型參數(shù)。交互模型f指的是NCF模型中的神經(jīng)網(wǎng)絡(luò)部分,對(duì)于一個(gè)X層的多層感知器網(wǎng)絡(luò),可以用公式(2.16)表示:21(Pv,Qv)((((Pv,Qv))))TUTITUTIuioutXuif(2.16)
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)非對(duì)稱相似度和關(guān)聯(lián)正則化的推薦算法[J]. 劉春玲,張黎. 計(jì)算機(jī)工程與應(yīng)用. 2020(16)
[2]社會(huì)化推薦研究綜述[J]. 王剛,蔣軍,王含茹. 計(jì)算機(jī)科學(xué). 2018(S2)
[3]基于用戶非對(duì)稱相似性的協(xié)同過(guò)濾推薦算法[J]. 黃賢英,龍姝言,謝晉. 四川大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[4]支持推薦非空率的關(guān)聯(lián)規(guī)則推薦算法[J]. 何明,劉偉世,張江. 通信學(xué)報(bào). 2017(10)
[5]聯(lián)合正則化的矩陣分解推薦算法[J]. 吳賓,婁錚錚,葉陽(yáng)東. 軟件學(xué)報(bào). 2018(09)
[6]針對(duì)時(shí)間序列多步預(yù)測(cè)的聚類隱馬爾科夫模型[J]. 章登義,歐陽(yáng)黜霏,吳文李. 電子學(xué)報(bào). 2014(12)
[7]協(xié)同過(guò)濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識(shí)別與人工智能. 2014(08)
[8]一種結(jié)合推薦對(duì)象間關(guān)聯(lián)關(guān)系的社會(huì)化推薦算法[J]. 郭磊,馬軍,陳竹敏,姜浩然. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[9]移動(dòng)通信網(wǎng)中基于用戶社會(huì)化關(guān)系挖掘的協(xié)同過(guò)濾算法[J]. 黃武漢,孟祥武,王立才. 電子與信息學(xué)報(bào). 2011(12)
[10]面向個(gè)性化推薦的強(qiáng)關(guān)聯(lián)規(guī)則挖掘[J]. 李杰,徐勇,王云峰,朱昭賢. 系統(tǒng)工程理論與實(shí)踐. 2009(08)
碩士論文
[1]基于用戶偏好多樣性的推薦算法研究及應(yīng)用[D]. 陳云峰.中國(guó)科學(xué)技術(shù)大學(xué) 2018
[2]基于時(shí)序模型的社會(huì)化推薦算法研究[D]. 牛冰慧.重慶大學(xué) 2017
本文編號(hào):3226866
本文鏈接:http://sikaile.net/guanlilunwen/xiangmuguanli/3226866.html
最近更新
教材專著