推薦系統(tǒng)中基于深度學(xué)習(xí)模型的表示學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-01-22 08:42
伴隨著大數(shù)據(jù)時(shí)代的到來,推薦系統(tǒng)在互聯(lián)網(wǎng)的很多領(lǐng)域都得到了應(yīng)用,并且在逐漸改變著人們的生活。推薦系統(tǒng)本質(zhì)上是通過一定方式將用戶和項(xiàng)目聯(lián)系起來,而這個(gè)方式可以有很多種,不同的方式構(gòu)成了不同的推薦系統(tǒng)。不同平臺(tái)對(duì)用戶行為的影響構(gòu)成的跨平臺(tái)方式可以發(fā)展成為跨域推薦;朋友推薦的方式可以發(fā)展成為社交推薦。深度學(xué)習(xí)的方法常被用來學(xué)習(xí)圖像、文本等有效的低維表示,這種表示可以用來補(bǔ)充或替換傳統(tǒng)的推薦算法,比如協(xié)同過濾。本文以深度學(xué)習(xí)方法為核心,分別就跨域推薦和社交推薦問題提出不同的解決方法。本文主要?jiǎng)?chuàng)新點(diǎn)如下:(1)本文提出了一種跨領(lǐng)域推薦中基于語義特征對(duì)抗學(xué)習(xí)的表示學(xué)習(xí)算法,該算法結(jié)合了基于內(nèi)容和基于遷移學(xué)習(xí)的方法,并且無需輔助域和目標(biāo)域之間的用戶重疊或者項(xiàng)目重疊。本文提出的算法解決了當(dāng)前跨域推薦面臨的三種挑戰(zhàn):通常的跨域推薦系統(tǒng)(CDRSs)很難找到異構(gòu)信息域之間的連接關(guān)系,所以大多數(shù)關(guān)注的是同質(zhì)信息域,或者假定用戶是重疊的;通常的CDRSs是基于歷史反饋來開發(fā)或基于在目標(biāo)域中推薦不同項(xiàng)目來探索不確定的用戶興趣,但是他們很難在這兩者之間取得平衡;通常的CDRSs因?yàn)闆]有針對(duì)用戶或項(xiàng)目的歷史反饋或者...
【文章來源】:湘潭大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)的常見應(yīng)用場景
2這個(gè)方式可以有很多種,比如通過朋友推薦(社交網(wǎng)絡(luò)),或者user的點(diǎn)擊購買行為等,構(gòu)成了各種方式的推薦系統(tǒng)。推薦系統(tǒng)的目標(biāo)可分為兩大類,一類是評(píng)分預(yù)測(cè),另一類是Top-N推薦。(1)評(píng)分預(yù)測(cè)目標(biāo):推薦系統(tǒng)可以看作是用戶對(duì)物品的打分預(yù)測(cè)問題,比如用戶給自己購買過的物品打多少分,是用戶對(duì)該項(xiàng)目偏愛的程度,如圖1.2所示。評(píng)分預(yù)測(cè)應(yīng)用最廣泛的方法是矩陣分解,其直接或者間接的利用user-item之間的顯性信息,如用戶評(píng)分矩陣,矩陣中第行列的元素!"為用戶對(duì)物品的喜愛程度,通常元素的取值范圍為1-5分(打5分表示最喜歡,打1分表示非常不喜歡)。由于矩陣分解采用的是最小化平方損失,根據(jù)損失函數(shù)與評(píng)價(jià)指標(biāo)一致原則,評(píng)分預(yù)測(cè)的指標(biāo)一般采用以下兩種:一種是均方根誤差(RMSE),另一種是平方絕對(duì)誤差(MAE)。(2)(2)Top-N推薦目標(biāo):推薦系統(tǒng)可以看作是給用戶推薦top-N個(gè)可能最感興趣的項(xiàng)目,即通過用戶的隱式反饋信息來獲取用戶喜好,如圖1.2(b)所示。在該目標(biāo)下的推薦,其實(shí)也可以通過預(yù)測(cè)評(píng)分得到top-N個(gè)項(xiàng)目。比如通過評(píng)分預(yù)測(cè)模型得到所有項(xiàng)目的評(píng)分,然后根據(jù)評(píng)分的排序?qū)op-N個(gè)高分項(xiàng)目推薦給用戶。但top-N目標(biāo)下的推薦,更應(yīng)該關(guān)注的是排序方法的構(gòu)建,其預(yù)測(cè)值是一個(gè)概率值,故評(píng)價(jià)指標(biāo)只能是MAP和NDCG等。圖1.2推薦系統(tǒng)的兩種目標(biāo),評(píng)分預(yù)測(cè)(a)和Top-N推薦(b)針對(duì)推薦系統(tǒng)種類的不同,可將其分為單領(lǐng)域推薦和跨領(lǐng)域推薦兩大類。(1)單領(lǐng)域推薦:在單一領(lǐng)域內(nèi)為用戶提供該領(lǐng)域內(nèi)的推薦,比如用戶在某電商平臺(tái)上點(diǎn)擊或購買一些物品,根據(jù)用戶的歷史購買記錄給用戶推薦感興趣的物品。(2)跨領(lǐng)域推薦:從輔助領(lǐng)域中提取出豐富的用戶畫像特征或項(xiàng)目特征,然后遷移到目標(biāo)域中,為目標(biāo)域用戶提供更加個(gè)性化的推薦,比如?
4此基礎(chǔ)上,基于內(nèi)容的方法被提出,該方法可以很好的緩解上述問題。基于內(nèi)容的角度。如圖1.3(a)所示,其原理是用戶偏愛與本身歷史行為項(xiàng)目內(nèi)容一致的項(xiàng)目,假設(shè)你喜歡電影速度與激情I,而速度與激情II-VIII和你的行為歷史電影在內(nèi)容上保持一致,比如同樣的導(dǎo)演或主演,同樣的主題等等。根據(jù)這些內(nèi)容的相似性,給用戶推薦電影,這也有效的緩解了冷啟動(dòng)。但基于內(nèi)容的模型很依賴有效的特征提取,所以許多基于內(nèi)容的方法都致力于設(shè)計(jì)有效的特征嵌入向量[4][5][6]。然而淺層模型主要利用手工特征,其無法學(xué)習(xí)用戶和項(xiàng)目的深層結(jié)構(gòu),所以淺層模型越來越不適用如今更豐富的數(shù)據(jù)。最近,先進(jìn)的深度學(xué)習(xí)技術(shù)推動(dòng)了對(duì)文本的機(jī)器理解[7]。深度學(xué)習(xí)自動(dòng)利用低階特征的交叉去挖掘更高階的特征表示,其好處在于省去了很多的勞動(dòng)力去進(jìn)行手工特征的處理。例如,一個(gè)基于評(píng)論的深度模型[8]由兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型組成,他們通過一個(gè)共享的公共層耦合在一起,通過基于評(píng)論的深度模型對(duì)用戶和項(xiàng)目進(jìn)行建模。自然語言處理(NLP)近年來取得了突破性的進(jìn)展,尤其大火的attention注意力機(jī)制更是提高了基于內(nèi)容的推薦方法的效果。Seo等人[9]提出了具有注意力機(jī)制的增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)。此外,Chen等人[10]提出了一種具有評(píng)論級(jí)別解釋性的神經(jīng)注意力回歸模型,以幫助用戶做出更好、更快的決策。(a)基于內(nèi)容的推薦(b)基于社交網(wǎng)絡(luò)的推薦圖1.3推薦系統(tǒng)類型這些方法的一個(gè)主要弊端在于,其僅分析評(píng)論文本中的語義特征,而忽略了用戶之間或者項(xiàng)目之間的影響。基于此,基于圖角度的推薦系統(tǒng)被提出。基于圖的角度。如圖1.3(b)所示,把用戶作為頂點(diǎn),兩個(gè)頂點(diǎn)之間的邊代表兩個(gè)用戶之間為朋友關(guān)系或類似的偏好關(guān)系。因此偏好信息可以在這張圖上進(jìn)行傳播,即每個(gè)用戶的潛?
【參考文獻(xiàn)】:
期刊論文
[1]基于標(biāo)簽卷積神經(jīng)網(wǎng)絡(luò)的文本推薦算法[J]. 馬驍烊,張謐. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(08)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[3]基于社交圈的在線社交網(wǎng)絡(luò)朋友推薦算法[J]. 王玙,高琳. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[4]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進(jìn)俠. 通信學(xué)報(bào). 2014(02)
[5]基于鄰域模型的K-means初始聚類中心選擇算法[J]. 曹付元,梁吉業(yè),姜廣. 計(jì)算機(jī)科學(xué). 2008(11)
本文編號(hào):2992924
【文章來源】:湘潭大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)的常見應(yīng)用場景
2這個(gè)方式可以有很多種,比如通過朋友推薦(社交網(wǎng)絡(luò)),或者user的點(diǎn)擊購買行為等,構(gòu)成了各種方式的推薦系統(tǒng)。推薦系統(tǒng)的目標(biāo)可分為兩大類,一類是評(píng)分預(yù)測(cè),另一類是Top-N推薦。(1)評(píng)分預(yù)測(cè)目標(biāo):推薦系統(tǒng)可以看作是用戶對(duì)物品的打分預(yù)測(cè)問題,比如用戶給自己購買過的物品打多少分,是用戶對(duì)該項(xiàng)目偏愛的程度,如圖1.2所示。評(píng)分預(yù)測(cè)應(yīng)用最廣泛的方法是矩陣分解,其直接或者間接的利用user-item之間的顯性信息,如用戶評(píng)分矩陣,矩陣中第行列的元素!"為用戶對(duì)物品的喜愛程度,通常元素的取值范圍為1-5分(打5分表示最喜歡,打1分表示非常不喜歡)。由于矩陣分解采用的是最小化平方損失,根據(jù)損失函數(shù)與評(píng)價(jià)指標(biāo)一致原則,評(píng)分預(yù)測(cè)的指標(biāo)一般采用以下兩種:一種是均方根誤差(RMSE),另一種是平方絕對(duì)誤差(MAE)。(2)(2)Top-N推薦目標(biāo):推薦系統(tǒng)可以看作是給用戶推薦top-N個(gè)可能最感興趣的項(xiàng)目,即通過用戶的隱式反饋信息來獲取用戶喜好,如圖1.2(b)所示。在該目標(biāo)下的推薦,其實(shí)也可以通過預(yù)測(cè)評(píng)分得到top-N個(gè)項(xiàng)目。比如通過評(píng)分預(yù)測(cè)模型得到所有項(xiàng)目的評(píng)分,然后根據(jù)評(píng)分的排序?qū)op-N個(gè)高分項(xiàng)目推薦給用戶。但top-N目標(biāo)下的推薦,更應(yīng)該關(guān)注的是排序方法的構(gòu)建,其預(yù)測(cè)值是一個(gè)概率值,故評(píng)價(jià)指標(biāo)只能是MAP和NDCG等。圖1.2推薦系統(tǒng)的兩種目標(biāo),評(píng)分預(yù)測(cè)(a)和Top-N推薦(b)針對(duì)推薦系統(tǒng)種類的不同,可將其分為單領(lǐng)域推薦和跨領(lǐng)域推薦兩大類。(1)單領(lǐng)域推薦:在單一領(lǐng)域內(nèi)為用戶提供該領(lǐng)域內(nèi)的推薦,比如用戶在某電商平臺(tái)上點(diǎn)擊或購買一些物品,根據(jù)用戶的歷史購買記錄給用戶推薦感興趣的物品。(2)跨領(lǐng)域推薦:從輔助領(lǐng)域中提取出豐富的用戶畫像特征或項(xiàng)目特征,然后遷移到目標(biāo)域中,為目標(biāo)域用戶提供更加個(gè)性化的推薦,比如?
4此基礎(chǔ)上,基于內(nèi)容的方法被提出,該方法可以很好的緩解上述問題。基于內(nèi)容的角度。如圖1.3(a)所示,其原理是用戶偏愛與本身歷史行為項(xiàng)目內(nèi)容一致的項(xiàng)目,假設(shè)你喜歡電影速度與激情I,而速度與激情II-VIII和你的行為歷史電影在內(nèi)容上保持一致,比如同樣的導(dǎo)演或主演,同樣的主題等等。根據(jù)這些內(nèi)容的相似性,給用戶推薦電影,這也有效的緩解了冷啟動(dòng)。但基于內(nèi)容的模型很依賴有效的特征提取,所以許多基于內(nèi)容的方法都致力于設(shè)計(jì)有效的特征嵌入向量[4][5][6]。然而淺層模型主要利用手工特征,其無法學(xué)習(xí)用戶和項(xiàng)目的深層結(jié)構(gòu),所以淺層模型越來越不適用如今更豐富的數(shù)據(jù)。最近,先進(jìn)的深度學(xué)習(xí)技術(shù)推動(dòng)了對(duì)文本的機(jī)器理解[7]。深度學(xué)習(xí)自動(dòng)利用低階特征的交叉去挖掘更高階的特征表示,其好處在于省去了很多的勞動(dòng)力去進(jìn)行手工特征的處理。例如,一個(gè)基于評(píng)論的深度模型[8]由兩個(gè)深度神經(jīng)網(wǎng)絡(luò)模型組成,他們通過一個(gè)共享的公共層耦合在一起,通過基于評(píng)論的深度模型對(duì)用戶和項(xiàng)目進(jìn)行建模。自然語言處理(NLP)近年來取得了突破性的進(jìn)展,尤其大火的attention注意力機(jī)制更是提高了基于內(nèi)容的推薦方法的效果。Seo等人[9]提出了具有注意力機(jī)制的增強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)。此外,Chen等人[10]提出了一種具有評(píng)論級(jí)別解釋性的神經(jīng)注意力回歸模型,以幫助用戶做出更好、更快的決策。(a)基于內(nèi)容的推薦(b)基于社交網(wǎng)絡(luò)的推薦圖1.3推薦系統(tǒng)類型這些方法的一個(gè)主要弊端在于,其僅分析評(píng)論文本中的語義特征,而忽略了用戶之間或者項(xiàng)目之間的影響。基于此,基于圖角度的推薦系統(tǒng)被提出。基于圖的角度。如圖1.3(b)所示,把用戶作為頂點(diǎn),兩個(gè)頂點(diǎn)之間的邊代表兩個(gè)用戶之間為朋友關(guān)系或類似的偏好關(guān)系。因此偏好信息可以在這張圖上進(jìn)行傳播,即每個(gè)用戶的潛?
【參考文獻(xiàn)】:
期刊論文
[1]基于標(biāo)簽卷積神經(jīng)網(wǎng)絡(luò)的文本推薦算法[J]. 馬驍烊,張謐. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(08)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計(jì)算機(jī)學(xué)報(bào). 2018(07)
[3]基于社交圈的在線社交網(wǎng)絡(luò)朋友推薦算法[J]. 王玙,高琳. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[4]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進(jìn)俠. 通信學(xué)報(bào). 2014(02)
[5]基于鄰域模型的K-means初始聚類中心選擇算法[J]. 曹付元,梁吉業(yè),姜廣. 計(jì)算機(jī)科學(xué). 2008(11)
本文編號(hào):2992924
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2992924.html
最近更新
教材專著