基于深度隱特征分析的推薦算法研究
發(fā)布時間:2021-11-17 08:41
隨著互聯(lián)網(wǎng)行業(yè)的飛速發(fā)展,互聯(lián)網(wǎng)上的信息量呈指數(shù)型增長。在紛繁復(fù)雜的互聯(lián)網(wǎng)信息中,如何篩選出用戶想要的信息成為推薦系統(tǒng)的主要任務(wù)。推薦系統(tǒng)通過有效分析用戶的歷史行為數(shù)據(jù),達(dá)到預(yù)測用戶下一步行為的目的,成為目前解決信息過載的主要手段之一。然而,傳統(tǒng)的基于協(xié)同過濾的推薦算法對用戶-物品評分?jǐn)?shù)據(jù)進(jìn)行建模分析時,一般采用線性模型,導(dǎo)致推薦算法的精度提升有限。深度學(xué)習(xí)技術(shù)憑著強(qiáng)大的表征能力在圖像識別、自然語言處理方面取得了巨大的成功,基于深度學(xué)習(xí)的推薦算法近年被廣泛研究。本文針對傳統(tǒng)協(xié)同過濾算法的數(shù)據(jù)表征能力弱等問題,通過結(jié)合深度學(xué)習(xí)的相關(guān)理論和方法,對基于深度隱特征分析的推薦算法進(jìn)行了研究,從而達(dá)到提升推薦算法精準(zhǔn)率的目的。具體工作如下:(1)對深度學(xué)習(xí)和推薦算法的研究現(xiàn)狀進(jìn)行了廣泛的調(diào)研,發(fā)現(xiàn)基于深度學(xué)習(xí)的推薦算法在處理多源數(shù)據(jù)、數(shù)據(jù)表征方面具有優(yōu)勢。在實際的推薦系統(tǒng)中,用戶和物品的信息數(shù)據(jù)是多種多樣的,例如物品的圖片信息。基于深度學(xué)習(xí)的推薦算法針對這些數(shù)據(jù)可以使用多種網(wǎng)絡(luò)模型進(jìn)行處理,相較于傳統(tǒng)的協(xié)同過濾算法而言,能夠提取出更具代表性的特征。除此之外,基于深度學(xué)習(xí)的推薦算法能夠?qū)τ脩艉臀锲?..
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院重慶綠色智能技術(shù)研究院)重慶市
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1使用矩陣分解進(jìn)行評分預(yù)測??
?基于深度隱特征分析的推薦算法研宄???0?1?0?0?...?0?0?0?1?0?...?0??I?*?*?I??r ̄??,??,??1?,?n??—?i??i?^?i??Predicted??rating??圖2.2?MLP模型??多層感知機(jī)模型擁有眾多衍生模型,目前在圖像處理上最為流行的卷積神??經(jīng)網(wǎng)絡(luò)(Convolutional?Neural?Networks,CNN),在自然語言處理上最為常用的??循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Networks,RNN)等等。??自編碼器被證明能夠在推薦系統(tǒng)中學(xué)習(xí)到有效的特征表示,使得推薦精度??明顯提高[57],是推薦系統(tǒng)中最為常用的網(wǎng)絡(luò)模型之-。自編碼器??(Autoencoders,AE)是深度學(xué)習(xí)中一種對輸入數(shù)據(jù)的大量特征進(jìn)行壓縮的方??法,屬于無監(jiān)督學(xué)習(xí)方法[68]。自編碼器首先也是一種神經(jīng)網(wǎng)絡(luò)模型,有輸入??層、隱含層、輸出層,其中輸入層和輸出層是相同的,中間層作為輸入數(shù)據(jù)的??低維特征表示,如圖2.3所示。將自編碼器作為一種模型應(yīng)用于推薦算法中,??是目前相關(guān)論文中常見的方法。自編碼器的結(jié)構(gòu)可以描述如下:??輸入層^中間隱含層:可視為編碼的過程,通過對輸入數(shù)據(jù)進(jìn)行壓縮,??類似于PCA,提取主要的隱特征,同時需要非線性的激活函數(shù),進(jìn)行特征的非??線性表達(dá);??中間隱含層=>?輸出層,可視為解碼的過程,主要是將隱特征還原為輸入??數(shù)據(jù),也需要非線性激活函數(shù)對數(shù)據(jù)進(jìn)行特征變換,是還原度盡可能高,整個??過程也可稱之為某種意義上的重構(gòu)(reconstruction)。??16??
?第2章相關(guān)理論和技術(shù)???編碼?解碼??_??輸入)2?隱含W?輸出.丨3??圖2.3自編碼器模型??自編碼器擁有多種衍生模型,擁有不同的特點(diǎn),適用于不同的特征提取場??景,主要分別有以下幾類:正則自編碼器(Regularized?Autoencoders)、稀疏自??編碼器(SparsityAutoencoders),去噪閂編碼器(DenoisingAutoencoders,DAE)??(2008),桟式去噪自編碼器(Stacked?DenoisingAutoencoders,SDAE)?(2010)、??收縮自編碼器(Contractive?Autoencoders,CAE?)(?2011?),變分自編碼器??(Variational?Autoencoders,VAE?)?(2013),以及衍生的邊緣去噪自編碼器??(Marginalize?Denoise?Autoencoders)?[44]。其中,用于推薦系統(tǒng)的模型有??SDAE[17,36]、VAE[26]、DAE[31]、CAE[33]和?MDAE[49]。??2.4深度隱特征的優(yōu)化方法??深度隱特征,指的是M過深度神經(jīng)網(wǎng)絡(luò)分別提取出的用戶隱特征和物品隱??特征,用于提升推薦模型的預(yù)測精度。然而,在深層祌經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程??中,存在著“梯度消失'?的問題[66],導(dǎo)致網(wǎng)絡(luò)難以學(xué)習(xí)到數(shù)據(jù)中的隱特征..除此??之外,本就計算復(fù)雜的神經(jīng)網(wǎng)絡(luò),隨著神經(jīng)網(wǎng)絡(luò)的加深,其參數(shù)量陡增,計算??量也變得更大。然而深層祌經(jīng)網(wǎng)絡(luò)被提出的當(dāng)吋,計算機(jī)硬件資源丨斑乏、〖丨?算??成本較高,導(dǎo)致當(dāng)時的深層神經(jīng)網(wǎng)絡(luò)很難被學(xué)術(shù)界和工業(yè)界所接受。??如今,隨著計算機(jī)硬件的
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[2]個性化推薦系統(tǒng)的研究進(jìn)展[J]. 劉建國,周濤,汪秉宏. 自然科學(xué)進(jìn)展. 2009(01)
本文編號:3500555
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院重慶綠色智能技術(shù)研究院)重慶市
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1使用矩陣分解進(jìn)行評分預(yù)測??
?基于深度隱特征分析的推薦算法研宄???0?1?0?0?...?0?0?0?1?0?...?0??I?*?*?I??r ̄??,??,??1?,?n??—?i??i?^?i??Predicted??rating??圖2.2?MLP模型??多層感知機(jī)模型擁有眾多衍生模型,目前在圖像處理上最為流行的卷積神??經(jīng)網(wǎng)絡(luò)(Convolutional?Neural?Networks,CNN),在自然語言處理上最為常用的??循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent?Neural?Networks,RNN)等等。??自編碼器被證明能夠在推薦系統(tǒng)中學(xué)習(xí)到有效的特征表示,使得推薦精度??明顯提高[57],是推薦系統(tǒng)中最為常用的網(wǎng)絡(luò)模型之-。自編碼器??(Autoencoders,AE)是深度學(xué)習(xí)中一種對輸入數(shù)據(jù)的大量特征進(jìn)行壓縮的方??法,屬于無監(jiān)督學(xué)習(xí)方法[68]。自編碼器首先也是一種神經(jīng)網(wǎng)絡(luò)模型,有輸入??層、隱含層、輸出層,其中輸入層和輸出層是相同的,中間層作為輸入數(shù)據(jù)的??低維特征表示,如圖2.3所示。將自編碼器作為一種模型應(yīng)用于推薦算法中,??是目前相關(guān)論文中常見的方法。自編碼器的結(jié)構(gòu)可以描述如下:??輸入層^中間隱含層:可視為編碼的過程,通過對輸入數(shù)據(jù)進(jìn)行壓縮,??類似于PCA,提取主要的隱特征,同時需要非線性的激活函數(shù),進(jìn)行特征的非??線性表達(dá);??中間隱含層=>?輸出層,可視為解碼的過程,主要是將隱特征還原為輸入??數(shù)據(jù),也需要非線性激活函數(shù)對數(shù)據(jù)進(jìn)行特征變換,是還原度盡可能高,整個??過程也可稱之為某種意義上的重構(gòu)(reconstruction)。??16??
?第2章相關(guān)理論和技術(shù)???編碼?解碼??_??輸入)2?隱含W?輸出.丨3??圖2.3自編碼器模型??自編碼器擁有多種衍生模型,擁有不同的特點(diǎn),適用于不同的特征提取場??景,主要分別有以下幾類:正則自編碼器(Regularized?Autoencoders)、稀疏自??編碼器(SparsityAutoencoders),去噪閂編碼器(DenoisingAutoencoders,DAE)??(2008),桟式去噪自編碼器(Stacked?DenoisingAutoencoders,SDAE)?(2010)、??收縮自編碼器(Contractive?Autoencoders,CAE?)(?2011?),變分自編碼器??(Variational?Autoencoders,VAE?)?(2013),以及衍生的邊緣去噪自編碼器??(Marginalize?Denoise?Autoencoders)?[44]。其中,用于推薦系統(tǒng)的模型有??SDAE[17,36]、VAE[26]、DAE[31]、CAE[33]和?MDAE[49]。??2.4深度隱特征的優(yōu)化方法??深度隱特征,指的是M過深度神經(jīng)網(wǎng)絡(luò)分別提取出的用戶隱特征和物品隱??特征,用于提升推薦模型的預(yù)測精度。然而,在深層祌經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過程??中,存在著“梯度消失'?的問題[66],導(dǎo)致網(wǎng)絡(luò)難以學(xué)習(xí)到數(shù)據(jù)中的隱特征..除此??之外,本就計算復(fù)雜的神經(jīng)網(wǎng)絡(luò),隨著神經(jīng)網(wǎng)絡(luò)的加深,其參數(shù)量陡增,計算??量也變得更大。然而深層祌經(jīng)網(wǎng)絡(luò)被提出的當(dāng)吋,計算機(jī)硬件資源丨斑乏、〖丨?算??成本較高,導(dǎo)致當(dāng)時的深層神經(jīng)網(wǎng)絡(luò)很難被學(xué)術(shù)界和工業(yè)界所接受。??如今,隨著計算機(jī)硬件的
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[2]個性化推薦系統(tǒng)的研究進(jìn)展[J]. 劉建國,周濤,汪秉宏. 自然科學(xué)進(jìn)展. 2009(01)
本文編號:3500555
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3500555.html
最近更新
教材專著