基于梯度提升決策樹(shù)與深度信念網(wǎng)絡(luò)融合的推薦算法研究
本文選題:推薦算法 切入點(diǎn):深度信念網(wǎng)絡(luò) 出處:《廣西師范大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著科學(xué)技術(shù)以及互聯(lián)網(wǎng)的不斷發(fā)展,全球信息總量爆發(fā)性增長(zhǎng),人們進(jìn)入信息時(shí)代,海量的數(shù)據(jù)不斷產(chǎn)生,信息超載問(wèn)題越來(lái)越嚴(yán)重。這些數(shù)據(jù)信息數(shù)量龐大,增加了人們獲取所需信息的困難程度,如何充分利用這些海量的數(shù)據(jù)信息,篩選出其中的“垃圾”信息,分析和挖掘出人們需要的信息成為人們關(guān)注的熱點(diǎn),推薦算法的出現(xiàn)有效地解決了這種情況。推薦算法通過(guò)分析處理海量稀疏的數(shù)據(jù)信息,學(xué)習(xí)到用戶的興趣愛(ài)好和行為習(xí)慣,挖掘出用戶可能的信息需求,將生成的預(yù)測(cè)結(jié)果推薦給用戶。對(duì)推薦算法來(lái)說(shuō),其處理的數(shù)據(jù)量越大,就越能夠充分地學(xué)習(xí)到數(shù)據(jù)中的潛在聯(lián)系,收集到用戶感興趣的信息,從而更準(zhǔn)確的推薦用戶需求的信息,所以推薦算法的研究適用于數(shù)據(jù)快速增長(zhǎng)的信息時(shí)代,成為人們研究的熱點(diǎn)。推薦算法的研究,將海量信息中挖掘出的有效信息推薦給需求這類信息的用戶,來(lái)滿足不同用戶的信息需求,節(jié)約用戶搜尋信息所需的時(shí)間,提高信息的利用率。推薦算法應(yīng)用廣泛,其中最有經(jīng)濟(jì)價(jià)值的應(yīng)用領(lǐng)域是電子商務(wù)領(lǐng)域,本課題研究的是在電子商務(wù)場(chǎng)景下的推薦算法。在大數(shù)據(jù)時(shí)代,電子商務(wù)場(chǎng)景下的數(shù)據(jù)量巨大,數(shù)據(jù)屬性維度高,傳統(tǒng)的推薦算法不能有效的處理這類數(shù)據(jù),推薦效果受到限制。梯度提升決策樹(shù)算法能夠有效的處理大量的,高屬性維度的特征數(shù)據(jù),在搜索排序、廣告點(diǎn)擊率等方面有較好的應(yīng)用,本文研究的電子商務(wù)場(chǎng)景下的數(shù)據(jù)同樣適用于梯度提升決策樹(shù)算法。梯度提升決策樹(shù)算法是一種流行的機(jī)器學(xué)習(xí)算法,與傳統(tǒng)的推薦算法相比,它能夠處理大量的稀疏的數(shù)據(jù),學(xué)習(xí)到數(shù)據(jù)中存在的潛在聯(lián)系,生成更高準(zhǔn)確率的推薦結(jié)果。但是實(shí)際應(yīng)用中,數(shù)據(jù)特征過(guò)大時(shí)梯度提升決策樹(shù)的學(xué)習(xí)效果就受到限制,我們引入深度信念網(wǎng)絡(luò)來(lái)解決數(shù)據(jù)特征過(guò)大的問(wèn)題。深度信念網(wǎng)絡(luò)是深度學(xué)習(xí)領(lǐng)域的主流算法,可以用它來(lái)識(shí)別特征、生成特征數(shù)據(jù),通過(guò)利用其處理數(shù)據(jù)特征的優(yōu)勢(shì)在特征選擇工作中篩選掉對(duì)推薦結(jié)果無(wú)用的特征數(shù)據(jù),將精簡(jiǎn)的特征數(shù)據(jù)引入梯度提升決策樹(shù)模型學(xué)習(xí),可以有效的提高推薦準(zhǔn)確率。采用融合不同的算法模型,充分利用單一算法處理不同問(wèn)題不同數(shù)據(jù)的互補(bǔ)優(yōu)勢(shì),解決大規(guī)模數(shù)據(jù)量和高維度特征選擇過(guò)程中的繁雜問(wèn)題。本文開(kāi)展了基于梯度提升決策樹(shù)與深度信念網(wǎng)絡(luò)融合的推薦算法研究,主要工作如下:1、提出了基于深度信念網(wǎng)絡(luò)的特征集合構(gòu)建算法。首先為了防止原始數(shù)據(jù)在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合或者欠擬合做了數(shù)據(jù)準(zhǔn)備,包括數(shù)據(jù)說(shuō)明、數(shù)據(jù)分析和數(shù)據(jù)預(yù)處理。其次依據(jù)數(shù)據(jù)預(yù)處理與統(tǒng)計(jì)分析的結(jié)果,結(jié)合實(shí)際生活中影響推薦結(jié)果的多種因素,從十二大角度生成了基礎(chǔ)類別和交叉組合類別的特征集合。然后在處理高維數(shù)據(jù)集合特征選取過(guò)程中,引入深度學(xué)習(xí)領(lǐng)域的深度信念網(wǎng)絡(luò)模型,以解決特征集合的特征選擇和高屬性維度問(wèn)題。通過(guò)在模型中訓(xùn)練其神經(jīng)元間的權(quán)重,讓整個(gè)模型網(wǎng)絡(luò)依據(jù)最大概率生成訓(xùn)練特征數(shù)據(jù),從而減少后續(xù)推薦算法訓(xùn)練特征的計(jì)算量。這種在特征模型的構(gòu)建階段引入了深度信念網(wǎng)絡(luò)方法,對(duì)于提高推薦系統(tǒng)的推薦準(zhǔn)確度和推薦效果起到了極其重要的作用。2、提出基于梯度提升思想的決策樹(shù)算法。首先從推薦算法的核心算法入手,將決策樹(shù)作為基礎(chǔ)學(xué)習(xí)器,引入梯度提升的思想框架通過(guò)迭代的方式訓(xùn)練大量的基礎(chǔ)學(xué)習(xí)模型,將這些訓(xùn)練好的基礎(chǔ)學(xué)習(xí)器加權(quán)融合,實(shí)現(xiàn)將弱學(xué)習(xí)器組合成為強(qiáng)學(xué)習(xí)器,提高了推薦算法的泛化能力和推薦效果。運(yùn)用深度信念網(wǎng)絡(luò)模型將原始數(shù)據(jù)結(jié)合實(shí)際規(guī)則構(gòu)建了特征集合,用這些特征集合不斷訓(xùn)練優(yōu)化梯度提升決策樹(shù),構(gòu)建最終的推薦算法模型。3、基于梯度提升決策樹(shù)與深度信念網(wǎng)絡(luò)融合的推薦算法。首先構(gòu)建深度信念網(wǎng)絡(luò)初級(jí)算法模型,將初步處理提取出的特征集合,使用深度信念網(wǎng)絡(luò)模型學(xué)習(xí)處理,篩選生成最終的特征集合。其次依據(jù)實(shí)際的業(yè)務(wù)場(chǎng)景,生成用戶和商品可能存在的所有相關(guān)規(guī)則,以時(shí)間軸為基線并參考時(shí)間遺忘規(guī)律,劃分訓(xùn)練集、測(cè)試集和驗(yàn)證集。最后,用深度信念網(wǎng)絡(luò)模型選取出的特征集合充分訓(xùn)練梯度提升決策樹(shù),結(jié)合模型的驗(yàn)證集合不斷迭代驗(yàn)證推薦模型的結(jié)果,調(diào)節(jié)優(yōu)化兩個(gè)模型的參數(shù),實(shí)現(xiàn)算法模型的融合,生成最終的推薦模型。本課題基于阿里巴巴移動(dòng)電子商務(wù)平臺(tái)的真實(shí)用戶-商品行為數(shù)據(jù),進(jìn)行了大量的實(shí)驗(yàn),通過(guò)實(shí)現(xiàn)梯度提升決策樹(shù)和深度信念網(wǎng)絡(luò)的融合,與單個(gè)推薦算法的隨機(jī)森林算法、梯度提升決策樹(shù)算法和邏輯回歸算法的對(duì)比分析,得出在處理大量稀疏數(shù)據(jù)和特征屬性的數(shù)據(jù)中,梯度提升決策樹(shù)能夠快速學(xué)習(xí)數(shù)據(jù)中的潛在聯(lián)系,生成推薦結(jié)果,同時(shí)為了篩選數(shù)據(jù)集中大量的特征數(shù)據(jù)提升算法效率,避免過(guò)多的特征數(shù)據(jù)對(duì)推薦效果的影響,引入深度信念網(wǎng)絡(luò),通過(guò)其訓(xùn)練學(xué)習(xí)降低特征數(shù)目。通過(guò)融合這兩種推薦算法以及實(shí)驗(yàn)對(duì)比驗(yàn)證,總結(jié)出融合的推薦算法在電子商務(wù)場(chǎng)景下具有較高的推薦效果,取得了良好的性能。
[Abstract]:......
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李穎基,彭宏,鄭啟倫,曾煒;自動(dòng)分層推薦算法[J];計(jì)算機(jī)應(yīng)用;2002年11期
2 徐義峰;徐云青;劉曉平;;一種基于時(shí)間序列性的推薦算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2006年10期
3 余小鵬;;一種基于多層關(guān)聯(lián)規(guī)則的推薦算法研究[J];計(jì)算機(jī)應(yīng)用;2007年06期
4 張海玉;劉志都;楊彩;賈松浩;;基于頁(yè)面聚類的推薦算法的改進(jìn)[J];計(jì)算機(jī)應(yīng)用與軟件;2008年09期
5 張立燕;;一種基于用戶事務(wù)模式的推薦算法[J];福建電腦;2009年03期
6 王晗;夏自謙;;基于蟻群算法和瀏覽路徑的推薦算法研究[J];中國(guó)科技信息;2009年07期
7 周珊丹;周興社;王海鵬;倪紅波;張桂英;苗強(qiáng);;智能博物館環(huán)境下的個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2010年19期
8 王文;;個(gè)性化推薦算法研究[J];電腦知識(shí)與技術(shù);2010年16期
9 張愷;秦亮曦;寧朝波;李文閣;;改進(jìn)評(píng)價(jià)估計(jì)的混合推薦算法研究[J];微計(jì)算機(jī)信息;2010年36期
10 夏秀峰;代沁;叢麗暉;;用戶顯意識(shí)下的多重態(tài)度個(gè)性化推薦算法[J];計(jì)算機(jī)工程與應(yīng)用;2011年16期
相關(guān)會(huì)議論文 前10條
1 王韜丞;羅喜軍;杜小勇;;基于層次的推薦:一種新的個(gè)性化推薦算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
2 唐燦;;基于模糊用戶心理模式的個(gè)性化推薦算法[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年
3 秦國(guó);杜小勇;;基于用戶層次信息的協(xié)同推薦算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 周玉妮;鄭會(huì)頌;;基于瀏覽路徑選擇的蟻群推薦算法:用于移動(dòng)商務(wù)個(gè)性化推薦系統(tǒng)[A];社會(huì)經(jīng)濟(jì)發(fā)展轉(zhuǎn)型與系統(tǒng)工程——中國(guó)系統(tǒng)工程學(xué)會(huì)第17屆學(xué)術(shù)年會(huì)論文集[C];2012年
5 蘇日啟;胡皓;汪秉宏;;基于網(wǎng)絡(luò)的含時(shí)推薦算法[A];第五屆全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
6 梁莘q,
本文編號(hào):1573363
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1573363.html