深度學習在推薦系統(tǒng)中的研究與應(yīng)用
發(fā)布時間:2020-12-11 03:57
現(xiàn)如今,隨著大數(shù)據(jù)時代的到來,信息量呈現(xiàn)出指數(shù)級爆炸性增長的趨勢,與此同時,用戶的個性化需求也越來越多,面對海量的數(shù)據(jù),如何幫助用戶迅速精準地獲取所需要的信息,是當前面臨的主要挑戰(zhàn)。因此,推薦系統(tǒng)受到了越來越廣泛的關(guān)注和重視,同時也逐漸變成了數(shù)據(jù)服務(wù)公司乃至整個互聯(lián)網(wǎng)行業(yè)的核心技術(shù)研究模塊。目前,推薦系統(tǒng)已經(jīng)得到廣泛應(yīng)用,而且取得了一定的效果,但在應(yīng)用中仍存在一些問題和不足,如系統(tǒng)數(shù)據(jù)量過少導致的冷啟動、數(shù)據(jù)稀疏性等問題亟待研究和解決,所以更好地研究和發(fā)展推薦系統(tǒng)技術(shù)具有重要意義。近些年來,基于人工神經(jīng)網(wǎng)絡(luò)的深度學習方法取得了重大的突破,相比傳統(tǒng)的機器學習方法,深度學習在計算機圖像與視頻、自然語言處理這些領(lǐng)域都得到了應(yīng)用并取得了更好的效果。因此,人們嘗試將深度學習的方法應(yīng)用于推薦系統(tǒng)領(lǐng)域,進行相關(guān)的研究,并取得了一些成果。相比于傳統(tǒng)推薦算法,深度學習方法在對目標特征的提取中具有更強的表現(xiàn)能力,對噪聲數(shù)據(jù)具有更好的抗噪能力,并且通過神經(jīng)網(wǎng)絡(luò)的建?梢愿泳_的學習目標特征,取得更好的效果,有著更加廣泛的適用場景。結(jié)合當前研究已有基礎(chǔ)和發(fā)展方向,本文分別研究了推薦算法和深度學習方法,并在傳...
【文章來源】:中國地質(zhì)大學(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)LeNet-5
第2章理論與相關(guān)技術(shù)24全連接層(FullyConnectedLayer)一般位于卷積神經(jīng)網(wǎng)絡(luò)最后,全連接層將一層神經(jīng)元分別輸出到不同的區(qū)域空間,并且全連接層的輸出是一個結(jié)果向量。全連接層的特別之處在于每一層上的全部神經(jīng)元都與其上一層中的全部神經(jīng)元連接,這樣可以一步一步提取上一層中每個神經(jīng)元的特征,并把全部特征整合。循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)序列數(shù)據(jù)在很多領(lǐng)域都很常見,如自然語言處理、語音識別、股市預測、天氣預測這些常見的預測模型中均存在不同的序列數(shù)據(jù)。一般最基本的序列模型僅僅對上一項和下一項進行預測,不需要隱式信息。例如在時間序列的自回歸模型里,該模型只對序列數(shù)據(jù)中的不同項采取加權(quán)平均,并預測下一項,同時也沒有采用隱式信息。但在真實狀況下,隱式信息非常必要并且往往包含非常重要的信息,同時在序列模型中,節(jié)點之間常常通過隱藏層來進行數(shù)據(jù)傳輸。一般情況下,序列模型常常都會包含隱式信息,這些信息會記錄序列模型在不同時間的狀態(tài),這時就可以根據(jù)時間以及記錄的信息實時預測下一項的變化。1986年Williams等人提出循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)的概念。循環(huán)神經(jīng)網(wǎng)絡(luò)的實質(zhì)是由序列模型發(fā)展演化而來。在過去的神經(jīng)網(wǎng)絡(luò)模型中,需要將數(shù)據(jù)輸入到模型中并得到輸出結(jié)果,但它們之間并沒有直接的關(guān)聯(lián),且相互獨立,例如在天氣預測領(lǐng)域中,希望根據(jù)今天的天氣預測明后兩天的天氣,這對于過去的神經(jīng)網(wǎng)絡(luò)模型顯然是難以解決的問題。此外,RNN有循環(huán)性,這是因為序列無時不刻都在執(zhí)行相同的任務(wù),并且每次都要根據(jù)當前的輸入和上一次的隱藏狀態(tài)來進行輸出。圖2-8顯示的是RNN的模型結(jié)構(gòu),其中包括輸入、輸出和隱藏單元。圖2-8RNN模型結(jié)構(gòu)
中國地質(zhì)大學(北京)工程碩士學位論文35第4章基于深度學習的特征聚合推薦模型經(jīng)過上一章的研究可以反映出傳統(tǒng)推薦方式都存在各自的優(yōu)劣,且適用于不同的應(yīng)用場景,但推薦精度普遍較低,對特征信息的利用方式也十分單一,并且在數(shù)據(jù)量較大的情況下運算效率較低,所以需要尋找一種適用性更強并能最大限度地解決上述問題的推薦算法。結(jié)合深度學習在特征提取和大規(guī)模數(shù)據(jù)分析方面的優(yōu)勢,本章嘗試將深度學習引入推薦系統(tǒng)中,評估其推薦效果。模型介紹文本卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)一般用于處理網(wǎng)狀拓撲結(jié)構(gòu)類型的數(shù)據(jù),比如圖片類型的數(shù)據(jù)可看作由×個整齊排列的像素點組成,自然語言可以看作由詞組成的一維序列結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)可以通過靈活組合卷積(convolution)和池化(pooling)操作形成不同的網(wǎng)絡(luò)結(jié)構(gòu),并用于不同的場景中。CNN的優(yōu)點是可以對網(wǎng)狀拓撲結(jié)構(gòu)類型的數(shù)據(jù)的局部進行計算,提取出多種不同的局部特征,得到的結(jié)果組合抽象出更高維度的數(shù)據(jù),從而得到更高級別的數(shù)據(jù)特征。通過前期大量的研究發(fā)現(xiàn),CNN能夠?qū)D像類和自然語言等文本類數(shù)據(jù)通過建模進行特征提取和數(shù)據(jù)分析。圖4-1文本卷積神經(jīng)網(wǎng)絡(luò)分類原理示意CNN對文本類數(shù)據(jù)進行分類的原理如圖4-1所示,一般分為以下幾個步驟:
【參考文獻】:
期刊論文
[1]基于內(nèi)容和協(xié)同過濾的科技文獻個性化推薦[J]. 楊凱,王利,周志平,趙衛(wèi)東. 信息技術(shù). 2019(12)
[2]淺析基于卷積神經(jīng)網(wǎng)絡(luò)的推薦系統(tǒng)[J]. 高暉春,郭金源,陳東玲,陳鵬飛,劉暢. 信息系統(tǒng)工程. 2019(10)
[3]基于多特征融合的電影推薦系統(tǒng)[J]. 黎丹雨. 計算機與現(xiàn)代化. 2019(08)
[4]協(xié)同過濾技術(shù)在電影推薦中的應(yīng)用[J]. 陳俊然. 電腦編程技巧與維護. 2019(01)
[5]基于深度學習的推薦算法研究綜述[J]. 王俊淑,張國明,胡斌. 南京師范大學學報(工程技術(shù)版). 2018(04)
[6]A Novel Deep Hybrid Recommender System Based on Auto-encoder with Neural Collaborative Filtering[J]. Yu Liu,Shuai Wang,M.Shahrukh Khan,Jieyu He. Big Data Mining and Analytics. 2018(03)
[7]基于深度學習的多交互混合推薦模型[J]. 李同歡,唐雁,劉冰. 計算機工程與應(yīng)用. 2019(01)
[8]基于標簽卷積神經(jīng)網(wǎng)絡(luò)的文本推薦算法[J]. 馬驍烊,張謐. 計算機系統(tǒng)應(yīng)用. 2018(08)
[9]一種基于云模型的社交網(wǎng)絡(luò)推薦系統(tǒng)評分預測方法[J]. 肖云鵬,孫華超,戴天驥,李茜,李暾. 電子學報. 2018(07)
[10]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
碩士論文
[1]基于深度學習的推薦系統(tǒng)算法研究[D]. 張杰.太原理工大學 2019
[2]基于音樂內(nèi)容語義的推薦算法的研究與實現(xiàn)[D]. 劉奕.北京郵電大學 2018
[3]基于機器學習的推薦技術(shù)研究[D]. 孟曉龍.吉林大學 2016
[4]基于混合模式的個性化音樂推薦系統(tǒng)的研究與實現(xiàn)[D]. 孔云.華中師范大學 2016
[5]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學 2016
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的推薦算法[D]. 吳浠.華南理工大學 2016
[7]混合推薦算法的研究[D]. 宋瑞平.蘭州大學 2014
[8]基于深度學習的推薦系統(tǒng)研究[D]. 陳達.北京郵電大學 2014
[9]個性化混合推薦算法的研究[D]. 張騰季.浙江大學 2013
[10]基于混合模式的個性化推薦系統(tǒng)的研究與應(yīng)用[D]. 梁潔.武漢理工大學 2011
本文編號:2909868
【文章來源】:中國地質(zhì)大學(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【部分圖文】:
經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)LeNet-5
第2章理論與相關(guān)技術(shù)24全連接層(FullyConnectedLayer)一般位于卷積神經(jīng)網(wǎng)絡(luò)最后,全連接層將一層神經(jīng)元分別輸出到不同的區(qū)域空間,并且全連接層的輸出是一個結(jié)果向量。全連接層的特別之處在于每一層上的全部神經(jīng)元都與其上一層中的全部神經(jīng)元連接,這樣可以一步一步提取上一層中每個神經(jīng)元的特征,并把全部特征整合。循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)序列數(shù)據(jù)在很多領(lǐng)域都很常見,如自然語言處理、語音識別、股市預測、天氣預測這些常見的預測模型中均存在不同的序列數(shù)據(jù)。一般最基本的序列模型僅僅對上一項和下一項進行預測,不需要隱式信息。例如在時間序列的自回歸模型里,該模型只對序列數(shù)據(jù)中的不同項采取加權(quán)平均,并預測下一項,同時也沒有采用隱式信息。但在真實狀況下,隱式信息非常必要并且往往包含非常重要的信息,同時在序列模型中,節(jié)點之間常常通過隱藏層來進行數(shù)據(jù)傳輸。一般情況下,序列模型常常都會包含隱式信息,這些信息會記錄序列模型在不同時間的狀態(tài),這時就可以根據(jù)時間以及記錄的信息實時預測下一項的變化。1986年Williams等人提出循環(huán)神經(jīng)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)的概念。循環(huán)神經(jīng)網(wǎng)絡(luò)的實質(zhì)是由序列模型發(fā)展演化而來。在過去的神經(jīng)網(wǎng)絡(luò)模型中,需要將數(shù)據(jù)輸入到模型中并得到輸出結(jié)果,但它們之間并沒有直接的關(guān)聯(lián),且相互獨立,例如在天氣預測領(lǐng)域中,希望根據(jù)今天的天氣預測明后兩天的天氣,這對于過去的神經(jīng)網(wǎng)絡(luò)模型顯然是難以解決的問題。此外,RNN有循環(huán)性,這是因為序列無時不刻都在執(zhí)行相同的任務(wù),并且每次都要根據(jù)當前的輸入和上一次的隱藏狀態(tài)來進行輸出。圖2-8顯示的是RNN的模型結(jié)構(gòu),其中包括輸入、輸出和隱藏單元。圖2-8RNN模型結(jié)構(gòu)
中國地質(zhì)大學(北京)工程碩士學位論文35第4章基于深度學習的特征聚合推薦模型經(jīng)過上一章的研究可以反映出傳統(tǒng)推薦方式都存在各自的優(yōu)劣,且適用于不同的應(yīng)用場景,但推薦精度普遍較低,對特征信息的利用方式也十分單一,并且在數(shù)據(jù)量較大的情況下運算效率較低,所以需要尋找一種適用性更強并能最大限度地解決上述問題的推薦算法。結(jié)合深度學習在特征提取和大規(guī)模數(shù)據(jù)分析方面的優(yōu)勢,本章嘗試將深度學習引入推薦系統(tǒng)中,評估其推薦效果。模型介紹文本卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)一般用于處理網(wǎng)狀拓撲結(jié)構(gòu)類型的數(shù)據(jù),比如圖片類型的數(shù)據(jù)可看作由×個整齊排列的像素點組成,自然語言可以看作由詞組成的一維序列結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)可以通過靈活組合卷積(convolution)和池化(pooling)操作形成不同的網(wǎng)絡(luò)結(jié)構(gòu),并用于不同的場景中。CNN的優(yōu)點是可以對網(wǎng)狀拓撲結(jié)構(gòu)類型的數(shù)據(jù)的局部進行計算,提取出多種不同的局部特征,得到的結(jié)果組合抽象出更高維度的數(shù)據(jù),從而得到更高級別的數(shù)據(jù)特征。通過前期大量的研究發(fā)現(xiàn),CNN能夠?qū)D像類和自然語言等文本類數(shù)據(jù)通過建模進行特征提取和數(shù)據(jù)分析。圖4-1文本卷積神經(jīng)網(wǎng)絡(luò)分類原理示意CNN對文本類數(shù)據(jù)進行分類的原理如圖4-1所示,一般分為以下幾個步驟:
【參考文獻】:
期刊論文
[1]基于內(nèi)容和協(xié)同過濾的科技文獻個性化推薦[J]. 楊凱,王利,周志平,趙衛(wèi)東. 信息技術(shù). 2019(12)
[2]淺析基于卷積神經(jīng)網(wǎng)絡(luò)的推薦系統(tǒng)[J]. 高暉春,郭金源,陳東玲,陳鵬飛,劉暢. 信息系統(tǒng)工程. 2019(10)
[3]基于多特征融合的電影推薦系統(tǒng)[J]. 黎丹雨. 計算機與現(xiàn)代化. 2019(08)
[4]協(xié)同過濾技術(shù)在電影推薦中的應(yīng)用[J]. 陳俊然. 電腦編程技巧與維護. 2019(01)
[5]基于深度學習的推薦算法研究綜述[J]. 王俊淑,張國明,胡斌. 南京師范大學學報(工程技術(shù)版). 2018(04)
[6]A Novel Deep Hybrid Recommender System Based on Auto-encoder with Neural Collaborative Filtering[J]. Yu Liu,Shuai Wang,M.Shahrukh Khan,Jieyu He. Big Data Mining and Analytics. 2018(03)
[7]基于深度學習的多交互混合推薦模型[J]. 李同歡,唐雁,劉冰. 計算機工程與應(yīng)用. 2019(01)
[8]基于標簽卷積神經(jīng)網(wǎng)絡(luò)的文本推薦算法[J]. 馬驍烊,張謐. 計算機系統(tǒng)應(yīng)用. 2018(08)
[9]一種基于云模型的社交網(wǎng)絡(luò)推薦系統(tǒng)評分預測方法[J]. 肖云鵬,孫華超,戴天驥,李茜,李暾. 電子學報. 2018(07)
[10]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
碩士論文
[1]基于深度學習的推薦系統(tǒng)算法研究[D]. 張杰.太原理工大學 2019
[2]基于音樂內(nèi)容語義的推薦算法的研究與實現(xiàn)[D]. 劉奕.北京郵電大學 2018
[3]基于機器學習的推薦技術(shù)研究[D]. 孟曉龍.吉林大學 2016
[4]基于混合模式的個性化音樂推薦系統(tǒng)的研究與實現(xiàn)[D]. 孔云.華中師范大學 2016
[5]基于循環(huán)神經(jīng)網(wǎng)絡(luò)模型的文本分類[D]. 龔千健.華中科技大學 2016
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的推薦算法[D]. 吳浠.華南理工大學 2016
[7]混合推薦算法的研究[D]. 宋瑞平.蘭州大學 2014
[8]基于深度學習的推薦系統(tǒng)研究[D]. 陳達.北京郵電大學 2014
[9]個性化混合推薦算法的研究[D]. 張騰季.浙江大學 2013
[10]基于混合模式的個性化推薦系統(tǒng)的研究與應(yīng)用[D]. 梁潔.武漢理工大學 2011
本文編號:2909868
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2909868.html
最近更新
教材專著