基于特征工程和高效梯度提升樹算法的精準化混合推薦方法研究
發(fā)布時間:2021-04-28 13:44
隨著互聯(lián)網(wǎng)和信息技術(shù)的迅猛發(fā)展,互聯(lián)網(wǎng)的信息量以指數(shù)形式增長。為了解決信息過載的問題,滿足擁有不同興趣愛好、關(guān)注領(lǐng)域、行為習慣、消費水平和個人成長經(jīng)歷的用戶的信息需求,協(xié)同過濾推薦系統(tǒng)應(yīng)運而生。但是,在互聯(lián)網(wǎng)數(shù)據(jù)量指數(shù)增長的背景下,協(xié)同過濾推薦系統(tǒng)存在的數(shù)據(jù)稀疏性問題越來越嚴重。在高維的項目空間中,用戶能夠訪問和打分的項目極少,這也導致了評分矩陣極度稀疏的問題。為了解決評分矩陣稀疏性的問題,本文從特征工程和推薦方法的角度出發(fā),提出了一種基于用戶行為數(shù)據(jù)以及用戶與物品屬性數(shù)據(jù)的混合推薦方法,并以電信運營商向用戶推薦套餐為應(yīng)用場景作具體論述。首先,對不同來源的特征進行有規(guī)律的特征組合,構(gòu)造成組合特征。并運用word2vec方法對用戶行為數(shù)據(jù)當中的時間序列數(shù)據(jù)進行特征增強,構(gòu)建擁有相同消費習慣的用戶之間的聯(lián)系。然后,基于高效梯度提升樹算法對大規(guī)模用戶數(shù)據(jù)集進行建模,將高效梯度提升樹模型的特征重要度以及模型輸出的用戶選擇套餐的概率分布對套餐進行過濾,以達到對用戶進行個性化套餐推薦的目的。最后,基于聯(lián)通運營商發(fā)布的用戶多源數(shù)據(jù),根據(jù)構(gòu)造完成的混合推薦方法,對用戶的興趣套餐進行預測并完成個性化套餐...
【文章來源】:武漢科技大學湖北省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 推薦系統(tǒng)研究現(xiàn)狀
1.2.2 集成學習研究現(xiàn)狀
1.3 論文的研究設(shè)計
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 論文技術(shù)路線
第2章 相關(guān)理論與方法
2.1 推薦系統(tǒng)
2.1.1 基于人口統(tǒng)計學的推薦
2.1.2 基于內(nèi)容的推薦
2.1.3 基于協(xié)同過濾的推薦
2.1.4 基于混合的推薦
2.2 集成學習提升方法
2.2.1 提升方法Adaboost算法
2.2.2 梯度提升決策樹(GBDT)
第3章 數(shù)據(jù)預處理與特征工程
3.1 面向大規(guī)模用戶推薦的數(shù)據(jù)處理
3.1.1 問題描述
3.1.2 數(shù)據(jù)處理思路
3.2 數(shù)據(jù)預處理
3.2.1 連續(xù)特征數(shù)據(jù)預處理
3.2.2 離散特征數(shù)據(jù)預處理
3.3 特征組合方法設(shè)計
3.4 特征增強方法
3.4.1 Word2vec
3.4.2 基于Word2vec的特征增強
第4章 基于高效梯度提升樹算法的混合推薦方法
4.1 混合推薦方法設(shè)計思路
4.2 高效梯度提升樹算法
4.2.1 XGBoost算法
4.2.2 LightGBM算法
4.3 基于高效梯度提升樹算法建模
4.3.1 S折交叉驗證
4.3.2 基于XGBoost算法建模
4.3.3 基于LightGBM算法建模
4.4 特征重要性分析方法
4.5 基于高效梯度提升樹算法的混合推薦方法構(gòu)建
4.5.1 混合推薦方法定義
4.5.2 混合推薦方法描述
第5章 基于聯(lián)通運營商多元數(shù)據(jù)的實例應(yīng)用分析
5.1 實例概述
5.2 數(shù)據(jù)預處理和探索性數(shù)據(jù)分析
5.2.1 數(shù)據(jù)預處理
5.2.2 探索性數(shù)據(jù)分析
5.3 基于特征組合和特征增強的特征工程
5.3.1 基于統(tǒng)計的特征組合
5.3.2 基于Word2Vec的特征增強
5.4 基于高效梯度提升樹算法的混合推薦方法實現(xiàn)
5.4.1 實驗條件
5.4.2 分類模型評價指標
5.4.3 超參數(shù)優(yōu)化
5.4.4 實驗預測結(jié)果與分析
5.4.5 特征重要性分析與個性化推薦結(jié)果
第6章 結(jié)論與展望
6.1 結(jié)論
6.2 展望
致謝
參考文獻
附錄1 攻讀碩士學位期間發(fā)表的論文
附錄2 攻讀碩士學位期間參加的科研項目
【參考文獻】:
期刊論文
[1]基于深度LightGBM集成學習模型的谷歌商店顧客購買力預測[J]. 葉志宇,馮愛民,高航. 計算機應(yīng)用. 2019(12)
[2]面向高維特征和多分類的分布式梯度提升樹[J]. 江佳偉,符芳誠,邵鎣俠,崔斌. 軟件學報. 2019(03)
[3]改進的基于物品的協(xié)同過濾推薦算法[J]. 石京京,肖迎元,鄭文廣. 天津理工大學學報. 2019(01)
[4]基于獨熱編碼和卷積神經(jīng)網(wǎng)絡(luò)的異常檢測[J]. 梁杰,陳嘉豪,張雪芹,周悅,林家駿. 清華大學學報(自然科學版). 2019(07)
[5]基于二次組合的特征工程與XGBoost模型的用戶行為預測[J]. 楊立洪,白肇強. 科學技術(shù)與工程. 2018(14)
[6]基于社交網(wǎng)絡(luò)信息的協(xié)同過濾推薦算法[J]. 張朝恒,何小衛(wèi),陳勇兵. 計算機技術(shù)與發(fā)展. 2017(12)
[7]基于KNN算法的新浪微博用戶行為分析及預測[J]. 解軍,邢進生. 山西師范大學學報(自然科學版). 2016(02)
[8]基于用戶人口統(tǒng)計特征與信任機制的協(xié)同推薦[J]. 時念云,葛曉偉,馬力. 計算機工程. 2016(06)
[9]基于用戶的協(xié)同過濾算法的推薦效率和個性化改進[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計算機系統(tǒng). 2016(03)
[10]基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦方法[J]. 楊武,唐瑞,盧玲. 計算機應(yīng)用. 2016(02)
碩士論文
[1]基于大數(shù)據(jù)技術(shù)的電信用戶畫像系統(tǒng)的實現(xiàn)與應(yīng)用[D]. 王藝霖.北京郵電大學 2018
[2]基于用戶通話行為的電信套餐業(yè)務(wù)推薦系統(tǒng)的設(shè)計與實現(xiàn)[D]. 李慧娟.貴州大學 2017
[3]基于神經(jīng)網(wǎng)絡(luò)與隨機森林的套餐推薦模型的設(shè)計與研究[D]. 顧方婷.上海交通大學 2017
[4]基于協(xié)同過濾模型與隱語義模型的推薦系統(tǒng)研究與實現(xiàn)[D]. 魯權(quán).湖南大學 2013
[5]基于用戶消費行為的移動業(yè)務(wù)推薦[D]. 田穎.華中科技大學 2013
本文編號:3165581
【文章來源】:武漢科技大學湖北省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 推薦系統(tǒng)研究現(xiàn)狀
1.2.2 集成學習研究現(xiàn)狀
1.3 論文的研究設(shè)計
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 論文技術(shù)路線
第2章 相關(guān)理論與方法
2.1 推薦系統(tǒng)
2.1.1 基于人口統(tǒng)計學的推薦
2.1.2 基于內(nèi)容的推薦
2.1.3 基于協(xié)同過濾的推薦
2.1.4 基于混合的推薦
2.2 集成學習提升方法
2.2.1 提升方法Adaboost算法
2.2.2 梯度提升決策樹(GBDT)
第3章 數(shù)據(jù)預處理與特征工程
3.1 面向大規(guī)模用戶推薦的數(shù)據(jù)處理
3.1.1 問題描述
3.1.2 數(shù)據(jù)處理思路
3.2 數(shù)據(jù)預處理
3.2.1 連續(xù)特征數(shù)據(jù)預處理
3.2.2 離散特征數(shù)據(jù)預處理
3.3 特征組合方法設(shè)計
3.4 特征增強方法
3.4.1 Word2vec
3.4.2 基于Word2vec的特征增強
第4章 基于高效梯度提升樹算法的混合推薦方法
4.1 混合推薦方法設(shè)計思路
4.2 高效梯度提升樹算法
4.2.1 XGBoost算法
4.2.2 LightGBM算法
4.3 基于高效梯度提升樹算法建模
4.3.1 S折交叉驗證
4.3.2 基于XGBoost算法建模
4.3.3 基于LightGBM算法建模
4.4 特征重要性分析方法
4.5 基于高效梯度提升樹算法的混合推薦方法構(gòu)建
4.5.1 混合推薦方法定義
4.5.2 混合推薦方法描述
第5章 基于聯(lián)通運營商多元數(shù)據(jù)的實例應(yīng)用分析
5.1 實例概述
5.2 數(shù)據(jù)預處理和探索性數(shù)據(jù)分析
5.2.1 數(shù)據(jù)預處理
5.2.2 探索性數(shù)據(jù)分析
5.3 基于特征組合和特征增強的特征工程
5.3.1 基于統(tǒng)計的特征組合
5.3.2 基于Word2Vec的特征增強
5.4 基于高效梯度提升樹算法的混合推薦方法實現(xiàn)
5.4.1 實驗條件
5.4.2 分類模型評價指標
5.4.3 超參數(shù)優(yōu)化
5.4.4 實驗預測結(jié)果與分析
5.4.5 特征重要性分析與個性化推薦結(jié)果
第6章 結(jié)論與展望
6.1 結(jié)論
6.2 展望
致謝
參考文獻
附錄1 攻讀碩士學位期間發(fā)表的論文
附錄2 攻讀碩士學位期間參加的科研項目
【參考文獻】:
期刊論文
[1]基于深度LightGBM集成學習模型的谷歌商店顧客購買力預測[J]. 葉志宇,馮愛民,高航. 計算機應(yīng)用. 2019(12)
[2]面向高維特征和多分類的分布式梯度提升樹[J]. 江佳偉,符芳誠,邵鎣俠,崔斌. 軟件學報. 2019(03)
[3]改進的基于物品的協(xié)同過濾推薦算法[J]. 石京京,肖迎元,鄭文廣. 天津理工大學學報. 2019(01)
[4]基于獨熱編碼和卷積神經(jīng)網(wǎng)絡(luò)的異常檢測[J]. 梁杰,陳嘉豪,張雪芹,周悅,林家駿. 清華大學學報(自然科學版). 2019(07)
[5]基于二次組合的特征工程與XGBoost模型的用戶行為預測[J]. 楊立洪,白肇強. 科學技術(shù)與工程. 2018(14)
[6]基于社交網(wǎng)絡(luò)信息的協(xié)同過濾推薦算法[J]. 張朝恒,何小衛(wèi),陳勇兵. 計算機技術(shù)與發(fā)展. 2017(12)
[7]基于KNN算法的新浪微博用戶行為分析及預測[J]. 解軍,邢進生. 山西師范大學學報(自然科學版). 2016(02)
[8]基于用戶人口統(tǒng)計特征與信任機制的協(xié)同推薦[J]. 時念云,葛曉偉,馬力. 計算機工程. 2016(06)
[9]基于用戶的協(xié)同過濾算法的推薦效率和個性化改進[J]. 王成,朱志剛,張玉俠,蘇芳芳. 小型微型計算機系統(tǒng). 2016(03)
[10]基于內(nèi)容的推薦與協(xié)同過濾融合的新聞推薦方法[J]. 楊武,唐瑞,盧玲. 計算機應(yīng)用. 2016(02)
碩士論文
[1]基于大數(shù)據(jù)技術(shù)的電信用戶畫像系統(tǒng)的實現(xiàn)與應(yīng)用[D]. 王藝霖.北京郵電大學 2018
[2]基于用戶通話行為的電信套餐業(yè)務(wù)推薦系統(tǒng)的設(shè)計與實現(xiàn)[D]. 李慧娟.貴州大學 2017
[3]基于神經(jīng)網(wǎng)絡(luò)與隨機森林的套餐推薦模型的設(shè)計與研究[D]. 顧方婷.上海交通大學 2017
[4]基于協(xié)同過濾模型與隱語義模型的推薦系統(tǒng)研究與實現(xiàn)[D]. 魯權(quán).湖南大學 2013
[5]基于用戶消費行為的移動業(yè)務(wù)推薦[D]. 田穎.華中科技大學 2013
本文編號:3165581
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3165581.html
最近更新
教材專著