基于網(wǎng)絡行為的用戶畫像算法研究
發(fā)布時間:2021-05-24 07:12
伴隨著整個社會對互聯(lián)網(wǎng)、特別是移動互聯(lián)網(wǎng)的廣泛接受,用戶產生數(shù)據(jù)呈現(xiàn)爆發(fā)式增長。我們每天都會在網(wǎng)絡上留下大量的行為數(shù)據(jù),比如查詢詞、網(wǎng)頁訪問記錄等,這些數(shù)據(jù)類型豐富、時效性強,為分析用戶的愛好習慣及個人屬性信息、構建用戶畫像模型,提供了充足的數(shù)據(jù)資源。用戶畫像是企業(yè)大數(shù)據(jù)的基礎,充分利用用戶行為記錄數(shù)據(jù),刻畫出用戶屬性信息全貌,高效地構建用戶畫像,將有利于企業(yè)實現(xiàn)精準營銷及個性化服務。傳統(tǒng)人工給用戶畫像打標簽的效率較低,所以借助算法模型來預測標簽成為用戶畫像的一個熱門研究方向。但是目前主流的機器學習算法未能深入挖掘特征間的復雜關系,在高維、稀疏特征時預測效果仍不盡人意,還存在較大提升空間。而混合算法往往能結合各算法的優(yōu)點,一定程度上克服缺陷,提高預測精度。針對用戶的查詢記錄數(shù)據(jù),為了實現(xiàn)用戶多維人口屬性標簽的預測任務,對用戶畫像構建方法進行了深入研究,研究工作總結如下:1)提出了一種基于隨機森林算法的二層集成學習框架。在第一層模型中,基于6種傳統(tǒng)的機器學習算法來作為用戶查詢詞特征提取器,并與用戶的數(shù)字特征相融合,作為第二層模型的輸入;在第二層模型中,使用隨機森林算法作為分類器,采用不同...
【文章來源】:廣東技術師范大學廣東省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究意義
1.3 用戶網(wǎng)絡行為畫像研究現(xiàn)狀
1.4 論文研究內容及結構
2 相關理論技術及模型
2.1 用戶畫像基礎
2.1.1 用戶畫像信息來源
2.1.2 用戶畫像常用模型
2.2 文本向量化常用模型
2.2.1 TF-IDF模型
2.2.2 詞向量模型
2.2.3 文檔向量模型
2.3 集成學習
2.3.1 Bagging算法
2.3.2 Boosting算法
2.3.3 Stacking算法
2.4 本章小結
3 基于隨機森林算法的用戶畫像構建
3.1 引言
3.2 算法介紹
3.2.1 邏輯回歸算法
3.2.2 支持向量機算法
3.2.3 樸素貝葉斯算法
3.2.4 主題模型
3.2.5 隨機森林算法
3.2.6 基于隨機森林算法的用戶畫像算法框架
3.3 實驗結果與分析
3.3.1 實驗環(huán)境及工具
3.3.2 數(shù)據(jù)集
3.3.3 預處理
3.3.4 對比方法
3.3.5 參數(shù)選擇
3.3.6 實驗結果
3.4 本章小結
4 基于XGBoost算法的用戶畫像算法框架
4.1 引言
4.2 算法介紹
4.2.1 BPDM(BPNN based Doc2Vec Model)
4.2.2 XGBoost算法
4.2.3 基于XGBoost算法的用戶畫像算法框架
4.3 實驗結果與分析
4.3.1 實驗環(huán)境及工具
4.3.2 數(shù)據(jù)集
4.3.3 對比方法
4.3.4 參數(shù)選擇
4.3.5 實驗結果
4.4 本章小結
5 總結與展望
5.1 全文總結
5.2 未來展望
參考文獻
致謝
攻讀碩士學位期間取得的研究成果
學位論文數(shù)據(jù)集表
【參考文獻】:
期刊論文
[1]基于樸素貝葉斯的農業(yè)文本分類方法研究[J]. 趙燕,李曉輝,周云成,張越. 節(jié)水灌溉. 2018(02)
[2]貝葉斯網(wǎng)絡在用戶畫像構建中的研究[J]. 張小可,沈文明,杜翠鳳. 移動通信. 2016(22)
[3]基于大數(shù)據(jù)的個人信用風險評估關鍵技術研究[J]. 林漢川,張萬軍,楊柳. 管理現(xiàn)代化. 2016(02)
[4]手機用戶畫像在大數(shù)據(jù)平臺的實現(xiàn)方案[J]. 張慷. 信息通信. 2014(02)
[5]人類行為的動力學與統(tǒng)計力學研究[J]. 汪秉宏,韓筱璞. 物理. 2010(01)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學技術大學 2017
[2]面向個性化服務的User Profile研究及應用[D]. 杜卿.華南理工大學 2014
[3]在線社會網(wǎng)絡用戶行為模型與應用算法研究[D]. 肖云鵬.北京郵電大學 2013
[4]網(wǎng)絡用戶行為分析的若干問題研究[D]. 劉鵬.北京郵電大學 2010
碩士論文
[1]基于Web日志的用戶行為大數(shù)據(jù)分析[D]. 宋芷萱.沈陽師范大學 2018
[2]基于深度神經網(wǎng)絡的用戶畫像研究[D]. 周妹璇.湖南大學 2018
[3]用戶畫像構建中知識表示與模型融合研究[D]. 李恒超.大連理工大學 2017
[4]基于集成SVM的文本分類方法研究[D]. 游攀利.華中科技大學 2014
[5]人機交互中用戶建模方法的研究[D]. 李榮.南京師范大學 2004
本文編號:3203782
【文章來源】:廣東技術師范大學廣東省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究意義
1.3 用戶網(wǎng)絡行為畫像研究現(xiàn)狀
1.4 論文研究內容及結構
2 相關理論技術及模型
2.1 用戶畫像基礎
2.1.1 用戶畫像信息來源
2.1.2 用戶畫像常用模型
2.2 文本向量化常用模型
2.2.1 TF-IDF模型
2.2.2 詞向量模型
2.2.3 文檔向量模型
2.3 集成學習
2.3.1 Bagging算法
2.3.2 Boosting算法
2.3.3 Stacking算法
2.4 本章小結
3 基于隨機森林算法的用戶畫像構建
3.1 引言
3.2 算法介紹
3.2.1 邏輯回歸算法
3.2.2 支持向量機算法
3.2.3 樸素貝葉斯算法
3.2.4 主題模型
3.2.5 隨機森林算法
3.2.6 基于隨機森林算法的用戶畫像算法框架
3.3 實驗結果與分析
3.3.1 實驗環(huán)境及工具
3.3.2 數(shù)據(jù)集
3.3.3 預處理
3.3.4 對比方法
3.3.5 參數(shù)選擇
3.3.6 實驗結果
3.4 本章小結
4 基于XGBoost算法的用戶畫像算法框架
4.1 引言
4.2 算法介紹
4.2.1 BPDM(BPNN based Doc2Vec Model)
4.2.2 XGBoost算法
4.2.3 基于XGBoost算法的用戶畫像算法框架
4.3 實驗結果與分析
4.3.1 實驗環(huán)境及工具
4.3.2 數(shù)據(jù)集
4.3.3 對比方法
4.3.4 參數(shù)選擇
4.3.5 實驗結果
4.4 本章小結
5 總結與展望
5.1 全文總結
5.2 未來展望
參考文獻
致謝
攻讀碩士學位期間取得的研究成果
學位論文數(shù)據(jù)集表
【參考文獻】:
期刊論文
[1]基于樸素貝葉斯的農業(yè)文本分類方法研究[J]. 趙燕,李曉輝,周云成,張越. 節(jié)水灌溉. 2018(02)
[2]貝葉斯網(wǎng)絡在用戶畫像構建中的研究[J]. 張小可,沈文明,杜翠鳳. 移動通信. 2016(22)
[3]基于大數(shù)據(jù)的個人信用風險評估關鍵技術研究[J]. 林漢川,張萬軍,楊柳. 管理現(xiàn)代化. 2016(02)
[4]手機用戶畫像在大數(shù)據(jù)平臺的實現(xiàn)方案[J]. 張慷. 信息通信. 2014(02)
[5]人類行為的動力學與統(tǒng)計力學研究[J]. 汪秉宏,韓筱璞. 物理. 2010(01)
博士論文
[1]基于社交大數(shù)據(jù)的用戶信用畫像方法研究[D]. 郭光明.中國科學技術大學 2017
[2]面向個性化服務的User Profile研究及應用[D]. 杜卿.華南理工大學 2014
[3]在線社會網(wǎng)絡用戶行為模型與應用算法研究[D]. 肖云鵬.北京郵電大學 2013
[4]網(wǎng)絡用戶行為分析的若干問題研究[D]. 劉鵬.北京郵電大學 2010
碩士論文
[1]基于Web日志的用戶行為大數(shù)據(jù)分析[D]. 宋芷萱.沈陽師范大學 2018
[2]基于深度神經網(wǎng)絡的用戶畫像研究[D]. 周妹璇.湖南大學 2018
[3]用戶畫像構建中知識表示與模型融合研究[D]. 李恒超.大連理工大學 2017
[4]基于集成SVM的文本分類方法研究[D]. 游攀利.華中科技大學 2014
[5]人機交互中用戶建模方法的研究[D]. 李榮.南京師范大學 2004
本文編號:3203782
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3203782.html
最近更新
教材專著