基于WEB日志的用戶畫像及可視化分析
發(fā)布時間:2021-09-24 09:34
隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的蓬勃發(fā)展,用戶對網(wǎng)站建設(shè)提出了更高的要求.然而,經(jīng)常因為網(wǎng)站設(shè)計給用戶操作帶來不便,致使用戶體驗變差,最終錚致客戶流失,軟件生命周期變短。若要設(shè)計出高質(zhì)量使用戶滿意的軟件,就需要根據(jù)用戶的真實行為反饋,了解用戶的行為習(xí)慣,有針對性的對網(wǎng)站進行優(yōu)化設(shè)計。本文以教育統(tǒng)計平臺為研究背景,針對網(wǎng)站設(shè)計中存在的功能展示不明確、組織結(jié)構(gòu)混亂等問題,提出了構(gòu)雄用戶畫像的方法。根據(jù)畫像結(jié)果為設(shè)計者提供建議,解決網(wǎng)站設(shè)計中存在的問題,優(yōu)化設(shè)計,提高用戶體驗。主要研究如下:(1)用戶行為的建模。本文使用序列模式挖掘方法中的PrefixSpan算法對用戶的行為軌跡進行挖掘。由于該算法在構(gòu)造投影數(shù)據(jù)庫時要占用大量的時間和空間,因此本文針對以上缺陷設(shè)計了PW算法,該算法增加了支持度和頁面權(quán)重的雙重過濾。經(jīng)實驗驗證,PW算法在時間效率和精確率上優(yōu)于PrefixSpan算法。(2)標(biāo)簽權(quán)重的計算。在序列模式算法挖掘出用戶行為后,將實驗結(jié)果保存到文本中作為標(biāo)簽權(quán)重算法的輸入。本文對計算標(biāo)簽權(quán)重的TF-IDF和BM25算法的精確率、召回率和F1值進行對比分析,實驗結(jié)果表明,BM25算法的綜合性能優(yōu)于TF...
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 用戶畫像在國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論與技術(shù)應(yīng)用研究
2.1 WEB挖掘技術(shù)概述
2.2 用戶畫像概述
2.3 構(gòu)建用戶畫像
2.3.1 用戶畫像的建模方法
2.3.2 多維度刻畫用戶畫像
2.3.3 標(biāo)簽體系的建立
2.3.4 構(gòu)建用戶畫像流程
2.4 評估用戶畫像
2.5 數(shù)據(jù)可視化
2.6 本章小結(jié)
3 基于WEB日志的用戶行為建模方法研究
3.1 實驗環(huán)境和數(shù)據(jù)
3.2 序列模式挖掘算法分析
3.3 用戶行為建模
3.3.1 PrefixSpan算法描述
3.3.2 PrefixSpan算法優(yōu)化
3.3.3 PrefixSpan與 PW算法分析
3.4 實驗結(jié)果與分析
3.4.1 實驗數(shù)據(jù)處理
3.4.2 時間效率對比
3.4.3 精準(zhǔn)度對比
3.4.4 用戶行為序列結(jié)果分析
3.5 本章小結(jié)
4 計算標(biāo)簽權(quán)重方法研究
4.1 標(biāo)簽權(quán)重算法分析
4.2 計算標(biāo)簽權(quán)重
4.2.1 TF-IDF算法描述
4.2.2 BM25 算法描述
4.2.3 TF-IDF和 BM25 算法分析
4.3 算法評價指標(biāo)
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)處理
4.4.2 精確率對比
4.4.3 召回率對比
4.4.4 F1 值對比
4.4.5 用戶標(biāo)簽權(quán)重結(jié)果分析
4.5 用戶行為可視化分析
4.5.1 活躍度信息數(shù)據(jù)可視化
4.5.2 偏好信息數(shù)據(jù)可視化
4.5.3 位置信息數(shù)據(jù)可視化
4.6 本章小結(jié)
5 用戶畫像在教育統(tǒng)計平臺中的應(yīng)用
5.1 搭建用戶畫像應(yīng)用系統(tǒng)
5.1.1 系統(tǒng)概述
5.1.2 數(shù)據(jù)庫設(shè)計
5.1.3 主要功能模塊
5.2 教育統(tǒng)計平臺的用戶畫像
5.2.1 用戶畫像標(biāo)簽體系
5.2.2 用戶畫像的結(jié)果展示
5.2.3 用戶畫像的應(yīng)用
5.3 用戶畫像的驗證
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
致謝
參考文獻
攻讀碩士學(xué)位期間研究成果
【參考文獻】:
期刊論文
[1]面向攻擊識別的威脅情報畫像分析[J]. 楊沛安,劉寶旭,杜翔宇. 計算機工程. 2020(01)
[2]用戶異常行為分析方法研究與應(yīng)用[J]. 賴建華,唐敏. 軟件導(dǎo)刊. 2019(08)
[3]基于動態(tài)精準(zhǔn)畫像的圖書館個性化推薦服務(wù)研究[J]. 張銳. 情報探索. 2019(02)
[4]內(nèi)部威脅檢測中用戶行為模式畫像方法研究[J]. 郭淵博,劉春輝,孔菁,王一豐. 通信學(xué)報. 2018(12)
[5]基于用戶動態(tài)畫像的科技情報服務(wù)推薦模型構(gòu)建研究[J]. 王益成,王萍. 情報理論與實踐. 2019(04)
[6]在線社交活動中的用戶畫像及其信息傳播行為研究[J]. 劉海鷗,孫晶晶,張亞明,趙攀. 情報科學(xué). 2018(12)
[7]基于讀者用戶畫像的高校圖書館精準(zhǔn)化服務(wù)研究[J]. 李雅. 農(nóng)業(yè)圖書情報學(xué)刊. 2018(12)
[8]基于云模型理論的群體用戶畫像模型[J]. 姚龍飛,何利力. 計算機系統(tǒng)應(yīng)用. 2018(06)
[9]基于動態(tài)用戶畫像的信息推薦研究[J]. 劉勇,吳翔宇,解本巨. 計算機系統(tǒng)應(yīng)用. 2018(06)
[10]大數(shù)據(jù)可視化工具比較及應(yīng)用[J]. 陳小燕,干麗萍,郭文平. 計算機教育. 2018(06)
碩士論文
[1]基于用戶畫像特征數(shù)據(jù)集的個性化推薦算法研究[D]. 張穎.西安電子科技大學(xué) 2018
[2]基于大數(shù)據(jù)技術(shù)的用戶畫像系統(tǒng)的設(shè)計與研究[D]. 關(guān)梓驁.北京郵電大學(xué) 2018
[3]基于ECharts的數(shù)據(jù)可視化實現(xiàn)[D]. 裴丹丹.北京郵電大學(xué) 2018
[4]對TF-IDF算法的改進及實驗研究[D]. 何曉靜.吉林大學(xué) 2017
[5]大數(shù)據(jù)背景下用戶畫像的統(tǒng)計方法實踐研究[D]. 李映坤.首都經(jīng)濟貿(mào)易大學(xué) 2016
[6]面向自然語言查詢的知識搜索關(guān)鍵技術(shù)研究[D]. 黃鵬程.浙江大學(xué) 2016
本文編號:3407523
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 用戶畫像在國內(nèi)外研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論與技術(shù)應(yīng)用研究
2.1 WEB挖掘技術(shù)概述
2.2 用戶畫像概述
2.3 構(gòu)建用戶畫像
2.3.1 用戶畫像的建模方法
2.3.2 多維度刻畫用戶畫像
2.3.3 標(biāo)簽體系的建立
2.3.4 構(gòu)建用戶畫像流程
2.4 評估用戶畫像
2.5 數(shù)據(jù)可視化
2.6 本章小結(jié)
3 基于WEB日志的用戶行為建模方法研究
3.1 實驗環(huán)境和數(shù)據(jù)
3.2 序列模式挖掘算法分析
3.3 用戶行為建模
3.3.1 PrefixSpan算法描述
3.3.2 PrefixSpan算法優(yōu)化
3.3.3 PrefixSpan與 PW算法分析
3.4 實驗結(jié)果與分析
3.4.1 實驗數(shù)據(jù)處理
3.4.2 時間效率對比
3.4.3 精準(zhǔn)度對比
3.4.4 用戶行為序列結(jié)果分析
3.5 本章小結(jié)
4 計算標(biāo)簽權(quán)重方法研究
4.1 標(biāo)簽權(quán)重算法分析
4.2 計算標(biāo)簽權(quán)重
4.2.1 TF-IDF算法描述
4.2.2 BM25 算法描述
4.2.3 TF-IDF和 BM25 算法分析
4.3 算法評價指標(biāo)
4.4 實驗結(jié)果與分析
4.4.1 實驗數(shù)據(jù)處理
4.4.2 精確率對比
4.4.3 召回率對比
4.4.4 F1 值對比
4.4.5 用戶標(biāo)簽權(quán)重結(jié)果分析
4.5 用戶行為可視化分析
4.5.1 活躍度信息數(shù)據(jù)可視化
4.5.2 偏好信息數(shù)據(jù)可視化
4.5.3 位置信息數(shù)據(jù)可視化
4.6 本章小結(jié)
5 用戶畫像在教育統(tǒng)計平臺中的應(yīng)用
5.1 搭建用戶畫像應(yīng)用系統(tǒng)
5.1.1 系統(tǒng)概述
5.1.2 數(shù)據(jù)庫設(shè)計
5.1.3 主要功能模塊
5.2 教育統(tǒng)計平臺的用戶畫像
5.2.1 用戶畫像標(biāo)簽體系
5.2.2 用戶畫像的結(jié)果展示
5.2.3 用戶畫像的應(yīng)用
5.3 用戶畫像的驗證
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來展望
致謝
參考文獻
攻讀碩士學(xué)位期間研究成果
【參考文獻】:
期刊論文
[1]面向攻擊識別的威脅情報畫像分析[J]. 楊沛安,劉寶旭,杜翔宇. 計算機工程. 2020(01)
[2]用戶異常行為分析方法研究與應(yīng)用[J]. 賴建華,唐敏. 軟件導(dǎo)刊. 2019(08)
[3]基于動態(tài)精準(zhǔn)畫像的圖書館個性化推薦服務(wù)研究[J]. 張銳. 情報探索. 2019(02)
[4]內(nèi)部威脅檢測中用戶行為模式畫像方法研究[J]. 郭淵博,劉春輝,孔菁,王一豐. 通信學(xué)報. 2018(12)
[5]基于用戶動態(tài)畫像的科技情報服務(wù)推薦模型構(gòu)建研究[J]. 王益成,王萍. 情報理論與實踐. 2019(04)
[6]在線社交活動中的用戶畫像及其信息傳播行為研究[J]. 劉海鷗,孫晶晶,張亞明,趙攀. 情報科學(xué). 2018(12)
[7]基于讀者用戶畫像的高校圖書館精準(zhǔn)化服務(wù)研究[J]. 李雅. 農(nóng)業(yè)圖書情報學(xué)刊. 2018(12)
[8]基于云模型理論的群體用戶畫像模型[J]. 姚龍飛,何利力. 計算機系統(tǒng)應(yīng)用. 2018(06)
[9]基于動態(tài)用戶畫像的信息推薦研究[J]. 劉勇,吳翔宇,解本巨. 計算機系統(tǒng)應(yīng)用. 2018(06)
[10]大數(shù)據(jù)可視化工具比較及應(yīng)用[J]. 陳小燕,干麗萍,郭文平. 計算機教育. 2018(06)
碩士論文
[1]基于用戶畫像特征數(shù)據(jù)集的個性化推薦算法研究[D]. 張穎.西安電子科技大學(xué) 2018
[2]基于大數(shù)據(jù)技術(shù)的用戶畫像系統(tǒng)的設(shè)計與研究[D]. 關(guān)梓驁.北京郵電大學(xué) 2018
[3]基于ECharts的數(shù)據(jù)可視化實現(xiàn)[D]. 裴丹丹.北京郵電大學(xué) 2018
[4]對TF-IDF算法的改進及實驗研究[D]. 何曉靜.吉林大學(xué) 2017
[5]大數(shù)據(jù)背景下用戶畫像的統(tǒng)計方法實踐研究[D]. 李映坤.首都經(jīng)濟貿(mào)易大學(xué) 2016
[6]面向自然語言查詢的知識搜索關(guān)鍵技術(shù)研究[D]. 黃鵬程.浙江大學(xué) 2016
本文編號:3407523
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3407523.html
最近更新
教材專著