基于大數(shù)據(jù)分析的寬帶家庭畫像研究與應(yīng)用
發(fā)布時(shí)間:2023-11-18 10:19
隨著網(wǎng)絡(luò)環(huán)境不斷完善、網(wǎng)絡(luò)功能愈發(fā)強(qiáng)大,越來(lái)越多的智能設(shè)備進(jìn)入互聯(lián)網(wǎng)家庭。如何更好的了解用戶,提升用戶體驗(yàn)成為互聯(lián)網(wǎng)服務(wù)領(lǐng)域中最重要的課題。海量的家庭網(wǎng)絡(luò)用戶數(shù)據(jù)為運(yùn)營(yíng)商、電子商務(wù)平臺(tái)提供了豐富的素材,如何利用好這些數(shù)據(jù)成為研究者關(guān)注的熱點(diǎn),研究家庭下的用戶畫像便是其中之一。隨著互聯(lián)網(wǎng)用戶規(guī)模及電子商務(wù)市場(chǎng)的不斷擴(kuò)大,提升電商平臺(tái)的競(jìng)爭(zhēng)力,僅僅研究用戶的個(gè)人行為是遠(yuǎn)遠(yuǎn)不夠的。本文采用DPI深度報(bào)文檢測(cè)技術(shù)對(duì)運(yùn)營(yíng)商寬帶賬號(hào)下家庭用戶的所有網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行采集、清洗、提取和分析,利用DBSCAN算法快速、準(zhǔn)確的識(shí)別出家庭賬號(hào)下的真實(shí)用戶、用戶訪問(wèn)的URL、終端信息等。通過(guò)對(duì)電子商務(wù)網(wǎng)站側(cè)用戶最終的實(shí)際購(gòu)物數(shù)據(jù)進(jìn)行采集和研究,提出了家庭畫像構(gòu)建的研究策略。通過(guò)計(jì)算用戶標(biāo)簽權(quán)重,完善用戶信息,構(gòu)建家庭寬帶下的用戶畫像。以用戶畫像為基礎(chǔ),考慮家庭中用戶間的相互影響,設(shè)定不同的閾值獲取家庭用戶的實(shí)時(shí)興趣集,結(jié)合家庭實(shí)際網(wǎng)絡(luò)消費(fèi)數(shù)據(jù),利用貝葉斯動(dòng)態(tài)模型預(yù)測(cè)家庭潛在興趣集,最終采用多元線性回歸方程將兩者統(tǒng)一,構(gòu)建較為全面、準(zhǔn)確的家庭畫像。在家庭畫像的基礎(chǔ)上,利用組合加權(quán)算法獲取相似行為偏好的家庭和相似...
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和研究意義
1.2 國(guó)內(nèi)外研究及應(yīng)用現(xiàn)狀
1.3 論文的主要研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 論文的章節(jié)安排
1.5 本章小結(jié)
第二章 相關(guān)知識(shí)介紹
2.1 深度包解析概述
2.1.1 DPI與傳統(tǒng)數(shù)據(jù)包檢測(cè)技術(shù)
2.1.2 DPI技術(shù)分類
2.2 Hadoop大數(shù)據(jù)分析
2.2.1 HDFS分布式文件系統(tǒng)
2.2.2 MapReduce并行計(jì)算框架
2.2.3 Hive數(shù)據(jù)倉(cāng)庫(kù)模型
2.3 文本挖掘技術(shù)
2.4 家庭畫像
2.4.1 用戶畫像概述
2.4.2 用戶行為分析
2.4.3 用戶標(biāo)簽
2.4.4 家庭畫像概述
2.5 本章小結(jié)
第三章 基于DPI和大數(shù)據(jù)的家庭用戶行為分析
3.1 概述
3.2 數(shù)據(jù)流量采集模塊
3.3 DPI數(shù)據(jù)清洗模塊
3.4 數(shù)據(jù)提取模塊
3.5 數(shù)據(jù)分析模塊
3.6 實(shí)驗(yàn)驗(yàn)證與分析
3.6.1 實(shí)驗(yàn)環(huán)境
3.6.2 實(shí)驗(yàn)結(jié)果
3.7 本章小結(jié)
第四章 基于貝葉斯動(dòng)態(tài)預(yù)測(cè)模型的家庭畫像構(gòu)建
4.1 用戶畫像構(gòu)建
4.1.1 用戶標(biāo)簽化
4.1.2 計(jì)算標(biāo)簽權(quán)重
4.1.3 用戶畫像實(shí)驗(yàn)評(píng)估
4.2 家庭畫像
4.2.1 家庭畫像實(shí)時(shí)興趣集
4.2.2 基于貝葉斯動(dòng)態(tài)模型預(yù)測(cè)家庭畫像潛在興趣集
4.2.3 構(gòu)建家庭畫像
4.3 本章小結(jié)
第五章 基于家庭畫像推薦系統(tǒng)的應(yīng)用
5.1 推薦系統(tǒng)測(cè)試平臺(tái)搭建
5.1.1 廣告推薦平臺(tái)
5.1.2 管理平臺(tái)
5.1.3 第三方統(tǒng)計(jì)平臺(tái)
5.2 利用組合加權(quán)推薦算法的個(gè)性化推薦
5.3 推薦效果
5.4 數(shù)據(jù)分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來(lái)展望
參考文獻(xiàn)
致謝
攻讀碩士期間取得的成果
本文編號(hào):3865090
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景和研究意義
1.2 國(guó)內(nèi)外研究及應(yīng)用現(xiàn)狀
1.3 論文的主要研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 論文的章節(jié)安排
1.5 本章小結(jié)
第二章 相關(guān)知識(shí)介紹
2.1 深度包解析概述
2.1.1 DPI與傳統(tǒng)數(shù)據(jù)包檢測(cè)技術(shù)
2.1.2 DPI技術(shù)分類
2.2 Hadoop大數(shù)據(jù)分析
2.2.1 HDFS分布式文件系統(tǒng)
2.2.2 MapReduce并行計(jì)算框架
2.2.3 Hive數(shù)據(jù)倉(cāng)庫(kù)模型
2.3 文本挖掘技術(shù)
2.4 家庭畫像
2.4.1 用戶畫像概述
2.4.2 用戶行為分析
2.4.3 用戶標(biāo)簽
2.4.4 家庭畫像概述
2.5 本章小結(jié)
第三章 基于DPI和大數(shù)據(jù)的家庭用戶行為分析
3.1 概述
3.2 數(shù)據(jù)流量采集模塊
3.3 DPI數(shù)據(jù)清洗模塊
3.4 數(shù)據(jù)提取模塊
3.5 數(shù)據(jù)分析模塊
3.6 實(shí)驗(yàn)驗(yàn)證與分析
3.6.1 實(shí)驗(yàn)環(huán)境
3.6.2 實(shí)驗(yàn)結(jié)果
3.7 本章小結(jié)
第四章 基于貝葉斯動(dòng)態(tài)預(yù)測(cè)模型的家庭畫像構(gòu)建
4.1 用戶畫像構(gòu)建
4.1.1 用戶標(biāo)簽化
4.1.2 計(jì)算標(biāo)簽權(quán)重
4.1.3 用戶畫像實(shí)驗(yàn)評(píng)估
4.2 家庭畫像
4.2.1 家庭畫像實(shí)時(shí)興趣集
4.2.2 基于貝葉斯動(dòng)態(tài)模型預(yù)測(cè)家庭畫像潛在興趣集
4.2.3 構(gòu)建家庭畫像
4.3 本章小結(jié)
第五章 基于家庭畫像推薦系統(tǒng)的應(yīng)用
5.1 推薦系統(tǒng)測(cè)試平臺(tái)搭建
5.1.1 廣告推薦平臺(tái)
5.1.2 管理平臺(tái)
5.1.3 第三方統(tǒng)計(jì)平臺(tái)
5.2 利用組合加權(quán)推薦算法的個(gè)性化推薦
5.3 推薦效果
5.4 數(shù)據(jù)分析
5.5 本章小結(jié)
第六章 總結(jié)與展望
6.1 全文總結(jié)
6.2 未來(lái)展望
參考文獻(xiàn)
致謝
攻讀碩士期間取得的成果
本文編號(hào):3865090
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/3865090.html
最近更新
教材專著