基于電信數(shù)據(jù)的用戶內(nèi)容偏好畫(huà)像補(bǔ)全
發(fā)布時(shí)間:2020-07-05 22:30
【摘要】:用戶畫(huà)像對(duì)于電信運(yùn)營(yíng)商的營(yíng)銷(xiāo)策略決策以及用戶體驗(yàn)改進(jìn)十分重要,其中用戶的網(wǎng)絡(luò)內(nèi)容偏好是畫(huà)像的重要組成部分。在目前運(yùn)營(yíng)商利用探針(DPI)數(shù)據(jù)無(wú)法完整記錄用戶內(nèi)容偏好信息的情況下,如何利用多種電信數(shù)據(jù)對(duì)缺失的用戶內(nèi)容偏好進(jìn)行補(bǔ)全,建立完整可靠的用戶偏好畫(huà)像是一個(gè)有重要意義的研究方向。本文以補(bǔ)全用戶內(nèi)容偏好為研究目標(biāo),以多類(lèi)型電信數(shù)據(jù)集為基礎(chǔ),提出了結(jié)合偏好類(lèi)別信息的偏好補(bǔ)全模型及結(jié)合用戶特征信息的偏好補(bǔ)全模型,并對(duì)用戶內(nèi)容偏好畫(huà)像補(bǔ)全模型進(jìn)行了實(shí)現(xiàn)。1、模型設(shè)計(jì)與實(shí)現(xiàn):本文將偏好補(bǔ)全問(wèn)題與傳統(tǒng)Top-N推薦問(wèn)題相結(jié)合,并以隱因子模型為基礎(chǔ)模型,挖掘利用電信多類(lèi)型數(shù)據(jù)提出兩種算法拓展隱因子模型解決偏好補(bǔ)全問(wèn)題:(1)結(jié)合偏好類(lèi)別的偏好補(bǔ)全模型:針對(duì)數(shù)據(jù)集中的偏好信息,本文從內(nèi)容偏好分層類(lèi)別關(guān)系的角度出發(fā),對(duì)偏好間關(guān)系進(jìn)行詳細(xì)地量化定義,并基于此設(shè)計(jì)結(jié)合偏好類(lèi)別信息的設(shè)計(jì)偏好補(bǔ)全模型。(2)結(jié)合用戶特征的偏好補(bǔ)全模型:針對(duì)數(shù)據(jù)集中的用戶信息,本文通過(guò)挖掘與量化抽象出用戶特征,并在實(shí)驗(yàn)中選取高質(zhì)特征集,設(shè)計(jì)結(jié)合用戶特征的偏好補(bǔ)全模型。(3)同時(shí),針對(duì)傳統(tǒng)單機(jī)算法不能快速完成大數(shù)據(jù)量偏好任務(wù)的問(wèn)題,本文基于分布式系統(tǒng)實(shí)現(xiàn)了上述偏好補(bǔ)全算法模型,可在短時(shí)間內(nèi)完成海量電信用戶的偏好補(bǔ)全任務(wù)。2、實(shí)驗(yàn)評(píng)估與結(jié)果分析:通過(guò)在運(yùn)營(yíng)商提供的連續(xù)四個(gè)月的電信多類(lèi)型數(shù)據(jù)集進(jìn)行模型對(duì)比實(shí)驗(yàn)以及高質(zhì)特征識(shí)別,發(fā)現(xiàn)通過(guò)對(duì)電信數(shù)據(jù)的充分挖掘,本文提出的模型在偏好補(bǔ)全問(wèn)題上的效果相比基礎(chǔ)模型得到了很大提升。除此之外,本文基于模型實(shí)驗(yàn)結(jié)果對(duì)偏好關(guān)系和高質(zhì)特征進(jìn)行了深入分析。3、系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn):在以上研究的基礎(chǔ)上,本文對(duì)電信用戶內(nèi)容偏好畫(huà)像系統(tǒng)進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn)。
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:F626;TP311.13
【圖文】:
偏好補(bǔ)全效果。本文用于挖掘用戶特征信息的電信數(shù)據(jù)集包括用戶寬表逡逑(Servlnfo),用戶呼叫詳單(CDR)和深度包檢測(cè)(DPI)數(shù)據(jù)集。從這些數(shù)據(jù)逡逑集挖掘量化的電信用戶特征可以分為以下四個(gè)不同類(lèi)別,如圖1-2所示:1、從逡逑用戶寬表數(shù)據(jù)集中提取的終纟而特征(例如終4而品牌,終端EVDO標(biāo)識(shí));2、從逡逑用戶寬表數(shù)據(jù)集中提取的個(gè)人特征(例如用戶性別,用戶年齡);3、從用戶呼叫逡逑詳單數(shù)據(jù)集提取的呼叫特征(例如呼叫總時(shí)間,呼叫總頻次);4、從深度包檢測(cè)逡逑數(shù)據(jù)集提取的網(wǎng)絡(luò)特征(例如網(wǎng)絡(luò)總流量,瀏覽總頻次)。逡逑個(gè)人特征邐,^\邐終端特征逡逑m邋ttsi...邋y邐^Y^evdo,品牌...逡逑網(wǎng)絡(luò)特征入--人通話特征逡逑流量,頻次…邐時(shí)長(zhǎng)
針對(duì)第二章中提到的利用類(lèi)別信息進(jìn)行T0P-N推薦的研究中對(duì)關(guān)系沒(méi)有量逡逑化定義的問(wèn)題,本文首先將電信偏好類(lèi)別樹(shù)中的關(guān)系劃分為父子關(guān)系和兄弟關(guān)系,逡逑并按照關(guān)系類(lèi)型和關(guān)系強(qiáng)度明確對(duì)類(lèi)別關(guān)系進(jìn)行定義和量化,如圖3_2所示。逡逑第一層|邐……逡逑第二層|、包逡逑第三層|女士服裝男士服裝邐籃辭邐^球逡逑4?費(fèi)邐/\邐Yi逡逑4邐邐/邐\逡逑第四展邋NBA邐CBA逡逑畫(huà)邐C3I\逡逑^邐I?兄弟至累逡逑廠繼承關(guān)系邐廠合作關(guān)系逡逑廠類(lèi)型邋<丨邐廠類(lèi)型j無(wú)關(guān)關(guān)系逡逑父子關(guān)系<邐1邋一無(wú)關(guān)關(guān)系邐兄弟關(guān)系邋<邐匕競(jìng)爭(zhēng)關(guān)系逡逑邐I-強(qiáng)度[0,1]邐邋I強(qiáng)度【0,1]邐逡逑■p^i'邐|社交軟件1逡逑[類(lèi)型承
本文編號(hào):2743217
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:F626;TP311.13
【圖文】:
偏好補(bǔ)全效果。本文用于挖掘用戶特征信息的電信數(shù)據(jù)集包括用戶寬表逡逑(Servlnfo),用戶呼叫詳單(CDR)和深度包檢測(cè)(DPI)數(shù)據(jù)集。從這些數(shù)據(jù)逡逑集挖掘量化的電信用戶特征可以分為以下四個(gè)不同類(lèi)別,如圖1-2所示:1、從逡逑用戶寬表數(shù)據(jù)集中提取的終纟而特征(例如終4而品牌,終端EVDO標(biāo)識(shí));2、從逡逑用戶寬表數(shù)據(jù)集中提取的個(gè)人特征(例如用戶性別,用戶年齡);3、從用戶呼叫逡逑詳單數(shù)據(jù)集提取的呼叫特征(例如呼叫總時(shí)間,呼叫總頻次);4、從深度包檢測(cè)逡逑數(shù)據(jù)集提取的網(wǎng)絡(luò)特征(例如網(wǎng)絡(luò)總流量,瀏覽總頻次)。逡逑個(gè)人特征邐,^\邐終端特征逡逑m邋ttsi...邋y邐^Y^evdo,品牌...逡逑網(wǎng)絡(luò)特征入--人通話特征逡逑流量,頻次…邐時(shí)長(zhǎng)
針對(duì)第二章中提到的利用類(lèi)別信息進(jìn)行T0P-N推薦的研究中對(duì)關(guān)系沒(méi)有量逡逑化定義的問(wèn)題,本文首先將電信偏好類(lèi)別樹(shù)中的關(guān)系劃分為父子關(guān)系和兄弟關(guān)系,逡逑并按照關(guān)系類(lèi)型和關(guān)系強(qiáng)度明確對(duì)類(lèi)別關(guān)系進(jìn)行定義和量化,如圖3_2所示。逡逑第一層|邐……逡逑第二層|、包逡逑第三層|女士服裝男士服裝邐籃辭邐^球逡逑4?費(fèi)邐/\邐Yi逡逑4邐邐/邐\逡逑第四展邋NBA邐CBA逡逑畫(huà)邐C3I\逡逑^邐I?兄弟至累逡逑廠繼承關(guān)系邐廠合作關(guān)系逡逑廠類(lèi)型邋<丨邐廠類(lèi)型j無(wú)關(guān)關(guān)系逡逑父子關(guān)系<邐1邋一無(wú)關(guān)關(guān)系邐兄弟關(guān)系邋<邐匕競(jìng)爭(zhēng)關(guān)系逡逑邐I-強(qiáng)度[0,1]邐邋I強(qiáng)度【0,1]邐逡逑■p^i'邐|社交軟件1逡逑[類(lèi)型承
本文編號(hào):2743217
本文鏈接:http://sikaile.net/guanlilunwen/sjfx/2743217.html
最近更新
教材專(zhuān)著