跨設(shè)備識別用戶及其行為研究
發(fā)布時間:2018-05-17 00:21
本文選題:跨設(shè)備識別用戶 + 特征空間。 參考:《西南大學(xué)》2017年碩士論文
【摘要】:隨著各種智能電子設(shè)備在人們生活中的廣泛應(yīng)用,比如智能手機,平板電腦,筆記本電腦等各種移動智能設(shè)備,人們越來越傾向于通過不同的智能設(shè)備來完成相同的任務(wù)。然而,當(dāng)用戶在不同智能設(shè)備之間來回切換完成任務(wù)的時候,他們的識別信息就會變得非常模糊,以至于難以追蹤到他們的蹤跡。廣告商希望能夠找到使用這些設(shè)備的用戶而不是設(shè)備本身,這樣便可以針對用戶所要完成的任務(wù)來做一些精準(zhǔn)營銷。因此,近些年來跨設(shè)備識別用戶逐漸成為了一個熱門的研究主題,它對于提高廣告營銷的價值以及提升用戶的體驗具有重要的意義。近些年來,很多普通的家庭或者個人都擁有多個可以連接互聯(lián)網(wǎng)的智能設(shè)備,隨著物聯(lián)網(wǎng)時代的來臨,智能設(shè)備更會呈現(xiàn)爆發(fā)式的增長。廣告公司總是希望無縫地連接到設(shè)備背后的消費者,而不是設(shè)備本身。傳統(tǒng)的辦法是利用一些確定性的特征,比如電話號碼,身份證號,電子郵箱等,這些特征需要用戶主動提供,類似于我們?nèi)粘J褂玫牡卿泿ぬ枴.?dāng)用戶在不同智能設(shè)備之間來回切換時,根據(jù)確定性特征便可以唯一確定一個用戶。然而,出于對隱私性和安全性的考慮,用戶很可能會拒絕提供他們的私人信息,這就給跨設(shè)備識別用戶帶來了很大的困難和挑戰(zhàn)。針對傳統(tǒng)跨設(shè)備識別方法的不足,近些年來已有一些學(xué)者對傳統(tǒng)方法嘗試了不同的改進,大多數(shù)研究以分析用戶行為的一致性為基礎(chǔ)。隨著機器學(xué)習(xí)的興起,一些學(xué)者提出基于概率的機器學(xué)習(xí)方法來預(yù)測用戶擁有某一智能設(shè)備的概率,很好的提升了跨設(shè)備識別的準(zhǔn)確率。然而,跨設(shè)備用戶的行為數(shù)據(jù)的規(guī)模通常是非常巨大的,而且非常稀疏,現(xiàn)有的一些研究通常都面臨著數(shù)據(jù)規(guī)模以及時間消耗的問題。本文在跨設(shè)備識別用戶的需求越來越強烈的背景下,通過分析以及處理了大量的用戶跨設(shè)備行為數(shù)據(jù),充分對比了現(xiàn)有的機器學(xué)習(xí)方法的優(yōu)缺點,并討論了時間消耗以及數(shù)據(jù)稀疏性的處理問題,提出了基于優(yōu)化提升的FFM模型,解決了跨設(shè)備識別用戶的問題。本文貢獻(xiàn)如下:1)用戶行為分析及其特征空間:對跨設(shè)備用戶行為進行了詳細(xì)的分析,并對數(shù)據(jù)進行了較完整的預(yù)處理,通過分析特征之間的關(guān)系生成了更加完整的特征。同時對數(shù)據(jù)的缺失值進行處理,進行了One-Hot編碼,數(shù)據(jù)標(biāo)準(zhǔn)化等處理,使預(yù)測結(jié)果更好。2)不同算法之間的比較:充分比較了可用于解決跨設(shè)備識別用戶問題的八種機器學(xué)習(xí)模型,比較了它們在不同數(shù)據(jù)集上的表現(xiàn),同時討論了不同模型的時間消耗問題,得到了XGBoost是較好的處理這個問題的模型的結(jié)論,并探究了XGBoost模型的最優(yōu)參數(shù)選擇問題。3)提出了基于優(yōu)化提升的FFM模型:對于大規(guī)模數(shù)據(jù)的稀疏性問題,FFM模型能較好的進行處理,我們在它的基礎(chǔ)上,根據(jù)跨設(shè)備用戶行為的地域特征,提出了基于優(yōu)化提升的FFM模型。模型不但能解決大規(guī)模數(shù)據(jù)的稀疏性問題,而且在十一種模型的對比實驗結(jié)果上表明,我們的模型具有更好的實驗結(jié)果以及更穩(wěn)定的特性,同時我們探究了模型的參數(shù)選擇最優(yōu)化問題。
[Abstract]:In recent years , many ordinary households or individuals have many kinds of smart devices that can connect the Internet . This paper discusses eight kinds of machine learning models which can be used to solve the problem of cross - device identification .
【學(xué)位授予單位】:西南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP181
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王國霞;劉賀平;;個性化推薦系統(tǒng)綜述[J];計算機工程與應(yīng)用;2012年07期
,本文編號:1899061
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/1899061.html
最近更新
教材專著