基于手機應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測
發(fā)布時間:2017-04-26 08:04
本文關(guān)鍵詞:基于手機應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測,,由筆耕文化傳播整理發(fā)布。
【摘要】:用戶基礎(chǔ)屬性信息,比如性別、年齡等,通常被認(rèn)為是用戶隱私信息,企業(yè)很難獲得,但是用戶基礎(chǔ)屬性信息在個性化服務(wù)、特定廣告投放、用戶行為分析和其他方面有著廣泛的應(yīng)用。本文針對上述問題,提出一種新穎的基于移動用戶手機應(yīng)用軟件使用日志分析用戶基礎(chǔ)屬性預(yù)測方法。首先,本文從移動用戶使用手機應(yīng)用的上網(wǎng)日志文件出發(fā),根據(jù)用戶訪問網(wǎng)頁的內(nèi)容提取頁面主題,從而得出用戶的訪問偏好和興趣主題,結(jié)合訪問記錄統(tǒng)計得出用戶訪問偏好矩陣并將用戶偏好矩陣作為用戶特征。其次結(jié)合用戶基礎(chǔ)屬性信息,分析了不同基礎(chǔ)屬性用戶群體訪問偏好特點,找出了不同基礎(chǔ)屬性用戶群體之間訪問偏好的區(qū)別。然后采用常用的四種分類預(yù)測算法作為基礎(chǔ)算法,實現(xiàn)對用戶基礎(chǔ)屬性分類預(yù)測,探索性的研究了實驗數(shù)據(jù)采集持續(xù)時間和采集樣本數(shù)量對預(yù)測結(jié)果的影響。發(fā)現(xiàn)當(dāng)實驗數(shù)據(jù)采集持續(xù)時間為8周時,四種常用的方法可以取得較穩(wěn)定的預(yù)測結(jié)果;而樣本采集數(shù)量對實驗結(jié)果影響不是很大。最后結(jié)合用戶偏好矩陣隱性反饋信息,提出基于主題和用戶的協(xié)同優(yōu)化方法。本文采用實際用戶的真實數(shù)據(jù)對方法進行驗證,實驗結(jié)果表明本文提出的預(yù)測算法在用戶性別基礎(chǔ)屬性預(yù)測中準(zhǔn)確率為81.21%,1F值為80.11%。對于用戶年齡和終端檔次多分類問題,本文提出的方法依然可以取得較好的預(yù)測結(jié)果,用戶終端檔次分類預(yù)測結(jié)果準(zhǔn)確率和1F值都高于71.82%,用戶年齡分類預(yù)測結(jié)果準(zhǔn)確率和1F值都高于64.39%。
【關(guān)鍵詞】:人口統(tǒng)計信息預(yù)測 智能手機應(yīng)用日志 用戶興趣模型 隱語義模型
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.01;TN929.5
本文關(guān)鍵詞:基于手機應(yīng)用日志的用戶基礎(chǔ)屬性預(yù)測,由筆耕文化傳播整理發(fā)布。
本文編號:328029
本文鏈接:http://sikaile.net/kejilunwen/wltx/328029.html
最近更新
教材專著