用戶畫像在內(nèi)容推送的研究與應用
本文選題:移動數(shù)據(jù) + 用戶畫像; 參考:《北方工業(yè)大學》2017年碩士論文
【摘要】:在大數(shù)據(jù)時代,移動用戶如何從海量信息中尋找自己感興趣的內(nèi)容服務,以及內(nèi)容服務提供者如何定位用戶群體,更好的為用戶提供服務,顯得尤為困難。為解決此問題,本課題要實現(xiàn)一個能夠自動為用戶提供個性化內(nèi)容推送服務的子系統(tǒng)。課題首先通過用戶安裝的App軟件,來采集移動用戶產(chǎn)生的數(shù)據(jù)即移動數(shù)據(jù),并根據(jù)數(shù)據(jù)是否動態(tài)變化,將其分為靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù),靜態(tài)數(shù)據(jù)即為用戶的基本信息;動態(tài)數(shù)據(jù)即移動用戶的行為數(shù)據(jù):興趣愛好數(shù)據(jù),移動應用App數(shù)據(jù),位置數(shù)據(jù)、使用智能終端數(shù)據(jù)等,并根據(jù)不同的數(shù)據(jù)類型,以樹形結(jié)構構建不同的標簽庫。后臺系統(tǒng)再通過編輯不同的內(nèi)容,然后將內(nèi)容組織成為有意義的內(nèi)容服務,并映射到相應的標簽下,從而形成內(nèi)容庫。在標簽體系和內(nèi)容庫的基礎上,以用戶為中心,根據(jù)人的日;顒右(guī)律,將一天分成八個不同的時間段,如上班時間、午餐時間、休息時間等,然后統(tǒng)計各個時間段用戶的興趣標簽數(shù),并針對不同的數(shù)據(jù)類型采用不同的計算權重方法。興趣愛好數(shù)據(jù),采用自定義公式計算;移動應用App數(shù)據(jù),采用改進的TF-IDF(term frequency-inverse document frequency)算法計算;位置數(shù)據(jù)、使用智能終端數(shù)據(jù)采用統(tǒng)計學方法計算;將計算之后的值作為權重,值越大,說明用戶對該標簽的喜好程度越大,然后經(jīng)過排序,選取Top-N的標簽,作為用戶個體畫像。在用戶畫像結(jié)果的基礎上,通過分類算法,預測不同性別、不同年齡的用戶在不同時間情景下的興趣愛好。課題研究了傳統(tǒng)的KNN(K-Nearest)、以及SVM(Support Vector Machine)、BP(Backpropagation)神經(jīng)網(wǎng)絡、DNN(Deep Natural Network)幾種算法的使用,并在Iris數(shù)據(jù)集和課題數(shù)據(jù)集進行了實驗,通過比較算法的準確性和耗時,最終選取了 DNN作為課題的預測算法。最后結(jié)合用戶當前所處位置情景和時間情景,通過相應的推送算法,采用位置情景優(yōu)先,時間情景次之的策略,利用用戶畫像和預測的興趣愛好標簽,選取內(nèi)容庫中的內(nèi)容服務,自動推送給用戶。然后通過實驗證明,基于DNN的個性化推送子系統(tǒng),能夠依據(jù)用戶的位置變化和時間情景變化,提供個性化的內(nèi)容推送服務,并與傳統(tǒng)的推送服務相比,具有較好的系統(tǒng)性能。
[Abstract]:In big data era, it is very difficult for mobile users to find the content service which they are interested in from the mass information, and how to locate the user group to provide better service to the user.In order to solve this problem, we need to implement a subsystem that can automatically provide personalized content push service for users.Firstly, the App software installed by the user is used to collect the mobile data generated by the mobile user, and according to whether the data changes dynamically, it is divided into static data and dynamic data, which is the basic information of the user.Dynamic data is the behavior data of mobile users, such as interest data, mobile application App data, location data, intelligent terminal data, etc. According to different data types, different tag libraries are constructed with tree structure.By editing different content, the background system organizes the content into a meaningful content service and maps it to the corresponding label to form a content library.On the basis of tag system and content library, taking the user as the center, according to the rules of people's daily activities, the day is divided into eight different time periods, such as work time, lunch time, rest time, etc.Then, the number of interest tags of users in each time period is counted, and different weight calculation methods are adopted for different data types.Interest data is calculated by custom formula; mobile application App data is calculated using improved TF-IDF(term frequency-inverse document frequency algorithm; position data is calculated by statistical method using intelligent terminal data; the calculated value is used as weight.The larger the value, the greater the user's preference for the tag, and then the Top-N label is selected as the user's individual portrait.Based on the results of the user portrait, the authors predict the interests and interests of users of different gender and age in different time situations through the classification algorithm.In this paper, we study the use of traditional KNNN K-Nearesti and SVM(Support Vector BackPropagation (BP) neural network. Experiments are carried out on Iris data sets and subject data sets, and the accuracy and time consuming of the algorithms are compared.Finally, DNN is chosen as the prediction algorithm.Finally, combined with the current location and time situation of the user, through the corresponding push algorithm, the strategy of location first, time scenario second, user portrait and predicted interest label are used.Select the content service in the content library and push it to the user automatically.Then it is proved by experiments that the personalized push subsystem based on DNN can provide personalized content push service according to the change of user's location and time and scene, and it has better system performance than traditional push service.
【學位授予單位】:北方工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前10條
1 王慶福;;貝葉斯網(wǎng)絡在用戶興趣模型構建中的研究[J];無線互聯(lián)科技;2016年12期
2 代晨旭;周熙晨;;一種基于內(nèi)容的新聞推薦系統(tǒng)實例[J];電腦知識與技術;2015年25期
3 鄭小雪;;基于知識地圖的政府訴求文件自動推送模型研究[J];現(xiàn)代情報;2015年08期
4 孫澤軍;常新峰;;基于XMPP推送技術在移動OA中的應用研究[J];實驗室研究與探索;2015年07期
5 章少平;梁雪春;;優(yōu)化的支持向量機集成分類器在非平衡數(shù)據(jù)集分類中的應用[J];計算機應用;2015年05期
6 劉樹棟;孟祥武;;基于位置的社會化網(wǎng)絡推薦系統(tǒng)[J];計算機學報;2015年02期
7 李業(yè)根;;基于大數(shù)據(jù)的圖書館信息營銷策略[J];圖書館學刊;2014年10期
8 韓吉;周杰;杜景林;;基于Android的氣象WSN監(jiān)測系統(tǒng)設計與實現(xiàn)[J];計算機工程與設計;2014年08期
9 倪紅軍;;基于Android平臺的消息推送研究與實現(xiàn)[J];實驗室研究與探索;2014年05期
10 蔣鵬;袁嵩;;基于MQTT協(xié)議的綜合消息推送[J];現(xiàn)代計算機(專業(yè)版);2014年11期
相關碩士學位論文 前9條
1 王丹;基于主題模型的用戶畫像提取算法研究[D];北京工業(yè)大學;2016年
2 王智囊;基于用戶畫像的醫(yī)療信息精準推薦的研究[D];電子科技大學;2016年
3 李映坤;大數(shù)據(jù)背景下用戶畫像的統(tǒng)計方法實踐研究[D];首都經(jīng)濟貿(mào)易大學;2016年
4 凌燕翔;基于上下文感知的推薦系統(tǒng)的研究[D];北京郵電大學;2015年
5 張磊;基于遺忘曲線的推薦算法研究[D];安徽理工大學;2014年
6 石清超;基于XMPP推送的Android個性化信息集成系統(tǒng)的研究與實現(xiàn)[D];中國海洋大學;2013年
7 顧正敏;一種面向Android平臺的輕量級推送技術研究與應用[D];北京大學;2013年
8 李政澤;微博用戶行為分析技術的研究與實現(xiàn)[D];國防科學技術大學;2012年
9 閆樹奎;面向移動網(wǎng)絡新聞的用戶興趣提取系統(tǒng)的設計與實現(xiàn)[D];北京郵電大學;2012年
,本文編號:1742401
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1742401.html