用戶畫像在內(nèi)容推送的研究與應(yīng)用
本文選題:移動(dòng)數(shù)據(jù) + 用戶畫像 ; 參考:《北方工業(yè)大學(xué)》2017年碩士論文
【摘要】:在大數(shù)據(jù)時(shí)代,移動(dòng)用戶如何從海量信息中尋找自己感興趣的內(nèi)容服務(wù),以及內(nèi)容服務(wù)提供者如何定位用戶群體,更好的為用戶提供服務(wù),顯得尤為困難。為解決此問(wèn)題,本課題要實(shí)現(xiàn)一個(gè)能夠自動(dòng)為用戶提供個(gè)性化內(nèi)容推送服務(wù)的子系統(tǒng)。課題首先通過(guò)用戶安裝的App軟件,來(lái)采集移動(dòng)用戶產(chǎn)生的數(shù)據(jù)即移動(dòng)數(shù)據(jù),并根據(jù)數(shù)據(jù)是否動(dòng)態(tài)變化,將其分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù),靜態(tài)數(shù)據(jù)即為用戶的基本信息;動(dòng)態(tài)數(shù)據(jù)即移動(dòng)用戶的行為數(shù)據(jù):興趣愛(ài)好數(shù)據(jù),移動(dòng)應(yīng)用App數(shù)據(jù),位置數(shù)據(jù)、使用智能終端數(shù)據(jù)等,并根據(jù)不同的數(shù)據(jù)類型,以樹(shù)形結(jié)構(gòu)構(gòu)建不同的標(biāo)簽庫(kù)。后臺(tái)系統(tǒng)再通過(guò)編輯不同的內(nèi)容,然后將內(nèi)容組織成為有意義的內(nèi)容服務(wù),并映射到相應(yīng)的標(biāo)簽下,從而形成內(nèi)容庫(kù)。在標(biāo)簽體系和內(nèi)容庫(kù)的基礎(chǔ)上,以用戶為中心,根據(jù)人的日;顒(dòng)規(guī)律,將一天分成八個(gè)不同的時(shí)間段,如上班時(shí)間、午餐時(shí)間、休息時(shí)間等,然后統(tǒng)計(jì)各個(gè)時(shí)間段用戶的興趣標(biāo)簽數(shù),并針對(duì)不同的數(shù)據(jù)類型采用不同的計(jì)算權(quán)重方法。興趣愛(ài)好數(shù)據(jù),采用自定義公式計(jì)算;移動(dòng)應(yīng)用App數(shù)據(jù),采用改進(jìn)的TF-IDF(term frequency-inverse document frequency)算法計(jì)算;位置數(shù)據(jù)、使用智能終端數(shù)據(jù)采用統(tǒng)計(jì)學(xué)方法計(jì)算;將計(jì)算之后的值作為權(quán)重,值越大,說(shuō)明用戶對(duì)該標(biāo)簽的喜好程度越大,然后經(jīng)過(guò)排序,選取Top-N的標(biāo)簽,作為用戶個(gè)體畫像。在用戶畫像結(jié)果的基礎(chǔ)上,通過(guò)分類算法,預(yù)測(cè)不同性別、不同年齡的用戶在不同時(shí)間情景下的興趣愛(ài)好。課題研究了傳統(tǒng)的KNN(K-Nearest)、以及SVM(Support Vector Machine)、BP(Backpropagation)神經(jīng)網(wǎng)絡(luò)、DNN(Deep Natural Network)幾種算法的使用,并在Iris數(shù)據(jù)集和課題數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),通過(guò)比較算法的準(zhǔn)確性和耗時(shí),最終選取了 DNN作為課題的預(yù)測(cè)算法。最后結(jié)合用戶當(dāng)前所處位置情景和時(shí)間情景,通過(guò)相應(yīng)的推送算法,采用位置情景優(yōu)先,時(shí)間情景次之的策略,利用用戶畫像和預(yù)測(cè)的興趣愛(ài)好標(biāo)簽,選取內(nèi)容庫(kù)中的內(nèi)容服務(wù),自動(dòng)推送給用戶。然后通過(guò)實(shí)驗(yàn)證明,基于DNN的個(gè)性化推送子系統(tǒng),能夠依據(jù)用戶的位置變化和時(shí)間情景變化,提供個(gè)性化的內(nèi)容推送服務(wù),并與傳統(tǒng)的推送服務(wù)相比,具有較好的系統(tǒng)性能。
[Abstract]:In big data era, it is very difficult for mobile users to find the content service which they are interested in from the mass information, and how to locate the user group to provide better service to the user.In order to solve this problem, we need to implement a subsystem that can automatically provide personalized content push service for users.Firstly, the App software installed by the user is used to collect the mobile data generated by the mobile user, and according to whether the data changes dynamically, it is divided into static data and dynamic data, which is the basic information of the user.Dynamic data is the behavior data of mobile users, such as interest data, mobile application App data, location data, intelligent terminal data, etc. According to different data types, different tag libraries are constructed with tree structure.By editing different content, the background system organizes the content into a meaningful content service and maps it to the corresponding label to form a content library.On the basis of tag system and content library, taking the user as the center, according to the rules of people's daily activities, the day is divided into eight different time periods, such as work time, lunch time, rest time, etc.Then, the number of interest tags of users in each time period is counted, and different weight calculation methods are adopted for different data types.Interest data is calculated by custom formula; mobile application App data is calculated using improved TF-IDF(term frequency-inverse document frequency algorithm; position data is calculated by statistical method using intelligent terminal data; the calculated value is used as weight.The larger the value, the greater the user's preference for the tag, and then the Top-N label is selected as the user's individual portrait.Based on the results of the user portrait, the authors predict the interests and interests of users of different gender and age in different time situations through the classification algorithm.In this paper, we study the use of traditional KNNN K-Nearesti and SVM(Support Vector BackPropagation (BP) neural network. Experiments are carried out on Iris data sets and subject data sets, and the accuracy and time consuming of the algorithms are compared.Finally, DNN is chosen as the prediction algorithm.Finally, combined with the current location and time situation of the user, through the corresponding push algorithm, the strategy of location first, time scenario second, user portrait and predicted interest label are used.Select the content service in the content library and push it to the user automatically.Then it is proved by experiments that the personalized push subsystem based on DNN can provide personalized content push service according to the change of user's location and time and scene, and it has better system performance than traditional push service.
【學(xué)位授予單位】:北方工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王慶福;;貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究[J];無(wú)線互聯(lián)科技;2016年12期
2 代晨旭;周熙晨;;一種基于內(nèi)容的新聞推薦系統(tǒng)實(shí)例[J];電腦知識(shí)與技術(shù);2015年25期
3 鄭小雪;;基于知識(shí)地圖的政府訴求文件自動(dòng)推送模型研究[J];現(xiàn)代情報(bào);2015年08期
4 孫澤軍;常新峰;;基于XMPP推送技術(shù)在移動(dòng)OA中的應(yīng)用研究[J];實(shí)驗(yàn)室研究與探索;2015年07期
5 章少平;梁雪春;;優(yōu)化的支持向量機(jī)集成分類器在非平衡數(shù)據(jù)集分類中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2015年05期
6 劉樹(shù)棟;孟祥武;;基于位置的社會(huì)化網(wǎng)絡(luò)推薦系統(tǒng)[J];計(jì)算機(jī)學(xué)報(bào);2015年02期
7 李業(yè)根;;基于大數(shù)據(jù)的圖書館信息營(yíng)銷策略[J];圖書館學(xué)刊;2014年10期
8 韓吉;周杰;杜景林;;基于Android的氣象WSN監(jiān)測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年08期
9 倪紅軍;;基于Android平臺(tái)的消息推送研究與實(shí)現(xiàn)[J];實(shí)驗(yàn)室研究與探索;2014年05期
10 蔣鵬;袁嵩;;基于MQTT協(xié)議的綜合消息推送[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2014年11期
相關(guān)碩士學(xué)位論文 前9條
1 王丹;基于主題模型的用戶畫像提取算法研究[D];北京工業(yè)大學(xué);2016年
2 王智囊;基于用戶畫像的醫(yī)療信息精準(zhǔn)推薦的研究[D];電子科技大學(xué);2016年
3 李映坤;大數(shù)據(jù)背景下用戶畫像的統(tǒng)計(jì)方法實(shí)踐研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2016年
4 凌燕翔;基于上下文感知的推薦系統(tǒng)的研究[D];北京郵電大學(xué);2015年
5 張磊;基于遺忘曲線的推薦算法研究[D];安徽理工大學(xué);2014年
6 石清超;基于XMPP推送的Android個(gè)性化信息集成系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)海洋大學(xué);2013年
7 顧正敏;一種面向Android平臺(tái)的輕量級(jí)推送技術(shù)研究與應(yīng)用[D];北京大學(xué);2013年
8 李政澤;微博用戶行為分析技術(shù)的研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2012年
9 閆樹(shù)奎;面向移動(dòng)網(wǎng)絡(luò)新聞的用戶興趣提取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
,本文編號(hào):1742401
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1742401.html