大數(shù)據(jù)下基于信息流的手機(jī)短信種子用戶快速識(shí)別
發(fā)布時(shí)間:2017-12-11 03:04
本文關(guān)鍵詞:大數(shù)據(jù)下基于信息流的手機(jī)短信種子用戶快速識(shí)別
更多相關(guān)文章: 大數(shù)據(jù) 種子用戶 信息流 信息流濃度 樹(shù)狀評(píng)價(jià)模型
【摘要】:對(duì)于信息種子用戶的識(shí)別在通訊發(fā)達(dá)的今天具有較為重要的意義,在某些關(guān)鍵的時(shí)刻這些種子用戶可以發(fā)揮很大的作用.將大數(shù)據(jù)的處理思維應(yīng)用到種子用戶的識(shí)別中,與傳統(tǒng)方法相比能更快更好地得到結(jié)果.本文開(kāi)篇介紹了電信業(yè)務(wù)以及短信種子用戶的相關(guān)背景,大數(shù)據(jù)的定義,大數(shù)據(jù)的各種特征以及應(yīng)用價(jià)值.接著介紹了關(guān)于密度聚類(lèi)方式和關(guān)于遞歸搜尋方式的樹(shù)形網(wǎng)絡(luò)結(jié)構(gòu)用來(lái)識(shí)別種子用戶,然后做了實(shí)證分析.由于關(guān)于密度聚類(lèi)算法和關(guān)于遞歸搜索算法的樹(shù)形網(wǎng)絡(luò)處理時(shí)間太長(zhǎng)并且在數(shù)據(jù)量達(dá)到大數(shù)據(jù)的標(biāo)準(zhǔn)時(shí)已經(jīng)無(wú)法處理,所以在第四章是在對(duì)如何構(gòu)建樹(shù)狀模型進(jìn)行的改進(jìn)和提升,先分析了影響用戶成為種子用戶的兩大因素:時(shí)間優(yōu)先和屬性特征,以及種子信息傳播的兩大特征:傳播時(shí)差和方向性.因此,本文針對(duì)上述兩點(diǎn)提出了一種可以迅速創(chuàng)建樹(shù)形網(wǎng)絡(luò)結(jié)構(gòu),并快速地尋找出種子用戶的方法.首先,應(yīng)對(duì)數(shù)據(jù)進(jìn)行清洗和數(shù)據(jù)處理,大數(shù)據(jù)的處理和清洗的典型方法有,基于函數(shù)依賴及卲含依賴的方法,基于用戶自定義約束條件的方法,基于統(tǒng)計(jì)學(xué)習(xí)的方法和基于因果關(guān)系的方法.針對(duì)種子用戶本文選擇了較為靈活的基于用戶自定義約束條件的方法來(lái)對(duì)數(shù)據(jù)進(jìn)行即先將用戶按屬性特征,也就是按照行業(yè)屬性將其分到不同的組中,通過(guò)分析計(jì)算所有組之間的短信流通關(guān)系和傳播時(shí)差來(lái)整理出信息流動(dòng)的方向,即方向性.從而逐步縮小了搜索范圍,也就是只看處于源頭位置的組,再通過(guò)閥值篩出選備選的種子用戶,然后驗(yàn)證備選種子用戶,設(shè)計(jì)合理的種子用戶的評(píng)價(jià)體系,即樹(shù)狀評(píng)價(jià)模型,將備選種子用戶代入評(píng)價(jià)模型算出的最后得分確定出種子用戶.最后,通過(guò)兩個(gè)模型的對(duì)比,可以得到改進(jìn)后的基于信息流模型優(yōu)于樹(shù)形網(wǎng)絡(luò)模型.
【學(xué)位授予單位】:四川師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:F626
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 黃曉斌;鐘輝新;;基于大數(shù)據(jù)的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)模型構(gòu)建[J];情報(bào)雜志;2013年03期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 吳暴;基于Web的短信平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2014年
2 李兵昌;短信種子用戶識(shí)別的研究[D];華南理工大學(xué);2013年
,本文編號(hào):1276890
本文鏈接:http://sikaile.net/jingjilunwen/xxjj/1276890.html
最近更新
教材專(zhuān)著