基于關(guān)聯(lián)分析的用戶興趣漂移挖掘算法研究
本文關(guān)鍵詞:基于關(guān)聯(lián)分析的用戶興趣漂移挖掘算法研究
更多相關(guān)文章: 數(shù)據(jù)稀疏 興趣漂移 關(guān)聯(lián)分析 主題模型 隨機(jī)游走
【摘要】:隨著“大數(shù)據(jù)”時(shí)代的到來(lái),人們被淹沒(méi)在海量的數(shù)據(jù)中難以找到真正需求的信息,推薦系統(tǒng)能利用用戶的歷史消費(fèi)記錄挖掘用戶的潛在興趣進(jìn)而向其推送有用的信息或商品,成為當(dāng)下緩解“數(shù)據(jù)過(guò)載”的有效方法。但是傳統(tǒng)推薦方法普遍存在三個(gè)問(wèn)題:1、“數(shù)據(jù)稀疏性”問(wèn)題:一個(gè)真實(shí)的網(wǎng)站中用戶消費(fèi)歷史往往較少,難以準(zhǔn)確體現(xiàn)出用戶的真實(shí)興趣;2、用戶興趣變化難以捕獲:用戶的興趣會(huì)隨著消費(fèi)上下文環(huán)境的變化而變化,傳統(tǒng)推薦算法都基于用戶興趣穩(wěn)定的假設(shè),無(wú)法準(zhǔn)確獲取用戶的此種興趣變化;3、推薦“過(guò)擬合”問(wèn)題:推薦系統(tǒng)往往傾向于推薦類似的商品給用戶。本文旨在解決上述推薦系統(tǒng)普遍存在的三個(gè)問(wèn)題,做了以下方面的研究。第一,針對(duì)“數(shù)據(jù)稀疏性”問(wèn)題,建立基于用戶關(guān)聯(lián)的數(shù)據(jù)填充模型。首先,利用評(píng)分信息挖掘用戶之間相同的偏好并建立關(guān)聯(lián)用戶組;其次,根據(jù)關(guān)聯(lián)用戶組占有度和關(guān)聯(lián)度篩選出強(qiáng)用戶關(guān)聯(lián)組;最后,對(duì)用戶的消費(fèi)歷史進(jìn)行等時(shí)間劃分,利用強(qiáng)用戶關(guān)聯(lián)組完成對(duì)數(shù)據(jù)稀疏的時(shí)間段的填充。第二,針對(duì)用戶興趣變化難以捕獲的問(wèn)題,建立用戶興趣漂移模型。首先,利用Latent Dirichlet Allocation(LDA)對(duì)用戶的每一段時(shí)間內(nèi)的消費(fèi)歷史進(jìn)行概率主題抽取;其次,結(jié)合時(shí)間衰減函數(shù)建立用戶興趣漂移模型;最后,預(yù)測(cè)用戶下階段可能的興趣并進(jìn)行項(xiàng)目推薦。第三,針對(duì)推薦結(jié)果“過(guò)擬合”問(wèn)題,建立用戶興趣擴(kuò)展模型。首先,建立用戶之間的時(shí)序關(guān)聯(lián)圖,利用隨機(jī)游走算法挖掘用戶之間的相互影響關(guān)系,獲得對(duì)目標(biāo)用戶影響最大的近鄰集合;其次,利用同樣方法挖掘項(xiàng)目之間的相互影響關(guān)系;最后,結(jié)合基于用戶的協(xié)同過(guò)濾算法和項(xiàng)目影響權(quán)重進(jìn)行項(xiàng)目推薦。實(shí)驗(yàn)表明:為解決上述三個(gè)問(wèn)題,本文提出的算法能夠更好更好發(fā)現(xiàn)用戶的潛在興趣,推薦給用戶真正需要的信息和商品。
【學(xué)位授予單位】:中國(guó)民航大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王杰;使圖像的編輯更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 董全德;;用戶興趣遷移模式與個(gè)性化服務(wù)[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年17期
4 鄭運(yùn)剛;馬建國(guó);;基于分類的用戶興趣漂移模型[J];情報(bào)雜志;2008年01期
5 張濤;;基于瀏覽歷史的用戶興趣提取模型[J];軟件導(dǎo)刊;2009年06期
6 楊杰;陳恩紅;;面向個(gè)性化服務(wù)的用戶興趣偏移檢測(cè)及處理方法[J];電子技術(shù);2009年11期
7 陳圣兵;李龍澍;紀(jì)霞;;多層次用戶興趣模式的動(dòng)態(tài)捕捉[J];計(jì)算機(jī)工程與應(yīng)用;2009年36期
8 鄭曉健;龐淑英;何英;;一種面向主題的用戶興趣挖掘模型研究[J];昆明學(xué)院學(xué)報(bào);2010年03期
9 花青松;劉海峰;胡錚;;基于基尼系數(shù)的用戶興趣分布模式度量方法[J];計(jì)算機(jī)工程;2012年22期
10 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國(guó)內(nèi)用戶興趣建模研究進(jìn)展[J];情報(bào)雜志;2013年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前7條
1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國(guó)通信學(xué)會(huì)第六屆學(xué)術(shù)年會(huì)論文集(下)[C];2009年
2 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導(dǎo)航模型系統(tǒng)(英文)[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國(guó)第17屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2006年
4 廖祝華;劉建勛;易愛(ài)平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識(shí)別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁(yè)生命周期建模(英文)[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 中國(guó)科學(xué)院計(jì)算技術(shù)研究所 王 斌;內(nèi)容為王[N];計(jì)算機(jī)世界;2004年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 梁政;面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個(gè)性化信息推薦[D];華東師范大學(xué);2012年
3 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
4 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
5 吳麗輝;個(gè)性化的Web信息采集技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
6 謝興;社會(huì)網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
7 李東勝;基于興趣與保護(hù)隱私的在線社區(qū)推薦技術(shù)研究[D];復(fù)旦大學(xué);2012年
8 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
9 姜邵巍;基于競(jìng)爭(zhēng)關(guān)系的推薦技術(shù)研究[D];北京郵電大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陳媛媛;用戶興趣圖譜演化機(jī)制研究[D];武漢理工大學(xué);2014年
2 梁潤(rùn)庭(Runting Leung);面向微博用戶的興趣識(shí)別算法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
3 俞忻峰;新浪微博的數(shù)據(jù)采集和推薦方案研究[D];南京理工大學(xué);2015年
4 楊梅;基于樹(shù)型網(wǎng)絡(luò)的多源用戶興趣數(shù)據(jù)融合方法研究[D];四川師范大學(xué);2015年
5 石光蓮;基于形式概念分析的Folksonomy用戶興趣識(shí)別研究[D];西南大學(xué);2015年
6 湯文清;微博用戶的興趣及性格分析[D];上海大學(xué);2015年
7 梅佩;基于瀏覽內(nèi)容的用戶興趣研究[D];北京化工大學(xué);2015年
8 張少杰;基于用戶興趣的微博廣告投放系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山西大學(xué);2015年
9 黃龍偉;基于蟻群算法的WEB日志用戶興趣路徑研究[D];江西師范大學(xué);2015年
10 方正;微博短文本分析技術(shù)研究及應(yīng)用[D];電子科技大學(xué);2014年
,本文編號(hào):1295247
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1295247.html