基于海量搜索歷史數(shù)據(jù)的用戶興趣模型
本文選題:向量空間模型 + TF-IDF; 參考:《計(jì)算機(jī)應(yīng)用》2014年S2期
【摘要】:針對互聯(lián)網(wǎng)搜索引擎環(huán)境中,基于海量搜索歷史數(shù)據(jù)分析用戶興趣的問題,提出一種改進(jìn)的用戶興趣模型。該模型根據(jù)用戶搜索的歷史數(shù)據(jù),結(jié)合向量空間模型(VSM)和TF-IDF算法,遞歸地回溯出用戶興趣權(quán)重列表。為解決用戶興趣變化和時(shí)間性能的問題,該模型引入時(shí)間遺忘機(jī)制進(jìn)行動態(tài)更新,并在Hadoop分布式系統(tǒng)架構(gòu)下利用Map Reduce分布式編程模型進(jìn)行實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的用戶興趣模型的查準(zhǔn)率和召回率都能達(dá)到50%,具有較好的可行性和可用性。
[Abstract]:To solve the problem of analyzing users' interest based on massive search history data in Internet search engine environment, an improved user interest model is proposed. Based on the historical data of user search and the combination of vector space model (VSM) and TF-IDF algorithm, the model recursively traces the list of user interest weights. In order to solve the problem of user interest change and time performance, the model introduces the time forgetting mechanism to update dynamically, and is implemented under Hadoop distributed system architecture using Map reduce distributed programming model. The experimental results show that the precision and recall rate of the improved user interest model can reach 50%, which has good feasibility and availability.
【作者單位】: 東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:東華大學(xué)勵(lì)志計(jì)劃項(xiàng)目(B201312)
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 郝水龍;吳共慶;胡學(xué)鋼;;基于層次向量空間模型的用戶興趣表示及更新[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年02期
2 宋艷娟;陳振標(biāo);;個(gè)性化檢索系統(tǒng)中用戶興趣模型的研究[J];計(jì)算機(jī)與數(shù)字工程;2013年02期
3 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國內(nèi)用戶興趣建模研究進(jìn)展[J];情報(bào)雜志;2013年05期
4 蔣萍,崔志明;智能搜索引擎中用戶興趣模型分析與研究[J];微電子學(xué)與計(jì)算機(jī);2004年11期
5 劉忠寶;趙文娟;;個(gè)性化搜索引擎中用戶興趣模型的構(gòu)建方法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年11期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭力軍;朱群雄;;基于RSS數(shù)據(jù)源的用戶興趣模型改進(jìn)及應(yīng)用[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
2 胡國忠;;對信息檢索系統(tǒng)應(yīng)用技術(shù)的數(shù)學(xué)表示模型的分析[J];長沙航空職業(yè)技術(shù)學(xué)院學(xué)報(bào);2005年04期
3 徐麟軍;吳飛;李伐;;學(xué)習(xí)資源個(gè)性化檢索系統(tǒng)中用戶興趣建模研究[J];電腦知識與技術(shù);2008年26期
4 范玉全;陳躍新;;基于本體的用戶興趣模型的更新方法[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2013年07期
5 侯青;徐家喜;吉力;;基于Hadoop的校園教育資源管理系統(tǒng)[J];電腦知識與技術(shù);2014年01期
6 吳飛;吳兵;申志斌;;新一代網(wǎng)絡(luò)教學(xué)平臺特征和技術(shù)難點(diǎn)的分析與探討[J];開放教育研究;2009年01期
7 張堅(jiān);;Web挖掘個(gè)性化模型研究[J];計(jì)算機(jī)與信息技術(shù);2006年Z1期
8 劉靜;李華亮;;個(gè)性化搜索引擎中興趣學(xué)習(xí)方法的研究[J];計(jì)算機(jī)時(shí)代;2009年11期
9 陳晨;李敏波;;基于本地插件的個(gè)性化搜索研究[J];計(jì)算機(jī)應(yīng)用與軟件;2011年05期
10 郭力軍;;RSS個(gè)性化信息服務(wù)的用戶興趣模型實(shí)現(xiàn)與應(yīng)用[J];計(jì)算機(jī)與現(xiàn)代化;2010年08期
相關(guān)會議論文 前2條
1 朱廣飛;董超;王衡;汪國平;;照片標(biāo)簽的智能化管理[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
2 吳曉;李丹寧;林潔;冀肖榆;李丹;;個(gè)性化搜索引擎中用戶興趣模型的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前3條
1 李強(qiáng);基于本體論的個(gè)性化和社會化元搜索引擎的研究[D];浙江大學(xué);2006年
2 顏端武;面向知識服務(wù)的智能推薦系統(tǒng)研究[D];南京理工大學(xué);2007年
3 劉煒;智能元搜索引擎中個(gè)性化模式庫的研究[D];太原理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 周志輝;基于用戶興趣模型的個(gè)性化搜索引擎研究與分析[D];江西理工大學(xué);2010年
2 趙全東;農(nóng)業(yè)智能問答系統(tǒng)中的用戶偏好研究[D];河北農(nóng)業(yè)大學(xué);2011年
3 黃衛(wèi)平;個(gè)性化搜索引擎的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2011年
4 張艷;用戶興趣模型在RSS網(wǎng)絡(luò)信息服務(wù)中的研究[D];南京航空航天大學(xué);2011年
5 盧志翔;全文檢索系統(tǒng)研究[D];廣西大學(xué);2011年
6 于寶福;個(gè)性化醫(yī)療信息推薦系統(tǒng)的研究與實(shí)現(xiàn)[D];浙江大學(xué);2012年
7 蔣萍;基于用戶興趣挖掘的個(gè)性化模型研究與設(shè)計(jì)[D];蘇州大學(xué);2005年
8 霍長青;個(gè)性化元搜索引擎研究與設(shè)計(jì)[D];山東科技大學(xué);2006年
9 魏芳;基于貝葉斯網(wǎng)絡(luò)的用戶興趣發(fā)現(xiàn)[D];西安建筑科技大學(xué);2007年
10 劉忠寶;個(gè)性化搜索引擎的研究與實(shí)現(xiàn)[D];北京工商大學(xué);2007年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉永利;歐陽元新;聞佳;熊璋;;基于概念聚類的用戶興趣建模方法[J];北京航空航天大學(xué)學(xué)報(bào);2010年02期
2 徐麟軍;吳飛;李伐;;學(xué)習(xí)資源個(gè)性化檢索系統(tǒng)中用戶興趣建模研究[J];電腦知識與技術(shù);2008年26期
3 蔣,
本文編號:2083303
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2083303.html