基于Hadoop的搜索引擎用戶行為分析.pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:基于Hadoop的搜索引擎用戶行為分析,,由筆耕文化傳播整理發(fā)布。
文檔介紹:
?CN43?1258/TP?ISSN1007?130X????PUTERENGINEERING&SCIENCE2011年第33卷第4期??Vol?33,No?4,2011?文章編號(hào):1007?130X(2011)04?0115?06基于Hadoop的搜索引擎用戶行為分析*AnAnalysisoftheSearchEngineUserBehaviorsBasedonHadoop王振宇1,郭?力2WANGZhen?yu1,GUOLi2(1.華南理工大學(xué)軟件學(xué)院,廣東廣州510006;2.華南理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,廣東廣州510006)(1.SchoolofSoftwareEngineering,SouthChinaUniversityofTechnology,Guangzhou510006;(2.puterScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006,China)摘?要:搜索引擎用戶行為分析是網(wǎng)絡(luò)信息檢索技術(shù)的研究熱點(diǎn)。通過(guò)分析用戶點(diǎn)擊行為,利用Web數(shù)據(jù)挖掘技術(shù)獲取有用信息,提高搜索引擎的檢索算法和檢索服務(wù)的效率,把用戶從大量無(wú)序的搜索結(jié)果中解放出來(lái)。本文針對(duì)傳統(tǒng)并行計(jì)算模型在易擴(kuò)展和易編程方面遇到的瓶頸,給出一種基于Ha?doop的海量日志數(shù)據(jù)處理模型,通過(guò)基于Hadoop的分布式文件系統(tǒng)HDFS與MapReduce并行計(jì)算模型提高系統(tǒng)擴(kuò)展性和易編程性,并應(yīng)用該模型分析了Sogou搜索引擎一個(gè)月內(nèi)約2200萬(wàn)條查詢?nèi)罩?分析結(jié)果對(duì)于掌握用戶搜索行為,評(píng)測(cè)及改進(jìn)搜索引擎檢索、排序算法等均有較好的指導(dǎo)意...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:基于Hadoop的搜索引擎用戶行為分析,由筆耕文化傳播整理發(fā)布。
本文編號(hào):160604
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/160604.html