基于Hadoop的搜索引擎用戶行為分析.pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:基于Hadoop的搜索引擎用戶行為分析,,由筆耕文化傳播整理發(fā)布。
文檔介紹:
?CN43?1258/TP?ISSN1007?130X????PUTERENGINEERING&SCIENCE2011年第33卷第4期??Vol?33,No?4,2011?文章編號:1007?130X(2011)04?0115?06基于Hadoop的搜索引擎用戶行為分析*AnAnalysisoftheSearchEngineUserBehaviorsBasedonHadoop王振宇1,郭?力2WANGZhen?yu1,GUOLi2(1.華南理工大學(xué)軟件學(xué)院,廣東廣州510006;2.華南理工大學(xué)計算機(jī)科學(xué)與工程學(xué)院,廣東廣州510006)(1.SchoolofSoftwareEngineering,SouthChinaUniversityofTechnology,Guangzhou510006;(2.puterScienceandEngineering,SouthChinaUniversityofTechnology,Guangzhou510006,China)摘?要:搜索引擎用戶行為分析是網(wǎng)絡(luò)信息檢索技術(shù)的研究熱點(diǎn)。通過分析用戶點(diǎn)擊行為,利用Web數(shù)據(jù)挖掘技術(shù)獲取有用信息,提高搜索引擎的檢索算法和檢索服務(wù)的效率,把用戶從大量無序的搜索結(jié)果中解放出來。本文針對傳統(tǒng)并行計算模型在易擴(kuò)展和易編程方面遇到的瓶頸,給出一種基于Ha?doop的海量日志數(shù)據(jù)處理模型,通過基于Hadoop的分布式文件系統(tǒng)HDFS與MapReduce并行計算模型提高系統(tǒng)擴(kuò)展性和易編程性,并應(yīng)用該模型分析了Sogou搜索引擎一個月內(nèi)約2200萬條查詢?nèi)罩?分析結(jié)果對于掌握用戶搜索行為,評測及改進(jìn)搜索引擎檢索、排序算法等均有較好的指導(dǎo)意...
內(nèi)容來自轉(zhuǎn)載請標(biāo)明出處.
本文關(guān)鍵詞:基于Hadoop的搜索引擎用戶行為分析,由筆耕文化傳播整理發(fā)布。
本文編號:160604
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/160604.html