基于日志挖掘的搜索引擎用戶行為分析
本文關(guān)鍵詞:基于日志挖掘的搜索引擎用戶行為分析,由筆耕文化傳播整理發(fā)布。
隨著網(wǎng)絡(luò)搜索用戶的大規(guī)模增加,網(wǎng)絡(luò)用戶行為分析已成為網(wǎng)絡(luò)信息檢索系統(tǒng)進行架構(gòu)分析、性能優(yōu)化和系統(tǒng)維護的重要基石,是網(wǎng)絡(luò)信息檢索和知識挖掘的重要研究領(lǐng)域之一。為更好理解網(wǎng)絡(luò)用戶的搜索行為,該文基于7.56億條真實網(wǎng)絡(luò)用戶行為日志,對用戶行為進行分析和研究。我們主要考察了用戶搜索行為中的查詢長度、查詢修改率、相關(guān)搜索點擊率、首次/最后一次點擊位置分布以及查
第 2卷 4
第 3期
中文信息學報 J OURNAL OF CH I S NF NE E I oRM ATI ON RoCES I P S NG
Vo .2,No 1 4 .3 M ay,201 0
21 0 0年 5月
文章編號:1 0 - 0 7 2 1 ) 3 0 4— 6 0 3 0 7 ( 0 0 0~ 0 90
基于日志掘的搜索引擎用戶行為分析挖 岑榮偉,奕群,敏,立云,少平劉張茹馬 (能技術(shù)與系統(tǒng)國家重點實驗室,華信息科學與技術(shù)國家實驗室 ( )清華大學計算機科學與技術(shù)系,京 1 08 )智清籌,北 0 0 4 摘要:著網(wǎng)絡(luò)搜索用戶的大規(guī)模增加,隨網(wǎng)絡(luò)用戶行為分析已成為網(wǎng)絡(luò)信息檢索系統(tǒng)進行架構(gòu)分析、能優(yōu)化和性系統(tǒng)維護的重要基石,網(wǎng)絡(luò)信息檢索和知識挖掘的重要研究領(lǐng)域之一。為更好理解網(wǎng)絡(luò)用戶的搜索行為,文是該
基于 75 . 6億條真實網(wǎng)絡(luò)用戶行為日志,用戶行為進行分析和研究。我們主要考察了用戶搜索行為中的查詢長對度、詢修改率、關(guān)搜索點擊率、次/查相首最后一次點擊位置分布以及查詢內(nèi)點擊數(shù)分布等信息。該文還基于不同 類型的查詢集合,察用戶在不同查詢需求下的行為差異性。相關(guān)分析結(jié)果對搜索引擎算法優(yōu)化和系統(tǒng)改進等都考
具有一定的參考意義。 關(guān)鍵詞:算機應(yīng)用;文信息處理;戶行為分析;索引擎;計中用搜網(wǎng)絡(luò)信息檢索 中圖分類號:TP 9 31文獻標識碼:A
S a c g n e h vo a y i s d O g M i n e r h En i e Us r Be a i r An l ssBa e n Lo ni g CEN n we,L1 Yi n,ZH A NG i Ro g i U qu M n,RU y n,M A ha p n Li u S o ig ( a e K e b a or nt li ntTe hn o n s e s,T sn St t y La or t y ofI elge c olgy a d Sy t m ighu a i a a N ton lLab a or orI o mato inc or t y f nf r in Sce e
a d Te h oo y n c n lg,De a t n fC mp trS in ea dTe h oo y,Ts g u iest p r
me to o ue ce c n c n lg i h aUnv r i n y,B in 0 0 4,Chn ) ej g 1 0 8 i ia A b t a t W ih t e gr sr c: t h owt n a ou e r h us r hi m ntofs a c e s,t h vi nayss h c e o h os m p t nt he be a ora l i asbe om ne oft e m t i ora r s ar h isu s f e c ng n s n t r s ofa c ie t e a l ss, pe f m a c ptm ia i nd s s e e e c s e or s ar h e i e i e m r h t c ur na y i ror n e o i z ton a y t m mai e nt—
n n e I i as j rae nb t no mainr tiv l n n wld ema a e n .I r e ob te n esa d a e. t s loamao rai ohif r to ere a dk o e g n g me t no d rt etru d rtn a s a c e a i r o b u e s e r h b h v o fwe s r,we a a y e b u e e a ir a e n 7 mi i n e t is o l k t r u h l g . n l z d we s r b h v o s b s d o 6 5 l o n r fc i—h o g o s l e c S v r l mp r a t a p c so s r b h vo s a e s u id,s c sq e y l n t e e a i o t n s e t fu e e a i r r t d e u h a u r e g h,r to o u r e i i g u r e o a i fq e y r f n,q e y r c m— n
me d t n a c s,frt ls l k dsrb to n ai c e s is/a tci itiuin,cik n mb ri u r o c l u e q ey,e 1 c n t .Weas n lzd tedfee c si sr a loa ay e h ifrn e nu e be a o o ifr nti or a i e dsba e e r t e y s t. The e a l s sm a e p i pr v t fe— h vir f r d fe e nf m ton n e s d on s pa
a e qu r e s s na y e y h l m o e bo h e fc tve s nd e fce c fs a c ngi s i ne sa fi in y o e r h e ne .
Ke r s o u e p l ai n;C i e e i f r to r c s i g;u e e a ira ay i;s a c n i e y wo d:c mp t r p i to a c h n s n o ma i n p o e sn s rb h v o n l ss e r h e g n;we n o~ b i f r m a i e re al ton r t jv
網(wǎng)絡(luò)用戶提供優(yōu)質(zhì)的搜索服務(wù),助用戶定位所需幫
引言 作為當前網(wǎng)絡(luò)信息檢索的主要工具,索引擎搜已成為人們訪問互聯(lián)網(wǎng)資源的有效手段。據(jù)最新 C NNI C統(tǒng)計報告顯示Ⅲ,止 2 0截 0 9年底,國網(wǎng)民中規(guī)模已達 3 8 . 4億人,中搜索引擎的使用率為其
的網(wǎng)絡(luò)目標資源,最大規(guī)模的吸引客戶使用,直是一 商用搜索引擎公司所關(guān)注的重點。網(wǎng)絡(luò)用戶行為分析是認識用戶意圖和了解用戶興趣的主要方法之 一
,
受到了研究界和產(chǎn)業(yè)界的廣泛關(guān)注,已成為網(wǎng)絡(luò) 搜索引擎日志記錄著用戶和搜索引擎交互的相
信息檢索和知識挖掘的重要研究領(lǐng)域之一。 關(guān)行為信息,是研究和分析真實網(wǎng)絡(luò)用戶行為的主
7 ., 3 3即搜索引擎用戶規(guī)模達到 2 8 . 1億。如何向 收稿日期: 0 9 0 2定稿日期: 0 0 0—7 2 0—91 2 1~ 12
基金項目:國家自然科學基金項目資助 (0 30 4 69 30 )高等學校博士學科點專項科研基金資助 (O 9O 22 O5 6 76 4,00 17; 2 OO O1 O0 ) 作者簡介:榮偉 (9 2 )男,士生,要研究方向是信息檢索,器學習;奕群 ( 9 1 )男,士,師,要研究岑 18一,博主機劉 18-,博講主 方向為信息檢索;敏 ( 9 7 )女,士,教授,,要研究方向為機器學習,息檢索。張 17一,博副主信
本文關(guān)鍵詞:基于日志挖掘的搜索引擎用戶行為分析,由筆耕文化傳播整理發(fā)布。
本文編號:90310
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/90310.html