基于用戶查詢?nèi)罩镜木W(wǎng)絡搜索主題分析
本文選題:網(wǎng)絡搜索 切入點:搜索引擎 出處:《智能系統(tǒng)學報》2017年05期 論文類型:期刊論文
【摘要】:網(wǎng)絡搜索分析在優(yōu)化搜索引擎方面具有舉足輕重的作用,而且對用戶個人搜索特性進行分析能夠提高搜索引擎的精準度。目前,大多數(shù)已有模型(比如點擊圖模型及其變體),注重研究用戶群體的共同特點。然而,關于如何做到既可以獲取用戶群體共同特點又可以獲取用戶個人特點方面的研究卻非常少。本文研究了基于個人用戶網(wǎng)絡搜索分析新問題,即通過研究用戶搜索的突發(fā)性現(xiàn)象,獲取個人用戶搜索查詢的主題分布情況。提出了兩個搜索主題模型,即搜索突發(fā)性模型(SBM)和耦合敏感搜索突發(fā)性模型(CS-SBM)。SBM假設查詢詞和URL主題是無關的,CS-SBM假設查詢詞和URL之間是有主題關聯(lián)的,得到的主題分布信息存儲在偏Dirichlet先驗中,采用Beta分布刻畫用戶搜索的時間特性。實驗結果表明,每一個用戶的網(wǎng)絡搜索軌跡都有多種基于用戶的獨有特點。同時,在使用大量真實用戶查詢?nèi)罩緮?shù)據(jù)情況下,與LDA、DCMLDA、TOT相比,本文提出的模型具有明顯的泛化性能優(yōu)勢,并且有效地描繪了用戶搜索查詢主題在時間上的變化過程。
[Abstract]:Web search analysis plays an important role in optimizing search engines, and the analysis of individual search characteristics of users can improve the accuracy of search engines. Most existing models, such as click-graph models and their variants, focus on the common characteristics of the user community. However, There is very little research on how to obtain both the common characteristics of user groups and the characteristics of users. In this paper, a new problem of search analysis based on personal user network is studied, that is, by studying the sudden phenomenon of user search, To obtain the topic distribution of individual user search query. Two search topic models are proposed. That is to say, the search paroxysmal model (SBM) and the coupled sensitive search paroxysmal model (CS-SBM.SBM) assume that the query term is independent of the URL topic and that there is a thematic correlation between the query term and the URL, and the topic distribution information obtained is stored in the partial Dirichlet priori. The Beta distribution is used to describe the time characteristics of user search. The experimental results show that each user's path of network search has many unique characteristics based on users. At the same time, in the case of using a large number of real users to query log data, compared with LDA-DCMLDATOT, The model presented in this paper has obvious generalization performance advantages and effectively describes the time variation process of user search query topics.
【作者單位】: 山東財經(jīng)大學計算機科學與技術學院;香港科技大學計算機科學及工程學系;
【基金】:國家自然科學基金重點項目(U1201258) 山東省自然科學杰出青年基金項目(JQ201316) 教育部人文社會科學研究項目(15YJAZH042)
【分類號】:TP391.3
【相似文獻】
相關期刊論文 前10條
1 ;網(wǎng)絡搜索未來將出現(xiàn)三大趨勢[J];軟件世界;2009年07期
2 靳超;;網(wǎng)絡搜索技巧探究[J];青春歲月;2014年07期
3 朝云;;有圖就能挖出真“像”[J];電腦愛好者;2014年08期
4 胡恒峰;;網(wǎng)絡搜索輕松搞定[J];科學24小時;2006年10期
5 羅勇;;搜索結果提前知[J];電腦迷;2010年23期
6 凱特·雷尼;;谷歌研發(fā)部主任:網(wǎng)絡搜索走向個性化[J];科技創(chuàng)業(yè);2010年02期
7 一嘯傾城;;搜出隨心所欲[J];電腦迷;2010年06期
8 ;實用網(wǎng)絡搜索技巧[J];藍鈴(打工妹);2006年07期
9 王賀;馮譜;;一種漢語語音網(wǎng)絡搜索方法[J];山東理工大學學報(自然科學版);2007年02期
10 蝴蝶;;暑期到來 全家都會喜愛的幾種簡易工具[J];計算機與網(wǎng)絡;2013年13期
相關重要報紙文章 前2條
1 薇言;可尋性與網(wǎng)絡搜索[N];中華讀書報;2014年
2 胡紅軍;讓搜索發(fā)揮更大價值[N];經(jīng)濟日報;2009年
相關博士學位論文 前1條
1 盧萬媈;基于眼動跟蹤的網(wǎng)絡搜索行為分析與預測[D];北京理工大學;2015年
相關碩士學位論文 前10條
1 李曉榮;最大和網(wǎng)絡搜索結果多樣性問題及其貪婪策略分析[D];電子科技大學;2016年
2 國敏;基于網(wǎng)絡搜索技術的游客量預測方法研究[D];首都師范大學;2012年
3 李一寧;對等點(P2P)網(wǎng)絡搜索技術的研究[D];上海交通大學;2007年
4 肖華;個性化網(wǎng)絡搜索的研究[D];北京工業(yè)大學;2006年
5 馮明星;基于本體論和聚類的P2P網(wǎng)絡搜索方法研究[D];廣西大學;2007年
6 李銳;P2P網(wǎng)絡搜索方法的研究及在遠程考試系統(tǒng)中的應用[D];貴州大學;2007年
7 張恩會;基于JXTA的P2P網(wǎng)絡搜索技術的研究[D];沈陽工業(yè)大學;2006年
8 向陽;基于P2P網(wǎng)絡搜索機制的設計與應用[D];北京郵電大學;2009年
9 董國盛;基于查詢?nèi)罩镜挠脩舨樵円鈭D檢測[D];天津大學;2014年
10 邱鵬;基于用戶查詢行為分析的在線訂票系統(tǒng)緩存優(yōu)化策略研究[D];北京交通大學;2017年
,本文編號:1600005
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1600005.html