基于用戶查詢?nèi)罩镜木W(wǎng)絡(luò)搜索主題分析
本文選題:網(wǎng)絡(luò)搜索 切入點(diǎn):搜索引擎 出處:《智能系統(tǒng)學(xué)報(bào)》2017年05期 論文類型:期刊論文
【摘要】:網(wǎng)絡(luò)搜索分析在優(yōu)化搜索引擎方面具有舉足輕重的作用,而且對(duì)用戶個(gè)人搜索特性進(jìn)行分析能夠提高搜索引擎的精準(zhǔn)度。目前,大多數(shù)已有模型(比如點(diǎn)擊圖模型及其變體),注重研究用戶群體的共同特點(diǎn)。然而,關(guān)于如何做到既可以獲取用戶群體共同特點(diǎn)又可以獲取用戶個(gè)人特點(diǎn)方面的研究卻非常少。本文研究了基于個(gè)人用戶網(wǎng)絡(luò)搜索分析新問(wèn)題,即通過(guò)研究用戶搜索的突發(fā)性現(xiàn)象,獲取個(gè)人用戶搜索查詢的主題分布情況。提出了兩個(gè)搜索主題模型,即搜索突發(fā)性模型(SBM)和耦合敏感搜索突發(fā)性模型(CS-SBM)。SBM假設(shè)查詢?cè)~和URL主題是無(wú)關(guān)的,CS-SBM假設(shè)查詢?cè)~和URL之間是有主題關(guān)聯(lián)的,得到的主題分布信息存儲(chǔ)在偏Dirichlet先驗(yàn)中,采用Beta分布刻畫用戶搜索的時(shí)間特性。實(shí)驗(yàn)結(jié)果表明,每一個(gè)用戶的網(wǎng)絡(luò)搜索軌跡都有多種基于用戶的獨(dú)有特點(diǎn)。同時(shí),在使用大量真實(shí)用戶查詢?nèi)罩緮?shù)據(jù)情況下,與LDA、DCMLDA、TOT相比,本文提出的模型具有明顯的泛化性能優(yōu)勢(shì),并且有效地描繪了用戶搜索查詢主題在時(shí)間上的變化過(guò)程。
[Abstract]:Web search analysis plays an important role in optimizing search engines, and the analysis of individual search characteristics of users can improve the accuracy of search engines. Most existing models, such as click-graph models and their variants, focus on the common characteristics of the user community. However, There is very little research on how to obtain both the common characteristics of user groups and the characteristics of users. In this paper, a new problem of search analysis based on personal user network is studied, that is, by studying the sudden phenomenon of user search, To obtain the topic distribution of individual user search query. Two search topic models are proposed. That is to say, the search paroxysmal model (SBM) and the coupled sensitive search paroxysmal model (CS-SBM.SBM) assume that the query term is independent of the URL topic and that there is a thematic correlation between the query term and the URL, and the topic distribution information obtained is stored in the partial Dirichlet priori. The Beta distribution is used to describe the time characteristics of user search. The experimental results show that each user's path of network search has many unique characteristics based on users. At the same time, in the case of using a large number of real users to query log data, compared with LDA-DCMLDATOT, The model presented in this paper has obvious generalization performance advantages and effectively describes the time variation process of user search query topics.
【作者單位】: 山東財(cái)經(jīng)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;香港科技大學(xué)計(jì)算機(jī)科學(xué)及工程學(xué)系;
【基金】:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(U1201258) 山東省自然科學(xué)杰出青年基金項(xiàng)目(JQ201316) 教育部人文社會(huì)科學(xué)研究項(xiàng)目(15YJAZH042)
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 ;網(wǎng)絡(luò)搜索未來(lái)將出現(xiàn)三大趨勢(shì)[J];軟件世界;2009年07期
2 靳超;;網(wǎng)絡(luò)搜索技巧探究[J];青春歲月;2014年07期
3 朝云;;有圖就能挖出真“像”[J];電腦愛好者;2014年08期
4 胡恒峰;;網(wǎng)絡(luò)搜索輕松搞定[J];科學(xué)24小時(shí);2006年10期
5 羅勇;;搜索結(jié)果提前知[J];電腦迷;2010年23期
6 凱特·雷尼;;谷歌研發(fā)部主任:網(wǎng)絡(luò)搜索走向個(gè)性化[J];科技創(chuàng)業(yè);2010年02期
7 一嘯傾城;;搜出隨心所欲[J];電腦迷;2010年06期
8 ;實(shí)用網(wǎng)絡(luò)搜索技巧[J];藍(lán)鈴(打工妹);2006年07期
9 王賀;馮譜;;一種漢語(yǔ)語(yǔ)音網(wǎng)絡(luò)搜索方法[J];山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
10 蝴蝶;;暑期到來(lái) 全家都會(huì)喜愛的幾種簡(jiǎn)易工具[J];計(jì)算機(jī)與網(wǎng)絡(luò);2013年13期
相關(guān)重要報(bào)紙文章 前2條
1 薇言;可尋性與網(wǎng)絡(luò)搜索[N];中華讀書報(bào);2014年
2 胡紅軍;讓搜索發(fā)揮更大價(jià)值[N];經(jīng)濟(jì)日?qǐng)?bào);2009年
相關(guān)博士學(xué)位論文 前1條
1 盧萬(wàn)媈;基于眼動(dòng)跟蹤的網(wǎng)絡(luò)搜索行為分析與預(yù)測(cè)[D];北京理工大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 李曉榮;最大和網(wǎng)絡(luò)搜索結(jié)果多樣性問(wèn)題及其貪婪策略分析[D];電子科技大學(xué);2016年
2 國(guó)敏;基于網(wǎng)絡(luò)搜索技術(shù)的游客量預(yù)測(cè)方法研究[D];首都師范大學(xué);2012年
3 李一寧;對(duì)等點(diǎn)(P2P)網(wǎng)絡(luò)搜索技術(shù)的研究[D];上海交通大學(xué);2007年
4 肖華;個(gè)性化網(wǎng)絡(luò)搜索的研究[D];北京工業(yè)大學(xué);2006年
5 馮明星;基于本體論和聚類的P2P網(wǎng)絡(luò)搜索方法研究[D];廣西大學(xué);2007年
6 李銳;P2P網(wǎng)絡(luò)搜索方法的研究及在遠(yuǎn)程考試系統(tǒng)中的應(yīng)用[D];貴州大學(xué);2007年
7 張恩會(huì);基于JXTA的P2P網(wǎng)絡(luò)搜索技術(shù)的研究[D];沈陽(yáng)工業(yè)大學(xué);2006年
8 向陽(yáng);基于P2P網(wǎng)絡(luò)搜索機(jī)制的設(shè)計(jì)與應(yīng)用[D];北京郵電大學(xué);2009年
9 董國(guó)盛;基于查詢?nèi)罩镜挠脩舨樵円鈭D檢測(cè)[D];天津大學(xué);2014年
10 邱鵬;基于用戶查詢行為分析的在線訂票系統(tǒng)緩存優(yōu)化策略研究[D];北京交通大學(xué);2017年
,本文編號(hào):1600005
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1600005.html