天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

搜索引擎用戶點擊模型研究

發(fā)布時間:2019-05-22 17:48
【摘要】:搜索引擎已經(jīng)成為互聯(lián)網(wǎng)最主要的訪問入口之一,用戶時常通過搜索引擎來尋找想要獲得的信息。對搜索引擎來說,能否返回高質(zhì)量的查詢結(jié)果對于用戶體驗至關(guān)重要,為此搜索引擎公司會廣泛收集用戶的交互數(shù)據(jù)(如用戶查詢了哪些詞,點擊了哪些結(jié)果);谶@些用戶的隱式反饋信息,點擊模型(click model)被廣泛用于從中挖掘查詢結(jié)果對于查詢詞的相關(guān)性信息。點擊模型對用戶的瀏覽和點擊行為進行建模并對查詢結(jié)果的相關(guān)性進行估計。已有的點擊模型考慮了位置偏置、用戶滿意度等影響用戶點擊的因素。在本工作中,我們認為存在其他一些還沒有被已有點擊模型充分考慮在內(nèi),但是會對用戶點擊產(chǎn)生影響的因素。如用戶相關(guān)的因素,查詢詞相關(guān)的因素,時間相關(guān)的因素等。本文將重點研究用戶行為偏好因素,用戶搜索專家程度因素和查詢詞類型因素對用戶點擊的影響,并且建立將這些因素考慮在內(nèi)的點擊模型。 用戶行為偏好因素:我們通過眼動實驗對用戶搜索時的檢驗行為進行分析,發(fā)現(xiàn)用戶在檢驗深度上存在較大的差異,說明用戶存在不同的檢驗偏好。此外,通過對真實搜索引擎用戶點擊日志的分析,我們發(fā)現(xiàn)用戶在點擊行為(點擊位置,點擊數(shù)量)上也體現(xiàn)出一定的差異,說明用戶存在點擊偏好。據(jù)此我們提出了一個考慮用戶偏好的點擊模型框架。在多個點擊模型上的實驗結(jié)果表明,在引入用戶行為偏好因素后,模型的性能能夠普遍得到顯著的提升。 用戶搜索專家程度因素:點擊通常被認為是用戶對查詢結(jié)果是否相關(guān)的判斷。我們認為不同用戶在判斷一個文檔的相關(guān)性時,做出正確判斷的概率存在差異。我們提出搜索專家程度的概念,并假設(shè)其決定了用戶能否正確的判斷文檔的相關(guān)性,進而對點擊行為產(chǎn)生影響。基于這個假設(shè),我們構(gòu)建了考慮用戶搜索專家程度的點擊模型,真實數(shù)據(jù)上的實驗結(jié)果表明,新的模型能夠更好的對文檔的相關(guān)性進行估計。 查詢詞類型因素:我們通過眼動實驗發(fā)現(xiàn)用戶在不同類型查詢詞下的搜索行為存在很大差異,然而已有的點擊模型并沒有考慮查詢詞類型因素對用戶點擊的影響。在對用戶的檢驗行為,,點擊行為和搜索專家程度受查詢詞類型的影響進行研究之后,我們提出了考慮查詢詞類型因素的點擊模型框架。這個框架能夠通過無監(jiān)督的方法從查詢詞的點擊特征與用戶點擊數(shù)據(jù)中學習出查詢詞的類型信息,并且對不同的查詢詞類型分別進行建模,由此提升點擊模型的性能。此外,我們的無監(jiān)督框架所估計出的各項參數(shù)與眼動實驗中得到的結(jié)果有較高的一致性,這也從另一個方面驗證了我們方法的有效性。
[Abstract]:Search engine has become one of the most important access points to the Internet, users often use search engine to find the information they want. For search engines, whether or not to return high-quality query results is critical to the user experience, so search engine companies widely collect user interaction data (such as what words the user queries and what results are clicked). Based on the implicit feedback information of these users, the click model (click model) is widely used to mine the correlation information of query results to query words. The click model models the browsing and click behavior of users and estimates the correlation of query results. The existing click model takes into account the location bias, user satisfaction and other factors that affect the user click. In this work, we think that there are other factors that have not been fully taken into account by the existing click model, but will have an impact on user click. Such as user-related factors, query words related factors, time-related factors and so on. This paper will focus on the influence of user behavior preference factor, user search expert degree factor and query word type factor on user click, and establish a click model that takes these factors into account. The factors of user behavior preference: we analyze the inspection behavior of users when searching through eye movement experiment, and find that there are great differences in the depth of inspection, which indicates that users have different test preferences. In addition, through the analysis of the click log of the real search engine user, we find that the user also shows some differences in the click behavior (click position, the number of clicks), indicating that the user has the click preference. Based on this, we propose a click model framework that takes into account user preferences. The experimental results on multiple click models show that the performance of the model can be significantly improved by introducing the user behavior preference factor. User search expert level factor: click is usually considered to be the user's judgment on whether the query results are relevant. We think that there are differences in the probability of correct judgment when different users judge the correlation of a document. We propose the concept of search expert level, and assume that it determines whether the user can correctly judge the relevance of the document, and then has an impact on the click behavior. Based on this hypothesis, we construct a click model considering the degree of user search experts. The experimental results on real data show that the new model can better estimate the correlation of documents. Query word type factor: through eye movement experiment, we find that the search behavior of users under different types of query words is very different, but the existing click model does not consider the influence of query word type factor on user click. After studying the influence of query word type on user's checking behavior, click behavior and the degree of search expert, we propose a click model framework which takes into account the factors of query word type. This framework can learn the type information of query words from the click characteristics of query words and user click data without supervision, and model different query word types, thus improving the performance of click model. In addition, the parameters estimated by our unsupervised framework are in good agreement with the results obtained in the eye movement experiment, which also verifies the effectiveness of our method from another aspect.
【學位授予單位】:清華大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:TP391.3

【共引文獻】

相關(guān)期刊論文 前10條

1 付博;趙世奇;劉挺;;Web查詢?nèi)罩狙芯烤C述[J];電子學報;2013年09期

2 郭世龍;王晨升;楊光;劉豐;鐘興志;;基于隨機游走模型的關(guān)鍵詞推薦算法[J];產(chǎn)業(yè)與科技論壇;2013年22期

3 劉喜文;鄭昌興;王文龍;湯剛強;;構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究[J];圖書與情報;2013年05期

4 許明;吳建平;杜怡曼;謝峰;肖云鵬;;基于三部圖的路網(wǎng)節(jié)點關(guān)鍵度排序方法[J];北京郵電大學學報;2014年S1期

5 張勝;;譜聚類在圖像識別中的應(yīng)用[J];安徽電子信息職業(yè)技術(shù)學院學報;2014年02期

6 張喜平;李永樹;劉剛;王蕾;;節(jié)點重要度貢獻的復(fù)雜網(wǎng)絡(luò)節(jié)點重要度評估方法[J];復(fù)雜系統(tǒng)與復(fù)雜性科學;2014年03期

7 龔衛(wèi)華;郭偉鵬;楊良懷;;信任網(wǎng)絡(luò)中多維信任序列模式挖掘方法研究[J];電子與信息學報;2014年08期

8 張引;高克寧;張斌;;多種搜索行為聯(lián)合分析方法研究[J];東北大學學報(自然科學版);2014年09期

9 王曉春;楊沐昀;李生;;個性化信息檢索中的用戶歷史分析[J];智能計算機與應(yīng)用;2014年05期

10 吳哲;郭宇春;陳常嘉;;基于用戶關(guān)系的在線社會網(wǎng)絡(luò)關(guān)鍵用戶識別算法[J];北京交通大學學報;2014年05期

相關(guān)會議論文 前2條

1 許明;吳建平;杜怡曼;謝峰;肖云鵬;;基于三部圖的路網(wǎng)節(jié)點關(guān)鍵度排序方法[A];2013年全國通信軟件學術(shù)會議論文集[C];2013年

2 紀雪梅;王芳;;在線社交網(wǎng)絡(luò)用戶情感傳播研究[A];2013中國信息經(jīng)濟學會學術(shù)年會暨博士生論壇論文集[C];2013年

相關(guān)博士學位論文 前10條

1 宋巍;基于主題的查詢意圖識別研究[D];哈爾濱工業(yè)大學;2013年

2 李朋;異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究[D];重慶大學;2013年

3 劉東;基于內(nèi)容的互聯(lián)網(wǎng)社交圖像標簽處理與分析[D];哈爾濱工業(yè)大學;2012年

4 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學;2012年

5 張勇實;基于鏈接相似性分析的WEB結(jié)構(gòu)挖掘方法研究[D];哈爾濱工程大學;2012年

6 吳共慶;基于標簽路徑特征的Web新聞內(nèi)容抽取研究[D];合肥工業(yè)大學;2012年

7 曾雪;在線社交網(wǎng)絡(luò)用戶的分類及采樣研究[D];電子科技大學;2013年

8 孔維梁;協(xié)同過濾推薦系統(tǒng)關(guān)鍵問題研究[D];華中師范大學;2013年

9 張金松;基于引文上下文分析的文獻檢索技術(shù)研究[D];大連海事大學;2013年

10 龔家瑜;基于數(shù)據(jù)挖掘的藥物靶標發(fā)現(xiàn)方法研究[D];華東理工大學;2013年

相關(guān)碩士學位論文 前10條

1 范敏;學術(shù)用戶網(wǎng)絡(luò)信息查尋中的認知失調(diào)及其調(diào)節(jié)機制研究[D];西南大學;2013年

2 黃政;青少年使用移動搜索行為的研究[D];上海交通大學;2013年

3 張濤;Web教學資源采集中超鏈接可采集度評價研究[D];南京師范大學;2013年

4 馬桂香;評論文本的多方面觀點挖掘研究[D];北京交通大學;2013年

5 劉文君;基于膜計算優(yōu)化算法的語義主題爬蟲研究[D];西華大學;2013年

6 舒昕;基于社會網(wǎng)絡(luò)分析的Web社區(qū)發(fā)現(xiàn)[D];蘭州交通大學;2013年

7 王良偉;面向垂直搜索引擎的主題爬蟲方法研究[D];重慶大學;2013年

8 劉閩;基于知識遷移的網(wǎng)絡(luò)輿論多維度識別系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學;2013年

9 張婷;基于用戶行為分析的本地搜索排序算法優(yōu)化[D];北京工業(yè)大學;2013年

10 王梅;隨機游走圖像分割算法的研究[D];北京工業(yè)大學;2013年



本文編號:2483118

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2483118.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶07d91***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com