天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于用戶搜索歷史的個(gè)性化信息檢索研究

發(fā)布時(shí)間:2018-05-06 08:36

  本文選題:個(gè)性化信息檢索 + 用戶歷史; 參考:《哈爾濱工業(yè)大學(xué)》2015年博士論文


【摘要】:個(gè)性化信息檢索針對(duì)用戶個(gè)人興趣偏好優(yōu)化文檔排序,被認(rèn)為是現(xiàn)有搜索引擎改善用戶檢索體驗(yàn)的一種有效途徑。個(gè)性化信息檢索以用戶為中心提供有針對(duì)性的檢索結(jié)果,因此不僅考慮查詢和文檔的匹配度,還考慮文檔和用戶興趣偏好的匹配度。用戶歷史包含用戶豐富的信息,是獲取用戶興趣偏好的最佳途徑,成為個(gè)性化信息檢索研究的焦點(diǎn)。為了探索不同的用戶歷史在檢索中的作用,本文量化分析了用戶歷史與檢索結(jié)果的相關(guān)性,探討了如何利用短期歷史、長(zhǎng)期歷史、以及綜合利用二者以提高個(gè)性化檢索性能的方法。1)針對(duì)用戶歷史與檢索結(jié)果的關(guān)系,量化分析了用戶長(zhǎng)短期歷史與用戶查詢和點(diǎn)擊的相關(guān)性。本文采用向量空間模型框架,從以下四個(gè)方面分析了用戶長(zhǎng)短期歷史與查詢和點(diǎn)擊的關(guān)系:相關(guān)比例、相關(guān)程度、是否存在線性關(guān)系和具體內(nèi)容上的差異。分析發(fā)現(xiàn)79.55%的查詢可以從用戶歷史中獲取相關(guān)信息,其中短期歷史覆蓋的比例較大(71.23%),相關(guān)程度也較高;而針對(duì)同一個(gè)查詢,不同的用戶歷史所提供的相關(guān)信息不盡相同,彼此的結(jié)合有可能進(jìn)一步提高檢索性能。2)針對(duì)如何合理利用短期歷史的問題,提出了一種短期歷史權(quán)重自適應(yīng)的個(gè)性化檢索方法。為了合理分配短期歷史權(quán)重,本文以短期歷史和當(dāng)前查詢的相關(guān)強(qiáng)度為核心依據(jù),以當(dāng)前查詢、短期歷史查詢、短期歷史點(diǎn)擊三個(gè)維度上的用戶行為特征為線索,建立了SVM回歸模型對(duì)短期歷史的權(quán)重進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)表明,該方法能夠根據(jù)具體的檢索環(huán)境為每個(gè)查詢的短期歷史動(dòng)態(tài)分配權(quán)重,有效提升了個(gè)性化檢索性能。3)針對(duì)如何有效利用長(zhǎng)期歷史的問題,本文引入增量層次聚類算法對(duì)長(zhǎng)期興趣建模,并在此基礎(chǔ)上建立新的查詢模型。長(zhǎng)期歷史內(nèi)容豐富但主題相對(duì)分散,并隨著用戶的使用不斷積累更新,因此長(zhǎng)期歷史中包含很多與當(dāng)前查詢無關(guān)的內(nèi)容。針對(duì)該問題,本文采用增量層次聚類算法漸進(jìn)地構(gòu)建用戶長(zhǎng)期興趣樹,并使用對(duì)當(dāng)前檢索有最大幫助的興趣簇估計(jì)長(zhǎng)期興趣模型,從而對(duì)用戶查詢進(jìn)行有益補(bǔ)充。實(shí)驗(yàn)證明,基于長(zhǎng)期歷史增量層次聚類的個(gè)性化檢索方法顯著優(yōu)于現(xiàn)有基于長(zhǎng)期歷史的檢索方法,在一定程度上解決了具有多樣性和動(dòng)態(tài)性的長(zhǎng)期歷史的利用問題,改善了個(gè)性化檢索性能。4)在上述研究的基礎(chǔ)上,設(shè)計(jì)了一種基于用戶長(zhǎng)短期歷史融合的個(gè)性化檢索框架。用戶長(zhǎng)短期歷史對(duì)檢索結(jié)果的作用不同,本文的模型將二者的不同作用綜合作用于查詢和文檔,一方面根據(jù)長(zhǎng)短期歷史更準(zhǔn)確地估計(jì)用戶查詢,另一方面考慮了文檔相對(duì)于用戶的重要性差異。實(shí)驗(yàn)中全面比較了不同用戶歷史的各種組合,結(jié)果表明長(zhǎng)短期歷史融合作用于查詢的效果優(yōu)于只使用一種歷史的情況,而同時(shí)作用于查詢和文檔可以獲得最佳的檢索性能。
[Abstract]:Personalized information retrieval is considered to be an effective way to improve users' retrieval experience by optimizing document ranking according to users' personal interests and preferences. Personalized information retrieval takes the user as the center to provide targeted retrieval results, so not only the matching degree of query and document, but also the matching degree of document and user interest preference are considered. The history of users contains abundant information, which is the best way to obtain user's preference of interest and becomes the focus of personalized information retrieval. In order to explore the role of different user history in retrieval, this paper quantitatively analyzes the correlation between user history and retrieval results, and discusses how to make use of short-term history and long-term history. According to the relationship between user history and retrieval result, the correlation between user's long and short history and user's query and click is analyzed quantitatively. In this paper, we use the vector space model framework to analyze the relationship between the user's long and short history and query and click from four aspects: correlation ratio, correlation degree, whether there is a linear relationship and the difference of specific content. It is found that 79.55% of the queries can obtain the relevant information from the user's history, among which the proportion of short-term history covers a large proportion, and the correlation degree is also high, but for the same query, different user history provides different relevant information. The combination of each other may further improve the retrieval performance. 2) aiming at the problem of how to make rational use of short-term history, an adaptive personalized retrieval method based on short-term historical weight is proposed. In order to distribute the short-term historical weight reasonably, this paper takes the short-term history and the relevant intensity of the current query as the core basis, taking the user behavior characteristics on the three dimensions of current query, short-term historical query and short-term history click as the clue. SVM regression model is established to predict the weight of short-term history. Experiments show that the method can assign weights to the short-term history of each query according to the specific retrieval environment, and effectively improve the performance of personalized retrieval. 3) aiming at the problem of how to utilize the long-term history effectively. In this paper, incremental hierarchical clustering algorithm is introduced to model long-term interest, and a new query model is established. The long history is rich in content, but the topic is relatively scattered, and with the use of the user, it is constantly updated, so the long history contains a lot of content unrelated to the current query. To solve this problem, the incremental hierarchical clustering algorithm is used to construct the long-term interest tree of the user gradually, and to estimate the long-term interest model by using the interest cluster which is the most helpful for the current retrieval, so as to complement the user query. The experiments show that the personalized retrieval method based on long-term historical increment hierarchical clustering is significantly superior to the existing retrieval method based on long-term history, and to some extent, it solves the problem of the utilization of long-term history with diversity and dynamics. Improving the performance of personalized retrieval. (4) based on the above research, a personalized retrieval framework based on the combination of users' long and short history is designed. The function of user's short and long history on retrieval results is different. The model of this paper combines the two functions to query and document, on the one hand, estimates user query more accurately according to long and short history. On the other hand, the importance of documents relative to users is considered. The results show that the combination of long and short history is better than that of using only one history, and the best retrieval performance can be obtained by using both query and document.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李樹青;;個(gè)性化信息檢索技術(shù)綜述[J];情報(bào)理論與實(shí)踐;2009年05期

2 易明;操玉杰;毛進(jìn);;基于點(diǎn)擊流的個(gè)性化信息檢索研究[J];情報(bào)科學(xué);2011年04期

3 楊林;;淺析個(gè)性化信息檢索模型[J];蘭臺(tái)世界;2013年02期

4 楊濤;;個(gè)性化信息檢索及其實(shí)現(xiàn)方式探析[J];圖書情報(bào)論壇;2002年02期

5 陳小華;趙捧未;;基于關(guān)聯(lián)規(guī)則的個(gè)性化信息檢索系統(tǒng)研究[J];情報(bào)科學(xué);2006年06期

6 郭新明;趙薔;弋改珍;;基于相關(guān)反饋的個(gè)性化信息檢索模型研究[J];咸陽(yáng)師范學(xué)院學(xué)報(bào);2008年06期

7 田曉珍;張敏;;基于元搜索引擎的個(gè)性化信息檢索系統(tǒng)[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2008年02期

8 朱曉斌;周源;;個(gè)性化信息檢索在網(wǎng)絡(luò)營(yíng)銷中的應(yīng)用[J];科技信息(學(xué)術(shù)研究);2008年05期

9 徐險(xiǎn)峰;;2001—2008年我國(guó)個(gè)性化信息檢索研究綜述[J];新世紀(jì)圖書館;2009年03期

10 張寧;趙德平;;基于領(lǐng)域本體的個(gè)性化信息檢索研究與應(yīng)用[J];科技傳播;2010年12期

相關(guān)會(huì)議論文 前2條

1 鄒博偉;張宇;范基禮;鄭偉;劉挺;;基于改進(jìn)的TextTiling方法的用戶新興趣發(fā)現(xiàn)的研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

2 張艷;周國(guó)祥;;Web挖掘在個(gè)性化信息檢索中的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

相關(guān)重要報(bào)紙文章 前1條

1 應(yīng)曉敏 竇文華;條條道路通羅馬[N];計(jì)算機(jī)世界;2003年

相關(guān)博士學(xué)位論文 前1條

1 王曉春;基于用戶搜索歷史的個(gè)性化信息檢索研究[D];哈爾濱工業(yè)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 王劍;基于用戶偏好分析的個(gè)性化信息檢索關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2016年

2 劉宏;基于語(yǔ)義的個(gè)性化信息檢索研究[D];華北電力大學(xué)(河北);2010年

3 余肖生;數(shù)字圖書館的個(gè)性化信息檢索研究[D];華中師范大學(xué);2004年

4 紀(jì)明奎;基于語(yǔ)義網(wǎng)的個(gè)性化信息檢索模型研究[D];黑龍江大學(xué);2007年

5 尹紅麗;基于本體的個(gè)性化信息檢索系統(tǒng)模型研究[D];山東大學(xué);2006年

6 陳小華;數(shù)據(jù)挖掘技術(shù)在個(gè)性化信息檢索系統(tǒng)中的應(yīng)用研究[D];西安電子科技大學(xué);2006年

7 萬里;基于本體的個(gè)性化信息檢索研究[D];蘭州理工大學(xué);2013年

8 林霞;個(gè)性化信息檢索技術(shù)在勘探門戶中的應(yīng)用研究[D];西安石油大學(xué);2011年

9 康楊楊;個(gè)性化信息檢索中用戶偏好分析技術(shù)研究[D];蘇州大學(xué);2014年

10 王威;基于上下文的個(gè)性化信息檢索技術(shù)研究[D];廈門大學(xué);2009年



本文編號(hào):1851571

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1851571.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8c8df***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com