支持檢索結果多樣化查詢性能預測的研究
發(fā)布時間:2020-07-01 10:19
【摘要】:對于給定的查詢,搜索引擎首先對查詢進行分析,之后在預先建好的索引上檢索文檔,并按一種排名算法產生排序的文檔列表。為了評估返回文檔列表的性能,通常需要人工判斷,非常費時,開銷很大。如能開發(fā)出自動的、無需人工判斷的查詢性能預測技術,有較大的實用意義。對于搜索引擎而言,提高一些難度較高查詢的性能尤其必要。如能預測此類查詢,采取必要的補救措施以提升查詢結果的質量,肯定能夠提高用戶的滿意度。因此,設計有效的查詢相關性性能預測方法是一項有意義的工作,這也是目前信息檢索領域的一個研究方向。一個查詢常含有多個子意圖,并且對于同一個查詢,不同用戶往往有不同的意圖。為了讓更多的用戶獲得較好的搜索體驗,應使靠前的查詢結果盡量覆蓋更多的子意圖。這一過程稱為多樣化處理,多樣化后查詢結果的性能稱為多樣化性能。在檢索多樣化的背景下,為了避免將多樣化性能低的查詢結果返回給用戶,搜索引擎需要預測查詢結果的多樣化性能,因此本文對查詢多樣化性能預測進行了研究。據我們所知,目前文獻中還沒有涉及這方面的研究。本文主要在以下幾個方面進行了研究工作:(1)對于查詢相關性性能的預測,從預測查詢困難度類別(困難、一般、或容易查詢)的角度入手,提出了一個基于支持向量機對查詢的困難度進行分類的方法。實驗結果顯示該方法的預測效果良好,特別在困難類別查詢的預測上,有效性較高。(2)對于查詢多樣化性能的預測,提出了5個算法。并采用TREC Web Track2010-2011多樣性任務中提交的結果檢驗了算法的性能,結果顯示預測算法有一定的有效性。(3)分析子查詢檢索結果的不同獲取方式對多樣化預測算法的影響。因為提出的多樣化預測算法,預測查詢多樣化性能時需分析子查詢檢索結果信息,而該結果除了如上一實驗從外部資源獲取,還可直接從檢索結果多樣化產生的中間結果獲取。實驗結果表明,提出的預測算法在性能上依然好于傳統預測算法。
【學位授予單位】:江蘇大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3
本文編號:2736633
【學位授予單位】:江蘇大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前1條
1 郎皓;王斌;李錦濤;丁凡;;文本檢索的查詢性能預測[J];軟件學報;2008年02期
本文編號:2736633
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2736633.html