天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于查詢子意圖識別的檢索結果多樣化方法研究

發(fā)布時間:2018-04-29 10:06

  本文選題:信息檢索 + 查詢子意圖; 參考:《哈爾濱工業(yè)大學》2012年碩士論文


【摘要】:互聯(lián)網的飛速發(fā)展使得人類的信息總量呈現出指數級增長的趨勢,為了使用戶能夠更快更準確地在海量的資源中找到與當前需求相關的信息,信息檢索技術應運而生。目前,搜索引擎作為信息檢索的一個重要應用已經成為人們日常工作生活中不可獲取的工具,它對用戶提交的代表其搜索意圖的查詢詞進行檢索并按照文檔與查詢詞的相似度的大小關系作為返回相關文檔的排列順序。然而,相同的查詢詞對于不同的用戶來說所代表的查詢意圖可能并不相同,,造成這個結果的原因主要有兩個:一是查詢詞可能存在著歧義性,二是查詢詞下可能涵蓋著多個子意圖。因此,僅僅考慮相似度的檢索方式會使某些用戶的需求不會被滿足,檢索結果應該考慮用戶的多樣化需求。為了滿足用戶的多樣化需求,本文對檢索結果多樣化問題進行研究,提出了基于查詢子意圖識別的多樣化方法,充分考慮返回文檔集合與用戶查詢意圖的相關性和返回文檔之間的多樣性。 本文中的基于查詢子意圖識別的多樣化方法是在傳統(tǒng)的顯式多樣化方法和隱式多樣化方法的基礎上發(fā)展而來的,兼有顯式多樣化方法中對原始查詢下不同的子意圖進行顯式覆蓋和隱式多樣化方法中降低返回文檔集合的冗余性的特性。方法中主要包括原始查詢下的不同子意圖的識別,不同子意圖的權重大小關系預測和利用不同權重的子意圖進行多樣化結果排序三個方面。 因此本文主要從以下幾個方面展開研究: 1.對原始查詢下的不同子意圖進行顯示挖掘。將商業(yè)搜索引擎給出的與原始查詢相關的Related查詢和Suggested查詢作為候選子查詢,并利用人工標注的方式將不同的候選子查詢劃分為不同的子意圖。同時,與其它三種挖掘候選子查詢的方式進行性能比較,證明了我們使用的方法的有效性。 2.對不同類別的子意圖進行權重預測。通過對6個月的瀏覽器用戶日志的挖掘,提取出32個與子意圖相關的特征,并利用SVM排序模型對不同類別的子意圖進行權重預測。 3.對檢索結果多樣化問題進行分析,并提出基于查詢子意圖識別的檢索結果多樣化方法并給出算法的一般過程。通過與傳統(tǒng)的顯隱式多樣化方法的性能上限和一種顯式多樣化的變種方法的性能進行比較,證明基于查詢子意圖識別的檢索結果多樣化方法的有效性。并對基于查詢子意圖識別的檢索結果多樣化方法的性能與子意圖類別個數的關系進行分析。 通過在NTCIR9子意圖挖掘任務的數據集合上的驗證,證明我們使用的子意圖挖掘方式具有很好的表現,為其它需要使用查詢子意圖的工作奠定了基礎。通過在NTCIR9多樣化結果排序任務的數據集合上與其它檢索結果多樣化方法的比較,證明基于查詢子意圖識別的檢索結果多樣化方法更能夠滿足用戶對于多樣化檢索結果的需求。
[Abstract]:With the rapid development of the Internet, the total amount of human information is increasing exponentially. In order to enable users to find information related to the current needs in a large amount of resources faster and more accurately, information retrieval technology emerges as the times require. At present, as an important application of information retrieval, search engine has become an inaccessible tool in people's daily working life. It retrieves the query words submitted by the user representing their search intention and returns the relevant documents in the order according to the similarity between the documents and the query terms. However, the same query words may represent different query intentions for different users. There are two main reasons for this result: first, the query words may have ambiguity. Second, query words may cover multiple sub-intentions. Therefore, only considering the similarity of the retrieval method will make some users' needs will not be satisfied, and the retrieval results should take into account the diverse needs of users. In order to meet the diverse needs of users, this paper studies the diversification of retrieval results, and proposes a diversification method based on query sub-intention recognition. Fully consider the correlation between the return document set and the user's query intention and the diversity of the returned document. The diversification method based on query subintention recognition in this paper is based on the traditional explicit diversification method and implicit diversification method. In both explicit diversification methods and implicit diversification methods, the explicit coverage of different subintentions under the original query and the reduction of the redundancy of the return document set are presented. The method mainly includes three aspects: the recognition of different sub-intention under the original query, the prediction of the weight relation of different sub-intention and the ranking of the result by using the sub-intention of different weight. Therefore, this paper mainly carries out the research from the following aspects: 1. Display and mine the different subintentions of the original query. The Related query and Suggested query related to the original query given by the commercial search engine are used as candidate subqueries, and the different candidate subqueries are divided into different sub-intentions by manual annotation. At the same time, compared with the other three methods of mining candidate subqueries, the effectiveness of our method is proved. 2. The weight of different kinds of subintentions is predicted. By mining the browser user logs for 6 months, 32 features related to sub-intention are extracted, and the weight of different subintentions is predicted by using SVM sorting model. 3. This paper analyzes the diversification of retrieval results, and proposes a method for diversity of retrieval results based on query subintention recognition and gives the general process of the algorithm. By comparing with the performance upper limit of the traditional explicit and implicit diversification method and the performance of an explicit diversification variant method, the effectiveness of the retrieval result diversification method based on query subintention recognition is proved. The relationship between the performance of the method and the number of subintention categories is analyzed. Through the verification on the data set of the NTCIR9 sub-intention mining task, it is proved that the sub-intention mining method we use has a good performance, which lays the foundation for other work that needs to use the query sub-intention. By comparing the data set of NTCIR9 diversity result sorting task with other retrieval result diversification methods, it is proved that the search result diversification method based on query subintention recognition can better meet the needs of users for diversified retrieval results.
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP391.3

【共引文獻】

相關期刊論文 前10條

1 區(qū)衛(wèi)民;譚泗橋;袁哲明;柏連陽;熊潔儀;;SVR-KNN法用于除草劑QSAR研究[J];安徽農業(yè)科學;2008年35期

2 韓勇鵬;;SVM方法及其在乳制品分類問題上的應用[J];安徽農業(yè)科學;2009年08期

3 郭立萍;唐家奎;米素娟;張成雯;趙理君;;基于支持向量機遙感圖像融合分類方法研究進展[J];安徽農業(yè)科學;2010年17期

4 張永生;魏新軍;侯振雨;彭娟;;支持向量回歸分光光度法同時測定莧菜紅和果綠[J];安徽農業(yè)科學;2010年33期

5 張永生;;支持向量機在害蟲預測預報中的應用[J];現代農業(yè)科技;2009年14期

6 馮學軍;;最小二乘支持向量機的研究與應用[J];安慶師范學院學報(自然科學版);2009年01期

7 宋海濱;劉云幗;;基于支持向量機的預測控制算法[J];兵工自動化;2006年04期

8 徐波;;基于改進PSO-LSSVM的軍用工程機械研制費用預測模型[J];兵工自動化;2011年10期

9 馬喜波;閻愛俠;;支持向量機算法用于烷基苯的熱容和標準焓值的預測[J];北京化工大學學報(自然科學版);2008年02期

10 劉華富;支持向量機Mercer核的若干性質[J];北京聯(lián)合大學學報(自然科學版);2005年01期

相關會議論文 前10條

1 周綺鳳;林成德;羅林開;彭洪;;一種基于黎曼度量的訓練樣本類不平衡SVM分類方法研究[A];第二十六屆中國控制會議論文集[C];2007年

2 張向波;梅國建;徐宗昌;;基于SVM的裝備戰(zhàn)備完好性預測模型[A];第十屆中國科協(xié)年會論文集(一)[C];2008年

3 張永生;魏新軍;顏振敏;南海娟;;多元線性回歸分光光度法同時測定飲料中三種色素[A];第十屆中國科協(xié)年會論文集(三)[C];2008年

4 肖惠玲;曾翎;黃海瑩;張琳;王昱清;楊勤;陳華富;;支持向量機探測腦功能活動[A];中國生物醫(yī)學工程進展——2007中國生物醫(yī)學工程聯(lián)合學術年會論文集(下冊)[C];2007年

5 王永春;;一種復合的支持向量機模型在電力系統(tǒng)短期負荷中的應用[A];第十屆全國電工數學學術年會論文集[C];2005年

6 吳p

本文編號:1819469


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1819469.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶aa364***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日本人妻精品有码字幕| 亚洲熟妇中文字幕五十路| 国产不卡最新在线视频| 欧美日韩黑人免费观看| 最新69国产精品视频| 久久国产亚洲精品赲碰热| 丰满人妻一二区二区三区av | 中文字幕亚洲精品在线播放| 日韩精品一级片免费看| 久久综合狠狠综合久久综合| 深夜视频在线观看免费你懂| 十八禁日本一区二区三区| 午夜免费精品视频在线看| 青青操成人免费在线视频| 午夜小视频成人免费看| 精品高清美女精品国产区| 色综合久久超碰色婷婷| 久久99热成人网不卡| 国产精品伦一区二区三区在线| 日本少妇aa特黄大片| 中文字幕一区二区三区大片| 国产成人精品国内自产拍| 在线观看欧美视频一区| 国产免费黄片一区二区| 日本99精品在线观看| 国产熟女高清一区二区| 国产精品白丝一区二区| 国产又大又黄又粗又免费| 老司机精品福利视频在线播放| 精品亚洲香蕉久久综合网| 久久精品中文扫妇内射| 富婆又大又白又丰满又紧又硬| 老司机精品福利视频在线播放| 欧美日韩国产的另类视频| 一区二区三区精品人妻| 精品女同一区二区三区| 欧美亚洲综合另类色妞| 国产免费一区二区不卡| 日韩中文字幕免费在线视频| 国产av一区二区三区久久不卡| 精品人妻一区二区三区四区久久 |