信息檢索模型風險及其評價方法研究
[Abstract]:With the development of information retrieval technology, the risk problems in different stages of information retrieval model, such as the risk in correlation estimation, the risk in document sorting and the risk in query expansion, have been paid more and more attention. The breakthrough point of studying these risk problems is to design a method that can evaluate both the performance mean and model risk, quantify the size of these risks, and then find out the risk reduction strategy. There are two emphases in this paper. One is to study the risk evaluation index of information retrieval. The specific work is to generalize the risk evaluation index based on deviation variance decomposition from average accuracy (AP) to other evaluation index. And the target model in this index is set more fairly and unbiased. Another research focus is how to reduce the risk of query expansion failure in the information retrieval model. To solve this problem, this paper proposes a query extension method based on knowledge atlas to reduce the risk of retrieval model, that is, to reduce the risk by adding information related to query expansion model. The specific method is to extract a number of entities and entity attributes related to the query from the knowledge map as extension words to reconstruct the query, to better express the information needs of users, and to calculate the weight of the extended words. Referring to the profit-risk analysis method in portfolio theory, the paper maximizes the correlation benefit between the extension word and the original query, and minimizes the risk of query drift caused by the extended word, which further controls the risk in query expansion. In order to test the rationality of the risk assessment method based on deviation variance decomposition, the model retrieval results submitted by TREC Ad Hoc (1993-1999 and Web Track (2010-2013) were reevaluated in the experimental part. The rationality of the proposed evaluation method for measuring the overall performance of the model is explained, and the tradeoff between the validity and stability of the model is analyzed quantitatively by using deviation and variance. Then, aiming at the strategy of reducing the risk of query expansion based on knowledge atlas, the experimental results show that the strategy is effective in two web data sets, and is compared with the query extension Model (RM3) based on pseudo-correlation feedback. The experimental results show that the extended model proposed in this paper is more effective and stable than RM3..
【學位授予單位】:天津大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3
【相似文獻】
相關期刊論文 前10條
1 魯屹華;;信息檢索模型相關研究現狀及分析[J];科技經濟市場;2011年11期
2 趙琳;;幾種信息檢索模型的比較[J];煤炭技術;2012年08期
3 王娟;;基于中文科技期刊數據庫信息檢索模型的研究[J];科教文匯(中旬刊);2012年10期
4 齊繼國,高X},汪東升;基于多用戶協同反饋的信息檢索模型[J];小型微型計算機系統(tǒng);2003年07期
5 吳晨;張全;繆建明;;基于語言概念空間的跨語種信息檢索模型[J];計算機工程;2006年18期
6 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關性算法的研究[J];情報雜志;2006年12期
7 周竹榮;黃果;周亭;;一種混合的文本信息檢索模型研究[J];計算機工程與設計;2007年11期
8 鐘振鴻;印潤遠;于慶梅;;基于本體驅動的法律信息檢索模型[J];微計算機信息;2007年30期
9 劉偉成;孫吉紅;;跨語言信息檢索模型應用研究[J];情報雜志;2007年10期
10 張小芳;;幾種常見信息檢索模型的分析與評價[J];情報雜志;2008年03期
相關會議論文 前10條
1 梅偉;劉惟一;;基于可信度的信息檢索模型[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年
2 黃名選;嚴小衛(wèi);張師超;;基于完全加權關聯規(guī)則挖掘的信息檢索模型[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
3 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年
4 張文雅;宋大為;趙曉朝;張鵬;李競飛;;基于可讀性的信息檢索模型研究[A];第十二屆全國人機語音通訊學術會議(NCMMSC'2013)論文集[C];2013年
5 李廣原;馮嘉禮;;基于屬性坐標的文本信息檢索模型[A];廣西計算機學會2005年學術年會論文集[C];2005年
6 普東航;唐常杰;元昌安;廖勇;張?zhí)鞈c;于中華;;一種基于相鄰地址的信息檢索模型AAM[A];第二十一屆中國數據庫學術會議論文集(研究報告篇)[C];2004年
7 盛俊;王明文;余俊英;;一種基于潛在語義的Markov網絡信息檢索模型[A];第二屆全國信息檢索與內容安全學術會議(NCIRCS-2005)論文集[C];2005年
8 吳晨;張全;繆建明;韋向峰;;自然語言語義理解下的信息檢索模型[A];第三屆學生計算語言學研討會論文集[C];2006年
9 孫斌;呂學強;蘇祺;;義項矩陣模型SMM簡介[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年
10 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數字檔案檢索策略[A];廣西計算機學會2010年學術年會論文集[C];2010年
相關博士學位論文 前9條
1 楊為民;基于場論的信息檢索模型的研究[D];安徽大學;2007年
2 徐建民;基于術語關系的貝葉斯網絡信息檢索模型擴展研究[D];天津大學;2007年
3 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學;2010年
4 程凡;基于排序學習的信息檢索模型研究[D];中國科學技術大學;2012年
5 涂新輝;基于概念的信息檢索模型研究[D];華中師范大學;2012年
6 梁作鵬;面向Web的XML檢索關鍵技術研究[D];東南大學;2005年
7 高琰;基于多特征的Web社區(qū)發(fā)現關鍵技術研究[D];中南大學;2007年
8 郭曉黎;煤礦安全事件本體及其在查詢擴展中的應用研究[D];中國礦業(yè)大學(北京);2016年
9 仲兆滿;事件本體及其在查詢擴展中的應用[D];上海大學;2011年
相關碩士學位論文 前10條
1 郝林雪;信息檢索模型風險及其評價方法研究[D];天津大學;2016年
2 任克江;基于地理信息的檢索和用戶數據挖掘[D];大連理工大學;2013年
3 丁志剛;基于類別意圖的信息檢索模型[D];北京郵電大學;2009年
4 王慶華;用戶個性化信息檢索模型的設計與實現[D];大連理工大學;2004年
5 黃果;文本信息檢索模型研究[D];西南大學;2007年
6 張文雅;基于可讀性的信息檢索模型研究[D];天津大學;2016年
7 張東偉;中英文跨語言信息檢索模型研究[D];黑龍江大學;2006年
8 廖亞男;基于多層Markov網絡的信息檢索模型[D];江西師范大學;2014年
9 左家莉;基于Markov網絡的信息檢索模型[D];江西師范大學;2005年
10 王艷萍;基于XML的移動信息檢索模型研究[D];大連理工大學;2006年
,本文編號:2268471
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2268471.html