信息檢索模型風(fēng)險及其評價方法研究
[Abstract]:With the development of information retrieval technology, the risk problems in different stages of information retrieval model, such as the risk in correlation estimation, the risk in document sorting and the risk in query expansion, have been paid more and more attention. The breakthrough point of studying these risk problems is to design a method that can evaluate both the performance mean and model risk, quantify the size of these risks, and then find out the risk reduction strategy. There are two emphases in this paper. One is to study the risk evaluation index of information retrieval. The specific work is to generalize the risk evaluation index based on deviation variance decomposition from average accuracy (AP) to other evaluation index. And the target model in this index is set more fairly and unbiased. Another research focus is how to reduce the risk of query expansion failure in the information retrieval model. To solve this problem, this paper proposes a query extension method based on knowledge atlas to reduce the risk of retrieval model, that is, to reduce the risk by adding information related to query expansion model. The specific method is to extract a number of entities and entity attributes related to the query from the knowledge map as extension words to reconstruct the query, to better express the information needs of users, and to calculate the weight of the extended words. Referring to the profit-risk analysis method in portfolio theory, the paper maximizes the correlation benefit between the extension word and the original query, and minimizes the risk of query drift caused by the extended word, which further controls the risk in query expansion. In order to test the rationality of the risk assessment method based on deviation variance decomposition, the model retrieval results submitted by TREC Ad Hoc (1993-1999 and Web Track (2010-2013) were reevaluated in the experimental part. The rationality of the proposed evaluation method for measuring the overall performance of the model is explained, and the tradeoff between the validity and stability of the model is analyzed quantitatively by using deviation and variance. Then, aiming at the strategy of reducing the risk of query expansion based on knowledge atlas, the experimental results show that the strategy is effective in two web data sets, and is compared with the query extension Model (RM3) based on pseudo-correlation feedback. The experimental results show that the extended model proposed in this paper is more effective and stable than RM3..
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 魯屹華;;信息檢索模型相關(guān)研究現(xiàn)狀及分析[J];科技經(jīng)濟市場;2011年11期
2 趙琳;;幾種信息檢索模型的比較[J];煤炭技術(shù);2012年08期
3 王娟;;基于中文科技期刊數(shù)據(jù)庫信息檢索模型的研究[J];科教文匯(中旬刊);2012年10期
4 齊繼國,高X},汪東升;基于多用戶協(xié)同反饋的信息檢索模型[J];小型微型計算機系統(tǒng);2003年07期
5 吳晨;張全;繆建明;;基于語言概念空間的跨語種信息檢索模型[J];計算機工程;2006年18期
6 吳麗華;羅云鋒;張宏斌;;信息檢索模型及相關(guān)性算法的研究[J];情報雜志;2006年12期
7 周竹榮;黃果;周亭;;一種混合的文本信息檢索模型研究[J];計算機工程與設(shè)計;2007年11期
8 鐘振鴻;印潤遠(yuǎn);于慶梅;;基于本體驅(qū)動的法律信息檢索模型[J];微計算機信息;2007年30期
9 劉偉成;孫吉紅;;跨語言信息檢索模型應(yīng)用研究[J];情報雜志;2007年10期
10 張小芳;;幾種常見信息檢索模型的分析與評價[J];情報雜志;2008年03期
相關(guān)會議論文 前10條
1 梅偉;劉惟一;;基于可信度的信息檢索模型[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
2 黃名選;嚴(yán)小衛(wèi);張師超;;基于完全加權(quán)關(guān)聯(lián)規(guī)則挖掘的信息檢索模型[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 黃國斌;王明文;葉浩;;一種新的基于中間語義的跨語言信息檢索模型[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
4 張文雅;宋大為;趙曉朝;張鵬;李競飛;;基于可讀性的信息檢索模型研究[A];第十二屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
5 李廣原;馮嘉禮;;基于屬性坐標(biāo)的文本信息檢索模型[A];廣西計算機學(xué)會2005年學(xué)術(shù)年會論文集[C];2005年
6 普東航;唐常杰;元昌安;廖勇;張?zhí)鞈c;于中華;;一種基于相鄰地址的信息檢索模型AAM[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
7 盛俊;王明文;余俊英;;一種基于潛在語義的Markov網(wǎng)絡(luò)信息檢索模型[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
8 吳晨;張全;繆建明;韋向峰;;自然語言語義理解下的信息檢索模型[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
9 孫斌;呂學(xué)強;蘇祺;;義項矩陣模型SMM簡介[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
10 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數(shù)字檔案檢索策略[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
相關(guān)博士學(xué)位論文 前9條
1 楊為民;基于場論的信息檢索模型的研究[D];安徽大學(xué);2007年
2 徐建民;基于術(shù)語關(guān)系的貝葉斯網(wǎng)絡(luò)信息檢索模型擴展研究[D];天津大學(xué);2007年
3 陳圣兵;基于商空間理論的海量信息檢索模型的研究[D];安徽大學(xué);2010年
4 程凡;基于排序?qū)W習(xí)的信息檢索模型研究[D];中國科學(xué)技術(shù)大學(xué);2012年
5 涂新輝;基于概念的信息檢索模型研究[D];華中師范大學(xué);2012年
6 梁作鵬;面向Web的XML檢索關(guān)鍵技術(shù)研究[D];東南大學(xué);2005年
7 高琰;基于多特征的Web社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中南大學(xué);2007年
8 郭曉黎;煤礦安全事件本體及其在查詢擴展中的應(yīng)用研究[D];中國礦業(yè)大學(xué)(北京);2016年
9 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 郝林雪;信息檢索模型風(fēng)險及其評價方法研究[D];天津大學(xué);2016年
2 任克江;基于地理信息的檢索和用戶數(shù)據(jù)挖掘[D];大連理工大學(xué);2013年
3 丁志剛;基于類別意圖的信息檢索模型[D];北京郵電大學(xué);2009年
4 王慶華;用戶個性化信息檢索模型的設(shè)計與實現(xiàn)[D];大連理工大學(xué);2004年
5 黃果;文本信息檢索模型研究[D];西南大學(xué);2007年
6 張文雅;基于可讀性的信息檢索模型研究[D];天津大學(xué);2016年
7 張東偉;中英文跨語言信息檢索模型研究[D];黑龍江大學(xué);2006年
8 廖亞男;基于多層Markov網(wǎng)絡(luò)的信息檢索模型[D];江西師范大學(xué);2014年
9 左家莉;基于Markov網(wǎng)絡(luò)的信息檢索模型[D];江西師范大學(xué);2005年
10 王艷萍;基于XML的移動信息檢索模型研究[D];大連理工大學(xué);2006年
,本文編號:2268471
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2268471.html