基于聚類分析的搜索引擎自動性能評價
本文選題:信息檢索 + 性能評價。 參考:《中文信息學(xué)報》2010年05期
【摘要】:傳統(tǒng)的搜索引擎性能評價方法需要人工標(biāo)注標(biāo)準(zhǔn)答案集,需花費(fèi)大量的人力物力,并且評價結(jié)果依賴于人工標(biāo)注的準(zhǔn)確性,效率較低。該文基于聚類分析的思路,提出了一種搜索引擎性能評價指標(biāo)和自動進(jìn)行搜索引擎性能評價的方法,此方法能自動計算信息類查詢的覆蓋范圍,并根據(jù)其覆蓋范圍對檢索結(jié)果進(jìn)行聚類,通過類間距和類內(nèi)距等指標(biāo)實(shí)現(xiàn)檢索性能的自動評價。實(shí)驗結(jié)果表明,基于聚類指標(biāo)的評價方法與人工標(biāo)注的評價方法的評價結(jié)果是相一致的。
[Abstract]:The traditional evaluation method of search engine performance needs manual tagging standard answer set, which requires a lot of manpower and material resources, and the evaluation result depends on the accuracy of manual annotation, and the efficiency is low. Based on the idea of clustering analysis, this paper puts forward a method of evaluating the performance of search engine and automatically evaluating the performance of search engine. This method can automatically calculate the coverage of information class query. According to its coverage range, the retrieval results are clustered, and the retrieval performance is automatically evaluated by the index of the space between classes and the distance between classes. The experimental results show that the evaluation method based on clustering index is consistent with the evaluation method based on manual labeling.
【作者單位】: 江西師范大學(xué)計算機(jī)信息工程學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(60963014) 江西省自然科學(xué)基金資助項目(2008GZS0052) 江西省科技攻關(guān)項目(2006-184) 江西省教育廳科技課題(2007-129)
【分類號】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張文慧;張冉;;基于中文分詞的農(nóng)業(yè)信息檢索平臺設(shè)計[J];安徽農(nóng)業(yè)科學(xué);2011年20期
2 楊永健;;淺議圖書館新型OPAC系統(tǒng)發(fā)展趨勢——以匯文OPAC系統(tǒng)為例[J];四川圖書館學(xué)報;2011年03期
3 黃名選;朱家安;馮平;;基于正負(fù)關(guān)聯(lián)規(guī)則融合的信息檢索模型[J];情報理論與實(shí)踐;2011年07期
4 吳謀碩;;基于用戶信息的信息檢索效果提高策略[J];電腦知識與技術(shù);2011年21期
5 劉勁松;張彬;柴文磊;魏建行;劉振鵬;;校園網(wǎng)園區(qū)搜索引擎的設(shè)計與實(shí)現(xiàn)[J];河北大學(xué)學(xué)報(自然科學(xué)版);2011年04期
6 吳慶濤;芮躍峰;張衛(wèi)星;;個性化搜索引擎中的用戶興趣模型分析與研究[J];現(xiàn)代計算機(jī);2011年08期
7 艾丹祥;左暉;楊君;;網(wǎng)絡(luò)信息檢索中相關(guān)反饋技術(shù)的Java實(shí)現(xiàn)[J];電腦知識與技術(shù);2011年16期
8 徐建民;陳振亞;;一種用于結(jié)構(gòu)化文檔檢索的貝葉斯網(wǎng)絡(luò)[J];計算機(jī)工程;2011年13期
9 謝根甲;王昊;;全國民辦高校綜合檢索數(shù)據(jù)庫建設(shè)與構(gòu)想[J];蘭臺世界;2011年15期
10 李明輝;;Thomson Reuters Integrity助力藥物研發(fā)[J];中華醫(yī)學(xué)圖書情報雜志;2011年04期
相關(guān)會議論文 前10條
1 ;編者的話[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
2 米曉紅;;一種基于LSI的用戶興趣模型構(gòu)建方法[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
3 王敬成;;HNC農(nóng)村智能信息檢索系統(tǒng)[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年
4 李應(yīng)興;付婷;李勇;;基于LUCENE的藏文信息檢索的研究與應(yīng)用[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
5 田田;馬軍;李躍軍;;應(yīng)用多本體進(jìn)行信息檢索的研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
6 吳立德;黃萱菁;;前言[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2004年
7 吳曉;李丹寧;林潔;冀肖榆;李丹;;個性化搜索引擎中用戶興趣模型的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
8 秦鵬;李恒訓(xùn);張華平;劉金剛;;基于關(guān)鍵詞提取的搜索結(jié)果聚類研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
9 陳志瑋;肖詩斌;施水才;王昕;;一種基于HTML位置信息的查詢擴(kuò)展技術(shù)[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
10 文健;李舟軍;;基于聚類語言模型的生物文獻(xiàn)檢索技術(shù)研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前10條
1 希安;微軟試水信息檢索[N];經(jīng)濟(jì)日報;2004年
2 本報記者 潘永花;組件化平臺提升信息檢索效率[N];網(wǎng)絡(luò)世界;2003年
3 柏榮;國家973項目在因特網(wǎng)大規(guī)模信息檢索領(lǐng)域取得突破[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2003年
4 微軟中國研究院 陳正 李明鏡 馬維英;互聯(lián)網(wǎng)上圖像信息檢索[N];計算機(jī)世界;2001年
5 于振海;Microsoft Office 2003的翻譯服務(wù)你用了嗎?[N];中國電腦教育報;2004年
6 高麗華;信息化遭遇新雷區(qū)[N];計算機(jī)世界;2007年
7 李茂 編譯;創(chuàng)新是技術(shù)素養(yǎng)的第一要求[N];中國教師報;2007年
8 涂序彥 陳泓娟;在網(wǎng)絡(luò)信息海洋中淘金[N];計算機(jī)世界;2001年
9 西安 張樹忠 時劍;如何使用Word 2003翻譯功能[N];電子報;2004年
10 清華大學(xué)計算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗室 張敏 金奕江;“!敝袚啤罢洹盵N];計算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前10條
1 吳定峰;基于本體的語義搜索模型研究[D];中國農(nóng)業(yè)科學(xué)院;2012年
2 董道國;高維數(shù)據(jù)索引結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2005年
3 翟海軍;面向Web信息檢索的知識挖掘[D];中國科學(xué)技術(shù)大學(xué);2010年
4 林建方;詞搭配抽取及在信息檢索中的應(yīng)用研究[D];哈爾濱工業(yè)大學(xué);2010年
5 郭永明;XML文檔交互式信息檢索技術(shù)研究[D];東華大學(xué);2010年
6 林古立;互聯(lián)網(wǎng)信息檢索中的多樣化排序研究及應(yīng)用[D];華南理工大學(xué);2011年
7 馬馬杜 ?ɡ;基于多智能體的流體動力行業(yè)虛擬聯(lián)盟信息檢索的研究[D];浙江大學(xué);2002年
8 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學(xué);2005年
9 張毅波;史文結(jié)構(gòu)化信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(軟件研究所);2001年
10 王鑫印;無結(jié)構(gòu)和半結(jié)構(gòu)信息檢索相關(guān)技術(shù)研究[D];復(fù)旦大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 喬智勇;Web數(shù)據(jù)挖掘系統(tǒng)的設(shè)計及關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2002年
2 楊才峰;基于自動分類的元搜索引擎的研究與應(yīng)用[D];華北電力大學(xué)(河北);2005年
3 宋海林;基于語言模型的信息檢索中負(fù)反饋技術(shù)的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2011年
4 杭月芹;基于文檔查詢信息的檢索系統(tǒng)研究與實(shí)現(xiàn)[D];揚(yáng)州大學(xué);2005年
5 史錦榮;基于多Agent智能搜索引擎模型研究[D];太原理工大學(xué);2005年
6 吳媛媛;移動終端上個人信息檢索核心子系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
7 羅建利;基于用戶興趣的概念查詢擴(kuò)展研究[D];揚(yáng)州大學(xué);2005年
8 曹雙喜;研究生在CNKI數(shù)字圖書館信息檢索過程中的選擇行為研究[D];西南大學(xué);2006年
9 馬志柔;中文信息檢索分類技術(shù)的研究[D];北京化工大學(xué);2005年
10 袁曉豐;列表類自動問題問答系統(tǒng)的設(shè)計與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2008年
,本文編號:1894919
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1894919.html