基于多角度關(guān)聯(lián)模型的實體檢索方法
發(fā)布時間:2017-12-21 18:18
本文關(guān)鍵詞:基于多角度關(guān)聯(lián)模型的實體檢索方法 出處:《計算機工程》2013年01期 論文類型:期刊論文
更多相關(guān)文章: 文本挖掘 關(guān)聯(lián)規(guī)則 實體檢索 實體名識別 詞頻-逆文檔頻率 維基百科 搜索引擎
【摘要】:針對信息檢索領(lǐng)域特定類型實體的檢索問題,在傳統(tǒng)搜索引擎的基礎(chǔ)上,提出一種基于多角度關(guān)聯(lián)模型的實體檢索方法,綜合運用實體名識別(NER)、文本向量、關(guān)聯(lián)規(guī)則等技術(shù)以及Wikipedia、Stanford NER等工具,并在TREC2010實體檢索項目中進行評測。實驗結(jié)果表明,與基于BM25和貝葉斯模型的檢索方法相比,該方法的nDCG@R值平均提高11.49%和18.09%。
【作者單位】: 復(fù)旦大學計算機科學技術(shù)學院;
【基金】:國家“863”計劃基金資助項目(2009AA01Z429)
【分類號】:TP391.3
【正文快照】: 1概述互聯(lián)網(wǎng)已經(jīng)成為人們獲取信息的重要渠道,在很多情況下,用戶想要尋找與實體相關(guān)的其他實體的信息,如與實體“奧斯卡”相關(guān)的問題“獲得今年奧斯卡最佳導演提名的人有哪些”,用戶希望得到的是獲得提名的人員列表,但是基于關(guān)鍵詞的傳統(tǒng)搜索引擎返回的結(jié)果是網(wǎng)頁的列表。在
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學學報(自然科學版);2002年05期
2 王宏志;樊文飛;;復(fù)雜數(shù)據(jù)上的實體識別技術(shù)研究[J];計算機學報;2011年10期
3 拜戰(zhàn)勝;徐德智;彭佳紅;陳光儀;;基于主題本體的信息采集模型研究[J];計算機技術(shù)與發(fā)展;2009年10期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 梁峰;金瑩;;基于Agent技術(shù)的語義網(wǎng)服務(wù)模型[J];安徽廣播電視大學學報;2008年01期
2 陶皖,李平,廖述梅;當前基于本體的語義標注工具的分析[J];安徽工程科技學院學報(自然科學版);2005年02期
3 趙秀芳;;基于本體的農(nóng)業(yè)信息檢索[J];安徽農(nóng)業(yè)科學;2006年10期
4 蔡f,
本文編號:1316705
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1316705.html
最近更新
教材專著