基于Lucene的英漢跨語(yǔ)言信息檢索
本文選題:信息檢索 切入點(diǎn):跨語(yǔ)言信息檢索 出處:《計(jì)算機(jī)工程》2005年13期 論文類型:期刊論文
【摘要】:描述了一個(gè)英漢跨語(yǔ)言檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),其主要研究目的在于尋找更為有效的英漢查詢翻譯方法,以及提高漢語(yǔ)檢索系統(tǒng)的性能。在英漢查詢翻譯方面,以英漢雙語(yǔ)詞典為基礎(chǔ),建立了查詢翻譯算法。在漢語(yǔ)檢索方面,分析不同索引單元對(duì)于檢索性能的影響,基于Lucene全文索引工具包建立了搜索引擎。在系統(tǒng)評(píng)測(cè)方面,提出了一種根據(jù)主題,快速構(gòu)建評(píng)測(cè)數(shù)據(jù)的方法。
[Abstract]:This paper describes the design and implementation of an English-Chinese cross-language retrieval system, the main purpose of which is to find a more effective method for English-Chinese query translation and to improve the performance of the Chinese retrieval system. On the basis of English-Chinese bilingual dictionaries, a query translation algorithm is established. In the aspect of Chinese retrieval, the influence of different index units on retrieval performance is analyzed, and a search engine based on Lucene full-text indexing toolkit is established. This paper presents a method to quickly construct the evaluation data according to the topic.
【作者單位】: 復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)與工程系 復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)與工程系
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(60203010)
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊皓東;江凌;李國(guó)俊;;國(guó)內(nèi)自然語(yǔ)言處理研究熱點(diǎn)分析——基于共詞分析[J];圖書情報(bào)工作;2011年10期
2 史曉東;盧亞軍;;央金藏文分詞系統(tǒng)[J];中文信息學(xué)報(bào);2011年04期
3 趙小兵;邱莉榕;趙鐵軍;;多民族語(yǔ)言本體知識(shí)庫(kù)構(gòu)建技術(shù)[J];中文信息學(xué)報(bào);2011年04期
4 王利鑫;耿煥同;孫凱;張茜;;基于自然語(yǔ)言處理的文本泄密自動(dòng)檢測(cè)技術(shù)[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年08期
5 安見才讓;;藏語(yǔ)句子相似度算法的研究[J];中文信息學(xué)報(bào);2011年04期
6 劉興林;鄭啟倫;馬千里;;中文合成詞識(shí)別及分詞修正[J];計(jì)算機(jī)應(yīng)用研究;2011年08期
7 張海軍;彭成;欒靜;;基于外部排序的字串左右熵快速計(jì)算方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年19期
8 袁里馳;;基于詞聚類的依存句法分析[J];中南大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年07期
9 胡莉;;中文“詞”的語(yǔ)言模型識(shí)別研究方法綜述[J];北方文學(xué)(下半月);2011年03期
10 劉小明;樊孝忠;劉里;;融合事件信息的復(fù)雜問句分析方法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年07期
相關(guān)會(huì)議論文 前10條
1 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 劉群;張浩;白碩;;中文信息處理開放平臺(tái)的設(shè)計(jì)[A];第一屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2002年
3 支流;朱學(xué)鋒;段慧明;俞士汶;;中文縮略語(yǔ)還原技術(shù)初探[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
4 鄭家恒;譚紅葉;王興義;;基于模式匹配的中文專有名詞識(shí)別[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
5 葛詩(shī)利;陳瀟瀟;;中國(guó)EFL學(xué)習(xí)者自動(dòng)作文評(píng)分探索[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
6 宋柔;;自然語(yǔ)言處理中語(yǔ)言知識(shí)的基礎(chǔ)性地位[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
7 楊麗鵬;林世平;;基于關(guān)聯(lián)規(guī)則和自然語(yǔ)言處理技術(shù)的概念間非分類關(guān)系的抽取[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
8 孫玉芳;;中文信息處理與國(guó)家信息化建設(shè)[A];面向21世紀(jì)的科技進(jìn)步與社會(huì)經(jīng)濟(jì)發(fā)展(上冊(cè))[C];1999年
9 張sソ,
本文編號(hào):1578572
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1578572.html