天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 圖書檔案論文 >

跨語言信息檢索技術的研究與實現(xiàn)

發(fā)布時間:2021-10-11 01:36
  在信息檢索領域,由于當今海量信息資源所用語種的多樣性和用戶所掌握語言的差異性,導致人們在進行文本信息檢索的時候產生語言障礙問題。而隨著用戶對多語言信息綜合獲取的需求不斷增長,跨語言信息檢索技術迅速發(fā)展,并將日益發(fā)揮重要作用。目前大多數(shù)跨語言信息檢索采用提問式翻譯方法,而如何提高翻譯的準確性成為跨語言檢索領域主要研究內容之一。本文在研究了跨語言信息檢索相關關鍵技術的基礎上,基于開放平臺ApacheLucene設計實現(xiàn)了中英文跨語言檢索系統(tǒng)。論文闡述了跨語言信息檢索理論和現(xiàn)有技術,研究了跨語言信息檢索中語言翻譯和信息檢索方法,設計了采用提問式翻譯和語義映射的跨語言信息檢索模型,解決了跨語言信息檢索中的翻譯歧義性問題;改進了信息索引流程和檢索結果排序算法,提高了檢索結果優(yōu)先匹配的準確性;在分析了Lucene信息檢索平臺的體系結構和模塊功能基礎上,設計實現(xiàn)了中英文跨語言檢索系統(tǒng)CLIRS,并在應用環(huán)境中驗證了跨語言信息檢索模型的有效性和系統(tǒng)各模塊功能。測試結果表明,CLIRS系統(tǒng)采用的中英文跨語言翻譯模型以及結果排序算法更好地實現(xiàn)了中英文雙向跨語言信息檢索。 

【文章來源】:西安電子科技大學陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

跨語言信息檢索技術的研究與實現(xiàn)


Lucene索引文件概念結構

索引文件結構


所記錄的域記錄號維持對應關系,在圖 3.4 中 segment1.fdx 與 segment1.tii 中就是通過這種方式保持聯(lián)系。這樣,域集合和項集合不僅僅聯(lián)系起來,而且其中的文件之間也相互聯(lián)系起來。此外,標準化因子文件和被刪除文檔文件則提供了一些程序內部的輔助設施(標準化因子用在評分排序機制中,被刪除文檔是一種偽刪除手段)。這樣,整個段的索引信息就通過這些文檔有機的組成。圖 3.3 Lucene 索引文件概念結構

文本,索引,內容,索引文件


WhitespaceAnalyzer處理文檔集寫索引文件生成索引文件結束圖 3.5 建立索引流程 對英文的支持很好,而且分析器 StandardA容為中英文混合時,CLucene 為其建立的索看 CLucene 為文本建立的索引內容。 內容為:u 盤可以用來儲存數(shù)據(jù)。 內容為:能儲存數(shù)據(jù)的東西有 u 盤。 CLucene 為這兩篇文本建立的索引內容如

【參考文獻】:
期刊論文
[1]基于Lucene的中文倒排索引技術的研究[J]. 鄭榕增,林世平.  計算機技術與發(fā)展. 2010(03)
[2]跨語言信息檢索方法概述[J]. 駱衛(wèi)華.  數(shù)字圖書館論壇. 2006(09)
[3]重新審視跨語言信息檢索[J]. 閔金明,孫樂,張俊林.  中文信息學報. 2006(04)
[4]跨語言信息檢索的發(fā)展與展望[J]. 任成梅.  圖書館學研究. 2006(04)
[5]信息檢索技術的設計探討[J]. 曹蓓蓓.  河北建筑科技學院學報. 2005(03)
[6]跨語言檢索技術:策略與方法[J]. 賴茂生,侯艷飛.  鄭州大學學報(哲學社會科學版). 2005(04)
[7]跨語言信息檢索實現(xiàn)方法與關鍵技術探討[J]. 王昊.  情報雜志. 2005(07)
[8]基于本體的跨語言信息檢索模型[J]. 王進,陳恩紅,張振亞,王煦法.  中文信息學報. 2004(03)
[9]論跨語言網(wǎng)絡信息檢索技術系統(tǒng):以Mulinex為例[J]. 陸寶益,陸寶忠.  情報科學. 2001(08)

碩士論文
[1]基于Lucene的全文檢索系統(tǒng)模型的研究[D]. 黃杰.暨南大學 2007



本文編號:3429538

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3429538.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶239fb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com