天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Lucene的蒙古文全文檢索系統(tǒng)研究與實現

發(fā)布時間:2018-05-07 10:19

  本文選題:Lucene + 全文檢索 ; 參考:《內蒙古師范大學》2013年碩士論文


【摘要】:隨著計算機技術和網絡技術的不斷發(fā)展,從海量數據資源中獲取有用的信息,已成為廣大用戶急需解決的一個問題。蒙古文是我國重要的少數民族語言文字之一,隨著蒙古族人民網絡知識的不斷增長,從互聯網上獲取豐富的數據信息已成為廣大蒙古族人民的迫切需要。因此,為了幫助蒙古族用戶快速準確地檢索所需信息,構建一個蒙古文全文檢索系統(tǒng)是非常有必要的。 本文研究并實現的基于Lucene的國際標準編碼蒙古文全文檢索系統(tǒng),不僅可以實現國際標準編碼蒙古文的全文檢索功能,推動國際標準編碼蒙古文網絡化應用的發(fā)展,同時還對蒙古文字適應信息時代發(fā)展的需求和國際標準編碼蒙古文搜索引擎的快速發(fā)展起著積極作用。隨著蒙古文信息處理研究工作的不斷深入,,蒙古文全文檢索技術還可以為蒙古文搜索引擎、語法信息詞典建設、機器翻譯、文本自動分類、自動摘要、自動校對等領域的快速發(fā)展提供幫助。因此,基于Lucene的國際標準編碼蒙古文全文檢索技術的研究具有非常關鍵的作用。 本文以實現國際標準編碼的蒙古文全文檢索系統(tǒng)為研究目標。學習了全文檢索的基礎理論和發(fā)展現狀;解析了基于Lucene的全文檢索系統(tǒng)的架構;了解了全文檢索系統(tǒng)的結構與功能、建立索引、查詢處理、結果優(yōu)化處理和信息檢索評價的方法等;分析了Lucene的一些基本概念、組織結構和工作原理等。本文重點研究了國際標準編碼蒙古文的構詞特點,并設計了一個符合蒙古文構詞特點的蒙古文分詞器,實現了對國際標準編碼蒙古文詞的正確切分,進而設計了基于Lucene的蒙古文全文檢索系統(tǒng),實現了對國際標準編碼蒙古文的全文檢索功能。實驗結果表明本系統(tǒng)對蒙古文全文檢索的查全率和查準率都有了很大提升,進而說明本文方法是有效的。
[Abstract]:With the continuous development of computer technology and network technology, obtaining useful information from massive data resources has become an urgent problem for the majority of users. Mongolian language is one of the most important minority languages in China. With the increasing of Mongolian people's network knowledge, it has become an urgent need for the vast numbers of Mongolian people to obtain abundant data and information from the Internet. Therefore, it is necessary to construct a Mongolian full-text retrieval system in order to help Mongolian users retrieve the required information quickly and accurately. In this paper, an international standard coding Mongolian full-text retrieval system based on Lucene is studied and implemented, which can not only realize the full-text retrieval function of international standard coding Mongolian, but also promote the development of international standard coding Mongolian network application. It also plays an active role in adapting Mongolian characters to the needs of the development of the information age and the rapid development of the international standard coding search engine. With the development of Mongolian information processing research, Mongolian full-text retrieval technology can also be used for Mongolian search engine, grammar information dictionary construction, machine translation, automatic text classification, automatic summary. Automatic proofreading and other areas of rapid development to help. Therefore, the research of Lucene-based international standard coding Mongolian full-text retrieval technology is very important. The aim of this thesis is to realize the Mongolian full-text retrieval system with international standard coding. This paper studies the basic theory and development status of full-text retrieval, analyzes the framework of full-text retrieval system based on Lucene, understands the structure and function of full-text retrieval system, establishes index and query processing, Results some basic concepts, organization structure and working principle of Lucene were analyzed. This paper focuses on the study of the word-formation characteristics of the international standard coding Mongolian, and designs a Mongolian word segmentation device which accords with the Mongolian word-formation characteristics, and realizes the correct segmentation of the international standard coding Mongolian words. Furthermore, a Mongolian full-text retrieval system based on Lucene is designed, and the full-text retrieval function of international standard coding Mongolian is realized. The experimental results show that the recall rate and precision rate of Mongolian full-text retrieval have been greatly improved by this system, which further shows that the method in this paper is effective.
【學位授予單位】:內蒙古師范大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.3

【參考文獻】

相關期刊論文 前1條

1 蔣明原;孔令德;;基于Lucene的藏文信息采集及檢索系統(tǒng)研究[J];電腦開發(fā)與應用;2011年02期

相關碩士學位論文 前10條

1 岳俊英;蒙古文信息檢索系統(tǒng)中檢索單元選取方法的研究[D];內蒙古大學;2011年

2 明玉;基于詞典、規(guī)則與統(tǒng)計的蒙古文詞切分系統(tǒng)的研究[D];內蒙古大學;2011年

3 關高娃;蒙古文停用詞和英文停用詞比較研究[D];內蒙古大學;2011年

4 塔娜;面向跨語言信息檢索的蒙漢語義詞典構建[D];內蒙古師范大學;2011年

5 李立;中文信息檢索系統(tǒng)研究[D];華中師范大學;2008年

6 王睿;蒙古文網頁抓取及編碼識別轉換研究[D];內蒙古大學;2008年

7 金威;蒙古文信息檢索模型的研究[D];內蒙古大學;2009年

8 阿雅娜;蒙古文停用詞表和詞干提取對蒙古文文本分類的影響[D];內蒙古大學;2009年

9 趙偉;條件隨機場在蒙古語詞切分中的應用[D];內蒙古大學;2009年

10 劉鶯迎;基于lucene中文全文檢索系統(tǒng)的研究與實現[D];鄭州大學;2009年



本文編號:1856538

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1856538.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶f6ead***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com