天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Lucene的蒙古文全文檢索系統(tǒng)研究與實現(xiàn)

發(fā)布時間:2018-05-07 10:19

  本文選題:Lucene + 全文檢索 ; 參考:《內(nèi)蒙古師范大學(xué)》2013年碩士論文


【摘要】:隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,從海量數(shù)據(jù)資源中獲取有用的信息,已成為廣大用戶急需解決的一個問題。蒙古文是我國重要的少數(shù)民族語言文字之一,隨著蒙古族人民網(wǎng)絡(luò)知識的不斷增長,從互聯(lián)網(wǎng)上獲取豐富的數(shù)據(jù)信息已成為廣大蒙古族人民的迫切需要。因此,為了幫助蒙古族用戶快速準(zhǔn)確地檢索所需信息,構(gòu)建一個蒙古文全文檢索系統(tǒng)是非常有必要的。 本文研究并實現(xiàn)的基于Lucene的國際標(biāo)準(zhǔn)編碼蒙古文全文檢索系統(tǒng),不僅可以實現(xiàn)國際標(biāo)準(zhǔn)編碼蒙古文的全文檢索功能,推動國際標(biāo)準(zhǔn)編碼蒙古文網(wǎng)絡(luò)化應(yīng)用的發(fā)展,同時還對蒙古文字適應(yīng)信息時代發(fā)展的需求和國際標(biāo)準(zhǔn)編碼蒙古文搜索引擎的快速發(fā)展起著積極作用。隨著蒙古文信息處理研究工作的不斷深入,,蒙古文全文檢索技術(shù)還可以為蒙古文搜索引擎、語法信息詞典建設(shè)、機(jī)器翻譯、文本自動分類、自動摘要、自動校對等領(lǐng)域的快速發(fā)展提供幫助。因此,基于Lucene的國際標(biāo)準(zhǔn)編碼蒙古文全文檢索技術(shù)的研究具有非常關(guān)鍵的作用。 本文以實現(xiàn)國際標(biāo)準(zhǔn)編碼的蒙古文全文檢索系統(tǒng)為研究目標(biāo)。學(xué)習(xí)了全文檢索的基礎(chǔ)理論和發(fā)展現(xiàn)狀;解析了基于Lucene的全文檢索系統(tǒng)的架構(gòu);了解了全文檢索系統(tǒng)的結(jié)構(gòu)與功能、建立索引、查詢處理、結(jié)果優(yōu)化處理和信息檢索評價的方法等;分析了Lucene的一些基本概念、組織結(jié)構(gòu)和工作原理等。本文重點(diǎn)研究了國際標(biāo)準(zhǔn)編碼蒙古文的構(gòu)詞特點(diǎn),并設(shè)計了一個符合蒙古文構(gòu)詞特點(diǎn)的蒙古文分詞器,實現(xiàn)了對國際標(biāo)準(zhǔn)編碼蒙古文詞的正確切分,進(jìn)而設(shè)計了基于Lucene的蒙古文全文檢索系統(tǒng),實現(xiàn)了對國際標(biāo)準(zhǔn)編碼蒙古文的全文檢索功能。實驗結(jié)果表明本系統(tǒng)對蒙古文全文檢索的查全率和查準(zhǔn)率都有了很大提升,進(jìn)而說明本文方法是有效的。
[Abstract]:With the continuous development of computer technology and network technology, obtaining useful information from massive data resources has become an urgent problem for the majority of users. Mongolian language is one of the most important minority languages in China. With the increasing of Mongolian people's network knowledge, it has become an urgent need for the vast numbers of Mongolian people to obtain abundant data and information from the Internet. Therefore, it is necessary to construct a Mongolian full-text retrieval system in order to help Mongolian users retrieve the required information quickly and accurately. In this paper, an international standard coding Mongolian full-text retrieval system based on Lucene is studied and implemented, which can not only realize the full-text retrieval function of international standard coding Mongolian, but also promote the development of international standard coding Mongolian network application. It also plays an active role in adapting Mongolian characters to the needs of the development of the information age and the rapid development of the international standard coding search engine. With the development of Mongolian information processing research, Mongolian full-text retrieval technology can also be used for Mongolian search engine, grammar information dictionary construction, machine translation, automatic text classification, automatic summary. Automatic proofreading and other areas of rapid development to help. Therefore, the research of Lucene-based international standard coding Mongolian full-text retrieval technology is very important. The aim of this thesis is to realize the Mongolian full-text retrieval system with international standard coding. This paper studies the basic theory and development status of full-text retrieval, analyzes the framework of full-text retrieval system based on Lucene, understands the structure and function of full-text retrieval system, establishes index and query processing, Results some basic concepts, organization structure and working principle of Lucene were analyzed. This paper focuses on the study of the word-formation characteristics of the international standard coding Mongolian, and designs a Mongolian word segmentation device which accords with the Mongolian word-formation characteristics, and realizes the correct segmentation of the international standard coding Mongolian words. Furthermore, a Mongolian full-text retrieval system based on Lucene is designed, and the full-text retrieval function of international standard coding Mongolian is realized. The experimental results show that the recall rate and precision rate of Mongolian full-text retrieval have been greatly improved by this system, which further shows that the method in this paper is effective.
【學(xué)位授予單位】:內(nèi)蒙古師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 蔣明原;孔令德;;基于Lucene的藏文信息采集及檢索系統(tǒng)研究[J];電腦開發(fā)與應(yīng)用;2011年02期

相關(guān)碩士學(xué)位論文 前10條

1 岳俊英;蒙古文信息檢索系統(tǒng)中檢索單元選取方法的研究[D];內(nèi)蒙古大學(xué);2011年

2 明玉;基于詞典、規(guī)則與統(tǒng)計的蒙古文詞切分系統(tǒng)的研究[D];內(nèi)蒙古大學(xué);2011年

3 關(guān)高娃;蒙古文停用詞和英文停用詞比較研究[D];內(nèi)蒙古大學(xué);2011年

4 塔娜;面向跨語言信息檢索的蒙漢語義詞典構(gòu)建[D];內(nèi)蒙古師范大學(xué);2011年

5 李立;中文信息檢索系統(tǒng)研究[D];華中師范大學(xué);2008年

6 王睿;蒙古文網(wǎng)頁抓取及編碼識別轉(zhuǎn)換研究[D];內(nèi)蒙古大學(xué);2008年

7 金威;蒙古文信息檢索模型的研究[D];內(nèi)蒙古大學(xué);2009年

8 阿雅娜;蒙古文停用詞表和詞干提取對蒙古文文本分類的影響[D];內(nèi)蒙古大學(xué);2009年

9 趙偉;條件隨機(jī)場在蒙古語詞切分中的應(yīng)用[D];內(nèi)蒙古大學(xué);2009年

10 劉鶯迎;基于lucene中文全文檢索系統(tǒng)的研究與實現(xiàn)[D];鄭州大學(xué);2009年



本文編號:1856538

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1856538.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f6ead***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
东北女人的逼操的舒服吗| 国产成人免费激情视频| 国产一区欧美午夜福利| 青青操日老女人的穴穴| 国产一区二区精品丝袜| 狠色婷婷久久一区二区三区| 国产精品欧美一区两区| 日韩色婷婷综合在线观看| 免费观看潮喷到高潮大叫| 99久久精品视频一区二区| 樱井知香黑人一区二区| 东北老熟妇全程露脸被内射| 亚洲欧美日韩国产综合在线| 成年人免费看国产视频| 国产内射一级一片内射高清视频 | 欧美国产日本免费不卡| 激情五月激情婷婷丁香| 成人精品国产亚洲av久久| 亚洲欧美日韩国产自拍| 中文字幕久久精品亚洲乱码| 国内女人精品一区二区三区| 精品女同一区二区三区| 欧美日韩国产精品第五页| 国产精品国三级国产专不卡| 91日韩欧美中文字幕| 日本黄色美女日本黄色| 国产精品十八禁亚洲黄污免费观看| 亚洲国产黄色精品在线观看| 毛片在线观看免费日韩| 亚洲a码一区二区三区| 欧美黑人巨大一区二区三区| 中国少妇精品偷拍视频 | 91亚洲人人在字幕国产| 四十女人口红哪个色好看| 亚洲人妻av中文字幕| 超薄丝袜足一区二区三区| 国产亚洲欧美日韩精品一区| 欧美日韩乱一区二区三区| 国产又粗又猛又黄又爽视频免费| 日本大学生精油按摩在线观看 | 国产一级内射麻豆91|