中學文科教材全文檢索系統(tǒng)的設(shè)計與實現(xiàn)
本文選題:中學文科教材 + 全文檢索 ; 參考:《中央民族大學》2017年碩士論文
【摘要】:隨著信息時代的來臨和信息技術(shù)的迅猛發(fā)展,學習資源不僅僅以紙為載體,將一部分學習資源信息化、電子化已經(jīng)是現(xiàn)代教育的發(fā)展趨勢,其中教材資源就包括在這學習資源中。學生、教師在大規(guī)模的信息中如何快速精確的找到自己所需要的學習信息,而不是迷失在茫茫數(shù)據(jù)的大海中,這是一個需要思索的問題。全文檢索是對文檔集中的詞建立倒排索引,記錄每個詞語在文檔集中出現(xiàn)的頻率和位置,在進行查詢時會對倒排索引進行檢索,提高檢索效率,而全文檢索系統(tǒng)就是應用全文檢索技術(shù)建立起來的系統(tǒng)體系。因此,針對教育領(lǐng)域的全文檢索系統(tǒng)的開發(fā)與實現(xiàn)是有意義的。本次畢業(yè)設(shè)計使用Elastic Search搜索引擎調(diào)用底層Lucene工具包開發(fā)了中學文科教材全文檢索系統(tǒng),主要工作內(nèi)容如下:(1)收集和整理中學文科教材語料;(2)對全文檢索的相關(guān)技術(shù)進行研究,對全文檢索技術(shù)中計算相似度值的公式進行了分析,提供了條件檢索的功能,包括全文檢索、復合檢索、作者、科目、年級、題目檢索類別;(3)在系統(tǒng)后臺我們使用ES庫來存儲收集到的教材文本,并且將這些文檔使用IK分詞器進行分詞,通過ES建立倒排索引,在檢索模塊使用MVC框架來搭建,將系統(tǒng)的數(shù)據(jù)、顯示、業(yè)務(wù)功能分成不同的模塊,使得開發(fā)過程中邏輯層次更加清晰,在后期的維護中也更加便捷;(4)系統(tǒng)前臺頁面使用JSP技術(shù),為信息檢索提供界面,前臺頁面主要包括了查詢頁、結(jié)果列表頁和信息詳情頁,通過接口的調(diào)用和方法類的實現(xiàn),將檢索得到的信息展示在Web頁面并且在前臺檢索結(jié)果頁面高亮顯示檢索詞。本次畢業(yè)設(shè)計希望可以幫助學生和教師在進行檢索之后,對與輸入關(guān)鍵字相關(guān)的各大初中文科教材內(nèi)容有一個整體的把握,便利用戶查找感興趣的相關(guān)內(nèi)容。本次畢業(yè)設(shè)計將有助于用戶提高檢索效率,促進用戶深入地學習相關(guān)知識,提高教學質(zhì)量。
[Abstract]:With the advent of the information age and the rapid development of information technology, learning resources not only take paper as the carrier, part of the learning resources information, electronic has been the development trend of modern education. Among them, the textbook resources are included in the learning resources. It is a problem that students and teachers need to think about how to find the learning information they need quickly and accurately in the large-scale information, instead of being lost in the sea of vast data. Full-text retrieval is to build inverted index of words in document set, record the frequency and position of each word appearing in document set, search inverted index in query, improve retrieval efficiency. And the full-text retrieval system is the system established by using the full-text retrieval technology. Therefore, it is meaningful to develop and implement the full-text retrieval system in the field of education. This graduation project has developed a full-text retrieval system for liberal arts textbooks in middle schools using the Elastic Search search engine calling the underlying Lucene toolkit. The main work is as follows: 1) collecting and sorting out the corpus of Chinese liberal arts textbooks. (2) researching on the related techniques of full-text retrieval. This paper analyzes the formula of calculating similarity value in full-text retrieval technology, and provides the functions of conditional retrieval, including full-text retrieval, compound retrieval, author, subject, grade, etc. In the background of the system, we use es library to store the collected text of teaching materials, and use IK participle to segment these documents, build inverted index through es, and use MVC framework to build the retrieval module. The data of the system, display, business function are divided into different modules, which makes the logic level more clear in the development process, and also more convenient in the later maintenance) the system foreground page uses JSP technology to provide the interface for information retrieval. The front page mainly includes the query page, the result list page and the information detail page, through the interface call and the method class realization, displays the retrieved information in the Web page and highlights the key words in the foreground retrieval result page. This graduation project hopes to help the students and teachers to have a comprehensive grasp of the contents of the liberal arts textbooks related to the input keywords after the retrieval, and to facilitate the users to find the relevant content of interest. This graduation project will help users to improve the efficiency of retrieval, promote the users to learn relevant knowledge, improve the quality of teaching.
【學位授予單位】:中央民族大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.3;G434
【相似文獻】
相關(guān)期刊論文 前9條
1 楊則正;Calera's Wordscan全文檢索系統(tǒng)[J];管理科學文摘;1997年09期
2 周拴龍;全文檢索系統(tǒng)軟件功能研究[J];河南師范大學學報(哲學社會科學版);1994年02期
3 林永照;;學生優(yōu)秀論文全文檢索系統(tǒng)的開發(fā)與利用[J];濟南職業(yè)學院學報;2009年01期
4 李琳;超文本全文檢索系統(tǒng)模型分析[J];青島海洋大學學報(社會科學版);1997年02期
5 鐘鋒;;基于Lucene的全文檢索系統(tǒng)研究與實現(xiàn)[J];浙江外國語學院學報;2013年04期
6 潘以鋒;;基于Lucene的網(wǎng)站全文檢索系統(tǒng)的開發(fā)[J];廣西教育學院學報;2006年05期
7 胡飛龍;;用VFP開發(fā)文本全文檢索系統(tǒng)[J];常州教育學院學報(綜合版);1999年01期
8 謝松;楊志永;;CNKI知識搜索檢索技術(shù)及評價[J];科教文匯(下旬刊);2009年08期
9 ;[J];;年期
相關(guān)會議論文 前2條
1 趙慧;李春明;鮑可進;;一種基于DotLucene搜索引擎的知識庫中文全文檢索系統(tǒng)[A];第二十二屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 周小庭;;用Info Digger全文檢索系統(tǒng)構(gòu)建首都師大基教中心網(wǎng)上平臺[A];OA’99辦公自動化全國學術(shù)研討暨展示會論文集[C];1999年
相關(guān)重要報紙文章 前2條
1 肖詩斌;全文檢索技術(shù)的深層剖析[N];中國計算機報;2003年
2 羅懿;世紀永聯(lián)搜索引擎獲獎[N];中國企業(yè)報;2000年
相關(guān)博士學位論文 前1條
1 吳煒;密文全文檢索系統(tǒng)中的索引機制研究[D];華中科技大學;2009年
相關(guān)碩士學位論文 前10條
1 黃小文;基于NoSQL存儲的海量文檔全文檢索系統(tǒng)的研究與實現(xiàn)[D];華北電力大學;2015年
2 張雯;TextRank算法的改進及在政法全文檢索系統(tǒng)中的應用[D];廣西大學;2015年
3 陶化忠;基于MapReduce全文檢索系統(tǒng)設(shè)計與實現(xiàn)[D];東北大學;2014年
4 陳碧榮;中學文科教材全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];中央民族大學;2017年
5 何勝利;礦山法律法規(guī)全文檢索系統(tǒng)的研究與應用[D];西安建筑科技大學;2005年
6 楊鎰菲;基于云存儲的分布式全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學;2012年
7 蔡晶晶;多文檔全文檢索系統(tǒng)的設(shè)計與開發(fā)[D];電子科技大學;2013年
8 王紅勝;多文檔全文檢索系統(tǒng)的設(shè)計與開發(fā)[D];電子科技大學;2010年
9 劉超;專利全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學;2010年
10 李秦;基于用戶行為的全文檢索系統(tǒng)個性化推薦研究[D];西南大學;2009年
,本文編號:1904036
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1904036.html