Luder基于內(nèi)容的文檔搜索引擎.pdf 全文
本文關(guān)鍵詞:Luder基于內(nèi)容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
天津工業(yè)大學(xué)
碩士學(xué)位論文
Luder基于內(nèi)容的文檔搜索引擎
姓名:竇亞君
申請學(xué)位級別:碩士
專業(yè):計算機應(yīng)用技術(shù)
指導(dǎo)教師:韓其睿
座機電話號碼
中文摘要
Web搜索技術(shù)的發(fā)展,加快了用戶在海量信息的互聯(lián)網(wǎng)上查找需要的信息的
速度,極大地推動了網(wǎng)絡(luò)資源的共享。與此同時,同等重要的本地文檔資源被忽
視了而且由于本地文檔資源的特殊性,不可能與Web共享。用戶在本地文件系統(tǒng)
中查相關(guān)性質(zhì)的文件內(nèi)容時,需要不斷地翻閱目錄去閱讀這些文件,嚴重地降低
了文檔查找效率,本地文檔資源沒有有效的利用。
本文研究并實現(xiàn)基于全文檢索的桌面文檔搜索引擎,在Lucene開源搜索框
架基礎(chǔ)上,重新封裝核心功能,實現(xiàn)對多種格式的本地文檔搜索功能,,使用戶在
系統(tǒng)中全局地掌握桌面文檔資源;構(gòu)建基于SⅥrl"圖形界面庫可移植的交互界面,
讓用戶方便地與系統(tǒng)交互;運用中文分詞理論實現(xiàn)支持中/英文的
式匹配,解決了Lucene對中文支持不好的問題;針對不同格式的文檔,構(gòu)建多
種類型解析器 Parser 抽取文檔文本用于建立索引,支持多種流行的文檔格式。
‘本系統(tǒng)有效地解決了桌面應(yīng)用中對于文檔查詢的問題,實現(xiàn)基于內(nèi)容查找、提高
查找效率與速度,更有效地利用桌面文檔資源。
關(guān)鍵詞:搜索引擎、桌面搜索、全文檢索、倒排索引,文檔格式、Lucene、中文
分詞
Abstract
The
of
inWeb
the
ofUSerS’
developmenttechnologySearchingquickenspeed
本文關(guān)鍵詞:Luder基于內(nèi)容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
本文編號:112663
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/112663.html