Luder基于內容的文檔搜索引擎
本文關鍵詞:Luder基于內容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
本文對Luder基于內容的文檔搜索引擎進行了研究。文章在Lucene開源搜索框架基礎上,重新封裝核心功能,實現(xiàn)對多種格式的本地文檔搜索功能,使用戶在系統(tǒng)中全局地掌握桌面文檔資源;構建基于SWT圖形界面庫可移植的交互界面,讓用戶方便地與系統(tǒng)交互:運用中文分詞理論實現(xiàn)支持中/英文的 MandarinAnaylzer、基于詞典的分析、分詞模塊,最大可以支持5個漢字詞的模式匹配,解決了Lucene對中文支持不好的問題;針對不同格式的文檔,構建多種類型解析器(Parser)抽取文檔文本用于建立索引,支持多種流行的文檔格式。本系統(tǒng)有效地解決了桌面應用中對于文檔查詢的問題...
本文對Luder基于內容的文檔搜索引擎進行了研究。文章在Lucene開源搜索框架基礎上,重新封裝核心功能,實現(xiàn)對多種格式的本地文檔搜索功能,使用戶在系統(tǒng)中全局地掌握桌面文檔資源;構建基于SWT圖形界面庫可移植的交互界面,讓用戶方便地與系統(tǒng)交互:運用中文分詞理論實現(xiàn)支持中/英文的 MandarinAnaylzer、基于詞典的分析、分詞模塊,最大可以支持5個漢字詞的模式匹配,解決了Lucene對中文支持不好的問題;針對不同格式的文檔,構建多種類型解析器(Parser)抽取文檔文本用于建立索引,支持多種流行的文檔格式。本系統(tǒng)有效地解決了桌面應用中對于文檔查詢的問題,實現(xiàn)基于內容查找、提高查找效率與速度,更有效地利用桌面文檔資源。
展開
本文關鍵詞:Luder基于內容的文檔搜索引擎,由筆耕文化傳播整理發(fā)布。
,本文編號:91789
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/91789.html