基于Lucene的電子公文全文檢索系統(tǒng)研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于Lucene的電子公文全文檢索系統(tǒng)研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
《北京交通大學(xué)》 2015年
基于Lucene的電子公文全文檢索系統(tǒng)研究與實(shí)現(xiàn)
趙素燕
【摘要】:近年來(lái)信息技術(shù)飛速發(fā)展,企業(yè)信息化達(dá)到很高的水平,電子辦公成為企業(yè)日常工作交流的主要方式,電子公文成為了企業(yè)信息傳遞、保存的重要形式。企業(yè)各部門(mén)每天產(chǎn)生的電子公文越來(lái)越多,如何讓用戶能夠隨時(shí)快速全面地從這些電子公文中找到所關(guān)心的內(nèi)容,日趨顯得重要。與此同時(shí),網(wǎng)絡(luò)全文搜索引擎發(fā)展迅速,其搜索的高效和人性化極大地改變了人們的搜索習(xí)慣。因此,提供一種高效的檢索方式對(duì)于提高系統(tǒng)用戶的工作效率、改善用戶體驗(yàn)和提升企業(yè)信息化水平尤為重要。 本文深入分析了電子公文檢索系統(tǒng)的研究現(xiàn)狀和存在的不足,將Lucene全文檢索技術(shù)引入到企業(yè)的電子公文檢索中,構(gòu)建了基于Lucene的電子公文全文檢索引擎。著重就電子公文檢索的安全問(wèn)題、Lucene檢索實(shí)時(shí)索引問(wèn)題,以及檢索結(jié)果排序問(wèn)題進(jìn)行了深入研究,在現(xiàn)有的系統(tǒng)訪問(wèn)控制模型的基礎(chǔ)上,提出了一種擴(kuò)展的訪問(wèn)權(quán)限控制模型;通過(guò)查閱大量技術(shù)資料和進(jìn)行系統(tǒng)分析,研究并設(shè)計(jì)了Lucene實(shí)時(shí)索引;結(jié)合電子公文檢索結(jié)果排序的影響因素,改進(jìn)了Lucene默認(rèn)的檢索結(jié)果排序策略。并對(duì)企業(yè)電子公文部分實(shí)際業(yè)務(wù)進(jìn)行調(diào)研分析,構(gòu)建了小型的基于Lucene的電子公文全文檢索系統(tǒng)。將Lucene全文檢索技術(shù)應(yīng)用到電子公文的檢索中,實(shí)現(xiàn)了對(duì)電子公文統(tǒng)一入口、多數(shù)據(jù)源查詢的信息檢索方式,能夠?qū)τ脩糨斎氲牟樵冋Z(yǔ)句進(jìn)行擴(kuò)展,支持各種格式文檔的全文檢索,按一定的順序返回用戶具有訪問(wèn)權(quán)限的文檔,滿足了企業(yè)的實(shí)際檢索需求,并且對(duì)Lucene全文檢索技術(shù)在企業(yè)級(jí)搜索中的應(yīng)用具有一定的借鑒意義。
【關(guān)鍵詞】:
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP391.3
【目錄】:
下載全文 更多同類(lèi)文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 周平;;Lucene全文檢索引擎技術(shù)及應(yīng)用[J];重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版);2007年04期
2 于洪波;;中文分詞技術(shù)研究[J];東莞理工學(xué)院學(xué)報(bào);2010年05期
3 劉紅芝;;中文分詞技術(shù)的研究[J];電腦開(kāi)發(fā)與應(yīng)用;2010年03期
4 方鑫;;基于安全的電子公文交換系統(tǒng)研究[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2013年01期
5 馬千里;林古立;;基于聚類(lèi)和用戶點(diǎn)擊的在線多樣化排序算法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年12期
6 李國(guó)和;劉光勝;秦波波;吳衛(wèi)江;李洪奇;;綜合最大匹配和歧義檢測(cè)的中文分詞粗分方法[J];計(jì)算機(jī)工程與應(yīng)用;2012年14期
7 郎小偉;王申康;;基于Lucene的全文檢索系統(tǒng)研究與開(kāi)發(fā)[J];計(jì)算機(jī)工程;2006年04期
8 顏維龍,蓋杰,武港山,袁春風(fēng);面向網(wǎng)絡(luò)的全文檢索中索引文件的組織[J];計(jì)算機(jī)應(yīng)用研究;2002年11期
9 熊泉浩;;中文分詞現(xiàn)狀及未來(lái)發(fā)展[J];科技廣場(chǎng);2009年11期
10 王玉娟;方逵;羅武;;農(nóng)業(yè)知識(shí)庫(kù)檢索排序算法研究[J];農(nóng)機(jī)化研究;2012年09期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 朱學(xué)芳;馮曦曦;;面向農(nóng)業(yè)主題搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];安徽農(nóng)業(yè)科學(xué);2011年35期
2 曹勇剛,金茂忠,劉超;CMS中RBAC模型的改造和應(yīng)用[J];北京航空航天大學(xué)學(xué)報(bào);2005年10期
3 陶鎮(zhèn)威;周雨程;;基于Compass框架的高級(jí)搜索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué));2011年08期
4 李敏;黃凱;;一個(gè)多線程全文檢索系統(tǒng)的構(gòu)建[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年03期
5 蔡兵;胡敏;;基于Lucene2.0的書(shū)目搜索引擎設(shè)計(jì)[J];重慶圖情研究;2009年01期
6 葉霞;;DL-PDM設(shè)計(jì)過(guò)程管理系統(tǒng)中任務(wù)模型的研究[J];江蘇技術(shù)師范學(xué)院學(xué)報(bào);2006年04期
7 肖寒;胡廣平;;數(shù)據(jù)庫(kù)大數(shù)據(jù)量存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)研究[J];成組技術(shù)與生產(chǎn)現(xiàn)代化;2011年02期
8 張淑華;;圖書(shū)館參考咨詢系統(tǒng)新技術(shù)探析[J];黑龍江檔案;2011年05期
9 于洪波;;中文分詞技術(shù)研究[J];東莞理工學(xué)院學(xué)報(bào);2010年05期
10 周楊;;基于Lucene的小型搜索引擎系統(tǒng)的架構(gòu)與實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2010年11期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 田鶴楠;杜軍平;;產(chǎn)品質(zhì)量食品安全互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)設(shè)計(jì)[A];中國(guó)電子學(xué)會(huì)第十七屆信息論學(xué)術(shù)年會(huì)論文集[C];2010年
2 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應(yīng)用[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
3 王磊;顧大權(quán);侯太平;萬(wàn)友;;語(yǔ)音聊天機(jī)器人在氣象知識(shí)共享領(lǐng)域的應(yīng)用[A];第31屆中國(guó)氣象學(xué)會(huì)年會(huì)S13 氣象通信與信息技術(shù)應(yīng)用實(shí)踐與新技術(shù)探索[C];2014年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
2 張穎江;基于增強(qiáng)型第二層隧道協(xié)議的隧道代理防火墻系統(tǒng)的研究[D];武漢理工大學(xué);2006年
3 周偉;基于網(wǎng)絡(luò)的協(xié)同設(shè)計(jì)系統(tǒng)數(shù)據(jù)交換及管理關(guān)鍵技術(shù)研究[D];重慶大學(xué);2007年
4 王治綱;分布式環(huán)境中基于本體的RBAC策略研究[D];華中科技大學(xué);2006年
5 余虎;數(shù)字電力系統(tǒng)基礎(chǔ)架構(gòu)平臺(tái)技術(shù)的研究[D];湖南大學(xué);2008年
6 朱一群;Web服務(wù)訪問(wèn)控制研究[D];上海交通大學(xué);2008年
7 蔡紅霞;制造網(wǎng)格安全技術(shù)的研究與實(shí)現(xiàn)[D];上海大學(xué);2008年
8 文坤梅;基于本體知識(shí)庫(kù)推理的語(yǔ)義搜索研究[D];華中科技大學(xué);2007年
9 文珠穆;多域互操作環(huán)境中的動(dòng)態(tài)信任與訪問(wèn)控制研究[D];華中科技大學(xué);2008年
10 丁鋒;基于OB4LAC的政府組織授權(quán)系統(tǒng)模型研究[D];大連理工大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 呂萬(wàn)里;中文文本分類(lèi)技術(shù)研究[D];山東科技大學(xué);2010年
2 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計(jì)[D];哈爾濱工程大學(xué);2010年
3 畢曉燕;權(quán)限控制一致性檢測(cè)的研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2010年
4 劉金寧;詞性標(biāo)注體系對(duì)中文分詞的影響[D];大連理工大學(xué);2010年
5 陸國(guó)際;基于角色的訪問(wèn)控制策略的集成研究[D];大連理工大學(xué);2010年
6 陳松;基于Petri網(wǎng)的信息流安全屬性的驗(yàn)證與可組合性研究[D];江蘇大學(xué);2010年
7 胡堯;基于角色訪問(wèn)控制技術(shù)的黨務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南昌大學(xué);2010年
8 胡少榮;一種輿情信息預(yù)處理平臺(tái)的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2010年
9 樊春雷;基于語(yǔ)義分析的糖尿病健康教育系統(tǒng)研究與實(shí)現(xiàn)[D];華東理工大學(xué);2011年
10 葛世海;基于J2EE的站群管理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 胡錫衡;;正向最大匹配法在中文分詞技術(shù)中的應(yīng)用[J];鞍山師范學(xué)院學(xué)報(bào);2008年02期
2 文庭孝;漢語(yǔ)自動(dòng)分詞研究進(jìn)展[J];圖書(shū)與情報(bào);2005年05期
3 孫鐵利,楊鳳芹;根據(jù)用戶隱式反饋建立和更新用戶興趣模型[J];東北師大學(xué)報(bào)(自然科學(xué)版);2003年03期
4 劉春輝;金順福;劉國(guó)華;李穎;;基于優(yōu)化最大匹配與統(tǒng)計(jì)結(jié)合的漢語(yǔ)分詞方法[J];燕山大學(xué)學(xué)報(bào);2009年02期
5 孫茂松,鄒嘉彥;漢語(yǔ)自動(dòng)分詞研究評(píng)述[J];當(dāng)代語(yǔ)言學(xué);2001年01期
6 劉紅芝;;中文分詞技術(shù)的研究[J];電腦開(kāi)發(fā)與應(yīng)用;2010年03期
7 吳偉;陳建峽;;基于Heritrix的web信息抽取優(yōu)化與實(shí)現(xiàn)[J];湖北工業(yè)大學(xué)學(xué)報(bào);2012年02期
8 馬暉男;吳江寧;潘東華;;一種修正的向量空間模型在信息檢索中的應(yīng)用[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2008年04期
9 林古立;彭宏;馬千里;韋佳;覃姜維;;一種基于關(guān)鍵詞的網(wǎng)頁(yè)搜索結(jié)果多樣化方法[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期
10 文坤梅,盧正鼎,陳莉,鄧曦;元搜索引擎中檢索結(jié)果排序的優(yōu)化方法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年03期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 郭琰;元搜索引擎的關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];南京理工大學(xué);2002年
2 史鵬輝;專(zhuān)業(yè)服務(wù)網(wǎng)站搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2004年
3 王亮;搜索引擎及其相關(guān)性排序研究[D];武漢大學(xué);2004年
4 壽周翔;專(zhuān)業(yè)搜索引擎的研究與設(shè)計(jì)[D];浙江大學(xué);2005年
5 李東林;中文信息過(guò)濾技術(shù)的研究與應(yīng)用[D];遼寧科技大學(xué);2006年
6 王楠;基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵詞搜索系統(tǒng)的研究[D];天津大學(xué);2010年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 孫瑞;;試析電子公文歸檔遇到的幾個(gè)問(wèn)題和對(duì)策[J];治淮;2006年04期
2 張文浩;;書(shū)生電子公文歸檔研究[J];黑龍江檔案;2006年06期
3 巨珺;;從真實(shí)性角度比較電子公文與紙質(zhì)公文[J];云南檔案;2010年01期
4 王紹俠;從行政法角度比較電子公文與紙質(zhì)公文的生效要件[J];檔案學(xué)通訊;2002年05期
5 劉昕,楊建華;基于Exchange Server的電子公文系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];華中電力;2003年04期
6 楊儉;電子公文應(yīng)用實(shí)現(xiàn)模式淺探[J];信息化建設(shè);2004年06期
7 徐剛毅,喻建平,謝維信;一種安全實(shí)用的電子公文系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代電子技術(shù);2004年21期
8 王東臨;;電子公文所涉的標(biāo)準(zhǔn)化問(wèn)題[J];辦公自動(dòng)化;2004年07期
9 朱正健,李忠凱,李寒冰,劉素琴;電子公文實(shí)時(shí)在線自動(dòng)歸檔的實(shí)現(xiàn)[J];中國(guó)檔案;2005年05期
10 徐鳴嵐,劉葵;電子公文交換平臺(tái)的分析與研制[J];浙江萬(wàn)里學(xué)院學(xué)報(bào);2005年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前7條
1 賀文彬;王云;;電子公文查閱系統(tǒng)[A];陜西省氣象學(xué)會(huì)2005年學(xué)術(shù)交流會(huì)論文集[C];2005年
2 張正強(qiáng);崔屏;;論電子公文管理元數(shù)據(jù)標(biāo)準(zhǔn)的制定[A];科學(xué)發(fā)展觀指導(dǎo)下的檔案學(xué)理論與實(shí)踐[C];2007年
3 郭小雅;隋永安;王洪新;孫熙;;對(duì)引黃濟(jì)青系統(tǒng)推廣電子公文的幾點(diǎn)認(rèn)識(shí)[A];山東水利學(xué)會(huì)第十屆優(yōu)秀學(xué)術(shù)論文集[C];2005年
4 濮永革;;電子公文格式規(guī)范比較研究[A];2007年浙江省高等學(xué)校檔案優(yōu)秀論文集[C];2007年
5 戴牡紅;易維;;基于XML的電子公文交換規(guī)范設(shè)計(jì)[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2008年
6 呂強(qiáng);;基于自證明公鑰的電子公文交換系統(tǒng)的研究與設(shè)計(jì)[A];2011年通信與信息技術(shù)新進(jìn)展——第八屆中國(guó)通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2011年
7 杜思勤;高德松;;在檔案館建立電子公文傳輸備份工作站的必要性和可行性[A];創(chuàng)新與發(fā)展——山東省檔案學(xué)會(huì)第六次會(huì)員代表大會(huì)暨山東省檔案學(xué)會(huì)第六次檔案學(xué)術(shù)討論會(huì)論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 作者 汪曉燕;[N];金融時(shí)報(bào);2000年
2 本報(bào)記者 宋樂(lè)永;[N];計(jì)算機(jī)世界;2003年
3 本報(bào)記者 宋樂(lè)永;[N];計(jì)算機(jī)世界;2004年
4 郭世兵 楊應(yīng)焦;[N];中國(guó)檔案報(bào);2007年
5 本報(bào)記者 高賽;[N];光明日?qǐng)?bào);2006年
6 龔玟;[N];科技日?qǐng)?bào);2006年
7 特約記者 吳國(guó)英;[N];中國(guó)石油報(bào);2007年
8 本刊記者 劉艷紅 通訊員 邢彥飛;[N];山西經(jīng)濟(jì)日?qǐng)?bào);2006年
9 寧波市政府辦公廳信息中心 陳劍波;[N];計(jì)算機(jī)世界;2007年
10 ;[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2004年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 杜阿芳;電子公文保證技術(shù)的研究與實(shí)現(xiàn)[D];東華大學(xué);2010年
2 謝海先;電子公文歸檔移交系統(tǒng)功能研究[D];天津師范大學(xué);2006年
3 丁晨;電子公文公布與開(kāi)放利用的研究[D];河北大學(xué);2010年
4 霍建男;當(dāng)代電子公文的寫(xiě)作及管理研究[D];長(zhǎng)春理工大學(xué);2014年
5 朱英春;電子公文系統(tǒng)的安全性研究[D];對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué);2006年
6 曹剛;基于手寫(xiě)技術(shù)電子公文系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];中南大學(xué);2004年
7 辛虹;石油化工研究院電子公文系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)[D];東北石油大學(xué);2013年
8 茍乙權(quán);基于數(shù)據(jù)庫(kù)傳輸?shù)碾娮庸慕粨Q系統(tǒng)開(kāi)發(fā)和實(shí)現(xiàn)[D];電子科技大學(xué);2013年
9 袁禮;電子公文系統(tǒng)安全設(shè)計(jì)與實(shí)現(xiàn)[D];四川大學(xué);2005年
10 陳潔;基于手寫(xiě)批注技術(shù)的電子公文系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華東師范大學(xué);2008年
本文關(guān)鍵詞:基于Lucene的電子公文全文檢索系統(tǒng)研究與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):72043
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/72043.html