天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于XML的全文檢索原型系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2018-08-30 18:08
【摘要】:針對當前單位網(wǎng)站搜索引擎存在的索引速度慢、更新不及時、檢索效率低等問題,在深入分析和研究Lucene和XML等技術在建立搜索引擎方面優(yōu)越性能的基礎上,構建一個基于XML的全文檢索原型系統(tǒng)。該系統(tǒng)以XML作為通用數(shù)據(jù)接口,以Lucene作為實現(xiàn)平臺,能夠實現(xiàn)快速及時索引和提高檢索效率的目的。
[Abstract]:Aiming at the problems of low index speed, late updating and low retrieval efficiency in the search engine of the website of our country at present, this paper analyzes and studies the superior performance of Lucene and XML in establishing search engine, based on the deep analysis and research on the superior performance of such techniques as Lucene and XML in establishing the search engine. A full-text retrieval prototype system based on XML is constructed. Using XML as the general data interface and Lucene as the implementation platform, the system can achieve the purpose of fast and timely indexing and improving the retrieval efficiency.
【作者單位】: 華中師范大學信息管理系 華中師范大學信息管理系
【基金】:國家社會科學基金項目“基于中文XML文檔的全文檢索研究”(項目編號:04CTQ005)的階段性研究成果之一
【分類號】:G354

【參考文獻】

相關期刊論文 前5條

1 魏應彬,王娟;用JDOM處理XML文檔[J];福建電腦;2004年10期

2 劉群,張華平,俞鴻魁,程學旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期

3 何偉;薛素靜;孔夢榮;楊正黨;;基于Lucene的全文搜索引擎的設計與實現(xiàn)[J];情報雜志;2006年09期

4 周寧,谷宏群;基于Lucene/XML的全文檢索機制研究[J];圖書情報知識;2005年03期

5 張華;董慧;;利用JDOM解析XML文檔及其在數(shù)據(jù)轉換上的應用[J];現(xiàn)代圖書情報技術;2005年11期

【共引文獻】

相關期刊論文 前10條

1 于江德;王希杰;;詞位標注漢語分詞技術詳解[J];安陽師范學院學報;2010年05期

2 馬志強;周長勝;丁維;楊娜;;校園網(wǎng)搜索引擎的研究與實現(xiàn)[J];北京機械工業(yè)學院學報;2007年01期

3 李巍巍;;全文檢索引擎工具包Lucene的結構與索引原理的研究[J];才智;2008年09期

4 傅鸝;孫堅;付春雷;;基于語義的音樂檢索系統(tǒng)[J];重慶理工大學學報(自然科學版);2011年01期

5 高東平;;基于類型論的漢語分詞系統(tǒng)TTCS[J];重慶理工大學學報(社會科學);2011年08期

6 曲維光;唐旭日;俞敬松;;超大規(guī)模語料庫精加工技術研究[J];當代語言學;2009年02期

7 張利;張立勇;張曉淼;耿鐵鎖;岳宗閣;;基于改進BP網(wǎng)絡的中文歧義字段分詞方法研究[J];大連理工大學學報;2007年01期

8 孫曉;黃德根;;基于最長次長匹配分詞的一體化中文詞法分析[J];大連理工大學學報;2010年06期

9 周珍娟;張字平;陸玲;;基于Lucene2.0的電子文獻全文檢索系統(tǒng)[J];電腦知識與技術(學術交流);2007年23期

10 魯強;金偉祖;;基于FMM和CRFs雙層分詞模型的研究[J];電腦知識與技術;2008年28期

相關會議論文 前10條

1 陳岳陽;馬學森;韓江洪;石雷;;基于JDOM實現(xiàn)XML數(shù)據(jù)備份的研究與實現(xiàn)?[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

2 于江德;王希杰;樊孝忠;;漢語詞法分析中上文和下文孰重孰輕[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

3 余驍捷;邵陽;吳及;王俠;;基于SVM和MMR融和的自動文摘方法[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年

4 李明宙;羅艷;王宗義;;Lucene全文檢索引擎的研究及應用[A];廣西計算機學會2010年學術年會論文集[C];2010年

5 申兵一;鞏青歌;;基于Lucene桌面搜索引擎系統(tǒng)的設計和實現(xiàn)[A];江蘇省電子學會2010年學術年會論文集[C];2010年

6 俞鴻魁;張華平;劉群;呂學強;施水才;;基于層疊隱馬爾可夫模型的中文命名實體識別[A];全國網(wǎng)絡與信息安全技術研討會'2005論文集(下冊)[C];2005年

7 宋柔;;自然語言處理中語言知識的基礎性地位[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年

8 王芳;萬常選;;基于可信度的中文完整詞自動識別[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年

9 李恒訓;張華平;秦鵬;于滿泉;劉金剛;;基于主題詞的網(wǎng)絡熱點話題發(fā)現(xiàn)[A];第五屆全國信息檢索學術會議論文集[C];2009年

10 秦鵬;李恒訓;張華平;劉金剛;;基于關鍵詞提取的搜索結果聚類研究[A];第五屆全國信息檢索學術會議論文集[C];2009年

相關博士學位論文 前10條

1 楊抒;基于WEB的林產(chǎn)品信息資源整合方法研究[D];北京林業(yè)大學;2011年

2 劉朝濤;中文問答系統(tǒng)中的句型理論及其應用研究[D];重慶大學;2010年

3 朱鎖玲;命名實體識別在方志內容挖掘中的應用研究[D];南京農(nóng)業(yè)大學;2011年

4 余傳明;基于本體的語義信息系統(tǒng)研究[D];武漢大學;2005年

5 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學;2005年

6 張素香;信息抽取中關鍵技術的研究[D];北京郵電大學;2007年

7 高紅;基于統(tǒng)計語言模型的漢語淺層分析研究[D];大連理工大學;2007年

8 傅魁;基于Web的本體學習研究[D];武漢理工大學;2007年

9 秦穎;漢語詞和短語的歧義消解研究[D];北京郵電大學;2008年

10 陳博;WEB文本情感分類中關鍵問題的研究[D];北京郵電大學;2008年

相關碩士學位論文 前10條

1 陳曉慧;空間信息服務管理平臺的設計與實現(xiàn)[D];山東科技大學;2010年

2 于洪霞;基于SVM的中文垃圾郵件過濾[D];哈爾濱工程大學;2009年

3 程波波;基于文本的茶學本體學習方法研究[D];安徽農(nóng)業(yè)大學;2010年

4 陳旭;地理編碼引擎的設計與實現(xiàn)[D];遼寧工程技術大學;2009年

5 劉偉麗;基于粒子群算法和支持向量機的中文文本分類研究[D];河南工業(yè)大學;2010年

6 潘正高;基于內容的Web新聞文本自動分類問題研究[D];合肥工業(yè)大學;2010年

7 常富國;高技術虛擬企業(yè)談判支持問題處理系統(tǒng)研究[D];哈爾濱理工大學;2010年

8 張廬穎;基于粗糙集的K-means研究[D];北京交通大學;2011年

9 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實現(xiàn)[D];華東理工大學;2011年

10 邱艷霞;領域術語自動抽取及關系分類研究[D];昆明理工大學;2009年

【二級參考文獻】

相關期刊論文 前6條

1 鮑玉來;用JAVA+XML實現(xiàn)網(wǎng)站全文檢索[J];高校圖書館工作;2003年06期

2 張華平,劉群;基于角色標注的中國人名自動識別研究[J];計算機學報;2004年01期

3 葛慧;Java與XML實現(xiàn)數(shù)據(jù)抽取[J];計算機與現(xiàn)代化;2003年01期

4 梁南元;書面漢語自動分詞系統(tǒng)—CDWS[J];中文信息學報;1987年02期

5 張華平,劉群;基于N-最短路徑方法的中文詞語粗分模型[J];中文信息學報;2002年05期

6 馮京桉;XML與網(wǎng)絡環(huán)境下的全文檢索[J];情報雜志;2003年10期

相關會議論文 前1條

1 高山;張艷;徐波;宗成慶;韓兆兵;;基于三元統(tǒng)計模型的漢語分詞及標注一體化研究[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術會議論文集[C];2001年

【相似文獻】

相關期刊論文 前10條

1 郭一平;向暉;王亮;;基于Lucene的Ftp搜索引擎的設計[J];圖書情報工作;2006年04期

2 孔伯煊;李祥;;基于Lucene\XML技術的Web搜索引擎設計與實現(xiàn)[J];航空計算技術;2006年04期

3 黃建崗;張愛華;;教務門戶網(wǎng)自動問答系統(tǒng)的設計與實現(xiàn)[J];電腦知識與技術;2009年36期

4 買日旦·吾守爾;維尼拉·木沙江;;多文種多向電子詞典軟件系統(tǒng)關鍵技術研究[J];計算機應用與軟件;2011年04期

5 李毅,楊善林,劉業(yè)政,顧鐵軍;基于XML的網(wǎng)絡課件環(huán)境中搜索引擎的實現(xiàn)[J];武漢理工大學學報(信息與管理工程版);2003年03期

6 蔡小艷;寇應展;沈巍;鄭偉;;漢語詞法分析系統(tǒng)ICTCLAS在Nutch-0.9中的應用與實現(xiàn)[J];軍械工程學院學報;2008年05期

7 吳於茜;在平面設計軟件中實現(xiàn)SVG格式文檔輸出[J];計算機工程與應用;2001年09期

8 張偉都,周海東,鐘共鳴,張素偉;面向XML的數(shù)據(jù)管理系統(tǒng)[J];計算機工程與應用;2001年20期

9 李天慶,張毅,張冰,胡東成;基于XML的體育數(shù)據(jù)規(guī)格化存儲技術研究[J];計算機工程與應用;2001年22期

10 張曉林;基于XML的信息組織與處理:1.XML技術體系[J];情報科學;2001年08期

相關會議論文 前10條

1 郭志懋;周傲英;;XML數(shù)據(jù)的在線過濾[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2002年

2 何震瀛;李建中;王宏志;;XML數(shù)據(jù)的關系存儲[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2002年

3 丁峰;王煜;姚延濤;沈鈞毅;;從XML模式到數(shù)據(jù)庫模式[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2001年

4 談子敬;施伯樂;;XML導出數(shù)據(jù)庫表的實現(xiàn)與應用[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年

5 羅道峰;孟小峰;;一種面向XML文檔的基于角色的擴展訪問控制方法[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年

6 鄭駿;王焱;錢衛(wèi)寧;周傲英;;XML相似相關結構庫的構造及其應用[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2002年

7 吳剛;于亞新;王國仁;于戈;;并行XML文檔數(shù)據(jù)分片技術研究[A];第十九屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2002年

8 王靜;孟小峰;王珊;;以目標節(jié)點為導向的XML路徑查詢處理[A];第二十屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2003年

9 王鵬飛;洪曉光;;基于XML大文檔的動態(tài)索引[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年

10 肖冰;廖湖聲;鄭玉明;;數(shù)據(jù)集成系統(tǒng)中的XML延遲處理技術[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2005年

相關重要報紙文章 前10條

1 秦林;《XML完全探索》[N];中華讀書報;2001年

2 本報記者 李瀛寰;XML推了網(wǎng)絡一把[N];中國計算機報;2000年

3 ;分化并不能阻止XML發(fā)展[N];中國計算機報;2000年

4 ;為XML標準定標準[N];中國計算機報;2001年

5 IDG電訊;Microsoft、IBM共同制定XML標準[N];計算機世界;2000年

6 北京郵電大學 張劍;XML與HTML的結合(上)[N];計算機世界;2001年

7 本報記者 陸 杰;XML叢林的新秀[N];中華讀書報;2002年

8 侯青;國際電子商務XML/EDI特點及現(xiàn)狀[N];國際商報;2001年

9 北京郵電大學 張劍;XML技術預覽[N];計算機世界;2001年

10 北京郵電大學 張劍;XML與HTML的結合(下)[N];計算機世界;2001年

相關博士學位論文 前10條

1 沈潔;基于自動機的XML數(shù)據(jù)過濾研究[D];哈爾濱工程大學;2010年

2 葉曉峰;基于XML的沖壓模具設計知識重用技術研究[D];華中科技大學;2010年

3 殷麗鳳;不完全信息環(huán)境下XML數(shù)據(jù)庫規(guī)范化問題的研究[D];哈爾濱理工大學;2009年

4 張晨靜;XML關鍵字過濾技術[D];復旦大學;2011年

5 寧博;XML查詢模式匹配及文檔過濾技術研究[D];東北大學;2009年

6 汪源;XML事務模型及并發(fā)控制研究[D];浙江大學;2006年

7 許建軍;對結構化和半結構化數(shù)據(jù)的關鍵字搜索研究[D];復旦大學;2007年

8 劉喜平;XML文檔搜索中的查詢處理技術研究[D];江西財經(jīng)大學;2010年

9 陳廷斌;基于XML/Web服務的供應鏈信息集成技術與方法研究[D];大連理工大學;2005年

10 陳亞華;企業(yè)應用集成架構研究與實現(xiàn)[D];復旦大學;2005年

相關碩士學位論文 前10條

1 王忠義;基于XML的全文檢索方法及原型系統(tǒng)實現(xiàn)研究[D];華中師范大學;2009年

2 王冬坡;基于Lucene的主題搜索引擎的研究與實現(xiàn)[D];河北科技大學;2010年

3 張彬;基于lucene的搜索引擎[D];上海師范大學;2010年

4 高欣;基于Lucene的全文檢索系統(tǒng)的研究與實現(xiàn)[D];天津師范大學;2010年

5 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學;2011年

6 杜先撰;基于Lucene全文索引系統(tǒng)設計與實現(xiàn)[D];南京大學;2011年

7 周月紅;基于Lucene的站內搜索引擎的設計與開發(fā)[D];華東理工大學;2011年

8 徐財應;基于Lucene的搜索引擎技術的研究與改進[D];長春理工大學;2010年

9 陳航哲;基于Lucene的垂直搜索引擎的研究與應用[D];暨南大學;2010年

10 岳莉;基于Lucene的全文檢索系統(tǒng)的研究與應用[D];西安電子科技大學;2010年

,

本文編號:2213874

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2213874.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶2484c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
欧美人禽色视频免费看| 黄色三级日本在线观看| 女人精品内射国产99| 欧美成人欧美一级乱黄| 日本精品理论在线观看| 国产三级欧美三级日韩三级| 日韩精品一区二区三区四区| 欧美区一区二区在线观看| 国产av精品高清一区二区三区 | 日韩精品一级片免费看| 日本少妇三级三级三级| 日本欧美视频在线观看免费| 国产成人精品国产成人亚洲| 少妇肥臀一区二区三区| 国产精品久久久久久久久久久痴汉 | 少妇熟女亚洲色图av天堂| 99少妇偷拍视频在线| 国产一区日韩二区欧美| 日韩欧美在线看一卡一卡| 香港国产三级久久精品三级| 国产亚洲成av人在线观看| 性欧美唯美尤物另类视频| 日韩欧美三级视频在线| 加勒比人妻精品一区二区| 又黄又硬又爽又色的视频| 91精品视频全国免费| 国产乱人伦精品一区二区三区四区| 最好看的人妻中文字幕| 午夜成年人黄片免费观看| 久久国产精品亚州精品毛片| 国产内射一级一片内射高清视频| 国产精品久久香蕉国产线| 99久久人妻中文字幕| 热久久这里只有精品视频| 国产精品激情对白一区二区| 国产成人精品久久二区二区| 久久中文字人妻熟女小妇| 欧美日韩免费黄片观看| 精品亚洲香蕉久久综合网| 中文字幕日韩欧美亚洲午夜 | 国产综合香蕉五月婷在线|