基于Lucene局域網(wǎng)內(nèi)容索引搜索引擎實(shí)現(xiàn)
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1Struts工作原理
該系統(tǒng)設(shè)計(jì)采用了兩個(gè)框架Struts和Hibernate的主要目的是為了實(shí)現(xiàn)一個(gè)分層的架構(gòu),可以減少工作量,概述如下:(1)Struts簡介Struts最初的時(shí)候是作為ApacheJakarta項(xiàng)目的一個(gè)組成部分,Servlet和JavaServerPage....
圖3.1系統(tǒng)整體構(gòu)架圖
圖3.1系統(tǒng)整體構(gòu)架圖Fig.3.1Farmdiagramofthesystems功能分析的主要功能分為三個(gè)模塊如下:頁內(nèi)容抓取器模塊TP協(xié)議,使用多線程技術(shù)基于對(duì)初始URL抓取網(wǎng)頁,存儲(chǔ)到本的MySQL數(shù)據(jù)庫中存儲(chǔ)和分析新的URL,下次抓取的URL....
圖4.2網(wǎng)頁抓取器核心類UML關(guān)系圖
25圖4.2網(wǎng)頁抓取器核心類UML關(guān)系圖Fig.4.2RelationalgraphofUML頁內(nèi)容抓取器使用最流行的廣度優(yōu)先的策略,以達(dá)到多線程的網(wǎng)作流程如下,設(shè)置初始URL抓取網(wǎng)頁,并分析網(wǎng)頁的URL保存,同時(shí)存儲(chǔ)抓取。保存頁面上的網(wǎng)頁內(nèi)容分析,網(wǎng)頁....
圖4.3網(wǎng)頁抓取器后臺(tái)實(shí)現(xiàn)效果
圖4.3網(wǎng)頁抓取器后臺(tái)實(shí)現(xiàn)效果Fig.4.3Backgroundtoachievetheeffect.2索引功能模塊的設(shè)計(jì)與實(shí)現(xiàn)2.1Lucene索引介紹該索引是一個(gè)數(shù)據(jù)存儲(chǔ)和組織結(jié)構(gòu)。該索引主要用于迅速找到一個(gè)字的文件。完整的信息索引,維護(hù)和管理軟件的功能....
本文編號(hào):3899677
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3899677.html