天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于Web搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2016-05-30 22:12

  本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。


《復(fù)旦大學(xué)》 2011年

基于Web搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

連蒴  

【摘要】:為了適應(yīng)網(wǎng)絡(luò)信息的飛速增長(zhǎng),并且能夠迅速、方便地從網(wǎng)絡(luò)中獲取有效信息,搜索引擎逐漸走進(jìn)了人們的生活,“竹竹”搜索引擎系統(tǒng)在這樣的條件下,應(yīng)運(yùn)而生。 本文首先系統(tǒng)的介紹了搜索引擎的概念、發(fā)展歷史、和搜索引擎的分類(lèi)。然后,對(duì)“竹竹”搜索引擎系統(tǒng)進(jìn)行需求分析,對(duì)系統(tǒng)進(jìn)行總體設(shè)計(jì),并對(duì)系統(tǒng)的各個(gè)功能模塊進(jìn)行詳細(xì)的設(shè)計(jì)和實(shí)現(xiàn),最后“竹竹”搜索引擎系統(tǒng)進(jìn)行了測(cè)試。 “竹竹”搜索引擎是基于Web的,面向筆記本電腦品牌的搜索引擎。系統(tǒng)的前端以MVC模式來(lái)實(shí)現(xiàn),Spring做中間層,JDBC作后端來(lái)開(kāi)發(fā)實(shí)現(xiàn)的。本系統(tǒng)分為三個(gè)子模塊,抓取模塊實(shí)現(xiàn)的功能為:將web上的海量網(wǎng)頁(yè)抓取到系統(tǒng)中;該模塊使用Heritrix來(lái)完成對(duì)網(wǎng)頁(yè)的抓取。處理模塊實(shí)現(xiàn)的功能為:解析網(wǎng)頁(yè),提取其中的有用內(nèi)容,為網(wǎng)頁(yè)建立詞庫(kù),由于筆記本電腦的品牌名在現(xiàn)有詞庫(kù)中不存在,因此要建立其特有的詞庫(kù)文件,對(duì)解析網(wǎng)頁(yè)生成的信息文件進(jìn)行分詞,并建立索引,將索引存入數(shù)據(jù)庫(kù)中;該模塊通過(guò)Lucene的API來(lái)實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)內(nèi)容的建索,使用HTMLParser的API實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)內(nèi)容的解析。用戶(hù)模塊實(shí)現(xiàn)的主要功能是:用戶(hù)模塊是系統(tǒng)的用戶(hù)接口;用戶(hù)通過(guò)此模塊完成與系統(tǒng)的交互,當(dāng)用戶(hù)在查詢(xún)界面上輸入要檢索的品牌信息后,系統(tǒng)將在可以接受的時(shí)間內(nèi),返回用戶(hù)所需的結(jié)果集;該模塊通過(guò)DWR封裝了AJAX技術(shù),處理用戶(hù)請(qǐng)求;通過(guò)Lucene的API來(lái)實(shí)現(xiàn)檢索。

【關(guān)鍵詞】:
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類(lèi)號(hào)】:TP391.3
【目錄】:

下載全文 更多同類(lèi)文獻(xiàn)

CAJ全文下載

(如何獲取全文? 歡迎:購(gòu)買(mǎi)知網(wǎng)充值卡、在線充值、在線咨詢(xún))

CAJViewer閱讀器支持CAJ、PDF文件格式


【引證文獻(xiàn)】

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 蔣成;網(wǎng)絡(luò)危害源過(guò)濾與偵測(cè)追蹤系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2013年

2 田瑞云;基于Hadoop的CDN-P2P系統(tǒng)中內(nèi)容預(yù)測(cè)機(jī)制研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 佘正平;;搜索引擎原理及存在問(wèn)題[J];圖書(shū)情報(bào)論壇;2006年04期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 成典勤;;基于JSP技術(shù)的Web應(yīng)用[J];安康師專(zhuān)學(xué)報(bào);2005年06期

2 凌宗云;;基于J2EE的學(xué)生就業(yè)信息管理系統(tǒng)的分析與設(shè)計(jì)[J];信息安全與技術(shù);2011年08期

3 聞?dòng)榔?;基于JSP的電子商務(wù)網(wǎng)站開(kāi)發(fā)[J];信息安全與技術(shù);2011年11期

4 張勇;;Java線程實(shí)現(xiàn)分析[J];辦公自動(dòng)化;2010年20期

5 郭娜;黃永平;吳學(xué)義;馬彧;;基于插件的動(dòng)態(tài)模塊框架研究[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2008年01期

6 鄭天華;王學(xué)成;;基于Eclipse的通用用戶(hù)權(quán)限管理插件的設(shè)計(jì)與實(shí)現(xiàn)[J];長(zhǎng)春理工大學(xué)學(xué)報(bào);2005年04期

7 馬惟哲;;B/S+C/S結(jié)構(gòu)的報(bào)名系統(tǒng)[J];浙江傳媒學(xué)院學(xué)報(bào);2008年02期

8 么煒;吳玉潔;董素芬;;基于多元線性回歸分析的設(shè)施農(nóng)業(yè)信息系統(tǒng)[J];河北農(nóng)業(yè)大學(xué)學(xué)報(bào);2011年01期

9 邢素萍;陳煜;;在Java巧用JDOM來(lái)生成和處理XML文檔[J];電腦學(xué)習(xí);2009年06期

10 程鵬;王建勇;黃文卓;林麗燕;;基于Web的電力系統(tǒng)數(shù)據(jù)模型轉(zhuǎn)換[J];電力自動(dòng)化設(shè)備;2006年10期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前6條

1 楊衛(wèi)明;;獨(dú)立式搜索引擎原理及存在問(wèn)題分析[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

2 周永;廖競(jìng);;“三個(gè)有利于”在計(jì)算機(jī)基礎(chǔ)課程教學(xué)中的應(yīng)用[A];2008年計(jì)算機(jī)應(yīng)用技術(shù)交流會(huì)論文集[C];2008年

3 張銀南;梅萬(wàn)龍;;基于Java的銀行自助終端系統(tǒng)開(kāi)發(fā)[A];促進(jìn)企業(yè)信息化進(jìn)程——第九屆中國(guó)Java技術(shù)及應(yīng)用交流大會(huì)文集[C];2006年

4 周永;陳寧;;幾種典型漢字編碼之間轉(zhuǎn)換的原理與實(shí)現(xiàn)[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

5 姜波;楊晶;何劍虹;陳祥光;;鋼軌供應(yīng)鏈系統(tǒng)的研究與實(shí)現(xiàn)[A];第七屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2009年

6 余平祥;張麗紅;劉偉章;余金昌;;雙代號(hào)網(wǎng)絡(luò)圖自動(dòng)生成系統(tǒng)研究與實(shí)現(xiàn)[A];農(nóng)業(yè)系統(tǒng)工程理論與實(shí)踐研究——全國(guó)農(nóng)業(yè)系統(tǒng)工程學(xué)術(shù)研討會(huì)論文集[C];2006年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 張向奎;汽車(chē)車(chē)身部件快速成形仿真技術(shù)平臺(tái)與關(guān)鍵算法研究[D];吉林大學(xué);2008年

2 劉竟;面向概念檢索的農(nóng)史信息門(mén)戶(hù)的設(shè)計(jì)與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年

3 朱東來(lái);多模型驅(qū)動(dòng)的面向服務(wù)系統(tǒng)開(kāi)發(fā)方法與技術(shù)研究[D];復(fù)旦大學(xué);2009年

4 李倩;富鈷和富硒物料濕法處理工藝及理論基礎(chǔ)研究[D];中南大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 張靜;基于SON微微基站的網(wǎng)絡(luò)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2010年

2 王虹;遼河油田油井遠(yuǎn)程監(jiān)控服務(wù)系統(tǒng)[D];大連理工大學(xué);2010年

3 李德路;青島遠(yuǎn)洋船舶調(diào)度管理系統(tǒng)設(shè)計(jì)[D];中國(guó)海洋大學(xué);2010年

4 徐斌;基于J2EE的石化運(yùn)維管理平臺(tái)的研究與實(shí)現(xiàn)[D];江西師范大學(xué);2010年

5 吳海應(yīng);江西電信網(wǎng)上營(yíng)業(yè)廳系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];江西師范大學(xué);2010年

6 陽(yáng)明亮;省煙草電子商務(wù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華東師范大學(xué);2010年

7 楊新兵;縣城行政執(zhí)法人員管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華東師范大學(xué);2010年

8 李彥華;衛(wèi)星網(wǎng)絡(luò)管理系統(tǒng)中的自檢驗(yàn)與更新技術(shù)研究[D];沈陽(yáng)理工大學(xué);2010年

9 江韜;廣州市防雷檢測(cè)業(yè)務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

10 朱德能;樂(lè)家衛(wèi)浴公司人力資源管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

【同被引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 吳鵬飛;;基于WVTool的文本向量空間模型研究與實(shí)現(xiàn)[J];電腦編程技巧與維護(hù);2012年05期

2 方娟;梁文燦;;一種基于協(xié)同過(guò)濾的網(wǎng)格門(mén)戶(hù)推薦模型[J];電子與信息學(xué)報(bào);2010年07期

3 徐風(fēng)苓;孟祥武;王立才;;基于移動(dòng)用戶(hù)上下文相似度的協(xié)同過(guò)濾推薦算法[J];電子與信息學(xué)報(bào);2011年11期

4 黃武漢;孟祥武;王立才;;移動(dòng)通信網(wǎng)中基于用戶(hù)社會(huì)化關(guān)系挖掘的協(xié)同過(guò)濾算法[J];電子與信息學(xué)報(bào);2011年12期

5 宗瑜;金萍;陳恩紅;李紅;劉仁金;;面向Weblog的模糊協(xié)同聚類(lèi)算法[J];電子與信息學(xué)報(bào);2012年03期

6 李藝紅;蔣秀鳳;;中文句子傾向性分析[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期

7 王雷;;淺析互聯(lián)網(wǎng)信息智能整合系統(tǒng)關(guān)鍵技術(shù)[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2012年11期

8 李振星,徐澤平,唐衛(wèi)清,唐榮錫;全二分最大匹配快速分詞算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年11期

9 王偉強(qiáng);高文;段立娟;;Internet上的文本數(shù)據(jù)挖掘[J];計(jì)算機(jī)科學(xué);2000年04期

10 蔣海;李軍;李忠誠(chéng);;混合內(nèi)容分發(fā)網(wǎng)絡(luò)及其性能分析模型[J];計(jì)算機(jī)學(xué)報(bào);2009年03期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 黃永生;基于用戶(hù)社會(huì)屬性的點(diǎn)對(duì)點(diǎn)內(nèi)容分發(fā)網(wǎng)絡(luò)模型研究[D];北京郵電大學(xué);2010年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條

1 艾偉;基于本體的Web信息文本挖掘與檢索服務(wù)研究[D];北京信息控制研究所;2010年

2 徐仰彬;基于SOM的文本聚類(lèi)及其在搜索結(jié)果中的應(yīng)用[D];西安電子科技大學(xué);2007年

3 高加旺;基于支持向量機(jī)的垃圾郵件過(guò)濾模型研究[D];哈爾濱理工大學(xué);2008年

4 韓立寶;基于P2POverCDN和RTSP的流媒體代理服務(wù)器的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年

5 熊瀟;基于搜索引擎索引分析的互聯(lián)網(wǎng)輿情監(jiān)控研究[D];上海交通大學(xué);2009年

6 朱濤;基于P2P的內(nèi)容分發(fā)網(wǎng)絡(luò)的系統(tǒng)結(jié)構(gòu)資源搜索與路由算法研究[D];電子科技大學(xué);2008年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條

1 徐建華;網(wǎng)絡(luò)搜索引擎原理、特性分析及未來(lái)發(fā)展趨勢(shì)[J];圖書(shū)情報(bào)工作;2000年08期

2 韓梅;網(wǎng)絡(luò)搜索引擎研究綜述(1994~2004年)[J];圖書(shū)館學(xué)研究;2005年10期

3 晏一平;岳泉;;中外元搜索引擎的比較研究[J];圖書(shū)館學(xué)研究;2005年11期

4 楊應(yīng)全,文汝,黃登婕;搜索引擎的不足與應(yīng)用經(jīng)驗(yàn)[J];現(xiàn)代情報(bào);2005年07期

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李樹(shù)青;崔北亮;;搜索引擎系統(tǒng)中的Web個(gè)性化信息推薦技術(shù)[J];情報(bào)雜志;2006年09期

2 王弼佐;游運(yùn)華;王茜;;基于Ontology的個(gè)性化智能知識(shí)檢索模型[J];情報(bào)雜志;2006年10期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 王慕潑;企業(yè)集團(tuán)的智能搜索引擎平臺(tái)的建立[D];浙江理工大學(xué);2014年

相關(guān)機(jī)構(gòu)

>浙江理工大學(xué)

相關(guān)作者

>王慕潑

《中國(guó)學(xué)術(shù)期刊(光盤(pán)版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
地址:北京清華大學(xué) 84-48信箱 知識(shí)超市公司
京ICP證040441號(hào)
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號(hào)
出版物經(jīng)營(yíng)許可證 新出發(fā)京批字第直0595號(hào)

訂購(gòu)熱線:400-819-9993 010-62982499
服務(wù)熱線:010-62985026 010-62791813
在線咨詢(xún):
傳真:010-62780361
京公網(wǎng)安備11010802020475號(hào)



  本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):52156

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/52156.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)308b8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com