天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2016-05-30 22:12

  本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。


《復(fù)旦大學(xué)》 2011年

基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)

連蒴  

【摘要】:為了適應(yīng)網(wǎng)絡(luò)信息的飛速增長,并且能夠迅速、方便地從網(wǎng)絡(luò)中獲取有效信息,搜索引擎逐漸走進(jìn)了人們的生活,“竹竹”搜索引擎系統(tǒng)在這樣的條件下,應(yīng)運而生。 本文首先系統(tǒng)的介紹了搜索引擎的概念、發(fā)展歷史、和搜索引擎的分類。然后,對“竹竹”搜索引擎系統(tǒng)進(jìn)行需求分析,對系統(tǒng)進(jìn)行總體設(shè)計,并對系統(tǒng)的各個功能模塊進(jìn)行詳細(xì)的設(shè)計和實現(xiàn),最后“竹竹”搜索引擎系統(tǒng)進(jìn)行了測試。 “竹竹”搜索引擎是基于Web的,面向筆記本電腦品牌的搜索引擎。系統(tǒng)的前端以MVC模式來實現(xiàn),Spring做中間層,JDBC作后端來開發(fā)實現(xiàn)的。本系統(tǒng)分為三個子模塊,抓取模塊實現(xiàn)的功能為:將web上的海量網(wǎng)頁抓取到系統(tǒng)中;該模塊使用Heritrix來完成對網(wǎng)頁的抓取。處理模塊實現(xiàn)的功能為:解析網(wǎng)頁,提取其中的有用內(nèi)容,為網(wǎng)頁建立詞庫,由于筆記本電腦的品牌名在現(xiàn)有詞庫中不存在,因此要建立其特有的詞庫文件,對解析網(wǎng)頁生成的信息文件進(jìn)行分詞,并建立索引,將索引存入數(shù)據(jù)庫中;該模塊通過Lucene的API來實現(xiàn)對網(wǎng)頁內(nèi)容的建索,使用HTMLParser的API實現(xiàn)了對網(wǎng)頁內(nèi)容的解析。用戶模塊實現(xiàn)的主要功能是:用戶模塊是系統(tǒng)的用戶接口;用戶通過此模塊完成與系統(tǒng)的交互,當(dāng)用戶在查詢界面上輸入要檢索的品牌信息后,系統(tǒng)將在可以接受的時間內(nèi),返回用戶所需的結(jié)果集;該模塊通過DWR封裝了AJAX技術(shù),處理用戶請求;通過Lucene的API來實現(xiàn)檢索。

【關(guān)鍵詞】:
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP391.3
【目錄】:

下載全文 更多同類文獻(xiàn)

CAJ全文下載

(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)

CAJViewer閱讀器支持CAJ、PDF文件格式


【引證文獻(xiàn)】

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 蔣成;網(wǎng)絡(luò)危害源過濾與偵測追蹤系統(tǒng)設(shè)計與實現(xiàn)[D];大連理工大學(xué);2013年

2 田瑞云;基于Hadoop的CDN-P2P系統(tǒng)中內(nèi)容預(yù)測機制研究與實現(xiàn)[D];北京郵電大學(xué);2013年

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 佘正平;;搜索引擎原理及存在問題[J];圖書情報論壇;2006年04期

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 成典勤;;基于JSP技術(shù)的Web應(yīng)用[J];安康師專學(xué)報;2005年06期

2 凌宗云;;基于J2EE的學(xué)生就業(yè)信息管理系統(tǒng)的分析與設(shè)計[J];信息安全與技術(shù);2011年08期

3 聞永萍;;基于JSP的電子商務(wù)網(wǎng)站開發(fā)[J];信息安全與技術(shù);2011年11期

4 張勇;;Java線程實現(xiàn)分析[J];辦公自動化;2010年20期

5 郭娜;黃永平;吳學(xué)義;馬彧;;基于插件的動態(tài)模塊框架研究[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2008年01期

6 鄭天華;王學(xué)成;;基于Eclipse的通用用戶權(quán)限管理插件的設(shè)計與實現(xiàn)[J];長春理工大學(xué)學(xué)報;2005年04期

7 馬惟哲;;B/S+C/S結(jié)構(gòu)的報名系統(tǒng)[J];浙江傳媒學(xué)院學(xué)報;2008年02期

8 么煒;吳玉潔;董素芬;;基于多元線性回歸分析的設(shè)施農(nóng)業(yè)信息系統(tǒng)[J];河北農(nóng)業(yè)大學(xué)學(xué)報;2011年01期

9 邢素萍;陳煜;;在Java巧用JDOM來生成和處理XML文檔[J];電腦學(xué)習(xí);2009年06期

10 程鵬;王建勇;黃文卓;林麗燕;;基于Web的電力系統(tǒng)數(shù)據(jù)模型轉(zhuǎn)換[J];電力自動化設(shè)備;2006年10期

中國重要會議論文全文數(shù)據(jù)庫 前6條

1 楊衛(wèi)明;;獨立式搜索引擎原理及存在問題分析[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年

2 周永;廖競;;“三個有利于”在計算機基礎(chǔ)課程教學(xué)中的應(yīng)用[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年

3 張銀南;梅萬龍;;基于Java的銀行自助終端系統(tǒng)開發(fā)[A];促進(jìn)企業(yè)信息化進(jìn)程——第九屆中國Java技術(shù)及應(yīng)用交流大會文集[C];2006年

4 周永;陳寧;;幾種典型漢字編碼之間轉(zhuǎn)換的原理與實現(xiàn)[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年

5 姜波;楊晶;何劍虹;陳祥光;;鋼軌供應(yīng)鏈系統(tǒng)的研究與實現(xiàn)[A];第七屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2009年

6 余平祥;張麗紅;劉偉章;余金昌;;雙代號網(wǎng)絡(luò)圖自動生成系統(tǒng)研究與實現(xiàn)[A];農(nóng)業(yè)系統(tǒng)工程理論與實踐研究——全國農(nóng)業(yè)系統(tǒng)工程學(xué)術(shù)研討會論文集[C];2006年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 張向奎;汽車車身部件快速成形仿真技術(shù)平臺與關(guān)鍵算法研究[D];吉林大學(xué);2008年

2 劉竟;面向概念檢索的農(nóng)史信息門戶的設(shè)計與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年

3 朱東來;多模型驅(qū)動的面向服務(wù)系統(tǒng)開發(fā)方法與技術(shù)研究[D];復(fù)旦大學(xué);2009年

4 李倩;富鈷和富硒物料濕法處理工藝及理論基礎(chǔ)研究[D];中南大學(xué);2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 張靜;基于SON微微基站的網(wǎng)絡(luò)管理系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工程大學(xué);2010年

2 王虹;遼河油田油井遠(yuǎn)程監(jiān)控服務(wù)系統(tǒng)[D];大連理工大學(xué);2010年

3 李德路;青島遠(yuǎn)洋船舶調(diào)度管理系統(tǒng)設(shè)計[D];中國海洋大學(xué);2010年

4 徐斌;基于J2EE的石化運維管理平臺的研究與實現(xiàn)[D];江西師范大學(xué);2010年

5 吳海應(yīng);江西電信網(wǎng)上營業(yè)廳系統(tǒng)的設(shè)計與實現(xiàn)[D];江西師范大學(xué);2010年

6 陽明亮;省煙草電子商務(wù)系統(tǒng)的設(shè)計與實現(xiàn)[D];華東師范大學(xué);2010年

7 楊新兵;縣城行政執(zhí)法人員管理系統(tǒng)的設(shè)計與實現(xiàn)[D];華東師范大學(xué);2010年

8 李彥華;衛(wèi)星網(wǎng)絡(luò)管理系統(tǒng)中的自檢驗與更新技術(shù)研究[D];沈陽理工大學(xué);2010年

9 江韜;廣州市防雷檢測業(yè)務(wù)系統(tǒng)設(shè)計與實現(xiàn)[D];華南理工大學(xué);2010年

10 朱德能;樂家衛(wèi)浴公司人力資源管理系統(tǒng)設(shè)計與實現(xiàn)[D];華南理工大學(xué);2010年

【同被引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 吳鵬飛;;基于WVTool的文本向量空間模型研究與實現(xiàn)[J];電腦編程技巧與維護(hù);2012年05期

2 方娟;梁文燦;;一種基于協(xié)同過濾的網(wǎng)格門戶推薦模型[J];電子與信息學(xué)報;2010年07期

3 徐風(fēng)苓;孟祥武;王立才;;基于移動用戶上下文相似度的協(xié)同過濾推薦算法[J];電子與信息學(xué)報;2011年11期

4 黃武漢;孟祥武;王立才;;移動通信網(wǎng)中基于用戶社會化關(guān)系挖掘的協(xié)同過濾算法[J];電子與信息學(xué)報;2011年12期

5 宗瑜;金萍;陳恩紅;李紅;劉仁金;;面向Weblog的模糊協(xié)同聚類算法[J];電子與信息學(xué)報;2012年03期

6 李藝紅;蔣秀鳳;;中文句子傾向性分析[J];福州大學(xué)學(xué)報(自然科學(xué)版);2010年04期

7 王雷;;淺析互聯(lián)網(wǎng)信息智能整合系統(tǒng)關(guān)鍵技術(shù)[J];計算機光盤軟件與應(yīng)用;2012年11期

8 李振星,徐澤平,唐衛(wèi)清,唐榮錫;全二分最大匹配快速分詞算法[J];計算機工程與應(yīng)用;2002年11期

9 王偉強;高文;段立娟;;Internet上的文本數(shù)據(jù)挖掘[J];計算機科學(xué);2000年04期

10 蔣海;李軍;李忠誠;;混合內(nèi)容分發(fā)網(wǎng)絡(luò)及其性能分析模型[J];計算機學(xué)報;2009年03期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 黃永生;基于用戶社會屬性的點對點內(nèi)容分發(fā)網(wǎng)絡(luò)模型研究[D];北京郵電大學(xué);2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條

1 艾偉;基于本體的Web信息文本挖掘與檢索服務(wù)研究[D];北京信息控制研究所;2010年

2 徐仰彬;基于SOM的文本聚類及其在搜索結(jié)果中的應(yīng)用[D];西安電子科技大學(xué);2007年

3 高加旺;基于支持向量機的垃圾郵件過濾模型研究[D];哈爾濱理工大學(xué);2008年

4 韓立寶;基于P2POverCDN和RTSP的流媒體代理服務(wù)器的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2008年

5 熊瀟;基于搜索引擎索引分析的互聯(lián)網(wǎng)輿情監(jiān)控研究[D];上海交通大學(xué);2009年

6 朱濤;基于P2P的內(nèi)容分發(fā)網(wǎng)絡(luò)的系統(tǒng)結(jié)構(gòu)資源搜索與路由算法研究[D];電子科技大學(xué);2008年

【二級參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前4條

1 徐建華;網(wǎng)絡(luò)搜索引擎原理、特性分析及未來發(fā)展趨勢[J];圖書情報工作;2000年08期

2 韓梅;網(wǎng)絡(luò)搜索引擎研究綜述(1994~2004年)[J];圖書館學(xué)研究;2005年10期

3 晏一平;岳泉;;中外元搜索引擎的比較研究[J];圖書館學(xué)研究;2005年11期

4 楊應(yīng)全,文汝,黃登婕;搜索引擎的不足與應(yīng)用經(jīng)驗[J];現(xiàn)代情報;2005年07期

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 李樹青;崔北亮;;搜索引擎系統(tǒng)中的Web個性化信息推薦技術(shù)[J];情報雜志;2006年09期

2 王弼佐;游運華;王茜;;基于Ontology的個性化智能知識檢索模型[J];情報雜志;2006年10期

3 ;[J];;年期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 王慕潑;企業(yè)集團的智能搜索引擎平臺的建立[D];浙江理工大學(xué);2014年

相關(guān)機構(gòu)

>浙江理工大學(xué)

相關(guān)作者

>王慕潑

《中國學(xué)術(shù)期刊(光盤版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
地址:北京清華大學(xué) 84-48信箱 知識超市公司
京ICP證040441號
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號
出版物經(jīng)營許可證 新出發(fā)京批字第直0595號

訂購熱線:400-819-9993 010-62982499
服務(wù)熱線:010-62985026 010-62791813
在線咨詢:
傳真:010-62780361
京公網(wǎng)安備11010802020475號



  本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。

,

本文編號:52156

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/52156.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶308b8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com