基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
《復(fù)旦大學(xué)》 2011年
基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)
連蒴
【摘要】:為了適應(yīng)網(wǎng)絡(luò)信息的飛速增長,并且能夠迅速、方便地從網(wǎng)絡(luò)中獲取有效信息,搜索引擎逐漸走進(jìn)了人們的生活,“竹竹”搜索引擎系統(tǒng)在這樣的條件下,應(yīng)運而生。 本文首先系統(tǒng)的介紹了搜索引擎的概念、發(fā)展歷史、和搜索引擎的分類。然后,對“竹竹”搜索引擎系統(tǒng)進(jìn)行需求分析,對系統(tǒng)進(jìn)行總體設(shè)計,并對系統(tǒng)的各個功能模塊進(jìn)行詳細(xì)的設(shè)計和實現(xiàn),最后“竹竹”搜索引擎系統(tǒng)進(jìn)行了測試。 “竹竹”搜索引擎是基于Web的,面向筆記本電腦品牌的搜索引擎。系統(tǒng)的前端以MVC模式來實現(xiàn),Spring做中間層,JDBC作后端來開發(fā)實現(xiàn)的。本系統(tǒng)分為三個子模塊,抓取模塊實現(xiàn)的功能為:將web上的海量網(wǎng)頁抓取到系統(tǒng)中;該模塊使用Heritrix來完成對網(wǎng)頁的抓取。處理模塊實現(xiàn)的功能為:解析網(wǎng)頁,提取其中的有用內(nèi)容,為網(wǎng)頁建立詞庫,由于筆記本電腦的品牌名在現(xiàn)有詞庫中不存在,因此要建立其特有的詞庫文件,對解析網(wǎng)頁生成的信息文件進(jìn)行分詞,并建立索引,將索引存入數(shù)據(jù)庫中;該模塊通過Lucene的API來實現(xiàn)對網(wǎng)頁內(nèi)容的建索,使用HTMLParser的API實現(xiàn)了對網(wǎng)頁內(nèi)容的解析。用戶模塊實現(xiàn)的主要功能是:用戶模塊是系統(tǒng)的用戶接口;用戶通過此模塊完成與系統(tǒng)的交互,當(dāng)用戶在查詢界面上輸入要檢索的品牌信息后,系統(tǒng)將在可以接受的時間內(nèi),返回用戶所需的結(jié)果集;該模塊通過DWR封裝了AJAX技術(shù),處理用戶請求;通過Lucene的API來實現(xiàn)檢索。
【關(guān)鍵詞】:
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 蔣成;網(wǎng)絡(luò)危害源過濾與偵測追蹤系統(tǒng)設(shè)計與實現(xiàn)[D];大連理工大學(xué);2013年
2 田瑞云;基于Hadoop的CDN-P2P系統(tǒng)中內(nèi)容預(yù)測機制研究與實現(xiàn)[D];北京郵電大學(xué);2013年
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 佘正平;;搜索引擎原理及存在問題[J];圖書情報論壇;2006年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 成典勤;;基于JSP技術(shù)的Web應(yīng)用[J];安康師專學(xué)報;2005年06期
2 凌宗云;;基于J2EE的學(xué)生就業(yè)信息管理系統(tǒng)的分析與設(shè)計[J];信息安全與技術(shù);2011年08期
3 聞永萍;;基于JSP的電子商務(wù)網(wǎng)站開發(fā)[J];信息安全與技術(shù);2011年11期
4 張勇;;Java線程實現(xiàn)分析[J];辦公自動化;2010年20期
5 郭娜;黃永平;吳學(xué)義;馬彧;;基于插件的動態(tài)模塊框架研究[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2008年01期
6 鄭天華;王學(xué)成;;基于Eclipse的通用用戶權(quán)限管理插件的設(shè)計與實現(xiàn)[J];長春理工大學(xué)學(xué)報;2005年04期
7 馬惟哲;;B/S+C/S結(jié)構(gòu)的報名系統(tǒng)[J];浙江傳媒學(xué)院學(xué)報;2008年02期
8 么煒;吳玉潔;董素芬;;基于多元線性回歸分析的設(shè)施農(nóng)業(yè)信息系統(tǒng)[J];河北農(nóng)業(yè)大學(xué)學(xué)報;2011年01期
9 邢素萍;陳煜;;在Java巧用JDOM來生成和處理XML文檔[J];電腦學(xué)習(xí);2009年06期
10 程鵬;王建勇;黃文卓;林麗燕;;基于Web的電力系統(tǒng)數(shù)據(jù)模型轉(zhuǎn)換[J];電力自動化設(shè)備;2006年10期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 楊衛(wèi)明;;獨立式搜索引擎原理及存在問題分析[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
2 周永;廖競;;“三個有利于”在計算機基礎(chǔ)課程教學(xué)中的應(yīng)用[A];2008年計算機應(yīng)用技術(shù)交流會論文集[C];2008年
3 張銀南;梅萬龍;;基于Java的銀行自助終端系統(tǒng)開發(fā)[A];促進(jìn)企業(yè)信息化進(jìn)程——第九屆中國Java技術(shù)及應(yīng)用交流大會文集[C];2006年
4 周永;陳寧;;幾種典型漢字編碼之間轉(zhuǎn)換的原理與實現(xiàn)[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(二)[C];2008年
5 姜波;楊晶;何劍虹;陳祥光;;鋼軌供應(yīng)鏈系統(tǒng)的研究與實現(xiàn)[A];第七屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2009年
6 余平祥;張麗紅;劉偉章;余金昌;;雙代號網(wǎng)絡(luò)圖自動生成系統(tǒng)研究與實現(xiàn)[A];農(nóng)業(yè)系統(tǒng)工程理論與實踐研究——全國農(nóng)業(yè)系統(tǒng)工程學(xué)術(shù)研討會論文集[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條
1 張向奎;汽車車身部件快速成形仿真技術(shù)平臺與關(guān)鍵算法研究[D];吉林大學(xué);2008年
2 劉竟;面向概念檢索的農(nóng)史信息門戶的設(shè)計與構(gòu)建[D];南京農(nóng)業(yè)大學(xué);2008年
3 朱東來;多模型驅(qū)動的面向服務(wù)系統(tǒng)開發(fā)方法與技術(shù)研究[D];復(fù)旦大學(xué);2009年
4 李倩;富鈷和富硒物料濕法處理工藝及理論基礎(chǔ)研究[D];中南大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張靜;基于SON微微基站的網(wǎng)絡(luò)管理系統(tǒng)設(shè)計與實現(xiàn)[D];哈爾濱工程大學(xué);2010年
2 王虹;遼河油田油井遠(yuǎn)程監(jiān)控服務(wù)系統(tǒng)[D];大連理工大學(xué);2010年
3 李德路;青島遠(yuǎn)洋船舶調(diào)度管理系統(tǒng)設(shè)計[D];中國海洋大學(xué);2010年
4 徐斌;基于J2EE的石化運維管理平臺的研究與實現(xiàn)[D];江西師范大學(xué);2010年
5 吳海應(yīng);江西電信網(wǎng)上營業(yè)廳系統(tǒng)的設(shè)計與實現(xiàn)[D];江西師范大學(xué);2010年
6 陽明亮;省煙草電子商務(wù)系統(tǒng)的設(shè)計與實現(xiàn)[D];華東師范大學(xué);2010年
7 楊新兵;縣城行政執(zhí)法人員管理系統(tǒng)的設(shè)計與實現(xiàn)[D];華東師范大學(xué);2010年
8 李彥華;衛(wèi)星網(wǎng)絡(luò)管理系統(tǒng)中的自檢驗與更新技術(shù)研究[D];沈陽理工大學(xué);2010年
9 江韜;廣州市防雷檢測業(yè)務(wù)系統(tǒng)設(shè)計與實現(xiàn)[D];華南理工大學(xué);2010年
10 朱德能;樂家衛(wèi)浴公司人力資源管理系統(tǒng)設(shè)計與實現(xiàn)[D];華南理工大學(xué);2010年
【同被引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳鵬飛;;基于WVTool的文本向量空間模型研究與實現(xiàn)[J];電腦編程技巧與維護(hù);2012年05期
2 方娟;梁文燦;;一種基于協(xié)同過濾的網(wǎng)格門戶推薦模型[J];電子與信息學(xué)報;2010年07期
3 徐風(fēng)苓;孟祥武;王立才;;基于移動用戶上下文相似度的協(xié)同過濾推薦算法[J];電子與信息學(xué)報;2011年11期
4 黃武漢;孟祥武;王立才;;移動通信網(wǎng)中基于用戶社會化關(guān)系挖掘的協(xié)同過濾算法[J];電子與信息學(xué)報;2011年12期
5 宗瑜;金萍;陳恩紅;李紅;劉仁金;;面向Weblog的模糊協(xié)同聚類算法[J];電子與信息學(xué)報;2012年03期
6 李藝紅;蔣秀鳳;;中文句子傾向性分析[J];福州大學(xué)學(xué)報(自然科學(xué)版);2010年04期
7 王雷;;淺析互聯(lián)網(wǎng)信息智能整合系統(tǒng)關(guān)鍵技術(shù)[J];計算機光盤軟件與應(yīng)用;2012年11期
8 李振星,徐澤平,唐衛(wèi)清,唐榮錫;全二分最大匹配快速分詞算法[J];計算機工程與應(yīng)用;2002年11期
9 王偉強;高文;段立娟;;Internet上的文本數(shù)據(jù)挖掘[J];計算機科學(xué);2000年04期
10 蔣海;李軍;李忠誠;;混合內(nèi)容分發(fā)網(wǎng)絡(luò)及其性能分析模型[J];計算機學(xué)報;2009年03期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 黃永生;基于用戶社會屬性的點對點內(nèi)容分發(fā)網(wǎng)絡(luò)模型研究[D];北京郵電大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 艾偉;基于本體的Web信息文本挖掘與檢索服務(wù)研究[D];北京信息控制研究所;2010年
2 徐仰彬;基于SOM的文本聚類及其在搜索結(jié)果中的應(yīng)用[D];西安電子科技大學(xué);2007年
3 高加旺;基于支持向量機的垃圾郵件過濾模型研究[D];哈爾濱理工大學(xué);2008年
4 韓立寶;基于P2POverCDN和RTSP的流媒體代理服務(wù)器的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2008年
5 熊瀟;基于搜索引擎索引分析的互聯(lián)網(wǎng)輿情監(jiān)控研究[D];上海交通大學(xué);2009年
6 朱濤;基于P2P的內(nèi)容分發(fā)網(wǎng)絡(luò)的系統(tǒng)結(jié)構(gòu)資源搜索與路由算法研究[D];電子科技大學(xué);2008年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 徐建華;網(wǎng)絡(luò)搜索引擎原理、特性分析及未來發(fā)展趨勢[J];圖書情報工作;2000年08期
2 韓梅;網(wǎng)絡(luò)搜索引擎研究綜述(1994~2004年)[J];圖書館學(xué)研究;2005年10期
3 晏一平;岳泉;;中外元搜索引擎的比較研究[J];圖書館學(xué)研究;2005年11期
4 楊應(yīng)全,文汝,黃登婕;搜索引擎的不足與應(yīng)用經(jīng)驗[J];現(xiàn)代情報;2005年07期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李樹青;崔北亮;;搜索引擎系統(tǒng)中的Web個性化信息推薦技術(shù)[J];情報雜志;2006年09期
2 王弼佐;游運華;王茜;;基于Ontology的個性化智能知識檢索模型[J];情報雜志;2006年10期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王慕潑;企業(yè)集團的智能搜索引擎平臺的建立[D];浙江理工大學(xué);2014年
相關(guān)機構(gòu)
>浙江理工大學(xué)
相關(guān)作者
>王慕潑
《中國學(xué)術(shù)期刊(光盤版)》電子雜志社有限公司
同方知網(wǎng)數(shù)字出版技術(shù)股份有限公司
地址:北京清華大學(xué) 84-48信箱 知識超市公司
京ICP證040441號
互聯(lián)網(wǎng)出版許可證 新出網(wǎng)證(京)字008號
出版物經(jīng)營許可證 新出發(fā)京批字第直0595號
訂購熱線:400-819-9993 010-62982499
服務(wù)熱線:010-62985026 010-62791813
在線咨詢:
傳真:010-62780361
京公網(wǎng)安備11010802020475號
本文關(guān)鍵詞:基于Web搜索引擎系統(tǒng)的設(shè)計與實現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號:52156
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/52156.html