天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

垂直搜索引擎在校園網(wǎng)中的研究與應(yīng)用

發(fā)布時間:2021-04-08 12:16
  隨著互聯(lián)網(wǎng)的迅猛發(fā)展,從海量數(shù)據(jù)信息中搜索有效信息已經(jīng)成為一個重要的問題。目前雖然己經(jīng)有g(shù)oogle、百度這些優(yōu)秀的通用搜索引擎,但這些搜索引擎對于局域網(wǎng)內(nèi)信息無法完全、準(zhǔn)確的獲取,同時信息的實(shí)時性也無法保證,所以它們并不能很好的準(zhǔn)確檢索具有行業(yè)背景的信息。目前高校校園網(wǎng)的建設(shè)已經(jīng)比較成熟,校園網(wǎng)內(nèi)部的公有信息大幅增長,例如本科及研究生的招生及宣傳信息。如果使用通用搜索引擎,用戶無法獲取較為有效的校園網(wǎng)相關(guān)信息。因此,為了提高信息檢索的效率,本文設(shè)計(jì)并實(shí)現(xiàn)了適用于高校校園網(wǎng)的垂直搜索引擎系統(tǒng)。本文研究并實(shí)現(xiàn)了一個應(yīng)用于高校校園網(wǎng)的垂直搜索引擎系統(tǒng)。首先闡述了通用搜索引擎的工作原理和主要組成部分,進(jìn)而分析了垂直搜索引擎的實(shí)現(xiàn)原理。論文設(shè)計(jì)并完成了網(wǎng)頁抓取模塊、預(yù)處理模塊、索引和查詢模塊等搜索引擎系統(tǒng)的4個核心模塊。其中在網(wǎng)頁抓取模塊中實(shí)現(xiàn)了網(wǎng)頁下載以及將已訪問過的URL過濾的功能;在預(yù)處理模塊中比較了兩種方案,選擇較優(yōu)的一種進(jìn)行了網(wǎng)頁去噪,同時完成了中文分詞、網(wǎng)頁去重工作。針對Lucene中文分詞效果比較弱這一特點(diǎn),對中文分詞技術(shù)進(jìn)行了研究,針對最大匹配法的缺陷對中文分詞進(jìn)行了改進(jìn),提高... 

【文章來源】:西安科技大學(xué)陜西省

【文章頁數(shù)】:61 頁

【學(xué)位級別】:碩士

【部分圖文】:

垂直搜索引擎在校園網(wǎng)中的研究與應(yīng)用


本系統(tǒng)垂直搜索引擎的總體設(shè)計(jì)框架

組織結(jié)構(gòu)圖,組織結(jié)構(gòu)圖,通用搜索引擎,論文


Lucene組織結(jié)構(gòu)圖

鏈接圖,網(wǎng)頁,互聯(lián)網(wǎng),鏈接


動作稱為爬取,下載網(wǎng)頁是一個能夠自動采集網(wǎng)頁據(jù)網(wǎng)頁上大量存在的超鏈的內(nèi)容,找到在該網(wǎng)頁一個網(wǎng)頁,這樣一直循環(huán)頁的自動下載;ヂ(lián)網(wǎng)中,網(wǎng)頁之間的鏈么它將會遇到無數(shù)多的能“壯士一去兮不復(fù)還略是是基于離散數(shù)學(xué)中

【參考文獻(xiàn)】:
期刊論文
[1]基于Bloom Filter的大規(guī)模網(wǎng)頁去重策略研究[J]. 丁振國,吳寶貴,辛友強(qiáng).  現(xiàn)代圖書情報(bào)技術(shù). 2008(03)
[2]WNBTE網(wǎng)頁正文抽取方法研究[J]. 李綱,戴強(qiáng)斌.  情報(bào)科學(xué). 2008(03)
[3]基于WPF的UI自動化測試[J]. 張永革.  軟件世界. 2007(18)
[4]搜索引擎綜合分析[J]. 方志堅(jiān),張瑞林,童小素.  計(jì)算機(jī)工程與設(shè)計(jì). 2007(16)
[5]新一代搜索引擎的智能化特征及技術(shù)進(jìn)展[J]. 喬東枝.  高校圖書館工作. 2007(04)
[6]具有時間反饋的PageRank改進(jìn)算法[J]. 戚華春,黃德才,鄭月鋒.  浙江工業(yè)大學(xué)學(xué)報(bào). 2005(03)
[7]基于信息挖掘的智能決策支持系統(tǒng)的結(jié)構(gòu)設(shè)計(jì)[J]. 蘇占東,楊炳儒,游福成.  計(jì)算機(jī)應(yīng)用研究. 2005(03)

碩士論文
[1]垂直搜索引擎關(guān)鍵技術(shù)研究及應(yīng)用[D]. 王玉輝.華北電力大學(xué)(河北) 2009
[2]中文自動分詞法在全文檢索中的研究及應(yīng)用[D]. 劉婷.南京航空航天大學(xué) 2007
[3]面向特定領(lǐng)域的專業(yè)搜索引擎的架構(gòu)與實(shí)現(xiàn)方法[D]. 胡曉博.哈爾濱工程大學(xué) 2007
[4]分布式Web挖掘與搜索的研究與實(shí)現(xiàn)[D]. 姚勇.西安電子科技大學(xué) 2006
[5]搜索引擎及其相關(guān)性排序研究[D]. 王亮.武漢大學(xué) 2004



本文編號:3125534

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3125534.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1deca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com