基于XML的站內(nèi)搜索引擎研究研究.pdf

發(fā)布時(shí)間：2016-08-12 11:10

本文關(guān)鍵詞：基于XML的站內(nèi)搜索引擎研究，由筆耕文化傳播整理發(fā)布。

文檔介紹：
華東師范大學(xué)碩士學(xué)位論文基于XML的站內(nèi)搜索引擎研究姓名:時(shí)金峰申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):計(jì)算機(jī)應(yīng)用指導(dǎo)教師:應(yīng)吉康20070101華東師范大學(xué)碩士學(xué)位論文摘要當(dāng)今,互聯(lián)網(wǎng)已成為人類有史以來資源最多、品種最全、規(guī)模最大的信息庫(kù)。作為網(wǎng)上最主要的信息檢索工具,搜索引擎發(fā)揮著非常重要的作用。傳統(tǒng)的搜索引擎大都是基于HTML的搜索引擎,HTML重顯示輕內(nèi)容的特點(diǎn)大大限制了搜索引擎的查準(zhǔn)率,傳統(tǒng)搜索引擎的查準(zhǔn)率有待提高。現(xiàn)在,一種可擴(kuò)展標(biāo)記語(yǔ)言XML開始慢慢發(fā)展起來,越來越多的文檔開始用酬L語(yǔ)言來描述、存儲(chǔ)和交換。XML的標(biāo)記含義豐富、意義明確,能明白的提示所標(biāo)記的內(nèi)容,搜索引擎可以依靠標(biāo)記和內(nèi)容之間的依存關(guān)系,準(zhǔn)確定位、找到目標(biāo),從而大大減小搜索范圍,提高檢索精度。在這種發(fā)展背景下,本文對(duì)基于XML文檔的站內(nèi)搜索引擎進(jìn)行了研究。首先,本文設(shè)計(jì)了基于XML文檔的站內(nèi)搜索引擎的模型,介紹了模型的設(shè)計(jì)思想及大體框架。模型包括機(jī)器人模塊、轉(zhuǎn)換模塊、解析模塊、索引模塊和查詢模塊這幾部分。本文詳細(xì)描述了各個(gè)模塊的結(jié)構(gòu)和實(shí)現(xiàn)思想,并給出了部分模塊的具體實(shí)現(xiàn)。然后,本文介紹搜索引擎的索引模塊。針對(duì)XML文檔的特點(diǎn),本文設(shè)計(jì)的索引模塊包括節(jié)點(diǎn)結(jié)構(gòu)構(gòu)造器和索引器,其中索... 內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.

本文關(guān)鍵詞：基于XML的站內(nèi)搜索引擎研究，由筆耕文化傳播整理發(fā)布。

，

本文編號(hào)：92180

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/92180.html

上一篇：Luder基于內(nèi)容的文檔搜索引擎
下一篇：元搜索引擎調(diào)度策略及結(jié)果排序算法的研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于XML的站內(nèi)搜索引擎研究研究.pdf