基于XML的站內(nèi)搜索引擎研究研究.pdf
本文關(guān)鍵詞:基于XML的站內(nèi)搜索引擎研究,由筆耕文化傳播整理發(fā)布。
文檔介紹:
華東師范大學(xué)碩士學(xué)位論文基于XML的站內(nèi)搜索引擎研究姓名:時(shí)金峰申請(qǐng)學(xué)位級(jí)別:碩士專(zhuān)業(yè):計(jì)算機(jī)應(yīng)用指導(dǎo)教師:應(yīng)吉康20070101華東師范大學(xué)碩士學(xué)位論文摘要當(dāng)今,互聯(lián)網(wǎng)已成為人類(lèi)有史以來(lái)資源最多、品種最全、規(guī)模最大的信息庫(kù)。作為網(wǎng)上最主要的信息檢索工具,搜索引擎發(fā)揮著非常重要的作用。傳統(tǒng)的搜索引擎大都是基于HTML的搜索引擎,HTML重顯示輕內(nèi)容的特點(diǎn)大大限制了搜索引擎的查準(zhǔn)率,傳統(tǒng)搜索引擎的查準(zhǔn)率有待提高,F(xiàn)在,一種可擴(kuò)展標(biāo)記語(yǔ)言XML開(kāi)始慢慢發(fā)展起來(lái),越來(lái)越多的文檔開(kāi)始用酬L語(yǔ)言來(lái)描述、存儲(chǔ)和交換。XML的標(biāo)記含義豐富、意義明確,能明白的提示所標(biāo)記的內(nèi)容,搜索引擎可以依靠標(biāo)記和內(nèi)容之間的依存關(guān)系,準(zhǔn)確定位、找到目標(biāo),從而大大減小搜索范圍,提高檢索精度。在這種發(fā)展背景下,本文對(duì)基于XML文檔的站內(nèi)搜索引擎進(jìn)行了研究。首先,本文設(shè)計(jì)了基于XML文檔的站內(nèi)搜索引擎的模型,介紹了模型的設(shè)計(jì)思想及大體框架。模型包括機(jī)器人模塊、轉(zhuǎn)換模塊、解析模塊、索引模塊和查詢(xún)模塊這幾部分。本文詳細(xì)描述了各個(gè)模塊的結(jié)構(gòu)和實(shí)現(xiàn)思想,并給出了部分模塊的具體實(shí)現(xiàn)。然后,本文介紹搜索引擎的索引模塊。針對(duì)XML文檔的特點(diǎn),本文設(shè)計(jì)的索引模塊包括節(jié)點(diǎn)結(jié)構(gòu)構(gòu)造器和索引器,其中索...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:基于XML的站內(nèi)搜索引擎研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):92180
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/92180.html