基于Nutch的XML網(wǎng)站全文搜索引擎實現(xiàn)
[Abstract]:The common search engine web crawler can only understand the common HTML tags, and can not effectively analyze the content of the XML site. In this paper, a pure XML website with dynamic custom tags is established, and a scheme of using XSL style information to help web crawler understand the meaning of XML web page label is proposed. The full-text search engine of XML website based on Nutch is implemented.
【作者單位】: 上海理工大學(xué)計算機工程學(xué)院;
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前1條
1 韓毅;;基于DTD的XML文檔內(nèi)容檢索研究[J];情報科學(xué);2006年03期
【共引文獻】
相關(guān)碩士學(xué)位論文 前5條
1 王巖;基于XML技術(shù)歷史數(shù)據(jù)歸檔與重構(gòu)的研究應(yīng)用[D];太原理工大學(xué);2011年
2 陳金森;XML搜索引擎中索引技術(shù)的研究[D];燕山大學(xué);2006年
3 胡燕;元數(shù)據(jù)在多媒體電子文件管理中的應(yīng)用研究[D];蘇州大學(xué);2008年
4 王忠義;基于XML的全文檢索方法及原型系統(tǒng)實現(xiàn)研究[D];華中師范大學(xué);2009年
5 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
【二級參考文獻】
相關(guān)期刊論文 前3條
1 路燕,張亮,汪衛(wèi),段起陽,施伯樂;XML查詢中DTD的排序技術(shù)[J];計算機研究與發(fā)展;2003年11期
2 樊小華;龐引明;張謐;汪衛(wèi);陳金海;施伯樂;;優(yōu)化的XML查詢匹配:基于B~+-Tree索引的包含段的結(jié)構(gòu)化聯(lián)接算法[J];計算機科學(xué);2004年06期
3 韓毅;數(shù)字圖書館中基于XML的搜索引擎設(shè)計[J];情報科學(xué);2003年12期
【相似文獻】
相關(guān)期刊論文 前10條
1 甘莉;李霖;尹章才;;基于XSL的地圖知識表達[J];測繪科學(xué);2006年03期
2 孫曉霞,劉曉霞;用Java擴展XSLT[J];微機發(fā)展;2005年08期
3 萬常選;魯遠;;基于用戶相關(guān)反饋的帶結(jié)構(gòu)語義的XML查詢詞擴展[J];情報學(xué)報;2009年03期
4 章小龍;衡星辰;;基于四層貝葉斯網(wǎng)絡(luò)的XML文檔信息檢索模型[J];計算機應(yīng)用;2009年10期
5 李春亮;雷永林;張偉;朱一凡;;基于UML的SMP2模型集成方法研究[J];系統(tǒng)仿真學(xué)報;2009年21期
6 馬振華;陳群;;基于相關(guān)性排序改進的ALCA算法[J];科學(xué)技術(shù)與工程;2010年09期
7 溫馨;陳群;婁穎;;基于詞項擴展的XML信息檢索反饋技術(shù)[J];計算機工程;2011年20期
8 王叢剛,瞿裕忠;一個XSLT處理器的設(shè)計[J];計算機工程;2002年03期
9 陳傳波;段紅華;;基于GML與SVG的WebGIS模型研究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2006年07期
10 劉康珍;肖和平;陽國貴;;XML文檔處理子系統(tǒng)的設(shè)計[J];計算機應(yīng)用與軟件;2008年06期
相關(guān)會議論文 前1條
1 禹繼波;毛宇光;;基于圖型建模的XML信息檢索研究[A];中國電子學(xué)會第十六屆信息論學(xué)術(shù)年會論文集[C];2009年
相關(guān)碩士學(xué)位論文 前4條
1 劉康珍;XML文檔管理系統(tǒng)的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2006年
2 段紅華;基于地理標(biāo)記語言與SVG的WebGIS模型及其應(yīng)用研究[D];華中科技大學(xué);2006年
3 曹雪冬;基于符合Celts-3標(biāo)準(zhǔn)的XML教育資源查詢技術(shù)的研究[D];內(nèi)蒙古大學(xué);2009年
4 王清;基于符合Celts-3標(biāo)準(zhǔn)的XML教育資源索引技術(shù)的研究[D];內(nèi)蒙古大學(xué);2009年
,本文編號:2208205
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2208205.html