《第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)》2009年
本文關(guān)鍵詞:寵物用品垂直搜索引擎研究與設(shè)計(jì),由筆耕文化傳播整理發(fā)布。
《第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)》2009年
Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)
王上 于海 王鉦旋
【摘要】:將deep Web發(fā)掘與主題爬行技術(shù)有機(jī)地結(jié)合起來,對(duì)deep Web垂直搜索引擎系統(tǒng)的關(guān)鍵技術(shù)進(jìn)行了深入研究.首先設(shè)計(jì)了deep Web主題爬行框架,它是在傳統(tǒng)的主題爬行框架的基礎(chǔ)上,加入了前端分類器作為爬行策略的執(zhí)行機(jī)構(gòu),并對(duì)該分類器做定期的增量更新;然后使用主題爬行技術(shù)指導(dǎo)deep Web發(fā)掘,并且借助開源組件Lucene將主題爬行器所搜索的信息進(jìn)行合理的安排,以便為檢索接口提供查詢服務(wù).當(dāng)用戶向搜索引擎提交查詢?cè)~后,Lucene缺省按照自己的相關(guān)度算法對(duì)結(jié)果進(jìn)行排序.通過爬蟲、索引器和查詢接口的設(shè)計(jì),實(shí)現(xiàn)了一個(gè)面向deep Web的垂直搜索引擎原型系統(tǒng).
【作者單位】:
【基金】:國家自然科學(xué)基金項(xiàng)目(60773098/F020103)
【分類號(hào)】:TP391.3
【正文快照】:
deep Web是一個(gè)與surfaee Web相對(duì)應(yīng)的概念,最初由Jill Ellsworth于1994年提出,指那些由普通搜索引擎難以發(fā)現(xiàn)其信息內(nèi)容的web頁面〔‘〕.與Surfaee Web相比,deep Web包含的信息量更大,,主題更專一,信息質(zhì)量更高,信息結(jié)構(gòu)化更好.研究表明[2一3」,deep web信息是可索引We
下載全文更多同類文獻(xiàn)
PDF全文下載
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式,AdobeReader僅支持PDF格式
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學(xué)[J];科學(xué)24小時(shí);2003年Z1期
2 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報(bào);2004年09期
3 胡文勝;;垂直搜索助號(hào)碼百事通與商務(wù)領(lǐng)航[J];每周電腦報(bào);2006年32期
4 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學(xué)垂直搜索引擎的實(shí)踐[J];信息系統(tǒng)工程;2009年05期
5 一林;;垂直搜索:前進(jìn)路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
6 牟思;;基于垂直搜索引擎的學(xué)校網(wǎng)站的研究與建設(shè)[J];中國教育技術(shù)裝備;2011年21期
7 田野;垂直搜索火熱為哪般[J];中國計(jì)算機(jī)用戶;2005年37期
8 胡文勝;;垂直搜索助號(hào)碼百事通與商務(wù)領(lǐng)航[J];每周電腦報(bào);2006年31期
9 邊凱;;你會(huì)搜索嗎?[J];中國計(jì)算機(jī)用戶;2007年23期
10 宿建光;;指點(diǎn)通:移動(dòng)垂直搜索的創(chuàng)新者[J];通信世界;2007年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
2 余偉;李石君;洪輝;田建偉;;基于覆蓋關(guān)系的Deep Web數(shù)據(jù)源排名[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
3 梁浩;左萬利;任斐;赫楓齡;;基于啟發(fā)式信息的Deep Web查詢接口屬性抽取[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
4 王英;左萬利;王鑫;彭濤;;Deep Web查詢轉(zhuǎn)換研究[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
5 閆中敏;李慶忠;彭朝暉;董永權(quán);丁艷輝;張永新;徐秀星;;DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年
6 王英;左萬利;王鑫;彭濤;;基于多分類器的Deep Web入口發(fā)現(xiàn)[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
7 王英;左萬利;彭濤;赫楓齡;彭釗;;應(yīng)用領(lǐng)域本體知識(shí)庫自動(dòng)填充Deep Web入口表單[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
8 朱命冬;申德榮;寇月;聶鐵錚;于戈;;一種應(yīng)用于Deep Web環(huán)境下的重復(fù)記錄識(shí)別模型[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
9 陶然;江錦華;吳羽;陳剛;;基于樹合并的Deep Web查詢接口集成[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
10 艾靜;王仲遠(yuǎn);孟小峰;;C-Rank:一種Deep Web數(shù)據(jù)記錄可信度評(píng)估方法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;[N];計(jì)算機(jī)世界;2010年
2 王艷;[N];中國旅游報(bào);2000年
3 賽迪網(wǎng) 方剛;[N];中國計(jì)算機(jī)報(bào);2000年
4 王靖;[N];人民日?qǐng)?bào)海外版;2000年
5 記者 王滸;[N];中國旅游報(bào);2009年
6 本報(bào)記者 王宏;[N];中國計(jì)算機(jī)報(bào);2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報(bào)記者 王曉雁;[N];法制日?qǐng)?bào);2009年
9 記者 吳德群;[N];深圳特區(qū)報(bào);2009年
10 本報(bào)記者 胡鈺;[N];華夏時(shí)報(bào);2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時(shí)間敏感對(duì)象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實(shí)現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 閆中敏;Deep Web數(shù)據(jù)獲取問題研究[D];山東大學(xué);2010年
5 田建偉;面向領(lǐng)域的高質(zhì)量Deep Web數(shù)據(jù)集成技術(shù)研究[D];武漢大學(xué);2010年
6 潘鵬;Deep Web查詢中的不確定性問題研究[D];山東大學(xué);2010年
7 王英;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)研究[D];吉林大學(xué);2010年
8 董永權(quán);Deep Web數(shù)據(jù)集成關(guān)鍵問題研究[D];山東大學(xué);2010年
9 吳春明;Deep Web數(shù)據(jù)集成關(guān)鍵技術(shù)及其在農(nóng)業(yè)領(lǐng)域的應(yīng)用[D];西南大學(xué);2011年
10 梁浩;Deep Web信息集成架構(gòu)及相關(guān)問題研究[D];吉林大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王培正;基于Deep Web的網(wǎng)絡(luò)信息抽取技術(shù)研究[D];華南理工大學(xué);2010年
2 李春燕;企業(yè)信息垂直搜索引擎的研究與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
3 齊鵬;垂直搜索引擎分類索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連海事大學(xué);2010年
4 張楠;面向汽車主題的垂直搜索引擎研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
5 陳向東;寵物用品垂直搜索引擎研究與設(shè)計(jì)[D];西北農(nóng)林科技大學(xué);2010年
6 周佳慶;實(shí)時(shí)垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學(xué);2010年
7 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與開發(fā)[D];武漢理工大學(xué);2011年
8 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實(shí)現(xiàn)[D];天津師范大學(xué);2011年
9 馮效棟;垂直搜索引擎技術(shù)在網(wǎng)絡(luò)輿情巡控中的研究與應(yīng)用[D];中國海洋大學(xué);2010年
10 張贏;個(gè)性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年
本文關(guān)鍵詞:寵物用品垂直搜索引擎研究與設(shè)計(jì),由筆耕文化傳播整理發(fā)布。
本文編號(hào):115471
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/115471.html