《第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)》2009年
本文關鍵詞:寵物用品垂直搜索引擎研究與設計,由筆耕文化傳播整理發(fā)布。
《第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)》2009年
Deep Web垂直搜索引擎設計與實現(xiàn)
王上 于海 王鉦旋
【摘要】:將deep Web發(fā)掘與主題爬行技術有機地結(jié)合起來,對deep Web垂直搜索引擎系統(tǒng)的關鍵技術進行了深入研究.首先設計了deep Web主題爬行框架,它是在傳統(tǒng)的主題爬行框架的基礎上,加入了前端分類器作為爬行策略的執(zhí)行機構,并對該分類器做定期的增量更新;然后使用主題爬行技術指導deep Web發(fā)掘,并且借助開源組件Lucene將主題爬行器所搜索的信息進行合理的安排,以便為檢索接口提供查詢服務.當用戶向搜索引擎提交查詢詞后,Lucene缺省按照自己的相關度算法對結(jié)果進行排序.通過爬蟲、索引器和查詢接口的設計,實現(xiàn)了一個面向deep Web的垂直搜索引擎原型系統(tǒng).
【作者單位】:
【基金】:國家自然科學基金項目(60773098/F020103)
【分類號】:TP391.3
【正文快照】:
deep Web是一個與surfaee Web相對應的概念,最初由Jill Ellsworth于1994年提出,指那些由普通搜索引擎難以發(fā)現(xiàn)其信息內(nèi)容的web頁面〔‘〕.與Surfaee Web相比,deep Web包含的信息量更大,,主題更專一,信息質(zhì)量更高,信息結(jié)構化更好.研究表明[2一3」,deep web信息是可索引We
下載全文更多同類文獻
PDF全文下載
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式,AdobeReader僅支持PDF格式
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 顧鵬堯;;讓搜索引擎更好地服務于教育教學[J];科學24小時;2003年Z1期
2 陳新顏;垂直搜索引擎辨析[J];現(xiàn)代情報;2004年09期
3 胡文勝;;垂直搜索助號碼百事通與商務領航[J];每周電腦報;2006年32期
4 胡潔;丁寧;關靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學垂直搜索引擎的實踐[J];信息系統(tǒng)工程;2009年05期
5 一林;;垂直搜索:前進路上的喜與憂[J];互聯(lián)網(wǎng)天地;2010年02期
6 牟思;;基于垂直搜索引擎的學校網(wǎng)站的研究與建設[J];中國教育技術裝備;2011年21期
7 田野;垂直搜索火熱為哪般[J];中國計算機用戶;2005年37期
8 胡文勝;;垂直搜索助號碼百事通與商務領航[J];每周電腦報;2006年31期
9 邊凱;;你會搜索嗎?[J];中國計算機用戶;2007年23期
10 宿建光;;指點通:移動垂直搜索的創(chuàng)新者[J];通信世界;2007年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
2 余偉;李石君;洪輝;田建偉;;基于覆蓋關系的Deep Web數(shù)據(jù)源排名[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2007年
3 梁浩;左萬利;任斐;赫楓齡;;基于啟發(fā)式信息的Deep Web查詢接口屬性抽取[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
4 王英;左萬利;王鑫;彭濤;;Deep Web查詢轉(zhuǎn)換研究[A];第六屆全國信息檢索學術會議論文集[C];2010年
5 閆中敏;李慶忠;彭朝暉;董永權;丁艷輝;張永新;徐秀星;;DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
6 王英;左萬利;王鑫;彭濤;;基于多分類器的Deep Web入口發(fā)現(xiàn)[A];第六屆全國信息檢索學術會議論文集[C];2010年
7 王英;左萬利;彭濤;赫楓齡;彭釗;;應用領域本體知識庫自動填充Deep Web入口表單[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(二)[C];2008年
8 朱命冬;申德榮;寇月;聶鐵錚;于戈;;一種應用于Deep Web環(huán)境下的重復記錄識別模型[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
9 陶然;江錦華;吳羽;陳剛;;基于樹合并的Deep Web查詢接口集成[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
10 艾靜;王仲遠;孟小峰;;C-Rank:一種Deep Web數(shù)據(jù)記錄可信度評估方法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(A輯)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學技術情報研究所 周峻松;[N];計算機世界;2010年
2 王艷;[N];中國旅游報;2000年
3 賽迪網(wǎng) 方剛;[N];中國計算機報;2000年
4 王靖;[N];人民日報海外版;2000年
5 記者 王滸;[N];中國旅游報;2009年
6 本報記者 王宏;[N];中國計算機報;2001年
7 徐瑾 張玉;[N];人民郵電;2009年
8 本報記者 王曉雁;[N];法制日報;2009年
9 記者 吳德群;[N];深圳特區(qū)報;2009年
10 本報記者 胡鈺;[N];華夏時報;2009年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 王曄;垂直搜索引擎若干問題研究[D];復旦大學;2011年
2 吳羽;面向時間敏感對象的垂直搜索引擎關鍵技術研究[D];浙江大學;2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學技術大學;2012年
4 閆中敏;Deep Web數(shù)據(jù)獲取問題研究[D];山東大學;2010年
5 田建偉;面向領域的高質(zhì)量Deep Web數(shù)據(jù)集成技術研究[D];武漢大學;2010年
6 潘鵬;Deep Web查詢中的不確定性問題研究[D];山東大學;2010年
7 王英;Deep Web數(shù)據(jù)集成關鍵技術研究[D];吉林大學;2010年
8 董永權;Deep Web數(shù)據(jù)集成關鍵問題研究[D];山東大學;2010年
9 吳春明;Deep Web數(shù)據(jù)集成關鍵技術及其在農(nóng)業(yè)領域的應用[D];西南大學;2011年
10 梁浩;Deep Web信息集成架構及相關問題研究[D];吉林大學;2010年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王培正;基于Deep Web的網(wǎng)絡信息抽取技術研究[D];華南理工大學;2010年
2 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(北京);2010年
3 齊鵬;垂直搜索引擎分類索引系統(tǒng)的設計與實現(xiàn)[D];大連海事大學;2010年
4 張楠;面向汽車主題的垂直搜索引擎研究與實現(xiàn)[D];西南交通大學;2010年
5 陳向東;寵物用品垂直搜索引擎研究與設計[D];西北農(nóng)林科技大學;2010年
6 周佳慶;實時垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學;2010年
7 華大年;手機產(chǎn)品信息垂直搜索引擎系統(tǒng)設計與開發(fā)[D];武漢理工大學;2011年
8 薛萍;基于教育領域的垂直搜索引擎的研究與實現(xiàn)[D];天津師范大學;2011年
9 馮效棟;垂直搜索引擎技術在網(wǎng)絡輿情巡控中的研究與應用[D];中國海洋大學;2010年
10 張贏;個性化多媒體資源垂直搜索引擎技術研究[D];華東交通大學;2009年
本文關鍵詞:寵物用品垂直搜索引擎研究與設計,由筆耕文化傳播整理發(fā)布。
本文編號:115471
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/115471.html