基于關鍵詞的深度萬維網(wǎng)數(shù)據(jù)庫查詢
本文關鍵詞:基于關鍵詞的深度萬維網(wǎng)數(shù)據(jù)庫查詢 出處:《計算機與數(shù)字工程》2013年04期 論文類型:期刊論文
更多相關文章: 深度萬維網(wǎng) 關鍵詞查詢 領域
【摘要】:深度萬維網(wǎng)蘊藏著海量的信息,現(xiàn)有的搜索引擎很難搜索到其中的內(nèi)容。如何充分地獲取深度萬維網(wǎng)中的有價值的信息成為一個難題。論文提出了基于關鍵詞的深度萬維網(wǎng)的數(shù)據(jù)庫的查詢方法,該方法采用樸素貝葉斯算法對關鍵詞進行分類,并采用日志挖掘?qū)Σ蓸拥臄?shù)據(jù)庫進行統(tǒng)計,最終生成查詢的SQL語句。該方法不僅解決了深度萬維網(wǎng)多領域的數(shù)據(jù)庫查詢,而且能夠與現(xiàn)有的搜索引擎進行整合,幫助用戶快速有效的查詢。
[Abstract]:The deep World wide Web contains vast amounts of information. It is very difficult for the existing search engines to search for the content. How to obtain the valuable information in the deep World wide Web is a difficult problem. This paper proposes a query method of the database based on the keyword depth World wide Web. . In this method, naive Bayes algorithm is used to classify keywords, and log mining is used to statistics the sampled database. The method not only solves the deep Web multi-domain database query, but also integrates with the existing search engine, and helps users to query quickly and effectively.
【作者單位】: 上海師范大學信息與機電學院;
【基金】:上海師范大學科研基金(編號:SK201041)資助
【分類號】:TP311.13
【正文快照】: 1引言在當今信息的時代,萬維網(wǎng)成了主要的資源。然而隱藏在其后的深度萬維網(wǎng)卻沒有被很好地開發(fā)和利用,因為傳統(tǒng)的搜索引擎搜索不到其中豐富的內(nèi)容。對深度萬維網(wǎng)中的數(shù)據(jù)庫的獲取,只能通過查詢接口,所要搜索的內(nèi)容只有被用戶查詢時才會由Web服務器動態(tài)的生成頁面,最終把結果
【參考文獻】
相關期刊論文 前5條
1 徐欣;阮幼林;;最大頻繁模式的挖掘算法[J];艦船電子工程;2009年03期
2 劉偉;孟小峰;孟衛(wèi)一;;Deep Web數(shù)據(jù)集成研究綜述[J];計算機學報;2007年09期
3 劉玉奎;周立柱;范舉;;中文深度萬維網(wǎng)數(shù)據(jù)庫的現(xiàn)狀研究[J];計算機學報;2011年02期
4 范舉;周立柱;;基于關鍵詞的深度萬維網(wǎng)數(shù)據(jù)庫選擇[J];計算機學報;2011年10期
5 趙志宏;黃蕾;劉峰;陳振宇;;Deep Web搜索技術進展綜述[J];山東大學學報(工學版);2009年02期
【共引文獻】
相關期刊論文 前10條
1 陸余良;房珊瑤;劉金紅;施凡;;Deep Web站點分類研究進展[J];安徽大學學報(自然科學版);2010年01期
2 陶磊;莫倩;;基于CSS選擇器的深網(wǎng)結果頁抽取方法[J];北京工商大學學報(自然科學版);2009年02期
3 李穎;劉國華;佟冰;劉順江;;基于素數(shù)的多源模式匹配方法的研究[J];燕山大學學報;2009年02期
4 王彩霞;高明;;Deep Web查詢接口及其識別算法[J];電腦知識與技術;2011年22期
5 蔣莘;;基于知網(wǎng)的論文按需檢索系統(tǒng)[J];電腦知識與技術;2012年02期
6 趙昊;衛(wèi)剛;趙曉東;;基于主題Deep Web數(shù)據(jù)挖掘的研究與探索[J];電腦知識與技術;2012年16期
7 張志平;張云坤;李文駿;;Deep web在個性化信息服務中的應用[J];電子商務;2010年08期
8 郭少杰;陳雅冰;;Deep Web技術在科學數(shù)據(jù)共享平臺中的應用[J];廣東科技;2010年14期
9 李春林;;Web數(shù)據(jù)庫集成技術及其發(fā)展趨勢[J];硅谷;2012年09期
10 李強;;Deep-Web搜索引擎實現(xiàn)技術研究[J];甘肅科技;2012年03期
相關會議論文 前8條
1 蔡彪;廖聞劍;彭艷兵;;Deep Web數(shù)據(jù)集成和關鍵技術綜述[A];2009年研究生學術交流會通信與信息技術論文集[C];2009年
2 李鵬;朱青;任安建;胡偉;杜小勇;;支持短語識別的關系數(shù)據(jù)庫關鍵詞查詢算法[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(一)[C];2008年
3 陶然;江錦華;吳羽;陳剛;;基于樹合并的Deep Web查詢接口集成[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
4 閆中敏;李慶忠;彭朝暉;董永權;丁艷輝;張永新;徐秀星;;DWDIS:面向分析的Deep Web數(shù)據(jù)集成系統(tǒng)[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
5 韓子揚;李貴;李征宇;王鳳英;;基于分布式結構的Deep Web結構化數(shù)據(jù)抽取系統(tǒng)[A];第九屆沈陽科學學術年會論文集[C];2012年
6 韓子揚;李貴;李征宇;王鳳英;;基于分布式結構的Deep Web結構化數(shù)據(jù)抽取系統(tǒng)[A];第九屆沈陽科學學術年會論文集(信息科學與工程技術分冊)[C];2012年
7 祝官文;王念濱;王紅濱;;基于語法分析的深層網(wǎng)絡查詢表單信息獲取方法[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年
8 鄧松;萬常選;劉喜平;江騰蛟;雷剛;;基于主題語義的非合作結構化Top-N深網(wǎng)數(shù)據(jù)源選擇[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年
相關博士學位論文 前10條
1 張慧斌;Deep Web查詢接口及查詢結果抽取研究[D];南開大學;2010年
2 閆中敏;Deep Web數(shù)據(jù)獲取問題研究[D];山東大學;2010年
3 黎方正;關系數(shù)據(jù)庫的關鍵詞檢索技術研究[D];中南大學;2010年
4 張卓;基于形式概念分析的Web數(shù)據(jù)庫抽取研究[D];武漢大學;2011年
5 王顏新;非常規(guī)突發(fā)事件情境重構模型研究[D];哈爾濱工業(yè)大學;2011年
6 吳春明;Deep Web數(shù)據(jù)集成關鍵技術及其在農(nóng)業(yè)領域的應用[D];西南大學;2011年
7 孟祥福;Web數(shù)據(jù)庫柔性查詢關鍵技術研究[D];東北大學;2010年
8 聶鐵錚;Deep Web中Web數(shù)據(jù)庫集成關鍵技術的研究[D];東北大學;2009年
9 黃健斌;基于條件概率圖模型的Deep Web數(shù)據(jù)抽取與集成研究[D];西安電子科技大學;2007年
10 徐和祥;Deep Web集成中若干技術研究[D];復旦大學;2008年
相關碩士學位論文 前10條
1 樊敬川;Deep Web數(shù)據(jù)庫的選擇研究[D];河北大學;2009年
2 商翠珍;數(shù)據(jù)資源匯聚的可視化建模技術研究與應用[D];山東科技大學;2010年
3 朱靜;數(shù)據(jù)資源匯聚中嵌套表格模型的研究與應用[D];山東科技大學;2010年
4 夏懷楠;支持跨域數(shù)據(jù)匯聚的關系數(shù)據(jù)訪問服務研究[D];山東科技大學;2010年
5 劉富江;網(wǎng)絡數(shù)據(jù)源模式識別方法及策略研究[D];哈爾濱工程大學;2010年
6 周建斌;基于J2EE Web應用的科學數(shù)據(jù)共享平臺的研究與實現(xiàn)[D];華南理工大學;2010年
7 王培正;基于Deep Web的網(wǎng)絡信息抽取技術研究[D];華南理工大學;2010年
8 彭媛媛;Deep Web數(shù)據(jù)清洗方法研究及應用[D];長春工業(yè)大學;2010年
9 白霜;DNA序列的最大頻繁模式挖掘[D];南昌大學;2010年
10 陶小波;電子就業(yè)文本挖掘系統(tǒng)關鍵技術研究與應用[D];浙江工商大學;2011年
【二級參考文獻】
相關期刊論文 前10條
1 劉偉;孟小峰;孟衛(wèi)一;;Deep Web數(shù)據(jù)集成研究綜述[J];計算機學報;2007年09期
2 劉玉奎;周立柱;范舉;;中文深度萬維網(wǎng)數(shù)據(jù)庫的現(xiàn)狀研究[J];計算機學報;2011年02期
3 宋峻峰,張維明,肖衛(wèi)東,唐九陽;基于本體的信息檢索模型研究[J];南京大學學報(自然科學版);2005年02期
4 黃曉冬;Invisible Web研究綜述[J];情報科學;2004年09期
5 林玲;周立柱;;基于簡單查詢接口的Web數(shù)據(jù)庫模式識別[J];清華大學學報(自然科學版);2010年04期
6 劉偉;孟小峰;凌妍妍;;一種基于圖模型的Web數(shù)據(jù)庫采樣方法[J];軟件學報;2008年02期
7 袁柳;李戰(zhàn)懷;陳世亮;;基于本體的Deep Web數(shù)據(jù)標注[J];軟件學報;2008年02期
8 高嶺;趙朋朋;崔志明;;Deep Web查詢接口的自動判定[J];計算機技術與發(fā)展;2007年05期
9 趙朋朋;高嶺;崔志明;;基于查詢接口特征的Deep Web數(shù)據(jù)源自動分類[J];微電子學與計算機;2006年10期
10 趙朋朋;崔志明;高嶺;仲華;;關于中國Deep Web的規(guī)模、分布和結構[J];小型微型計算機系統(tǒng);2007年10期
【相似文獻】
相關期刊論文 前10條
1 汪曉航;;數(shù)據(jù)庫技術的發(fā)展[J];企業(yè)導報;2011年02期
2 楊磊;基于獨立軟件級構件的領域軟構件體系[J];計算機應用研究;2001年06期
3 鄒咸林;領域體系結構開發(fā)技術及應用[J];嘉應學院學報;2001年03期
4 賈l,
本文編號:1410384
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1410384.html