天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于Web信息組織模型的元數(shù)據(jù)檢索技術

發(fā)布時間:2018-03-07 21:39

  本文選題:元數(shù)據(jù) 切入點:搜索引擎 出處:《計算機應用》2006年S1期  論文類型:期刊論文


【摘要】:針對目前互聯(lián)網(wǎng)搜索引擎主要使用全文檢索技術,無法從W eb頁面中提取元數(shù)據(jù)信息情況,設計了一個基于信息組織模型的W eb元數(shù)據(jù)信息提取和檢索系統(tǒng)。使用基于正則表達式的元數(shù)據(jù)信息提取模型,信息提取和索引程序不斷從數(shù)量巨大的W eb頁面中提取元數(shù)據(jù)信息,對本地元數(shù)據(jù)庫進行不斷地更新。抽象了多種W eb信息組織模型,設計了相應的信息檢索模型,并且這些模型可以大范圍地應用于提取W eb站點的元數(shù)據(jù),所采用的方法充分利用了W eb頁面的數(shù)據(jù)結(jié)構,避免了采用復雜的語法、語義分析,為面向多個領域的元數(shù)據(jù)信息檢索做出了一定的研究和探索。
[Abstract]:At present, the main use of the Internet search engine, full-text retrieval technology, to extract metadata information from the W EB page, the design of a W EB metadata information organization model information extraction and retrieval system based on the model. Using the metadata information extraction based on regular expressions, information extraction and indexing program to extract metadata information from the huge number of W EB page, the local element database updated continuously. A variety of abstract W EB information model, the design of information retrieval models, and these models can be used in a wide range of metadata extraction W EB site, the method makes full use of the data structure of W EB pages, to avoid the use of complex syntax, semantic analysis, information oriented fields as metadata retrieval has made certain research and exploration.

【作者單位】: 北京航空航天大學計算機學院 北京航空航天大學計算機學院
【基金】:國家科技部基金資助項目(2003DKA5G015)
【分類號】:TP391.3

【相似文獻】

相關期刊論文 前10條

1 ;創(chuàng)新工業(yè)搜索引擎[J];中國制造業(yè)信息化;2011年12期

2 胡風華;王磊;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];中國新技術新產(chǎn)品;2011年18期

3 方亞會;;Google失敗后快速切換搜索引擎[J];電腦迷;2011年11期

4 李國鋒;李春偉;;網(wǎng)絡搜索引擎技術探析[J];廊坊師范學院學報;2005年04期

5 冷國華;;網(wǎng)頁快照幫我快速獲取資料[J];電腦愛好者;2011年10期

6 閆淑紅;;基于搜索引擎的信息查詢技術研究[J];電腦開發(fā)與應用;2011年07期

7 康亞娟;;淺談站內(nèi)信息搜索系統(tǒng)[J];硅谷;2011年13期

8 孫掌印;;搜索引擎Yahoo與Google的比較分析[J];科技情報開發(fā)與經(jīng)濟;2011年17期

9 馮慶峰;;信息時代如何獲取信息[J];成功(教育);2011年08期

10 王巧玲;彭靜;王春紅;;中文分詞技術的研究及在Nutch中的實現(xiàn)[J];科技信息;2011年19期

相關會議論文 前10條

1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術年會論文集[C];2008年

2 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年

3 倪俊峰;;基于黃頁搜索引擎的關鍵字排名廣告系統(tǒng)的設計與實現(xiàn)[A];2005年中國索引學會年會暨學術研討會論文集[C];2005年

4 張怡;查貴庭;;SEO在信息服務中的應用研究[A];2010年中國索引學會年會暨學術研討會論文集[C];2010年

5 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第2屆中國普適計算學術會議(PCC'06)論文集[C];2006年

6 楊萌;李春麗;朱明;;網(wǎng)絡搜索技術下的編輯工作[A];學報編輯論叢(第十一集)[C];2003年

7 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年

8 申琪君;;電子地圖搜索引擎比較[A];中國地理學會2007年學術年會論文摘要集[C];2007年

9 岑榮偉;劉奕群;張敏;茹立云;馬少平;;網(wǎng)絡搜索引擎用戶行為分析和研究[A];第五屆全國信息檢索學術會議論文集[C];2009年

10 薩曉靜;;網(wǎng)絡化生存下的圖書館改革之路[A];福建省圖書館學會2008年學術年會論文集[C];2008年

相關重要報紙文章 前10條

1 本報記者 朱杰;搜索引擎應用性能分析報告[N];中國計算機報;2009年

2 記者 李建偉;第4代搜索引擎在鄭州問世[N];中國知識產(chǎn)權報;2009年

3 記者 趙志鵬;媒體稱俄擬建國家搜索引擎[N];新華每日電訊;2010年

4 吳前;搜索引擎“碳排量”驚人[N];中國文化報;2010年

5 記者 李大慶;新型搜索引擎能向用戶直接提供所需內(nèi)容[N];科技日報;2010年

6 深圳大學傳播學院、傳媒與文化發(fā)展研究中心 周裕瓊;誰動了我的大腦[N];社會科學報;2010年

7 李大慶;新型搜索引擎直接為用戶提供所需內(nèi)容[N];中國技術市場報;2010年

8 余建斌;搜索引擎市場“烽煙四起”[N];中國高新技術產(chǎn)業(yè)導報;2010年

9 邁巴赫 編譯;搜索引擎20年[N];計算機世界;2010年

10 記者 秦羽 通訊員 施銀峰;全球搜索引擎營銷大會在甬舉行[N];寧波日報;2010年

相關博士學位論文 前10條

1 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年

2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年

3 蘇君華;面向搜索引擎的技術接受模型研究[D];南京大學;2011年

4 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年

6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年

7 李莎莎;面向搜索引擎的自然語言處理關鍵技術研究[D];國防科學技術大學;2011年

8 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應用研究所);2003年

9 費巍;搜索引擎檢索功能的性能評價研究[D];武漢大學;2010年

10 黃河;農(nóng)業(yè)復雜自適應搜索模型研究及實現(xiàn)[D];中國科學技術大學;2010年

相關碩士學位論文 前10條

1 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學;2010年

2 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年

3 董晨;基于模糊聚類的個性化搜索引擎的研究[D];福州大學;2005年

4 封俊;基于Hadoop的分布式搜索引擎研究與實現(xiàn)[D];太原理工大學;2010年

5 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實現(xiàn)[D];華南理工大學;2010年

6 尉建興;基于Lucene搜索引擎的研究與應用[D];太原理工大學;2011年

7 歐建斌;基于Web挖掘與信息分類的個性化搜索引擎研究[D];暨南大學;2010年

8 張朝斌;企業(yè)級搜索引擎的優(yōu)化設計與實現(xiàn)[D];華南理工大學;2010年

9 楊曉丹;基于Lucene的主題搜索引擎模板的設計與實現(xiàn)[D];浙江工商大學;2011年

10 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學;2011年

,

本文編號:1581054

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1581054.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e14d9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com