用PAT Tree構(gòu)建Internet搜索引擎分布式數(shù)據(jù)庫(kù)
本文關(guān)鍵詞: 搜索引擎 分布式數(shù)據(jù)庫(kù) PATTree 出處:《計(jì)算機(jī)應(yīng)用》2002年09期 論文類型:期刊論文
【摘要】:文中根據(jù)Internet搜索引擎的特點(diǎn) ,提出了用PATTree作為搜索引擎索引數(shù)據(jù)庫(kù)的思想 ,在理論上對(duì)其可行性進(jìn)行了分析 ,用它實(shí)現(xiàn)了一個(gè)能夠?qū)TP站點(diǎn)進(jìn)行檢索的實(shí)驗(yàn)性搜索引擎。
[Abstract]:According to the characteristics of Internet search engine, this paper puts forward the idea of using PATTree as the index database of search engine, and analyzes its feasibility in theory. It is used to implement an experimental search engine that can retrieve FTP sites.
【作者單位】: 清華大學(xué)電子工程系 清華大學(xué)電子工程系 清華大學(xué)電子工程系
【分類號(hào)】:TP311.133.1
【正文快照】: 1 引言隨著互聯(lián)網(wǎng)的發(fā)展 ,搜索引擎已經(jīng)成為互聯(lián)網(wǎng)上必不可少的工具。然而 ,因特網(wǎng)上的信息資源非常龐大 ,并且仍在不斷地增長(zhǎng)著。 1994年 ,大約有 10 0 ,0 0 0個(gè)WWW網(wǎng)址[1] ;1997年 ,這一數(shù)目增長(zhǎng)到了二百萬(wàn)至一億[2 ] ;到 2 0 0 0年 ,WWW上大約有一百億個(gè)網(wǎng)頁(yè)。所以
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 楊文峰,李星;基于PAT TREE統(tǒng)計(jì)語(yǔ)言模型與關(guān)鍵詞自動(dòng)提取[J];計(jì)算機(jī)工程與應(yīng)用;2001年15期
【共引文獻(xiàn)】
相關(guān)期刊論文 前7條
1 吳保珍;何婷婷;李立;張勇;陳龍;;基于全切分獲取網(wǎng)絡(luò)流行語(yǔ)方法研究[J];計(jì)算機(jī)應(yīng)用研究;2009年04期
2 高振峰;李錫祚;;基于滑動(dòng)窗口的特征提取方法在文本分類中的應(yīng)用[J];科技信息(學(xué)術(shù)研究);2008年34期
3 張慶國(guó);薛德軍;張振海;張君玉;;海量數(shù)據(jù)集上基于特征組合的關(guān)鍵詞自動(dòng)抽取[J];情報(bào)學(xué)報(bào);2006年05期
4 曹進(jìn)軍;;基于PATTree的半結(jié)構(gòu)化文本信息抽取范式研究[J];情報(bào)雜志;2007年07期
5 肖紅;許少華;;基于詞匯同現(xiàn)模型的關(guān)鍵詞自動(dòng)提取方法研究[J];沈陽(yáng)理工大學(xué)學(xué)報(bào);2009年05期
6 劉華;;基于分類標(biāo)注語(yǔ)料庫(kù)的關(guān)鍵詞標(biāo)引知識(shí)自動(dòng)獲取[J];圖書情報(bào)工作;2007年07期
7 劉華;;關(guān)鍵詞自動(dòng)標(biāo)引系統(tǒng)實(shí)現(xiàn)[J];現(xiàn)代圖書情報(bào)技術(shù);2006年02期
相關(guān)會(huì)議論文 前1條
1 吳繼媛;孫淳;侯敏;;面向傳媒語(yǔ)言語(yǔ)料庫(kù)的關(guān)鍵詞自動(dòng)抽取研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
相關(guān)博士學(xué)位論文 前2條
1 王蘭成;基于XMARC信息描述的知識(shí)標(biāo)引與概念檢索研究[D];東華大學(xué);2004年
2 王菁華;文本中知識(shí)的獲取[D];北京郵電大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 盧小康;中文文本復(fù)制檢測(cè)技術(shù)研究[D];杭州電子科技大學(xué);2009年
2 管瑞霞;基于基因表達(dá)式編程的中文文本關(guān)鍵詞提取算法研究[D];杭州電子科技大學(xué);2009年
3 王明燕;基于WEB頁(yè)面的關(guān)鍵詞與關(guān)鍵概念提取技術(shù)[D];北京工業(yè)大學(xué);2003年
4 劉洋;基于Web的內(nèi)容挖掘技術(shù)研究[D];哈爾濱工程大學(xué);2003年
5 劉建舟;術(shù)語(yǔ)自動(dòng)抽取系統(tǒng)的設(shè)計(jì)及關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2004年
6 劉巖;基于Web的文本挖掘技術(shù)的研究[D];哈爾濱工程大學(xué);2004年
7 沈建良;基于本體論的個(gè)性化信息搜索系統(tǒng)研究[D];哈爾濱工程大學(xué);2005年
8 翟林;領(lǐng)域本體的半自動(dòng)構(gòu)建方法研究與實(shí)現(xiàn)[D];東南大學(xué);2005年
9 張志剛;領(lǐng)域本體構(gòu)建方法的研究與應(yīng)用[D];大連海事大學(xué);2008年
10 趙青;改進(jìn)搜索引擎性能的研究[D];天津大學(xué);2007年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期
2 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期
3 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
4 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期
5 周毅華;從搜索引擎的分類看其應(yīng)用技巧[J];圖書館理論與實(shí)踐;2002年06期
6 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書館學(xué)研究;2002年05期
7 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期
8 林中;GOOGLE搜索引擎的關(guān)鍵詞檢索[J];中國(guó)信息導(dǎo)報(bào);2003年03期
9 封劍待封喉;吸星大法“搜”天下 笑傲網(wǎng)絡(luò)任我行——搜索引擎絕對(duì)專題[J];網(wǎng)絡(luò)與信息;2003年07期
10 閆凡蕾;建設(shè)站內(nèi)搜索的好幫手——Search Engine Maker[J];少年電世界;2003年08期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
6 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
7 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
相關(guān)重要報(bào)紙文章 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場(chǎng)[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
4 賽迪顧問(wèn)股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國(guó)計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國(guó)經(jīng)營(yíng)報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國(guó)證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
10 姜蕊;問(wèn)天下誰(shuí)識(shí)搜索?[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
6 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
7 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
8 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
9 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
3 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
4 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
5 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
6 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
7 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
8 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
9 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年
10 歐建斌;基于Web挖掘與信息分類的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年
,本文編號(hào):1450996
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1450996.html