面向主題的個(gè)人實(shí)時(shí)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
【圖文】:
題瀏覽模塊負(fù)責(zé)主題的制定和以特定格式從主題文件中讀取出搜集到的鏈接標(biāo)題及地址,并通過(guò)一個(gè)IE插件實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的瀏覽,如圖1所示。網(wǎng)絡(luò)爬蟲(chóng)模塊是對(duì)現(xiàn)有網(wǎng)絡(luò)爬蟲(chóng)的一種改進(jìn),它使用啟發(fā)式的實(shí)時(shí)搜索算法,從用戶指定的種子URL開(kāi)始,在網(wǎng)絡(luò)上查找主題相關(guān)信息,其結(jié)構(gòu)見(jiàn)圖2。下面對(duì)網(wǎng)絡(luò)爬蟲(chóng)模塊各組成部分作詳·40·《現(xiàn)代圖書(shū)情報(bào)技術(shù)》 2006年 第5期信息檢索技術(shù) 總第136期
網(wǎng)絡(luò)爬蟲(chóng)的一種改進(jìn),它使用啟發(fā)式的實(shí)時(shí)搜索算法,從用戶指定的種子URL開(kāi)始,在網(wǎng)絡(luò)上查找主題相關(guān)信息,其結(jié)構(gòu)見(jiàn)圖2。下面對(duì)網(wǎng)絡(luò)爬蟲(chóng)模塊各組成部分作詳·40·《現(xiàn)代圖書(shū)情報(bào)技術(shù)》 2006年 第5期信息檢索技術(shù) 總第136期
【作者單位】: 江西財(cái)經(jīng)大學(xué)信息學(xué)院 江西財(cái)經(jīng)大學(xué)信息學(xué)院
【分類(lèi)號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 汪濤,樊孝忠;主題爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用;2004年S1期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高靈霞;;基于主題爬蟲(chóng)的個(gè)性化搜索引擎技術(shù)分析[J];電腦知識(shí)與技術(shù);2009年32期
2 徐詩(shī)亮;;一種基于概念空間的主題爬蟲(chóng)設(shè)計(jì)方法[J];福建電腦;2008年10期
3 邱均平,張洋;網(wǎng)絡(luò)信息計(jì)量學(xué)綜述[J];高校圖書(shū)館工作;2005年01期
4 付濤;戴玉剛;周登;;鏈接分析在主題信息檢索系統(tǒng)中的應(yīng)用[J];電腦與電信;2009年01期
5 李園偉;;面向高校主題搜索引擎的的爬行器設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2011年16期
6 付光;;面向招聘信息主題搜索引擎的研究與設(shè)計(jì)[J];廣西教育;2011年18期
7 李艷生;汪自云;;基于遺傳算法的Web主題庫(kù)成長(zhǎng)技術(shù)研究[J];湖北師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期
8 李廣麗;劉覺(jué)夫;;面向URL的網(wǎng)絡(luò)機(jī)器人軟件模型的研究與實(shí)現(xiàn)[J];華東交通大學(xué)學(xué)報(bào);2007年01期
9 譚愛(ài)平;成亞玲;;搜索引擎技術(shù)綜述[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年03期
10 陳方;譚愛(ài)平;成亞玲;文益民;;主題爬蟲(chóng)技術(shù)研究綜述[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年05期
相關(guān)碩士學(xué)位論文 前10條
1 巫昌凱;企業(yè)知識(shí)庫(kù)系統(tǒng)中復(fù)雜查詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
2 王斐;基于增量反饋和自適應(yīng)機(jī)制的主題爬蟲(chóng)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京理工大學(xué);2005年
3 王曉華;基于內(nèi)容的搜索引擎技術(shù)研究及其應(yīng)用[D];鄭州大學(xué);2005年
4 姜杰;專業(yè)搜索引擎分布式Robot設(shè)計(jì)研究[D];南京師范大學(xué);2005年
5 葉昭暉;網(wǎng)絡(luò)信息雷達(dá)系統(tǒng)的研究與設(shè)計(jì)[D];國(guó)防科學(xué)技術(shù)大學(xué);2005年
6 劉瑋瑋;搜索引擎中主題爬蟲(chóng)的研究與實(shí)現(xiàn)[D];南京理工大學(xué);2006年
7 劉潔清;網(wǎng)站聚焦爬蟲(chóng)研究[D];江西財(cái)經(jīng)大學(xué);2006年
8 姜鑫維;基于分布式的智能搜索引擎[D];武漢理工大學(xué);2006年
9 劉強(qiáng)國(guó);主題搜索引擎設(shè)計(jì)與研究[D];電子科技大學(xué);2007年
10 趙欽;并行爬行器的架構(gòu)與優(yōu)化策略[D];北京工業(yè)大學(xué);2006年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 曹軍;Google的PageRank技術(shù)剖析[J];情報(bào)雜志;2002年10期
相關(guān)會(huì)議論文 前1條
1 李盛韜;吳麗輝;于滿泉;潘文鋒;余智華;王斌;程學(xué)旗;;主題Web信息采集的研究與設(shè)計(jì)[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 于成龍;于洪波;;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究[J];東莞理工學(xué)院學(xué)報(bào);2011年03期
2 王芳;陳海建;;深入解析Web主題爬蟲(chóng)的關(guān)鍵性原理[J];微型電腦應(yīng)用;2011年07期
3 魏毅峰;;產(chǎn)品評(píng)論檢索系統(tǒng)設(shè)計(jì)[J];現(xiàn)代經(jīng)濟(jì)信息;2011年14期
4 ;李彥宏論搜索引擎三個(gè)定律[J];新電子;2001年02期
5 相春雷;;2009年中國(guó)搜索引擎市場(chǎng)趨勢(shì)分析[J];軟件世界;2010年02期
6 郭曉霞;王磊;席巖;王曉艷;汪瑛;;基于網(wǎng)絡(luò)的視頻內(nèi)容檢索與盜版追蹤溯源研究[J];廣播與電視技術(shù);2011年07期
7 張春菊;張雪英;朱少楠;徐希濤;;基于網(wǎng)絡(luò)爬蟲(chóng)的地名數(shù)據(jù)庫(kù)維護(hù)方法[J];地球信息科學(xué)學(xué)報(bào);2011年04期
8 ;揭秘搜索引擎收錄網(wǎng)站的秘密[J];計(jì)算機(jī)與網(wǎng)絡(luò);2010年Z1期
9 張睿涵;林振榮;李建民;衷灣;;基于主題定制的專利網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與現(xiàn)代化;2011年07期
10 金凡;顧進(jìn)廣;;一種改進(jìn)的T-Spider分布式爬蟲(chóng)[J];微電子學(xué)與計(jì)算機(jī);2011年08期
相關(guān)會(huì)議論文 前10條
1 劉凡平;高艷華;于炯;張偉;;基于關(guān)鍵決策方法的站內(nèi)搜索研究與實(shí)現(xiàn)[A];2010年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集[C];2010年
2 徐劍;柯貴明;;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)在搜索引擎中的應(yīng)用[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國(guó)中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
5 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
6 維尼拉·木沙江;吐?tīng)柡椤の崴韭?;維、哈、柯文搜索引擎中網(wǎng)頁(yè)爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 陶冶;劉建勛;唐明董;;基于Map/Reduce的分布式Web服務(wù)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];CCF NCSC 2011——第二屆中國(guó)計(jì)算機(jī)學(xué)會(huì)服務(wù)計(jì)算學(xué)術(shù)會(huì)議論文集[C];2011年
8 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
9 王凱;劉代志;李東旭;齊瑋;;地球物理環(huán)境情報(bào)搜集系統(tǒng)研究[A];國(guó)家安全地球物理叢書(shū)(四)——地球物理環(huán)境探測(cè)和目標(biāo)信息獲取與處理[C];2008年
10 姚樹(shù)宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 記者 毛濤濤;優(yōu)酷主動(dòng)屏蔽搜索引擎[N];北京商報(bào);2008年
2 實(shí)習(xí)生 楊海鵬;2008中國(guó)搜索引擎市場(chǎng)突破50億元[N];中國(guó)新聞出版報(bào);2009年
3 記者 張良;給搜索引擎排座次,首份“搜索榜”出爐[N];新華每日電訊;2009年
4 孟飛鴻;今年搜索引擎市場(chǎng)增幅近四成[N];中國(guó)稅務(wù)報(bào);2009年
5 本報(bào)記者 張韜;中國(guó)搜索引擎用戶規(guī)模達(dá)2.03億[N];上海證券報(bào);2009年
6 記者 崔逾瑜 實(shí)習(xí)生 石小利;“搜索引擎依賴癥”悄然浮現(xiàn)[N];湖北日?qǐng)?bào);2009年
7 夏言;全球搜索引擎營(yíng)銷(xiāo)大會(huì)四月在廈門(mén)舉行[N];國(guó)際商報(bào);2009年
8 本報(bào)記者 廖慶升;洪波:谷歌逆市招聘表明搜索引擎將一枝獨(dú)秀[N];通信信息報(bào);2009年
9 張黎明;搜索引擎行業(yè)立法監(jiān)管提速[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2009年
10 記者 戈清平;三季度搜索引擎收入增長(zhǎng)放緩[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 李群;主題搜索引擎聚類(lèi)算法的研究[D];北京林業(yè)大學(xué);2011年
2 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
6 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
7 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年
8 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
9 費(fèi)巍;搜索引擎檢索功能的性能評(píng)價(jià)研究[D];武漢大學(xué);2010年
10 黃河;農(nóng)業(yè)復(fù)雜自適應(yīng)搜索模型研究及實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 梁萍;搜索引擎中網(wǎng)絡(luò)爬蟲(chóng)及結(jié)果聚類(lèi)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年
2 龔勇;搜索引擎中網(wǎng)絡(luò)爬蟲(chóng)的研究[D];武漢理工大學(xué);2010年
3 夏亮;主題搜索引擎網(wǎng)絡(luò)爬蟲(chóng)搜索策略的研究與實(shí)現(xiàn)[D];北京化工大學(xué);2010年
4 郭海燕;搜索引擎中網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究[D];西安電子科技大學(xué);2009年
5 李春生;基于WEB信息采集的分布式網(wǎng)絡(luò)爬蟲(chóng)搜索引擎的研究[D];吉林大學(xué);2009年
6 歐建斌;基于Web挖掘與信息分類(lèi)的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年
7 徐財(cái)應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進(jìn)[D];長(zhǎng)春理工大學(xué);2010年
8 蘇旋;分布式網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2006年
9 劉青偉;搜索引擎中的Pagerank排序算法研究分析[D];電子科技大學(xué);2010年
10 范慧;以博客內(nèi)容為對(duì)象的個(gè)性化搜索研究[D];華中科技大學(xué);2010年
,本文編號(hào):2546554
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2546554.html