面向主題的個人實時搜索引擎的設計與實現(xiàn)
【圖文】:
題瀏覽模塊負責主題的制定和以特定格式從主題文件中讀取出搜集到的鏈接標題及地址,并通過一個IE插件實現(xiàn)對網(wǎng)頁的瀏覽,如圖1所示。網(wǎng)絡爬蟲模塊是對現(xiàn)有網(wǎng)絡爬蟲的一種改進,它使用啟發(fā)式的實時搜索算法,從用戶指定的種子URL開始,在網(wǎng)絡上查找主題相關(guān)信息,其結(jié)構(gòu)見圖2。下面對網(wǎng)絡爬蟲模塊各組成部分作詳·40·《現(xiàn)代圖書情報技術(shù)》 2006年 第5期信息檢索技術(shù) 總第136期
網(wǎng)絡爬蟲的一種改進,它使用啟發(fā)式的實時搜索算法,從用戶指定的種子URL開始,在網(wǎng)絡上查找主題相關(guān)信息,其結(jié)構(gòu)見圖2。下面對網(wǎng)絡爬蟲模塊各組成部分作詳·40·《現(xiàn)代圖書情報技術(shù)》 2006年 第5期信息檢索技術(shù) 總第136期
【作者單位】: 江西財經(jīng)大學信息學院 江西財經(jīng)大學信息學院
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前1條
1 汪濤,樊孝忠;主題爬蟲的設計與實現(xiàn)[J];計算機應用;2004年S1期
【共引文獻】
相關(guān)期刊論文 前10條
1 高靈霞;;基于主題爬蟲的個性化搜索引擎技術(shù)分析[J];電腦知識與技術(shù);2009年32期
2 徐詩亮;;一種基于概念空間的主題爬蟲設計方法[J];福建電腦;2008年10期
3 邱均平,張洋;網(wǎng)絡信息計量學綜述[J];高校圖書館工作;2005年01期
4 付濤;戴玉剛;周登;;鏈接分析在主題信息檢索系統(tǒng)中的應用[J];電腦與電信;2009年01期
5 李園偉;;面向高校主題搜索引擎的的爬行器設計[J];電腦知識與技術(shù);2011年16期
6 付光;;面向招聘信息主題搜索引擎的研究與設計[J];廣西教育;2011年18期
7 李艷生;汪自云;;基于遺傳算法的Web主題庫成長技術(shù)研究[J];湖北師范學院學報(自然科學版);2010年04期
8 李廣麗;劉覺夫;;面向URL的網(wǎng)絡機器人軟件模型的研究與實現(xiàn)[J];華東交通大學學報;2007年01期
9 譚愛平;成亞玲;;搜索引擎技術(shù)綜述[J];湖南工業(yè)職業(yè)技術(shù)學院學報;2008年03期
10 陳方;譚愛平;成亞玲;文益民;;主題爬蟲技術(shù)研究綜述[J];湖南工業(yè)職業(yè)技術(shù)學院學報;2008年05期
相關(guān)碩士學位論文 前10條
1 巫昌凱;企業(yè)知識庫系統(tǒng)中復雜查詢系統(tǒng)的設計與實現(xiàn)[D];華南理工大學;2010年
2 王斐;基于增量反饋和自適應機制的主題爬蟲系統(tǒng)的設計與實現(xiàn)[D];南京理工大學;2005年
3 王曉華;基于內(nèi)容的搜索引擎技術(shù)研究及其應用[D];鄭州大學;2005年
4 姜杰;專業(yè)搜索引擎分布式Robot設計研究[D];南京師范大學;2005年
5 葉昭暉;網(wǎng)絡信息雷達系統(tǒng)的研究與設計[D];國防科學技術(shù)大學;2005年
6 劉瑋瑋;搜索引擎中主題爬蟲的研究與實現(xiàn)[D];南京理工大學;2006年
7 劉潔清;網(wǎng)站聚焦爬蟲研究[D];江西財經(jīng)大學;2006年
8 姜鑫維;基于分布式的智能搜索引擎[D];武漢理工大學;2006年
9 劉強國;主題搜索引擎設計與研究[D];電子科技大學;2007年
10 趙欽;并行爬行器的架構(gòu)與優(yōu)化策略[D];北京工業(yè)大學;2006年
【二級參考文獻】
相關(guān)期刊論文 前1條
1 曹軍;Google的PageRank技術(shù)剖析[J];情報雜志;2002年10期
相關(guān)會議論文 前1條
1 李盛韜;吳麗輝;于滿泉;潘文鋒;余智華;王斌;程學旗;;主題Web信息采集的研究與設計[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
【相似文獻】
相關(guān)期刊論文 前10條
1 于成龍;于洪波;;網(wǎng)絡爬蟲技術(shù)研究[J];東莞理工學院學報;2011年03期
2 王芳;陳海建;;深入解析Web主題爬蟲的關(guān)鍵性原理[J];微型電腦應用;2011年07期
3 魏毅峰;;產(chǎn)品評論檢索系統(tǒng)設計[J];現(xiàn)代經(jīng)濟信息;2011年14期
4 ;李彥宏論搜索引擎三個定律[J];新電子;2001年02期
5 相春雷;;2009年中國搜索引擎市場趨勢分析[J];軟件世界;2010年02期
6 郭曉霞;王磊;席巖;王曉艷;汪瑛;;基于網(wǎng)絡的視頻內(nèi)容檢索與盜版追蹤溯源研究[J];廣播與電視技術(shù);2011年07期
7 張春菊;張雪英;朱少楠;徐希濤;;基于網(wǎng)絡爬蟲的地名數(shù)據(jù)庫維護方法[J];地球信息科學學報;2011年04期
8 ;揭秘搜索引擎收錄網(wǎng)站的秘密[J];計算機與網(wǎng)絡;2010年Z1期
9 張睿涵;林振榮;李建民;衷灣;;基于主題定制的專利網(wǎng)絡爬蟲的設計與實現(xiàn)[J];計算機與現(xiàn)代化;2011年07期
10 金凡;顧進廣;;一種改進的T-Spider分布式爬蟲[J];微電子學與計算機;2011年08期
相關(guān)會議論文 前10條
1 劉凡平;高艷華;于炯;張偉;;基于關(guān)鍵決策方法的站內(nèi)搜索研究與實現(xiàn)[A];2010年全國開放式分布與并行計算機學術(shù)會議論文集[C];2010年
2 徐劍;柯貴明;;網(wǎng)絡爬蟲技術(shù)在搜索引擎中的應用[A];全國第21屆計算機技術(shù)與應用學術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應用學術(shù)會議論文集[C];2010年
3 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術(shù)年會論文集[C];2008年
4 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學術(shù)交流會議論文匯編[C];2003年
5 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
6 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術(shù)研討會論文集[C];2010年
7 陶冶;劉建勛;唐明董;;基于Map/Reduce的分布式Web服務搜索引擎設計與實現(xiàn)[A];CCF NCSC 2011——第二屆中國計算機學會服務計算學術(shù)會議論文集[C];2011年
8 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學會2008年年會論文集[C];2008年
9 王凱;劉代志;李東旭;齊瑋;;地球物理環(huán)境情報搜集系統(tǒng)研究[A];國家安全地球物理叢書(四)——地球物理環(huán)境探測和目標信息獲取與處理[C];2008年
10 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計算學術(shù)會議論文集[C];2005年
相關(guān)重要報紙文章 前10條
1 記者 毛濤濤;優(yōu)酷主動屏蔽搜索引擎[N];北京商報;2008年
2 實習生 楊海鵬;2008中國搜索引擎市場突破50億元[N];中國新聞出版報;2009年
3 記者 張良;給搜索引擎排座次,首份“搜索榜”出爐[N];新華每日電訊;2009年
4 孟飛鴻;今年搜索引擎市場增幅近四成[N];中國稅務報;2009年
5 本報記者 張韜;中國搜索引擎用戶規(guī)模達2.03億[N];上海證券報;2009年
6 記者 崔逾瑜 實習生 石小利;“搜索引擎依賴癥”悄然浮現(xiàn)[N];湖北日報;2009年
7 夏言;全球搜索引擎營銷大會四月在廈門舉行[N];國際商報;2009年
8 本報記者 廖慶升;洪波:谷歌逆市招聘表明搜索引擎將一枝獨秀[N];通信信息報;2009年
9 張黎明;搜索引擎行業(yè)立法監(jiān)管提速[N];中國高新技術(shù)產(chǎn)業(yè)導報;2009年
10 記者 戈清平;三季度搜索引擎收入增長放緩[N];中國高新技術(shù)產(chǎn)業(yè)導報;2008年
相關(guān)博士學位論文 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
2 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學;2011年
4 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
5 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
6 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年
7 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2011年
8 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應用研究所);2003年
9 費巍;搜索引擎檢索功能的性能評價研究[D];武漢大學;2010年
10 黃河;農(nóng)業(yè)復雜自適應搜索模型研究及實現(xiàn)[D];中國科學技術(shù)大學;2010年
相關(guān)碩士學位論文 前10條
1 梁萍;搜索引擎中網(wǎng)絡爬蟲及結(jié)果聚類的研究與實現(xiàn)[D];中國科學技術(shù)大學;2011年
2 龔勇;搜索引擎中網(wǎng)絡爬蟲的研究[D];武漢理工大學;2010年
3 夏亮;主題搜索引擎網(wǎng)絡爬蟲搜索策略的研究與實現(xiàn)[D];北京化工大學;2010年
4 郭海燕;搜索引擎中網(wǎng)絡爬蟲技術(shù)研究[D];西安電子科技大學;2009年
5 李春生;基于WEB信息采集的分布式網(wǎng)絡爬蟲搜索引擎的研究[D];吉林大學;2009年
6 歐建斌;基于Web挖掘與信息分類的個性化搜索引擎研究[D];暨南大學;2010年
7 徐財應;基于Lucene的搜索引擎技術(shù)的研究與改進[D];長春理工大學;2010年
8 蘇旋;分布式網(wǎng)絡爬蟲技術(shù)的研究與實現(xiàn)[D];哈爾濱工業(yè)大學;2006年
9 劉青偉;搜索引擎中的Pagerank排序算法研究分析[D];電子科技大學;2010年
10 范慧;以博客內(nèi)容為對象的個性化搜索研究[D];華中科技大學;2010年
,本文編號:2546554
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2546554.html