天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于VSM主題爬蟲爬行策略的研究

發(fā)布時間:2017-11-13 23:22

  本文關(guān)鍵詞:基于VSM主題爬蟲爬行策略的研究


  更多相關(guān)文章: 主題爬蟲 爬行 VSM


【摘要】:網(wǎng)絡(luò)爬蟲作為搜索引擎重要的組成部分,其抓取網(wǎng)頁資源主題相關(guān)性的高低直接決定爬蟲性能的好壞。文章在VSM模型的基礎(chǔ)上引入關(guān)鍵詞的同義、繼承、屬性等關(guān)系的相關(guān)詞匯來增強VSM模型的語義,通過實驗進行驗證,改進能夠取得較好的抓取效果。
【作者單位】: 蘭州交通大學(xué)電信學(xué)院;
【分類號】:TP391.1
【正文快照】: 0引言隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)上的信息量也急速增加。傳統(tǒng)的搜索引擎已經(jīng)不可能提供給用戶既全面又具有專業(yè)深度的服務(wù)了,垂直搜索引擎應(yīng)運而生。主題網(wǎng)絡(luò)爬蟲作為垂直搜索引擎的抓取模塊,負責(zé)搜集網(wǎng)上的網(wǎng)頁信息。主題爬蟲的好壞直接影響著搜索引擎的服務(wù)質(zhì)量,故作為搜索

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 蘇喻;鄭誠;馬中杰;;基于語義的VSM模型改進[J];計算機應(yīng)用與軟件;2011年08期

2 徐猛;胡平;;基于VSM的網(wǎng)頁主題相關(guān)性算法的研究[J];微計算機信息;2009年12期

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前6條

1 馮秀珍;趙翠芬;;面向主題相關(guān)的網(wǎng)站架構(gòu)優(yōu)化方法研究[J];科技管理研究;2012年03期

2 左曉飛;劉懷亮;范云杰;趙輝;;基于概念語義場的文本聚類算法研究[J];情報雜志;2012年05期

3 鄭小波;鄭誠;封軍;;基于Nutch專題搜索引擎的研究[J];微計算機信息;2010年30期

4 郭鋼;李浩;周婧;;基于詞語語義和隱喻邏輯的顧客非結(jié)構(gòu)化需求分析[J];中國機械工程;2013年08期

5 邢麗;;基于云計算的信息推薦系統(tǒng)研究[J];物流技術(shù);2013年03期

6 何利益;陸國鋒;羅鵬;;動態(tài)新聞主題信息推薦系統(tǒng)設(shè)計[J];指揮信息系統(tǒng)與技術(shù);2013年04期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 蘇喻;基于語義的文本聚類搜索研究[D];安徽大學(xué);2011年

2 譚勝;互聯(lián)網(wǎng)新聞實時信息采集及主題探測研究[D];南京航空航天大學(xué);2011年

3 劉佳;基于P2P的主題爬行與搜索路由研究[D];武漢理工大學(xué);2010年

4 王洋;基于主題詞同現(xiàn)圖的網(wǎng)頁相關(guān)度研究[D];華南理工大學(xué);2010年

5 易清亮;面向主題的P2P搜索引擎的研究[D];西華大學(xué);2010年

6 郭倩;主題網(wǎng)站的自動發(fā)現(xiàn)與判定方法研究[D];南京航空航天大學(xué);2012年

7 戚璐瑤;一種基于關(guān)聯(lián)規(guī)則挖掘的查詢擴展算法及應(yīng)用研究[D];南京航空航天大學(xué);2012年

8 芮虎;比價購物平臺中網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[D];華東理工大學(xué);2013年

9 褚宏爽;主題搜索引擎網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2013年

10 張俊;基于Lucene的產(chǎn)品比價搜索系統(tǒng)的研究與設(shè)計[D];上海師范大學(xué);2013年

【二級參考文獻】

中國期刊全文數(shù)據(jù)庫 前3條

1 姜華;;一種基于本體的概念語義相似度計算研究[J];計算機應(yīng)用與軟件;2009年07期

2 孫吉貴;劉杰;趙連宇;;聚類算法研究[J];軟件學(xué)報;2008年01期

3 張冬慧;孫波;徐照財;程顯毅;;文本自動分類關(guān)鍵技術(shù)研究[J];微計算機信息;2008年06期

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 曾水香;羅林波;;基于改進Hits算法的多主題爬蟲研究與實現(xiàn)[J];福建電腦;2010年05期

2 關(guān)慧芬;師軍;馬繼紅;;基于遺傳算法的主題爬行技術(shù)研究[J];計算機與數(shù)字工程;2008年10期

3 汪斌;張云偉;劉健;陳晶;;一種面向農(nóng)業(yè)信息主題網(wǎng)絡(luò)爬蟲的設(shè)計[J];安徽農(nóng)業(yè)科學(xué);2009年20期

4 戚欣;;基于本體的主題網(wǎng)絡(luò)爬蟲設(shè)計[J];武漢理工大學(xué)學(xué)報;2009年03期

5 李廣麗;;基于網(wǎng)頁內(nèi)容評價和Web圖的啟發(fā)式垂直搜索策略的設(shè)計[J];情報理論與實踐;2009年09期

6 張敏;杜華;;垂直搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)[J];情報科學(xué);2011年03期

7 鄒永斌;陳興蜀;王文賢;;基于貝葉斯分類器的主題爬蟲研究[J];計算機應(yīng)用研究;2009年09期

8 任小燕;康小軍;;面向教育資源的垂直搜索引擎應(yīng)用研究[J];軟件導(dǎo)刊;2007年13期

9 柴嘉斌;李廣華;李長春;;主題爬蟲搜索策略的研究[J];科技信息;2011年12期

10 金明珠;丁岳偉;;基于動態(tài)主題庫的主題爬蟲[J];計算機應(yīng)用;2009年S2期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 吳煒;梁昆;李瑞軒;辜希武;盧正鼎;;一種基于主題相關(guān)度的網(wǎng)頁排序算法[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年

2 王旭;杜軍平;;質(zhì)檢總局互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的研究[A];中國電子學(xué)會第十七屆信息論學(xué)術(shù)年會論文集[C];2010年

3 李素建;李蕓;紀(jì)鷺寧;徐睿峰;;詞典匹配和串頻統(tǒng)計相結(jié)合在自動主題分析中的應(yīng)用[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

4 趙恩彪;隋金君;王自亮;李智;;電荷法測量粉塵濃度技術(shù)研究[A];第八屆全國采礦學(xué)術(shù)會議論文集[C];2009年

5 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年

6 張靖;趙明清;;粗糙集理論在建立線性計量經(jīng)濟模型中的應(yīng)用[A];中國企業(yè)運籌學(xué)學(xué)術(shù)交流大會論文集[C];2005年

7 肖詩斌;孫麗華;王弘尉;施水才;;指標(biāo)信息抽取技術(shù)的研究[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年

8 丁春;;論自由詞向關(guān)鍵詞轉(zhuǎn)換的意義[A];學(xué)報編輯論叢(第十二集)[C];2004年

9 齊敏霞;左廷榮;于曉明;;壽光商務(wù)小區(qū)暖通空調(diào)節(jié)能設(shè)計[A];全國暖通空調(diào)制冷2008年學(xué)術(shù)年會資料集[C];2008年

10 柏桂榮;章勇;;基于RSS的用戶興趣模型研究[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會議論文集[C];2009年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 竇毅;“不花錢”讓你排位更靠前[N];中國經(jīng)營報;2007年

2 本報記者  朱薇;抄襲網(wǎng)頁基本布局風(fēng)格也侵權(quán)[N];經(jīng)濟參考報;2006年

3 朱薇;重慶:抄襲網(wǎng)頁基本布局風(fēng)格,也是侵權(quán)[N];新華每日電訊;2006年

4 ;美國開發(fā)出網(wǎng)頁標(biāo)注新技術(shù)[N];人民郵電;2006年

5 ;四月,點擊傳媒關(guān)鍵詞[N];中國婦女報;2003年

6 陳華芳 龔萍;2003教育信息化關(guān)鍵詞[N];中國教育報;2004年

7 本報記者 陳晨曦;競體工作會上的關(guān)鍵詞[N];人民日報;2003年

8 本報記者 李嬌龍;營銷有招一點通[N];中國圖書商報;2004年

9 韓曉玲 楚靜;歷史文化語義學(xué)走向成熟[N];中國社會科學(xué)院院報;2007年

10 ;“十字真經(jīng)”建設(shè)服務(wù)型政府[N];常州日報;2007年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年

2 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年

3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年

4 汲業(yè);面向圖像的垂直搜索引擎關(guān)鍵技術(shù)研究[D];大連海事大學(xué);2013年

5 曲剛;環(huán)境不確定條件下企業(yè)組織間協(xié)作關(guān)系研究[D];大連理工大學(xué);2007年

6 孫偉;香葉天竺葵精油的植物生物學(xué)及其藥理研究[D];華東師范大學(xué);2005年

7 劉向威;NLP技術(shù)在中文信息檢索中的應(yīng)用研究[D];天津大學(xué);2005年

8 黃鵬;基于文本和視覺信息融合的Web圖像檢索[D];浙江大學(xué);2008年

9 馮松鶴;面向感知的圖像檢索及自動標(biāo)注算法研究[D];北京交通大學(xué);2009年

10 劉剛;面向領(lǐng)域的軟件需求一致性驗證方法研究[D];哈爾濱工程大學(xué);2008年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 劉朋;基于Lucene的垂直搜索引擎關(guān)鍵技術(shù)的研究應(yīng)用[D];武漢理工大學(xué);2009年

2 羅林波;基于網(wǎng)頁內(nèi)容和鏈接的主題爬蟲研究與實現(xiàn)[D];海南大學(xué);2010年

3 梁淼;面向問答類網(wǎng)站的垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2013年

4 海濤;垂直搜索引擎數(shù)據(jù)采集技術(shù)的研究與實現(xiàn)[D];華北電力大學(xué)(北京);2008年

5 邱偉林;面向領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];大連海事大學(xué);2011年

6 王俊;面向房產(chǎn)領(lǐng)域的垂直搜索引擎研究與實現(xiàn)[D];南昌大學(xué);2012年

7 白玉昭;垂直搜索引擎的研究與實現(xiàn)[D];江南大學(xué);2012年

8 關(guān)小敏;垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2012年

9 朱健琛;個性化新聞搜索引擎的研究與設(shè)計[D];電子科技大學(xué);2012年

10 孫逸雪;基于時態(tài)信息的主題搜索引擎的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2009年

,

本文編號:1182862

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1182862.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1c4b4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com