主題爬蟲(chóng)技術(shù)研究綜述
發(fā)布時(shí)間:2023-04-10 22:11
隨著移動(dòng)互聯(lián)網(wǎng)的普及以及網(wǎng)絡(luò)信息指數(shù)的增長(zhǎng),如何有效地提取和利用這些信息面臨巨大挑戰(zhàn)。介紹了主題爬蟲(chóng)的工作原理、分類(lèi);回顧了近年來(lái)國(guó)內(nèi)外關(guān)于主題爬蟲(chóng)的研究狀況,分析了各種主題相似度的方法以及搜索策略,得出相比于普通的爬蟲(chóng)系統(tǒng),基于網(wǎng)頁(yè)內(nèi)容和基于鏈接分析的爬蟲(chóng)系統(tǒng)的查準(zhǔn)率、查全率都大幅提升;最后分析比較了主題網(wǎng)絡(luò)爬蟲(chóng)兩種動(dòng)態(tài)搜索策略并指出了未來(lái)研究方向。
【文章頁(yè)數(shù)】:6 頁(yè)
本文編號(hào):3788819
【文章頁(yè)數(shù)】:6 頁(yè)
本文編號(hào):3788819
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3788819.html
最近更新
教材專(zhuān)著