基于多權(quán)重因子影響的網(wǎng)頁排序改進(jìn)算法
【圖文】:
圖 5.3 Heritrix 主界面Figure 5.3 The main interface for Heritrix由于本文實(shí)驗(yàn)使用的Heritrix版本為 Heritrix3.1.0,與 Heritrix1.14.4 版本最大的不同在于任務(wù)配置文件從 order.xml 文件轉(zhuǎn)到了 crawler-beans.cxml 文件。因此在任務(wù)建立完成后,進(jìn)入管理界面,對 crawler-beans.cxml 配置文件進(jìn)行編輯。
圖 5.3 Heritrix 主界面Figure 5.3 The main interface for Heritrix由于本文實(shí)驗(yàn)使用的Heritrix版本為 Heritrix3.1.0,與 Heritrix1.14.4 版本最大的不同在于任務(wù)配置文件從 order.xml 文件轉(zhuǎn)到了 crawler-beans.cxml 文件。因此在任務(wù)建立完成后,進(jìn)入管理界面,對 crawler-beans.cxml 配置文件進(jìn)行編輯。
【學(xué)位授予單位】:浙江農(nóng)林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李躍鵬;金翠;及俊川;;基于word2vec的關(guān)鍵詞提取算法[J];科研信息化技術(shù)與應(yīng)用;2015年04期
2 徐山;杜衛(wèi)鋒;;不均衡訓(xùn)練集下短信過濾系統(tǒng)kNN方法的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年11期
3 馬海波;楊楠;于新興;;用戶差別化和主題敏感的PageRank算法[J];大連交通大學(xué)學(xué)報(bào);2013年04期
4 孫佳龍;郭金運(yùn);郭淑艷;;基于多種度量的電離層TEC混沌預(yù)測分析[J];地球物理學(xué)進(jìn)展;2013年03期
5 馮海濤;;基于網(wǎng)頁時(shí)間權(quán)值的PageRank算法改進(jìn)[J];西安郵電大學(xué)學(xué)報(bào);2013年02期
6 劉敏娜;;基于向量空間模型的信息檢索技術(shù)研究[J];現(xiàn)代電子技術(shù);2012年11期
7 叢帥;張積賓;徐志明;王宇穎;;Feature selection algorithm for text classification based on improved mutual information[J];Journal of Harbin Institute of Technology;2011年03期
8 王德廣;周志剛;梁旭;;PageRank算法的分析及其改進(jìn)[J];計(jì)算機(jī)工程;2010年22期
9 潘磊;雷鈺麗;王崇駿;謝俊元;;基于權(quán)重的Jaccard相似度度量的實(shí)體識別方法[J];北京交通大學(xué)學(xué)報(bào);2009年06期
10 高琳;夏清國;王黎明;;基于本體的智能信息檢索系統(tǒng)的構(gòu)建方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年24期
,本文編號:2649982
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2649982.html