主題信息搜索系統(tǒng)中的搜索策略研究
本文關(guān)鍵詞:主題信息搜索系統(tǒng)中的搜索策略研究
更多相關(guān)文章: 搜索引擎 搜索策略 遺傳算法 空間向量模型
【摘要】:針對主題搜索引擎反饋信息主題相關(guān)度低的問題,提出了將遺傳算法與基于內(nèi)容的空間向量模型相結(jié)合的搜索策略。利用空間向量模型確定網(wǎng)頁與主題的相關(guān)度,并將遺傳算法應(yīng)用于相關(guān)度判別,提高主題信息搜索的準(zhǔn)確率和查全率。在Heritrix框架基礎(chǔ)上,利用Eclipse 3.3實現(xiàn)了相應(yīng)功能。實驗結(jié)果表明,搜索策略改進(jìn)后的系統(tǒng)抓取主題頁面所占比例與原系統(tǒng)相比提高了約30%。
【作者單位】: 中南民族大學(xué)圖書館;中南民族大學(xué)電信學(xué)院;
【關(guān)鍵詞】: 搜索引擎 搜索策略 遺傳算法 空間向量模型
【基金】:中央高;究蒲袠I(yè)務(wù)費專項資金項目(ZZQ10011)
【分類號】:TP391.3;TP311.52
【正文快照】: 0引言主題信息搜索系統(tǒng)服務(wù)于特定的應(yīng)用領(lǐng)域,其任務(wù)是獲取與主題相關(guān)的頁面,無需遍歷全網(wǎng)。在主題信息搜索系統(tǒng)中,搜索策略是影響系統(tǒng)性能的關(guān)鍵。常用的主題搜索策略有:基于網(wǎng)頁鏈接結(jié)構(gòu)的搜索策略和基于內(nèi)容評價的搜索策略。其中,PageRank[1]和Hits[2]是基于鏈接結(jié)構(gòu)的搜索
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 袁鼎榮;鐘寧;張師超;;文本信息處理研究述評[J];計算機(jī)科學(xué);2011年02期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉喜文;鄭昌興;王文龍;湯剛強(qiáng);;構(gòu)建數(shù)據(jù)倉庫過程中的數(shù)據(jù)清洗研究[J];圖書與情報;2013年05期
2 潘善亮;茅琴嬌;韓露;;一種基于虛擬社交化的Web服務(wù)發(fā)現(xiàn)方法研究[J];電信科學(xué);2013年12期
3 顧益軍;解易;張培晶;;面向有組織犯罪分析的人際關(guān)系網(wǎng)絡(luò)節(jié)點重要性評價研究[J];中國人民公安大學(xué)學(xué)報(自然科學(xué)版);2013年04期
4 任劍鋒;梁雪;李淑紅;;基于非線性流形學(xué)習(xí)和支持向量機(jī)的文本分類算法[J];計算機(jī)科學(xué);2012年01期
5 楊藝;周元;;基于用戶查詢意圖識別的Web搜索優(yōu)化模型[J];計算機(jī)科學(xué);2012年01期
6 賈長云;梁海軍;;基于B-ISVM算法的物聯(lián)網(wǎng)云存儲數(shù)據(jù)偽裝不良信息檢測[J];計算機(jī)科學(xué);2013年02期
7 戴璐;丁立新;薛兵;;一種摘要中隱含的知識片段的挖掘方案[J];計算機(jī)科學(xué);2013年02期
8 范文禮;劉志剛;;一種基于效率矩陣的網(wǎng)絡(luò)節(jié)點重要度評價算法[J];計算物理;2013年05期
9 張s,
本文編號:625307
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/625307.html