基于主題模型的資源選擇算法
本文選題:分布式檢索 + 資源選擇; 參考:《華南理工大學學報(自然科學版)》2017年03期
【摘要】:在具有多個真實搜索引擎的聯(lián)邦檢索環(huán)境下,基于小文檔的資源選擇算法由于難以估計每個搜索引擎的真實網(wǎng)頁數(shù)量,因此準確率較低.針對這個問題,文中提出了基于主題模型的資源庫描述方法,利用LDA主體模型獲取每個資源庫的描述詞;在此基礎(chǔ)上提出新的資源選擇算法,結(jié)合垂直領(lǐng)域權(quán)重和詞向量計算資源庫和查詢請求之間的相關(guān)度,并根據(jù)相關(guān)度大小獲取最終資源選擇結(jié)果.實驗結(jié)果表明,基于主題模型的資源選擇算法能很好地提高資源選擇效果,可有效應用于分布式搜索引擎的聯(lián)邦檢索環(huán)境.
[Abstract]:In the federated retrieval environment with multiple real search engines, the algorithm of resource selection based on small documents is difficult to estimate the number of real web pages of each search engine, so the accuracy is low. In order to solve this problem, a method of describing resource base based on topic model is proposed in this paper. The description words of each resource base are obtained by using LDA agent model, and then a new resource selection algorithm is proposed. Combining the vertical domain weight and word vector to calculate the correlation between the resource base and the query request, the final resource selection results are obtained according to the correlation degree. The experimental results show that the resource selection algorithm based on topic model can improve the efficiency of resource selection and can be effectively applied to the federated retrieval environment of distributed search engines.
【作者單位】: 華南理工大學計算機科學與工程學院∥廣東省計算機網(wǎng)絡(luò)重點實驗室;
【基金】:廣東省自然科學基金重大基礎(chǔ)研究培育項目(2015A030308017) 教育部中國移動科研基金資助項目(MCM20150512)~~
【分類號】:TP301.6;TP391.3
【相似文獻】
相關(guān)期刊論文 前10條
1 仲盛;多元選擇算法的改進[J];微機發(fā)展;1996年06期
2 張衡,吳禮發(fā),張毓森,曾慶凱;一種r可變陰性選擇算法及其仿真分析[J];計算機學報;2005年10期
3 尹貴祥;劉新茂;;隨機選擇算法的研究[J];現(xiàn)代電子技術(shù);2011年08期
4 羅一丹;蔡自興;王勇;江中央;;基于免疫重構(gòu)的陰性選擇算法[J];計算機科學;2008年03期
5 董小剛;趙俊;;一種選擇冒泡算法——冒泡算法與選擇算法的結(jié)合[J];科教文匯(下半月);2006年02期
6 武繼剛;一個多元選擇算法[J];微機發(fā)展;1995年03期
7 楊寧;王茜;;一種基于小生境策略的陰性選擇算法[J];計算機科學;2011年S1期
8 戴常英;尹建武;;實數(shù)向量型陰性選擇算法的改進[J];微計算機應用;2008年02期
9 孟慶華;趙文禮;樊志華;曾復;;基于改進型陰性選擇算法的車輛故障檢測方法研究[J];兵工學報;2009年12期
10 汪慧敏;高曉智;黃顯林;宋卓越;;基于改進負選擇算法的異常檢測[J];計算機仿真;2008年05期
相關(guān)會議論文 前1條
1 王廣濤;宋擒豹;車蕊;;一種新的基于信息熵的屬性選擇算法[A];第26屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2009年
相關(guān)博士學位論文 前1條
1 王廣濤;屬性子集選擇算法及其推薦方法研究[D];西安交通大學;2017年
相關(guān)碩士學位論文 前5條
1 楊賓;車聯(lián)網(wǎng)中繼選擇算法研究[D];重慶郵電大學;2014年
2 郭衍奎;基于互信息的屬性選擇算法研究[D];北京交通大學;2015年
3 阮強;基于SVM-RFE的潛在生物標志物選擇算法研究[D];大連理工大學;2011年
4 韓光輝;基于歐式距離的實例選擇算法研究[D];河北大學;2011年
5 楊艷艷;基于CP-nets的多議題對稱依賴關(guān)系的研究[D];鄭州大學;2013年
,本文編號:1887296
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1887296.html