天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種詞匯共現(xiàn)算法及共現(xiàn)詞對(duì)檢索系統(tǒng)排序的影響

發(fā)布時(shí)間:2019-07-22 17:39
【摘要】:為了探討共現(xiàn)詞對(duì)檢索系統(tǒng)排序相關(guān)性的影響,提出一種新的共現(xiàn)詞匯算法——FDC。算法中考慮了詞匯在文檔中的共現(xiàn)頻度、相對(duì)距離和共文檔率。從天網(wǎng)搜索引擎查詢?nèi)罩局羞x取部分查詢?cè)~,用本算法和潛在語(yǔ)義索引(LS I)方法分別求其共現(xiàn)詞匯,并以相同的評(píng)分策略改變?cè)寂判蚪Y(jié)果。D iscoun ted cum u lative ga in(DCG)評(píng)估結(jié)果表明,本算法獲得的共現(xiàn)詞在99%的置信度下對(duì)原始排序的相關(guān)性有改進(jìn);而LS I方法獲得的共現(xiàn)詞對(duì)排序相關(guān)性也表現(xiàn)出同樣顯著的改進(jìn)效果。結(jié)果顯示共現(xiàn)詞匯能改進(jìn)檢索系統(tǒng)結(jié)果排序的相關(guān)性,并且不依賴于特定算法。
[Abstract]:In order to study the influence of the co-occurrence word on the retrieval system's rank correlation, a new co-occurrence vocabulary algorithm _ FDC is proposed. The co-occurrence frequency, relative distance and co-document rate of the words in the document are considered in the algorithm. A partial query word is selected from the query log of the Skynet search engine, and the common-current vocabulary is obtained by using the algorithm and the potential semantic index (LS I) method, and the original ordering result is changed with the same scoring strategy. The results of D iscoun ted cum u-native ga (DCG) show that the correlation of the co-occurrence word obtained by the algorithm is improved with the confidence of 99%, and the co-occurrence word obtained by the LS I method also shows the same significant improvement effect. The results show that the co-occurrence vocabulary can improve the relevance of the retrieval system results ordering and does not rely on a particular algorithm.
【作者單位】: 北京大學(xué)信息科學(xué)技術(shù)學(xué)院 北京大學(xué)信息科學(xué)技術(shù)學(xué)院 北京大學(xué)信息科學(xué)技術(shù)學(xué)院 北京大學(xué)信息科學(xué)技術(shù)學(xué)院
【基金】:國(guó)家自然科學(xué)基金重點(diǎn)資助項(xiàng)目(60435020) 教育部博士點(diǎn)基金項(xiàng)目(20030001076)
【分類號(hào)】:TP391.3;

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 李曉明;對(duì)中國(guó)曾有過(guò)靜態(tài)網(wǎng)頁(yè)數(shù)的一種估計(jì)[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前3條

1 馮是聰,王繼民;關(guān)于“中文網(wǎng)頁(yè)自動(dòng)分類競(jìng)賽”結(jié)果的分析[J];中文信息學(xué)報(bào);2003年05期

2 朱家稷,閆宏飛;一種Web多維分析模型及應(yīng)用[J];情報(bào)學(xué)報(bào);2004年05期

3 劉曉莉,彭波;基于概率模型的名人網(wǎng)頁(yè)相關(guān)度評(píng)價(jià)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期

相關(guān)博士學(xué)位論文 前1條

1 吳麗輝;個(gè)性化的Web信息采集技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年

相關(guān)碩士學(xué)位論文 前2條

1 尹奇椺;基于語(yǔ)義Web的信息表達(dá)與語(yǔ)義化過(guò)程研究[D];浙江大學(xué);2003年

2 劉玉蓮;WEB信息搜集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的研究[D];哈爾濱工程大學(xué);2003年

【相似文獻(xiàn)】

相關(guān)期刊論文 前1條

1 陳,

本文編號(hào):2517777


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2517777.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2046f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com