基于Wikidata和標(biāo)簽云的搜索算法研究
發(fā)布時(shí)間:2017-08-20 02:18
本文關(guān)鍵詞:基于Wikidata和標(biāo)簽云的搜索算法研究
更多相關(guān)文章: 知識(shí)庫(kù) Wikidata 網(wǎng)頁(yè)檢索 頁(yè)面排序 標(biāo)簽云 搜索引擎
【摘要】:知識(shí)庫(kù)是一種結(jié)構(gòu)化、易于操作、有組織的知識(shí)集群。針對(duì)Wikidata這一開(kāi)放知識(shí)庫(kù)的內(nèi)容及結(jié)構(gòu),提出一種構(gòu)建標(biāo)簽云的方法,對(duì)信息進(jìn)行標(biāo)簽化處理,并將轉(zhuǎn)換得到的標(biāo)簽向量應(yīng)用于信息檢索和頁(yè)面排序。首先,提取Wikidata中的結(jié)構(gòu)化數(shù)據(jù),構(gòu)建以實(shí)體為單位的標(biāo)簽云;然后,將需要檢索的文檔和用戶的檢索語(yǔ)句映射為相應(yīng)的標(biāo)簽,并采用處理向量的相關(guān)方法實(shí)現(xiàn)網(wǎng)頁(yè)的排序算法;最后,采用信息檢索常用的標(biāo)準(zhǔn)對(duì)該算法進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的基于關(guān)鍵詞的搜索方法相比,新算法在一定程度上能夠提高頁(yè)面排序的準(zhǔn)確率。
【作者單位】: 吉林大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 知識(shí)庫(kù) Wikidata 網(wǎng)頁(yè)檢索 頁(yè)面排序 標(biāo)簽云 搜索引擎
【分類(lèi)號(hào)】:TP391.3
【正文快照】: 0引言信息呈現(xiàn)幾何式爆炸增長(zhǎng),面對(duì)如此龐大的信息數(shù)量,搜索引擎成為互聯(lián)網(wǎng)的絕佳入口。目前主流的搜索引擎算法仍以關(guān)鍵詞的匹配程度檢索,但是相同的詞語(yǔ)在不同的語(yǔ)境中有著不同的意義,而不同的人對(duì)同樣的詞語(yǔ)也會(huì)有不同的理解,因此簡(jiǎn)單地基于關(guān)鍵詞的搜索引擎既不能識(shí)別出關(guān),
本文編號(hào):704147
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/704147.html
最近更新
教材專(zhuān)著