搜索引擎的相關(guān)性排序算法研究.pdf 全文
本文關(guān)鍵詞:搜索引擎的相關(guān)性排序算法研究,由筆耕文化傳播整理發(fā)布。
中國(guó)科學(xué)技術(shù)大學(xué)
碩士學(xué)位論文
搜索引擎的相關(guān)性排序算法研究
姓名:王黎
申請(qǐng)學(xué)位級(jí)別:碩士
專(zhuān)業(yè):模式識(shí)別與智能系統(tǒng)
指導(dǎo)教師:帥建梅
20100427
摘 要
摘 要
隨著計(jì)算機(jī)系統(tǒng)性能的提高和網(wǎng)絡(luò)技術(shù)的不斷進(jìn)步,萬(wàn)維網(wǎng)成為全球最大的信
息資源庫(kù),如何為如此龐大的信息資源提供高效的導(dǎo)航服務(wù),幫助用戶(hù)在海量的數(shù)
據(jù)中快速找到需要的信息是搜索引擎亟待解決的問(wèn)題。通常用戶(hù)只關(guān)心搜索引擎返
回的排在前面的結(jié)果,然而當(dāng)前搜索引擎返回的查詢(xún)結(jié)果與用戶(hù)需求的相關(guān)程度并
不理想。于是搜索引擎的相關(guān)性排序--按照與用戶(hù)查詢(xún)的相關(guān)程度對(duì)搜索引擎的索
引文檔進(jìn)行排序,成為當(dāng)前研究的重點(diǎn)和熱點(diǎn)。
本文首先研究了文本搜索引擎的相關(guān)性排序模型,并為自學(xué)習(xí)排序模型提出一
種構(gòu)造訓(xùn)練集的方法。然后研究了圖像搜索引擎的相關(guān)性排序問(wèn)題,重點(diǎn)介紹了圖
像重排序的方法,并提出一種度量圖像相似性的方法。本文對(duì)搜索引擎的相關(guān)性排
序方法進(jìn)行了深入的研究,主要工作和創(chuàng)新之處歸納為以下幾點(diǎn):
(1) 文本搜索引擎的相關(guān)性排序模型,包括布爾模型,向量空間模型,概率模
型,超鏈接模型,自學(xué)習(xí)排序模型,其中自學(xué)習(xí)排序模型將機(jī)器學(xué)習(xí)的方法
運(yùn)用到搜索引擎的相關(guān)性排序問(wèn)題,解決了以往模型的許多不足之處。
(2) 為自學(xué)習(xí)排序模型構(gòu)造訓(xùn)練集。自學(xué)習(xí)排序是一種有監(jiān)督的機(jī)器學(xué)習(xí)算法,,
模型的性能很大程度上依賴(lài)訓(xùn)練集。構(gòu)造訓(xùn)練集
本文關(guān)鍵詞:搜索引擎的相關(guān)性排序算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):99835
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/99835.html