面向不同對(duì)象的搜索引擎中的排序模型與性能評(píng)價(jià)
發(fā)布時(shí)間:2017-08-30 01:03
本文關(guān)鍵詞:面向不同對(duì)象的搜索引擎中的排序模型與性能評(píng)價(jià)
更多相關(guān)文章: 信息檢索 搜索引擎 對(duì)象級(jí)搜索 性能評(píng)價(jià)
【摘要】:目前,互聯(lián)網(wǎng)規(guī)模不斷擴(kuò)大,成為人們最重要的信息來(lái)源之一,但同時(shí)也出現(xiàn)了“信息過(guò)載”的問(wèn)題,網(wǎng)絡(luò)上的信息增長(zhǎng)速度過(guò)快,用戶獲取所需信息難度越來(lái)越大。因此,搜索引擎應(yīng)運(yùn)而生。隨著搜索引擎的發(fā)展,目前有兩個(gè)重要的研究方向:其一,傳統(tǒng)搜索引擎是基于網(wǎng)頁(yè)的,而網(wǎng)絡(luò)上的信息承載方式已經(jīng)不僅限于傳統(tǒng)網(wǎng)頁(yè),因此需要探索新的搜索引擎技術(shù);其二,搜索引擎層出不窮,質(zhì)量參差不齊,需要有一種合適的方式來(lái)評(píng)價(jià)搜索引擎的性能。本文主要貢獻(xiàn)有以下三點(diǎn):第一,提出了一種新的對(duì)象級(jí)別搜索引擎的排序模型。本模型適用于多種對(duì)象存在的場(chǎng)合,是基于對(duì)象之間的鏈接關(guān)系的,從而具有通用性。第二,提出了UIG的概念。UIG與傳統(tǒng)的DCG相比,衡量的信息更為準(zhǔn)確。第三,提出了一種用于搜索引擎性能評(píng)價(jià)的搜索引擎的理想點(diǎn)擊分布族。在實(shí)際應(yīng)用中,可以通過(guò)搜索引擎的實(shí)際點(diǎn)擊數(shù)據(jù)擬合其參數(shù);同時(shí),從實(shí)際點(diǎn)擊分布與理想點(diǎn)擊分布的差別上,可以反映出搜索引擎排序算法的缺陷與改進(jìn)方向。本文所提出的對(duì)象級(jí)搜索引擎排序模型,首先以對(duì)象鏈接圖為基礎(chǔ),計(jì)算單個(gè)對(duì)象對(duì)單個(gè)term的相關(guān)度,然后對(duì)多個(gè)term的相關(guān)度進(jìn)行合并。本模型在ACM Portal數(shù)據(jù)集上得到驗(yàn)證取得較好效果。本文所提出的搜索引擎點(diǎn)擊分布模型,是從壽命分布中的威布爾分布出發(fā),并結(jié)合搜索引擎的特點(diǎn)加以修改所得。本模型在AOL、搜狗、微軟搜索引擎數(shù)據(jù)集上得到驗(yàn)證取得較好效果。
【關(guān)鍵詞】:信息檢索 搜索引擎 對(duì)象級(jí)搜索 性能評(píng)價(jià)
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第1章 緒論8-20
- 1.1 引言8-9
- 1.2 研究背景9-16
- 1.2.1 信息檢索9-14
- 1.2.2 對(duì)象級(jí)別的搜索14-15
- 1.2.3 搜索引擎性能評(píng)價(jià)15-16
- 1.3 本文動(dòng)因16-17
- 1.4 本文研究?jī)?nèi)容與主要貢獻(xiàn)17-18
- 1.5 本文章節(jié)安排18-20
- 第2章 相關(guān)工作綜述20-28
- 2.1 引言20
- 2.2 傳統(tǒng)搜索引擎算法20-23
- 2.3 對(duì)象級(jí)搜索算法23-24
- 2.4 搜索引擎性能評(píng)價(jià)方法24-26
- 2.5 本章小結(jié)26-28
- 第3章 對(duì)象級(jí)搜索引擎的排序模型研究28-38
- 3.1 引言28-29
- 3.2 對(duì)象影響力計(jì)算29-31
- 3.3 單個(gè)查詢的相關(guān)度計(jì)算31-33
- 3.4 多個(gè)查詢的相關(guān)度合并33-34
- 3.5 實(shí)驗(yàn)數(shù)據(jù)與結(jié)果34-36
- 3.5.1 單個(gè)查詢的性能對(duì)比34-35
- 3.5.2 多個(gè)查詢的合并性能對(duì)比35-36
- 3.6 本章小結(jié)36-38
- 第4章 搜索引擎性能評(píng)價(jià)38-54
- 4.1 引言38
- 4.2 搜索引擎性能評(píng)價(jià)標(biāo)準(zhǔn)38-40
- 4.3 搜索引擎中用戶點(diǎn)擊分布的理想模型40-46
- 4.3.1 搜索結(jié)果頁(yè)內(nèi)總點(diǎn)擊率的分布模型41-43
- 4.3.2 搜索結(jié)果頁(yè)內(nèi)每個(gè)文檔的點(diǎn)擊分布模型43-44
- 4.3.3 模型中的參數(shù)估計(jì)44-46
- 4.4 實(shí)驗(yàn)結(jié)果46-52
- 4.4.1 搜索結(jié)果頁(yè)內(nèi)總點(diǎn)擊率擬合47-49
- 4.4.2 搜索結(jié)果頁(yè)中總點(diǎn)擊率擬合49-52
- 4.5 本章小結(jié)52-54
- 第5章 總結(jié)與展望54-56
- 參考文獻(xiàn)56-60
- 致謝60-62
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果62
本文編號(hào):756391
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/756391.html
最近更新
教材專著