基于學(xué)習(xí)排序添加輔助信息的標(biāo)簽排序方法研究
發(fā)布時間:2021-07-21 23:17
學(xué)習(xí)排序是利用機器學(xué)習(xí)技術(shù)來對搜索結(jié)果進行排序的技術(shù),在包括信息檢索與數(shù)據(jù)挖掘等技術(shù)在內(nèi)的眾多應(yīng)用領(lǐng)域中具有重大作用,因此近年來備受關(guān)注。學(xué)習(xí)排序假設(shè)每個培訓(xùn)實例都與一個可靠的標(biāo)簽相關(guān)聯(lián),并提供了一種優(yōu)秀的自動化框架進行特征組合,這些組合可以查詢依賴特征,如通過現(xiàn)存搜索引擎給文檔賦予分?jǐn)?shù),也可以查詢獨立特征。本文調(diào)查了兩種基本類型的輔助信息,并以此引入相應(yīng)的學(xué)習(xí)算法中。研究使用的概率排序模型首先結(jié)合廣義線性模型和Plackett-Luce(P-L)模型,用于處理基于實例的解決多分類標(biāo)簽的排序問題。目標(biāo)是訓(xùn)練學(xué)習(xí)一種排序功能,排序功能通過訓(xùn)練并使用最大似然估計方法來估計標(biāo)簽排序,并迭代地訓(xùn)練排序功能,該功能可以在整套標(biāo)簽上產(chǎn)生完整的排序,并且在標(biāo)簽不完整的情況下依舊能提供有效的標(biāo)簽排序功能。隨后排序功能通過兩種輔助信息改進的ListMLE算法的新算法進行優(yōu)化,該方法可以通過真實值標(biāo)簽和注釋者專業(yè)知識程度來迭代地訓(xùn)練排序功能。此外,學(xué)習(xí)排序可以從眾包標(biāo)簽中探索排序,改進后的算法在合成的以及實際的數(shù)據(jù)上都經(jīng)過了測試,結(jié)果顯示新的方法明顯優(yōu)于平均方法和現(xiàn)有眾包回歸方法。而對于擁有數(shù)據(jù)龐大的標(biāo)簽...
【文章來源】:昆明理工大學(xué)云南省
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
排名表現(xiàn)曲線圖
NDCG@3指標(biāo)分析曲線圖
NDCG@5指標(biāo)分析曲線圖
本文編號:3295960
【文章來源】:昆明理工大學(xué)云南省
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
排名表現(xiàn)曲線圖
NDCG@3指標(biāo)分析曲線圖
NDCG@5指標(biāo)分析曲線圖
本文編號:3295960
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3295960.html
最近更新
教材專著