面向排序?qū)W習(xí)的層次聚類特征選擇算法
發(fā)布時間:2021-03-09 11:51
大型搜索系統(tǒng)對用戶查詢的快速響應(yīng)尤為必要,同時在計算候選文檔的特征相關(guān)性時,必須遵守嚴(yán)格的后端延遲約束。通過特征選擇,提高了機器學(xué)習(xí)的效率。針對排序?qū)W習(xí)中快速特征選擇的起點多為單一排序效果最好的特征的特點,首先提出了一種用層次聚類法生成特征選擇起點的算法,并將該算法應(yīng)用于已有的2種快速特征選擇中。除此之外,還提出了一種充分利用聚類特征的新方法來處理特征選擇。在2個標(biāo)準(zhǔn)數(shù)據(jù)集上的實驗表明,該算法既可以在不影響精度的情況下獲得較小的特征子集,也可以在中等子集上獲得最佳的排序精度。
【文章來源】:計算機工程與科學(xué). 2019,41(12)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
HCIP-GSA在MQ2008上的NDCG@10的值
HCIP-NGSA在MQ2008上的NDCG@10的值
HC-GSA在MQ2008上的NDCG@10的值
【參考文獻(xiàn)】:
期刊論文
[1]基于冗余分析的特征選擇算法[J]. 仇利克,郭忠文,劉青,劉穎健,仇志金. 北京郵電大學(xué)學(xué)報. 2017(01)
[2]基于特征選擇的Bagging分類算法研究[J]. 姚明海,趙連朋,劉維學(xué). 計算機技術(shù)與發(fā)展. 2014(04)
[3]面向排序?qū)W習(xí)的特征分析的研究[J]. 花貴春,張敏,鄺達(dá),劉奕群,馬少平,茹立云. 計算機工程與應(yīng)用. 2011(17)
本文編號:3072802
【文章來源】:計算機工程與科學(xué). 2019,41(12)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
HCIP-GSA在MQ2008上的NDCG@10的值
HCIP-NGSA在MQ2008上的NDCG@10的值
HC-GSA在MQ2008上的NDCG@10的值
【參考文獻(xiàn)】:
期刊論文
[1]基于冗余分析的特征選擇算法[J]. 仇利克,郭忠文,劉青,劉穎健,仇志金. 北京郵電大學(xué)學(xué)報. 2017(01)
[2]基于特征選擇的Bagging分類算法研究[J]. 姚明海,趙連朋,劉維學(xué). 計算機技術(shù)與發(fā)展. 2014(04)
[3]面向排序?qū)W習(xí)的特征分析的研究[J]. 花貴春,張敏,鄺達(dá),劉奕群,馬少平,茹立云. 計算機工程與應(yīng)用. 2011(17)
本文編號:3072802
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3072802.html
最近更新
教材專著