混雜數(shù)據(jù)的多核幾何平均度量學(xué)習(xí)
發(fā)布時間:2018-05-11 21:18
本文選題:幾何平均 + 多核學(xué)習(xí) ; 參考:《軟件學(xué)報》2017年11期
【摘要】:在機器學(xué)習(xí)和模式識別任務(wù)中,選擇一種合適的距離度量方法是至關(guān)重要的.度量學(xué)習(xí)主要利用判別性信息學(xué)習(xí)一個馬氏距離或相似性度量.然而,大多數(shù)現(xiàn)有的度量學(xué)習(xí)方法都是針對數(shù)值型數(shù)據(jù)的,對于一些有結(jié)構(gòu)的數(shù)據(jù)(比如符號型數(shù)據(jù)),用傳統(tǒng)的距離度量來度量兩個對象之間的相似性是不合理的;其次,大多數(shù)度量學(xué)習(xí)方法會受到維度的困擾,高維度使得訓(xùn)練時間長,模型的可擴展性差.提出了一種基于幾何平均的混雜數(shù)據(jù)度量學(xué)習(xí)方法.采用不同的核函數(shù)將數(shù)值型數(shù)據(jù)和符號型數(shù)據(jù)分別映射到可再生核希爾伯特空間,從而避免了特征的高維度帶來的負面影響.同時,提出了一個基于幾何平均的多核度量學(xué)習(xí)模型,將混雜數(shù)據(jù)的度量學(xué)習(xí)問題轉(zhuǎn)化為求黎曼流形上兩個點的中心點問題.在UCI數(shù)據(jù)集上的實驗結(jié)果表明,針對混雜數(shù)據(jù)的多核度量學(xué)習(xí)方法與現(xiàn)有的度量學(xué)習(xí)方法相比,在準(zhǔn)確性方面展現(xiàn)出更優(yōu)異的性能.
[Abstract]:In the task of machine learning and pattern recognition, it is very important to choose a suitable distance measurement method. Metric learning mainly uses discriminant information to learn a Markov distance or similarity measure. However, most of the existing metric learning methods are for numerical data. For some structured data, such as symbolic data, it is unreasonable to measure the similarity between two objects by traditional distance measurement. Most metric learning methods are troubled by the dimension, the high dimension makes the training time long, and the scalability of the model is poor. A hybrid data metric learning method based on geometric averaging is proposed. Different kernel functions are used to map numerical data and symbolic data to Hilbert space of reproducing kernel respectively, thus avoiding the negative effects of the high dimension of features. At the same time, a multi-kernel metric learning model based on geometric averaging is proposed, which transforms the metric learning problem of hybrid data into the center point problem of two points on Riemannian manifold. The experimental results on the UCI dataset show that the multi-core metric learning method for hybrid data shows better performance in accuracy than the existing metric learning methods.
【作者單位】: 天津大學(xué)計算機科學(xué)與技術(shù)學(xué)院;
【分類號】:TP181
【相似文獻】
相關(guān)會議論文 前3條
1 田建艷;武增懿;韓肖清;;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法的改進[A];2009年中國智能自動化會議論文集(第七分冊)[南京理工大學(xué)學(xué)報(增刊)][C];2009年
2 周斌;;內(nèi)燃機排放神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)樣本的確定[A];加入WTO和中國科技與可持續(xù)發(fā)展——挑戰(zhàn)與機遇、責(zé)任和對策(上冊)[C];2002年
3 文博武;胡壽松;;基于再勵學(xué)習(xí)的殲擊機安全著陸橫側(cè)向協(xié)調(diào)控制[A];2005全國自動化新技術(shù)學(xué)術(shù)交流會論文集(二)[C];2005年
相關(guān)碩士學(xué)位論文 前2條
1 趙杉杉;深度學(xué)習(xí)驅(qū)動的場景分析和語義目標(biāo)解析[D];浙江大學(xué);2017年
2 惠寅華;基于同倫的學(xué)習(xí)算法研究[D];蘇州大學(xué);2013年
,本文編號:1875658
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1875658.html
最近更新
教材專著