針對機(jī)器學(xué)習(xí)中殘缺數(shù)據(jù)的近似補(bǔ)全方法
本文關(guān)鍵詞: 機(jī)器學(xué)習(xí) 殘缺項(xiàng) 二次規(guī)劃 補(bǔ)全方法 出處:《西安交通大學(xué)學(xué)報》2017年10期 論文類型:期刊論文
【摘要】:針對機(jī)器學(xué)習(xí)中含殘缺項(xiàng)的數(shù)據(jù)不能被有效利用,導(dǎo)致分類和回歸準(zhǔn)確率不高的問題,提出了一種近似補(bǔ)全方法——k-ANNO方法。給定殘缺的數(shù)據(jù)樣本,該方法首先通過離線構(gòu)建的圖結(jié)構(gòu)來近似搜索與該樣本最接近的k個近鄰頂點(diǎn),然后采用快速二次規(guī)劃估計各近鄰的最優(yōu)權(quán)重,最后基于權(quán)重值來補(bǔ)全樣本中的殘缺項(xiàng),用戶可以根據(jù)實(shí)際需求在補(bǔ)全效率與準(zhǔn)確性之間折中。k-ANNO方法較好地解決了機(jī)器學(xué)習(xí)中普遍存在的數(shù)據(jù)殘缺問題,有效抑制了數(shù)據(jù)殘缺對分類和回歸精度的干擾。利用多份公開數(shù)據(jù)集評估了k-ANNO方法的補(bǔ)全效果,結(jié)果表明:當(dāng)加速比在2~10之間時,k-ANNO方法的分類錯誤率比已有的均值補(bǔ)全、C均值補(bǔ)全、自組織映射補(bǔ)全方法低1%~4%,回歸均方根誤差比已有方法低約0.5~2.0;當(dāng)樣本規(guī)模為4 000時,在不同加速比參數(shù)下,k-ANNO方法的計算效率比樸素k近鄰方法高約35%~320%。
[Abstract]:In order to solve the problem that the data with incomplete items can not be used effectively in machine learning, which leads to the low accuracy of classification and regression, an approximate complement method, k-ANNO method, is proposed, and the incomplete data samples are given. In this method, the nearest nearest vertices to the sample are approximately searched by the graph structure constructed offline, and then the optimal weights of each nearest neighbor are estimated by the fast quadratic programming. Finally, the incomplete items in the whole sample are compensated based on the weight value. According to the actual requirements, users can make a compromise between complete efficiency and accuracy. The method can solve the problem of data incomplete in machine learning. The interference of incomplete data on classification and regression accuracy is effectively suppressed. The complement effect of k-ANNO method is evaluated by using a number of open datasets. The results show that the acceleration ratio is between 2 ~ 10. The classification error rate of k-ANNO method is 1 / 4 lower than that of the existing method, and the root mean square error of regression is about 0.52.0 lower than that of the existing method. When the sample size is 4 000, the computational efficiency of the KANNO method is about 35% higher than that of the simple k nearest neighbor method under different speedup parameters.
【作者單位】: 盲信號處理重點(diǎn)實(shí)驗(yàn)室;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(U1536105)
【分類號】:TP181
【正文快照】: 機(jī)器學(xué)習(xí)是一種挖掘數(shù)據(jù)中潛在規(guī)律的有效方法,能夠?qū)ρ芯繉ο蟮奈粗悇e或數(shù)值進(jìn)行預(yù)測,因而被廣泛應(yīng)用在計算機(jī)視覺、智能家居[1]、問卷分析[2]、基因組分析[3]等領(lǐng)域。當(dāng)機(jī)器學(xué)習(xí)方法的輸入數(shù)據(jù)包含殘缺項(xiàng)時,許多機(jī)器學(xué)習(xí)方法的預(yù)測精度會急劇下降,導(dǎo)致漏檢、虛警甚至模型
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 夏潤海,王開顏;機(jī)器學(xué)習(xí)與智能決策支持系統(tǒng)[J];濰坊學(xué)院學(xué)報;2003年02期
2 張明玉,倪志偉;基于機(jī)器學(xué)習(xí)的智能決策支持系統(tǒng)[J];淮南師范學(xué)院學(xué)報;2005年03期
3 楊凌霄;武建平;;機(jī)器學(xué)習(xí)方法在人臉檢測中的應(yīng)用[J];計算機(jī)與數(shù)字工程;2008年03期
4 ;第十一屆中國機(jī)器學(xué)習(xí)會議[J];智能系統(tǒng)學(xué)報;2008年02期
5 ;第14屆中國機(jī)器學(xué)習(xí)會議[J];智能系統(tǒng)學(xué)報;2012年06期
6 費(fèi)宗銘;呂建;王志堅;陳道蓄;徐家福;;機(jī)器學(xué)習(xí)[J];計算機(jī)科學(xué);1991年01期
7 趙沁平;魏華;王軍玲;;機(jī)器學(xué)習(xí)技術(shù)與機(jī)器學(xué)習(xí)系統(tǒng)[J];計算機(jī)科學(xué);1993年05期
8 姚敏;機(jī)器學(xué)習(xí)及其發(fā)展方向[J];計算機(jī)時代;1994年04期
9 ;第31屆機(jī)器學(xué)習(xí)國際會議(英文)[J];智能系統(tǒng)學(xué)報;2014年01期
10 黃海濱;機(jī)器學(xué)習(xí)及其主要策略[J];河池師范高等?茖W(xué)校學(xué)報(自然科學(xué)版);2000年04期
相關(guān)會議論文 前10條
1 王玨;;歸納機(jī)器學(xué)習(xí)[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
2 吳滄浦;;智能系統(tǒng)與機(jī)器學(xué)習(xí)的新領(lǐng)域[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學(xué)術(shù)年會文集[C];2000年
3 周晴杰;徐立鴻;吳啟迪;;機(jī)器學(xué)習(xí)串級結(jié)構(gòu)的初步探討[A];1998年中國控制會議論文集[C];1998年
4 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機(jī)器學(xué)習(xí)法相結(jié)合的蛋白質(zhì)名識別[A];大連理工大學(xué)生物醫(yī)學(xué)工程學(xué)術(shù)論文集(第2卷)[C];2005年
5 蔡健平;林世平;;基于機(jī)器學(xué)習(xí)的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
6 黃金鐵;李景銀;周建常;;對高爐爐況評價模型參數(shù)的機(jī)器學(xué)習(xí)——一個三類線性模式分類器的實(shí)現(xiàn)[A];1995中國控制與決策學(xué)術(shù)年會論文集[C];1995年
7 程國建;蔡磊;潘華賢;;核向量機(jī)在大規(guī)模機(jī)器學(xué)習(xí)中的應(yīng)用[A];第十一屆中國青年信息與管理學(xué)者大會論文集[C];2009年
8 張鈸;張鈴;;統(tǒng)計學(xué)習(xí)理論及其應(yīng)用[A];2001年中國智能自動化會議論文集(上冊)[C];2001年
9 周川;林學(xué),
本文編號:1484967
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1484967.html