在線(xiàn)序列主動(dòng)學(xué)習(xí)方法
發(fā)布時(shí)間:2018-01-05 17:22
本文關(guān)鍵詞:在線(xiàn)序列主動(dòng)學(xué)習(xí)方法 出處:《計(jì)算機(jī)科學(xué)》2017年01期 論文類(lèi)型:期刊論文
更多相關(guān)文章: 主動(dòng)學(xué)習(xí) 極限學(xué)習(xí)機(jī) 在線(xiàn)序列學(xué)習(xí) 樣例熵 K-近鄰
【摘要】:現(xiàn)實(shí)世界中存在著大量無(wú)類(lèi)標(biāo)的數(shù)據(jù),如各種醫(yī)療圖像數(shù)據(jù)、網(wǎng)頁(yè)數(shù)據(jù)等。在大數(shù)據(jù)時(shí)代,這種情況更加突出。標(biāo)注這些無(wú)類(lèi)標(biāo)的數(shù)據(jù)需要付出巨大的代價(jià)。主動(dòng)學(xué)習(xí)是解決這一問(wèn)題的有效手段,也是近幾年機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域中的一個(gè)研究熱點(diǎn)。提出了一種基于在線(xiàn)序列極限學(xué)習(xí)機(jī)的主動(dòng)學(xué)習(xí)算法,該算法利用在線(xiàn)序列極限學(xué)習(xí)機(jī)增量學(xué)習(xí)的特點(diǎn),可顯著提高學(xué)習(xí)系統(tǒng)的效率。另外,該算法用樣例熵作為啟發(fā)式度量無(wú)類(lèi)標(biāo)樣例的重要性,用K-近鄰分類(lèi)器作為Oracle標(biāo)注選出的無(wú)類(lèi)標(biāo)樣例的類(lèi)別。實(shí)驗(yàn)結(jié)果顯示,提出的算法具有學(xué)習(xí)速度快、標(biāo)注準(zhǔn)確的特點(diǎn)。
[Abstract]:In the real world, there are a large number of unclassified data, such as various medical image data, web data, etc. In the big data era. This situation is more prominent. Tagging these unmarked data has to pay a huge price. Active learning is an effective means to solve this problem. It is also a hot topic in the field of machine learning and data mining in recent years. An active learning algorithm based on online sequence limit learning machine is proposed. The algorithm can significantly improve the efficiency of learning system by using the characteristics of incremental learning of online sequence limit learning machine. In addition, the algorithm uses sample entropy as a heuristic to measure the importance of non-class sample. The K-nearest neighbor classifier is used as the classification of the non-class sample selected by Oracle. The experimental results show that the proposed algorithm has the advantages of fast learning speed and accurate labeling.
【作者單位】: 河北大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院河北省機(jī)器學(xué)習(xí)與計(jì)算智能重點(diǎn)實(shí)驗(yàn)室;河北大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;中國(guó)氣象局氣象干部培訓(xùn)學(xué)院河北分院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(71371063) 河北省自然科學(xué)基金項(xiàng)目(F2013201220) 河北省高等學(xué)?茖W(xué)技術(shù)研究重點(diǎn)項(xiàng)目(ZD20131028) 河北省高等學(xué)校科學(xué)技術(shù)研究項(xiàng)目(QN20131153)資助
【分類(lèi)號(hào)】:TP181
【正文快照】: 1引言 主動(dòng)學(xué)習(xí)是一種有監(jiān)督學(xué)習(xí)。與傳統(tǒng)的被動(dòng)學(xué)習(xí)不同,在主動(dòng)學(xué)習(xí)中,學(xué)習(xí)器不是被動(dòng)地接受、處理人類(lèi)提供的所有數(shù)據(jù),而是主動(dòng)地選取它所認(rèn)為最有價(jià)值的數(shù)據(jù),并交由領(lǐng)域?qū)<疫M(jìn)行標(biāo)注。主動(dòng)學(xué)習(xí)的目標(biāo)是在可接受精度的前提下,選取盡可能少的樣例以減小標(biāo)注和學(xué)習(xí)的代價(jià)。 ,
本文編號(hào):1384098
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1384098.html
最近更新
教材專(zhuān)著