基于半監(jiān)督Tri-training的遷移學(xué)習(xí)算法研究
發(fā)布時間:2021-12-29 12:59
隨著互聯(lián)網(wǎng)、信息技術(shù)及存儲技術(shù)的快速發(fā)展,數(shù)據(jù)量呈指數(shù)增長,獲取大量有標(biāo)記數(shù)據(jù)樣本十分困難,而獲取大量未標(biāo)記數(shù)據(jù)樣本相對容易。半監(jiān)督學(xué)習(xí)和遷移學(xué)習(xí)都能夠利用少量已標(biāo)記數(shù)據(jù)和大量未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),不需要大量的人力物力去獲取有標(biāo)簽的數(shù)據(jù),節(jié)省了時間和成本。然而,半監(jiān)督學(xué)習(xí)在使用未標(biāo)記數(shù)據(jù)時可能導(dǎo)致學(xué)習(xí)性能下降,而遷移學(xué)習(xí)領(lǐng)域自適應(yīng)方法在維度約簡過程中忽略了標(biāo)簽的依賴關(guān)系,也可能導(dǎo)致分類準(zhǔn)確率降低。本文針對這些問題進(jìn)行了改進(jìn),主要工作如下:(1)為了減小Tri-training算法在學(xué)習(xí)過程中產(chǎn)生的標(biāo)記噪聲對學(xué)習(xí)性能的影響,本文分別提出了一種基于交叉熵的Tri-training算法、一種安全的Tri-training學(xué)習(xí)算法、一個基于交叉熵的安全Tri-training學(xué)習(xí)框架。在提出的方法中,用交叉熵代替錯誤率來更好的反映模型預(yù)估結(jié)果和真實(shí)分布之間的差距,并結(jié)合凸優(yōu)化方法降低了標(biāo)記噪聲,提高了偽標(biāo)簽的質(zhì)量和模型的泛化性能。在UCI基準(zhǔn)數(shù)據(jù)集驗(yàn)證了所提方法的有效性,并利用顯著性檢驗(yàn)從統(tǒng)計學(xué)的角度進(jìn)一步驗(yàn)證了方法的性能。實(shí)驗(yàn)結(jié)果表明,所提出的半監(jiān)督學(xué)習(xí)方法在分類性能方面優(yōu)于傳統(tǒng)的Tri-...
【文章來源】:遼寧師范大學(xué)遼寧省
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同數(shù)據(jù)分布的目標(biāo)域數(shù)據(jù)
Caltech-256+Office-31數(shù)據(jù)集Fig.4.1Caltech-256+Office-31datasets
USPS+MNIST數(shù)據(jù)集Fig.4.2USPS+MNISTdatasets
【參考文獻(xiàn)】:
期刊論文
[1]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報. 2015(01)
[2]基于分歧的半監(jiān)督學(xué)習(xí)[J]. 周志華. 自動化學(xué)報. 2013(11)
本文編號:3556174
【文章來源】:遼寧師范大學(xué)遼寧省
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同數(shù)據(jù)分布的目標(biāo)域數(shù)據(jù)
Caltech-256+Office-31數(shù)據(jù)集Fig.4.1Caltech-256+Office-31datasets
USPS+MNIST數(shù)據(jù)集Fig.4.2USPS+MNISTdatasets
【參考文獻(xiàn)】:
期刊論文
[1]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報. 2015(01)
[2]基于分歧的半監(jiān)督學(xué)習(xí)[J]. 周志華. 自動化學(xué)報. 2013(11)
本文編號:3556174
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3556174.html
最近更新
教材專著