遷移學(xué)習(xí)分類技術(shù)及應(yīng)用研究
發(fā)布時(shí)間:2021-07-21 23:46
計(jì)算機(jī)科學(xué)和互聯(lián)網(wǎng)的發(fā)展,使得數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)技術(shù)得到空前關(guān)注。多數(shù)機(jī)器學(xué)習(xí)算法依賴于有標(biāo)記數(shù)據(jù),而人工標(biāo)注成本較高,許多應(yīng)用中缺少有標(biāo)記數(shù)據(jù),遷移學(xué)習(xí)技術(shù)應(yīng)運(yùn)而生。本文主要研究了遷移學(xué)習(xí)中的零樣本學(xué)習(xí)方法,遷移學(xué)習(xí)技術(shù)在未知雷達(dá)輻射源識(shí)別中的應(yīng)用以及強(qiáng)化學(xué)習(xí)在雷達(dá)干擾決策中的應(yīng)用。首先,本文研究了基于線性兼容性函數(shù)的零樣本學(xué)習(xí)算法。通過(guò)使用考慮了類別差異的損失函數(shù),并且加入直推式的局部學(xué)習(xí)算法進(jìn)一步修正模型,F(xiàn)有的基于線性兼容性函數(shù)的零樣本學(xué)習(xí)算法的損失函數(shù)對(duì)錯(cuò)分給不同類別以相同的損失,忽略了不同類別之間存在的差異。因此,使用差異化的損失函數(shù)可以使源域模型能夠更好地適應(yīng)目標(biāo)域的分類任務(wù)。然后引入直推式的局部學(xué)習(xí)方法,利用目標(biāo)域樣本潛在的分布信息與結(jié)構(gòu)特點(diǎn),減少投影域漂移問(wèn)題帶來(lái)的影響,從而提高分類效果。實(shí)驗(yàn)表明,改進(jìn)后的算法分類性能有一定的提升,局部學(xué)習(xí)方法可以顯著提高分類準(zhǔn)確率。其次,研究了基于遷移成分分析的未知雷達(dá)輻射源識(shí)別方法。本文首先對(duì)未知雷達(dá)輻射源識(shí)別問(wèn)題進(jìn)行了分析,通過(guò)專家知識(shí)將已知雷達(dá)輻射源和未知雷達(dá)輻射源聯(lián)系起來(lái),用基于高斯混合模型的新類別檢測(cè)方法將測(cè)試樣本中的已知...
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
動(dòng)物屬性數(shù)據(jù)集圖像示例
如圖 2.1 是一個(gè)域適應(yīng)的示意圖。源域空間 共享空間目標(biāo)域空間圖2.1 域適應(yīng)示意圖2.4 強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)是的概念最早由 Minsky 于 1954 提出,逐漸成為機(jī)器學(xué)習(xí)中的熱點(diǎn)研究方向,并廣泛應(yīng)用于各種智能控制、決策分析等現(xiàn)實(shí)應(yīng)用中。強(qiáng)化學(xué)習(xí)能夠讓機(jī)器通過(guò)獎(jiǎng)勵(lì)和懲罰自主地學(xué)會(huì)完成任務(wù)。強(qiáng)化學(xué)習(xí)所面對(duì)的問(wèn)題是一個(gè)機(jī)器如何在一個(gè)動(dòng)態(tài)的環(huán)境中用試錯(cuò)的方式學(xué)習(xí)行為,處理這類問(wèn)題的方法主要有兩種。一種是在動(dòng)作空間中搜索能夠在環(huán)境中獲得最好表現(xiàn)的動(dòng)作,這種方法通常使用遺傳算法等智能搜索算法來(lái)求解。另一種方法用統(tǒng)計(jì)方法和動(dòng)態(tài)規(guī)劃方法來(lái)估計(jì)采取動(dòng)作帶來(lái)的效用。第二種方法是研究的主流,因?yàn)樗昧藦?qiáng)化學(xué)習(xí)問(wèn)題的特殊結(jié)構(gòu)[48]。強(qiáng)化學(xué)習(xí)的任務(wù)通?梢杂民R爾科夫決策過(guò)程(Markov Decision Process,MDP)來(lái)表示。馬爾科夫決策過(guò)程可以用一個(gè)四元組 S , A, P, R 來(lái)描述。其中
圖3.3 aPY 數(shù)據(jù)集圖像示例[51]中,包含了來(lái)自PASCALVOC2008數(shù)據(jù)集的20oo 數(shù)據(jù)集的 12 個(gè)類別的 2644 幅圖像,每幅圖像有
本文編號(hào):3296004
【文章來(lái)源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
動(dòng)物屬性數(shù)據(jù)集圖像示例
如圖 2.1 是一個(gè)域適應(yīng)的示意圖。源域空間 共享空間目標(biāo)域空間圖2.1 域適應(yīng)示意圖2.4 強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)是的概念最早由 Minsky 于 1954 提出,逐漸成為機(jī)器學(xué)習(xí)中的熱點(diǎn)研究方向,并廣泛應(yīng)用于各種智能控制、決策分析等現(xiàn)實(shí)應(yīng)用中。強(qiáng)化學(xué)習(xí)能夠讓機(jī)器通過(guò)獎(jiǎng)勵(lì)和懲罰自主地學(xué)會(huì)完成任務(wù)。強(qiáng)化學(xué)習(xí)所面對(duì)的問(wèn)題是一個(gè)機(jī)器如何在一個(gè)動(dòng)態(tài)的環(huán)境中用試錯(cuò)的方式學(xué)習(xí)行為,處理這類問(wèn)題的方法主要有兩種。一種是在動(dòng)作空間中搜索能夠在環(huán)境中獲得最好表現(xiàn)的動(dòng)作,這種方法通常使用遺傳算法等智能搜索算法來(lái)求解。另一種方法用統(tǒng)計(jì)方法和動(dòng)態(tài)規(guī)劃方法來(lái)估計(jì)采取動(dòng)作帶來(lái)的效用。第二種方法是研究的主流,因?yàn)樗昧藦?qiáng)化學(xué)習(xí)問(wèn)題的特殊結(jié)構(gòu)[48]。強(qiáng)化學(xué)習(xí)的任務(wù)通?梢杂民R爾科夫決策過(guò)程(Markov Decision Process,MDP)來(lái)表示。馬爾科夫決策過(guò)程可以用一個(gè)四元組 S , A, P, R 來(lái)描述。其中
圖3.3 aPY 數(shù)據(jù)集圖像示例[51]中,包含了來(lái)自PASCALVOC2008數(shù)據(jù)集的20oo 數(shù)據(jù)集的 12 個(gè)類別的 2644 幅圖像,每幅圖像有
本文編號(hào):3296004
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3296004.html
最近更新
教材專著