基于機(jī)器學(xué)習(xí)的脈沖星候選樣本分類算法研究
發(fā)布時(shí)間:2022-02-10 22:31
脈沖星搜索是射電天文學(xué)中的重要前沿領(lǐng)域。隨著現(xiàn)代搜索設(shè)備性能的不斷提升,分辨率和靈敏度顯著提高,設(shè)備可以接收到更微弱的脈沖星信號(hào)的同時(shí),接收到的干擾信號(hào)也越來越多。因此,現(xiàn)代射電天文設(shè)備會(huì)接收到大量的數(shù)據(jù),但脈沖星信號(hào)只占其中的一小部分。同時(shí),部分射頻干擾(RFI)形似脈沖星信號(hào),這也增加了樣本分類的難度。因而,如何從海量信號(hào)中準(zhǔn)確地識(shí)別出脈沖星信號(hào)成為一個(gè)亟需解決的問題。本文圍繞著使用機(jī)器學(xué)習(xí)算法解決脈沖星候選樣本分類的問題,考慮不同應(yīng)用場(chǎng)景和需求,探索了監(jiān)督學(xué)習(xí)方法、半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法在脈沖星候選樣本分類問題上的應(yīng)用。首先,針對(duì)脈沖星樣本集不均衡且缺少對(duì)專家設(shè)計(jì)的人工特征優(yōu)化分析的問題,提出了一種用于不均衡條件下脈沖星樣本分類的混合集成學(xué)習(xí)算法。通過引入樹模型對(duì)特征的相對(duì)重要度進(jìn)行分析和特征選擇,優(yōu)化特征集合;針對(duì)樣本極度不均衡的情況,借鑒Easy Ensemble思想將不均衡數(shù)據(jù)集分成若干較為均衡的子數(shù)據(jù)集,并利用XGBoost模型和隨機(jī)森林模型作為基學(xué)習(xí)器,在子數(shù)據(jù)上分別進(jìn)行代價(jià)敏感訓(xùn)練,從而實(shí)現(xiàn)混合集成,提升了基于人工特征分類的算法性能。在HTRU(High Ti...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院國家空間科學(xué)中心)北京市
【文章頁數(shù)】:161 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
縮寫詞
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究進(jìn)展
1.2.1 傳統(tǒng)識(shí)別方法
1.2.2 機(jī)器學(xué)習(xí)方法
1.3 本文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.3.1 研究?jī)?nèi)容與章節(jié)安排
1.3.2 創(chuàng)新點(diǎn)
第2章 基本理論
2.1 引言
2.2 脈沖星信號(hào)處理
2.3 脈沖星候選樣本
2.4 脈沖星候選樣本數(shù)據(jù)集
2.4.1 HTRU1和HTRU2 數(shù)據(jù)集
2.4.2 數(shù)據(jù)特點(diǎn)
2.5 機(jī)器學(xué)習(xí)算法
2.6 不均衡樣本處理策略
2.6.1 樣本層面處理策略
2.6.2 特征層面處理策略
2.6.3 算法層面處理策略
2.7 算法的測(cè)試與評(píng)價(jià)
2.7.1 算法的評(píng)估
2.7.2 算法的評(píng)價(jià)指標(biāo)
2.8 本章小結(jié)
第3章 基于集成學(xué)習(xí)的脈沖星候選樣本分類算法研究
3.1 引言
3.2 脈沖星專家特征
3.3 特征選擇
3.3.1 常用的特征選擇方法
3.3.2 基于樹模型的特征相對(duì)重要度
3.4 集成學(xué)習(xí)
3.4.1 隨機(jī)森林
3.4.2 XGBoost
3.5 針對(duì)不均衡脈沖星樣本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代價(jià)敏感學(xué)習(xí)
3.5.3 改進(jìn)的混合集成算法
3.6 仿真與分析
3.6.1 數(shù)據(jù)集構(gòu)造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征篩選
3.6.4 算法結(jié)果
3.6.5 算法分析
3.7 本章小結(jié)
第4章 基于卷積神經(jīng)網(wǎng)絡(luò)的脈沖星候選樣本分類算法研究
4.1 引言
4.2 卷積神經(jīng)網(wǎng)絡(luò)
4.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
4.2.2 參數(shù)優(yōu)化
4.2.3 正則化
4.3 基于深度卷積神經(jīng)網(wǎng)絡(luò)的分類模型
4.3.1 樣本不均衡問題的解決方案
4.3.2 模型結(jié)構(gòu)
4.4 仿真與分析
4.4.1 數(shù)據(jù)集構(gòu)造
4.4.2 模型訓(xùn)練
4.4.3 模型分析
4.4.4 混合集成算法與卷積神經(jīng)網(wǎng)絡(luò)算法的組合分類與比較
4.5 本章小結(jié)
第5章 基于異常檢測(cè)的脈沖星候選樣本分類算法的研究
5.1 引言
5.2 異常檢測(cè)算法
5.2.1 算法流程
5.2.2 算法的核心參數(shù)
5.2.3 算法的特點(diǎn)
5.3 基于孤立森林的脈沖星異常檢測(cè)
5.4 仿真與分析
5.4.1 算法結(jié)果
5.4.2 模型分析
5.4.3 混合集成算法與孤立森林異常檢測(cè)算法結(jié)果比較
5.5 本章小結(jié)
第6章 基于深度聚類的脈沖星候選樣本無監(jiān)督分類算法的研究
6.1 引言
6.2 傳統(tǒng)的聚類算法
6.3 結(jié)合深度學(xué)習(xí)的聚類方法
6.3.1 AE模型部分
6.3.2 聚類層部分
6.4 基于DCEC的脈沖星樣本聚類
6.5 仿真與分析
6.5.1 數(shù)據(jù)集構(gòu)造
6.5.2 模型設(shè)置
6.5.3 仿真分析
6.6 本章小結(jié)
第7章 總結(jié)和展望
7.1 主要工作總結(jié)
7.2 研究展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于自歸一化神經(jīng)網(wǎng)絡(luò)的脈沖星候選體選擇[J]. 康志偉,劉拓,劉勁,馬辛,陳曉. 物理學(xué)報(bào). 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射線脈沖星導(dǎo)航原理[J]. 帥平,陳紹龍,吳一帆,張春青,李明. 宇航學(xué)報(bào). 2007(06)
本文編號(hào):3619642
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院國家空間科學(xué)中心)北京市
【文章頁數(shù)】:161 頁
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
abstract
縮寫詞
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究進(jìn)展
1.2.1 傳統(tǒng)識(shí)別方法
1.2.2 機(jī)器學(xué)習(xí)方法
1.3 本文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.3.1 研究?jī)?nèi)容與章節(jié)安排
1.3.2 創(chuàng)新點(diǎn)
第2章 基本理論
2.1 引言
2.2 脈沖星信號(hào)處理
2.3 脈沖星候選樣本
2.4 脈沖星候選樣本數(shù)據(jù)集
2.4.1 HTRU1和HTRU2 數(shù)據(jù)集
2.4.2 數(shù)據(jù)特點(diǎn)
2.5 機(jī)器學(xué)習(xí)算法
2.6 不均衡樣本處理策略
2.6.1 樣本層面處理策略
2.6.2 特征層面處理策略
2.6.3 算法層面處理策略
2.7 算法的測(cè)試與評(píng)價(jià)
2.7.1 算法的評(píng)估
2.7.2 算法的評(píng)價(jià)指標(biāo)
2.8 本章小結(jié)
第3章 基于集成學(xué)習(xí)的脈沖星候選樣本分類算法研究
3.1 引言
3.2 脈沖星專家特征
3.3 特征選擇
3.3.1 常用的特征選擇方法
3.3.2 基于樹模型的特征相對(duì)重要度
3.4 集成學(xué)習(xí)
3.4.1 隨機(jī)森林
3.4.2 XGBoost
3.5 針對(duì)不均衡脈沖星樣本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代價(jià)敏感學(xué)習(xí)
3.5.3 改進(jìn)的混合集成算法
3.6 仿真與分析
3.6.1 數(shù)據(jù)集構(gòu)造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征篩選
3.6.4 算法結(jié)果
3.6.5 算法分析
3.7 本章小結(jié)
第4章 基于卷積神經(jīng)網(wǎng)絡(luò)的脈沖星候選樣本分類算法研究
4.1 引言
4.2 卷積神經(jīng)網(wǎng)絡(luò)
4.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
4.2.2 參數(shù)優(yōu)化
4.2.3 正則化
4.3 基于深度卷積神經(jīng)網(wǎng)絡(luò)的分類模型
4.3.1 樣本不均衡問題的解決方案
4.3.2 模型結(jié)構(gòu)
4.4 仿真與分析
4.4.1 數(shù)據(jù)集構(gòu)造
4.4.2 模型訓(xùn)練
4.4.3 模型分析
4.4.4 混合集成算法與卷積神經(jīng)網(wǎng)絡(luò)算法的組合分類與比較
4.5 本章小結(jié)
第5章 基于異常檢測(cè)的脈沖星候選樣本分類算法的研究
5.1 引言
5.2 異常檢測(cè)算法
5.2.1 算法流程
5.2.2 算法的核心參數(shù)
5.2.3 算法的特點(diǎn)
5.3 基于孤立森林的脈沖星異常檢測(cè)
5.4 仿真與分析
5.4.1 算法結(jié)果
5.4.2 模型分析
5.4.3 混合集成算法與孤立森林異常檢測(cè)算法結(jié)果比較
5.5 本章小結(jié)
第6章 基于深度聚類的脈沖星候選樣本無監(jiān)督分類算法的研究
6.1 引言
6.2 傳統(tǒng)的聚類算法
6.3 結(jié)合深度學(xué)習(xí)的聚類方法
6.3.1 AE模型部分
6.3.2 聚類層部分
6.4 基于DCEC的脈沖星樣本聚類
6.5 仿真與分析
6.5.1 數(shù)據(jù)集構(gòu)造
6.5.2 模型設(shè)置
6.5.3 仿真分析
6.6 本章小結(jié)
第7章 總結(jié)和展望
7.1 主要工作總結(jié)
7.2 研究展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
【參考文獻(xiàn)】:
期刊論文
[1]基于自歸一化神經(jīng)網(wǎng)絡(luò)的脈沖星候選體選擇[J]. 康志偉,劉拓,劉勁,馬辛,陳曉. 物理學(xué)報(bào). 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射線脈沖星導(dǎo)航原理[J]. 帥平,陳紹龍,吳一帆,張春青,李明. 宇航學(xué)報(bào). 2007(06)
本文編號(hào):3619642
本文鏈接:http://sikaile.net/kejilunwen/tianwen/3619642.html
最近更新
教材專著