基于機器學習的脈沖星候選樣本分類算法研究
發(fā)布時間:2022-02-10 22:31
脈沖星搜索是射電天文學中的重要前沿領域。隨著現(xiàn)代搜索設備性能的不斷提升,分辨率和靈敏度顯著提高,設備可以接收到更微弱的脈沖星信號的同時,接收到的干擾信號也越來越多。因此,現(xiàn)代射電天文設備會接收到大量的數(shù)據(jù),但脈沖星信號只占其中的一小部分。同時,部分射頻干擾(RFI)形似脈沖星信號,這也增加了樣本分類的難度。因而,如何從海量信號中準確地識別出脈沖星信號成為一個亟需解決的問題。本文圍繞著使用機器學習算法解決脈沖星候選樣本分類的問題,考慮不同應用場景和需求,探索了監(jiān)督學習方法、半監(jiān)督學習方法和無監(jiān)督學習方法在脈沖星候選樣本分類問題上的應用。首先,針對脈沖星樣本集不均衡且缺少對專家設計的人工特征優(yōu)化分析的問題,提出了一種用于不均衡條件下脈沖星樣本分類的混合集成學習算法。通過引入樹模型對特征的相對重要度進行分析和特征選擇,優(yōu)化特征集合;針對樣本極度不均衡的情況,借鑒Easy Ensemble思想將不均衡數(shù)據(jù)集分成若干較為均衡的子數(shù)據(jù)集,并利用XGBoost模型和隨機森林模型作為基學習器,在子數(shù)據(jù)上分別進行代價敏感訓練,從而實現(xiàn)混合集成,提升了基于人工特征分類的算法性能。在HTRU(High Ti...
【文章來源】:中國科學院大學(中國科學院國家空間科學中心)北京市
【文章頁數(shù)】:161 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
縮寫詞
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究進展
1.2.1 傳統(tǒng)識別方法
1.2.2 機器學習方法
1.3 本文研究內容及創(chuàng)新點
1.3.1 研究內容與章節(jié)安排
1.3.2 創(chuàng)新點
第2章 基本理論
2.1 引言
2.2 脈沖星信號處理
2.3 脈沖星候選樣本
2.4 脈沖星候選樣本數(shù)據(jù)集
2.4.1 HTRU1和HTRU2 數(shù)據(jù)集
2.4.2 數(shù)據(jù)特點
2.5 機器學習算法
2.6 不均衡樣本處理策略
2.6.1 樣本層面處理策略
2.6.2 特征層面處理策略
2.6.3 算法層面處理策略
2.7 算法的測試與評價
2.7.1 算法的評估
2.7.2 算法的評價指標
2.8 本章小結
第3章 基于集成學習的脈沖星候選樣本分類算法研究
3.1 引言
3.2 脈沖星專家特征
3.3 特征選擇
3.3.1 常用的特征選擇方法
3.3.2 基于樹模型的特征相對重要度
3.4 集成學習
3.4.1 隨機森林
3.4.2 XGBoost
3.5 針對不均衡脈沖星樣本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代價敏感學習
3.5.3 改進的混合集成算法
3.6 仿真與分析
3.6.1 數(shù)據(jù)集構造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征篩選
3.6.4 算法結果
3.6.5 算法分析
3.7 本章小結
第4章 基于卷積神經(jīng)網(wǎng)絡的脈沖星候選樣本分類算法研究
4.1 引言
4.2 卷積神經(jīng)網(wǎng)絡
4.2.1 網(wǎng)絡結構
4.2.2 參數(shù)優(yōu)化
4.2.3 正則化
4.3 基于深度卷積神經(jīng)網(wǎng)絡的分類模型
4.3.1 樣本不均衡問題的解決方案
4.3.2 模型結構
4.4 仿真與分析
4.4.1 數(shù)據(jù)集構造
4.4.2 模型訓練
4.4.3 模型分析
4.4.4 混合集成算法與卷積神經(jīng)網(wǎng)絡算法的組合分類與比較
4.5 本章小結
第5章 基于異常檢測的脈沖星候選樣本分類算法的研究
5.1 引言
5.2 異常檢測算法
5.2.1 算法流程
5.2.2 算法的核心參數(shù)
5.2.3 算法的特點
5.3 基于孤立森林的脈沖星異常檢測
5.4 仿真與分析
5.4.1 算法結果
5.4.2 模型分析
5.4.3 混合集成算法與孤立森林異常檢測算法結果比較
5.5 本章小結
第6章 基于深度聚類的脈沖星候選樣本無監(jiān)督分類算法的研究
6.1 引言
6.2 傳統(tǒng)的聚類算法
6.3 結合深度學習的聚類方法
6.3.1 AE模型部分
6.3.2 聚類層部分
6.4 基于DCEC的脈沖星樣本聚類
6.5 仿真與分析
6.5.1 數(shù)據(jù)集構造
6.5.2 模型設置
6.5.3 仿真分析
6.6 本章小結
第7章 總結和展望
7.1 主要工作總結
7.2 研究展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
【參考文獻】:
期刊論文
[1]基于自歸一化神經(jīng)網(wǎng)絡的脈沖星候選體選擇[J]. 康志偉,劉拓,劉勁,馬辛,陳曉. 物理學報. 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強,尹宏鵬. 控制與決策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射線脈沖星導航原理[J]. 帥平,陳紹龍,吳一帆,張春青,李明. 宇航學報. 2007(06)
本文編號:3619642
【文章來源】:中國科學院大學(中國科學院國家空間科學中心)北京市
【文章頁數(shù)】:161 頁
【學位級別】:博士
【文章目錄】:
摘要
abstract
縮寫詞
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究進展
1.2.1 傳統(tǒng)識別方法
1.2.2 機器學習方法
1.3 本文研究內容及創(chuàng)新點
1.3.1 研究內容與章節(jié)安排
1.3.2 創(chuàng)新點
第2章 基本理論
2.1 引言
2.2 脈沖星信號處理
2.3 脈沖星候選樣本
2.4 脈沖星候選樣本數(shù)據(jù)集
2.4.1 HTRU1和HTRU2 數(shù)據(jù)集
2.4.2 數(shù)據(jù)特點
2.5 機器學習算法
2.6 不均衡樣本處理策略
2.6.1 樣本層面處理策略
2.6.2 特征層面處理策略
2.6.3 算法層面處理策略
2.7 算法的測試與評價
2.7.1 算法的評估
2.7.2 算法的評價指標
2.8 本章小結
第3章 基于集成學習的脈沖星候選樣本分類算法研究
3.1 引言
3.2 脈沖星專家特征
3.3 特征選擇
3.3.1 常用的特征選擇方法
3.3.2 基于樹模型的特征相對重要度
3.4 集成學習
3.4.1 隨機森林
3.4.2 XGBoost
3.5 針對不均衡脈沖星樣本的混合集成模型
3.5.1 Easy Ensemble算法
3.5.2 代價敏感學習
3.5.3 改進的混合集成算法
3.6 仿真與分析
3.6.1 數(shù)據(jù)集構造
3.6.2 特征重要度分析
3.6.3 基于特征重要度的特征篩選
3.6.4 算法結果
3.6.5 算法分析
3.7 本章小結
第4章 基于卷積神經(jīng)網(wǎng)絡的脈沖星候選樣本分類算法研究
4.1 引言
4.2 卷積神經(jīng)網(wǎng)絡
4.2.1 網(wǎng)絡結構
4.2.2 參數(shù)優(yōu)化
4.2.3 正則化
4.3 基于深度卷積神經(jīng)網(wǎng)絡的分類模型
4.3.1 樣本不均衡問題的解決方案
4.3.2 模型結構
4.4 仿真與分析
4.4.1 數(shù)據(jù)集構造
4.4.2 模型訓練
4.4.3 模型分析
4.4.4 混合集成算法與卷積神經(jīng)網(wǎng)絡算法的組合分類與比較
4.5 本章小結
第5章 基于異常檢測的脈沖星候選樣本分類算法的研究
5.1 引言
5.2 異常檢測算法
5.2.1 算法流程
5.2.2 算法的核心參數(shù)
5.2.3 算法的特點
5.3 基于孤立森林的脈沖星異常檢測
5.4 仿真與分析
5.4.1 算法結果
5.4.2 模型分析
5.4.3 混合集成算法與孤立森林異常檢測算法結果比較
5.5 本章小結
第6章 基于深度聚類的脈沖星候選樣本無監(jiān)督分類算法的研究
6.1 引言
6.2 傳統(tǒng)的聚類算法
6.3 結合深度學習的聚類方法
6.3.1 AE模型部分
6.3.2 聚類層部分
6.4 基于DCEC的脈沖星樣本聚類
6.5 仿真與分析
6.5.1 數(shù)據(jù)集構造
6.5.2 模型設置
6.5.3 仿真分析
6.6 本章小結
第7章 總結和展望
7.1 主要工作總結
7.2 研究展望
參考文獻
致謝
作者簡歷及攻讀學位期間發(fā)表的學術論文與研究成果
【參考文獻】:
期刊論文
[1]基于自歸一化神經(jīng)網(wǎng)絡的脈沖星候選體選擇[J]. 康志偉,劉拓,劉勁,馬辛,陳曉. 物理學報. 2020(06)
[2]Pulsar candidate selection using ensemble networks for FAST drift-scan survey[J]. HongFeng Wang,WeiWei Zhu,Ping Guo,Di Li,SiBo Feng,Qian Yin,ChenChen Miao,ZhenZhao Tao,ZhiChen Pan,Pei Wang,Xin Zheng,XiaoDan Deng,ZhiJie Liu,XiaoYao Xie,XuHong Yu,ShanPing You,Hui Zhang. Science China(Physics,Mechanics & Astronomy). 2019(05)
[3]不平衡數(shù)據(jù)分類方法綜述[J]. 李艷霞,柴毅,胡友強,尹宏鵬. 控制與決策. 2019(04)
[4]Application of isolation forest to extract multivariate anomalies from geochemical exploration data[J]. WU Wei,CHEN Yongliang. Global Geology. 2018(01)
[5]X射線脈沖星導航原理[J]. 帥平,陳紹龍,吳一帆,張春青,李明. 宇航學報. 2007(06)
本文編號:3619642
本文鏈接:http://sikaile.net/kejilunwen/tianwen/3619642.html