基于XGBoost算法的恒星/星系分類研究
發(fā)布時(shí)間:2021-11-27 17:12
機(jī)器學(xué)習(xí)在當(dāng)今的諸多領(lǐng)域已經(jīng)取得了巨大的成功.尤其是提升算法.提升算法適應(yīng)各種場景的能力較強(qiáng)、準(zhǔn)確率較高,已經(jīng)在多個(gè)領(lǐng)域發(fā)揮巨大的作用.但是提升算法在天文學(xué)中的應(yīng)用卻極為少見.為解決斯隆數(shù)字巡天(Sloan Digital Sky Survey,SDSS)數(shù)據(jù)中恒星/星系暗源集分類正確率低的問題,引入了機(jī)器學(xué)習(xí)中較新的研究成果–XGBoost (eXtreme Gradient Boosting).從SDSS-DR7 (SDSS Data Release 7)中獲取完整的測光數(shù)據(jù)集,并根據(jù)星等值劃分為亮源集和暗源集.首先,分別對亮源集和暗源集使用十折交叉驗(yàn)證法,同時(shí)運(yùn)用XGBoost算法建立恒星/星系分類模型;然后,運(yùn)用柵格搜索等方法調(diào)優(yōu)XGBoost參數(shù);最后,基于星系的分類正確率等指標(biāo),與功能樹(Function Tree, FT)、Adaboost (Adaptive boosting)、隨機(jī)森林(Random Forest, RF)、梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)、堆疊降噪自編碼(Stacked Denoising ...
【文章來源】:天文學(xué)報(bào). 2019,60(02)北大核心CSCD
【文章頁數(shù)】:10 頁
【文章目錄】:
1 引言
2 斯隆數(shù)字巡天
3 提升算法
3.1 GBDT原理
3.2 XGBoost原理
4 實(shí)驗(yàn)測試
4.1 數(shù)據(jù)集介紹
4.2 實(shí)驗(yàn)分析
4.2.1 特征重要性測試
4.2.2 XGBoost模型優(yōu)化
4.2.3 實(shí)驗(yàn)方法及模型對比
5 總結(jié)與展望
【參考文獻(xiàn)】:
期刊論文
[1]基于非參數(shù)回歸與Adaboost的恒星光譜自動分類方法[J]. 劉蓉,喬學(xué)軍,張健楠,段福慶. 光譜學(xué)與光譜分析. 2017(05)
[2]基于DBN,SVM和BP神經(jīng)網(wǎng)絡(luò)的光譜分類比較[J]. 李俊峰,汪月樂,胡升,何慧靈. 光譜學(xué)與光譜分析. 2016(10)
[3]數(shù)據(jù)挖掘技術(shù)在天文學(xué)中的應(yīng)用[J]. 張彥霞,趙永恒. 科研信息化技術(shù)與應(yīng)用. 2011(03)
本文編號:3522720
【文章來源】:天文學(xué)報(bào). 2019,60(02)北大核心CSCD
【文章頁數(shù)】:10 頁
【文章目錄】:
1 引言
2 斯隆數(shù)字巡天
3 提升算法
3.1 GBDT原理
3.2 XGBoost原理
4 實(shí)驗(yàn)測試
4.1 數(shù)據(jù)集介紹
4.2 實(shí)驗(yàn)分析
4.2.1 特征重要性測試
4.2.2 XGBoost模型優(yōu)化
4.2.3 實(shí)驗(yàn)方法及模型對比
5 總結(jié)與展望
【參考文獻(xiàn)】:
期刊論文
[1]基于非參數(shù)回歸與Adaboost的恒星光譜自動分類方法[J]. 劉蓉,喬學(xué)軍,張健楠,段福慶. 光譜學(xué)與光譜分析. 2017(05)
[2]基于DBN,SVM和BP神經(jīng)網(wǎng)絡(luò)的光譜分類比較[J]. 李俊峰,汪月樂,胡升,何慧靈. 光譜學(xué)與光譜分析. 2016(10)
[3]數(shù)據(jù)挖掘技術(shù)在天文學(xué)中的應(yīng)用[J]. 張彥霞,趙永恒. 科研信息化技術(shù)與應(yīng)用. 2011(03)
本文編號:3522720
本文鏈接:http://sikaile.net/kejilunwen/tianwen/3522720.html
教材專著