基于集成學習的M亞矮星搜索方法研究
發(fā)布時間:2021-09-08 07:10
M亞矮星是一類低質量、低光度的貧金屬性的恒星,被認為是銀河系中的古老群體。M亞矮星的研究對于探索銀河系的演化和組成至關重要。然而由于M亞矮星和M矮星有著相似的光譜形態(tài),使得二者往往混淆在一起。近年來隨著機器學習的發(fā)展,為M矮星和M亞矮星的分類提供了許多新的方法。本文重點采用基于決策樹的集成學習算法構建了M矮星和M亞矮星的分類模型。集成學習不僅能產生最終的預測結果,還能有效評估區(qū)分二者的特征。另外實驗結果表明本文在LAMOST數(shù)據(jù)集上構建的LightGBM模型可以有效區(qū)分M矮星光譜和M亞矮星光譜,算法準確率達到97.22%,并成功應用到了 SDSS數(shù)據(jù)集上。本文主要分為以下四個部分:(1)數(shù)據(jù)預處理數(shù)據(jù)預處理過程包括光譜數(shù)據(jù)的獲取、插值、歸一化和去除大氣吸收線等操作,以及數(shù)據(jù)集的劃分。(2)模型構建本實驗中,利用LAMOSTDR4的光譜數(shù)據(jù),分別構建了 SVM、隨機森林、XGBoost、LightGBM訓練模型,其中LightGBM分類效果最好,并且運行效率最高。本文的創(chuàng)新點之一就是將比較先進的集成學習算法LightGBM率先應用到M矮星和M亞矮星的分類問題當中,并且通過實驗結果說明了這...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖1-2?SDSS?2.5米望遠鏡??1.2.3光譜數(shù)據(jù)介紹??光譜數(shù)據(jù)是天文研宄領域中最常用的、最重要的研究對象之一
?山東大學碩士學位論文???從剩下樣本數(shù)據(jù)中隨機抽取W2X100%個樣本作為小梯度樣本集合(W為小??梯度樣本的采樣率)。最后將兩個樣本合并就得到了?LightGBM的訓練樣本。??同時,為了平衡數(shù)據(jù)集的概率分布,還給小樣本光譜數(shù)據(jù)設置了一個權重系??數(shù)通過這樣的調節(jié)還能在一定程度上保證模型的準確率,GuolinKe??w2??在論文中給出了數(shù)學證明[44]。??實驗光譜?采樣光譜??編號?梯度?編號?梯度權重??2-5?2-51??選擇前2個??5?3?光譜,?5?3?1??wi=l/3??I?4??剩余光譜中,隨機??4?1.5?選擇?2?個,w2=l/3.?6?1-?2??6?1??1?0.5??圖3-4?GOSS采樣示意圖??圖3-4,舉例說明了?GOSS的采樣策略,首先根據(jù)梯度對所有的光譜數(shù)??據(jù)進行排序,假設■,則算法在計算增益時,對于小梯度樣本的??3?3??數(shù)據(jù)設置權重,放大^^=2倍,以平衡數(shù)據(jù)分布。LightGBM構建判別模??w2??型的過程如算法3-2:??20??
?山東大學碩士學位論文???6000-8300A,共2300A數(shù)據(jù),間隔為1A。經過流量標準化處理后,本實驗??中輸入到算法模型中的是2300維的連續(xù)的光譜特征。??經過歸一化和插值操作后,從數(shù)據(jù)集當中挑選出了早型(M2)的M矮??星和M亞矮星光譜和晚型(M5)的M矮星和M亞矮星光譜,如圖4-1所示:???M2???14?靡’’?'I?’??1.2-?Subd:arf?L?/?I??x??i-?m?,/?/?V,?1??〇-6-?;J'(?\?^?J??0.4-??6000?6500?7000?7500?8000??Wavelength(A)???M5???x-4-?丫1??1.2?Subdwarf?,?/產'??x?/%??iL〇-?.?^?V?.?i?I??i〇.8.?m?f??1?一?,廣?twT?I??a6_?j\?/?'M??。.4.?V’?d?Dwarf??6000?6500?7000?7500?8000??Wavelength(A)??圖4-1?M矮星和M亞矮星的光譜形態(tài):上半部分是M2早型,下半部分是M5晚型??圖4-1為M矮星和M亞矮星的光譜形態(tài),橫坐標為6000A-8300A波??段,縱坐標為相對流量。從圖4-1可以看出,M亞矮星與M矮星光譜形態(tài)??及其相似,并且具有類似的特征。其中一個顯著的特征就是在可見光譜上布??滿了?TiO、CaH、和CaOH等分子帶。這些分子帶本質上是一些有規(guī)律的光??譜線,由分子振動和轉動躍遷形成,蘊含著大量的光譜信息。除了這些分子??帶,M亞矮星和M矮星光譜還有許多原子特征線,比如Nal線
【參考文獻】:
期刊論文
[1]低信噪比巡天數(shù)據(jù)中特殊恒星光譜的搜尋方法[J]. 吳明磊,潘景昌,衣振萍,韋鵬. 光譜學與光譜分析. 2019(02)
[2]M矮星光譜型分類研究[J]. 衣振萍,潘景昌,羅阿理. 光譜學與光譜分析. 2013(08)
[3]The Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST)[J]. Xiang-Qun Cui2, Yong-Heng Zhao1, Yao-Quan Chu3, Guo-Ping Li2, Qi Li1, Li-Ping Zhang2, Hong-Jun Su1, Zheng-Qiu Yao2, Ya-Nan Wang2, Xiao-Zheng Xing3, Xin-Nan Li2, Yong-Tian Zhu2, Gang Wang1, Bo-Zhong Gu2, A-Li Luo1, Xin-Qi Xu2, Zhen-Chao Zhang2, Gen-Rong Liu2, Hao-Tong Zhang1, De-Hua Yang2, Shu-Yun Cao1, Hai-Yuan Chen2, Jian-Jun Chen1, Kun-Xin Chen2, Ying Chen1, Jia-Ru Chu3, Lei Feng1, Xue-Fei Gong2, Yong-Hui Hou2, Hong-Zhuan Hu3, Ning-Sheng Hu2, Zhong-Wen Hu2, Lei Jia1, Fang-Hua Jiang2, Xiang Jiang2, Zi-Bo Jiang2, Ge Jin3, Ai-Hua Li2, Yan Li4, Ye-Ping Li2, Guan-Qun Liu2, Zhi-Gang Liu3, Wen-Zhi Lu2, Yin-Dun Mao4, Li Men1, Yong-Jun Qi2, Zhao-Xiang Qi4, Huo-Ming Shi1, Zheng-Hong Tang4, Qing-Sheng Tao2, Da-Qi Wang1, Dan Wang1, Guo-Min Wang2, Hai Wang2, Jia-Ning Wang2, Jian Wang3, Jian-Ling Wang1, Jian-Ping Wang3, Lei Wang2, Shu-Qing Wang1, You Wang2, Yue-Fei Wang2, Ling-Zhe Xu2, Yan Xu1, Shi-Hai Yang2, Yong Yu4, Hui Yuan1, Xiang-Yan Yuan2, Chao Zhai3, Jing Zhang5, Yan-Xia Zhang1, Yong Zhang2, Ming Zhao4, Fang Zhou2, Guo-Hua Zhou2, Jie Zhu2 and Si-Cheng Zou1 1 National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China; 2 Nanjing Institute of Astronomical Optics and Technology, National Astronomical Observatories, Chinese Academy of Sciences, Nanjing 210042, China 3 University of Science and Technology of China, Hefei 230026, China 4 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China 5 Institute of Architecture Design and Research, Chinese Academy of Sciences, Beijing 100190, China. Research in Astronomy and Astrophysics. 2012(09)
[4]光譜流量標準化的高效計算[J]. 李鄉(xiāng)儒. 光譜學與光譜分析. 2012(01)
[5]天文學中的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[J]. 張彥霞,趙永恒,崔辰州. 天文學進展. 2002(04)
本文編號:3390359
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖1-2?SDSS?2.5米望遠鏡??1.2.3光譜數(shù)據(jù)介紹??光譜數(shù)據(jù)是天文研宄領域中最常用的、最重要的研究對象之一
?山東大學碩士學位論文???從剩下樣本數(shù)據(jù)中隨機抽取W2X100%個樣本作為小梯度樣本集合(W為小??梯度樣本的采樣率)。最后將兩個樣本合并就得到了?LightGBM的訓練樣本。??同時,為了平衡數(shù)據(jù)集的概率分布,還給小樣本光譜數(shù)據(jù)設置了一個權重系??數(shù)通過這樣的調節(jié)還能在一定程度上保證模型的準確率,GuolinKe??w2??在論文中給出了數(shù)學證明[44]。??實驗光譜?采樣光譜??編號?梯度?編號?梯度權重??2-5?2-51??選擇前2個??5?3?光譜,?5?3?1??wi=l/3??I?4??剩余光譜中,隨機??4?1.5?選擇?2?個,w2=l/3.?6?1-?2??6?1??1?0.5??圖3-4?GOSS采樣示意圖??圖3-4,舉例說明了?GOSS的采樣策略,首先根據(jù)梯度對所有的光譜數(shù)??據(jù)進行排序,假設■,則算法在計算增益時,對于小梯度樣本的??3?3??數(shù)據(jù)設置權重,放大^^=2倍,以平衡數(shù)據(jù)分布。LightGBM構建判別模??w2??型的過程如算法3-2:??20??
?山東大學碩士學位論文???6000-8300A,共2300A數(shù)據(jù),間隔為1A。經過流量標準化處理后,本實驗??中輸入到算法模型中的是2300維的連續(xù)的光譜特征。??經過歸一化和插值操作后,從數(shù)據(jù)集當中挑選出了早型(M2)的M矮??星和M亞矮星光譜和晚型(M5)的M矮星和M亞矮星光譜,如圖4-1所示:???M2???14?靡’’?'I?’??1.2-?Subd:arf?L?/?I??x??i-?m?,/?/?V,?1??〇-6-?;J'(?\?^?J??0.4-??6000?6500?7000?7500?8000??Wavelength(A)???M5???x-4-?丫1??1.2?Subdwarf?,?/產'??x?/%??iL〇-?.?^?V?.?i?I??i〇.8.?m?f??1?一?,廣?twT?I??a6_?j\?/?'M??。.4.?V’?d?Dwarf??6000?6500?7000?7500?8000??Wavelength(A)??圖4-1?M矮星和M亞矮星的光譜形態(tài):上半部分是M2早型,下半部分是M5晚型??圖4-1為M矮星和M亞矮星的光譜形態(tài),橫坐標為6000A-8300A波??段,縱坐標為相對流量。從圖4-1可以看出,M亞矮星與M矮星光譜形態(tài)??及其相似,并且具有類似的特征。其中一個顯著的特征就是在可見光譜上布??滿了?TiO、CaH、和CaOH等分子帶。這些分子帶本質上是一些有規(guī)律的光??譜線,由分子振動和轉動躍遷形成,蘊含著大量的光譜信息。除了這些分子??帶,M亞矮星和M矮星光譜還有許多原子特征線,比如Nal線
【參考文獻】:
期刊論文
[1]低信噪比巡天數(shù)據(jù)中特殊恒星光譜的搜尋方法[J]. 吳明磊,潘景昌,衣振萍,韋鵬. 光譜學與光譜分析. 2019(02)
[2]M矮星光譜型分類研究[J]. 衣振萍,潘景昌,羅阿理. 光譜學與光譜分析. 2013(08)
[3]The Large Sky Area Multi-Object Fiber Spectroscopic Telescope (LAMOST)[J]. Xiang-Qun Cui2, Yong-Heng Zhao1, Yao-Quan Chu3, Guo-Ping Li2, Qi Li1, Li-Ping Zhang2, Hong-Jun Su1, Zheng-Qiu Yao2, Ya-Nan Wang2, Xiao-Zheng Xing3, Xin-Nan Li2, Yong-Tian Zhu2, Gang Wang1, Bo-Zhong Gu2, A-Li Luo1, Xin-Qi Xu2, Zhen-Chao Zhang2, Gen-Rong Liu2, Hao-Tong Zhang1, De-Hua Yang2, Shu-Yun Cao1, Hai-Yuan Chen2, Jian-Jun Chen1, Kun-Xin Chen2, Ying Chen1, Jia-Ru Chu3, Lei Feng1, Xue-Fei Gong2, Yong-Hui Hou2, Hong-Zhuan Hu3, Ning-Sheng Hu2, Zhong-Wen Hu2, Lei Jia1, Fang-Hua Jiang2, Xiang Jiang2, Zi-Bo Jiang2, Ge Jin3, Ai-Hua Li2, Yan Li4, Ye-Ping Li2, Guan-Qun Liu2, Zhi-Gang Liu3, Wen-Zhi Lu2, Yin-Dun Mao4, Li Men1, Yong-Jun Qi2, Zhao-Xiang Qi4, Huo-Ming Shi1, Zheng-Hong Tang4, Qing-Sheng Tao2, Da-Qi Wang1, Dan Wang1, Guo-Min Wang2, Hai Wang2, Jia-Ning Wang2, Jian Wang3, Jian-Ling Wang1, Jian-Ping Wang3, Lei Wang2, Shu-Qing Wang1, You Wang2, Yue-Fei Wang2, Ling-Zhe Xu2, Yan Xu1, Shi-Hai Yang2, Yong Yu4, Hui Yuan1, Xiang-Yan Yuan2, Chao Zhai3, Jing Zhang5, Yan-Xia Zhang1, Yong Zhang2, Ming Zhao4, Fang Zhou2, Guo-Hua Zhou2, Jie Zhu2 and Si-Cheng Zou1 1 National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China; 2 Nanjing Institute of Astronomical Optics and Technology, National Astronomical Observatories, Chinese Academy of Sciences, Nanjing 210042, China 3 University of Science and Technology of China, Hefei 230026, China 4 Shanghai Astronomical Observatory, Chinese Academy of Sciences, Shanghai 200030, China 5 Institute of Architecture Design and Research, Chinese Academy of Sciences, Beijing 100190, China. Research in Astronomy and Astrophysics. 2012(09)
[4]光譜流量標準化的高效計算[J]. 李鄉(xiāng)儒. 光譜學與光譜分析. 2012(01)
[5]天文學中的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[J]. 張彥霞,趙永恒,崔辰州. 天文學進展. 2002(04)
本文編號:3390359
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3390359.html