基于集成學(xué)習(xí)的激光誘導(dǎo)擊穿光譜學(xué)技術(shù)定量分析算法及應(yīng)用研究
發(fā)布時(shí)間:2021-07-27 21:42
激光誘導(dǎo)擊穿光譜學(xué)技術(shù)(Laser-Induced Breakdown Spectroscopy,LIBS)是一項(xiàng)新的化學(xué)分析技術(shù),由于其多種優(yōu)點(diǎn)目前被廣泛應(yīng)用于材料識(shí)別以及混合物定量和定性分析中。其中,LIBS定量分析方法的研究是當(dāng)前的研究熱點(diǎn),可以便捷地幫助科研工作者確定混合物中的元素組成以及元素含量。因此對(duì)LIBS定量分析技術(shù)進(jìn)行深入研究并提升其分析預(yù)測(cè)精度,具有重要的實(shí)際應(yīng)用價(jià)值。論文綜述了LIBS定量分析領(lǐng)域的研究工作進(jìn)展,介紹了基于神經(jīng)網(wǎng)絡(luò)、基于支持向量回歸、基于隨機(jī)森林回歸的LIBS定量分析方法,并分析了各種方法的優(yōu)缺點(diǎn)以及應(yīng)用范圍。針對(duì)單一學(xué)習(xí)器容易受到基體效應(yīng)的影響、容易出現(xiàn)過(guò)擬合的風(fēng)險(xiǎn)、容易被隨機(jī)產(chǎn)生的誤差影響而影響預(yù)測(cè)精度的問(wèn)題,為了進(jìn)一步提升LIBS定量分析方法的預(yù)測(cè)精度,并克服單一學(xué)習(xí)器的不足之處,本文提出了一種兩層結(jié)構(gòu)的基于集成學(xué)習(xí)的LIBS定量分析方法。該方法首先由基學(xué)習(xí)器選擇的流程選擇出合適的基學(xué)習(xí)器。第一層由若干個(gè)選擇的基學(xué)習(xí)器組成。將第一層的基學(xué)習(xí)器交叉驗(yàn)證的過(guò)程中對(duì)驗(yàn)證集的預(yù)測(cè)作為次級(jí)元學(xué)習(xí)器的輸入特征,并以此進(jìn)行元學(xué)習(xí)器的訓(xùn)練,并將最終訓(xùn)練完成的...
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見(jiàn)LIBS分析實(shí)驗(yàn)裝置
。Bagging技術(shù)是學(xué)習(xí)結(jié)果集成的經(jīng)典例子。當(dāng)給定一個(gè)訓(xùn)練集,它首先會(huì)通過(guò)對(duì)整個(gè)訓(xùn)練集進(jìn)行Bootstrap的隨機(jī)抽樣、隨機(jī)子空間、擾動(dòng)、投影等方式來(lái)獲得若干個(gè)子抽樣訓(xùn)練集。且訓(xùn)練子集抽樣之間盡可能保持相對(duì)獨(dú)立。這樣,我們可以獲得數(shù)據(jù)集在相對(duì)獨(dú)立和穩(wěn)定的情況下的抽樣。然后對(duì)于這若干個(gè)訓(xùn)練集使用不同的基學(xué)習(xí)器進(jìn)行訓(xùn)練和學(xué)習(xí),再對(duì)于分類任務(wù)使用投票的方式、對(duì)于回歸任務(wù)使用算術(shù)平均或者加權(quán)平均的方式來(lái)形成組合的強(qiáng)學(xué)習(xí)器。最終再使用這些組合學(xué)習(xí)器對(duì)測(cè)試集中的樣本進(jìn)行預(yù)測(cè),以獲取這些測(cè)試集的對(duì)應(yīng)測(cè)試結(jié)果。圖2-1Bagging的常見(jiàn)流程結(jié)構(gòu)2.1.2Boosting集成框架概述Boosting是一種可以用于提升弱學(xué)習(xí)器的泛化能力的有監(jiān)督學(xué)習(xí)的集成算法。它最開(kāi)始由MichaelKearns[3]提出。其主要的思想是將弱學(xué)習(xí)器組裝成強(qiáng)學(xué)習(xí)器。在PAC學(xué)習(xí)框架中,一定可以使用某種方法將弱分類器組裝成一個(gè)強(qiáng)分類器。大多數(shù)的Boosting算法由一系列的弱學(xué)習(xí)器組成,使用迭代的方法,根據(jù)他們?cè)诜诸愔械臏?zhǔn)確率或者回歸預(yù)測(cè)中的誤差情況給予弱學(xué)習(xí)器不同的權(quán)重,同時(shí)會(huì)對(duì)使用的數(shù)據(jù)集進(jìn)行重新加權(quán),以此來(lái)強(qiáng)化對(duì)此前分類錯(cuò)誤或者預(yù)測(cè)誤差較大的數(shù)據(jù)的重新分類和預(yù)測(cè)。Adaboost[4]算法是學(xué)習(xí)過(guò)程集成的典型例子。在AdaBoost的訓(xùn)練中,算法會(huì)通過(guò)不斷動(dòng)態(tài)調(diào)整訓(xùn)練集中不同樣本的對(duì)應(yīng)信心值(權(quán)值)來(lái)體現(xiàn)學(xué)習(xí)器當(dāng)前對(duì)樣本的預(yù)測(cè)精度,最終將動(dòng)態(tài)形成的多個(gè)弱學(xué)習(xí)器組合成強(qiáng)學(xué)習(xí)器。當(dāng)給定一個(gè)原始的訓(xùn)練集時(shí),首先Adaboost會(huì)賦予訓(xùn)練集的每個(gè)樣本相等的權(quán)重系數(shù),此時(shí)說(shuō)明訓(xùn)練集中的每個(gè)樣本的重要程度相等。接著使用這些樣本訓(xùn)練一個(gè)弱分類器,并對(duì)原始訓(xùn)練集的樣本進(jìn)行預(yù)測(cè)。根據(jù)預(yù)測(cè)情況更新樣本的權(quán)重值,提高預(yù)測(cè)正確的樣本的權(quán)重,并降低預(yù)測(cè)錯(cuò)誤的樣本的權(quán)重。?
華南理工大學(xué)碩士學(xué)位論文8一個(gè)強(qiáng)學(xué)習(xí)器。2.1.3Stacking集成框架概述Stacking[5]方法是指在組合集成多個(gè)基學(xué)習(xí)器時(shí)使用一個(gè)二級(jí)元學(xué)習(xí)器來(lái)綜合權(quán)衡各個(gè)基學(xué)習(xí)器的輸出。首先訓(xùn)練多個(gè)不同的基學(xué)習(xí)器,然后把不同的基學(xué)習(xí)器交叉驗(yàn)證訓(xùn)練過(guò)程中對(duì)于驗(yàn)證集的預(yù)測(cè)作為二級(jí)元學(xué)習(xí)器的輸入進(jìn)行再次訓(xùn)練,以得到一個(gè)最終的輸出。理論上,Stacking可以表示上面提到的兩種集成學(xué)習(xí)方法,只要采用合適的模型組合策略即可。一般來(lái)說(shuō),會(huì)使用Stacking作為提升預(yù)測(cè)結(jié)果的方法。圖2-2Stacking集成的常見(jiàn)流程Stacking方法的常見(jiàn)流程如圖2-2所示。首先使用不同的基模型對(duì)整個(gè)的訓(xùn)練集的不同子抽樣中進(jìn)行訓(xùn)練和學(xué)習(xí)。注意與Bagging不同的是,在Stacking中的子抽樣是不放回的子抽樣。然后將這些基模型預(yù)測(cè)得到的輸出作為第二層學(xué)習(xí)器的輸入,這里常常稱第二層學(xué)習(xí)器為元學(xué)習(xí)器。等待元學(xué)習(xí)器學(xué)習(xí)訓(xùn)練完畢我們便可以得到我們所需的最終模型。在對(duì)測(cè)試集進(jìn)行測(cè)試的時(shí)候也需要使用相同的流程對(duì)測(cè)試集進(jìn)行預(yù)訓(xùn)練,再交由元學(xué)習(xí)器比較學(xué)習(xí)效果。2.1.4集成學(xué)習(xí)的相關(guān)應(yīng)用集成學(xué)習(xí)作為當(dāng)前比較熱門的研究方向,被廣大學(xué)者應(yīng)用于各種研究中,以提高單獨(dú)學(xué)習(xí)器的預(yù)測(cè)性能和泛化能力。PouriyehS[6]等人比較了各類單獨(dú)學(xué)習(xí)器在對(duì)心臟疾病的圖像分類時(shí)的準(zhǔn)確性。對(duì)比了包括決策樹(shù)(DecisionTree)、樸素貝葉斯(NaiveBayes)、支持向量機(jī)(SupportVectorMachine)、K臨近(K-NearestNeighbor)等各種學(xué)習(xí)算法的分類性能。同時(shí)分別使用Bagging、Boosting和Stacking三種不同的方式對(duì)各類基學(xué)習(xí)器進(jìn)行集成,并通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)使用Boosting的結(jié)構(gòu)在其應(yīng)用場(chǎng)景中可以顯著地提升分類的準(zhǔn)確性以及性能。HeH[7]等人則提出了一個(gè)三層的Stacking模型應(yīng)用在用戶信用評(píng)級(jí)中。該模型通過(guò)對(duì)XG
【參考文獻(xiàn)】:
期刊論文
[1]基于LIBS技術(shù)的鋼鐵合金中Cr和Ni元素SVM定量分析方法研究[J]. 張瑩,李穎,谷艷紅,郭豪,黎娜. 光譜學(xué)與光譜分析. 2016(07)
碩士論文
[1]基于深度學(xué)習(xí)和集成學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[D]. 竇路路.東華大學(xué) 2018
本文編號(hào):3306596
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
常見(jiàn)LIBS分析實(shí)驗(yàn)裝置
。Bagging技術(shù)是學(xué)習(xí)結(jié)果集成的經(jīng)典例子。當(dāng)給定一個(gè)訓(xùn)練集,它首先會(huì)通過(guò)對(duì)整個(gè)訓(xùn)練集進(jìn)行Bootstrap的隨機(jī)抽樣、隨機(jī)子空間、擾動(dòng)、投影等方式來(lái)獲得若干個(gè)子抽樣訓(xùn)練集。且訓(xùn)練子集抽樣之間盡可能保持相對(duì)獨(dú)立。這樣,我們可以獲得數(shù)據(jù)集在相對(duì)獨(dú)立和穩(wěn)定的情況下的抽樣。然后對(duì)于這若干個(gè)訓(xùn)練集使用不同的基學(xué)習(xí)器進(jìn)行訓(xùn)練和學(xué)習(xí),再對(duì)于分類任務(wù)使用投票的方式、對(duì)于回歸任務(wù)使用算術(shù)平均或者加權(quán)平均的方式來(lái)形成組合的強(qiáng)學(xué)習(xí)器。最終再使用這些組合學(xué)習(xí)器對(duì)測(cè)試集中的樣本進(jìn)行預(yù)測(cè),以獲取這些測(cè)試集的對(duì)應(yīng)測(cè)試結(jié)果。圖2-1Bagging的常見(jiàn)流程結(jié)構(gòu)2.1.2Boosting集成框架概述Boosting是一種可以用于提升弱學(xué)習(xí)器的泛化能力的有監(jiān)督學(xué)習(xí)的集成算法。它最開(kāi)始由MichaelKearns[3]提出。其主要的思想是將弱學(xué)習(xí)器組裝成強(qiáng)學(xué)習(xí)器。在PAC學(xué)習(xí)框架中,一定可以使用某種方法將弱分類器組裝成一個(gè)強(qiáng)分類器。大多數(shù)的Boosting算法由一系列的弱學(xué)習(xí)器組成,使用迭代的方法,根據(jù)他們?cè)诜诸愔械臏?zhǔn)確率或者回歸預(yù)測(cè)中的誤差情況給予弱學(xué)習(xí)器不同的權(quán)重,同時(shí)會(huì)對(duì)使用的數(shù)據(jù)集進(jìn)行重新加權(quán),以此來(lái)強(qiáng)化對(duì)此前分類錯(cuò)誤或者預(yù)測(cè)誤差較大的數(shù)據(jù)的重新分類和預(yù)測(cè)。Adaboost[4]算法是學(xué)習(xí)過(guò)程集成的典型例子。在AdaBoost的訓(xùn)練中,算法會(huì)通過(guò)不斷動(dòng)態(tài)調(diào)整訓(xùn)練集中不同樣本的對(duì)應(yīng)信心值(權(quán)值)來(lái)體現(xiàn)學(xué)習(xí)器當(dāng)前對(duì)樣本的預(yù)測(cè)精度,最終將動(dòng)態(tài)形成的多個(gè)弱學(xué)習(xí)器組合成強(qiáng)學(xué)習(xí)器。當(dāng)給定一個(gè)原始的訓(xùn)練集時(shí),首先Adaboost會(huì)賦予訓(xùn)練集的每個(gè)樣本相等的權(quán)重系數(shù),此時(shí)說(shuō)明訓(xùn)練集中的每個(gè)樣本的重要程度相等。接著使用這些樣本訓(xùn)練一個(gè)弱分類器,并對(duì)原始訓(xùn)練集的樣本進(jìn)行預(yù)測(cè)。根據(jù)預(yù)測(cè)情況更新樣本的權(quán)重值,提高預(yù)測(cè)正確的樣本的權(quán)重,并降低預(yù)測(cè)錯(cuò)誤的樣本的權(quán)重。?
華南理工大學(xué)碩士學(xué)位論文8一個(gè)強(qiáng)學(xué)習(xí)器。2.1.3Stacking集成框架概述Stacking[5]方法是指在組合集成多個(gè)基學(xué)習(xí)器時(shí)使用一個(gè)二級(jí)元學(xué)習(xí)器來(lái)綜合權(quán)衡各個(gè)基學(xué)習(xí)器的輸出。首先訓(xùn)練多個(gè)不同的基學(xué)習(xí)器,然后把不同的基學(xué)習(xí)器交叉驗(yàn)證訓(xùn)練過(guò)程中對(duì)于驗(yàn)證集的預(yù)測(cè)作為二級(jí)元學(xué)習(xí)器的輸入進(jìn)行再次訓(xùn)練,以得到一個(gè)最終的輸出。理論上,Stacking可以表示上面提到的兩種集成學(xué)習(xí)方法,只要采用合適的模型組合策略即可。一般來(lái)說(shuō),會(huì)使用Stacking作為提升預(yù)測(cè)結(jié)果的方法。圖2-2Stacking集成的常見(jiàn)流程Stacking方法的常見(jiàn)流程如圖2-2所示。首先使用不同的基模型對(duì)整個(gè)的訓(xùn)練集的不同子抽樣中進(jìn)行訓(xùn)練和學(xué)習(xí)。注意與Bagging不同的是,在Stacking中的子抽樣是不放回的子抽樣。然后將這些基模型預(yù)測(cè)得到的輸出作為第二層學(xué)習(xí)器的輸入,這里常常稱第二層學(xué)習(xí)器為元學(xué)習(xí)器。等待元學(xué)習(xí)器學(xué)習(xí)訓(xùn)練完畢我們便可以得到我們所需的最終模型。在對(duì)測(cè)試集進(jìn)行測(cè)試的時(shí)候也需要使用相同的流程對(duì)測(cè)試集進(jìn)行預(yù)訓(xùn)練,再交由元學(xué)習(xí)器比較學(xué)習(xí)效果。2.1.4集成學(xué)習(xí)的相關(guān)應(yīng)用集成學(xué)習(xí)作為當(dāng)前比較熱門的研究方向,被廣大學(xué)者應(yīng)用于各種研究中,以提高單獨(dú)學(xué)習(xí)器的預(yù)測(cè)性能和泛化能力。PouriyehS[6]等人比較了各類單獨(dú)學(xué)習(xí)器在對(duì)心臟疾病的圖像分類時(shí)的準(zhǔn)確性。對(duì)比了包括決策樹(shù)(DecisionTree)、樸素貝葉斯(NaiveBayes)、支持向量機(jī)(SupportVectorMachine)、K臨近(K-NearestNeighbor)等各種學(xué)習(xí)算法的分類性能。同時(shí)分別使用Bagging、Boosting和Stacking三種不同的方式對(duì)各類基學(xué)習(xí)器進(jìn)行集成,并通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)使用Boosting的結(jié)構(gòu)在其應(yīng)用場(chǎng)景中可以顯著地提升分類的準(zhǔn)確性以及性能。HeH[7]等人則提出了一個(gè)三層的Stacking模型應(yīng)用在用戶信用評(píng)級(jí)中。該模型通過(guò)對(duì)XG
【參考文獻(xiàn)】:
期刊論文
[1]基于LIBS技術(shù)的鋼鐵合金中Cr和Ni元素SVM定量分析方法研究[J]. 張瑩,李穎,谷艷紅,郭豪,黎娜. 光譜學(xué)與光譜分析. 2016(07)
碩士論文
[1]基于深度學(xué)習(xí)和集成學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[D]. 竇路路.東華大學(xué) 2018
本文編號(hào):3306596
本文鏈接:http://sikaile.net/kejilunwen/huaxue/3306596.html
最近更新
教材專著