基于最小角回歸與GA-PLS的NIR光譜變量選擇方法
發(fā)布時間:2018-05-16 15:02
本文選題:近紅外光譜 + 最小角回歸。 參考:《光譜學與光譜分析》2017年06期
【摘要】:近紅外(NIR)光譜一般具有較多的波長變量數(shù),對其直接或間接地進行變量選擇是提高模型穩(wěn)定性能及預測性能的關鍵。最小角回歸(LAR)是一種相對較新和有效的機器學習算法,常用于進行回歸分析和變量選擇。面向光譜建模應用,提出一種LAR結合遺傳偏最小二乘法(GA-PLS)的變量選擇方法,可有效篩選出少數(shù)特征波長點。首先在全光譜區(qū)利用LAR消除變量間的共線性得到初篩波長點,然后用GA-PLS對LAR篩選出的波長點進一步優(yōu)選從而得到最終建模用的特征波長點。為驗證本文方法的有效性,以藥片和汽油的近紅外光譜回歸分析作為應用案例,對原光譜進行預處理后,采用該方法進行變量篩選,然后分別建模其中的活性成分含量和C10含量。結果顯示,在這兩個應用中,最終優(yōu)化得到的特征波長點數(shù)均只需七個,而兩者的預測決定系數(shù)R2p分別達到0.933 9和0.951 9,與全光譜、無信息變量消除法(UVE)和連續(xù)投影算法(SPA)等方法相比,特征波長點更少,同時R2p和預測均方根誤差RMSEP值更優(yōu)。因此,LAR結合GA-PLS,能有效地從近紅外光譜中選擇出信息變量從而減少建模波數(shù),提高預測精度,擁有較好的模型解釋性。該方法可為特定領域的專用光譜儀設計提供有效的波長篩選工具。
[Abstract]:NIR spectra generally have a large number of wavelength variables. The selection of NIR spectra directly or indirectly is the key to improve the stability and prediction performance of the model. Minimum angle regression algorithm is a relatively new and effective machine learning algorithm, which is often used for regression analysis and variable selection. A variable selection method based on LAR combined with genetic partial least square method (GA-PLS) is proposed for spectral modeling, which can effectively screen a few characteristic wavelength points. In the whole spectrum region, the initial wavelength points are obtained by using LAR to eliminate the collinearity between variables, and then the characteristic wavelength points for the final modeling are obtained by the further optimization of the wavelength points selected by LAR by using GA-PLS. In order to verify the effectiveness of this method, the near infrared spectral regression analysis of tablets and gasoline was used as an application case. After pretreatment of the original spectrum, the method was used to screen the variables. Then, the content of active components and the content of C _ (10) were modeled respectively. The results show that, in these two applications, the number of characteristic wavelength points obtained by the final optimization is only seven, and the predictive determination coefficients R2p of the two methods are 0.933 9 and 0.951 9, respectively, which are in agreement with the full spectrum. Compared with the continuous projection algorithm (spa) and without information variable elimination (UVEE), there are fewer characteristic wavelength points, and R2P and the RMSEP value of RMS error are better. Therefore, Lar combined with GA-PLS can effectively select information variables from NIR spectra, thus reducing modeling wavenumber, improving prediction accuracy and having better model interpretation. This method can provide an effective wavelength screening tool for the design of special spectrometers in specific fields.
【作者單位】: 桂林電子科技大學電子工程與自動化學院;北京郵電大學自動化學院;
【基金】:國家自然科學基金項目(21365008,61562013) 廣西壯族自治區(qū)自然科學基金項目(2013GXNSFBA019279) 桂林電子科技大學研究生創(chuàng)新項目(GDYCSZ201474,GDYCSZ201478)資助
【分類號】:O657.33;R737.31
【相似文獻】
相關期刊論文 前2條
1 吳迪;汪志平;何勇;周子立;;iPLS-SPA變量選擇方法在螺旋藻粉無損檢測中的應用[J];農(nóng)業(yè)工程學報;2009年S2期
2 ;[J];;年期
相關會議論文 前3條
1 李洪東;梁逸曾;;高維數(shù)據(jù)變量選擇新方法研究[A];中國化學會第27屆學術年會第15分會場摘要集[C];2010年
2 徐登;范偉;梁逸曾;;紫外光譜結合變量選擇和偏最小二乘回歸同時測定水中重金屬鎘、鋅、鈷[A];中國化學會第29屆學術年會摘要集——第19分會:化學信息學與化學計量學[C];2014年
3 梁逸曾;李洪東;許青松;曹東升;張志敏;;灰色化學建模與模型集群分析——兼論過擬合、穩(wěn)健估計、變量選擇與模型評價[A];中國化學會第27屆學術年會第15分會場摘要集[C];2010年
相關博士學位論文 前2條
1 唐凱臨;變量選擇和變換的新方法研究[D];同濟大學;2008年
2 唐麗娟;定量結構活性相關性研究與高維微陣列數(shù)據(jù)分析中的化學計量學新算法[D];湖南大學;2009年
相關碩士學位論文 前1條
1 龍旭霞;基于互信息的變量選擇方法研究[D];中南大學;2013年
,本文編號:1897335
本文鏈接:http://sikaile.net/yixuelunwen/fuchankeerkelunwen/1897335.html
最近更新
教材專著