【摘要】:對所測樣本的光譜信息建立化學計量學模型是光譜分析方法中重要的一步,模型的好壞直接決定了預(yù)測結(jié)果的準確度。本文主要研究的是化學計量學模型中的變量選擇模型以及定性分析模型。在光譜分析方法中采用的變量選擇模型大都基于偏最小二乘(partial least squares,PLS)模型,如基于PLS模型回歸系數(shù)的變量選擇算法(PLS with regression coefficient,PLS-BETA)、無信息變量消除算法(PLS with uninformative variable elimination,PLS-UVE)、變量重要性投影算法(PLS with variable importance in projection,PLS-VIP)。這些變量選擇算法都需要優(yōu)化模型的潛在變量(latent variables,LV)以及變量重要性指標的閾值。學者們通常根據(jù)模型的偏差指標來確定LV的取值,閾值的取值則是根據(jù)自身經(jīng)驗主觀選取的,該方法增大了校正模型過擬合的風險且并不客觀。本文提出利用排序差異和算法(sum of ranking differences,SRD)結(jié)合表征模型偏差或模型方差的多個模型評價指標來自動且客觀的確定LV及閾值的取值,并以VIP及UVE算法為變量選擇算法的代表,以公共的玉米近紅外(near infrared reflectance,NIR)光譜數(shù)據(jù)為實驗數(shù)據(jù)做了相關(guān)研究。研究結(jié)果表明該方法所選變量較傳統(tǒng)VIP(UVE)所選變量的可解釋性及所選變量對應(yīng)的預(yù)測精度均有了提升。并進一步研究了SRD輸入矩陣中的部分劣質(zhì)模型是否會對SRD算法最終所選的變量選擇算法模型造成影響。同時本文提出利用SRD算法結(jié)合分類模型對光譜數(shù)據(jù)進行定性分析,相較于單一的分類模型,該方法不需要選取分類模型的參數(shù)取值。并以偏最小二乘判別分析算法(partial least squares-discriminant analysis,PLS-DA)為分類模型的代表,以泥蚶的激光誘導擊穿光譜(Laser-induced breakdown spectroscopy,LIBS)數(shù)據(jù)為實驗數(shù)據(jù)做了相關(guān)研究,研究結(jié)果表明該方法的分類效果優(yōu)于單獨使用PLS-DA模型的分類效果。主要內(nèi)容如下:1.介紹了光譜分析方法的應(yīng)用、光譜分析方法中化學計量學模型的一些調(diào)參方法,以及近紅外光譜及激光誘導擊穿光譜的作用機理。同時介紹了線性模型、變量選擇方法,并重點介紹了本研究中用到的排序差異和算法(sum of ranking differences,SRD)以及表征模型偏差方向或模型方差方向的一些模型評價指標。2.提出利用SRD算法來選取變量選擇算法的參數(shù)取值,并以VIP(UVE)算法作為變量選擇算法的代表做了相關(guān)研究。以公共的玉米近紅外光譜數(shù)據(jù)為實驗數(shù)據(jù),利用表征模型不同方向的多個模型評價指標結(jié)合SRD算法從VIP(UVE)算法所有參數(shù)取值對應(yīng)的模型中自動且客觀的選取出一個最佳的模型,該模型對應(yīng)的參數(shù)取值即為VIP(UVE)模型參數(shù)的最終取值,并將該方法命名為:PLS-VIP-SRD(PLS-UVE-SRD)。同時按傳統(tǒng)的方法確立了VIP(UVE)模型的參數(shù)取值,其取值對應(yīng)的模型即為傳統(tǒng)的PLS-VIP(PLS-UVE)算法確立的模型。比較了PLS-VIP-SRD(PLS-UVE-SRD)與PLS-VIP(PLS-UVE)各自所選變量的可解釋性以及所選變量的預(yù)測精度。3.基于內(nèi)容2研究了SRD輸入矩陣中的部分劣質(zhì)模型是否會對SRD算法選取VIP(UVE)的參數(shù)取值造成影響。先根據(jù)一些指標從VIP(UVE)算法所有參數(shù)取值對應(yīng)的模型中初篩掉部分劣質(zhì)模型,再利用表征模型不同方向的多個模型評價指標結(jié)合SRD算法從VIP(UVE)算法對應(yīng)的剩余模型中自動且客觀地選取出一個最佳的模型。該模型對應(yīng)的參數(shù)取值即為SRD輸入矩陣中不含部分劣質(zhì)模型的PLS-VIP-SRD(PLS-UVE-SRD)模型參數(shù)的最終取值。4.提出利用SRD算法結(jié)合分類模型來對光譜數(shù)據(jù)做定性分析。該方法將分類模型所有可能參數(shù)取值對應(yīng)的模型作為SRD輸入矩陣的行,樣本的不同類別作為SRD輸入矩陣的列,從而避免了單獨使用分類模型所需的調(diào)參過程。并以偏最小二乘判別分析(PLS-DA)做為分類模型的代表,以泥蚶的LIBS數(shù)據(jù)做為實驗數(shù)據(jù)做了相關(guān)研究,并將該方法所實現(xiàn)的分類效果與單獨使用PLS-DA所實現(xiàn)的分類效果做了對比分析。
【圖文】:
溫州大學碩士學位論文偏差中的最小值,minFR是 SRD 輸入矩陣中各個模型分別對應(yīng)的排序序號的中的最小值。RRM值綜合考慮了交叉驗證得到的各模型對應(yīng)的排序序號的及排序序號的穩(wěn)定性,RRM值越小,模型越好。.3 模型的評價指標在評價一個模型的時候,不僅要考率到模型的偏差指標還要考慮到模型的(或模型復(fù)雜度)指標[9-13]。模型的偏差(bias)指模型對校正集的預(yù)測準確性型的方差(variance)指模型的精確性(不確定性)。正如圖 1-1 所示:對于模型來說,其偏差過小,方差必然過大,模型也會過擬合;方差過小,偏差過大,模型也會欠擬合[11]。

圖 2-2 PLS-VIP-SRD 的 SRD 輸入矩陣中各個模型對應(yīng)的 10 個 RRM 值e 2-2 10 RRM values corresponding to each model in the SRD input matrix of PLS-VIP-SRD 中,橫坐標表示各個模型的序號(第 1-第 13600 個模型),縱坐標表示序號(第 1-第 10 次實驗)?梢詮膱D 2-2 中看見,在橫坐標相同的情標的顏色幾乎沒有變化,即各個模型的RRM值在各次實驗中幾乎個輸入模型得到的 10 個RRM值的均值如圖 2-3 所示:SRD input model2000 4000 6000 8000 10000 1200001.5luearea 1 area 2 area 3
【學位授予單位】:溫州大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:O657.3;TS207.3
【參考文獻】
相關(guān)期刊論文 前10條
1 張德虎;田海清;武士鑰;劉超;陳亞莉;王輝;;河套蜜瓜糖度可見近紅外光譜特征波長提取方法研究[J];光譜學與光譜分析;2015年09期
2 樊書祥;黃文倩;李江波;郭志明;趙春江;;特征變量優(yōu)選在蘋果可溶性固形物近紅外便攜式檢測中的應(yīng)用[J];光譜學與光譜分析;2014年10期
3 吳鼎;海然;劉平;趙棟燁;劉佳宏;丁洪斌;;基于激光誘導擊穿光譜地溝油鑒別的初步探究[J];科學通報;2014年21期
4 高紅秀;金萍;周玉巖;石瑛;;近紅外光譜分析原理、檢測及定標技術(shù)簡介[J];中國科技信息;2014年Z1期
5 別軍象;趙宇峰;;遺傳算法在肉類近紅外光譜分析中波長選擇的應(yīng)用[J];計算機與數(shù)字工程;2014年01期
6 沈掌泉;盧必慧;單英杰;許紅衛(wèi);;基于變量選擇的偏最小二乘回歸法和田間行走式近紅外光譜進行土壤碳含量測定研究[J];光譜學與光譜分析;2013年07期
7 劉凱;王茜劏;趙華;肖銀龍;;激光誘導擊穿光譜在塑料分類中的應(yīng)用[J];光譜學與光譜分析;2011年05期
8 阮治綱;李彬;;近紅外光譜分析技術(shù)的原理及在中藥材中的應(yīng)用[J];藥物分析雜志;2011年02期
9 張軍;姜黎;陳哲;余謙;梁靜秋;王京華;;基于近紅外光譜技術(shù)成品汽油分類方法的研究[J];光譜學與光譜分析;2010年10期
10 鄔登巍;吳昀昭;馬宏瑞;;基于中紅外漫反射光譜的土壤重金屬元素含量預(yù)測研究[J];光譜學與光譜分析;2010年06期
,
本文編號:
2606472
本文鏈接:http://sikaile.net/projectlw/qgylw/2606472.html