模式識別在復雜基體樣品直接質譜快速分析中的應用研究
發(fā)布時間:2024-03-01 04:32
隨著計算機技術和檢測技術的持續(xù)進步和不斷發(fā)展,獲得的儀器數據正在迅速增長,各類的數據庫也層出不窮。如何從大量檢測數據中發(fā)現事物間所存在的特征和規(guī)律是當代學者亟待解決的主要課題。模式識別是當前對采集后的數據信息進行分析并挖掘的最佳方法之一,并已在眾多領域得到廣泛應用。本文利用偏最小二乘法線性判別分析(PLS-LDA)、隨機森林(RF)、偏最小二乘法(PLS)、主成分分析(PCA)等模式識別方法分別對肺癌、水質和茶葉的質譜數據展開模式識別分析,同時建立了相應的分類識別模型,取得了較好的結果,為模式識別方法在質譜數據中的應用提供了新的研究思路。本文的主要研究內容包括:(1)建立了一種基于偏最小二乘法線性判別分析(PLS-LDA)的肺癌診斷模型。采用電噴霧萃取電離質譜對肺癌組織和正常組織進行直接質譜分析,結合偏最小二乘法線性判別分析(PLS-LDA)對肺癌組織和正常組織的質譜數據進行模式判別,并對組織樣本中存在的潛在生物標記物進行了鑒別和分析,為未來進一步探究肺癌的發(fā)生、生長規(guī)律及尋找潛在的生物標記物奠定基礎。(2)建立了兩種基于隨機森林(RF)的水質直接質譜分類模型。對五類地表水進行直接質譜...
【文章頁數】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 模式識別的常用方法及應用
1.2.1 主成分分析(Principal component analysis,PCA)
1.2.2 偏最小二乘法(Partial Least Squares,PLS)
1.2.3 線性判別分析(Linear Discriminant Analysis,LDA)
1.2.4 隨機森林算法(Random forest,RF)
1.2.5 人工神經網絡(Artificial Neural Networks,ANN)
1.2.6 支持向量機算法(Support Vector Machine,SVM)
1.2.7 聚類算法
1.2.7.1 k-means聚類算法
1.2.7.2 層次聚類算法
1.2.7.3 自組織神經映射(Self-organizing Feature Map,SOM)聚類算法
1.2.7.4 模糊C均值(Fuzzy C-means,FCM)聚類算法
1.3 本文的主要研究內容和創(chuàng)新點
第二章 基于偏最小二乘法線性判別分析(PLS-LDA)建立的肺癌診斷模型
2.1 引言
2.2 實驗部分
2.2.1 儀器試劑
2.2.2 實驗組織樣品的收集及制備
2.2.3 實驗參數及條件
2.2.4 實驗方法
2.2.5 數據處理
2.3 結果與討論
2.3.1 實驗條件優(yōu)化
2.3.2 肺癌組織樣品的一級質譜分析
2.3.3 偏最小二乘法線性判別分析(PLS-LDA)
2.4 小結
第三章 基于隨機森林算法(RF)建立的水質信息模型
3.1 引言
3.2 實驗部分
3.2.1 儀器與試劑
3.2.2 樣本的采集及制備
3.2.3 EESI工作原理及其實驗參數
3.2.4 TOF-MS工作原理
3.2.5 數據處理
3.3 結果與討論
3.3.1 水樣的質譜分析
3.3.1.1 五類水質水樣的EESI-TOF-MS一級掃描譜圖
3.3.1.2 不同含量的重金屬Cu離子水樣的EESI-LTQ-MS一級掃描譜圖
3.3.2 隨機森林(RF)分析模型
3.3.2.1 EESI-TOF-MS實驗下的五類水質水樣的隨機森林(RF)模式識別模型
3.3.2.2 EESI-LTQ-MS實驗下的五類水質水樣的隨機森林(RF)模式識別模型
3.3.2.3 三類不同含量重金屬Cu離子水樣的隨機森林(RF)模式識別模型
3.4 小結
第四章 基于偏最小二乘法(PLS)和隨機森林算法(RF)建立的茶葉分類模型
4.1 引言
4.2 實驗部分
4.2.1 儀器與試劑
4.2.2 實驗條件及參數
4.2.3 數據處理
4.3 結果與討論
4.3.1 茶葉品種的鑒別
4.3.1.1 基于偏最小二乘法(PLS)建立的茶葉品種模式識別模型
4.3.1.2 基于隨機森林算法(RF)建立的茶葉品種模式識別模型
4.3.2 茶葉產地的鑒別
4.3.2.1 基于偏最小二乘法(PLS)建立的茶葉產地模式識別模型
4.3.2.2 基于隨機森林算法(RF)建立的茶葉產地模式識別模型
4.4 小結
第五章 總結與展望
5.1 總結
5.2 展望
參考文獻
附錄
致謝
本文編號:3915427
【文章頁數】:69 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.2 模式識別的常用方法及應用
1.2.1 主成分分析(Principal component analysis,PCA)
1.2.2 偏最小二乘法(Partial Least Squares,PLS)
1.2.3 線性判別分析(Linear Discriminant Analysis,LDA)
1.2.4 隨機森林算法(Random forest,RF)
1.2.5 人工神經網絡(Artificial Neural Networks,ANN)
1.2.6 支持向量機算法(Support Vector Machine,SVM)
1.2.7 聚類算法
1.2.7.1 k-means聚類算法
1.2.7.2 層次聚類算法
1.2.7.3 自組織神經映射(Self-organizing Feature Map,SOM)聚類算法
1.2.7.4 模糊C均值(Fuzzy C-means,FCM)聚類算法
1.3 本文的主要研究內容和創(chuàng)新點
第二章 基于偏最小二乘法線性判別分析(PLS-LDA)建立的肺癌診斷模型
2.1 引言
2.2 實驗部分
2.2.1 儀器試劑
2.2.2 實驗組織樣品的收集及制備
2.2.3 實驗參數及條件
2.2.4 實驗方法
2.2.5 數據處理
2.3 結果與討論
2.3.1 實驗條件優(yōu)化
2.3.2 肺癌組織樣品的一級質譜分析
2.3.3 偏最小二乘法線性判別分析(PLS-LDA)
2.4 小結
第三章 基于隨機森林算法(RF)建立的水質信息模型
3.1 引言
3.2 實驗部分
3.2.1 儀器與試劑
3.2.2 樣本的采集及制備
3.2.3 EESI工作原理及其實驗參數
3.2.4 TOF-MS工作原理
3.2.5 數據處理
3.3 結果與討論
3.3.1 水樣的質譜分析
3.3.1.1 五類水質水樣的EESI-TOF-MS一級掃描譜圖
3.3.1.2 不同含量的重金屬Cu離子水樣的EESI-LTQ-MS一級掃描譜圖
3.3.2 隨機森林(RF)分析模型
3.3.2.1 EESI-TOF-MS實驗下的五類水質水樣的隨機森林(RF)模式識別模型
3.3.2.2 EESI-LTQ-MS實驗下的五類水質水樣的隨機森林(RF)模式識別模型
3.3.2.3 三類不同含量重金屬Cu離子水樣的隨機森林(RF)模式識別模型
3.4 小結
第四章 基于偏最小二乘法(PLS)和隨機森林算法(RF)建立的茶葉分類模型
4.1 引言
4.2 實驗部分
4.2.1 儀器與試劑
4.2.2 實驗條件及參數
4.2.3 數據處理
4.3 結果與討論
4.3.1 茶葉品種的鑒別
4.3.1.1 基于偏最小二乘法(PLS)建立的茶葉品種模式識別模型
4.3.1.2 基于隨機森林算法(RF)建立的茶葉品種模式識別模型
4.3.2 茶葉產地的鑒別
4.3.2.1 基于偏最小二乘法(PLS)建立的茶葉產地模式識別模型
4.3.2.2 基于隨機森林算法(RF)建立的茶葉產地模式識別模型
4.4 小結
第五章 總結與展望
5.1 總結
5.2 展望
參考文獻
附錄
致謝
本文編號:3915427
本文鏈接:http://sikaile.net/kejilunwen/huaxue/3915427.html
教材專著