代謝組學(xué)數(shù)據(jù)挖掘關(guān)鍵問題研究
發(fā)布時(shí)間:2021-04-08 01:23
代謝組學(xué)是上世紀(jì)七八十年代發(fā)展起來的一門科學(xué),是繼基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)之后誕生的一門新的交叉學(xué)科,也是系統(tǒng)生物學(xué)中的一個(gè)重要組成部分,近年來已經(jīng)迅速成為生命科學(xué)研究的熱點(diǎn)之一。與各種組學(xué)類似,代謝組學(xué)也是一門融合分析化學(xué)、化學(xué)計(jì)量學(xué)以及生理病理學(xué)等領(lǐng)域知識(shí)的交叉學(xué)科。完整的代謝組學(xué)研究過程包括樣品的采集、預(yù)處理、數(shù)據(jù)的采集和數(shù)據(jù)的分析及解釋等步驟。研究平臺(tái)主要由分析技術(shù)平臺(tái)和數(shù)據(jù)分析平臺(tái)構(gòu)成。數(shù)據(jù)分析是代謝組學(xué)研究的重要組成部分,也是揭示生物規(guī)律的關(guān)鍵步驟。分析技術(shù)精密性的提高,各種分析平臺(tái)視窗的擴(kuò)大,批量生物樣本檢測(cè)需求都大大增加了輸出數(shù)據(jù)的量和復(fù)雜度,給后續(xù)分析和挖掘帶來了極大的負(fù)擔(dān)。本論文就代謝組學(xué)數(shù)據(jù)挖掘領(lǐng)域的幾個(gè)關(guān)鍵問題進(jìn)行研究討論,主要內(nèi)容如下:1、基于MATLAB平臺(tái),將四種分類器,偏最小二乘(Partial LeastSquares regression,PLS),線性判別式分析(Linear discriminantanalysis,LDA),支持向量機(jī)(Support vector machines,SVM)以及隨機(jī)森林(Random forest,RF)...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
代謝組學(xué)研究流程圖
圖 2- 1 SVM 原理 意圖Fig.2-1 SVM principle diagramF)RF,Leo Breiman 2001)在機(jī)器學(xué)習(xí)中分類器,并且其輸出的類別是由個(gè)別樹型原理前需要了解另外兩個(gè)內(nèi)容:決策組合而成,每個(gè)決策樹都參與當(dāng)前分類分類方法,是以實(shí)例(又稱為訓(xùn)練集)為來,在機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)等領(lǐng)域得到了點(diǎn)表示在一個(gè)變量上的測(cè)試,每個(gè)分支類別[51]。p aggregating)算法[52]是由 Leo Breiman
代謝組學(xué)數(shù)據(jù)挖掘關(guān)鍵問題研究 第二章 典型機(jī)器學(xué)習(xí)算法在代謝組學(xué)數(shù)據(jù)分析中的應(yīng)用和比較2.4.1.2. GC-MS 檢測(cè)所有的尿液(CRC)和血清(LC)樣本首先經(jīng)過化學(xué)衍生化,隨后由 GC-MS和 GC-TOFMS 盡行分析。具體操作參考文獻(xiàn)[22]。圖 2- 2 為兩個(gè)數(shù)據(jù)集的總離子圖(Total Ion Current,TIC),A 為腸癌病人尿液,檢測(cè)儀器為 GC-QMS(GasChromatography Quadrupol Mass),B 為肝癌病人血清樣本,檢測(cè)儀器為GC-TOFMS。
【參考文獻(xiàn)】:
期刊論文
[1]基于SVM-RFE-SFS的基因選擇方法[J]. 游偉,李樹濤,譚明奎. 中國生物醫(yī)學(xué)工程學(xué)報(bào). 2010(01)
[2]鉤藤多動(dòng)合劑的藥效作用及用代謝物組學(xué)方法研究其生化機(jī)制[J]. 黃玉榮,魏廣力,龍紅,肖淑華,王淑芳,劉昌孝. 中草藥. 2005(03)
[3]數(shù)據(jù)挖掘分類算法綜述[J]. 談恒貴,王文杰,李游華. 微型機(jī)與應(yīng)用. 2005(02)
[4]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文. 計(jì)算機(jī)應(yīng)用研究. 2001(08)
碩士論文
[1]隨機(jī)森林及其在色譜指紋中的應(yīng)用研究[D]. 孫烈.大連理工大學(xué) 2009
本文編號(hào):3124575
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
代謝組學(xué)研究流程圖
圖 2- 1 SVM 原理 意圖Fig.2-1 SVM principle diagramF)RF,Leo Breiman 2001)在機(jī)器學(xué)習(xí)中分類器,并且其輸出的類別是由個(gè)別樹型原理前需要了解另外兩個(gè)內(nèi)容:決策組合而成,每個(gè)決策樹都參與當(dāng)前分類分類方法,是以實(shí)例(又稱為訓(xùn)練集)為來,在機(jī)器學(xué)習(xí)、知識(shí)發(fā)現(xiàn)等領(lǐng)域得到了點(diǎn)表示在一個(gè)變量上的測(cè)試,每個(gè)分支類別[51]。p aggregating)算法[52]是由 Leo Breiman
代謝組學(xué)數(shù)據(jù)挖掘關(guān)鍵問題研究 第二章 典型機(jī)器學(xué)習(xí)算法在代謝組學(xué)數(shù)據(jù)分析中的應(yīng)用和比較2.4.1.2. GC-MS 檢測(cè)所有的尿液(CRC)和血清(LC)樣本首先經(jīng)過化學(xué)衍生化,隨后由 GC-MS和 GC-TOFMS 盡行分析。具體操作參考文獻(xiàn)[22]。圖 2- 2 為兩個(gè)數(shù)據(jù)集的總離子圖(Total Ion Current,TIC),A 為腸癌病人尿液,檢測(cè)儀器為 GC-QMS(GasChromatography Quadrupol Mass),B 為肝癌病人血清樣本,檢測(cè)儀器為GC-TOFMS。
【參考文獻(xiàn)】:
期刊論文
[1]基于SVM-RFE-SFS的基因選擇方法[J]. 游偉,李樹濤,譚明奎. 中國生物醫(yī)學(xué)工程學(xué)報(bào). 2010(01)
[2]鉤藤多動(dòng)合劑的藥效作用及用代謝物組學(xué)方法研究其生化機(jī)制[J]. 黃玉榮,魏廣力,龍紅,肖淑華,王淑芳,劉昌孝. 中草藥. 2005(03)
[3]數(shù)據(jù)挖掘分類算法綜述[J]. 談恒貴,王文杰,李游華. 微型機(jī)與應(yīng)用. 2005(02)
[4]數(shù)據(jù)挖掘中決策樹算法的探討[J]. 唐華松,姚耀文. 計(jì)算機(jī)應(yīng)用研究. 2001(08)
碩士論文
[1]隨機(jī)森林及其在色譜指紋中的應(yīng)用研究[D]. 孫烈.大連理工大學(xué) 2009
本文編號(hào):3124575
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3124575.html
最近更新
教材專著