基于多種數(shù)學(xué)模型推斷損傷時(shí)間的比較和優(yōu)化的初步研究
發(fā)布時(shí)間:2021-12-12 11:29
目的:通過比較三種基于骨骼肌損傷修復(fù)相關(guān)的35個(gè)基因相對表達(dá)量建立損傷時(shí)間推斷的機(jī)器學(xué)習(xí)預(yù)測模型準(zhǔn)確性和泛化性,選出基于多維核酸指標(biāo)進(jìn)行骨骼肌損傷時(shí)間推斷的最佳數(shù)學(xué)模型,為機(jī)器學(xué)習(xí)算法建立數(shù)學(xué)模型用于推斷損傷時(shí)間在法醫(yī)學(xué)實(shí)踐應(yīng)用提供新的思路和方向。方法:65只Sprague-Dewley雄性成年大鼠,隨機(jī)分為對照組和損傷組(4h、8h、12h、16h、20h、24h、28h、32h、36h、40h、44h和48h,每組5只大鼠)建立大鼠骨骼肌挫傷動物模型。利用RT-qPCR檢測骨骼肌組織35個(gè)與損傷修復(fù)相關(guān)基因的相對表達(dá)量,得到建模數(shù)據(jù)集。通過Python(3,7版本)語言采用無監(jiān)督層次聚類算法對歸一化處理后的訓(xùn)練數(shù)據(jù)集進(jìn)行相關(guān)性分析后,通過線性判別分析對數(shù)據(jù)降維確定六種類別標(biāo)簽。而后,應(yīng)用遞歸特征消除算法分別聯(lián)合邏輯斯蒂回歸模型、隨機(jī)森林模型和多項(xiàng)式樸素貝葉斯模型建立三種有監(jiān)督數(shù)學(xué)模型,通過內(nèi)部留一法驗(yàn)證上述三種機(jī)器學(xué)習(xí)方法測試損傷時(shí)間推斷模型的準(zhǔn)確性。另外增加13只大鼠在相同損傷時(shí)間點(diǎn)上建立骨骼肌挫傷動物模型(隨機(jī)分為對照組與損傷組,每組1只大鼠),采用同樣的方法檢測35個(gè)基因指標(biāo)...
【文章來源】:山西醫(yī)科大學(xué)山西省
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
決策樹模型示意圖
山西醫(yī)科大學(xué)碩士學(xué)位論文15和最校有了ROC曲線后,可以引出曲線下面積(AreasundertheCurves,AUCs)的定義:ROC曲線下的面積,數(shù)值越大,表明模型的效能越好,對樣本的識別更準(zhǔn)確,每一個(gè)預(yù)測結(jié)果在ROC曲線中以一個(gè)點(diǎn)代表。如圖2所示。圖2ROC及AUCs示意圖注:圖中的黑色虛線對角線是隨機(jī)情況下的ROC曲線,對應(yīng)的AUCs值為0.5;紅色虛線是理想情況下的ROC曲線,此時(shí)模型具有完美的區(qū)分度,對應(yīng)的AUCs值為1;現(xiàn)實(shí)情況下的ROC曲線介于兩者之間,AUCs值一般大于0.5而小于1。1.6全文數(shù)據(jù)分析流程和建模思路在得到65只大鼠損傷后13個(gè)時(shí)間點(diǎn),與損傷修復(fù)相關(guān)的35個(gè)基因的相對表達(dá)量數(shù)據(jù)后,通過Min-Maxscaling對數(shù)據(jù)進(jìn)行預(yù)處理,縮放到[0,1]之間;經(jīng)LDA分析降維觀察后,確定分類標(biāo)簽;隨后采用留一法隨機(jī)分為訓(xùn)練組和驗(yàn)證組數(shù)據(jù)集,建立并比較三種數(shù)學(xué)模型,通過另一批大鼠對模型進(jìn)行外部測試;通過RFE算法進(jìn)行特征篩除后,篩選得出更適用于損傷時(shí)間推斷的數(shù)學(xué)模型,如圖3所示。
山西醫(yī)科大學(xué)碩士學(xué)位論文16圖3數(shù)據(jù)分析流程建模思路示意圖2結(jié)果2.1RNA質(zhì)量和PCR擴(kuò)增效率2.1.1總RNA的質(zhì)量經(jīng)Agilent2100電泳分析,所有實(shí)驗(yàn)樣本的OD260/280值均在1.8-2.2之間,結(jié)果見圖4;RNA的完整性檢測結(jié)果顯示RNAintegritynumber(RIN)值均大于7.0。說明RNA的純度及完整性均較好,均可用于后續(xù)實(shí)驗(yàn)。
本文編號:3536595
【文章來源】:山西醫(yī)科大學(xué)山西省
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【部分圖文】:
決策樹模型示意圖
山西醫(yī)科大學(xué)碩士學(xué)位論文15和最校有了ROC曲線后,可以引出曲線下面積(AreasundertheCurves,AUCs)的定義:ROC曲線下的面積,數(shù)值越大,表明模型的效能越好,對樣本的識別更準(zhǔn)確,每一個(gè)預(yù)測結(jié)果在ROC曲線中以一個(gè)點(diǎn)代表。如圖2所示。圖2ROC及AUCs示意圖注:圖中的黑色虛線對角線是隨機(jī)情況下的ROC曲線,對應(yīng)的AUCs值為0.5;紅色虛線是理想情況下的ROC曲線,此時(shí)模型具有完美的區(qū)分度,對應(yīng)的AUCs值為1;現(xiàn)實(shí)情況下的ROC曲線介于兩者之間,AUCs值一般大于0.5而小于1。1.6全文數(shù)據(jù)分析流程和建模思路在得到65只大鼠損傷后13個(gè)時(shí)間點(diǎn),與損傷修復(fù)相關(guān)的35個(gè)基因的相對表達(dá)量數(shù)據(jù)后,通過Min-Maxscaling對數(shù)據(jù)進(jìn)行預(yù)處理,縮放到[0,1]之間;經(jīng)LDA分析降維觀察后,確定分類標(biāo)簽;隨后采用留一法隨機(jī)分為訓(xùn)練組和驗(yàn)證組數(shù)據(jù)集,建立并比較三種數(shù)學(xué)模型,通過另一批大鼠對模型進(jìn)行外部測試;通過RFE算法進(jìn)行特征篩除后,篩選得出更適用于損傷時(shí)間推斷的數(shù)學(xué)模型,如圖3所示。
山西醫(yī)科大學(xué)碩士學(xué)位論文16圖3數(shù)據(jù)分析流程建模思路示意圖2結(jié)果2.1RNA質(zhì)量和PCR擴(kuò)增效率2.1.1總RNA的質(zhì)量經(jīng)Agilent2100電泳分析,所有實(shí)驗(yàn)樣本的OD260/280值均在1.8-2.2之間,結(jié)果見圖4;RNA的完整性檢測結(jié)果顯示RNAintegritynumber(RIN)值均大于7.0。說明RNA的純度及完整性均較好,均可用于后續(xù)實(shí)驗(yàn)。
本文編號:3536595
本文鏈接:http://sikaile.net/yixuelunwen/yundongyixue/3536595.html
最近更新
教材專著