基于集成學習與個性化推薦的miRNA相關預測研究
發(fā)布時間:2021-11-11 13:43
微RNA(microRNA,簡稱miRNA)雖然不能編碼蛋白質,但可以調控基因表達,在人體多種生命活動中有重要功能。研究表明,miRNA與多種人類疾病的發(fā)生發(fā)展密切相關,并且miRNA是可行的小分子藥物靶點。疾病及小分子藥物相關的miRNA研究對于疾病發(fā)生發(fā)展機制的理解、疾病的診斷和藥物的研發(fā)均具有重要意義。miRNA-疾病、小分子藥物-miRNA關聯預測模型可以識別出最有可能的潛在關聯,對于生物實驗有重要的指導作用。本文分別基于集成學習和個性化推薦方法構建模型預測疾病、小分子藥物相關的miRNA,主要的研究內容如下:(1)提出了基于決策樹集成的miRNA與疾病的關聯預測模型(Ensemble of Decision Tree based MiRNA-Disease Association prediction,簡稱EDTMDA)。首先基于miRNA-疾病關聯信息和整合的相似性信息分別構建miRNA的特征和疾病的特征。然后,通過隨機選取負樣本、miRNA特征和疾病特征,以及特征降維處理,構建了多個決策樹。最后將這些決策樹預測值的平均值作為miRNA-疾病關聯分數。相比于單個學習器方法,...
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:77 頁
【學位級別】:碩士
【部分圖文】:
EDTMDA算法流程圖
碩士學位論文20候選樣本集預測打分,如果測試樣本的排名超過給定的閾值,則認為是成功的預測。本文做了100次5折交叉驗證實驗來減少隨機劃分已知關聯帶來的結果偏差。EDTMDA的AUC的平均值及標準差為0.9192+/-0.0009,明顯優(yōu)于其他預測模型(見表2-2)。圖2-2EDTMDA與其他模型在LOOCV中的性能對比Figure2-2PerformancecomparisonbetweenEDTMDAandothermodelsinLOOCV表2-2EDTMDA與其他模型在5折交叉驗證中的性能對比Table2-2PerformancecomparisonbetweenEDTMDAandothermodelsin5-foldcrossvalidation模型AUC的平均值及標準差EDTMDA0.9192+/-0.0009LRSSLMDA0.9181+/-0.0004PBMDA0.9172+/-0.0007MDHGI0.8794+/-0.0021MCMDA0.8767+/-0.0011MaxFlow0.8579+/-0.001RLSMDA0.8569+/-0.0020HDMP0.8342+/-0.0010WBSMDA0.8185+/-0.00092.4.2案例研究為了進一步評估EDTMDA預測疾病相關miRNA的性能,本文針對腎腫瘤(KidneyNeoplasms)、乳腺腫瘤(BreastNeoplasms)和肝細胞腫瘤(CarcinomaHepatocellular)三種疾病實施不同類型的案例研究實驗。第一種類型的案例研究是針對腎腫瘤進行的。腎腫瘤占全球所有腫瘤的2%,
3基于貝葉斯個性化排序預測miRNA與疾病的關聯29,miRNA和miRNA的關系,可以定義為:,,()=,,。此外,BPR算法假設先驗概率()服從均值為0,方差為的正太分布,即()~(0,)。綜上,BPR的優(yōu)化目標準則BPR-OPT可寫為:=∏(|>)∈∝∏(>|)∈()=∏(>|)(,,)∈()=∑(,,())(,,)∈+()=∑(,,())(,,)∈‖‖2=∑(,,)(‖‖2+‖‖2)(,,)∈(35)其中,和是正則化參數。雖然通過最大化BPR-OPT準則可以獲得疾病最優(yōu)隱向量和miRNA最優(yōu)隱向量,對miRNA與疾病關聯進行預測,但仍有一些問題需要解決。本文從以下三個方面改進BPR算法,建立BRMDA模型預測miRNA與疾病的關聯(算法流程見圖3-1)。圖3-1BRMDA算法流程圖Figure3-1TheflowchartofBRMDA(1)增加miRNA的相似性信息和疾病的相似性信息
【參考文獻】:
期刊論文
[1]Epidemiology of esophageal cancer[J]. Yuwei Zhang. World Journal of Gastroenterology. 2013(34)
本文編號:3488959
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:77 頁
【學位級別】:碩士
【部分圖文】:
EDTMDA算法流程圖
碩士學位論文20候選樣本集預測打分,如果測試樣本的排名超過給定的閾值,則認為是成功的預測。本文做了100次5折交叉驗證實驗來減少隨機劃分已知關聯帶來的結果偏差。EDTMDA的AUC的平均值及標準差為0.9192+/-0.0009,明顯優(yōu)于其他預測模型(見表2-2)。圖2-2EDTMDA與其他模型在LOOCV中的性能對比Figure2-2PerformancecomparisonbetweenEDTMDAandothermodelsinLOOCV表2-2EDTMDA與其他模型在5折交叉驗證中的性能對比Table2-2PerformancecomparisonbetweenEDTMDAandothermodelsin5-foldcrossvalidation模型AUC的平均值及標準差EDTMDA0.9192+/-0.0009LRSSLMDA0.9181+/-0.0004PBMDA0.9172+/-0.0007MDHGI0.8794+/-0.0021MCMDA0.8767+/-0.0011MaxFlow0.8579+/-0.001RLSMDA0.8569+/-0.0020HDMP0.8342+/-0.0010WBSMDA0.8185+/-0.00092.4.2案例研究為了進一步評估EDTMDA預測疾病相關miRNA的性能,本文針對腎腫瘤(KidneyNeoplasms)、乳腺腫瘤(BreastNeoplasms)和肝細胞腫瘤(CarcinomaHepatocellular)三種疾病實施不同類型的案例研究實驗。第一種類型的案例研究是針對腎腫瘤進行的。腎腫瘤占全球所有腫瘤的2%,
3基于貝葉斯個性化排序預測miRNA與疾病的關聯29,miRNA和miRNA的關系,可以定義為:,,()=,,。此外,BPR算法假設先驗概率()服從均值為0,方差為的正太分布,即()~(0,)。綜上,BPR的優(yōu)化目標準則BPR-OPT可寫為:=∏(|>)∈∝∏(>|)∈()=∏(>|)(,,)∈()=∑(,,())(,,)∈+()=∑(,,())(,,)∈‖‖2=∑(,,)(‖‖2+‖‖2)(,,)∈(35)其中,和是正則化參數。雖然通過最大化BPR-OPT準則可以獲得疾病最優(yōu)隱向量和miRNA最優(yōu)隱向量,對miRNA與疾病關聯進行預測,但仍有一些問題需要解決。本文從以下三個方面改進BPR算法,建立BRMDA模型預測miRNA與疾病的關聯(算法流程見圖3-1)。圖3-1BRMDA算法流程圖Figure3-1TheflowchartofBRMDA(1)增加miRNA的相似性信息和疾病的相似性信息
【參考文獻】:
期刊論文
[1]Epidemiology of esophageal cancer[J]. Yuwei Zhang. World Journal of Gastroenterology. 2013(34)
本文編號:3488959
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3488959.html