基于異質(zhì)性網(wǎng)絡(luò)鏈路預(yù)測算法的非編碼RNA-疾病相關(guān)性預(yù)測研究
發(fā)布時(shí)間:2020-07-28 20:07
【摘要】:近十幾年來,非編碼RNA(non-coding RNA,ncRNA)的研究在生命科學(xué)領(lǐng)域中占據(jù)了非常重要的地位。其中,ncRNA-疾病的相關(guān)性研究直接關(guān)乎人類健康,深入研究ncRNA-疾病的相關(guān)性有助于幫助人們在分子水平上理解疾病的發(fā)病機(jī)制,對疾病的預(yù)防、治療、預(yù)后都具有十分重要的意義。隨著高通量實(shí)驗(yàn)技術(shù)的快速發(fā)展,ncRNA-疾病相關(guān)性數(shù)據(jù)得到快速積累,并建立了一些可靠性高的公開數(shù)據(jù)庫。這些數(shù)據(jù)庫不僅提供了實(shí)驗(yàn)支持的ncRNA-疾病關(guān)系的系統(tǒng)概述,還涉及相關(guān)的生物學(xué)信息,極大地推動了ncRNA-疾病相關(guān)性研究的進(jìn)展。研究者充分利用現(xiàn)有實(shí)驗(yàn)數(shù)據(jù),設(shè)計(jì)高效而精確的計(jì)算方法預(yù)測出潛在的ncRNA-疾病相關(guān)性,用于指導(dǎo)后續(xù)實(shí)驗(yàn),可以顯著降低生物實(shí)驗(yàn)所需成本。然而,現(xiàn)有的大部分計(jì)算方法僅基于已有數(shù)據(jù)庫中ncRNA-疾病相互作用信息構(gòu)建ncRNA-疾病關(guān)聯(lián)網(wǎng)絡(luò),并沒有考慮到生物網(wǎng)絡(luò)本身的異質(zhì)性特征,忽視了 ncRNA-疾病關(guān)聯(lián)網(wǎng)絡(luò)中相關(guān)的生物信息。本文針對ncRNA-疾病相關(guān)性研究中的2個(gè)重要方向——小分子RNA(microRNA,miRNA)-疾病的相關(guān)性和長非編碼RNA(long non-coding RNA,IncRNA)-疾病相關(guān)性進(jìn)行研究,具體內(nèi)容如下:1、在已知miRNA-疾病相互作用數(shù)據(jù)基礎(chǔ)上,通過引入大量miRNA-靶基因(target)相關(guān)性數(shù)據(jù),構(gòu)建出“disease-miRNA-target”異質(zhì)性網(wǎng)絡(luò),并在此網(wǎng)絡(luò)上提出miRNA-疾病相關(guān)性預(yù)測算法DMTHNDM(disease-miRNA-target heterogeneous network for disease-related miRNA)用于潛在的 miRNA-疾病相關(guān)性預(yù)測。該網(wǎng)絡(luò)中,靶基因作為miRNA-疾病相關(guān)性的協(xié)同預(yù)測標(biāo)簽,極大地豐富了網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。通過將DMTHNDM與現(xiàn)有miRNA-疾病相關(guān)性預(yù)測工作進(jìn)行性能對比,結(jié)果顯示本文方法不僅更好地描述了 miRNA-疾病關(guān)聯(lián)網(wǎng)絡(luò)的異質(zhì)性,同時(shí)有效地提高了潛在miRNA-疾病相關(guān)性的預(yù)測性能。2、結(jié)合IncRNA-疾病相互作用信息以及基因(gene)-疾病相互作用信息,構(gòu)建了“IncRNA-disease-gene”異質(zhì)性網(wǎng)絡(luò)。然而,現(xiàn)有實(shí)驗(yàn)驗(yàn)證的IncRNA-疾病相互作用數(shù)據(jù)較少,以致網(wǎng)絡(luò)稀疏,孤立節(jié)點(diǎn)較多。為解決該問題,本文進(jìn)一步收集了 IncRNA表達(dá)譜信息與疾病的表型信息,由此計(jì)算出IncRNA表達(dá)譜相似性及疾病語義相似性。通過整合以上四類信息,構(gòu)建IncRNA-疾病相關(guān)性的異質(zhì)性網(wǎng)絡(luò),并在此基礎(chǔ)上提出一種改進(jìn)的資源傳播算法TPGLDA(Tripartite Graph for LncRNA-Disease Association)用于預(yù)測潛在的 IncRNA-疾病相關(guān)性。通過與現(xiàn)有方法的對比,TPGLDA不僅解決了孤立節(jié)點(diǎn)問題,同時(shí)顯著提升了性能。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R341
【圖文】:
平臺對外公開,研宄者可直接將實(shí)驗(yàn)結(jié)果提交給ArrayExpress或從NCBI邋Gene逡逑Expression邋Omnibus數(shù)據(jù)庫導(dǎo)入,經(jīng)過計(jì)算機(jī)過濾和人工審核驗(yàn)證后,實(shí)時(shí)更逡逑新。因此,該數(shù)據(jù)庫有效解決了以往因人工收集導(dǎo)致的數(shù)據(jù)數(shù)量和種類的遺逡逑漏,提高了數(shù)據(jù)的準(zhǔn)確性并令研宄成果與時(shí)俱進(jìn)。該數(shù)據(jù)庫資源十分豐富,包逡逑含人類、家鼠、擬南芥等多個(gè)物種,有利于不同方向?qū)W者進(jìn)一步研宄。本文使逡逑用的IncRNA表達(dá)譜數(shù)據(jù)集來源于ArrayExpress數(shù)據(jù)庫,通過對16個(gè)人類組織逡逑個(gè)體和混合物的高通量測序進(jìn)行轉(zhuǎn)錄分析,最終下載得到17426個(gè)IncRNA在逡逑16個(gè)人類組織下的表達(dá)譜。逡逑2.3.2疾病表型特征數(shù)據(jù)來源逡逑現(xiàn)有研[傊な擔(dān)膊∮鏌逑嗨菩鑰捎行У卦擻糜讜げ馇痹詰模睿悖遙危粒膊″義瞎叵擔(dān)ǎ茫瑁澹,邋201(dān)誨澹茫瑁澹睿澹澹翦澹幔歟,邋201(dān)誨澹兀酰幔睿澹翦澹幔歟,201(dān)。而疾病表型特蒸|葑魑義霞撲慵膊∮鏌逑嗨菩緣氖莼,也矚g媳徽現(xiàn)烈恍┕菘。本昔[械膩義霞膊”硇吞卣魘堇叢從諉攔乙窖際楣蕕囊窖е魈獯時(shí)恚停澹櫻儒義
本文編號:2773384
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R341
【圖文】:
平臺對外公開,研宄者可直接將實(shí)驗(yàn)結(jié)果提交給ArrayExpress或從NCBI邋Gene逡逑Expression邋Omnibus數(shù)據(jù)庫導(dǎo)入,經(jīng)過計(jì)算機(jī)過濾和人工審核驗(yàn)證后,實(shí)時(shí)更逡逑新。因此,該數(shù)據(jù)庫有效解決了以往因人工收集導(dǎo)致的數(shù)據(jù)數(shù)量和種類的遺逡逑漏,提高了數(shù)據(jù)的準(zhǔn)確性并令研宄成果與時(shí)俱進(jìn)。該數(shù)據(jù)庫資源十分豐富,包逡逑含人類、家鼠、擬南芥等多個(gè)物種,有利于不同方向?qū)W者進(jìn)一步研宄。本文使逡逑用的IncRNA表達(dá)譜數(shù)據(jù)集來源于ArrayExpress數(shù)據(jù)庫,通過對16個(gè)人類組織逡逑個(gè)體和混合物的高通量測序進(jìn)行轉(zhuǎn)錄分析,最終下載得到17426個(gè)IncRNA在逡逑16個(gè)人類組織下的表達(dá)譜。逡逑2.3.2疾病表型特征數(shù)據(jù)來源逡逑現(xiàn)有研[傊な擔(dān)膊∮鏌逑嗨菩鑰捎行У卦擻糜讜げ馇痹詰模睿悖遙危粒膊″義瞎叵擔(dān)ǎ茫瑁澹,邋201(dān)誨澹茫瑁澹睿澹澹翦澹幔歟,邋201(dān)誨澹兀酰幔睿澹翦澹幔歟,201(dān)。而疾病表型特蒸|葑魑義霞撲慵膊∮鏌逑嗨菩緣氖莼,也矚g媳徽現(xiàn)烈恍┕菘。本昔[械膩義霞膊”硇吞卣魘堇叢從諉攔乙窖際楣蕕囊窖е魈獯時(shí)恚停澹櫻儒義
本文編號:2773384
本文鏈接:http://sikaile.net/xiyixuelunwen/2773384.html
最近更新
教材專著