基于數(shù)據(jù)挖掘的基因和疾病的關(guān)系研究
發(fā)布時(shí)間:2022-12-11 04:16
利用先進(jìn)的數(shù)據(jù)挖掘方法分析研究基因和疾病之間的關(guān)系有助于發(fā)現(xiàn)疾病的發(fā)生機(jī)制,從而為疾病的診斷和個(gè)性化治療提供科學(xué)依據(jù)。但是,基因相關(guān)信息的數(shù)據(jù)通常具有高維小樣本、高噪聲、高冗余的特點(diǎn),這使得很多優(yōu)秀的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法在處理分析基因與疾病相關(guān)數(shù)據(jù)時(shí)效果較差。因此,需要針對(duì)具體基因和疾病的相關(guān)數(shù)據(jù)的特點(diǎn),設(shè)計(jì)合適的算法模型來(lái)進(jìn)行數(shù)據(jù)分析。在本論文中,針對(duì)不同基因與疾病相關(guān)數(shù)據(jù)的特點(diǎn),從基因功能預(yù)測(cè),特征基因選擇和miRNA和疾病的關(guān)系三個(gè)方面對(duì)基因與疾病的關(guān)系進(jìn)行了分析研究。提出了一系列相應(yīng)的數(shù)據(jù)挖掘方法對(duì)其進(jìn)行處理。本文的主要研究?jī)?nèi)容和創(chuàng)新點(diǎn)如下:1)基因功能預(yù)測(cè)問(wèn)題事實(shí)上是一個(gè)多示例多標(biāo)簽問(wèn)題,在本文中使用機(jī)器學(xué)習(xí)的方法對(duì)基于多示例多標(biāo)簽對(duì)象進(jìn)行探討,旨在對(duì)未知的基因功能進(jìn)行注釋。本文將層次聚類(lèi)與多標(biāo)簽學(xué)習(xí)框架相結(jié)合,并提出一個(gè)基于基因本體層次結(jié)構(gòu)的多標(biāo)簽層次聚類(lèi)算法框架。本文將多示例多標(biāo)簽的問(wèn)題轉(zhuǎn)化為相對(duì)簡(jiǎn)單的單示例多標(biāo)簽問(wèn)題。這個(gè)算法依據(jù)的是基因表達(dá)之間的相關(guān)性,并依據(jù)基因之間的功能類(lèi)的最大化相關(guān)性對(duì)相應(yīng)的聚類(lèi)方法進(jìn)行補(bǔ)充,并構(gòu)建有相似基因功能的基因?yàn)槎嗍纠龜?shù)據(jù)集。最后,對(duì)提...
【文章頁(yè)數(shù)】:120 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基因功能預(yù)測(cè)研究現(xiàn)狀
1.2.2 特征基因選擇研究現(xiàn)狀
1.2.3 miRNA與疾病的關(guān)系研究現(xiàn)狀
1.3 本文研究目的及主要工作
1.4 論文的組織結(jié)構(gòu)
第2章 相關(guān)工作
2.1 基因功能注釋數(shù)據(jù)庫(kù)介紹
2.1.1 KEGG數(shù)據(jù)庫(kù)
2.1.2 GO數(shù)據(jù)庫(kù)
2.2 基因表達(dá)譜數(shù)據(jù)
2.2.1 基因表達(dá)譜的獲取及數(shù)據(jù)表示
2.2.2 基因表達(dá)譜相關(guān)數(shù)據(jù)特點(diǎn)
2.2.3 常用基因表達(dá)譜相關(guān)數(shù)據(jù)庫(kù)
2.3 miRNAs與疾病相關(guān)數(shù)據(jù)
2.4 特征選擇方法
2.4.1 包裝方法
2.4.2 過(guò)濾方法
2.4.3 嵌入式方法
2.4.4 集成方法
2.4.5 混合方法
2.4.6 特征選擇方法之間的比較
2.5 矩陣完成方法
2.6 小結(jié)
第3章 基于本體層次結(jié)構(gòu)的基因功能預(yù)測(cè)
3.1 引言
3.1.1 基因功能預(yù)測(cè)任務(wù)
3.2 多示例多標(biāo)簽學(xué)習(xí)
3.2.1 MLL算法
3.3 基于本體層次的多示例方法
3.3.1 基因本體論層次結(jié)構(gòu)
3.3.2 GOMIHC算法
3.4實(shí)驗(yàn)
3.4.1 數(shù)據(jù)集
3.4.2 性能評(píng)價(jià)指標(biāo)
3.5 實(shí)驗(yàn)結(jié)果和分析
3.5.1 實(shí)驗(yàn)設(shè)計(jì)
3.5.2 實(shí)驗(yàn)結(jié)果
3.5.3 實(shí)驗(yàn)結(jié)果分析
3.6 小結(jié)
第4章 基于最大局部判別邊緣的半監(jiān)督的基因選擇
4.1 引言
4.2 特征選擇的半監(jiān)督最大判別信息
4.2.1 SMLM
4.2.2 SMLM的算法流程
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)
4.3.2 對(duì)比算法介紹
4.3.3 參數(shù)設(shè)置及評(píng)價(jià)指標(biāo)
4.3.4 實(shí)驗(yàn)結(jié)果與分析
4.4 小結(jié)
第5章 基于誘導(dǎo)矩陣完成預(yù)測(cè)MIRNA-疾病關(guān)聯(lián)
5.1 引言
5.2 數(shù)據(jù)預(yù)處理
5.3 相似性度量方法
5.3.1 疾病語(yǔ)義相似性
5.3.2 計(jì)算miRNA功能相似性
5.3.3 計(jì)算疾病和miRNA的高斯核相似性
5.3.4 整合疾病和miRNA的相似性
5.4 基于誘導(dǎo)矩陣完成預(yù)測(cè)miRNA-疾病關(guān)聯(lián)
5.4.1 方法概述
5.4.2 構(gòu)建miRNA疾病雙層網(wǎng)絡(luò)
5.4.3 誘導(dǎo)矩陣完成算法
5.5 結(jié)果與討論
5.5.1 性能評(píng)估指標(biāo)
5.5.2 結(jié)果分析
5.5.3 對(duì)新疾病的性能研究
5.5.4 評(píng)估不同數(shù)據(jù)源的貢獻(xiàn)
5.5.5 案例研究
5.6 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
附錄A 攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文
附錄B 攻讀博士學(xué)位期間主要參與的課題
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)方法在基因功能注釋中的應(yīng)用[J]. 李金城,廖奇,沈其君. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào). 2016(05)
[2]基因表達(dá)譜數(shù)據(jù)分析技術(shù)[J]. 劉玲. 電腦與信息技術(shù). 2010(06)
[3]基因 在疾病中扮演的角色[J]. 孫衛(wèi)華. 醫(yī)藥保健雜志. 2009(20)
[4]無(wú)監(jiān)督環(huán)境下基于聚類(lèi)集成的特征選擇[J]. 羅毅輝,熊曙初,王四春,范強(qiáng). 微計(jì)算機(jī)信息. 2008(09)
[5]基因功能注釋——后基因組時(shí)代面臨的挑戰(zhàn)[J]. 王行國(guó). 世界科技研究與發(fā)展. 2007(01)
[6]基因功能注釋的計(jì)算方法[J]. 朱新宇. 生物技術(shù). 2003(06)
博士論文
[1]疾病相關(guān)的miRNAs與lncRNAs預(yù)測(cè)方法研究[D]. 谷長(zhǎng)龍.湖南大學(xué) 2017
碩士論文
[1]基于半監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的特征選擇算法研究[D]. 鄭欣.西北大學(xué) 2017
[2]半監(jiān)督特征選擇和特征選擇的穩(wěn)定性研究[D]. 陳東.上海交通大學(xué) 2013
[3]基于改進(jìn)K-means聚類(lèi)的系統(tǒng)發(fā)育譜方法在基因功能注釋中的應(yīng)用[D]. 孫平平.東北師范大學(xué) 2008
本文編號(hào):3718123
【文章頁(yè)數(shù)】:120 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基因功能預(yù)測(cè)研究現(xiàn)狀
1.2.2 特征基因選擇研究現(xiàn)狀
1.2.3 miRNA與疾病的關(guān)系研究現(xiàn)狀
1.3 本文研究目的及主要工作
1.4 論文的組織結(jié)構(gòu)
第2章 相關(guān)工作
2.1 基因功能注釋數(shù)據(jù)庫(kù)介紹
2.1.1 KEGG數(shù)據(jù)庫(kù)
2.1.2 GO數(shù)據(jù)庫(kù)
2.2 基因表達(dá)譜數(shù)據(jù)
2.2.1 基因表達(dá)譜的獲取及數(shù)據(jù)表示
2.2.2 基因表達(dá)譜相關(guān)數(shù)據(jù)特點(diǎn)
2.2.3 常用基因表達(dá)譜相關(guān)數(shù)據(jù)庫(kù)
2.3 miRNAs與疾病相關(guān)數(shù)據(jù)
2.4 特征選擇方法
2.4.1 包裝方法
2.4.2 過(guò)濾方法
2.4.3 嵌入式方法
2.4.4 集成方法
2.4.5 混合方法
2.4.6 特征選擇方法之間的比較
2.5 矩陣完成方法
2.6 小結(jié)
第3章 基于本體層次結(jié)構(gòu)的基因功能預(yù)測(cè)
3.1 引言
3.1.1 基因功能預(yù)測(cè)任務(wù)
3.2 多示例多標(biāo)簽學(xué)習(xí)
3.2.1 MLL算法
3.3 基于本體層次的多示例方法
3.3.1 基因本體論層次結(jié)構(gòu)
3.3.2 GOMIHC算法
3.4實(shí)驗(yàn)
3.4.1 數(shù)據(jù)集
3.4.2 性能評(píng)價(jià)指標(biāo)
3.5 實(shí)驗(yàn)結(jié)果和分析
3.5.1 實(shí)驗(yàn)設(shè)計(jì)
3.5.2 實(shí)驗(yàn)結(jié)果
3.5.3 實(shí)驗(yàn)結(jié)果分析
3.6 小結(jié)
第4章 基于最大局部判別邊緣的半監(jiān)督的基因選擇
4.1 引言
4.2 特征選擇的半監(jiān)督最大判別信息
4.2.1 SMLM
4.2.2 SMLM的算法流程
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 實(shí)驗(yàn)數(shù)據(jù)
4.3.2 對(duì)比算法介紹
4.3.3 參數(shù)設(shè)置及評(píng)價(jià)指標(biāo)
4.3.4 實(shí)驗(yàn)結(jié)果與分析
4.4 小結(jié)
第5章 基于誘導(dǎo)矩陣完成預(yù)測(cè)MIRNA-疾病關(guān)聯(lián)
5.1 引言
5.2 數(shù)據(jù)預(yù)處理
5.3 相似性度量方法
5.3.1 疾病語(yǔ)義相似性
5.3.2 計(jì)算miRNA功能相似性
5.3.3 計(jì)算疾病和miRNA的高斯核相似性
5.3.4 整合疾病和miRNA的相似性
5.4 基于誘導(dǎo)矩陣完成預(yù)測(cè)miRNA-疾病關(guān)聯(lián)
5.4.1 方法概述
5.4.2 構(gòu)建miRNA疾病雙層網(wǎng)絡(luò)
5.4.3 誘導(dǎo)矩陣完成算法
5.5 結(jié)果與討論
5.5.1 性能評(píng)估指標(biāo)
5.5.2 結(jié)果分析
5.5.3 對(duì)新疾病的性能研究
5.5.4 評(píng)估不同數(shù)據(jù)源的貢獻(xiàn)
5.5.5 案例研究
5.6 小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
附錄A 攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文
附錄B 攻讀博士學(xué)位期間主要參與的課題
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器學(xué)習(xí)方法在基因功能注釋中的應(yīng)用[J]. 李金城,廖奇,沈其君. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào). 2016(05)
[2]基因表達(dá)譜數(shù)據(jù)分析技術(shù)[J]. 劉玲. 電腦與信息技術(shù). 2010(06)
[3]基因 在疾病中扮演的角色[J]. 孫衛(wèi)華. 醫(yī)藥保健雜志. 2009(20)
[4]無(wú)監(jiān)督環(huán)境下基于聚類(lèi)集成的特征選擇[J]. 羅毅輝,熊曙初,王四春,范強(qiáng). 微計(jì)算機(jī)信息. 2008(09)
[5]基因功能注釋——后基因組時(shí)代面臨的挑戰(zhàn)[J]. 王行國(guó). 世界科技研究與發(fā)展. 2007(01)
[6]基因功能注釋的計(jì)算方法[J]. 朱新宇. 生物技術(shù). 2003(06)
博士論文
[1]疾病相關(guān)的miRNAs與lncRNAs預(yù)測(cè)方法研究[D]. 谷長(zhǎng)龍.湖南大學(xué) 2017
碩士論文
[1]基于半監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的特征選擇算法研究[D]. 鄭欣.西北大學(xué) 2017
[2]半監(jiān)督特征選擇和特征選擇的穩(wěn)定性研究[D]. 陳東.上海交通大學(xué) 2013
[3]基于改進(jìn)K-means聚類(lèi)的系統(tǒng)發(fā)育譜方法在基因功能注釋中的應(yīng)用[D]. 孫平平.東北師范大學(xué) 2008
本文編號(hào):3718123
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3718123.html
最近更新
教材專(zhuān)著