女性乳腺癌患者存活時(shí)間問(wèn)題的降維及預(yù)測(cè)算法研究與開(kāi)發(fā)
發(fā)布時(shí)間:2022-02-16 21:33
乳腺癌是發(fā)生在乳腺上皮組織的一種惡性腫瘤,是危害女性健康的一種疾病,乳腺并不是維持生命體征的一種必不可少的組織器官,原位乳腺癌并不直接危害生命,但是一旦癌細(xì)胞喪失一般細(xì)胞特性,就會(huì)發(fā)生擴(kuò)散,當(dāng)癌細(xì)胞擴(kuò)散到全身,嚴(yán)重的可能會(huì)危及生命。DNA甲基化是基因修飾的一種方式,在基因組Cp G上結(jié)合一個(gè)甲基基團(tuán),從而影響多個(gè)生物功能模塊,包括DNA與蛋白質(zhì)的相互作用方式、DNA的穩(wěn)定性、DNA構(gòu)象、染色質(zhì)結(jié)構(gòu)的改變、以及基因的表達(dá)。甲基化測(cè)序方法按照原理可以分為三大類(lèi),重亞硫酸鹽測(cè)序,基于限制性?xún)?nèi)切酶的測(cè)序,和靶向富集甲基化位點(diǎn)測(cè)序。隨著高通量測(cè)序技術(shù)的發(fā)展,甲基化數(shù)據(jù)的獲得變得更為容易,在現(xiàn)代醫(yī)學(xué)中,利用DNA甲基化數(shù)據(jù)對(duì)乳腺癌進(jìn)行診斷成為一種很有效的方法。但DNA甲基化數(shù)據(jù)具有很高的數(shù)據(jù)維度,并且由于基因檢測(cè)的成本過(guò)高,導(dǎo)致樣本數(shù)量相對(duì)不多,也就是所謂的“大p小n”的問(wèn)題出現(xiàn),由于數(shù)據(jù)維度過(guò)高,如果直接用模型對(duì)原數(shù)據(jù)進(jìn)行預(yù)測(cè),一方面很大可能會(huì)導(dǎo)致過(guò)擬合現(xiàn)象的出現(xiàn)。即使在訓(xùn)練集中能夠得到相對(duì)不錯(cuò)的效果,但是測(cè)試集的效果很差,導(dǎo)致模型的泛化能力不強(qiáng)。另一方面,要得到所有的DNA甲基化位點(diǎn)的數(shù)據(jù),需...
【文章來(lái)源】:吉林大學(xué)吉林省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 本課題研究現(xiàn)狀
1.3 主要工作和創(chuàng)新點(diǎn)
第2章 DNA甲基化數(shù)據(jù)挖掘方法
2.1 DNA甲基化數(shù)據(jù)簡(jiǎn)介
2.2 數(shù)據(jù)預(yù)處理
2.3 特征選擇算法
2.3.1 過(guò)濾法
2.3.2 包裝法
2.3.3 嵌入法
2.4 分類(lèi)回歸算法
2.4.1 回歸算法
2.4.2 分類(lèi)算法
2.5 性能評(píng)價(jià)
2.5.1 交叉驗(yàn)證
2.5.2 性能指標(biāo)
2.6 本章小結(jié)
第3章 乳腺癌患者存活時(shí)間預(yù)測(cè)系統(tǒng)設(shè)計(jì)
3.1 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
3.2 二分類(lèi)模型
3.3 回歸模型
3.4 性能評(píng)價(jià)
3.4.1 二分類(lèi)模型性能對(duì)比
3.4.2 回歸模型性能對(duì)比
3.5 文章小結(jié)
第4章 其他乳腺癌biomarker對(duì)比
4.1 pam50
4.2 乳腺癌指數(shù)
4.3 Endopredict test
4.4 對(duì)比實(shí)驗(yàn)
4.5 文章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)介及科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于信息增益的特征優(yōu)化選擇方法[J]. 劉慶和,梁正友. 計(jì)算機(jī)工程與應(yīng)用. 2011(12)
[2]DNA甲基化方法研究現(xiàn)狀[J]. 沈佳堯,侯鵬,祭美菊,李松,陸祖宏,何農(nóng)躍. 生命的化學(xué). 2003(02)
本文編號(hào):3628699
【文章來(lái)源】:吉林大學(xué)吉林省211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.2 本課題研究現(xiàn)狀
1.3 主要工作和創(chuàng)新點(diǎn)
第2章 DNA甲基化數(shù)據(jù)挖掘方法
2.1 DNA甲基化數(shù)據(jù)簡(jiǎn)介
2.2 數(shù)據(jù)預(yù)處理
2.3 特征選擇算法
2.3.1 過(guò)濾法
2.3.2 包裝法
2.3.3 嵌入法
2.4 分類(lèi)回歸算法
2.4.1 回歸算法
2.4.2 分類(lèi)算法
2.5 性能評(píng)價(jià)
2.5.1 交叉驗(yàn)證
2.5.2 性能指標(biāo)
2.6 本章小結(jié)
第3章 乳腺癌患者存活時(shí)間預(yù)測(cè)系統(tǒng)設(shè)計(jì)
3.1 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)
3.2 二分類(lèi)模型
3.3 回歸模型
3.4 性能評(píng)價(jià)
3.4.1 二分類(lèi)模型性能對(duì)比
3.4.2 回歸模型性能對(duì)比
3.5 文章小結(jié)
第4章 其他乳腺癌biomarker對(duì)比
4.1 pam50
4.2 乳腺癌指數(shù)
4.3 Endopredict test
4.4 對(duì)比實(shí)驗(yàn)
4.5 文章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 展望
參考文獻(xiàn)
作者簡(jiǎn)介及科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于信息增益的特征優(yōu)化選擇方法[J]. 劉慶和,梁正友. 計(jì)算機(jī)工程與應(yīng)用. 2011(12)
[2]DNA甲基化方法研究現(xiàn)狀[J]. 沈佳堯,侯鵬,祭美菊,李松,陸祖宏,何農(nóng)躍. 生命的化學(xué). 2003(02)
本文編號(hào):3628699
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628699.html
最近更新
教材專(zhuān)著