癌癥基因表達(dá)數(shù)據(jù)屬性偏序表示與知識(shí)發(fā)現(xiàn)
發(fā)布時(shí)間:2017-09-18 02:24
本文關(guān)鍵詞:癌癥基因表達(dá)數(shù)據(jù)屬性偏序表示與知識(shí)發(fā)現(xiàn)
更多相關(guān)文章: 屬性偏序結(jié)構(gòu)圖 肺腺癌基因表達(dá)數(shù)據(jù) 特征選擇 數(shù)據(jù)離散化 知識(shí)發(fā)現(xiàn)
【摘要】:基因芯片技術(shù)可以在一次實(shí)驗(yàn)中大規(guī)模并行檢測(cè)成千上萬(wàn)個(gè)基因的表達(dá)量,對(duì)癌癥等疾病的分類、診斷研究有非常重要的實(shí)際意義。近幾年來(lái)基因表達(dá)數(shù)據(jù)量呈指數(shù)式的增長(zhǎng),如何有效的組織分析、處理這些海量的基因表達(dá)數(shù)據(jù),從中提取出有效的生物、醫(yī)學(xué)信息已成為人們關(guān)注和研究的熱點(diǎn)。針對(duì)這一問(wèn)題,本文將特征選擇方法與以形式概念分析為基礎(chǔ)的屬性偏序結(jié)構(gòu)圖相結(jié)合來(lái)處理肺腺癌基因表達(dá)數(shù)據(jù),探索研究一種新的知識(shí)發(fā)現(xiàn)方法。本文研究了形式概念分析和屬性偏序結(jié)構(gòu)圖的基礎(chǔ)概念與相關(guān)定義,分析了屬性偏序結(jié)構(gòu)圖用于知識(shí)發(fā)現(xiàn)和可視化數(shù)據(jù)關(guān)系方面所具有的優(yōu)勢(shì),并提出了一個(gè)將特征選擇與屬性偏序圖相結(jié)合應(yīng)用于癌癥基因表達(dá)數(shù)據(jù)方面的知識(shí)發(fā)現(xiàn)方案;之后介紹了基因表達(dá)數(shù)據(jù)方面相關(guān)內(nèi)容和所要處理的肺腺癌基因表達(dá)數(shù)據(jù)來(lái)源及對(duì)其所做的預(yù)處理過(guò)程;接著結(jié)合使用T-test方法和Elastic net方法對(duì)肺腺癌基因表達(dá)數(shù)據(jù)進(jìn)行了特征基因選擇,共選出35個(gè)特征基因,該過(guò)程大大降低了數(shù)據(jù)的維度。最后,運(yùn)用c#編程對(duì)數(shù)據(jù)進(jìn)行離散化處理生成二值的形式背景,進(jìn)而生成屬性偏序結(jié)構(gòu)圖,根據(jù)圖中的簇集分布及層次關(guān)系進(jìn)行知識(shí)發(fā)現(xiàn)。最終發(fā)現(xiàn),選擇出的特征基因在肺腺癌腫瘤樣本和正常樣本中均差異表達(dá),識(shí)別出了與腫瘤發(fā)生和轉(zhuǎn)移密切相關(guān)的靶基因,而且在對(duì)比分析過(guò)程中發(fā)現(xiàn)吸煙影響部分基因在腫瘤樣本中的表達(dá);另外,大部分的特征基因在腫瘤樣本中表達(dá)值一般,只有少數(shù)基因是高表達(dá)和低表達(dá)的。
【關(guān)鍵詞】:屬性偏序結(jié)構(gòu)圖 肺腺癌基因表達(dá)數(shù)據(jù) 特征選擇 數(shù)據(jù)離散化 知識(shí)發(fā)現(xiàn)
【學(xué)位授予單位】:燕山大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP311.13;R730
【目錄】:
- 摘要5-6
- Abstract6-8
- 目錄8-10
- 第1章 緒論10-15
- 1.1 研究背景與意義10-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-13
- 1.3 本文主要內(nèi)容13-15
- 第2章 形式概念分析理論15-30
- 2.1 序與格15-17
- 2.2 形式背景與形式概念17-19
- 2.3 形式背景的生成19-21
- 2.4 屬性偏序結(jié)構(gòu)圖21-29
- 2.4.1 基本的屬性定義22-28
- 2.4.2 生成屬性偏序圖的規(guī)則28-29
- 2.5 本章小結(jié)29-30
- 第3章 基因表達(dá)數(shù)據(jù)及預(yù)處理30-41
- 3.1 生物信息學(xué)30-31
- 3.2 基因芯片技術(shù)原理及應(yīng)用31-32
- 3.3 微陣列基因表達(dá)數(shù)據(jù)32-36
- 3.4 本文研究所用數(shù)據(jù)集及預(yù)處理36-40
- 3.5 本章小結(jié)40-41
- 第4章 特征基因的選擇41-51
- 4.1 特征選擇簡(jiǎn)述41-42
- 4.2 Lasso算法介紹42-44
- 4.2.1 Lasso算法43
- 4.2.2 Lars算法43-44
- 4.3 Lasso相關(guān)方法44-46
- 4.3.1 Elastic Net44-45
- 4.3.2 Adaptive Lasso45-46
- 4.4 肺癌基因表達(dá)數(shù)據(jù)特征基因選擇46-50
- 4.4.1 T-test對(duì)特征基因的初步選擇46-48
- 4.4.2 Elastic net對(duì)特征基因的選擇48-50
- 4.5 本章小結(jié)50-51
- 第5章 肺癌基因數(shù)據(jù)的知識(shí)發(fā)現(xiàn)51-66
- 5.1 生成形式背景51-52
- 5.2 樣本為對(duì)象特征基因?yàn)閷傩缘钠蚪Y(jié)構(gòu)知識(shí)發(fā)現(xiàn)52-58
- 5.3 特征基因作為屬性的對(duì)比知識(shí)發(fā)現(xiàn)58-63
- 5.3.1 不吸煙患者的組織樣本為對(duì)象58-60
- 5.3.2 吸煙患者的組織樣本為對(duì)象60-62
- 5.3.3 對(duì)比分析62-63
- 5.4 特征基因作為對(duì)象的知識(shí)發(fā)現(xiàn)63-65
- 5.5 本章小結(jié)65-66
- 結(jié)論66-68
- 參考文獻(xiàn)68-72
- 攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果72-73
- 致謝73-74
- 作者簡(jiǎn)介74
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 張靖;胡學(xué)鋼;張玉紅;施萬(wàn)鋒;;K-split Lasso:有效的腫瘤特征基因選擇方法[J];計(jì)算機(jī)科學(xué)與探索;2012年12期
2 孫中吉;李櫻;;生物信息學(xué)在醫(yī)學(xué)基礎(chǔ)研究中的應(yīng)用[J];醫(yī)學(xué)信息學(xué)雜志;2013年11期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 桑雨;連續(xù)數(shù)據(jù)離散化方法研究[D];大連理工大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 孫良剛;基于屬性偏序原理的屬性偏序結(jié)構(gòu)圖表示算法研究[D];燕山大學(xué);2012年
,本文編號(hào):872842
本文鏈接:http://sikaile.net/yixuelunwen/zlx/872842.html
最近更新
教材專著