基于基因表達微陣列數(shù)據(jù)集的加權(quán)雙向聚類算法研究
發(fā)布時間:2017-10-18 01:28
本文關(guān)鍵詞:基于基因表達微陣列數(shù)據(jù)集的加權(quán)雙向聚類算法研究
更多相關(guān)文章: 基因表達數(shù)據(jù) 數(shù)據(jù)挖掘 基因調(diào)控網(wǎng)絡(luò) 雙向聚類算法 驗證指標
【摘要】:隨著生物信息技術(shù)的迅速發(fā)展,基因芯片技術(shù)在生物界領(lǐng)域有了明顯的進展,它不僅反映了當前細胞生理狀態(tài)以及基因之間的相關(guān)性,而且對于癌癥亞型的識別、藥物靶點的檢測、藥物療效的診斷以及揭示疾病發(fā)生機制等領(lǐng)域起到至關(guān)重要的作用,因此基于基因表達微陣列數(shù)據(jù)的一些相關(guān)研究是生物技術(shù)領(lǐng)域的核心.基于基因表達微陣列數(shù)據(jù)的分析方法一般是利用聚類方法來挖掘矩陣中所隱藏的重要信息.由于基因表達數(shù)據(jù)具有雙向關(guān)聯(lián)的特性,所以傳統(tǒng)的聚類算法在基因表達數(shù)據(jù)的研究中就受到了一定的局限,傳統(tǒng)的聚類算法只能單一對行或列進行聚類從而找出基因表達矩陣的全局信息,而最終卻忽略了其中重要的局部信息,因此一般的聚類算法沒有辦法精確地映射出基因與條件之間的緊密關(guān)系.本文主要針對一般聚類方法的不足,提出了基于基因表達數(shù)據(jù)無監(jiān)督的加權(quán)雙向聚類算法,具體做了以下幾項工作:首先,利用最小生成森林法生成了基因調(diào)控網(wǎng)絡(luò).而根據(jù)基因調(diào)控網(wǎng)絡(luò)中基因的重要性給每一個基因分配相應(yīng)的權(quán)重.其次,在基因生成網(wǎng)絡(luò)的基礎(chǔ)上提出了加權(quán)的雙向聚類算法.最后,針對于已有的驗證指標,即平均殘差(ASR指標)進行了改進,然后將改進的指標與已提出的指標進行比較,最終確定了最優(yōu)的聚類個數(shù).并且我們將該方法應(yīng)用到乳腺癌和青少年類風(fēng)濕性關(guān)節(jié)炎兩組數(shù)據(jù)上,實例表明本論文所提出的加權(quán)雙向聚類算法具有很好的聚類效果.
【關(guān)鍵詞】:基因表達數(shù)據(jù) 數(shù)據(jù)挖掘 基因調(diào)控網(wǎng)絡(luò) 雙向聚類算法 驗證指標
【學(xué)位授予單位】:黑龍江大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:Q811.4;TP311.13
【目錄】:
- 中文摘要4-5
- Abstract5-8
- 第1章 緒論8-12
- 1.1 課題的研究背景及意義8-9
- 1.2 國內(nèi)外的研究現(xiàn)狀9-11
- 1.3 本文研究的內(nèi)容和結(jié)構(gòu)11-12
- 第2章 基因生成網(wǎng)絡(luò)12-19
- 2.1 常見的基因生成網(wǎng)絡(luò)方法12-16
- 2.1.1 基于原始數(shù)據(jù)的基因生成網(wǎng)絡(luò)12
- 2.1.2 基于表達數(shù)據(jù)的基因生成網(wǎng)絡(luò)12-16
- 2.1.3 小結(jié)16
- 2.2 最小生成森林法16-18
- 2.2.1 Chow-Liu樹16-17
- 2.2.2 最小生成森林法17-18
- 2.3 本章小結(jié)18-19
- 第3章 加權(quán)雙向聚類算法19-32
- 3.1 雙向聚類算法的簡介19-22
- 3.2 加權(quán)雙向聚類算法22-28
- 3.2.1 給基因分配權(quán)重22
- 3.2.2 非負矩陣分解22-25
- 3.2.3 加權(quán)雙向聚類算法25-28
- 3.3 雙向聚類算法的驗證指標28-31
- 3.3.1 平均殘差(ASR指標)29
- 3.3.2 平均相關(guān)指標(ACV指標)29
- 3.3.3 PBM指標29-30
- 3.3.4 Γ指標30-31
- 3.3.5 MNSR指標31
- 3.4 本章小結(jié)31-32
- 第4章 實驗結(jié)果及分析32-42
- 4.1 數(shù)據(jù)來源32-33
- 4.2 數(shù)據(jù)處理過程33-35
- 4.3 實驗結(jié)果與分析35-41
- 4.3.1 乳腺癌數(shù)據(jù)35-38
- 4.3.2 青少年類風(fēng)濕性關(guān)節(jié)炎38-41
- 4.4 本章小結(jié)41-42
- 結(jié)論42-44
- 參考文獻44-51
- 致謝51-52
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文52
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 雷于生,任恕,粟載福;KDD技術(shù)及其在基因表達微陣列數(shù)據(jù)中的應(yīng)用[J];國外醫(yī)學(xué)(分子生物學(xué)分冊);2000年06期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 王志玲;基于基因表達微陣列數(shù)據(jù)集的加權(quán)雙向聚類算法研究[D];黑龍江大學(xué);2016年
2 鄒央云;基于混合線性模型框架的基因表達微陣列數(shù)據(jù)統(tǒng)計分析方法研究[D];浙江大學(xué);2006年
,本文編號:1052175
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/1052175.html
最近更新
教材專著