天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 數(shù)學(xué)論文 >

基于稀疏低秩回歸方法的腫瘤亞型聚類分析

發(fā)布時(shí)間:2018-07-20 18:58
【摘要】:當(dāng)前,癌癥是導(dǎo)致人類死亡的主要疾病之一。隨著第二代測(cè)序技術(shù)的發(fā)展,世界各國的學(xué)者實(shí)施了大規(guī)模癌癥基因組測(cè)序工程(例如TCGA),獲得了大量不同類型的生物學(xué)數(shù)據(jù)(例如mRNA表達(dá)數(shù)據(jù),DNA甲基化數(shù)據(jù),體細(xì)胞突變數(shù)據(jù)),對(duì)于理解癌癥的發(fā)病機(jī)理,尋找腫瘤的準(zhǔn)確亞型,設(shè)計(jì)出治療癌癥的有效藥物等方面產(chǎn)生了積極影響。然而,新的問題也隨之而來,如何充分整合和利用多組學(xué)的生物測(cè)序數(shù)據(jù)來設(shè)計(jì)出腫瘤亞型聚類算法,成為生物信息學(xué)研究的熱點(diǎn)之一。目前,腫瘤亞型聚類常用的分析方法仍是半監(jiān)督或著無監(jiān)督的對(duì)單一的生物組學(xué)數(shù)據(jù)的樣本分配。但這類方法存在的缺陷是多種相關(guān)性數(shù)據(jù)類型不能用于一個(gè)單獨(dú)的聚類方法,容易造成信息損失。近幾年來,基于多組學(xué)生物數(shù)據(jù),研究者提出了一些腫瘤亞型聚類分析算法。但這些方法還處于發(fā)展的早期階段,仍然存在許多問題亟待解決。如基因的預(yù)篩選問題、構(gòu)建真正意義上的數(shù)據(jù)整合模型、得到更為準(zhǔn)確的結(jié)果等。因此迫切需要發(fā)展新的數(shù)據(jù)分析方法。本文中,我們研究工作的核心思想是基于稀疏低秩回歸的方法,把高維度的多組學(xué)數(shù)據(jù)投射到一個(gè)低維度的含有主要的生物過程的子空間里,最終達(dá)到數(shù)據(jù)融合和快速聚類的目的。第一章介紹了基于多組學(xué)數(shù)據(jù)的亞型分析的研究背景、研究意義,以及國內(nèi)外研究現(xiàn)狀和主要的研究方法。第二章介紹了各種研究癌癥亞型常用的數(shù)據(jù)和,列舉回顧了多種具有代表性的整合多種數(shù)據(jù)的聚類算法。第三章介紹了基于稀疏低秩回歸方法優(yōu)化iCluster算法的理論。我們基于稀疏低秩回歸的方法代替了優(yōu)化的PCA的算法,計(jì)算出具有稀疏低秩性的系數(shù)矩陣的初值,保證了后續(xù)迭代過程中估計(jì)出最優(yōu)的后驗(yàn)概率值。與iCluster算法相比的比較實(shí)驗(yàn)也驗(yàn)證了算法改進(jìn)的有效性。第四章介紹了基于稀疏低秩回歸的方法提出的Scluster聚類算法的理論。它是用一種用該方法首先利用合適的稀疏低秩回歸的方法來從每種生物數(shù)據(jù)中發(fā)現(xiàn)有效的低維度的子空間,然后整合這些子空間為一個(gè)樣本-樣本的相似矩陣,最后用譜聚類的方法識(shí)別癌癥亞型。對(duì)于在三種不同的癌癥類型數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,我們提出的Scluster在預(yù)測(cè)生存周期上更加有效。在GBM的亞型分析中,基于表達(dá)數(shù)據(jù)和甲基化數(shù)據(jù)的整合,我們的方法能更有效的捕捉到生物上的特征和發(fā)現(xiàn)亞型中的子集,發(fā)現(xiàn)了一種隱在的新型亞型。第五章介紹了研究中的一些問題并總結(jié)全文、展望未來的發(fā)展方向。
[Abstract]:At present, cancer is one of the major diseases leading to human death. With the development of the second generation sequencing technology, scholars from all over the world have carried out large-scale cancer genome sequencing projects (such as TCGA) and obtained a large number of different types of biological data (such as mRNA expression data and DNA methylation data). Somatic mutation data) has a positive effect on understanding the pathogenesis of cancer, searching for accurate subtypes of cancer, designing effective drugs for cancer treatment, and so on. However, with the new problems, how to fully integrate and use the multiple sets of biologic sequencing data to design a tumor subtype clustering algorithm has become one of the hot topics in bioinformatics. At present, the commonly used analysis methods of tumor subtype clustering are semi-supervised or unsupervised sample allocation for a single biometric data. However, the disadvantage of this kind of method is that many kinds of correlated data types can not be used in a single clustering method, which can easily cause information loss. In recent years, a number of clustering algorithms for tumor subtypes have been proposed based on multigroup biological data. However, these methods are still in the early stage of development, and there are still many problems to be solved. For example, gene pre-screening and real data integration model are constructed to get more accurate results. Therefore, there is an urgent need to develop new data analysis methods. In this paper, the core idea of our work is to project high dimensional multigroup data into a low dimensional subspace containing major biological processes based on sparse low rank regression. Finally, the purpose of data fusion and fast clustering is achieved. The first chapter introduces the research background and significance of subtype analysis based on multi-group data, as well as the current research situation and main research methods at home and abroad. In the second chapter, we introduce the commonly used data of cancer subtype, and enumerate and review some representative clustering algorithms that integrate many kinds of data. Chapter 3 introduces the theory of optimizing iCluster algorithm based on sparse low rank regression method. Based on the sparse low rank regression method, we replace the optimized PCA algorithm, calculate the initial value of the coefficient matrix with sparse low rank property, and ensure the estimation of the optimal posterior probability value in the subsequent iteration process. Compared with the iCluster algorithm, the comparison experiment also verifies the effectiveness of the improved algorithm. In chapter 4, the theory of cluster clustering algorithm based on sparse low rank regression is introduced. It uses a suitable sparse low-rank regression method to find valid low-dimensional subspaces from each biological data, and then integrates these subspaces into a sample-sample similarity matrix. Finally, the cancer subtypes were identified by spectral clustering. The experimental results on three different types of cancer data sets show that the proposed cluster is more effective in predicting life cycle. In GBM subtype analysis, based on the integration of expressed and methylated data, our method can more effectively capture biological features and find subsets of subtypes, and find a new hidden subtype. The fifth chapter introduces some problems in the research, summarizes the full text, and looks forward to the future development direction.
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:R730.2;O212.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃良;;門限自回歸方法在秋季低溫發(fā)生期預(yù)測(cè)中的運(yùn)用[J];四川氣象;1991年03期

2 王書寧,戴建設(shè),胡萍;未知有界誤差下新的回歸方法[J];控制與決策;1994年04期

3 潘蕙琦,史秉璋;介紹一種回歸方法──浮動(dòng)法[J];數(shù)理統(tǒng)計(jì)與管理;1985年03期

4 倪加勛;介紹一種新的回歸方法——單調(diào)回歸[J];統(tǒng)計(jì)與決策;1986年03期

5 顏金銳 ,林群;秩單調(diào)回歸方法及應(yīng)用[J];廈門大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);1993年03期

6 楊自強(qiáng);殷溪源;;基于垂直距離的回歸方法[J];物探化探計(jì)算技術(shù);1993年02期

7 牟永平;怎樣用自回歸方法 做季降水量預(yù)報(bào)[J];山東氣象;1979年01期

8 孫耀東,王太源,宗序平;可線性化回歸方法的改進(jìn)和拓展[J];揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年02期

9 潘蕙琦,史秉璋;用最優(yōu)回歸方法評(píng)價(jià)一種選擇回歸子集的新方法[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);1987年02期

10 黃樹顏;回歸方法的數(shù)據(jù)預(yù)處理及其應(yīng)用[J];統(tǒng)計(jì)研究;1986年02期

相關(guān)會(huì)議論文 前2條

1 王莉;楊印生;劉子玉;;基于Binary Logistic回歸方法的農(nóng)村勞動(dòng)力流動(dòng)影響因素分析[A];中國現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年

2 周明;陳中笑;;利用二元回歸方法分析我國降水的同位素效應(yīng)[A];S6 大氣成分與天氣氣候變化[C];2012年

相關(guān)博士學(xué)位論文 前1條

1 勾建偉;懲罰回歸方法的研究及其在后全基因關(guān)聯(lián)研究中的應(yīng)用[D];南京醫(yī)科大學(xué);2014年

相關(guān)碩士學(xué)位論文 前5條

1 葛曙光;基于稀疏低秩回歸方法的腫瘤亞型聚類分析[D];安徽大學(xué);2017年

2 郭月玲;百分位數(shù)回歸方法在財(cái)務(wù)管理中的應(yīng)用[D];電子科技大學(xué);2008年

3 杜萬亮;基于獨(dú)立成分分析的多元回歸方法研究[D];東北大學(xué);2009年

4 劉高生;切片逆回歸降維模型擴(kuò)展及其應(yīng)用[D];貴州財(cái)經(jīng)大學(xué);2014年

5 王曉霞;基于分片逆回歸的維數(shù)縮減[D];湖北大學(xué);2011年

,

本文編號(hào):2134453

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/2134453.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1ec0a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日本 一区二区 在线| 欧美一区二区三区播放| 国产一区二区三区av在线| 精品一区二区三区乱码中文| 果冻传媒精选麻豆白晶晶| 国产日韩欧美一区二区| 欧美精品亚洲精品日韩专区| 99久久国产亚洲综合精品| 五月婷婷六月丁香狠狠| 久久经典一区二区三区| 中国美女偷拍福利视频| 91久久精品国产成人| 粉嫩一区二区三区粉嫩视频| 国产一区一一一区麻豆| 亚洲在线观看福利视频| 日韩在线中文字幕不卡| 中文字幕亚洲在线一区| 一区二区三区人妻在线| 99国产高清不卡视频| 日韩精品一级片免费看| 精品少妇一区二区视频| 国产色第一区不卡高清| 激情综合五月开心久久| 精品少妇人妻av免费看| 久久精品福利在线观看| 激情中文字幕在线观看| 国产一区二区不卡在线播放| 日韩一区二区三区在线欧洲| 日本中文字幕在线精品| 黄色在线免费高清观看| 好吊视频有精品永久免费| 精品综合欧美一区二区三区| 久久婷婷综合色拍亚洲| 亚洲日本久久国产精品久久| 成人免费视频免费观看| 色鬼综合久久鬼色88| 在线观看国产成人av天堂野外| 成人国产激情福利久久| 国产精品免费视频视频| 亚洲一区二区三区精选| 亚洲天堂精品在线视频|