乳癌病人臨床數(shù)據(jù)的降維處理及生存預(yù)測(cè)分析
[Abstract]:With the development of gene technology, the expression level of mi RNA in cancer patients can be easily obtained. Recent studies have found that RNA plays an important role in cancer metastasis. From the patient's mi RNA expression level analysis of the patient's condition began to attract attention. This paper focuses on dimensionality reduction of high dimensional mi RNA expression level data and survival prediction analysis combined with clinical data. There are a lot of censored data in the patient's clinical data, so we can not ignore the censored data when solving the survival distribution function. In this paper, we obtain the survival distribution function of breast cancer patients by product limit estimation and maximum likelihood estimation, respectively, and prove the existence condition of the solution of the maximum likelihood estimation method. The same distribution interpolation method is proposed to interpolate censored data and the error of the same distribution interpolation method is analyzed. Another characteristic of patient clinical data is high dimension. The processing methods of high-dimensional data can be divided into two categories: feature selection and feature extraction. In this paper, three dimensionality reduction methods, minimum grid clustering and principal component analysis (PCA), are compared. The shortest path in Isomap method is found to predict the progression of cancer. A decentralization modification is proposed for the minimum mesh clustering method. Finally, based on the dimensionality reduction data and the staging data of different stages of cancer in clinical data, the classification results of breast cancer stages obtained by support vector product method and decision tree method are compared. Through the Kruskal-Wallis test of mi RNA expression level data and clinical data, we find out the miRNA. which has correlation with cancer stage. The regression relationship between mi RNA expression level and patient survival was established by stepwise multivariate regression method. It was found that part of mi RNA selected by stepwise regression model had been proved to be correlated with cancer. For example: hsa-mir-548t, hsa-mir-190, hsa-mir-200b, etc.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:R737.9
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周雪忠;劉保延;姚乃禮;李平;王映輝;王春山;于彤;穆釗;徐興良;;中醫(yī)臨床數(shù)據(jù)倉(cāng)庫(kù)的研究及構(gòu)建[J];國(guó)際中醫(yī)中藥雜志;2006年06期
2 劉閩碧;;以時(shí)間為導(dǎo)向的臨床數(shù)據(jù)管理[J];華北煤炭醫(yī)學(xué)院學(xué)報(bào);2007年01期
3 趙麗娜;周吉順;;中醫(yī)臨床數(shù)據(jù)信息化過程中的標(biāo)準(zhǔn)化問題[J];世界科學(xué)技術(shù)(中醫(yī)藥現(xiàn)代化);2011年04期
4 成福春;尹嶺;方肇勤;朱抗美;張平;劉珉;仲毅;;中醫(yī)臨床數(shù)據(jù)分析模型構(gòu)建[J];中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志;2009年06期
5 孟繁榮;劉永蘭;王軍成;;醫(yī)院臨床數(shù)據(jù)中心建設(shè)問題分析[J];解放軍醫(yī)藥雜志;2012年12期
6 蔡長(zhǎng)坤;;采用非實(shí)驗(yàn)設(shè)計(jì)的臨床數(shù)據(jù)求算藥動(dòng)參數(shù)[J];江西中醫(yī)學(xué)院學(xué)報(bào);1993年03期
7 楊建偉;心血管病臨床數(shù)據(jù)計(jì)算機(jī)檢索系統(tǒng)的設(shè)計(jì)[J];醫(yī)學(xué)信息;1998年10期
8 吳美京;吳騁;王睿;賀佳;;臨床試驗(yàn)數(shù)據(jù)管理培訓(xùn)——現(xiàn)狀、經(jīng)驗(yàn)與展望[J];西北醫(yī)學(xué)教育;2009年05期
9 鄧亞中;于嘉;劉川;劉宗范;;電子化時(shí)代臨床數(shù)據(jù)管理現(xiàn)狀和未來趨勢(shì)[J];中國(guó)新藥雜志;2014年08期
10 過駿愈;楊岱冰;;臨床數(shù)據(jù)中心的應(yīng)用[J];中國(guó)醫(yī)療設(shè)備;2014年06期
相關(guān)會(huì)議論文 前8條
1 王禹毅;韓梅;陳妮妮;李青;劉建平;;從如何獲得高質(zhì)量臨床數(shù)據(jù)探討臨床試驗(yàn)的數(shù)據(jù)管理[A];第七屆中醫(yī)/中西醫(yī)結(jié)合循證醫(yī)學(xué)方法研討會(huì)會(huì)議材料[C];2013年
2 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];中國(guó)中西醫(yī)結(jié)合學(xué)會(huì)診斷專業(yè)委員會(huì)2009’年會(huì)論文集[C];2009年
3 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];2009全國(guó)時(shí)間生物醫(yī)學(xué)學(xué)術(shù)會(huì)議論文集[C];2009年
4 張華;張笑波;趙宏杰;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];中華中醫(yī)藥學(xué)會(huì)第二屆中醫(yī)方證基礎(chǔ)研究與臨床應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2008年
5 潘宏銘;;從臨床試驗(yàn)到臨床實(shí)踐—?颂婺幄羝谂R床數(shù)據(jù)分析[A];2013年第六屆國(guó)家級(jí)分子靶點(diǎn)藥物治療新進(jìn)展學(xué)習(xí)班暨浙江省腫瘤化療學(xué)術(shù)年會(huì)論文集[C];2013年
6 李嶺;季星來;李妍;李春義;;生物信息學(xué)研究中臨床數(shù)據(jù)解讀方面可能存在的若干問題的探討[A];中國(guó)的遺傳學(xué)研究——中國(guó)遺傳學(xué)會(huì)第七次代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要匯編[C];2003年
7 韓釗;臧秋玲;葉祖森;王蘋莉;樊愷;曹云剛;耿媛媛;張征;;卒中臨床數(shù)據(jù)登記系統(tǒng)的研究開發(fā)[A];醫(yī)學(xué)科研管理前沿與實(shí)務(wù)研討班論文集[C];2009年
8 韓釗;臧秋玲;葉祖森;項(xiàng)崇雷;陳小麗;邵蓓;鄭榮遠(yuǎn);;《卒中臨床數(shù)據(jù)登記系統(tǒng)V1.0》軟件的開發(fā)與使用[A];2008年浙江省神經(jīng)病學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2008年
相關(guān)重要報(bào)紙文章 前7條
1 本報(bào)記者 賈巖;謝燕彬:臨床數(shù)據(jù)管理亟待加強(qiáng)[N];醫(yī)藥經(jīng)濟(jì)報(bào);2014年
2 孫亞林 賀佳 曹陽(yáng);臨床數(shù)據(jù)管理期待實(shí)現(xiàn)電子化[N];中國(guó)醫(yī)藥報(bào);2005年
3 記者 邢宇皓;全球最大重疾數(shù)據(jù)樣本資源庫(kù)開建[N];光明日?qǐng)?bào);2010年
4 王蘭;FDA要求羅氏Actemra更多非臨床數(shù)據(jù)[N];中國(guó)醫(yī)藥報(bào);2008年
5 實(shí)習(xí)記者 陳蕾 駐滬記者 張莉;中醫(yī)的數(shù)字化方向[N];醫(yī)藥經(jīng)濟(jì)報(bào);2006年
6 汪少穎;專家建議加強(qiáng)中成藥臨床數(shù)據(jù)整理研究[N];中國(guó)中醫(yī)藥報(bào);2003年
7 邵建國(guó);他司魯肽因臨床數(shù)據(jù)不佳失寵[N];醫(yī)藥經(jīng)濟(jì)報(bào);2010年
相關(guān)博士學(xué)位論文 前1條
1 周天舒;國(guó)際臨床數(shù)據(jù)交換關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];浙江大學(xué);2013年
相關(guān)碩士學(xué)位論文 前9條
1 趙寒;面向臨床醫(yī)學(xué)數(shù)據(jù)的潛變量建模關(guān)鍵問題與技術(shù)研究[D];北京工業(yè)大學(xué);2015年
2 劉駿健;基于openEHR的臨床數(shù)據(jù)中心設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2016年
3 陳景安;乳癌病人臨床數(shù)據(jù)的降維處理及生存預(yù)測(cè)分析[D];哈爾濱工業(yè)大學(xué);2016年
4 孫亞林;臨床數(shù)據(jù)管理系統(tǒng)研究及其在數(shù)據(jù)規(guī)范化管理中的應(yīng)用[D];第二軍醫(yī)大學(xué);2005年
5 周敏;中醫(yī)臨床數(shù)據(jù)匯交及技術(shù)平臺(tái)構(gòu)建方案研究[D];湖北中醫(yī)藥大學(xué);2014年
6 劉一帆;基于電子病歷的科室臨床數(shù)據(jù)中心的實(shí)現(xiàn)[D];中山大學(xué);2014年
7 張瑤;影響臨床數(shù)據(jù)質(zhì)量的因素及數(shù)據(jù)采集方法的選擇[D];復(fù)旦大學(xué);2012年
8 程雯麗;判別和聚類方法在針灸臨床數(shù)據(jù)分析中的應(yīng)用研究[D];東華大學(xué);2013年
9 黃宗浩;臨床數(shù)據(jù)統(tǒng)計(jì)分析在UIS系統(tǒng)中的設(shè)計(jì)與實(shí)現(xiàn)[D];華東理工大學(xué);2013年
,本文編號(hào):2224662
本文鏈接:http://sikaile.net/yixuelunwen/zlx/2224662.html