天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 醫(yī)學(xué)論文 > 腫瘤論文 >

原發(fā)性結(jié)直腸惡性腫瘤根治術(shù)后結(jié)局的分類預(yù)測(cè)模型研究

發(fā)布時(shí)間:2018-04-28 06:11

  本文選題:結(jié)直腸惡性腫瘤 + 風(fēng)險(xiǎn)預(yù)測(cè); 參考:《重慶醫(yī)科大學(xué)》2017年碩士論文


【摘要】:結(jié)直腸癌(CRC)是一種常見的消化道惡性腫瘤,發(fā)病率與死亡率均呈逐年上升趨勢(shì),已然成為影響人類健康的重要疾病。目前CRC的主要治療手段為外科手術(shù),但術(shù)后仍有一定比例的復(fù)發(fā)轉(zhuǎn)移風(fēng)險(xiǎn),且復(fù)發(fā)轉(zhuǎn)移將嚴(yán)重影響患者預(yù)后,故是否能準(zhǔn)確預(yù)測(cè)患者術(shù)后結(jié)局,采取適當(dāng)措施就顯得尤為重要。國(guó)內(nèi)外已有研究對(duì)CRC術(shù)后轉(zhuǎn)移風(fēng)險(xiǎn)及結(jié)局進(jìn)行預(yù)測(cè),主要采用多因素Logistic回歸和COX回歸,但這2種方法對(duì)樣本量要求較高,不宜分析小樣本高維數(shù)據(jù)。近年興起的機(jī)器學(xué)習(xí)算法,如基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)學(xué)習(xí)算法(SVM)、隨機(jī)森林算法(RF)則適用于小樣本、高維數(shù)據(jù)的分類問題,可以得到具有較好泛化能力的預(yù)測(cè)模型。預(yù)測(cè)模型結(jié)合特征選擇算法,在降低空間冗余度的同時(shí),還可以降低訓(xùn)練成本。其中Boruta算法通過衡量特征對(duì)結(jié)局的重要性進(jìn)行選擇,可避免變量之間的相關(guān)性,對(duì)醫(yī)學(xué)數(shù)據(jù)較為適用,但目前尚未應(yīng)用于惡性腫瘤數(shù)據(jù)的預(yù)測(cè)。本研究分為兩部分,第一部分利用UCI標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行模擬預(yù)測(cè),運(yùn)用SPSS 22.0軟件進(jìn)行單因素差異性分析,R 3.30進(jìn)行Boruta特征選擇,隨后建立SVM模型和RF模型,運(yùn)用Stata14.0對(duì)模型預(yù)測(cè)效果進(jìn)行比較,嘗試篩選出較優(yōu)的特征選擇方式,第二部分針對(duì)抽樣采集的CRC預(yù)后相關(guān)數(shù)據(jù),對(duì)第一部分篩選得到的模型進(jìn)行驗(yàn)證,并對(duì)CRC術(shù)后不良結(jié)局進(jìn)行預(yù)測(cè)。研究結(jié)果顯示:(1)針對(duì)UCI標(biāo)準(zhǔn)數(shù)據(jù)集的分類預(yù)測(cè)結(jié)果顯示,基于全數(shù)據(jù)集的RF預(yù)測(cè)模型(AUC=0.717)效果較好;基于差異性分析的預(yù)測(cè)效果較好的是Polynomial-SVM模型(AUC=0.756);基于Boruta特征選擇預(yù)測(cè)效果較好的為RF模型(AUC=0.905)。ROC曲線分析顯示,不同預(yù)處理方法的最優(yōu)預(yù)測(cè)模型間存在差異(2x=7.27,P=0.026)。(2)結(jié)直腸癌單因素分析結(jié)果顯示,腫瘤部位、CA-199、CEA、浸潤(rùn)深度、神經(jīng)浸潤(rùn)、脈管浸潤(rùn)、T分期、N分期、Dukes分期、術(shù)后化療、陽(yáng)性淋巴數(shù)在預(yù)后分組間存在差異(P0.05)。Boruta方法篩選結(jié)果顯示,CA-199、陽(yáng)性淋巴數(shù)、神經(jīng)浸潤(rùn)、手術(shù)時(shí)間、是否化療、化療療程數(shù)為影響預(yù)后結(jié)局的重要因素。(3)對(duì)于結(jié)直腸癌術(shù)后結(jié)局預(yù)測(cè)模型的比較顯示,基于全數(shù)據(jù)集的預(yù)測(cè)效果最好的為Polynomial-SVM模型(AUC=0.907),基于差異性分析預(yù)測(cè)效果最好的為Polynomial-SVM模型(AUC=0.911),基于Boruta特征選擇的模型其預(yù)測(cè)效果以RF為好(AUC=0.982),且三種最優(yōu)模型之間存在差異(2x=7.74,P=0.021)。(4)COX比例風(fēng)險(xiǎn)模型發(fā)現(xiàn),CA-199高(RR=2.002,95%CI:1.143~3.505)、陽(yáng)性淋巴數(shù)(RR=1.244,95%CI:1.141~1.357)、神經(jīng)浸潤(rùn)(RR=2.206,95%CI:1.130~4.308)、術(shù)中放療(RR=2.098,95%CI:1.191~3.696)為結(jié)直腸癌術(shù)后結(jié)局的可能危險(xiǎn)因素。綜上所述,基于Boruta特征選擇的模型預(yù)測(cè)效果較基于傳統(tǒng)差異性分析的模型預(yù)測(cè)效果好,Boruta特征選擇算法可作為臨床數(shù)據(jù)預(yù)測(cè)模型前的數(shù)據(jù)降維方式,以便降低模型復(fù)雜度,同時(shí)提高預(yù)測(cè)效果。基于Boruta特征選擇的RF模型能在一定程度上預(yù)測(cè)CRC根治術(shù)后結(jié)局,對(duì)指導(dǎo)臨床醫(yī)生術(shù)前干預(yù)有所幫助。
[Abstract]:Colorectal cancer (CRC) is a common malignant tumor of the digestive tract. The incidence and mortality are increasing year by year. It has become an important disease affecting human health. At present, the main treatment method of CRC is surgery, but there is still a certain proportion of the risk of recurrence and metastasis after the operation, and the recurrence and metastasis will seriously affect the prognosis of the patients. It is very important to predict the outcome of the patients accurately and take appropriate measures. Research on the risk and outcome of postoperative transfer of CRC has been predicted at home and abroad, mainly using multiple factor Logistic regression and COX regression. However, these 2 methods are not suitable for the analysis of small sample high dimensional data. Based on the statistical learning theory, the support vector machine learning algorithm (SVM), the random forest algorithm (RF) applies to the small sample, the classification of the high dimensional data, the prediction model with good generalization ability can be obtained. The prediction model combined with the feature selection algorithm can reduce the redundancy of space while reducing the training cost. Among them, the Boruta calculation is also reduced. By selecting the importance of the outcome, the method can avoid the correlation between variables and is more suitable for medical data, but it has not been applied to the prediction of malignant tumor data. This study is divided into two parts. The first part is divided into two parts. The first part uses the standard data set of UCI to carry out simulation pretest and SPSS 22 software for single factor difference. Analysis, R 3.30 carries out Boruta feature selection, then establishes SVM model and RF model. Using Stata14.0 to compare the prediction effect of the model, try to screen out the better feature selection method. The second part is to verify the model of the first part, and the bad outcome after the CRC operation. The research results show that: (1) according to the classification prediction results of the UCI standard data set, the RF prediction model based on the full data set (AUC=0.717) has better effect, the better prediction effect based on the difference analysis is the Polynomial-SVM model (AUC=0.756), and the RF model (AUC=0.905).ROC curve based on the Boruta characteristic selection prediction is better. The analysis showed that there were differences between the optimal prediction models of different pretreatment methods (2x=7.27, P=0.026). (2) the results of colorectal cancer single factor analysis showed that the tumor site, CA-199, CEA, infiltration depth, nerve infiltration, vascular infiltration, T staging, N staging, Dukes staging, postoperative chemotherapy, and positive lymphatic numbers were different (P0.05).Boruta square between the prognosis groups. The results of screening showed that CA-199, positive lymph number, nerve infiltration, operation time, chemotherapy and chemotherapy were important factors affecting the prognosis. (3) the comparison of prognosis model of postoperative outcome of colorectal cancer showed that the best prediction effect based on full data set was Polynomial-SVM model (AUC=0.907), based on differential analysis The best test result is Polynomial-SVM model (AUC=0.911), the model based on Boruta feature selection is good for RF (AUC=0.982), and there is a difference between the three optimal models (2x=7.74, P=0.021). (4) COX proportional hazard model found that CA-199 high (RR= 2.002,95%CI:1.143~3.505), positive lymph number (RR=1.244,95%CI:1.141~1.357), God Through infiltration (RR=2.206,95%CI:1.130~4.308), intraoperative radiotherapy (RR=2.098,95%CI:1.191~3.696) is a possible risk factor for the outcome of colorectal cancer surgery. To sum up, the predictive effect of the model based on Boruta feature selection is better than the model based on the traditional difference analysis model, and the Boruta feature selection algorithm can be used as a clinical data prediction model. The previous data reduction method can reduce the model complexity and improve the prediction effect. The RF model based on Boruta feature selection can predict the outcome of CRC after radical operation to a certain extent, which is helpful to the preoperative intervention of clinicians.

【學(xué)位授予單位】:重慶醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:R735.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 南重漢;鄒凌云;;基于分組重量編碼和特征選擇技術(shù)預(yù)測(cè)外膜蛋白[J];第三軍醫(yī)大學(xué)學(xué)報(bào);2013年13期

2 何蘭;范繼紅;;基因芯片數(shù)據(jù)特征選擇法研究[J];醫(yī)學(xué)信息學(xué)雜志;2012年10期

3 吳紅霞;吳悅;劉宗田;雷州;;基于Relief和SVM-RFE的組合式SNP特征選擇[J];計(jì)算機(jī)應(yīng)用研究;2012年06期

4 邵歡;李國(guó)正;劉國(guó)萍;王憶勤;;多標(biāo)記中醫(yī)問診數(shù)據(jù)的癥狀選擇[J];中國(guó)科學(xué):信息科學(xué);2011年11期

5 楊立才;李金亮;姚玉翠;吳曉晴;;基于F-score特征選擇和支持向量機(jī)的P300識(shí)別算法[J];生物醫(yī)學(xué)工程學(xué)雜志;2008年01期

6 蔡立軍;沈小喬;林亞平;蔣林波;;一種改進(jìn)的基因表達(dá)數(shù)據(jù)分類方法[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期

7 劉嶠;王娟;陳偉;秦志光;;用于全基因組關(guān)聯(lián)分析的一種基因自動(dòng)選擇算法研究[J];航天醫(yī)學(xué)與醫(yī)學(xué)工程;2010年04期

8 李昕;趙春;王惠惠;趙芳芳;;一種面向生物信息學(xué)數(shù)據(jù)的模式選擇算法研究[J];生物醫(yī)學(xué)工程學(xué)雜志;2011年05期

9 高智勇,龔健雅,秦前清,林家瑞;惡性腫瘤相關(guān)改變檢測(cè)方法的研究進(jìn)展[J];北京生物醫(yī)學(xué)工程;2005年02期

10 周華英;張啟蕊;羅漫;王鶴嫻;;醫(yī)藥文本分類特征選擇的研究[J];遼寧中醫(yī)藥大學(xué)學(xué)報(bào);2011年06期

相關(guān)會(huì)議論文 前10條

1 靖紅芳;王斌;楊雅輝;;基于類別分布的特征選擇框架[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

2 李長(zhǎng)升;盧漢清;;排序?qū)W習(xí)模型中的特征選擇[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

3 劉功申;李建華;李生紅;;基于類信息的特征選擇和加權(quán)方法[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

4 倪友平;王思臣;馬桂珍;陳曾平;;分支界定算法在低分辨雷達(dá)飛機(jī)架次判別中的應(yīng)用[A];第十三屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2007)論文集[C];2007年

5 李澤輝;聶生東;陳兆學(xué);;應(yīng)用多類SVM分割MR腦圖像特征選擇與優(yōu)化的實(shí)驗(yàn)研究[A];中國(guó)儀器儀表學(xué)會(huì)第九屆青年學(xué)術(shù)會(huì)議論文集[C];2007年

6 蒙新泛;王厚峰;;主客觀識(shí)別中的上下文因素的研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年

7 萬(wàn)京;王建東;;一種基于新的差異性度量的ReliefF方法[A];2009年研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)論文集[C];2009年

8 范麗;許潔萍;;基于GMM的音樂信號(hào)音色模型研究[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年

9 陳友;戴磊;程學(xué)旗;;基于MRMHC-C4.5的IP流分類[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

10 申f;楊宏暉;袁帥;;用于水聲目標(biāo)識(shí)別的互信息無(wú)監(jiān)督特征選擇[A];第三屆上!靼猜晫W(xué)學(xué)會(huì)學(xué)術(shù)會(huì)議論文集[C];2013年

相關(guān)博士學(xué)位論文 前10條

1 李靜;高維數(shù)據(jù)交互特征選擇和分類研究[D];燕山大學(xué);2015年

2 劉風(fēng);基于磁共振成像的多變量模式分析方法學(xué)與應(yīng)用研究[D];電子科技大學(xué);2014年

3 王石平;粗糙擬陣及其在高維數(shù)據(jù)降維中的應(yīng)用研究[D];電子科技大學(xué);2014年

4 代琨;基于支持向量機(jī)的網(wǎng)絡(luò)數(shù)據(jù)特征選擇技術(shù)研究[D];解放軍信息工程大學(xué);2013年

5 王愛國(guó);微陣列基因表達(dá)數(shù)據(jù)的特征分析方法研究[D];合肥工業(yè)大學(xué);2015年

6 楊峻山;生物組學(xué)數(shù)據(jù)的集成特征選擇研究[D];深圳大學(xué);2017年

7 王博;文本分類中特征選擇技術(shù)的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2009年

8 張明錦;基于特征選擇的多變量數(shù)據(jù)分析方法及其在譜學(xué)研究中的應(yīng)用[D];華東理工大學(xué);2011年

9 高青斌;蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)相關(guān)問題研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

10 馮國(guó)忠;文本分類中的貝葉斯特征選擇[D];東北師范大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 周瑞;基于支持向量機(jī)特征選擇的移動(dòng)通信網(wǎng)絡(luò)問題分析[D];華南理工大學(xué);2015年

2 張金蕾;蛋白質(zhì)SUMO化修飾位點(diǎn)預(yù)測(cè)的數(shù)據(jù)挖掘技術(shù)研究[D];西北農(nóng)林科技大學(xué);2015年

3 陳云風(fēng);基于聚類集成技術(shù)的高鐵信號(hào)故障診斷研究[D];西南交通大學(xué);2015年

4 張斌斌;網(wǎng)絡(luò)股評(píng)的傾向性分析[D];中央民族大學(xué);2015年

5 季金勝;高分辨率遙感影像典型地物目標(biāo)的特征選擇及其穩(wěn)定性研究[D];上海交通大學(xué);2015年

6 袁玉錄;基于數(shù)據(jù)分類的網(wǎng)絡(luò)通信行為建模方法研究[D];電子科技大學(xué);2015年

7 王虎;基于試驗(yàn)設(shè)計(jì)的白酒譜圖特征選擇及支持向量機(jī)參數(shù)優(yōu)化研究[D];南京財(cái)經(jīng)大學(xué);2015年

8 王維智;基于特征提取和特征選擇的級(jí)聯(lián)深度學(xué)習(xí)模型研究[D];哈爾濱工業(yè)大學(xué);2015年

9 皮陽(yáng);基于聲音的生物種群識(shí)別[D];電子科技大學(xué);2015年

10 劉樹龍;特征選擇在軟件缺陷預(yù)測(cè)中的應(yīng)用技術(shù)研究[D];南京大學(xué);2015年



本文編號(hào):1814105

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/zlx/1814105.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶61ade***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
99久只有精品免费视频播放| 国内自拍偷拍福利视频| 欧美日韩人妻中文一区二区| 国产av一区二区三区久久不卡 | 国产色偷丝袜麻豆亚洲| 中文字幕人妻一区二区免费| 性欧美唯美尤物另类视频| 国产性色精品福利在线观看| 六月丁香六月综合缴情| 久久午夜福利精品日韩| 日韩精品一区二区不卡| 日本中文字幕在线精品| 欧洲精品一区二区三区四区| 麻豆剧果冻传媒一二三区| 不卡中文字幕在线免费看| 91人妻丝袜一区二区三区| 偷自拍亚洲欧美一区二页| 国产麻豆一区二区三区在| 91日韩在线观看你懂的| 欧美日韩在线观看自拍| 中文字幕高清不卡一区| 亚洲一区二区三区三区| 亚洲中文在线观看小视频| 日韩一区二区三区久久| 日韩在线精品视频观看| 亚洲一二三四区免费视频| 少妇被粗大进猛进出处故事| 欧美日韩人妻中文一区二区| 好吊视频一区二区在线| 中日韩美一级特黄大片| 我想看亚洲一级黄色录像| 欧美日韩免费黄片观看| 国产免费人成视频尤物| 亚洲欧美日韩在线中文字幕| 亚洲伊人久久精品国产| 免费精品一区二区三区| 日韩中文字幕狠狠人妻| 这里只有九九热精品视频| 国产一区二区在线免费| 一区二区三区日韩经典| 亚洲av日韩av高潮无打码|