天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于類不平衡處理的乳腺癌預后預測模型研究

發(fā)布時間:2020-06-11 22:27
【摘要】:目的:本文探討不平衡分類的乳腺癌數(shù)據(jù)集基于機器學習方法預測預后的生存狀態(tài)。本研究旨在根據(jù)1845名乳腺癌患者的隨訪數(shù)據(jù),建立出穩(wěn)定、可靠的預測模型,以此為基礎選擇預測效果相對較好的預后預測模型。對影響乳腺癌預后生存或死亡狀態(tài)的因素進行探討,選擇解釋性不同的模型對影響因素解釋。方法:乳腺腫瘤預后的生存狀態(tài)數(shù)據(jù)為不平衡數(shù)據(jù),本文使用SMOTE、Borderline-SMOTE、AD ASYN、One-sided select處理乳腺腫瘤生存狀態(tài)的不平衡數(shù)據(jù)。對預后狀態(tài)分類選用經(jīng)典決策樹、條件推斷樹、隨機森林和支持向量機。評價指標采用準確率、敏感度、特異性、正例命中率、負例命中率來評價分類器的效果;對收集的乳腺癌數(shù)據(jù)集進行初步的探索性分析,針對Logistic回歸模型,解釋回歸系數(shù)和一元優(yōu)勢比的估計值,給出決策樹每個分支所對應的因素及對應結局發(fā)生的概率、使用隨機森林方法對影響乳腺癌患者預后生存狀態(tài)的影響因素進行排序。結果:(1)針對乳腺癌患者預后數(shù)據(jù)集生存狀態(tài)不平衡這一問題,欠采樣方法One-Sided select技術,結合條件決策樹預測,在不平衡的乳腺癌數(shù)據(jù)集中預后預測效果最好,將敏感度由2%提高到58%,提高了56%。(2)使用Cox分析中的逐步向前法后,從因變量中篩選出:T分期、N分期、孕激素、HER2、是否采用內(nèi)分泌治療和是否進行化療。(3)Logistic回歸篩選出年齡、N分期、乳腺癌內(nèi)分泌治療、化療手段、多灶性病灶、化療。通過隨機森林的特征變量的重要性來看,年齡、激素受體表達、腫塊大小、N分期、臨床分期、T分期變量的重要性更靠前。結論:本文所針對類不平衡乳腺癌數(shù)據(jù)集所使用的數(shù)據(jù)挖掘方法,同樣可以用于其他類不平衡疾病數(shù)據(jù)集,也可用于疾病的發(fā)生、發(fā)展、治療方法的療效及最終預后的影響因素等更多的醫(yī)學研究。
【圖文】:

技術路線圖,全文,挖掘分析,關聯(lián)規(guī)則


9圖 1 全文技術路線圖Fig. 1 Technology Road Map of Thesis3 研究方法為了對收集到的數(shù)據(jù)集進行挖掘分析,常使用的方法包括分類、回歸、聚類、關聯(lián)規(guī)則分析等。數(shù)據(jù)挖掘的一個流程圖如下:

流程圖,數(shù)據(jù)挖掘,流程圖


圖 2 數(shù)據(jù)挖掘流程圖Fig. 2 Data mining flow chart一個數(shù)據(jù)挖掘分析的基本流程,主要有三塊:對要分析選擇合適的數(shù)據(jù)挖掘方法及挖掘軟件和結合實際分析的目標是根據(jù)需求明確要做什么,然后就是根據(jù)目標獲取的挖掘技術,最后就是對挖掘的結果進行分析,不斷的結果,從而獲得一個穩(wěn)定有效、準確而有意義的模型,合實際的解決方案。及預處理機構工作人員收集數(shù)據(jù)的方式不同,醫(yī)學數(shù)據(jù)通常包含衡、缺失和無關變量[17]。此外,醫(yī)療數(shù)據(jù)還存在數(shù)據(jù)量平衡的[18,19]。以上羅列的原始數(shù)據(jù)集存在問題會造成后數(shù)據(jù)挖掘的性能也會被降低。因此,數(shù)據(jù)預處理應作為,,并且數(shù)據(jù)預處理在數(shù)據(jù)挖掘中耗費 70%-80%的時間[20學數(shù)據(jù)集可以提高臨床可解釋性[21]、降低計算成本[22]、
【學位授予單位】:新疆醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:R737.9;R181.3

【相似文獻】

相關期刊論文 前10條

1 陳莉莉;石菊芳;劉玉琴;岳馨培;王樂;馬恒敏;黃慧瑤;王仲照;代敏;;基于人群的乳腺癌預后參數(shù)研究現(xiàn)狀[J];中華乳腺病雜志(電子版);2018年06期

2 公彥棟;黃焰;;乳腺癌預后預測評估模型的研究進展[J];癌癥進展;2016年09期

3 魏美琴;;中藥在乳腺癌預后復發(fā)中的應用進展[J];中國繼續(xù)醫(yī)學教育;2016年09期

4 雷蕾;吳斌;何濤;湯艷;;2001至2012年乳腺癌預后因素研究的中文文獻計量分析[J];瀘州醫(yī)學院學報;2014年02期

5 郭雅明;吳萬敏;李艷杰;;乳腺癌預后的相關因素研究進展[J];內(nèi)蒙古醫(yī)學雜志;2008年01期

6 白杰;吳萬敏;呂時來;;乳腺癌預后因素研究新進展[J];臨床外科雜志;2007年06期

7 胡曉清;陳理達;趙挺;;BMI與乳腺癌預后關系的臨床分析[J];臨床醫(yī)學;2006年02期

8 白杰;吳萬敏;;乳腺癌預后因素研究新進展[J];內(nèi)蒙古醫(yī)學院學報;2006年S1期

9 劉秀芹;122例乳腺癌預后指標的表達情況回顧及總結[J];中原醫(yī)刊;2004年05期

10 朱濤,鄭巧敏,董敏;腫瘤標志物對乳腺癌預后的評估[J];井岡山醫(yī)專學報;2004年03期

相關會議論文 前10條

1 王新遠;;關于年齡與乳腺癌預后因素的分析[A];第四屆中國腫瘤學術大會暨第五屆海峽兩岸腫瘤學術會議論文集[C];2006年

2 關晏星;雷秋模;王莉;張蕓;段紅華;吳根秀;;泌乳素受體與乳腺癌預后的相關性研究[A];2000全國腫瘤學術大會論文集[C];2000年

3 呂明麗;張小平;蔡海東;;乳腺癌預后相關細胞因子的分析[A];中華醫(yī)學會第九次全國核醫(yī)學學術會議論文摘要匯編[C];2011年

4 劉鵬;王穎;寧連勝;孟潔;狄根紅;孫慧;戰(zhàn)忠利;王慶生;張利華;;PCNA對Ⅰ期乳腺癌預后意義的評估[A];2000全國腫瘤學術大會論文集[C];2000年

5 許丹寧;川允波;;雌激素受體及其在乳腺癌中的作用研究進展[A];中國畜牧獸醫(yī)學會獸醫(yī)產(chǎn)科學分會第五屆全體會議第十次學術研討會論文集[C];2009年

6 陳雅青;;DCE-MRI與乳腺癌預后相關性研究[A];中華醫(yī)學會第16次全國放射學學術大會論文匯編[C];2009年

7 李紅霞;范欽和;李吉友;解云濤;;p73 G4C14-to-A4T14(GC/AT)基因多態(tài)性與乳腺癌預后的關系[A];中華醫(yī)學會病理學分會2007年學術年會暨第九屆全國病理大會論文匯編[C];2007年

8 袁們;王雯邈;常江;于典科;徐兵河;;乳腺癌差異表達基因3`UTR遺傳變異與三陰性乳腺癌預后的關聯(lián)研究[A];第八屆中國腫瘤學術大會暨第十三屆海峽兩岸腫瘤學術會議論文匯編[C];2014年

9 陳益定;吳金民;鄭備義;陳麗榮;鄧甬川;王海軍;彭佳萍;鄭樹;;Ki-67核抗原與SPF值的相關性及其與乳腺癌預后的關系[A];2000全國腫瘤學術大會論文集[C];2000年

10 張志剛;黃建;;CXCR4的表達與乳腺癌預后及病理特征的Meta分析[A];國家級“乳腺癌診治新進展”學習班暨學術年會論文匯編[C];2013年

相關重要報紙文章 前4條

1 記者 張夢然;三種罕見基因突變影響乳腺癌預后[N];科技日報;2018年

2 余志平;甲狀腺激素影響乳腺癌預后[N];中國醫(yī)藥報;2005年

3 余科;乳腺癌預后判斷[N];醫(yī)藥經(jīng)濟報;2009年

4 記者 馮衛(wèi)東;乳腺癌預后有了新生物標記[N];科技日報;2014年

相關博士學位論文 前10條

1 李晶;彩色多普勒超聲對乳腺癌診斷和灰階超聲對乳腺癌預后的研究[D];中國醫(yī)科大學;2007年

2 王妍妍;生物標志物與乳腺癌預后關系的相關研究[D];浙江大學;2015年

3 畢曉峰;乳腺癌相關蛋白表達分析及與臨床預后關系的研究[D];中國協(xié)和醫(yī)科大學;2008年

4 張靈小;多基因單核苷酸多態(tài)與三陰性乳腺癌預后及療效的關聯(lián)研究[D];北京協(xié)和醫(yī)學院;2012年

5 杜躍耀;腎上腺素受體表達及相關的基因多態(tài)性與乳腺癌預后及易感性的研究[D];復旦大學;2012年

6 譚茹;動態(tài)增強磁共振血管成像與乳腺癌預后因素的相關性分析[D];山東大學;2015年

7 孟祥穎;Bcl-2及相關miR-16、miR-15b、miR-195對乳腺癌預后影響的研究[D];中國人民解放軍軍事醫(yī)學科學院;2010年

8 周幸春;腫瘤/睪丸抗原在乳腺癌組織中的表達與乳腺癌預后相關性的研究[D];第四軍醫(yī)大學;2012年

9 傅佩芬;胰島素樣生長因子1受體在乳腺癌中的表達及臨床意義[D];浙江大學;2013年

10 劉芳芳;腫瘤浸潤Treg細胞的化療敏感性及其與乳腺癌預后關系的研究[D];天津醫(yī)科大學;2011年

相關碩士學位論文 前10條

1 王哲;基于類不平衡處理的乳腺癌預后預測模型研究[D];新疆醫(yī)科大學;2019年

2 魏選東;基于芯片分析的乳腺癌預后核心基因篩選及其預測效果分析[D];湖南師范大學;2018年

3 黃鵬;基于基因共表達網(wǎng)絡分析的三陰性乳腺癌預后相關基因與鉑應答靶點關系的研究[D];中國醫(yī)科大學;2018年

4 王夢;原發(fā)病灶病理緩解狀態(tài)對ypN0期乳腺癌預后的影響[D];天津醫(yī)科大學;2018年

5 邸世愷;血清催乳素水平與乳腺癌預后有關臨床及病理因素的相關性研究[D];青海大學;2018年

6 賴雨程;雌激素受體β(ERβ)對乳腺癌預后預測的Meta分析和文獻綜述[D];浙江大學;2017年

7 覃宇周;復發(fā)轉移相關基因聯(lián)合表達判斷早期乳腺癌預后的研究[D];廣西醫(yī)科大學;2007年

8 王超;基于細胞信號通路互作的乳腺癌預后計算模型研究[D];西南大學;2016年

9 喬向彬;探討超聲彈性成像評估乳腺癌預后的價值[D];遵義醫(yī)學院;2013年

10 譚浩翔;內(nèi)皮素-1與乳腺癌預后的關系[D];福建醫(yī)科大學;2004年



本文編號:2708563

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/2708563.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶bbd91***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com