基于數(shù)據(jù)挖掘的前列腺癌相關(guān)數(shù)據(jù)的研究
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的前列腺癌相關(guān)數(shù)據(jù)的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:前列腺癌是一種常見于男性泌尿生殖系統(tǒng)的惡性腫瘤,其發(fā)病率在西方歐美國家居所有男性腫瘤之首,死亡率僅次于肺癌,居第二位。與西方國家相比,我國前列腺癌的發(fā)病率明顯偏低,但近年來由于受各種因素的影響而呈顯著增長態(tài)勢。前列腺癌原發(fā)灶多位于外周帶,發(fā)病早期無特殊癥狀,臨床確診時(shí)多為晚期,致使患者長期預(yù)后不佳。前列腺癌的早期診斷是泌尿外科醫(yī)生面臨的一個(gè)重要課題。隨著醫(yī)療行業(yè)信息化建設(shè)的不斷發(fā)展,越來越多的前列腺癌臨床數(shù)據(jù)被存儲在醫(yī)療數(shù)據(jù)庫中,如何發(fā)現(xiàn)這些數(shù)據(jù)背后隱藏的信息和規(guī)律,從而為前列腺癌的診斷、治療乃至整個(gè)醫(yī)學(xué)研究做出貢獻(xiàn),是目前亟待解決的問題。本研究嘗試?yán)脭?shù)據(jù)挖掘的方法和技術(shù)對前列腺癌臨床數(shù)據(jù)進(jìn)行分析,從中發(fā)現(xiàn)和總結(jié)了前列腺癌的臨床特征和發(fā)展規(guī)律,并在此基礎(chǔ)上構(gòu)建了一個(gè)基于GA_BP神經(jīng)網(wǎng)絡(luò)的前列腺癌早期預(yù)測模型。為了簡化指標(biāo)結(jié)構(gòu),降低解決問題的復(fù)雜度,本研究先后采用屬性選擇技術(shù)(非參數(shù)檢驗(yàn)和二變量相關(guān))、主成分分析法對樣本空間進(jìn)行處理,成功將數(shù)據(jù)維度從9維降至4維;針對基本BP神經(jīng)網(wǎng)絡(luò)容易陷入局部極小點(diǎn)、收斂過程緩慢的缺陷,本研究分別采用遺傳算法和LM算法對其進(jìn)行優(yōu)化,試驗(yàn)及仿真結(jié)果表明上述改進(jìn)均可在一定程度上達(dá)到預(yù)期效果;最終,預(yù)測模型在訓(xùn)練集上的約登指數(shù)、靈敏度、特異度、正確率為0.7661、0.8661、0.9000、0.8903,在測試集上的約登指數(shù)、靈敏度、特異度、正確率為0.6853、0.8364、0.8489、0.8454,各項(xiàng)指標(biāo)均處于較高水平。將預(yù)測模型與臨床上常用的前列腺癌診斷指標(biāo)tPSA、%fPSA、PSAD做比較,相應(yīng)的ROC曲線下的面積分別為0.933、0.798、0.827、0.894,說明本文構(gòu)建的預(yù)測模型具有更好的疾病區(qū)分能力,可以輔助臨床醫(yī)生對前列腺癌進(jìn)行診斷和治療,減少不必要的穿刺活檢,具有重要的臨床研究應(yīng)用價(jià)值。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 前列腺癌 主成分分析 BP神經(jīng)網(wǎng)絡(luò) 遺傳算法 ROC曲線
【學(xué)位授予單位】:北京理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:R737.25;TP311.13
【目錄】:
- 摘要5-6
- Abstract6-11
- 第1章 緒論11-19
- 1.1 研究背景和意義11-12
- 1.2 數(shù)據(jù)挖掘概述12-14
- 1.2.1 數(shù)據(jù)挖掘的定義12
- 1.2.2 數(shù)據(jù)挖掘的過程12-13
- 1.2.3 數(shù)據(jù)挖掘的功能13-14
- 1.3 前列腺癌概述14-17
- 1.3.1 前列腺癌的危險(xiǎn)因素15
- 1.3.2 前列腺癌的診斷方法15-16
- 1.3.3 前列腺癌的治療方法16-17
- 1.4 論文的組織結(jié)構(gòu)17-19
- 第2章 相關(guān)理論與技術(shù)19-42
- 2.1 主成分分析19-22
- 2.1.1 主成分分析的基本原理19
- 2.1.2 主成分分析的數(shù)學(xué)模型19-20
- 2.1.3 主成分的貢獻(xiàn)率20-21
- 2.1.4 主成分分析的算法步驟21-22
- 2.2 BP神經(jīng)網(wǎng)絡(luò)22-35
- 2.2.1 人工神經(jīng)網(wǎng)絡(luò)22-29
- 2.2.1.1 生物神經(jīng)元和人工神經(jīng)元23-28
- 2.2.1.2 人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)28
- 2.2.1.3 人工神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)28-29
- 2.2.2 BP神經(jīng)網(wǎng)絡(luò)29-35
- 2.2.2.1 BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)29
- 2.2.2.2 BP神經(jīng)網(wǎng)絡(luò)的算法原理29-33
- 2.2.2.3 BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程33-35
- 2.2.2.4 BP神經(jīng)網(wǎng)絡(luò)的特點(diǎn)35
- 2.3 遺傳算法35-41
- 2.3.1 遺傳算法的基本原理35-36
- 2.3.2 遺傳算法的基本術(shù)語36
- 2.3.3 遺傳算法的運(yùn)算流程36-41
- 2.4 本章小結(jié)41-42
- 第3章 研究數(shù)據(jù)42-59
- 3.1 數(shù)據(jù)來源42
- 3.2 數(shù)據(jù)預(yù)處理42-48
- 3.3 研究對象的確定48
- 3.3.1 納入標(biāo)準(zhǔn)48
- 3.3.2 排除標(biāo)準(zhǔn)48
- 3.3.3 分組48
- 3.4 數(shù)據(jù)初探48-56
- 3.4.1 數(shù)據(jù)的描述性統(tǒng)計(jì)48-49
- 3.4.2 患病情況與研究指標(biāo)間的關(guān)系49-53
- 3.4.3 研究指標(biāo)間的相關(guān)分析53-56
- 3.5 不平衡數(shù)據(jù)集的分類評價(jià)方法56-58
- 3.6 本章小結(jié)58-59
- 第4章 基于GA_BP神經(jīng)網(wǎng)絡(luò)的前列腺癌預(yù)測模型研究59-78
- 4.1 引言59-60
- 4.2 顯著預(yù)測因子的篩選60-61
- 4.3 主成分分析61-62
- 4.4 預(yù)測模型的構(gòu)建62-74
- 4.4.1 GA_BP算法62-63
- 4.4.2 設(shè)計(jì)思路63
- 4.4.3 具體實(shí)現(xiàn)63-74
- 4.4.3.1 數(shù)據(jù)歸一化63-65
- 4.4.3.2 確定網(wǎng)絡(luò)結(jié)構(gòu)65-67
- 4.4.3.3 GA優(yōu)化初始權(quán)值和閾值67-70
- 4.4.3.4 網(wǎng)絡(luò)訓(xùn)練與預(yù)測70-74
- 4.5 預(yù)測模型的評價(jià)74-77
- 4.6 本章小結(jié)77-78
- 第5章 總結(jié)與展望78-81
- 參考文獻(xiàn)81-86
- 攻讀學(xué)位期間發(fā)表論文與研究成果清單86-87
- 致謝87
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳明;;醫(yī)學(xué)數(shù)據(jù)挖掘綜述[J];醫(yī)學(xué)信息;2008年01期
2 黃秋燕;金京皓;沈岳龍;鄭暉;;數(shù)據(jù)挖掘在醫(yī)學(xué)信息中的應(yīng)用[J];醫(yī)學(xué)信息(上旬刊);2010年08期
3 孫哲豐;王迎利;;中國藥品電子監(jiān)管數(shù)據(jù)挖掘現(xiàn)狀的分析與思考[J];中國醫(yī)藥導(dǎo)刊;2014年06期
4 劉春艷,張愛連,胡鐵軍;數(shù)據(jù)挖掘及其在信息服務(wù)業(yè)應(yīng)用的研究現(xiàn)狀[J];醫(yī)學(xué)情報(bào)工作;2004年06期
5 ;統(tǒng)計(jì)分析與數(shù)據(jù)挖掘的優(yōu)秀工作平臺[J];中國醫(yī)院統(tǒng)計(jì);2006年02期
6 徐剛;袁兆康;;數(shù)據(jù)挖掘及其在醫(yī)學(xué)領(lǐng)域中的應(yīng)用和展望[J];實(shí)用臨床醫(yī)學(xué);2006年11期
7 黃艷玲;;數(shù)據(jù)挖掘在醫(yī)學(xué)領(lǐng)域中的文獻(xiàn)發(fā)展評價(jià)[J];現(xiàn)代醫(yī)院;2007年01期
8 丁維;蔣永光;宋姚屏;吳孟旭;李昆;;數(shù)據(jù)挖掘及其在中醫(yī)領(lǐng)域的應(yīng)用研究[J];數(shù)理醫(yī)藥學(xué)雜志;2007年03期
9 王華;江啟成;胡學(xué)鋼;;數(shù)據(jù)挖掘在醫(yī)學(xué)上的應(yīng)用[J];安徽醫(yī)藥;2008年08期
10 馬利;;基于數(shù)據(jù)挖掘的聚類分析和傳統(tǒng)聚類分析的對比研究[J];數(shù)理醫(yī)藥學(xué)雜志;2008年05期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應(yīng)用[A];中國計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國智能自動(dòng)化會(huì)議論文集(第二分冊)[C];2009年
10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報(bào);2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年
3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國電子報(bào);2002年
7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報(bào);2003年
8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報(bào);2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報(bào);2005年
10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年
2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年
4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評估與應(yīng)用[D];電子科技大學(xué);2015年
6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年
7 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問題研究與應(yīng)用[D];復(fù)旦大學(xué);2004年
8 李玉華;面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年
9 吳少智;時(shí)間序列數(shù)據(jù)挖掘在生物醫(yī)學(xué)中的應(yīng)用研究[D];電子科技大學(xué);2010年
10 王珊珊;知識指導(dǎo)下的數(shù)據(jù)挖掘在新聞和金融工具之間因果關(guān)系上的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識別與評價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年
2 張彥俊;游戲運(yùn)營中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年
4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺設(shè)計(jì)[D];江南大學(xué);2015年
5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年
6 戴陽陽;基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測研究與應(yīng)用[D];江南大學(xué);2015年
7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年
8 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年
9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識別模型的研究[D];昆明理工大學(xué);2015年
10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年
本文關(guān)鍵詞:基于數(shù)據(jù)挖掘的前列腺癌相關(guān)數(shù)據(jù)的研究,由筆耕文化傳播整理發(fā)布。
,本文編號:285204
本文鏈接:http://sikaile.net/yixuelunwen/mjlw/285204.html