天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用

發(fā)布時(shí)間:2020-07-13 03:33
【摘要】:隨著信息技術(shù)的發(fā)展,醫(yī)療方面產(chǎn)生了海量的醫(yī)學(xué)數(shù)據(jù),這些數(shù)據(jù)不僅體現(xiàn)在數(shù)量龐大、類型多樣和更新迅速,還體現(xiàn)在數(shù)據(jù)本身潛在的、有待于挖掘的價(jià)值。挖掘這些潛在的信息,對(duì)醫(yī)療檢查、腫瘤治療及醫(yī)療資源分配等具有重要的意義。本文利用一類數(shù)據(jù)挖掘算法對(duì)宮頸癌臨床數(shù)據(jù)進(jìn)行了分析研究,從中挖掘?qū)m頸癌的致病因素、檢查方法及推薦的治療手段等相關(guān)知識(shí),從而建立相應(yīng)分類決策模型。本文主要完成以下兩方面的工作:1.根據(jù)UCI數(shù)據(jù)庫(kù)Cervical Cancer(Risk Factors)數(shù)據(jù)集中委內(nèi)瑞拉加拉加斯醫(yī)院醫(yī)療數(shù)據(jù)的特點(diǎn),依次對(duì)該數(shù)據(jù)進(jìn)行預(yù)處理。首先,數(shù)據(jù)含有缺失值,本文采用直接刪除法和常數(shù)插補(bǔ)法相結(jié)合的方式處理缺失值;然后,由于數(shù)據(jù)是不平衡的,本文采用上采樣法對(duì)不平衡的數(shù)據(jù)進(jìn)行處理;最后,數(shù)據(jù)中存在連續(xù)屬性,本文以年齡為例采用等寬分箱法對(duì)連續(xù)屬性離散化,并通過(guò)信息值來(lái)衡量離散后的效果。2.本文利用一類數(shù)據(jù)挖掘算法對(duì)宮頸癌臨床數(shù)據(jù)的風(fēng)險(xiǎn)因素進(jìn)行評(píng)估,間接地可以轉(zhuǎn)為二分類問題,文中主要以決策樹(DT)、隨機(jī)森林(RF)和支持向量機(jī)(SVM)為主線,依次進(jìn)行實(shí)驗(yàn)。首先,創(chuàng)建決策樹分類模型,計(jì)算患病確診率和未患病的確診率;其次,對(duì)該模型進(jìn)行了兩次優(yōu)化,優(yōu)化(1):根據(jù)葉子節(jié)點(diǎn)含有的最小樣本數(shù)進(jìn)行優(yōu)化(MSSOLN-DT),優(yōu)化(2):對(duì)決策樹進(jìn)行剪枝優(yōu)化(PO-DT),將決策樹與兩次優(yōu)化的模型依次比較,結(jié)果顯示:MSSOLN-DT的重帶入誤差最小為0.0550和10折交叉驗(yàn)證誤差最小為0.1267,優(yōu)化后的比經(jīng)典的DT結(jié)構(gòu)都簡(jiǎn)單;然后,本文采用線性核函數(shù)作為SVM的核函數(shù),構(gòu)造SVM模型,計(jì)算患病確診率和未患病的確診率;最后,本文構(gòu)建了隨機(jī)森林模型,文中對(duì)比分析了決策樹、支持向量機(jī)和隨機(jī)森林創(chuàng)建的模型,通過(guò)分析比較,發(fā)現(xiàn)隨機(jī)森林構(gòu)建的模型在宮頸癌的分類識(shí)別中擁有較好的效果,當(dāng)檢測(cè)方法為“Hinselmann”時(shí),精確度最高為98.21%;當(dāng)檢測(cè)方法為“Schiller”時(shí),雖然精確度是4種檢測(cè)方法中最低的,但也達(dá)到了91.94%的效果。
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R737.33;TP311.13
【圖文】:

框圖,框圖,宮頸癌,數(shù)據(jù)挖掘算法


第二章是宮頸癌的基本理論。首先介紹了宮頸癌的背景和致病因素;其次介紹了目前宮頸癌的檢測(cè)方法;最后介紹了宮頸癌的治療手段。第三章是數(shù)據(jù)挖掘算法的基本理論。一方面,闡述了數(shù)據(jù)挖掘算法的演變過(guò)程和主要方法,詳細(xì)的介紹了預(yù)測(cè)模型法、數(shù)據(jù)分割法、關(guān)聯(lián)分析法以及偏離分析法等,這里主要介紹了決策樹、隨機(jī)森林及支持向量機(jī)三種數(shù)據(jù)挖掘算法,為后期的仿真實(shí)驗(yàn)做鋪墊。另一方面,討論了導(dǎo)致缺失值的原因,針對(duì)不同的原因依次舉例分析,歸納了缺失值的處理方法。第四章是仿真實(shí)驗(yàn)預(yù)處理。首先,介紹了分類問題處理流程;其次,對(duì)數(shù)據(jù)集給出詳細(xì)的說(shuō)明;然后,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括:缺失值處理、不平衡數(shù)據(jù)處還有連續(xù)屬性離散化等。第五章是仿真實(shí)驗(yàn)。首先基于第三章介紹的 DT 的理論框架,構(gòu)建了經(jīng)典 DT 模型,針對(duì) UCI 數(shù)據(jù)庫(kù)中宮頸癌實(shí)際的臨床數(shù)據(jù)特征屬性和實(shí)際數(shù)據(jù)潛在的性能,采用一類數(shù)據(jù)挖掘算法構(gòu)造模型,包括:DT、RF 及 SVM,對(duì)宮頸癌的臨床數(shù)據(jù)進(jìn)行智能診斷,挖掘出宮頸癌與特征屬性之間的關(guān)系,最后,將本文涉及到的這一類數(shù)據(jù)挖掘算法針對(duì)同樣的宮頸癌數(shù)據(jù),比較其泛化性能。

數(shù)據(jù)挖掘


第 3 章 數(shù)據(jù)挖掘基本理論與缺失值處理在處理大數(shù)據(jù)時(shí),DM 需要一個(gè)綜合性強(qiáng)、復(fù)雜度高且多方位優(yōu)化的系統(tǒng),DM技術(shù)以一個(gè)獨(dú)立的身份存在于處理大數(shù)據(jù)的整個(gè)系統(tǒng)中,與其他的模塊之間相輔相成、協(xié)調(diào)發(fā)展?傊,數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)時(shí)代下的地位是無(wú)可比擬的[34]。數(shù)據(jù)挖掘是是一門匯聚多個(gè)學(xué)科的交叉性學(xué)科,將數(shù)學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)可視化和機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的技術(shù)和相關(guān)專業(yè)知識(shí)相結(jié)合。DM 的主要方法如圖 3.2 所示:

體系結(jié)構(gòu)圖,體系結(jié)構(gòu),支持向量機(jī)


'xTrainx 直觀地看,對(duì)屬性 a Attr而言, 表示不存在缺失值時(shí)的樣本數(shù)據(jù)所占的比表示不存在缺失值樣本數(shù)據(jù)中第k 類所占的比例,vr~則表示不存在缺失值時(shí)樣本中在屬性a上取值va 的樣本所占的比例。其中 1~1~1||1 Vvviip ,r 。通過(guò)上述的公以將(3-2)式的信息增益變形為:Gain (T rain,a) Gain(Tain',a)(3-(3.10)可以將(3.16)式變型為:((')))~( ,)((') vVvvGain Traina EntTrainrEntTrain(3-2)支持向量機(jī)Corinna 和 Vapnik 等[39]于 1995 年首次共同提出了支持向量機(jī)(Support Veachine, SVM),這是一種分類算法[40],同時(shí)具備較強(qiáng)的分類和泛化能力,主要數(shù)據(jù)量小、非線性問題及函數(shù)擬合等機(jī)器學(xué)習(xí)問題。SVM 主要情況分為:線性、線性不可分還有非線性可分等[41]。支持向量機(jī)的體系結(jié)構(gòu)圖 3.3 所示:

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張珍;;云計(jì)算環(huán)境下的數(shù)據(jù)挖掘算法探究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2019年05期

2 劉小燕;;數(shù)據(jù)挖掘算法基于關(guān)聯(lián)規(guī)則的分析和應(yīng)用[J];課程教育研究;2017年11期

3 黃武鋒;;一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法[J];電腦編程技巧與維護(hù);2017年03期

4 張容;張勇;;基于數(shù)據(jù)挖掘算法的電子圖書館智能推薦技術(shù)研究[J];西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年07期

5 趙慧;王曉燕;;基于云計(jì)算的海量數(shù)據(jù)挖掘算法[J];產(chǎn)業(yè)與科技論壇;2015年16期

6 曹安林;;基于數(shù)據(jù)挖掘算法的創(chuàng)客校園質(zhì)量管理模型研究[J];現(xiàn)代職業(yè)教育;2017年10期

7 王曉艷;;數(shù)據(jù)挖掘算法的分析探討[J];硅谷;2014年02期

8 黃取治;;動(dòng)態(tài)云模型大規(guī)模數(shù)據(jù)挖掘算法[J];長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期

9 張慧霞;;常用數(shù)據(jù)挖掘算法的分析對(duì)比[J];河南科技;2014年19期

10 李珩;武雪芳;;基于云計(jì)算的數(shù)據(jù)挖掘算法研究[J];無(wú)線互聯(lián)科技;2013年12期

相關(guān)會(huì)議論文 前10條

1 任珂;牟冬梅;;四種典型數(shù)據(jù)挖掘算法在疾病防治中的研究現(xiàn)狀分析[A];中華醫(yī)學(xué)會(huì)第二十一次全國(guó)醫(yī)學(xué)信息學(xué)術(shù)會(huì)議論文匯編[C];2015年

2 劉玲;張興會(huì);;基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年

3 盛立;劉希玉;高明;;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(二)[C];2005年

4 賀煒;邢春曉;潘泉;;因果不完備條件下的數(shù)據(jù)挖掘算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年

5 陳曦;曾凡鋒;;數(shù)據(jù)挖掘算法在風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 陳正展;;基于決策樹的隱私保護(hù)數(shù)據(jù)挖掘算法[A];第六屆全國(guó)信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2012年

7 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年

8 潘國(guó)林;楊帆;;數(shù)據(jù)挖掘算法在保險(xiǎn)客戶分析中的應(yīng)用[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年

9 楊利軍;勾學(xué)榮;;數(shù)據(jù)挖掘在移動(dòng)客戶流失預(yù)測(cè)中的研究和應(yīng)用[A];2008年中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集(上冊(cè))[C];2009年

10 段成永;邱少明;盧剛;劉焱;;基于Map/Reduce模型的空情數(shù)據(jù)挖掘算法[A];2014第二屆中國(guó)指揮控制大會(huì)論文集(上)[C];2014年

相關(guān)重要報(bào)紙文章 前4條

1 ;選擇合適的數(shù)據(jù)挖掘算法[N];計(jì)算機(jī)世界;2007年

2 本報(bào)記者 吳玉征;Sybase加速“大數(shù)據(jù)”分析[N];計(jì)算機(jī)世界;2012年

3 本報(bào)記者 李建發(fā);從IT到DT:能源大數(shù)據(jù)帶來(lái)新價(jià)值[N];中國(guó)電力報(bào);2016年

4 吳朱華;大數(shù)據(jù)從“小”做起[N];網(wǎng)絡(luò)世界;2012年

相關(guān)博士學(xué)位論文 前10條

1 張靜;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[D];西北工業(yè)大學(xué);2006年

2 吳玨;隱私保護(hù)的數(shù)據(jù)挖掘算法研究[D];西南石油大學(xué);2012年

3 吳國(guó)清;科學(xué)計(jì)算時(shí)變數(shù)據(jù)集的數(shù)據(jù)挖掘算法研究[D];中國(guó)工程物理研究院;2009年

4 梁瑾;模糊粗糙單調(diào)數(shù)據(jù)挖掘算法及在污水處理中應(yīng)用研究[D];華南理工大學(xué);2011年

5 沈悅;基于導(dǎo)航通信多模應(yīng)用的位置服務(wù)技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

6 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

7 鞏建光;面向電信領(lǐng)域的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2012年

8 陳云開;基于粗糙集和聚類的數(shù)據(jù)挖掘算法及其在反洗錢中的應(yīng)用研究[D];華中科技大學(xué);2007年

9 魯萬(wàn);數(shù)據(jù)挖掘環(huán)境中隱私保護(hù)數(shù)據(jù)共享混合方法研究[D];大連海事大學(xué);2013年

10 范廣玲;基于數(shù)據(jù)挖掘的潛油電泵系統(tǒng)運(yùn)行評(píng)價(jià)研究[D];東北石油大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 呂丹;一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用[D];長(zhǎng)春工業(yè)大學(xué);2019年

2 鄭江帆;基于GPU的數(shù)據(jù)挖掘算法并行化研究[D];浙江工業(yè)大學(xué);2018年

3 許偉;基于遙感影像與C5.0數(shù)據(jù)挖掘算法的土壤制圖研究[D];華中農(nóng)業(yè)大學(xué);2018年

4 盧媛媛;大數(shù)據(jù)平臺(tái)下的數(shù)據(jù)挖掘算法設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)石油大學(xué)(北京);2017年

5 郭聞博;某型預(yù)警機(jī)雷達(dá)情報(bào)分析的數(shù)據(jù)挖掘算法研究[D];武漢理工大學(xué);2016年

6 郭娟娟;基于加權(quán)k近鄰的離群數(shù)據(jù)挖掘算法及并行化[D];太原科技大學(xué);2018年

7 耿美玲;基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法的研究[D];東北大學(xué);2015年

8 李玉廷;基于兩種數(shù)據(jù)挖掘算法的股骨頸預(yù)后評(píng)分分類[D];太原理工大學(xué);2017年

9 楊利鋒;基于低秩稀疏子空間的數(shù)據(jù)挖掘算法研究[D];廣西師范大學(xué);2017年

10 祁丹;基于分布式計(jì)算的數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2016年



本文編號(hào):2752898

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/fuchankeerkelunwen/2752898.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d4f5d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
亚洲国产丝袜一区二区三区四| 91人妻人人揉人人澡人| 国内九一激情白浆发布| 插进她的身体里在线观看骚| 超薄肉色丝袜脚一区二区| 国内精品一区二区欧美| 日韩国产传媒在线精品| 国产不卡最新在线视频| 99国产成人免费一区二区| 精品丝袜一区二区三区性色| 日韩一区欧美二区国产| 亚洲一区二区精品免费| 久久国产青偷人人妻潘金莲| 日本熟妇五十一区二区三区| 欧洲日韩精品一区二区三区| 98精品永久免费视频| 亚洲国产成人av毛片国产| 麻豆精品视频一二三区 | 欧美尤物在线视频91| 一区二区三区四区亚洲专区| 极品熟女一区二区三区| 国产丝袜美女诱惑一区二区| 一区二区三区日韩经典| 精品欧美日韩一区二区三区 | 精品香蕉国产一区二区三区| 国产免费一区二区三区av大片| 中文字幕乱码亚洲三区| 欧美性高清一区二区三区视频| 亚洲日本韩国一区二区三区| 91人妻人人澡人人人人精品| 国产一区二区不卡在线播放| 亚洲av秘片一区二区三区| 日本高清加勒比免费在线| 超碰在线免费公开中国黄片| 麻豆一区二区三区在线免费| 我的性感妹妹在线观看| 久久福利视频这里有精品| 国产一级一片内射视频在线| 日本不卡在线视频你懂的| 粗暴蹂躏中文一区二区三区| 国产精品乱子伦一区二区三区|