一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R737.33;TP311.13
【圖文】:
第二章是宮頸癌的基本理論。首先介紹了宮頸癌的背景和致病因素;其次介紹了目前宮頸癌的檢測(cè)方法;最后介紹了宮頸癌的治療手段。第三章是數(shù)據(jù)挖掘算法的基本理論。一方面,闡述了數(shù)據(jù)挖掘算法的演變過(guò)程和主要方法,詳細(xì)的介紹了預(yù)測(cè)模型法、數(shù)據(jù)分割法、關(guān)聯(lián)分析法以及偏離分析法等,這里主要介紹了決策樹、隨機(jī)森林及支持向量機(jī)三種數(shù)據(jù)挖掘算法,為后期的仿真實(shí)驗(yàn)做鋪墊。另一方面,討論了導(dǎo)致缺失值的原因,針對(duì)不同的原因依次舉例分析,歸納了缺失值的處理方法。第四章是仿真實(shí)驗(yàn)預(yù)處理。首先,介紹了分類問題處理流程;其次,對(duì)數(shù)據(jù)集給出詳細(xì)的說(shuō)明;然后,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括:缺失值處理、不平衡數(shù)據(jù)處還有連續(xù)屬性離散化等。第五章是仿真實(shí)驗(yàn)。首先基于第三章介紹的 DT 的理論框架,構(gòu)建了經(jīng)典 DT 模型,針對(duì) UCI 數(shù)據(jù)庫(kù)中宮頸癌實(shí)際的臨床數(shù)據(jù)特征屬性和實(shí)際數(shù)據(jù)潛在的性能,采用一類數(shù)據(jù)挖掘算法構(gòu)造模型,包括:DT、RF 及 SVM,對(duì)宮頸癌的臨床數(shù)據(jù)進(jìn)行智能診斷,挖掘出宮頸癌與特征屬性之間的關(guān)系,最后,將本文涉及到的這一類數(shù)據(jù)挖掘算法針對(duì)同樣的宮頸癌數(shù)據(jù),比較其泛化性能。
第 3 章 數(shù)據(jù)挖掘基本理論與缺失值處理在處理大數(shù)據(jù)時(shí),DM 需要一個(gè)綜合性強(qiáng)、復(fù)雜度高且多方位優(yōu)化的系統(tǒng),DM技術(shù)以一個(gè)獨(dú)立的身份存在于處理大數(shù)據(jù)的整個(gè)系統(tǒng)中,與其他的模塊之間相輔相成、協(xié)調(diào)發(fā)展?傊,數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)時(shí)代下的地位是無(wú)可比擬的[34]。數(shù)據(jù)挖掘是是一門匯聚多個(gè)學(xué)科的交叉性學(xué)科,將數(shù)學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)可視化和機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的技術(shù)和相關(guān)專業(yè)知識(shí)相結(jié)合。DM 的主要方法如圖 3.2 所示:
'xTrainx 直觀地看,對(duì)屬性 a Attr而言, 表示不存在缺失值時(shí)的樣本數(shù)據(jù)所占的比表示不存在缺失值樣本數(shù)據(jù)中第k 類所占的比例,vr~則表示不存在缺失值時(shí)樣本中在屬性a上取值va 的樣本所占的比例。其中 1~1~1||1 Vvviip ,r 。通過(guò)上述的公以將(3-2)式的信息增益變形為:Gain (T rain,a) Gain(Tain',a)(3-(3.10)可以將(3.16)式變型為:((')))~( ,)((') vVvvGain Traina EntTrainrEntTrain(3-2)支持向量機(jī)Corinna 和 Vapnik 等[39]于 1995 年首次共同提出了支持向量機(jī)(Support Veachine, SVM),這是一種分類算法[40],同時(shí)具備較強(qiáng)的分類和泛化能力,主要數(shù)據(jù)量小、非線性問題及函數(shù)擬合等機(jī)器學(xué)習(xí)問題。SVM 主要情況分為:線性、線性不可分還有非線性可分等[41]。支持向量機(jī)的體系結(jié)構(gòu)圖 3.3 所示:
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張珍;;云計(jì)算環(huán)境下的數(shù)據(jù)挖掘算法探究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2019年05期
2 劉小燕;;數(shù)據(jù)挖掘算法基于關(guān)聯(lián)規(guī)則的分析和應(yīng)用[J];課程教育研究;2017年11期
3 黃武鋒;;一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法[J];電腦編程技巧與維護(hù);2017年03期
4 張容;張勇;;基于數(shù)據(jù)挖掘算法的電子圖書館智能推薦技術(shù)研究[J];西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年07期
5 趙慧;王曉燕;;基于云計(jì)算的海量數(shù)據(jù)挖掘算法[J];產(chǎn)業(yè)與科技論壇;2015年16期
6 曹安林;;基于數(shù)據(jù)挖掘算法的創(chuàng)客校園質(zhì)量管理模型研究[J];現(xiàn)代職業(yè)教育;2017年10期
7 王曉艷;;數(shù)據(jù)挖掘算法的分析探討[J];硅谷;2014年02期
8 黃取治;;動(dòng)態(tài)云模型大規(guī)模數(shù)據(jù)挖掘算法[J];長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
9 張慧霞;;常用數(shù)據(jù)挖掘算法的分析對(duì)比[J];河南科技;2014年19期
10 李珩;武雪芳;;基于云計(jì)算的數(shù)據(jù)挖掘算法研究[J];無(wú)線互聯(lián)科技;2013年12期
相關(guān)會(huì)議論文 前10條
1 任珂;牟冬梅;;四種典型數(shù)據(jù)挖掘算法在疾病防治中的研究現(xiàn)狀分析[A];中華醫(yī)學(xué)會(huì)第二十一次全國(guó)醫(yī)學(xué)信息學(xué)術(shù)會(huì)議論文匯編[C];2015年
2 劉玲;張興會(huì);;基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年
3 盛立;劉希玉;高明;;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[A];山東省計(jì)算機(jī)學(xué)會(huì)2005年信息技術(shù)與信息化研討會(huì)論文集(二)[C];2005年
4 賀煒;邢春曉;潘泉;;因果不完備條件下的數(shù)據(jù)挖掘算法[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
5 陳曦;曾凡鋒;;數(shù)據(jù)挖掘算法在風(fēng)險(xiǎn)評(píng)估中的應(yīng)用[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
6 陳正展;;基于決策樹的隱私保護(hù)數(shù)據(jù)挖掘算法[A];第六屆全國(guó)信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2012年
7 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
8 潘國(guó)林;楊帆;;數(shù)據(jù)挖掘算法在保險(xiǎn)客戶分析中的應(yīng)用[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
9 楊利軍;勾學(xué)榮;;數(shù)據(jù)挖掘在移動(dòng)客戶流失預(yù)測(cè)中的研究和應(yīng)用[A];2008年中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集(上冊(cè))[C];2009年
10 段成永;邱少明;盧剛;劉焱;;基于Map/Reduce模型的空情數(shù)據(jù)挖掘算法[A];2014第二屆中國(guó)指揮控制大會(huì)論文集(上)[C];2014年
相關(guān)重要報(bào)紙文章 前4條
1 ;選擇合適的數(shù)據(jù)挖掘算法[N];計(jì)算機(jī)世界;2007年
2 本報(bào)記者 吳玉征;Sybase加速“大數(shù)據(jù)”分析[N];計(jì)算機(jī)世界;2012年
3 本報(bào)記者 李建發(fā);從IT到DT:能源大數(shù)據(jù)帶來(lái)新價(jià)值[N];中國(guó)電力報(bào);2016年
4 吳朱華;大數(shù)據(jù)從“小”做起[N];網(wǎng)絡(luò)世界;2012年
相關(guān)博士學(xué)位論文 前10條
1 張靜;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[D];西北工業(yè)大學(xué);2006年
2 吳玨;隱私保護(hù)的數(shù)據(jù)挖掘算法研究[D];西南石油大學(xué);2012年
3 吳國(guó)清;科學(xué)計(jì)算時(shí)變數(shù)據(jù)集的數(shù)據(jù)挖掘算法研究[D];中國(guó)工程物理研究院;2009年
4 梁瑾;模糊粗糙單調(diào)數(shù)據(jù)挖掘算法及在污水處理中應(yīng)用研究[D];華南理工大學(xué);2011年
5 沈悅;基于導(dǎo)航通信多模應(yīng)用的位置服務(wù)技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
6 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
7 鞏建光;面向電信領(lǐng)域的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2012年
8 陳云開;基于粗糙集和聚類的數(shù)據(jù)挖掘算法及其在反洗錢中的應(yīng)用研究[D];華中科技大學(xué);2007年
9 魯萬(wàn);數(shù)據(jù)挖掘環(huán)境中隱私保護(hù)數(shù)據(jù)共享混合方法研究[D];大連海事大學(xué);2013年
10 范廣玲;基于數(shù)據(jù)挖掘的潛油電泵系統(tǒng)運(yùn)行評(píng)價(jià)研究[D];東北石油大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 呂丹;一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用[D];長(zhǎng)春工業(yè)大學(xué);2019年
2 鄭江帆;基于GPU的數(shù)據(jù)挖掘算法并行化研究[D];浙江工業(yè)大學(xué);2018年
3 許偉;基于遙感影像與C5.0數(shù)據(jù)挖掘算法的土壤制圖研究[D];華中農(nóng)業(yè)大學(xué);2018年
4 盧媛媛;大數(shù)據(jù)平臺(tái)下的數(shù)據(jù)挖掘算法設(shè)計(jì)與實(shí)現(xiàn)[D];中國(guó)石油大學(xué)(北京);2017年
5 郭聞博;某型預(yù)警機(jī)雷達(dá)情報(bào)分析的數(shù)據(jù)挖掘算法研究[D];武漢理工大學(xué);2016年
6 郭娟娟;基于加權(quán)k近鄰的離群數(shù)據(jù)挖掘算法及并行化[D];太原科技大學(xué);2018年
7 耿美玲;基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法的研究[D];東北大學(xué);2015年
8 李玉廷;基于兩種數(shù)據(jù)挖掘算法的股骨頸預(yù)后評(píng)分分類[D];太原理工大學(xué);2017年
9 楊利鋒;基于低秩稀疏子空間的數(shù)據(jù)挖掘算法研究[D];廣西師范大學(xué);2017年
10 祁丹;基于分布式計(jì)算的數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2016年
本文編號(hào):2752898
本文鏈接:http://sikaile.net/yixuelunwen/fuchankeerkelunwen/2752898.html