一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用
【學(xué)位授予單位】:長春工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:R737.33;TP311.13
【圖文】:
第二章是宮頸癌的基本理論。首先介紹了宮頸癌的背景和致病因素;其次介紹了目前宮頸癌的檢測方法;最后介紹了宮頸癌的治療手段。第三章是數(shù)據(jù)挖掘算法的基本理論。一方面,闡述了數(shù)據(jù)挖掘算法的演變過程和主要方法,詳細(xì)的介紹了預(yù)測模型法、數(shù)據(jù)分割法、關(guān)聯(lián)分析法以及偏離分析法等,這里主要介紹了決策樹、隨機(jī)森林及支持向量機(jī)三種數(shù)據(jù)挖掘算法,為后期的仿真實(shí)驗(yàn)做鋪墊。另一方面,討論了導(dǎo)致缺失值的原因,針對不同的原因依次舉例分析,歸納了缺失值的處理方法。第四章是仿真實(shí)驗(yàn)預(yù)處理。首先,介紹了分類問題處理流程;其次,對數(shù)據(jù)集給出詳細(xì)的說明;然后,對數(shù)據(jù)進(jìn)行預(yù)處理,包括:缺失值處理、不平衡數(shù)據(jù)處還有連續(xù)屬性離散化等。第五章是仿真實(shí)驗(yàn)。首先基于第三章介紹的 DT 的理論框架,構(gòu)建了經(jīng)典 DT 模型,針對 UCI 數(shù)據(jù)庫中宮頸癌實(shí)際的臨床數(shù)據(jù)特征屬性和實(shí)際數(shù)據(jù)潛在的性能,采用一類數(shù)據(jù)挖掘算法構(gòu)造模型,包括:DT、RF 及 SVM,對宮頸癌的臨床數(shù)據(jù)進(jìn)行智能診斷,挖掘出宮頸癌與特征屬性之間的關(guān)系,最后,將本文涉及到的這一類數(shù)據(jù)挖掘算法針對同樣的宮頸癌數(shù)據(jù),比較其泛化性能。
第 3 章 數(shù)據(jù)挖掘基本理論與缺失值處理在處理大數(shù)據(jù)時,DM 需要一個綜合性強(qiáng)、復(fù)雜度高且多方位優(yōu)化的系統(tǒng),DM技術(shù)以一個獨(dú)立的身份存在于處理大數(shù)據(jù)的整個系統(tǒng)中,與其他的模塊之間相輔相成、協(xié)調(diào)發(fā)展?傊,數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)時代下的地位是無可比擬的[34]。數(shù)據(jù)挖掘是是一門匯聚多個學(xué)科的交叉性學(xué)科,將數(shù)學(xué)、統(tǒng)計學(xué)、人工智能、數(shù)據(jù)可視化和機(jī)器學(xué)習(xí)等多個領(lǐng)域的技術(shù)和相關(guān)專業(yè)知識相結(jié)合。DM 的主要方法如圖 3.2 所示:
'xTrainx 直觀地看,對屬性 a Attr而言, 表示不存在缺失值時的樣本數(shù)據(jù)所占的比表示不存在缺失值樣本數(shù)據(jù)中第k 類所占的比例,vr~則表示不存在缺失值時樣本中在屬性a上取值va 的樣本所占的比例。其中 1~1~1||1 Vvviip ,r 。通過上述的公以將(3-2)式的信息增益變形為:Gain (T rain,a) Gain(Tain',a)(3-(3.10)可以將(3.16)式變型為:((')))~( ,)((') vVvvGain Traina EntTrainrEntTrain(3-2)支持向量機(jī)Corinna 和 Vapnik 等[39]于 1995 年首次共同提出了支持向量機(jī)(Support Veachine, SVM),這是一種分類算法[40],同時具備較強(qiáng)的分類和泛化能力,主要數(shù)據(jù)量小、非線性問題及函數(shù)擬合等機(jī)器學(xué)習(xí)問題。SVM 主要情況分為:線性、線性不可分還有非線性可分等[41]。支持向量機(jī)的體系結(jié)構(gòu)圖 3.3 所示:
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張珍;;云計算環(huán)境下的數(shù)據(jù)挖掘算法探究[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2019年05期
2 劉小燕;;數(shù)據(jù)挖掘算法基于關(guān)聯(lián)規(guī)則的分析和應(yīng)用[J];課程教育研究;2017年11期
3 黃武鋒;;一種基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法[J];電腦編程技巧與維護(hù);2017年03期
4 張容;張勇;;基于數(shù)據(jù)挖掘算法的電子圖書館智能推薦技術(shù)研究[J];西南師范大學(xué)學(xué)報(自然科學(xué)版);2017年07期
5 趙慧;王曉燕;;基于云計算的海量數(shù)據(jù)挖掘算法[J];產(chǎn)業(yè)與科技論壇;2015年16期
6 曹安林;;基于數(shù)據(jù)挖掘算法的創(chuàng)客校園質(zhì)量管理模型研究[J];現(xiàn)代職業(yè)教育;2017年10期
7 王曉艷;;數(shù)據(jù)挖掘算法的分析探討[J];硅谷;2014年02期
8 黃取治;;動態(tài)云模型大規(guī)模數(shù)據(jù)挖掘算法[J];長春工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2014年03期
9 張慧霞;;常用數(shù)據(jù)挖掘算法的分析對比[J];河南科技;2014年19期
10 李珩;武雪芳;;基于云計算的數(shù)據(jù)挖掘算法研究[J];無線互聯(lián)科技;2013年12期
相關(guān)會議論文 前10條
1 任珂;牟冬梅;;四種典型數(shù)據(jù)挖掘算法在疾病防治中的研究現(xiàn)狀分析[A];中華醫(yī)學(xué)會第二十一次全國醫(yī)學(xué)信息學(xué)術(shù)會議論文匯編[C];2015年
2 劉玲;張興會;;基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究[A];全國第二屆信號處理與應(yīng)用學(xué)術(shù)會議?痆C];2008年
3 盛立;劉希玉;高明;;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[A];山東省計算機(jī)學(xué)會2005年信息技術(shù)與信息化研討會論文集(二)[C];2005年
4 賀煒;邢春曉;潘泉;;因果不完備條件下的數(shù)據(jù)挖掘算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
5 陳曦;曾凡鋒;;數(shù)據(jù)挖掘算法在風(fēng)險評估中的應(yīng)用[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
6 陳正展;;基于決策樹的隱私保護(hù)數(shù)據(jù)挖掘算法[A];第六屆全國信號和智能信息處理與應(yīng)用學(xué)術(shù)會議論文集[C];2012年
7 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計算機(jī)模擬與信息技術(shù)學(xué)術(shù)會議論文集[C];2011年
8 潘國林;楊帆;;數(shù)據(jù)挖掘算法在保險客戶分析中的應(yīng)用[A];全國第20屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集(上冊)[C];2009年
9 楊利軍;勾學(xué)榮;;數(shù)據(jù)挖掘在移動客戶流失預(yù)測中的研究和應(yīng)用[A];2008年中國高校通信類院系學(xué)術(shù)研討會論文集(上冊)[C];2009年
10 段成永;邱少明;盧剛;劉焱;;基于Map/Reduce模型的空情數(shù)據(jù)挖掘算法[A];2014第二屆中國指揮控制大會論文集(上)[C];2014年
相關(guān)重要報紙文章 前4條
1 ;選擇合適的數(shù)據(jù)挖掘算法[N];計算機(jī)世界;2007年
2 本報記者 吳玉征;Sybase加速“大數(shù)據(jù)”分析[N];計算機(jī)世界;2012年
3 本報記者 李建發(fā);從IT到DT:能源大數(shù)據(jù)帶來新價值[N];中國電力報;2016年
4 吳朱華;大數(shù)據(jù)從“小”做起[N];網(wǎng)絡(luò)世界;2012年
相關(guān)博士學(xué)位論文 前10條
1 張靜;基于粗糙集理論的數(shù)據(jù)挖掘算法研究[D];西北工業(yè)大學(xué);2006年
2 吳玨;隱私保護(hù)的數(shù)據(jù)挖掘算法研究[D];西南石油大學(xué);2012年
3 吳國清;科學(xué)計算時變數(shù)據(jù)集的數(shù)據(jù)挖掘算法研究[D];中國工程物理研究院;2009年
4 梁瑾;模糊粗糙單調(diào)數(shù)據(jù)挖掘算法及在污水處理中應(yīng)用研究[D];華南理工大學(xué);2011年
5 沈悅;基于導(dǎo)航通信多模應(yīng)用的位置服務(wù)技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2012年
6 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
7 鞏建光;面向電信領(lǐng)域的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2012年
8 陳云開;基于粗糙集和聚類的數(shù)據(jù)挖掘算法及其在反洗錢中的應(yīng)用研究[D];華中科技大學(xué);2007年
9 魯萬;數(shù)據(jù)挖掘環(huán)境中隱私保護(hù)數(shù)據(jù)共享混合方法研究[D];大連海事大學(xué);2013年
10 范廣玲;基于數(shù)據(jù)挖掘的潛油電泵系統(tǒng)運(yùn)行評價研究[D];東北石油大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 呂丹;一類數(shù)據(jù)挖掘算法及其在宮頸癌智能診斷中的應(yīng)用[D];長春工業(yè)大學(xué);2019年
2 鄭江帆;基于GPU的數(shù)據(jù)挖掘算法并行化研究[D];浙江工業(yè)大學(xué);2018年
3 許偉;基于遙感影像與C5.0數(shù)據(jù)挖掘算法的土壤制圖研究[D];華中農(nóng)業(yè)大學(xué);2018年
4 盧媛媛;大數(shù)據(jù)平臺下的數(shù)據(jù)挖掘算法設(shè)計與實(shí)現(xiàn)[D];中國石油大學(xué)(北京);2017年
5 郭聞博;某型預(yù)警機(jī)雷達(dá)情報分析的數(shù)據(jù)挖掘算法研究[D];武漢理工大學(xué);2016年
6 郭娟娟;基于加權(quán)k近鄰的離群數(shù)據(jù)挖掘算法及并行化[D];太原科技大學(xué);2018年
7 耿美玲;基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法的研究[D];東北大學(xué);2015年
8 李玉廷;基于兩種數(shù)據(jù)挖掘算法的股骨頸預(yù)后評分分類[D];太原理工大學(xué);2017年
9 楊利鋒;基于低秩稀疏子空間的數(shù)據(jù)挖掘算法研究[D];廣西師范大學(xué);2017年
10 祁丹;基于分布式計算的數(shù)據(jù)挖掘算法研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2016年
本文編號:2752898
本文鏈接:http://sikaile.net/yixuelunwen/fuchankeerkelunwen/2752898.html