乳腺癌數(shù)據(jù)分析與計算建模
發(fā)布時間:2021-01-17 19:51
在女性癌癥中,乳腺癌的發(fā)病率最高。早期診斷和治療對于降低乳腺癌的發(fā)病率和死亡率非常重要。計算機輔助診斷系統(tǒng)可以有效提高乳腺癌的診斷準(zhǔn)確性和診斷效率。但是,目前缺少對乳腺腫瘤不同檢測特征之間的關(guān)系以及不同特征診斷價值的研究。此外,大部分機器學(xué)習(xí)算法需要人為設(shè)置參數(shù),然而選擇合適的參數(shù)是比較困難的。為了解決上述問題,本論文主要研究了如下問題:(1)利用貝葉斯網(wǎng)絡(luò)定量分析乳腺癌超聲檢查與細針穿刺細胞學(xué)(FNAC)檢查中不同特征的診斷價值,以及不同乳腺癌特征之間的關(guān)系。該研究結(jié)果表明:不同特征之間存在不同程度的影響;不同特征的診斷價值不同,在超聲檢查中,形態(tài)的診斷價值最高;在FNAC中裸核的診斷價值最高。(2)利用異常檢測算法診斷乳腺癌,并研究基于水平集方法的異常檢測技術(shù),提出利用水平集方法診斷乳腺癌的方案。實驗結(jié)果表明:K-means算法診斷超聲檢查的性能最好;K近鄰算法診斷FNAC的性能最好。水平集方法描述數(shù)據(jù)的性能很好。(3)利用不同缺失數(shù)據(jù)處理方法處理兩組乳腺癌數(shù)據(jù)中的缺失值。實驗結(jié)果表明:當(dāng)超聲特征中存在缺失數(shù)據(jù)時,不同特征應(yīng)該選擇不同的方法處理;對于FNAC特征中的缺失數(shù)據(jù),隨機森...
【文章來源】:福建師范大學(xué)福建省
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1.兩個相連節(jié)點之間的四種不同的影響關(guān)系??
個惡性腫瘤病例)。將FNAC數(shù)據(jù)隨機分為包括355個樣本的訓(xùn)練數(shù)據(jù)集(230個良??性腫瘤病例和125個惡性腫瘤病例)和包括328個樣本的測試數(shù)據(jù)集(214個良性??腫瘤病例和114個惡性腫瘤病例)。利用十折交叉檢驗方法測試,得到如圖2-2所示??的貝葉斯網(wǎng)絡(luò)模型。在圖2-2中,一個長方形表示一個變量(特征),在每個長方形??中包括變量的名稱,每個變量的所有狀態(tài)以及在訓(xùn)練數(shù)據(jù)集中,每個變量中不同狀??態(tài)的比例,并用條形圖表示出來。連接兩個變量的有向線段表明兩個變量之間存在??一定的關(guān)系,有向線段的寬度表示程度,線段越寬表明兩者的關(guān)系越強。在圖2-2??中,將“Diagnosis”節(jié)點設(shè)置為目標(biāo)節(jié)點,其他節(jié)點均為非目標(biāo)節(jié)點,根據(jù)圖2-2??所示的節(jié)點之間的影響關(guān)系,該網(wǎng)絡(luò)可以分析其他節(jié)點對“Diagnosis”的影響;同??時可以分析其他相連節(jié)的非目標(biāo)節(jié)點之間的相互影響。??圖2-2?(a)為基于超聲檢查數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)結(jié)構(gòu)說明SH、RI、??CA和BS都對Diagnosis節(jié)點有影響;SH與RI、BS之間存在影響關(guān)系
福建師范大學(xué)軟件工程碩士學(xué)位論文??圖2-3?(a)和(b)分別為乳腺腫瘤超聲檢查特征和FNAC檢查特征對乳腺腫??瘤診斷的影響強度。例如在圖2-3?(a)中可以看出,SH對乳腺腫瘤診斷的影響最??大,SI=0.3201;其次依次為RI、CA和BS。這意味著在超聲檢查的四個特征中“SH”??的診斷價值最高。在圖2-3?(b)中可以看出,BANU對診斷的影響強度為0.379,??是FNAC診斷中診斷價值最高的特征。圖2-4對不同非目標(biāo)特征之間相互依賴強度??進行定量分析。其中,我們用*1?(*代替特征的名稱,例如SH1)表示產(chǎn)生影響者,??圖中的橫坐標(biāo)表示被影響者。圖2-4?(a)表示,SH對RI和BS的影響強度分別為??0.1452和0.1465?(菱形標(biāo)記),RI對SH的影響強度為0.2269?(正方形標(biāo)記),BS??對SH的影響強度為0.1415?(三角形標(biāo)記),RI和BS之間影響強度比較大,分別為??0.4398和0.4246。在圖2-4?(b)中可以看出UCSI和UCSH之間的影響強度最大。??"?參?參籲??OJ???.?參擊????#??02¥?^???0J?*??%??g?0.2?■?0
【參考文獻】:
期刊論文
[1]基于R語言的缺失數(shù)據(jù)及刪失數(shù)據(jù)處理[J]. 張靈婕,尤添革. 福建電腦. 2017(12)
[2]中國女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬青,鄭榮壽. 中國腫瘤臨床. 2015(13)
[3]追蹤研究中缺失數(shù)據(jù)處理方法及應(yīng)用現(xiàn)狀分析[J]. 葉素靜,唐文清,張敏強,曹魏聰. 心理科學(xué)進展. 2014(12)
本文編號:2983492
【文章來源】:福建師范大學(xué)福建省
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1.兩個相連節(jié)點之間的四種不同的影響關(guān)系??
個惡性腫瘤病例)。將FNAC數(shù)據(jù)隨機分為包括355個樣本的訓(xùn)練數(shù)據(jù)集(230個良??性腫瘤病例和125個惡性腫瘤病例)和包括328個樣本的測試數(shù)據(jù)集(214個良性??腫瘤病例和114個惡性腫瘤病例)。利用十折交叉檢驗方法測試,得到如圖2-2所示??的貝葉斯網(wǎng)絡(luò)模型。在圖2-2中,一個長方形表示一個變量(特征),在每個長方形??中包括變量的名稱,每個變量的所有狀態(tài)以及在訓(xùn)練數(shù)據(jù)集中,每個變量中不同狀??態(tài)的比例,并用條形圖表示出來。連接兩個變量的有向線段表明兩個變量之間存在??一定的關(guān)系,有向線段的寬度表示程度,線段越寬表明兩者的關(guān)系越強。在圖2-2??中,將“Diagnosis”節(jié)點設(shè)置為目標(biāo)節(jié)點,其他節(jié)點均為非目標(biāo)節(jié)點,根據(jù)圖2-2??所示的節(jié)點之間的影響關(guān)系,該網(wǎng)絡(luò)可以分析其他節(jié)點對“Diagnosis”的影響;同??時可以分析其他相連節(jié)的非目標(biāo)節(jié)點之間的相互影響。??圖2-2?(a)為基于超聲檢查數(shù)據(jù)的貝葉斯網(wǎng)絡(luò)模型,該網(wǎng)絡(luò)結(jié)構(gòu)說明SH、RI、??CA和BS都對Diagnosis節(jié)點有影響;SH與RI、BS之間存在影響關(guān)系
福建師范大學(xué)軟件工程碩士學(xué)位論文??圖2-3?(a)和(b)分別為乳腺腫瘤超聲檢查特征和FNAC檢查特征對乳腺腫??瘤診斷的影響強度。例如在圖2-3?(a)中可以看出,SH對乳腺腫瘤診斷的影響最??大,SI=0.3201;其次依次為RI、CA和BS。這意味著在超聲檢查的四個特征中“SH”??的診斷價值最高。在圖2-3?(b)中可以看出,BANU對診斷的影響強度為0.379,??是FNAC診斷中診斷價值最高的特征。圖2-4對不同非目標(biāo)特征之間相互依賴強度??進行定量分析。其中,我們用*1?(*代替特征的名稱,例如SH1)表示產(chǎn)生影響者,??圖中的橫坐標(biāo)表示被影響者。圖2-4?(a)表示,SH對RI和BS的影響強度分別為??0.1452和0.1465?(菱形標(biāo)記),RI對SH的影響強度為0.2269?(正方形標(biāo)記),BS??對SH的影響強度為0.1415?(三角形標(biāo)記),RI和BS之間影響強度比較大,分別為??0.4398和0.4246。在圖2-4?(b)中可以看出UCSI和UCSH之間的影響強度最大。??"?參?參籲??OJ???.?參擊????#??02¥?^???0J?*??%??g?0.2?■?0
【參考文獻】:
期刊論文
[1]基于R語言的缺失數(shù)據(jù)及刪失數(shù)據(jù)處理[J]. 張靈婕,尤添革. 福建電腦. 2017(12)
[2]中國女性乳腺癌發(fā)病死亡和生存狀況[J]. 陳萬青,鄭榮壽. 中國腫瘤臨床. 2015(13)
[3]追蹤研究中缺失數(shù)據(jù)處理方法及應(yīng)用現(xiàn)狀分析[J]. 葉素靜,唐文清,張敏強,曹魏聰. 心理科學(xué)進展. 2014(12)
本文編號:2983492
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2983492.html
最近更新
教材專著