基于機(jī)器學(xué)習(xí)的胸部X光片分類及胸部病變定位方法研究
發(fā)布時(shí)間:2020-04-23 04:12
【摘要】:肺癌在世界范圍內(nèi)都是發(fā)病率及死亡率較高的癌癥之一。2015年,肺癌新發(fā)病例在中國約429.2萬新發(fā)癌癥病例中占17.1%(73.3萬例),死亡病例占總體癌癥死亡病例的21.1%(61萬例/281.4萬例),在中國肺癌已成為因癌致死的主要疾病。罹患肺癌的原因復(fù)雜,涉及基因及遺傳改變。雖然近年來隨著公眾健康知識(shí)的整體提高,環(huán)境污染、空氣污染的改善,醫(yī)療水平的提高以及臨床有效藥物的使用,肺癌的治療效果有了很大的提高。但晚期肺癌患者的死亡率仍處在較高的水平,所以早期診斷成為肺癌防治的關(guān)鍵。臨床肺癌初步篩查主要是依靠影像學(xué)證據(jù)判斷,常見檢查方式有胸部X光片與計(jì)算機(jī)斷層掃描。計(jì)算機(jī)斷層掃描(Computer Tomography,CT)是采用計(jì)算機(jī)控制下的X射線通過人體組織顯現(xiàn)出不同密度影像來進(jìn)行對(duì)比診斷,較傳統(tǒng)胸部X射線圖像有著靈敏度高、誤診率低等特點(diǎn)。由于X射線本身有使基因突變的潛在可能,所有有學(xué)者認(rèn)為CT檢查存在患者接受射線輻射量較高等風(fēng)險(xiǎn)。相較CT檢查,X光片檢查具有輻射量小、檢查費(fèi)用低廉、設(shè)備普及等優(yōu)勢,尤其是在第三世界經(jīng)濟(jì)欠發(fā)達(dá)國家,X光片檢查更易于普通人群接受。所以X光片檢查在實(shí)際臨床肺癌篩查、相關(guān)肺部疾病的診斷工作中仍具有一定的意義。圖像識(shí)別是利用計(jì)算機(jī)算法對(duì)圖像進(jìn)行處理分析,從而達(dá)到識(shí)別不同目標(biāo)與對(duì)象的技術(shù)。圖像識(shí)別一直以來都是計(jì)算機(jī)視覺研究的一個(gè)重要方向。圖像識(shí)別定位技術(shù)可以有效處理特定目標(biāo)的檢測和識(shí)別,可以對(duì)圖像進(jìn)行分類及目標(biāo)定位判斷。目前圖像識(shí)別技術(shù)在圖像搜索、目標(biāo)行為分析、無人機(jī)、自動(dòng)駕駛等高新產(chǎn)業(yè)與生物醫(yī)學(xué)、地質(zhì)學(xué)等很多學(xué)科都有廣闊的應(yīng)用前景。圖像識(shí)別早期主要采用方向梯度直方圖(Histogram of oriented gradients,HOG)、尺度不便特征變換(Scale invariant feature transform,SIFT)等一些特征提取方法,將提取到的特征通過分類器進(jìn)行分類識(shí)別。該類方法的特征提取工作是主觀手工設(shè)計(jì)的,不同的應(yīng)用、特征的不同選擇都會(huì)對(duì)整體系統(tǒng)的性能產(chǎn)生直接影響。早期圖像識(shí)別任務(wù)都是針對(duì)特定識(shí)別對(duì)象的,不具有泛化能力,并且樣本規(guī)模較小,在實(shí)際應(yīng)用中難以達(dá)到較高的識(shí)別要求。近年來,隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于圖像識(shí)別任務(wù)的成功案例越來越多。深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)的研究范疇,給機(jī)器學(xué)習(xí)帶來新一輪浪潮。深度學(xué)習(xí)在圖像識(shí)別領(lǐng)域、語音識(shí)別方面均取得了重大突破,解決了傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)加深后的梯度彌散問題,使圖像識(shí)別中的特征提取由人工設(shè)計(jì)轉(zhuǎn)化為自動(dòng)獲取。機(jī)器學(xué)習(xí)輔助胸片診斷研究可分為2部分研究任務(wù),一部分為:含有病變的陽性胸片與無病變的陰性胸片的分類方法研究;另一部分是陽性胸片中的病變檢測定位方法研究。本文就全面分析可用于以上兩項(xiàng)任務(wù)的模型的基礎(chǔ)上,用重新設(shè)計(jì)分類網(wǎng)絡(luò)、優(yōu)化建議框生成策略、加入新功能層、使用有效激活函數(shù)、特征提取網(wǎng)絡(luò)替換、梯度信息動(dòng)態(tài)修正、二階優(yōu)化算法、影響函數(shù)算法的思想,提出了3個(gè)新胸片分類模型、3個(gè)新胸片病變檢測模型。研究結(jié)果表明,本文所提出的新模型,可以更好的適用于胸片分類任務(wù)與胸片病變檢測任務(wù),拓展了計(jì)算機(jī)輔助胸片診斷的應(yīng)用范圍與深度。論文的主要研究內(nèi)容和結(jié)果包括以下幾個(gè)方面:(1)針對(duì)胸片分類任務(wù),對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法進(jìn)行了研究,針對(duì)圖像數(shù)據(jù)過大問題,對(duì)主成分分析法在胸片分類任務(wù)中的應(yīng)用進(jìn)行了研究。其次針對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)算法難于理解二維圖像信息這一問題進(jìn)行了分析,提出使用基于卷積的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行胸片分類任務(wù),考慮到深度網(wǎng)絡(luò)分類層神經(jīng)元數(shù)量變化劇烈問題,重新設(shè)計(jì)了全連接層,提出了FC-migreatd-ResNet深度分類模型,該模型在胸片分類數(shù)據(jù)庫上的較強(qiáng)分類性能通過實(shí)驗(yàn)得到了驗(yàn)證,分類效果優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)模型與原深度分類模型。(2)針對(duì)胸片病變檢測任務(wù),對(duì)Fast-RCNN模型進(jìn)行了研究,該模型中的多任務(wù)網(wǎng)絡(luò)中通過使用Dropout策略去降低模型對(duì)訓(xùn)練集發(fā)生過擬合的可能性,為了提高模型的病變檢測性能,受到Inception網(wǎng)絡(luò)的啟發(fā),本文提出VGG-19-BN模型,該模型去除了Dropout策略,加入了Batch Normalization層,使得多任務(wù)網(wǎng)絡(luò)中的各層輸出標(biāo)準(zhǔn)化,降低了不同樣本間的差異性。新模型在胸片病變數(shù)據(jù)庫中得到了驗(yàn)證,相較原Fast-RCNN模型提高了病變檢測性能。(3)針對(duì)胸片病變檢測任務(wù),對(duì)Faster-RCNN模型進(jìn)行了研究,該模型使用卷積RPN網(wǎng)絡(luò)生成用于訓(xùn)練網(wǎng)絡(luò)的建議框,原算法中的9-anchors建議框生成策略會(huì)產(chǎn)生過多的低質(zhì)量建議框,降低了模型病變檢測效果,本文首先對(duì)胸片病變數(shù)據(jù)庫中的標(biāo)注框進(jìn)行了統(tǒng)計(jì),提出了4-anchors建議框生成策略,其次,對(duì)比了ResNet與VGG兩種特征提取網(wǎng)絡(luò)在特征提取任務(wù)中的性能,最終提出ResNet-4anchors胸片病變檢測模型。通過對(duì)胸片病變數(shù)據(jù)庫中的病變檢測,新模型較原模型病變檢測性能提升明顯。(4)針對(duì)高閾值病變檢測任務(wù),對(duì)YOLO三種模型進(jìn)行了研究。使用胸片病變數(shù)據(jù)庫進(jìn)行了優(yōu)勢模型對(duì)比,結(jié)果顯示YOLOv3模型在高閾值病變檢測任務(wù)中檢測性能更高。為了更好的完成高閾值病變檢測任務(wù),降低病變漏檢率,通過對(duì)YOLOv3網(wǎng)絡(luò)結(jié)構(gòu)分析,發(fā)現(xiàn)多個(gè)卷積層特征圖數(shù)量減少過快,有丟失信息的可能,于是加入多個(gè)卷積核為1 × 1的卷積層,提出了YOLOv3-domain目標(biāo)檢測網(wǎng)絡(luò),新模型在胸片病變數(shù)據(jù)庫上得到驗(yàn)證,新模型高閾值病變檢測性能較原網(wǎng)絡(luò)有提高。(5)針對(duì)胸片分類任務(wù),對(duì)用于神經(jīng)網(wǎng)絡(luò)參數(shù)訓(xùn)練的梯度下降法、數(shù)值優(yōu)化中的二階優(yōu)化算法進(jìn)行了研究,為了能更有效的訓(xùn)練神經(jīng)網(wǎng)絡(luò),提高模型預(yù)測性能,本文提出了一種利用梯度信息帶修正策略的二階優(yōu)化算法HFGCSO,新算法綜合了網(wǎng)絡(luò)參數(shù)的一階、二階信息,考慮了兩種信息的空間關(guān)系,使神經(jīng)網(wǎng)絡(luò)的參數(shù)訓(xùn)練更為有效。HFGCSO算法在兩種數(shù)據(jù)集上得到了驗(yàn)證,新算法較梯度下降算法,原二階優(yōu)化算法的分類準(zhǔn)確率更高。(6)針對(duì)胸片分類任務(wù),對(duì)影響函數(shù)進(jìn)行了研究,為了提高深度分類網(wǎng)絡(luò)的可解釋性,本文利用影響函數(shù)對(duì)胸片分類數(shù)據(jù)集進(jìn)行了定量分析,得到單一訓(xùn)練樣本對(duì)深度分類模型的影響值,并據(jù)此從訓(xùn)練集層面對(duì)深度的分類模型的預(yù)測行為進(jìn)行了解釋。為了提高傳統(tǒng)機(jī)器學(xué)習(xí)模型的分類性能,提出剪裁訓(xùn)練策略,通過該策略訓(xùn)練得到的模型分類準(zhǔn)確率有提高,新策略在胸片分類數(shù)據(jù)集上對(duì)三種機(jī)器學(xué)習(xí)分類模型均有效。神經(jīng)網(wǎng)絡(luò)模仿了人腦神經(jīng)元,在很多任務(wù)中都顯示出接近甚至超出人類的決策判斷能力。利用神經(jīng)網(wǎng)絡(luò)進(jìn)行醫(yī)學(xué)影像輔助診斷是本文的研究初衷,對(duì)多種分類機(jī)器學(xué)習(xí)算法以及目標(biāo)檢測算法的改進(jìn)是本文的研究內(nèi)容。旨在提高計(jì)算機(jī)輔助診斷在醫(yī)學(xué)影像診斷中的應(yīng)用價(jià)值,為加速計(jì)算機(jī)輔助診斷普及提供技術(shù)準(zhǔn)備。
【圖文】:
邐h視諢餮暗男夭浚毓餛擲嗉靶夭坎”潿ㄎ環(huán)椒ㄑ芯垮義希恚礤義賢跡玻斃仄菘獾慕㈠義希ǎ幔〇埽簰,
本文編號(hào):2637340
【圖文】:
邐h視諢餮暗男夭浚毓餛擲嗉靶夭坎”潿ㄎ環(huán)椒ㄑ芯垮義希恚礤義賢跡玻斃仄菘獾慕㈠義希ǎ幔〇埽簰,
本文編號(hào):2637340
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2637340.html
最近更新
教材專著