基于3D卷積神經(jīng)網(wǎng)絡的肺結節(jié)檢測與肺癌識別
發(fā)布時間:2020-06-21 15:12
【摘要】:肺癌是全球癌癥死亡的主要原因之一,據(jù)統(tǒng)計每年有160萬人死于這種疾病。對于肺癌患者來說,越早發(fā)現(xiàn)其存活率越高。目前,醫(yī)學領域主要通過肺部CT掃描圖像來篩查來識別肺癌。隨著深度學習的發(fā)展,圖像分類、語音生成和游戲等等人類任務到機器自動化的轉換成為可能,人工智能在醫(yī)療領域也應用越來越廣泛,目前,深度學習已經(jīng)在皮膚癌檢測和腦腫瘤分割等醫(yī)學工作中有所應用。和傳統(tǒng)的計算機視覺任務不同,肺癌檢測存在很多難點,主要是因為:(1)許多結節(jié)被非醫(yī)學專家標記,這很容易導致大量的誤判。(2)CT掃描得到的肺部圖像是三維結構的,這將使得任何檢測算法在計算上成本高昂。(3)正負樣本嚴重不平衡使得數(shù)據(jù)缺乏多樣性和驗證。因此,肺癌檢測是一個值得研究的問題。本文針對肺部的CT掃描圖像,研究了一種基于3D卷積神經(jīng)網(wǎng)絡的肺癌檢測與識別算法,用于輔助醫(yī)生進行肺癌的診斷。該算法主要分為三個部分,圖像預處理,肺結節(jié)檢測與肺癌識別。在圖像預處理中,我們主要進行了以下步驟,將CT圖像中的灰度值轉換為HU值表示,然后是為了統(tǒng)一像素在物理世界對應的尺寸大小,進行了像素重采用,接下來是提取肺部掩碼以獲取CT圖像的肺腔區(qū)域,以便更好的處理,最后進行了數(shù)據(jù)的標準化處理,以便更好的適應網(wǎng)絡的輸入要求。在肺結節(jié)檢測部分,分為區(qū)域塊劃分,用于解決GPU內存不足的問題,然后是正負樣本均衡,為了解決訓練數(shù)據(jù)中正負樣本的不均衡問題,在這些基礎之上,構建了肺結節(jié)檢測網(wǎng)絡,用于檢測候選結節(jié)。在肺癌識別部分,通過候選肺結節(jié)篩選,篩選出候選肺結節(jié)作為輸入,并構建了肺癌識別網(wǎng)絡,該網(wǎng)絡輸出患者患肺癌的概率。該算法可檢測疑似結節(jié),并給出患者患肺癌的概率,前者可以找出疑似結節(jié)供醫(yī)生參考,后者可以給出肺癌概率的判別,這兩者都可輔助醫(yī)生用于肺癌的診斷。本文針對所提出的算法進行了詳細的實驗,實驗數(shù)據(jù)包括兩部分,一部分是開源的Kaggle數(shù)據(jù)集,數(shù)據(jù)集中一共有2285組圖像,包括2359個肺結節(jié),其中直徑小于35mm的小結節(jié)有1186個,直徑小于10mm的結節(jié)有905個;另一部分是來自國內多個醫(yī)院的多中心數(shù)據(jù)集,一共有820例樣本,其中良性樣本有435例,惡性樣本有385例。通過在上述數(shù)據(jù)集上的實驗的驗證,我們的算法模型在肺癌的分類上有較高的特異性和敏感度。
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R730.44;R734.2;TP391.41;TP183
【圖文】:
實際上這是大海撈針問題的那個針。為了確定患者是否患有早期癌癥,首先必須從大型的 3D 肺部 CT 掃描圖像(典型地大約有 200 張 2D 切片圖像)檢測出存在的微小肺結節(jié)(對于早期癌癥,直徑大都小于 10mm)毫米。圖1 1給出了一個肺部 CT 掃描圖像的例子,一個患者的肺部 CT 圖像是由一組橫向掃描的切片組成,以展示肺腔的三維結構構造。在臨床上,醫(yī)生通過觀察肺結節(jié)的形態(tài)結構以初步判斷患者是否患有肺癌,但這一診斷也未必絕對準確,只有通過病理結果分析即手術,才能得到絕對正確的患病結果。此外,CT 掃描圖像中充滿了來自周圍組織、骨骼和空氣等的噪音,這些噪聲也將影響對于結果的判斷。針對肺部圖像的研究,主要都是開發(fā)一種基于圖像的模型,作為輔助觀點
行為來影響環(huán)境。需要學習的是關于找到使神經(jīng)網(wǎng)絡實現(xiàn)所需行為的權重。根據(jù)問題以及神經(jīng)元如何連接,這種行為可能需要一長串的計算階段,其中每個階段通常以非線性方式聚合然后激活網(wǎng)絡。深度學習是許多這樣的階段的準確分配和組合。圖2 1展示了一個簡單的神經(jīng)網(wǎng)絡,在該圖中,最左邊的層被稱為輸入層,中間的層被稱為隱藏層,最右邊的層被稱為輸出層,該圖中有三個輸入神經(jīng)元,三個隱藏神經(jīng)元,一個輸出神經(jīng)元,其中,隱藏層還有一個偏置神經(jīng)元。若用 表示神經(jīng)網(wǎng)絡的輸入值, 和 表示神經(jīng)網(wǎng)絡中的參數(shù)和偏置值, 表示神經(jīng)元的輸出值或稱為激活值,( ),其中,i表示輸入向量 的第 個分量
本文編號:2724243
【學位授予單位】:上海交通大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R730.44;R734.2;TP391.41;TP183
【圖文】:
實際上這是大海撈針問題的那個針。為了確定患者是否患有早期癌癥,首先必須從大型的 3D 肺部 CT 掃描圖像(典型地大約有 200 張 2D 切片圖像)檢測出存在的微小肺結節(jié)(對于早期癌癥,直徑大都小于 10mm)毫米。圖1 1給出了一個肺部 CT 掃描圖像的例子,一個患者的肺部 CT 圖像是由一組橫向掃描的切片組成,以展示肺腔的三維結構構造。在臨床上,醫(yī)生通過觀察肺結節(jié)的形態(tài)結構以初步判斷患者是否患有肺癌,但這一診斷也未必絕對準確,只有通過病理結果分析即手術,才能得到絕對正確的患病結果。此外,CT 掃描圖像中充滿了來自周圍組織、骨骼和空氣等的噪音,這些噪聲也將影響對于結果的判斷。針對肺部圖像的研究,主要都是開發(fā)一種基于圖像的模型,作為輔助觀點
行為來影響環(huán)境。需要學習的是關于找到使神經(jīng)網(wǎng)絡實現(xiàn)所需行為的權重。根據(jù)問題以及神經(jīng)元如何連接,這種行為可能需要一長串的計算階段,其中每個階段通常以非線性方式聚合然后激活網(wǎng)絡。深度學習是許多這樣的階段的準確分配和組合。圖2 1展示了一個簡單的神經(jīng)網(wǎng)絡,在該圖中,最左邊的層被稱為輸入層,中間的層被稱為隱藏層,最右邊的層被稱為輸出層,該圖中有三個輸入神經(jīng)元,三個隱藏神經(jīng)元,一個輸出神經(jīng)元,其中,隱藏層還有一個偏置神經(jīng)元。若用 表示神經(jīng)網(wǎng)絡的輸入值, 和 表示神經(jīng)網(wǎng)絡中的參數(shù)和偏置值, 表示神經(jīng)元的輸出值或稱為激活值,( ),其中,i表示輸入向量 的第 個分量
【參考文獻】
相關期刊論文 前2條
1 陳武;孫艷麗;席妍;;腫瘤標志物水平與肺癌分期、近期療效及生存時間的相關性的臨床觀察[J];標記免疫分析與臨床;2008年04期
2 支修益;;肺癌篩查[J];解剖與臨床;2013年03期
本文編號:2724243
本文鏈接:http://sikaile.net/linchuangyixuelunwen/2724243.html
最近更新
教材專著