天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

小樣本臨床數(shù)據(jù)的擴(kuò)增協(xié)同分類輔助診斷方法研究與應(yīng)用

發(fā)布時(shí)間:2020-08-09 00:13
【摘要】:臨床數(shù)據(jù)中蘊(yùn)含著許多有價(jià)值的信息,對(duì)于醫(yī)生明確診斷,治療疾病具有重要意義。但是現(xiàn)實(shí)生活中的臨床數(shù)據(jù)由于保密性、不完整性,罕見疾病樣本數(shù)量少,以及對(duì)于一些診斷困難疾病的臨床數(shù)據(jù)類別標(biāo)簽獲取困難等客觀原因?qū)е聼o(wú)法獲得大量的臨床樣本。由這些原因造成的臨床數(shù)據(jù)分類問(wèn)題是一個(gè)典型的小樣本數(shù)據(jù)分類問(wèn)題。但是小樣本臨床數(shù)據(jù)采用傳統(tǒng)分類算法訓(xùn)練的分類模型分類性能較低,不能滿足現(xiàn)實(shí)生活的需要。為了進(jìn)一步提高分類性能,為臨床診斷提供一種有效的輔助診斷手段,本論文以臨床數(shù)據(jù)為基礎(chǔ),針對(duì)不同疾病的小樣本臨床數(shù)據(jù)進(jìn)行了研究,提出了數(shù)據(jù)擴(kuò)增協(xié)同分類的小樣本臨床數(shù)據(jù)分類方法。本論文主要取得了如下成果:1.從臨床數(shù)據(jù)樣本量少出發(fā),為了能夠獲得大量的樣本,提出了基于高斯混合模型的數(shù)據(jù)擴(kuò)增方法。通過(guò)對(duì)已有臨床數(shù)據(jù)高斯混合分布的估計(jì)生成大量帶有類別標(biāo)簽的虛擬數(shù)據(jù)即擴(kuò)增數(shù)據(jù),這樣可以為接下來(lái)的分類任務(wù)提供大量的數(shù)據(jù)支持。2.本文在“數(shù)據(jù)擴(kuò)增協(xié)同分類”思想下提出了兩種分類算法:第一種是基于數(shù)據(jù)擴(kuò)增的分類算法:對(duì)臨床訓(xùn)練數(shù)據(jù)通過(guò)數(shù)據(jù)擴(kuò)增生成大量擴(kuò)增數(shù)據(jù),然后將擴(kuò)增數(shù)據(jù)和臨床訓(xùn)練數(shù)據(jù)組成新的訓(xùn)練集訓(xùn)練傳統(tǒng)的有監(jiān)督分類模型。第二種是數(shù)據(jù)擴(kuò)增協(xié)同半監(jiān)督循環(huán)隨機(jī)森林(DA-SSCRF)分類算法:通過(guò)對(duì)第一種算法的理論及實(shí)驗(yàn)分析發(fā)現(xiàn)數(shù)據(jù)擴(kuò)增給出的類別標(biāo)簽存在錯(cuò)誤會(huì)導(dǎo)致分類性能下降。因此為了給擴(kuò)增數(shù)據(jù)標(biāo)記可信度高的類別標(biāo)簽,本文引入了半監(jiān)督學(xué)習(xí)思想,將臨床訓(xùn)練數(shù)據(jù)作為有標(biāo)簽數(shù)據(jù),對(duì)臨床訓(xùn)練數(shù)據(jù)擴(kuò)增得到的擴(kuò)增數(shù)據(jù)作為無(wú)標(biāo)簽數(shù)據(jù),最終提出了小樣本分類背景下的半監(jiān)督循環(huán)隨機(jī)森林分類算法。通過(guò)構(gòu)造半監(jiān)督分類模型,使得擴(kuò)增數(shù)據(jù)能夠起到強(qiáng)化分類性能的作用。3.通過(guò)八種疾病臨床數(shù)據(jù)集的驗(yàn)證,DA-SSCRF分類算法的分類準(zhǔn)確率比不進(jìn)行數(shù)據(jù)擴(kuò)增的有監(jiān)督分類算法和進(jìn)行數(shù)據(jù)擴(kuò)增的其它半監(jiān)督分類算法的準(zhǔn)確率提升了3%到11%。4.為了證明DA-SSCRF算法的實(shí)用性,將DA-SSCRF算法應(yīng)用到了來(lái)自某三甲醫(yī)院的腦膜炎疾病臨床數(shù)據(jù)集上。本文通過(guò)基于變異系數(shù)的特征選擇方法從原始的52維臨床信息中選出了10維特征組成腦膜炎臨床數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果也表明DA-SSCRF算法在腦膜炎疾病類型的診斷準(zhǔn)確率上提升3%,在臨床醫(yī)生診斷困難的結(jié)核性腦膜炎和隱球菌腦膜炎這兩種類型的診斷率上分別提升了6%和10%。DA-SSCRF算法通過(guò)10維腦膜炎臨床信息就能夠?qū)崿F(xiàn)對(duì)腦膜炎快速高效的診斷,對(duì)于腦膜炎疾病類型診斷具有重要意義。綜上,本文針對(duì)小樣本臨床數(shù)據(jù)的分類問(wèn)題提出了相應(yīng)的解決辦法,有效提高了疾病診斷的準(zhǔn)確性,對(duì)于輔助醫(yī)生進(jìn)行疾病診斷具有重要意義。
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:R-05;TP181
【圖文】:

框架圖,小樣本,框架圖,分類方法


據(jù)擴(kuò)增與分類同時(shí)進(jìn)行,數(shù)據(jù)擴(kuò)增中考慮分類,分類中進(jìn)行數(shù)據(jù)擴(kuò)增;诖怂枷胩岢隽藘煞N分類算法,圖 3.1 給出了本文方法的框架圖。圖3.1 小樣本臨床數(shù)據(jù)分類方法框架圖基于數(shù)據(jù)擴(kuò)增的分類算法:首先為了解決臨床訓(xùn)練數(shù)據(jù)樣本數(shù)量少的問(wèn)題,通過(guò)基于高斯混合模型的數(shù)據(jù)擴(kuò)增(DA)方法生成帶有類別標(biāo)簽的擴(kuò)增數(shù)據(jù),然后和訓(xùn)練數(shù)

流程圖,流程圖,數(shù)據(jù),高斯混合模型


特征的離散化處理:針對(duì)臨床數(shù)據(jù)中的離散特征,對(duì)擴(kuò)增得到的連續(xù)值進(jìn)行離散化處理。圖 3.2 給出了數(shù)據(jù)擴(kuò)增方法流程圖。圖3.2 數(shù)據(jù)擴(kuò)增方法流程圖(1)擴(kuò)增數(shù)量及類別標(biāo)簽的獲取為了獲得帶有類別標(biāo)簽的擴(kuò)增數(shù)據(jù),需要對(duì)臨床訓(xùn)練數(shù)據(jù)中的每一類數(shù)據(jù)進(jìn)行高斯混合模型的參數(shù)估計(jì)生成帶有類別標(biāo)簽的擴(kuò)增數(shù)據(jù)。我們知道高斯混合模型是由多個(gè)高斯模型線性組成的,通過(guò)高斯混合模型隨機(jī)生成擴(kuò)增數(shù)據(jù)的過(guò)程實(shí)際上就是隨機(jī)生成服從多個(gè)高斯分布數(shù)據(jù)的過(guò)程。如果要生成一定數(shù)量的服從高斯混合分布的擴(kuò)增數(shù)據(jù),那么每一個(gè)高斯分布所占的樣本數(shù)量成為一個(gè)關(guān)鍵問(wèn)題。由于在高斯混合模型中每一個(gè)高斯分布的權(quán)重系數(shù)都不相同,這個(gè)權(quán)重系數(shù)代表數(shù)據(jù)出現(xiàn)在這個(gè)高斯分布的可能性,即概率值。因此我們的擴(kuò)增原則是按照數(shù)據(jù)可能出現(xiàn)在某個(gè)高斯分布的概率生成相應(yīng)的擴(kuò)增數(shù)據(jù)。對(duì)于臨床訓(xùn)練數(shù)據(jù)中的每個(gè)類別的臨床數(shù)據(jù),通過(guò)高斯混合分布生成一定數(shù)量的擴(kuò)增數(shù)據(jù)的步驟如下所示:將臨床訓(xùn)練數(shù)據(jù)D中的第i類數(shù)據(jù)記為( i)D ,標(biāo)簽為 i 。( i)D 通過(guò)高斯混合模型參數(shù)的估計(jì)得到最新參數(shù)集new ( new , new , new)1 i i i i k

流程圖,分類算法,流程圖,數(shù)據(jù)


3.2.3 算法具體流程因此,基于數(shù)據(jù)擴(kuò)增的分類算法具體流程如圖 3.3 所示:圖3.3 基于數(shù)據(jù)擴(kuò)增的分類算法流程圖由圖 3.3 可知,該方法主要分為五個(gè)階段:第一階段:待擴(kuò)增臨床數(shù)據(jù)集的劃分第二階段:通過(guò)高斯混合模型得到相關(guān)參數(shù)第三階段:擴(kuò)增數(shù)量及類別標(biāo)簽的獲取第四階段:離散特征的離散化第五階段:分類模型的訓(xùn)練具體流程如下所示:輸入:臨床訓(xùn)練數(shù)據(jù)1 2 1 2 2{ , ,..., , , ,..., }m m m mD+ +x x x x x x ,其中,前 m 個(gè)特征是連續(xù)變量,最后m 個(gè)特征是離散變量。假設(shè)該數(shù)據(jù)集共有g(shù) 類,即有g(shù) 個(gè)類別標(biāo)簽。輸出:帶有類別標(biāo)簽的擴(kuò)增數(shù)據(jù)集過(guò)程:第一階段:待擴(kuò)增臨床數(shù)據(jù)集的劃分Step1:對(duì)臨床訓(xùn)練數(shù)據(jù) D 按照類別 g 進(jìn)行劃分。將其劃分為 g 個(gè)子數(shù)據(jù)集,每一個(gè)子數(shù)據(jù)集稱為單類臨床數(shù)據(jù)集,作為下一步的輸入。因此共有g(shù) 個(gè)單類臨床數(shù)據(jù)集,其中第i 類臨床數(shù)據(jù)集

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 景慎旗;劉云;繆妹妹;張小亮;;基于臨床數(shù)據(jù)中心的醫(yī)院知識(shí)服務(wù)系統(tǒng)構(gòu)建[J];醫(yī)學(xué)信息學(xué)雜志;2017年02期

2 林琳;白波;王韜;;臨床數(shù)據(jù)中心的構(gòu)建與應(yīng)用[J];中國(guó)數(shù)字醫(yī)學(xué);2016年08期

3 吳曉芬;王磊;王培軍;;基于電子病歷的臨床數(shù)據(jù)中心構(gòu)建[J];醫(yī)學(xué)信息學(xué)雜志;2016年10期

4 徐曉輝;;醫(yī)院臨床數(shù)據(jù)中心構(gòu)建探討[J];中國(guó)數(shù)字醫(yī)學(xué);2015年02期

5 尹嶺;陳廣飛;蔣艷峰;成福春;杜鵬;應(yīng)俊;何史林;管淑麗;彭芳;劉勝男;周丹;;臨床數(shù)據(jù)資源整合與利用[J];中國(guó)數(shù)字醫(yī)學(xué);2010年11期

6 左崇年;;臨床數(shù)據(jù)造假入刑并非小題大做[J];江淮法治;2017年08期

7 羅晶;李勁松;黃麗麗;周天舒;翁盛鑫;田宇;;臨床數(shù)據(jù)中心建設(shè)助力轉(zhuǎn)化醫(yī)學(xué)研究[J];轉(zhuǎn)化醫(yī)學(xué)雜志;2013年02期

8 孟繁榮;劉永蘭;王軍成;;醫(yī)院臨床數(shù)據(jù)中心建設(shè)問(wèn)題分析[J];解放軍醫(yī)藥雜志;2012年12期

9 ;等待臨床數(shù)據(jù)導(dǎo)致“不應(yīng)有的死亡”[J];科學(xué)之友;2006年11期

10 樂(lè)穎;;臨床數(shù)據(jù)中心的構(gòu)建與應(yīng)用[J];中國(guó)衛(wèi)生產(chǎn)業(yè);2018年05期

相關(guān)會(huì)議論文 前10條

1 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];中國(guó)中西醫(yī)結(jié)合學(xué)會(huì)診斷專業(yè)委員會(huì)2009’年會(huì)論文集[C];2009年

2 張華;張笑波;趙宏杰;林宇春;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];2009全國(guó)時(shí)間生物醫(yī)學(xué)學(xué)術(shù)會(huì)議論文集[C];2009年

3 張華;張笑波;趙宏杰;;證的量化與臨床數(shù)據(jù)的定性的方法學(xué)理論基礎(chǔ)[A];中華中醫(yī)藥學(xué)會(huì)第二屆中醫(yī)方證基礎(chǔ)研究與臨床應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2008年

4 王禹毅;韓梅;陳妮妮;李青;劉建平;;從如何獲得高質(zhì)量臨床數(shù)據(jù)探討臨床試驗(yàn)的數(shù)據(jù)管理[A];第七屆中醫(yī)/中西醫(yī)結(jié)合循證醫(yī)學(xué)方法研討會(huì)會(huì)議材料[C];2013年

5 李嶺;季星來(lái);李妍;李春義;;生物信息學(xué)研究中臨床數(shù)據(jù)解讀方面可能存在的若干問(wèn)題的探討[A];中國(guó)的遺傳學(xué)研究——中國(guó)遺傳學(xué)會(huì)第七次代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要匯編[C];2003年

6 潘宏銘;;從臨床試驗(yàn)到臨床實(shí)踐—埃克替尼Ⅳ期臨床數(shù)據(jù)分析[A];2013年第六屆國(guó)家級(jí)分子靶點(diǎn)藥物治療新進(jìn)展學(xué)習(xí)班暨浙江省腫瘤化療學(xué)術(shù)年會(huì)論文集[C];2013年

7 韓釗;臧秋玲;葉祖森;王蘋莉;樊愷;曹云剛;耿媛媛;張征;;卒中臨床數(shù)據(jù)登記系統(tǒng)的研究開發(fā)[A];醫(yī)學(xué)科研管理前沿與實(shí)務(wù)研討班論文集[C];2009年

8 陳松鶴;;基于CDR的醫(yī)院衛(wèi)生統(tǒng)計(jì)數(shù)據(jù)建設(shè)與應(yīng)用[A];第二十八屆中國(guó)醫(yī)院協(xié)會(huì)病案專業(yè)委員會(huì)學(xué)術(shù)會(huì)議論文集[C];2019年

9 陳松鶴;陳志文;;基于CDR的醫(yī)院衛(wèi)生統(tǒng)計(jì)數(shù)據(jù)建設(shè)與應(yīng)用[A];第二十七屆中國(guó)醫(yī)院協(xié)會(huì)病案管理專業(yè)委員會(huì)學(xué)術(shù)會(huì)議論文集[C];2018年

10 韓釗;臧秋玲;葉祖森;項(xiàng)崇雷;陳小麗;邵蓓;鄭榮遠(yuǎn);;《卒中臨床數(shù)據(jù)登記系統(tǒng)V1.0》軟件的開發(fā)與使用[A];2008年浙江省神經(jīng)病學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2008年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者 龍九尊;上市申請(qǐng)近4年未獲批 VTI披露ELAD臨床數(shù)據(jù)[N];科學(xué)時(shí)報(bào);2011年

2 記者 姚倩;瑞德西韋臨床數(shù)據(jù)近期將公布[N];北京商報(bào);2020年

3 晏揚(yáng);從“罰酒三杯”到死刑,藥物臨床數(shù)據(jù)還敢造假?[N];工人日?qǐng)?bào);2017年

4 伊一芳;臨床數(shù)據(jù)造假 應(yīng)該付出代價(jià)[N];人民法院報(bào);2017年

5 左崇年;“臨床數(shù)據(jù)造假入刑”并非小題大做[N];中國(guó)商報(bào);2017年

6 劉效仁;臨床數(shù)據(jù)造假入刑為生命安全鑄劍[N];證券時(shí)報(bào);2017年

7 廣西 醫(yī)生 羅志華;臨床數(shù)據(jù)造假入刑是合理糾偏[N];長(zhǎng)江日?qǐng)?bào);2017年

8 西南政法大學(xué)政治與公共管理學(xué)院副教授 和靜鈞;臨床造假入刑才是真正“零容忍”[N];深圳特區(qū)報(bào);2017年

9 廖海金 江西省新余市渝水區(qū)政協(xié)委員;臨床數(shù)據(jù)造假,必須施以最嚴(yán)格的刑罰[N];人民政協(xié)報(bào);2017年

10 本報(bào)記者 張藍(lán)飛;臨床數(shù)據(jù)成推動(dòng)產(chǎn)業(yè)創(chuàng)新抓手[N];醫(yī)藥經(jīng)濟(jì)報(bào);2017年

相關(guān)博士學(xué)位論文 前2條

1 周天舒;國(guó)際臨床數(shù)據(jù)交換關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];浙江大學(xué);2013年

2 馮奇;POMDP近似解法研究及在中醫(yī)診療方案優(yōu)化中的應(yīng)用[D];北京交通大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 郭峻凌;基于圖卷積網(wǎng)絡(luò)的癌癥生存期預(yù)測(cè)方法[D];哈爾濱工業(yè)大學(xué);2019年

2 康越;小樣本臨床數(shù)據(jù)的擴(kuò)增協(xié)同分類輔助診斷方法研究與應(yīng)用[D];西安電子科技大學(xué);2019年

3 許帆;基于臨床數(shù)據(jù)的中醫(yī)處方推薦方法研究[D];北京交通大學(xué);2019年

4 李雪梅;食管鱗癌臨床數(shù)據(jù)平臺(tái)構(gòu)建與處理分析[D];濟(jì)南大學(xué);2019年

5 范旦;基于大數(shù)據(jù)分析法的腰痛古代文獻(xiàn)數(shù)據(jù)與現(xiàn)代臨床數(shù)據(jù)證藥對(duì)照研究[D];成都中醫(yī)藥大學(xué);2018年

6 李雅娜;腦卒中臨床數(shù)據(jù)管理與疾病輔助預(yù)測(cè)系統(tǒng)[D];昆明理工大學(xué);2018年

7 潘主強(qiáng);基于中醫(yī)臨床數(shù)據(jù)的疾病分類關(guān)鍵方法研究[D];西南石油大學(xué);2017年

8 王宏宇;基于大數(shù)據(jù)研究模式對(duì)重癥燒傷患者臨床數(shù)據(jù)的挖掘與分析[D];第三軍醫(yī)大學(xué);2015年

9 孫亞林;臨床數(shù)據(jù)管理系統(tǒng)研究及其在數(shù)據(jù)規(guī)范化管理中的應(yīng)用[D];第二軍醫(yī)大學(xué);2005年

10 劉一帆;基于電子病歷的科室臨床數(shù)據(jù)中心的實(shí)現(xiàn)[D];中山大學(xué);2014年



本文編號(hào):2786298

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2786298.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6f3d6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com