非均衡學(xué)習(xí)及在產(chǎn)前篩查高風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用
本文關(guān)鍵詞:非均衡學(xué)習(xí)及在產(chǎn)前篩查高風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用
更多相關(guān)文章: 非均衡學(xué)習(xí) 樣例選擇 代價(jià)敏感學(xué)習(xí) 重采樣 極速學(xué)習(xí)機(jī) 產(chǎn)前篩查 高風(fēng)險(xiǎn)預(yù)測(cè) 輔助決策
【摘要】:傳統(tǒng)的機(jī)器學(xué)習(xí)方法應(yīng)用于均衡數(shù)據(jù)能夠取得較好的學(xué)習(xí)效果,但是處理非均衡數(shù)據(jù)時(shí),基于誤差最小化原理的學(xué)習(xí)機(jī)制往往導(dǎo)致結(jié)果偏向多數(shù)類(lèi),而所占比重較低的少數(shù)類(lèi)則會(huì)被忽略,F(xiàn)實(shí)生活中非均衡數(shù)據(jù)大量存在,少數(shù)類(lèi)更是研究的重點(diǎn),如何既提高整體的分類(lèi)性能,又提高少數(shù)類(lèi)的分類(lèi)性能成為研究的難點(diǎn)。產(chǎn)前篩查的數(shù)據(jù)作為典型的結(jié)構(gòu)型非均衡數(shù)據(jù),機(jī)器學(xué)習(xí)方法在該領(lǐng)域的應(yīng)用研究較少。一般采用傳統(tǒng)方法即通過(guò)化驗(yàn)甲型胎兒蛋白(AFP)、人絨毛膜促性腺激素(h CG)以及游離雌三醇(u E3)在孕婦血清中的濃度再參考孕婦的體重、年齡等因素,計(jì)算出孕婦懷有唐氏綜合癥、愛(ài)德華氏綜合征、開(kāi)放性神經(jīng)管缺陷胎兒的危險(xiǎn)值。而產(chǎn)前篩查高風(fēng)險(xiǎn)計(jì)算軟件多為國(guó)外公司設(shè)計(jì),計(jì)算方法不公開(kāi)。而且傳統(tǒng)的產(chǎn)前篩查方法存在30%漏診的現(xiàn)象,即不能檢測(cè)出所有的患病胎兒。為了解決非均衡數(shù)據(jù)關(guān)于少數(shù)類(lèi)分類(lèi)性能差,數(shù)據(jù)壓縮耗時(shí)的問(wèn)題;實(shí)現(xiàn)產(chǎn)前篩查高風(fēng)險(xiǎn)計(jì)算系統(tǒng)的模擬;提高產(chǎn)前篩查的真陽(yáng)性率,降低傳統(tǒng)方法漏診率,本文將從以下4個(gè)方面對(duì)非均衡學(xué)習(xí)及其在產(chǎn)前篩查高風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用展開(kāi)研究,并提出了基于非平穩(wěn)割點(diǎn)的樣例選擇方法、基于重采樣的ELM集成學(xué)習(xí)方法、基于可調(diào)節(jié)因子的加權(quán)ELM方法,以及產(chǎn)前篩查高風(fēng)險(xiǎn)預(yù)測(cè)模型和輔助決策模型。(1)將非平穩(wěn)割點(diǎn)的概念引入樣例選擇中,提出了基于非平穩(wěn)割點(diǎn)的樣例選擇方法UCBSS。理論上證明判別函數(shù)是凸函數(shù)并以其極小值作為割點(diǎn)劃分樣例空間的分類(lèi)器,其劃分割點(diǎn)為非平穩(wěn)割點(diǎn)。對(duì)于每個(gè)屬性均標(biāo)記出非平穩(wěn)割點(diǎn)相鄰的樣例,將含有非平穩(wěn)割點(diǎn)信息較多的樣例保留,組成非平穩(wěn)樣例子集。對(duì)于刪除的不含有非平穩(wěn)割點(diǎn)信息的樣例,理論上也證明能被剩余樣例學(xué)習(xí)的分類(lèi)器正確分類(lèi)。在人工數(shù)據(jù)集和UCI數(shù)據(jù)集上的實(shí)驗(yàn)也表明該方法適用于非均衡度較高的大數(shù)據(jù)的數(shù)據(jù)壓縮,在同傳統(tǒng)數(shù)據(jù)壓縮方法CNN的比較中,顯示了該方法時(shí)間上的優(yōu)勢(shì)。此外實(shí)驗(yàn)采用判別函數(shù)不是凸函數(shù)的分類(lèi)器達(dá)到了相同的效果。當(dāng)分類(lèi)器的判別函數(shù)是凸函數(shù)時(shí),該方法還適用于噪音比較高的大數(shù)據(jù)的壓縮。(2)基于重采樣的ELM(極速學(xué)習(xí)機(jī))集成學(xué)習(xí)方法結(jié)合重采樣技術(shù)和集成學(xué)習(xí),充分利用少數(shù)類(lèi)的樣例信息,并考慮在隨機(jī)欠采樣多數(shù)類(lèi)的過(guò)程中子樣和母體的關(guān)系,在重新構(gòu)成的多個(gè)數(shù)據(jù)集上訓(xùn)練ELM方法,再通過(guò)投票確定最終結(jié)果。實(shí)驗(yàn)過(guò)程在多個(gè)改造的UCI數(shù)據(jù)集上進(jìn)行,實(shí)驗(yàn)結(jié)果表明該方法優(yōu)于隨機(jī)欠采樣和CNN分別結(jié)合ELM的方法。此外,當(dāng)非均衡度較高時(shí),可以首先使用UCBSS方法降低非均衡度,再使用基于重采樣的ELM集成學(xué)習(xí)方法,實(shí)驗(yàn)結(jié)果顯示在提高方法執(zhí)行效率的同時(shí),能夠保持甚至提高整體的分類(lèi)性能。(3)加權(quán)ELM根據(jù)多數(shù)類(lèi)和少數(shù)類(lèi)的樣例數(shù)目賦予多數(shù)類(lèi)和少數(shù)類(lèi)不同的權(quán)重,但是這種權(quán)重僅參考類(lèi)別本身數(shù)量,且是固定值,實(shí)驗(yàn)的結(jié)果也表明其他的權(quán)重能夠得到更好的結(jié)果。本文提出基于可調(diào)節(jié)因子的加權(quán)極速學(xué)習(xí)機(jī)方法WELMAF,權(quán)值設(shè)置考慮了類(lèi)別之間的關(guān)系,采用權(quán)重1作為多數(shù)類(lèi)的初始權(quán)重,多數(shù)類(lèi)和少數(shù)類(lèi)的樣例數(shù)目比值作為少數(shù)類(lèi)的初始權(quán)重。采用2種方案分別在少數(shù)類(lèi)或多數(shù)類(lèi)的權(quán)重上添加調(diào)節(jié)因子,另一類(lèi)的權(quán)重保持不變。兩種方案因?yàn)樗{(diào)節(jié)的權(quán)重不同,調(diào)節(jié)因子的取值范圍和步長(zhǎng)有所差別,通過(guò)實(shí)驗(yàn)比較給出了合適的調(diào)節(jié)范圍和步長(zhǎng),并得到了優(yōu)于原加權(quán)ELM的分類(lèi)性能。(4)首先對(duì)產(chǎn)前篩查的數(shù)據(jù)進(jìn)行預(yù)處理,刪除冗余特征,噪音樣例。采用5種預(yù)測(cè)模型(決策樹(shù)、ELM、基于重采樣ELM集成學(xué)習(xí)方法、加權(quán)ELM、WELMAF分別與UCBSS方法相結(jié)合)模擬產(chǎn)前篩查高風(fēng)險(xiǎn)計(jì)算系統(tǒng),通過(guò)實(shí)驗(yàn)對(duì)比,UCBSS結(jié)合決策樹(shù)的預(yù)測(cè)模型的測(cè)試性能最高,與目前的高風(fēng)險(xiǎn)計(jì)算系統(tǒng)得到的結(jié)果最接近,尤其18-三體綜合征和開(kāi)放性神經(jīng)管缺陷的預(yù)測(cè)精度接近100%。通過(guò)在唐氏篩查的模擬診斷數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),運(yùn)用UCBSS結(jié)合WELMAF構(gòu)成的產(chǎn)前篩查輔助決策模型,識(shí)別了全部的唐氏綜合征病例,降低了漏診率,并使假陽(yáng)性率在可接受的范圍內(nèi),可以避免更多患病胎兒的出生。
【學(xué)位授予單位】:河北大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP181;R714.5
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 胡彩霞;;產(chǎn)前篩查管理的做法和體會(huì)[J];中國(guó)農(nóng)村衛(wèi)生事業(yè)管理;2007年03期
2 黃鶯;劉發(fā)平;蔣淑卿;;淺談產(chǎn)前篩查的做法和體會(huì)[J];中國(guó)農(nóng)村衛(wèi)生事業(yè)管理;2010年02期
3 王芳;劉曉曦;許俠;;部分省市產(chǎn)前篩查管理現(xiàn)狀的定性研究[J];中國(guó)預(yù)防醫(yī)學(xué)雜志;2010年02期
4 劉曉曦;王芳;許俠;;兩城市產(chǎn)前篩查服務(wù)利用現(xiàn)狀分析[J];中國(guó)優(yōu)生與遺傳雜志;2010年04期
5 劉曉曦;許俠;王芳;;部分國(guó)家產(chǎn)前篩查政策的比較及啟示[J];中國(guó)初級(jí)衛(wèi)生保健;2010年07期
6 張麗霞;孟茜;張義濤;鄭彥;孟一清;;信息網(wǎng)絡(luò)在產(chǎn)前篩查管理中的應(yīng)用和研究[J];中國(guó)婦幼保健;2011年25期
7 陳英耀,錢(qián)序,唐智柳,曹建文,黃葭燕,胡芳芳,王倩,呂軍,應(yīng)向華;我國(guó)產(chǎn)前篩查服務(wù)的現(xiàn)狀和存在的關(guān)鍵問(wèn)題[J];中國(guó)衛(wèi)生質(zhì)量管理;2004年03期
8 馮曉春;上海普陀區(qū)前瞻性產(chǎn)前篩查部分異常兒分析報(bào)告[J];中國(guó)優(yōu)生與遺傳雜志;2004年S1期
9 郭春華,王峻,蘇向東,丁海明,袁莉萍,郝瑞萍;關(guān)于產(chǎn)前篩查試劑臨床診斷規(guī)范性評(píng)價(jià)[J];臨床醫(yī)藥實(shí)踐;2004年11期
10 王治國(guó),李小鵬,武平原;2003年全國(guó)產(chǎn)前篩查實(shí)驗(yàn)室質(zhì)量評(píng)價(jià)[J];中國(guó)預(yù)防醫(yī)學(xué)雜志;2004年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 劉曉丹;唐少華;楊雪梅;胡勇;謝偉偉;胡速;鄭義;;溫州市產(chǎn)前篩查管理網(wǎng)絡(luò)系統(tǒng)的建立[A];2009年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2009年
2 胡婭莉;;再論產(chǎn)前篩查、診斷質(zhì)量控制的重要性[A];第四屆長(zhǎng)三角婦產(chǎn)科學(xué)術(shù)論壇暨浙江省2009年婦產(chǎn)科學(xué)術(shù)年會(huì)論文匯編[C];2009年
3 舒青青;吳勝蘭;何俊英;;2008年衢州市聯(lián)合血清學(xué)和超聲進(jìn)行產(chǎn)前篩查分析[A];第四屆長(zhǎng)三角婦產(chǎn)科學(xué)術(shù)論壇暨浙江省2009年婦產(chǎn)科學(xué)術(shù)年會(huì)論文匯編[C];2009年
4 陳志央;陳意振;殷美芳;王飛;陳怡博;;孕中期母血清產(chǎn)前篩查參數(shù)分析[A];2004年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2004年
5 唐少華;楊雪梅;鄭昭科;;孕中期生化指標(biāo)在產(chǎn)前篩查中的應(yīng)用[A];2004年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2004年
6 陳志央;陳鐵峰;陳怡博;王振宇;王飛;王麗麗;;孕中期產(chǎn)前篩查與促甲狀腺素相關(guān)性探討[A];2006年浙江省檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2006年
7 許紅;王彥慧;;產(chǎn)前篩查和超聲產(chǎn)前篩查診斷[A];中國(guó)優(yōu)生優(yōu)育協(xié)會(huì)第四屆全國(guó)學(xué)術(shù)論文報(bào)告會(huì)暨基因科學(xué)高峰論壇論文專(zhuān)輯[C];2008年
8 朱寶生;戚慶煒;呂時(shí)銘;許爭(zhēng)峰;王華;蔡艷;蔣濤;黃以寧;王澤;章錦曼;邊旭明;;血清學(xué)產(chǎn)前篩查的實(shí)驗(yàn)室質(zhì)量控制[A];遺傳學(xué)進(jìn)步與人口健康高峰論壇論文集[C];2007年
9 沈涌海;王陳君;;杭州地區(qū)2003年~2006年產(chǎn)前篩查結(jié)果分析[A];2007年浙江省醫(yī)學(xué)檢驗(yàn)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2007年
10 劉根賢;;日照市孕中期產(chǎn)前篩查的結(jié)果分析[A];中華醫(yī)學(xué)會(huì)第七次全國(guó)檢驗(yàn)醫(yī)學(xué)學(xué)術(shù)會(huì)議資料匯編[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 記者 宜秀萍;我省產(chǎn)前篩查率僅為4.74%[N];甘肅日?qǐng)?bào);2013年
2 記者 陳漢光 通訊員 蔡志偉;漳州啟動(dòng)產(chǎn)前篩查診斷工作[N];閩南日?qǐng)?bào);2010年
3 記者 吳森林 付希華;明年起出生缺陷產(chǎn)前篩查免費(fèi)[N];中山日?qǐng)?bào);2009年
4 王茜;產(chǎn)前篩查:“屏蔽”畸形兒的最后防線(xiàn)[N];新華每日電訊;2007年
5 市婦幼保健院產(chǎn)前篩查中心 徐貴江;淺談產(chǎn)前篩查[N];揚(yáng)州日?qǐng)?bào);2006年
6 周烈;產(chǎn)前篩查做什么[N];健康報(bào);2008年
7 云南省第一人民醫(yī)院遺傳診斷中心教授 朱寶生;產(chǎn)前篩查 成功阻斷出生缺陷[N];健康報(bào);2010年
8 記者 劉蘭英;我市產(chǎn)前篩查工作正式啟動(dòng)[N];菏澤日?qǐng)?bào);2011年
9 記者 宜秀萍;我省孕婦產(chǎn)前篩查比例遠(yuǎn)低于全國(guó)平均水平[N];甘肅日?qǐng)?bào);2012年
10 記者 李寶森;哈爾濱胎兒產(chǎn)前篩查堪憂(yōu)[N];黑龍江日?qǐng)?bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 姚遠(yuǎn);唐氏綜合征產(chǎn)前篩查母體血液生物新標(biāo)志物篩選及檢測(cè)方法的建立[D];第三軍醫(yī)大學(xué);2015年
2 楊智麗;云南地區(qū)孕中期血清學(xué)產(chǎn)前篩查方案評(píng)價(jià)[D];云南大學(xué);2015年
3 邢勝;非均衡學(xué)習(xí)及在產(chǎn)前篩查高風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[D];河北大學(xué);2017年
4 謝臻蔚;唐氏綜合征血清學(xué)產(chǎn)前篩查方案優(yōu)化的研究[D];浙江大學(xué);2010年
5 戚紅;解整合素—金屬蛋白酶12作為產(chǎn)前篩查標(biāo)志物的初步研究[D];中國(guó)協(xié)和醫(yī)科大學(xué);2008年
6 白濤;2T與Lifecycle兩種唐氏綜合征產(chǎn)前篩查風(fēng)險(xiǎn)計(jì)算軟件在中國(guó)孕婦人群的應(yīng)用研究[D];北京協(xié)和醫(yī)學(xué)院;2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李龍;圍產(chǎn)期孕婦與胎兒疾病產(chǎn)前篩查方法的Meta分析[D];昆明理工大學(xué);2015年
2 翟閃閃;母體血漿中胎兒游離mRNA等位基因比率分析用于21三體綜合征無(wú)創(chuàng)性產(chǎn)前篩查的研究[D];鄭州大學(xué);2015年
3 鄭麗莉;胎兒染色體疾病產(chǎn)前篩查方案比較及其應(yīng)用[D];華北理工大學(xué);2015年
4 孫博;高通量測(cè)序和常規(guī)孕中期產(chǎn)前篩查檢測(cè)胎兒非整倍體的效率分析[D];浙江大學(xué);2015年
5 劉梅梅;妊娠中期產(chǎn)前篩查相關(guān)因素分析及心理干預(yù)對(duì)妊娠結(jié)局的影響[D];青島大學(xué);2016年
6 吳曉靈;福建省免費(fèi)產(chǎn)前篩查診斷項(xiàng)目實(shí)施效果及影響因素研究[D];福建醫(yī)科大學(xué);2016年
7 鄂瓊;浙江省唐氏綜合征產(chǎn)前篩查服務(wù)利用的影響因素分析[D];復(fù)旦大學(xué);2008年
8 巫先曉;濾紙干血片法在唐氏綜合癥產(chǎn)前篩查中的應(yīng)用前景[D];重慶醫(yī)科大學(xué);2012年
9 史紀(jì)芳;抑制素A在產(chǎn)前篩查中的應(yīng)用[D];昆明醫(yī)學(xué)院;2006年
10 張柳燕;孕周對(duì)唐氏綜合癥篩查檢出率影響的回顧性研究[D];浙江大學(xué);2007年
,本文編號(hào):1305537
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1305537.html