基于異質(zhì)性模型的低體重出生兒判別分析研究
發(fā)布時間:2021-06-11 03:29
在低體重出生兒預(yù)測判別分析中,母親行為習(xí)慣和身體特征是關(guān)鍵性因素,但相似的受試者母親特征所生嬰兒表現(xiàn)型差異較大,給低體重出生兒預(yù)測判別造成較大困惑。為提高低體重出生兒預(yù)測判別精準(zhǔn)度,引入廣義線性混合模型擬合個體異質(zhì)性,構(gòu)建異質(zhì)性機(jī)器學(xué)習(xí)模型,通過異質(zhì)性模型的分類數(shù)值模擬,其中異質(zhì)性隨機(jī)森林模型判別準(zhǔn)確率達(dá)100%。數(shù)值模擬結(jié)果顯示異質(zhì)性模型在判別分析上有極大的優(yōu)勢,可以輔助醫(yī)生有針對性地對受試者母親進(jìn)行診斷,實現(xiàn)低體重出生兒的預(yù)測精準(zhǔn)智能化。
【文章來源】:中國數(shù)字醫(yī)學(xué). 2020,15(11)
【文章頁數(shù)】:6 頁
【部分圖文】:
=2聚類結(jié)果
率是9.8%,即準(zhǔn)確率達(dá)到90.2%分類效果最好。三種機(jī)器學(xué)習(xí)方法判別預(yù)測結(jié)果不盡人意,雖然隨機(jī)森林判別預(yù)測精準(zhǔn)度達(dá)90.2%,但仍有47個低出生體重嬰兒分到非低出生體重嬰兒類別,因此模型還有很大的改進(jìn)余地。第一,機(jī)器學(xué)習(xí)模型在變量選擇上有所欠缺,即給定什么變量并運(yùn)用所有變量,增加不必要變量和缺少重要變量對模型結(jié)果影響很大。第二,對數(shù)據(jù)的分析是基于188個受試者母親是同質(zhì)的,但實際情況并非如此,因此需要對個體異質(zhì)性進(jìn)行分析。以下對個體異質(zhì)性進(jìn)行進(jìn)一步分析,并改進(jìn)模型。2.2個體異質(zhì)性分析圖1是選取前14個受試者所生嬰兒的出生體重的折線圖。結(jié)果顯示14受試者母親所生嬰兒體重的截距,斜率都有很大差異。第一個受試者母親所生嬰兒全部為低出生體重嬰兒,第10~14個受試者母親所生嬰兒全部正常,因此可見個體之間是非同質(zhì)的。圖2是188個個體BWT(出生體重)與年齡AGE回歸的截距與斜率95%置信區(qū)間值圖。如圖所示每個受試者母親所生嬰兒之間截距與斜率差異性巨大,側(cè)面反映每個受試者母親的異質(zhì)性。因此對受試者同質(zhì)性假設(shè)不成立,模型有改進(jìn)的必要。根據(jù)模型的響應(yīng)變量是二分類變量,并且基于對個體異質(zhì)性假設(shè),考慮對每個受試者的截距項加入一個隨機(jī)變量,因而考慮選取廣義線性混合效應(yīng)模型估計個體異質(zhì)性。2.2.1基于個體異質(zhì)性Ckmeans.1d.dp聚類最優(yōu)化單變量聚類(JoeSongandHaizhouWang),解決了單變量K均值、K中值和K段三種類型的問題,保證了最優(yōu)性和重現(xiàn)性[11-12]。核心算法使用各自的度量最小化簇內(nèi)距離之和,隨著簇數(shù)k的增加,其相對于分類方法分類結(jié)果判錯率(%)-01決策樹模型03063131.919259-01Bagging模型03241313.218262-01隨機(jī)森林模型0
嫌興?欠缺,即給定什么變量并運(yùn)用所有變量,增加不必要變量和缺少重要變量對模型結(jié)果影響很大。第二,對數(shù)據(jù)的分析是基于188個受試者母親是同質(zhì)的,但實際情況并非如此,因此需要對個體異質(zhì)性進(jìn)行分析。以下對個體異質(zhì)性進(jìn)行進(jìn)一步分析,并改進(jìn)模型。2.2個體異質(zhì)性分析圖1是選取前14個受試者所生嬰兒的出生體重的折線圖。結(jié)果顯示14受試者母親所生嬰兒體重的截距,斜率都有很大差異。第一個受試者母親所生嬰兒全部為低出生體重嬰兒,第10~14個受試者母親所生嬰兒全部正常,因此可見個體之間是非同質(zhì)的。圖2是188個個體BWT(出生體重)與年齡AGE回歸的截距與斜率95%置信區(qū)間值圖。如圖所示每個受試者母親所生嬰兒之間截距與斜率差異性巨大,側(cè)面反映每個受試者母親的異質(zhì)性。因此對受試者同質(zhì)性假設(shè)不成立,模型有改進(jìn)的必要。根據(jù)模型的響應(yīng)變量是二分類變量,并且基于對個體異質(zhì)性假設(shè),考慮對每個受試者的截距項加入一個隨機(jī)變量,因而考慮選取廣義線性混合效應(yīng)模型估計個體異質(zhì)性。2.2.1基于個體異質(zhì)性Ckmeans.1d.dp聚類最優(yōu)化單變量聚類(JoeSongandHaizhouWang),解決了單變量K均值、K中值和K段三種類型的問題,保證了最優(yōu)性和重現(xiàn)性[11-12]。核心算法使用各自的度量最小化簇內(nèi)距離之和,隨著簇數(shù)k的增加,其相對于分類方法分類結(jié)果判錯率(%)-01決策樹模型03063131.919259-01Bagging模型03241313.218262-01隨機(jī)森林模型033619.8147104表2模型的分類結(jié)果圖1受試者個體折線圖圖2受試者個體截距差異圖信息化論壇InformationForum
【參考文獻(xiàn)】:
期刊論文
[1]嬰兒出生體重與母親學(xué)歷及職業(yè)關(guān)系的探討[J]. 江萍,李玲. 社區(qū)醫(yī)學(xué)雜志. 2018(01)
[2]甘肅低出生體重嬰兒現(xiàn)狀及其預(yù)防策略[J]. 張勰,楊麗,劉暉,高雪梅. 甘肅科技. 2017(02)
[3]結(jié)直腸癌的遺傳異質(zhì)性與分子分型[J]. 鞠海星. 中華結(jié)直腸疾病電子雜志. 2015(04)
[4]統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論(第四版)[J]. 吳喜之. 中國統(tǒng)計. 2013(06)
[5]腫瘤遺傳異質(zhì)性[J]. 楊壹羚,褚嘉祐,王明榮. 遺傳. 2013(01)
[6]視網(wǎng)膜色素變性的遺傳異質(zhì)性和臨床異質(zhì)性[J]. 盛迅倫. 山東大學(xué)耳鼻喉眼學(xué)報. 2011(05)
[7]4379例嬰兒出生體重分析[J]. 魏秀菊,李青,李潤平. 中國婦幼保健. 2011(02)
[8]嬰兒出生體重和母親孕期體重指數(shù)與胰島素抵抗綜合征的關(guān)系[J]. 米杰,程紅,侯冬青,趙小元,魯杰,張志坤. 中國藥物與臨床. 2003(03)
本文編號:3223716
【文章來源】:中國數(shù)字醫(yī)學(xué). 2020,15(11)
【文章頁數(shù)】:6 頁
【部分圖文】:
=2聚類結(jié)果
率是9.8%,即準(zhǔn)確率達(dá)到90.2%分類效果最好。三種機(jī)器學(xué)習(xí)方法判別預(yù)測結(jié)果不盡人意,雖然隨機(jī)森林判別預(yù)測精準(zhǔn)度達(dá)90.2%,但仍有47個低出生體重嬰兒分到非低出生體重嬰兒類別,因此模型還有很大的改進(jìn)余地。第一,機(jī)器學(xué)習(xí)模型在變量選擇上有所欠缺,即給定什么變量并運(yùn)用所有變量,增加不必要變量和缺少重要變量對模型結(jié)果影響很大。第二,對數(shù)據(jù)的分析是基于188個受試者母親是同質(zhì)的,但實際情況并非如此,因此需要對個體異質(zhì)性進(jìn)行分析。以下對個體異質(zhì)性進(jìn)行進(jìn)一步分析,并改進(jìn)模型。2.2個體異質(zhì)性分析圖1是選取前14個受試者所生嬰兒的出生體重的折線圖。結(jié)果顯示14受試者母親所生嬰兒體重的截距,斜率都有很大差異。第一個受試者母親所生嬰兒全部為低出生體重嬰兒,第10~14個受試者母親所生嬰兒全部正常,因此可見個體之間是非同質(zhì)的。圖2是188個個體BWT(出生體重)與年齡AGE回歸的截距與斜率95%置信區(qū)間值圖。如圖所示每個受試者母親所生嬰兒之間截距與斜率差異性巨大,側(cè)面反映每個受試者母親的異質(zhì)性。因此對受試者同質(zhì)性假設(shè)不成立,模型有改進(jìn)的必要。根據(jù)模型的響應(yīng)變量是二分類變量,并且基于對個體異質(zhì)性假設(shè),考慮對每個受試者的截距項加入一個隨機(jī)變量,因而考慮選取廣義線性混合效應(yīng)模型估計個體異質(zhì)性。2.2.1基于個體異質(zhì)性Ckmeans.1d.dp聚類最優(yōu)化單變量聚類(JoeSongandHaizhouWang),解決了單變量K均值、K中值和K段三種類型的問題,保證了最優(yōu)性和重現(xiàn)性[11-12]。核心算法使用各自的度量最小化簇內(nèi)距離之和,隨著簇數(shù)k的增加,其相對于分類方法分類結(jié)果判錯率(%)-01決策樹模型03063131.919259-01Bagging模型03241313.218262-01隨機(jī)森林模型0
嫌興?欠缺,即給定什么變量并運(yùn)用所有變量,增加不必要變量和缺少重要變量對模型結(jié)果影響很大。第二,對數(shù)據(jù)的分析是基于188個受試者母親是同質(zhì)的,但實際情況并非如此,因此需要對個體異質(zhì)性進(jìn)行分析。以下對個體異質(zhì)性進(jìn)行進(jìn)一步分析,并改進(jìn)模型。2.2個體異質(zhì)性分析圖1是選取前14個受試者所生嬰兒的出生體重的折線圖。結(jié)果顯示14受試者母親所生嬰兒體重的截距,斜率都有很大差異。第一個受試者母親所生嬰兒全部為低出生體重嬰兒,第10~14個受試者母親所生嬰兒全部正常,因此可見個體之間是非同質(zhì)的。圖2是188個個體BWT(出生體重)與年齡AGE回歸的截距與斜率95%置信區(qū)間值圖。如圖所示每個受試者母親所生嬰兒之間截距與斜率差異性巨大,側(cè)面反映每個受試者母親的異質(zhì)性。因此對受試者同質(zhì)性假設(shè)不成立,模型有改進(jìn)的必要。根據(jù)模型的響應(yīng)變量是二分類變量,并且基于對個體異質(zhì)性假設(shè),考慮對每個受試者的截距項加入一個隨機(jī)變量,因而考慮選取廣義線性混合效應(yīng)模型估計個體異質(zhì)性。2.2.1基于個體異質(zhì)性Ckmeans.1d.dp聚類最優(yōu)化單變量聚類(JoeSongandHaizhouWang),解決了單變量K均值、K中值和K段三種類型的問題,保證了最優(yōu)性和重現(xiàn)性[11-12]。核心算法使用各自的度量最小化簇內(nèi)距離之和,隨著簇數(shù)k的增加,其相對于分類方法分類結(jié)果判錯率(%)-01決策樹模型03063131.919259-01Bagging模型03241313.218262-01隨機(jī)森林模型033619.8147104表2模型的分類結(jié)果圖1受試者個體折線圖圖2受試者個體截距差異圖信息化論壇InformationForum
【參考文獻(xiàn)】:
期刊論文
[1]嬰兒出生體重與母親學(xué)歷及職業(yè)關(guān)系的探討[J]. 江萍,李玲. 社區(qū)醫(yī)學(xué)雜志. 2018(01)
[2]甘肅低出生體重嬰兒現(xiàn)狀及其預(yù)防策略[J]. 張勰,楊麗,劉暉,高雪梅. 甘肅科技. 2017(02)
[3]結(jié)直腸癌的遺傳異質(zhì)性與分子分型[J]. 鞠海星. 中華結(jié)直腸疾病電子雜志. 2015(04)
[4]統(tǒng)計學(xué):從數(shù)據(jù)到結(jié)論(第四版)[J]. 吳喜之. 中國統(tǒng)計. 2013(06)
[5]腫瘤遺傳異質(zhì)性[J]. 楊壹羚,褚嘉祐,王明榮. 遺傳. 2013(01)
[6]視網(wǎng)膜色素變性的遺傳異質(zhì)性和臨床異質(zhì)性[J]. 盛迅倫. 山東大學(xué)耳鼻喉眼學(xué)報. 2011(05)
[7]4379例嬰兒出生體重分析[J]. 魏秀菊,李青,李潤平. 中國婦幼保健. 2011(02)
[8]嬰兒出生體重和母親孕期體重指數(shù)與胰島素抵抗綜合征的關(guān)系[J]. 米杰,程紅,侯冬青,趙小元,魯杰,張志坤. 中國藥物與臨床. 2003(03)
本文編號:3223716
本文鏈接:http://sikaile.net/yixuelunwen/eklw/3223716.html
最近更新
教材專著